標(biāo)準(zhǔn)解讀
GB/T 44217.6-2024是一項(xiàng)中國(guó)國(guó)家標(biāo)準(zhǔn),專注于語(yǔ)言資源管理領(lǐng)域中的語(yǔ)義標(biāo)注框架。該標(biāo)準(zhǔn)的第六部分詳細(xì)闡述了語(yǔ)義標(biāo)注的原則,旨在為語(yǔ)言數(shù)據(jù)處理、自然語(yǔ)言處理(NLP)以及人工智能(AI)等相關(guān)領(lǐng)域的研究與應(yīng)用提供一套統(tǒng)一和規(guī)范的指導(dǎo)方針。
標(biāo)準(zhǔn)核心內(nèi)容概述
-
語(yǔ)境理解:強(qiáng)調(diào)在進(jìn)行語(yǔ)義標(biāo)注時(shí),必須充分考慮詞匯或短語(yǔ)所在的上下文環(huán)境,因?yàn)檎Z(yǔ)境對(duì)確定詞義、句意及語(yǔ)篇關(guān)系至關(guān)重要。
-
標(biāo)準(zhǔn)化與互操作性:提倡使用國(guó)際認(rèn)可的標(biāo)注體系和詞匯表,確保不同平臺(tái)和系統(tǒng)間的數(shù)據(jù)兼容性和互操作性,便于信息共享和跨領(lǐng)域合作。
-
層次性與粒度:指出語(yǔ)義標(biāo)注應(yīng)支持多層次和多粒度,即從詞語(yǔ)基本意義到復(fù)雜語(yǔ)義結(jié)構(gòu)的全面覆蓋,以適應(yīng)不同應(yīng)用場(chǎng)景的需求。
-
明確性與一致性:要求標(biāo)注規(guī)則要清晰明了,減少主觀解釋空間,確保不同標(biāo)注者在面對(duì)相同文本時(shí)能做出一致的標(biāo)注,提升標(biāo)注數(shù)據(jù)的質(zhì)量和可靠性。
-
動(dòng)態(tài)更新與擴(kuò)展性:鑒于語(yǔ)言的不斷發(fā)展變化,標(biāo)準(zhǔn)鼓勵(lì)標(biāo)注框架具備靈活性,能夠隨語(yǔ)言使用習(xí)慣和技術(shù)進(jìn)步而適時(shí)調(diào)整和擴(kuò)展。
-
語(yǔ)義關(guān)聯(lián)性:強(qiáng)調(diào)在標(biāo)注過(guò)程中識(shí)別并標(biāo)注出詞匯、短語(yǔ)間的語(yǔ)義關(guān)系,如因果、對(duì)比、歸屬等,以便于深入理解和利用語(yǔ)言資源的內(nèi)在邏輯。
-
技術(shù)中立性:雖然標(biāo)準(zhǔn)提供了指導(dǎo)原則,但并不限定具體的技術(shù)實(shí)現(xiàn)方式,允許采用最適合當(dāng)前任務(wù)的技術(shù)手段進(jìn)行語(yǔ)義標(biāo)注。
-
隱私與倫理考量:提醒在處理語(yǔ)言資源時(shí),尤其是涉及個(gè)人或敏感信息時(shí),需遵守相關(guān)法律法規(guī),保護(hù)個(gè)人隱私,遵循倫理原則。
應(yīng)用指導(dǎo)意義
此標(biāo)準(zhǔn)為語(yǔ)言數(shù)據(jù)的收集、整理、分析以及應(yīng)用提供了一套科學(xué)合理的框架,有助于提升自然語(yǔ)言處理系統(tǒng)的準(zhǔn)確性和智能化水平,促進(jìn)語(yǔ)言資源的有效管理和利用。它不僅對(duì)學(xué)術(shù)研究具有重要指導(dǎo)價(jià)值,也為語(yǔ)言技術(shù)產(chǎn)業(yè)的發(fā)展奠定了堅(jiān)實(shí)的基礎(chǔ),特別是在機(jī)器翻譯、智能問(wèn)答、信息抽取等領(lǐng)域展現(xiàn)出廣泛的應(yīng)用潛力。
如需獲取更多詳盡信息,請(qǐng)直接參考下方經(jīng)官方授權(quán)發(fā)布的權(quán)威標(biāo)準(zhǔn)文檔。
....
查看全部
- 現(xiàn)行
- 正在執(zhí)行有效
- 2024-07-24 頒布
- 2025-02-01 實(shí)施
![GB/T 44217.6-2024語(yǔ)言資源管理語(yǔ)義標(biāo)注框架第6部分:語(yǔ)義標(biāo)注原則_第1頁(yè)](http://file4.renrendoc.com/view2/M03/20/3C/wKhkFma-KmeAV7K2AAE96sGw5fY758.jpg)
![GB/T 44217.6-2024語(yǔ)言資源管理語(yǔ)義標(biāo)注框架第6部分:語(yǔ)義標(biāo)注原則_第2頁(yè)](http://file4.renrendoc.com/view2/M03/20/3C/wKhkFma-KmeAV7K2AAE96sGw5fY7582.jpg)
![GB/T 44217.6-2024語(yǔ)言資源管理語(yǔ)義標(biāo)注框架第6部分:語(yǔ)義標(biāo)注原則_第3頁(yè)](http://file4.renrendoc.com/view2/M03/20/3C/wKhkFma-KmeAV7K2AAE96sGw5fY7583.jpg)
![GB/T 44217.6-2024語(yǔ)言資源管理語(yǔ)義標(biāo)注框架第6部分:語(yǔ)義標(biāo)注原則_第4頁(yè)](http://file4.renrendoc.com/view2/M03/20/3C/wKhkFma-KmeAV7K2AAE96sGw5fY7584.jpg)
![GB/T 44217.6-2024語(yǔ)言資源管理語(yǔ)義標(biāo)注框架第6部分:語(yǔ)義標(biāo)注原則_第5頁(yè)](http://file4.renrendoc.com/view2/M03/20/3C/wKhkFma-KmeAV7K2AAE96sGw5fY7585.jpg)
文檔簡(jiǎn)介
ICS01020
CCSA.22
中華人民共和國(guó)國(guó)家標(biāo)準(zhǔn)
GB/T442176—2024
.
語(yǔ)言資源管理語(yǔ)義標(biāo)注框架
第6部分語(yǔ)義標(biāo)注原則
:
Languageresourcemanagement—Semanticannotationframework—
Part6Princilesofsemanticannotation
:p
ISO24617-62016Lanuaeresourcemanaement—Semanticannotation
[:,ggg
framework—Part6PrincilesofsemanticannotationSemAFPrinciles
:p(p),
MOD
]
2024-07-24發(fā)布2025-02-01實(shí)施
國(guó)家市場(chǎng)監(jiān)督管理總局發(fā)布
國(guó)家標(biāo)準(zhǔn)化管理委員會(huì)
GB/T442176—2024
.
目次
前言
…………………………Ⅲ
引言
…………………………Ⅴ
范圍
1………………………1
規(guī)范性引用文件
2…………………………1
術(shù)語(yǔ)和定義
3………………1
用途和功能
4………………2
用途
4.1…………………2
功能
4.2…………………2
簡(jiǎn)述
5………………………3
標(biāo)注原則
6…………………3
繼承自語(yǔ)言標(biāo)注框架的原則
6.1………………………3
其他一般標(biāo)注原則
6.2…………………4
語(yǔ)義標(biāo)注的特定原則
6.3………………4
的方法論基礎(chǔ)
7SemAF……………………5
標(biāo)注方案設(shè)計(jì)的步驟
7.1………………5
元模型
7.2………………6
抽象語(yǔ)法具體語(yǔ)法和語(yǔ)義
7.3、…………7
設(shè)計(jì)過(guò)程中的步驟和反饋
7.4…………9
標(biāo)注方案中的可選元素
7.5……………11
標(biāo)注方案之間的重疊
8……………………12
語(yǔ)義一致性和術(shù)語(yǔ)一致性
8.1…………12
作為語(yǔ)義角色的空間和時(shí)間關(guān)系
8.2…………………12
事件
8.3…………………14
對(duì)話中的話語(yǔ)關(guān)系
8.4…………………14
跨越多個(gè)標(biāo)注框架的語(yǔ)義現(xiàn)象
9…………14
普遍存在的語(yǔ)義現(xiàn)象
9.1………………14
量化
9.2…………………14
數(shù)量和量
9.3……………15
否定情態(tài)事實(shí)性和屬性
9.4、、…………16
修飾與量化
9.5…………………………17
附錄資料性自然語(yǔ)言量化標(biāo)注方法
A()………………19
參考文獻(xiàn)
……………………22
Ⅰ
GB/T442176—2024
.
前言
本文件按照標(biāo)準(zhǔn)化工作導(dǎo)則第部分標(biāo)準(zhǔn)化文件的結(jié)構(gòu)和起草規(guī)則的規(guī)定
GB/T1.1—2020《1:》
起草
。
本文件是語(yǔ)言資源管理語(yǔ)義標(biāo)注框架的第部分已經(jīng)發(fā)布了以
GB/T44217《》6。GB/T44217
下部分
:
第部分語(yǔ)義標(biāo)注原則
———6:;
第部分可度量數(shù)量信息
———11:(MQI)。
本文件修改采用語(yǔ)言資源管理語(yǔ)義標(biāo)注框架第部分語(yǔ)義標(biāo)注原則
ISO24617-6:2016《6:
原則
(SemAF)》。
本文件增加了規(guī)范性引用文件一章
“”。
本文件與的技術(shù)差異及原因如下
ISO24617-6:2016:
更改了對(duì)數(shù)字語(yǔ)料庫(kù)中的語(yǔ)義標(biāo)注通常支持解釋和推理的原因的闡述將其改為陳述性描述
———,
見(jiàn)標(biāo)準(zhǔn)中無(wú)需闡述原因
(6.3),;
刪除了反饋關(guān)系和依賴關(guān)系未出現(xiàn)在話語(yǔ)關(guān)系標(biāo)注方案的原因的闡述刪除了話語(yǔ)關(guān)系的
———,
標(biāo)注方案應(yīng)從繼承這些關(guān)系的原因的闡述見(jiàn)的標(biāo)
ISOISO24617-2(ISO24617-6:20167.4),
準(zhǔn)中無(wú)需闡述原因
;
更改了關(guān)于數(shù)值和量的標(biāo)注方式見(jiàn)由于技術(shù)發(fā)展對(duì)于數(shù)值和量的標(biāo)注方式采用
———(9.3),,
中對(duì)數(shù)值和量的標(biāo)注方式
ISO24617-11:2022。
本文件做了下列編輯性改動(dòng)
:
更改了標(biāo)準(zhǔn)名稱將語(yǔ)義標(biāo)注框架的簡(jiǎn)稱刪去
———,;
更改了實(shí)現(xiàn)本文件目的三種方式的表述形式見(jiàn)根據(jù)要求改為列項(xiàng)
———(4.1),GB/T1.1—2020,
表示
;
更改了示例的表述形式見(jiàn)改為符合漢語(yǔ)表述方式的示例
———(4.2),;
更改了示例示例示例的內(nèi)容見(jiàn)改為符合漢語(yǔ)表述方式的示例
———1、2、3(4.2),;
更改了標(biāo)注方案間一致性和標(biāo)注方案集合完整性的表述形式見(jiàn)第章根據(jù)
———(5),GB/T1.1—
要求改為列項(xiàng)表示
2020,;
更改了語(yǔ)義標(biāo)注兩個(gè)功能的表述形式見(jiàn)根據(jù)要求改為列項(xiàng)表示
———(6.3),GB/T1.1—2020,;
更改了示例的表述形式見(jiàn)改為符合漢語(yǔ)表述方式的示例
———(6.3),;
更改了對(duì)有意義的標(biāo)注的解釋方式見(jiàn)標(biāo)準(zhǔn)中無(wú)需闡述原因改為陳述性描述
———(6.3),,;
更改了示例的內(nèi)容見(jiàn)改為符合漢語(yǔ)表述方式的示例
———2(6.3),;
更改了示例示例示例的內(nèi)容見(jiàn)改為符合漢語(yǔ)表述方式的示例
———4、5、6(7.2),;
更改了示例的表述形式見(jiàn)改為符合漢語(yǔ)表述方式的示例
———(7.2),;
更改正文中對(duì)于參考文獻(xiàn)的表述方式見(jiàn)以符合的要求
———(7.2),GB/T1.1—2020;
更改了給定表示轉(zhuǎn)換為另一個(gè)語(yǔ)義等同表示的步驟的表述形式見(jiàn)改為列項(xiàng)表示
———(7.3),;
更改正文中對(duì)于參考文獻(xiàn)的表述方式見(jiàn)以符合的要求
———(7.4),GB/T1.1—2020;
更改了示例中對(duì)距離的描述見(jiàn)改為符合漢語(yǔ)習(xí)慣的衡量距離的單位
———4(8.2),;
更改了對(duì)話行為標(biāo)注方案兩種類型的表述形式見(jiàn)改為列項(xiàng)表示
———ISO(8.4),;
更改了示例及相關(guān)內(nèi)容見(jiàn)
———1(8.8);
更改了示例的表述形式見(jiàn)改為符合漢語(yǔ)表述方式的示例
———(9.2),;
Ⅲ
GB/T442176—2024
.
更改了示例內(nèi)容及表述形式見(jiàn)改為符合漢語(yǔ)表述方式的示例
———(9.4),;
刪除了原示例及正文中相應(yīng)的說(shuō)明見(jiàn)的其表述方式不
———(24)(9.5.1,ISO24617-6:20168.5.1),
符合中文習(xí)慣
;
更改了示例內(nèi)容及表述形式見(jiàn)改為符合漢語(yǔ)表述方式的示例
———(9.5.2),。
請(qǐng)注意本文件的某些內(nèi)容可能涉及專利本文件的發(fā)布機(jī)構(gòu)不承擔(dān)識(shí)別專利的責(zé)任
。。
本文件由全國(guó)語(yǔ)言與術(shù)語(yǔ)標(biāo)準(zhǔn)化技術(shù)委員會(huì)提出并歸口
(SAC/TC62)。
本文件起草單位中國(guó)標(biāo)準(zhǔn)化研究院華南師范大學(xué)湖北省標(biāo)準(zhǔn)化與質(zhì)量研究院北京信息科技大
:、、、
學(xué)廈門坤錦電子科技有限公司中國(guó)科學(xué)技術(shù)信息研究所中國(guó)質(zhì)量標(biāo)準(zhǔn)出版?zhèn)髅接邢薰颈本┘t
、、、、
弘文文化傳媒有限公司聊城大學(xué)北京工業(yè)大學(xué)上海對(duì)外經(jīng)貿(mào)大學(xué)中國(guó)中醫(yī)科學(xué)院中醫(yī)藥信息研究
、、、、
所江蘇科技大學(xué)四川語(yǔ)言橋信息技術(shù)有限公司廣州智語(yǔ)信息科技有限公司
、、、。
本文件主要起草人曹馨宇王海濤郝天永陳炎明呂學(xué)強(qiáng)黃樹(shù)福劉耀劉曉東嚴(yán)可賀莉麗
:、、、、、、、、、、
魏潔魯曦賈仰理徐術(shù)坤劉磊劉亮亮周洪偉劉嘎瓊朱憲超瞿瑛瑛
、、、、、、、、、。
Ⅳ
GB/T442176—2024
.
引言
語(yǔ)義標(biāo)注是計(jì)算機(jī)對(duì)自然語(yǔ)言深層次處理的重要技術(shù)之一是對(duì)文本中的詞語(yǔ)或句子添加可供理
,
解的語(yǔ)義標(biāo)簽的過(guò)程依據(jù)標(biāo)注的一般原則和具體標(biāo)注對(duì)象的不同標(biāo)準(zhǔn)被劃分為不同的部分
。,,
語(yǔ)言資源管理語(yǔ)義標(biāo)注框架擬由個(gè)部分構(gòu)成
GB/T44217《》12。
第部分時(shí)間和事件目的在于提供一種通用的方法來(lái)描述文本中的時(shí)間和事件
———1:。。
第部分對(duì)話行為目的在于提供一種表示對(duì)話行為的標(biāo)注語(yǔ)言以及一種將對(duì)話分割為語(yǔ)
———2:。
義單元的方法
。
第部分語(yǔ)義角色目的在于為語(yǔ)義角色提供一個(gè)協(xié)商一致的標(biāo)注方案
———4:。。
第部分篇章結(jié)構(gòu)目的在于為話語(yǔ)實(shí)現(xiàn)和話語(yǔ)內(nèi)容提供一種表示方式
———5:。。
第部分語(yǔ)義標(biāo)注原則目的在于確定以語(yǔ)義標(biāo)注框架為特征的語(yǔ)義標(biāo)注方法
———6:。。
第部分空間信息目的在于提供一種通用的方法來(lái)描述自然語(yǔ)言文本中表達(dá)運(yùn)動(dòng)相關(guān)的
———7:。
空間信息和時(shí)空信息
。
第部分篇章中的語(yǔ)義關(guān)系核心標(biāo)注框架目的在于為話語(yǔ)關(guān)系的表示和標(biāo)注提供一個(gè)
———8:,。
方案
。
第部分引用標(biāo)注框架目的在于為自然語(yǔ)言文本和多模態(tài)交互中所指現(xiàn)象的標(biāo)注和表示
———9:。
提供一個(gè)綜合模型
。
第部分可度量數(shù)量信息目的在于為可度量數(shù)量信息提供一種標(biāo)注方案
———11:(MQI)。。
第部分?jǐn)?shù)量目的在于為數(shù)量信息語(yǔ)義表示提出一般形式化定義
———12:。。
第部分空間語(yǔ)義目的在于通過(guò)為抽象語(yǔ)法建立形式語(yǔ)義提供標(biāo)注空間信息的方法
———14:。。
第部分可度量數(shù)量信息抽取目的在于提供一種從自然語(yǔ)言文本中抽取可度量數(shù)量信息
———15:。
的一般方法
。
Ⅴ
GB/T442176—2024
.
語(yǔ)言資源管理語(yǔ)義標(biāo)注框架
第6部分語(yǔ)義標(biāo)注原則
:
1范圍
本文件描述了以語(yǔ)義標(biāo)注框架為特征的語(yǔ)義標(biāo)注方法策略可為特定類別
ISO(SemAF)。SemAF
的語(yǔ)義現(xiàn)象開(kāi)發(fā)獨(dú)立的語(yǔ)義標(biāo)注方案并最終合成一個(gè)單一連貫且覆蓋廣泛的方案本文件對(duì)這一策
,、,
略進(jìn)行了簡(jiǎn)要敘述并針對(duì)語(yǔ)言標(biāo)注框架中的標(biāo)注與表示分別給出了用于語(yǔ)義標(biāo)注的抽象
,ISO“”“”,
句法概念與具體句法概念本文件還描述了上述概念在元模型規(guī)范和標(biāo)注語(yǔ)義解釋方面的作用以便
。,
確定一個(gè)理?yè)?jù)充分的標(biāo)注方案
。
本文件還為各個(gè)部分的標(biāo)注方案提供了指南用于處理以下兩個(gè)問(wèn)題一是因標(biāo)注方案重
SemAF,:
疊而引起的概念與術(shù)語(yǔ)上的不一致二是涉及多個(gè)部分的語(yǔ)義現(xiàn)象如否定情態(tài)和計(jì)量的處
;SemAF(、)
理方式本文件對(duì)以上問(wèn)題均給出了確切實(shí)例并視情況給出了部分的解決方案
溫馨提示
- 1. 本站所提供的標(biāo)準(zhǔn)文本僅供個(gè)人學(xué)習(xí)、研究之用,未經(jīng)授權(quán),嚴(yán)禁復(fù)制、發(fā)行、匯編、翻譯或網(wǎng)絡(luò)傳播等,侵權(quán)必究。
- 2. 本站所提供的標(biāo)準(zhǔn)均為PDF格式電子版文本(可閱讀打?。?,因數(shù)字商品的特殊性,一經(jīng)售出,不提供退換貨服務(wù)。
- 3. 標(biāo)準(zhǔn)文檔要求電子版與印刷版保持一致,所以下載的文檔中可能包含空白頁(yè),非文檔質(zhì)量問(wèn)題。
最新文檔
- 2025年個(gè)人普通貨物運(yùn)輸合同模板(三篇)
- 2025年二手房屋買賣合同范文(2篇)
- 2025年二人合伙開(kāi)店協(xié)議經(jīng)典版(三篇)
- 2025年五年級(jí)語(yǔ)文教學(xué)工作總結(jié)參考范文(二篇)
- 2025年個(gè)人房產(chǎn)抵押借款合同標(biāo)準(zhǔn)版本(三篇)
- 2025年五金配件訂購(gòu)買賣合同(三篇)
- 2025年產(chǎn)品銷售合作協(xié)議(三篇)
- 2025年專利實(shí)施合同參考樣本(三篇)
- 歷史建筑修復(fù)外包合同
- 教育產(chǎn)業(yè)基地建設(shè)居間協(xié)議
- 輸液港用無(wú)損傷針相關(guān)知識(shí)
- 高標(biāo)準(zhǔn)農(nóng)田施工組織設(shè)計(jì)(全)
- 宿舍、辦公樓消防應(yīng)急預(yù)案
- 職業(yè)安全健康工作總結(jié)(2篇)
- 14S501-1 球墨鑄鐵單層井蓋及踏步施工
- YB 4022-1991耐火泥漿荷重軟化溫度試驗(yàn)方法(示差-升溫法)
- 水土保持方案中沉沙池的布設(shè)技術(shù)
- 安全生產(chǎn)技術(shù)規(guī)范 第25部分:城鎮(zhèn)天然氣經(jīng)營(yíng)企業(yè)DB50-T 867.25-2021
- 現(xiàn)代企業(yè)管理 (全套完整課件)
- 走進(jìn)本土項(xiàng)目化設(shè)計(jì)-讀《PBL項(xiàng)目化學(xué)習(xí)設(shè)計(jì)》有感
- 高中語(yǔ)文日積月累23
評(píng)論
0/150
提交評(píng)論