




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
ICS01.020
CCS點(diǎn)擊此處添加CCS號(hào)
中華人民共和國(guó)國(guó)家標(biāo)準(zhǔn)
GB/TXXXXX—XXXX
`
術(shù)語(yǔ)資源管理-—術(shù)語(yǔ)數(shù)據(jù)庫(kù)交換(TBX)
Managementofterminologyresources—TermBaseeXchange(TBX)
((ISO30042:2019,MOD)
(征求意見稿)
在提交反饋意見時(shí),請(qǐng)將您知道的相關(guān)專利連同支持性文件一并附上。
-XX-XX發(fā)布XXXX-XX-XX實(shí)施
GB/TXXXXX—XXXX
前言
本文件按照GB/T1.1—2020《標(biāo)準(zhǔn)化工作導(dǎo)則第1部分:標(biāo)準(zhǔn)化文件的結(jié)構(gòu)和起草規(guī)則》的規(guī)定
起草。
本文件修改采用ISO30042:2019《術(shù)語(yǔ)資源管理-—術(shù)語(yǔ)數(shù)據(jù)庫(kù)交換(TBX)》。
本文件與ISO30042:2019的技術(shù)差異及原因如下:
——增加了關(guān)于術(shù)語(yǔ)對(duì)應(yīng)詞的數(shù)據(jù)類目和對(duì)應(yīng)的TBX專用語(yǔ)。
本文件由全國(guó)語(yǔ)言與術(shù)語(yǔ)標(biāo)準(zhǔn)化技術(shù)委員會(huì)(SAC/TC62)提出并歸口。
本文件起草單位:中國(guó)標(biāo)準(zhǔn)化研究院、華南師范大學(xué)、北京信息科技大學(xué)等。
本文件主要起草人:
III
GB/TXXXXX—XXXX
術(shù)語(yǔ)資源管理--術(shù)語(yǔ)數(shù)據(jù)庫(kù)交換(TBX)
1范圍
本文件規(guī)定了描述了元模型、數(shù)據(jù)類目、XML樣式:DCA(作為屬性的數(shù)據(jù)類目)和DCT(作為標(biāo)
簽的數(shù)據(jù)類目)和定義TBX專用語(yǔ)的方法。
本文件適用于分析和理解術(shù)語(yǔ)數(shù)據(jù)集合或設(shè)計(jì)符合國(guó)際標(biāo)準(zhǔn)和最佳實(shí)踐的新術(shù)語(yǔ)數(shù)據(jù)庫(kù)。典型用
戶是程序員、軟件開發(fā)人員、術(shù)語(yǔ)專家、分析師和其他語(yǔ)言專業(yè)人士,應(yīng)用領(lǐng)域包括翻譯和創(chuàng)作。
2規(guī)范性引用文件
下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文件,
僅該日期對(duì)應(yīng)的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本
文件。
GB13000信息技術(shù)通用多八位編碼字符集(UCS)第一部分:體系結(jié)構(gòu)與基本多文種平面(GB13000:
2010,ISO/IEC10646:2003,IDT)
GB/T16786術(shù)語(yǔ)工作計(jì)算機(jī)應(yīng)用數(shù)據(jù)類目(GB/T16786-2007,ISO12620:1999,NEQ)
GB/T16786術(shù)語(yǔ)工作計(jì)算機(jī)應(yīng)用術(shù)語(yǔ)信息置標(biāo)框架(GB/T29181-2012,ISO16642:2003,IDT)
ISO8601-1日期和時(shí)間信息交換表示方法第1部分:基本規(guī)則(Dateandtime-Representations
forinformationinterchange—Part1:Basicrules)
ISO8601-2日期和時(shí)間信息交換表示方法第2部分:擴(kuò)展規(guī)則(Dateandtime-
Representationsforinformationinterchange—Part2:Extensions)
ISO21720:2017XLIFF(XML本地化交換文件格式)(XLIFF(XMLLocalisationinterchange
fileformat))
3術(shù)語(yǔ)和定義
下列術(shù)語(yǔ)和定義適用于本文件。
ISO和IEC負(fù)責(zé)維護(hù)術(shù)語(yǔ)數(shù)據(jù)庫(kù)在標(biāo)準(zhǔn)中的使用,術(shù)語(yǔ)數(shù)據(jù)庫(kù)通過以下地址進(jìn)行訪問:
——ISO在線瀏覽平臺(tái):/obp
——IEC術(shù)語(yǔ)數(shù)據(jù)庫(kù):Electropedia:
屬性類attributeclass
一組或多個(gè)相關(guān)屬性。
子元素childelement
從屬于另一個(gè)元素的元素。
分類元素classificationelement
用于根據(jù)概念條目中的功能對(duì)數(shù)據(jù)類目進(jìn)行分組的元素。
1
GB/TXXXXX—XXXX
補(bǔ)充信息complementaryinformation
CI
對(duì)術(shù)語(yǔ)條目(3.5)中所描述的內(nèi)容予以補(bǔ)充,并在術(shù)語(yǔ)數(shù)據(jù)集合(3.29)中共享的信息。
概念條目conceptentry
術(shù)語(yǔ)條目
條目
術(shù)語(yǔ)數(shù)據(jù)集合(3.21)的一部分,包含與某一概念相關(guān)的術(shù)語(yǔ)數(shù)據(jù)。
術(shù)語(yǔ)數(shù)據(jù)集合中所包含的與一個(gè)概念相關(guān)的術(shù)語(yǔ)數(shù)據(jù)。
核心結(jié)構(gòu)corestructure
在所有TBX專用語(yǔ)(3.12)中使用的通用結(jié)構(gòu)和數(shù)據(jù)類目(3.8)
注1:核心結(jié)構(gòu)符合ISO16642(TMF)。
核心結(jié)構(gòu)模塊corestructuremodule
核心模塊
TBX-核心模塊
數(shù)據(jù)類目模塊(3.9),僅包含作為核心結(jié)構(gòu)(3.6)一部分的數(shù)據(jù)類目(3.8)
數(shù)據(jù)類目datacategory
從形式或語(yǔ)義的角度來(lái)看密切相關(guān)的數(shù)據(jù)項(xiàng)類別
注:數(shù)據(jù)類目可以看作是數(shù)據(jù)庫(kù)中字段概念的概括。
例:/partofspeech/,/subjectfield/,/definition/.
條目注釋2:在運(yùn)行文本中,例如在本文檔中,數(shù)據(jù)類目名稱用正斜杠括起來(lái)(例如/partofspeech/)。
數(shù)據(jù)分類模塊datacategorymodule
模塊
允許的數(shù)據(jù)類目列表(3.8)以及在設(shè)計(jì)符合TBX的術(shù)語(yǔ)數(shù)據(jù)集合(3.29)中使用的限制
示例TBX-Core模塊,包括所有TBX專用語(yǔ)共有的數(shù)據(jù)類目和結(jié)構(gòu),TBX-Min模塊,它添加了簡(jiǎn)
單詞匯表所需的最少數(shù)據(jù)類目,以及TBX-Basic模塊,它提供了一個(gè)更豐富的數(shù)據(jù)類目。
DCA
數(shù)據(jù)類目作為屬性datacategoryasattribute
表示TBX數(shù)據(jù)的樣式,其中大多數(shù)數(shù)據(jù)類目(3.8)表示為相應(yīng)模式中聲明的XML元素上的類型
屬性的值
示例<termNotetype="partOfSpeech">形容詞</termNote>。
DCT
數(shù)據(jù)類目作為標(biāo)簽datacategoryastag
表示TBX數(shù)據(jù)的樣式,其中大多數(shù)數(shù)據(jù)類目(3.8)表示為XML通用標(biāo)識(shí)符
專用語(yǔ)dialect
2
GB/TXXXXX—XXXX
XML標(biāo)記語(yǔ)言,根據(jù)TBX的核心結(jié)構(gòu)(3.6)進(jìn)行驗(yàn)證,并在特定數(shù)據(jù)類目模塊(3.9)或數(shù)據(jù)類
目模塊集指定的那些級(jí)別上準(zhǔn)確允許那些數(shù)據(jù)類目(3.8)并遵守所有其他相關(guān)約束
注:“所有其他相關(guān)約束”是指所討論的專用語(yǔ)所必需但不能在核心結(jié)構(gòu)或數(shù)據(jù)類目模塊中表達(dá)的約束,例如日期
格式或條件約束。這方面的一個(gè)例子出現(xiàn)在專用語(yǔ)TBX-Basic中,它需要/definition/或/語(yǔ)境/。
顯示名稱displayname
出現(xiàn)在軟件用戶界面或其他介質(zhì)上的數(shù)據(jù)類目(3.8)的名稱。
文檔實(shí)例documentinstance
包含以TBX專用語(yǔ)(3.12)表示的概念條目(3.5)的文件
交換exchange
涉及從一個(gè)術(shù)語(yǔ)庫(kù)(3.28)導(dǎo)出數(shù)據(jù)并將其導(dǎo)入另一個(gè)術(shù)語(yǔ)庫(kù)的事務(wù)
全局信息globalinformation
GI
應(yīng)用于整個(gè)術(shù)語(yǔ)數(shù)據(jù)集合(3.29)的技術(shù)性和管理性的信息。
分組元素groupingelement
XML元素,其目的是將一組子元素組合在一起(3.2)
目標(biāo)語(yǔ)言objectlanguage
被描述的語(yǔ)言
PID
持久標(biāo)識(shí)符persistentidentifier
唯一標(biāo)識(shí)符(URI),確保對(duì)數(shù)字目標(biāo)進(jìn)行永久訪問,而不受其物理位置或當(dāng)前所有權(quán)的影響。
[來(lái)源:ISO24619:2011,3.2.4,修改——“持久標(biāo)識(shí)符”成為第二個(gè)首選術(shù)語(yǔ),條目注釋1已
刪除。]
私人專用語(yǔ)privatedialect
未在可公開訪問的網(wǎng)站上描述的用于私人用途的專用語(yǔ)(3.12)
公共專用語(yǔ)publicdialect
在可公開訪問的網(wǎng)站上描述的專用語(yǔ)(3.12)
注:可公開訪問的網(wǎng)站的一個(gè)示例是TBXInfo[15]。
根元素rootelement
TBX文檔實(shí)例中的第一個(gè)元素(3.14)
注:根元素是<tbx>。
TBX代理TBXagent
3
GB/TXXXXX—XXXX
生成、讀取、編輯、寫入、處理、存儲(chǔ)、呈現(xiàn)或以其他方式操作TBX兼容文檔實(shí)例的程序或?qū)嵱?/p>
程序(3.14)
TBX出口TBXexport
從術(shù)語(yǔ)庫(kù)(3.28)或其子集創(chuàng)建TBX專用語(yǔ)(3.12)文檔實(shí)例(3.14)的過程
TBX進(jìn)口TBXimport
將術(shù)語(yǔ)數(shù)據(jù)從一個(gè)TBX文檔實(shí)例(3.14)插入現(xiàn)有術(shù)語(yǔ)庫(kù)(3.29)的過程
條目注釋1:現(xiàn)有術(shù)語(yǔ)庫(kù)可以是空的,也可以已經(jīng)包含術(shù)語(yǔ)條目。
TBX模塊說(shuō)明TBXModuleDescription
TBXMD
用于識(shí)別一組數(shù)據(jù)類目(3.8)及其對(duì)特定數(shù)據(jù)類目模塊(3.9)的約束的形式主義
術(shù)語(yǔ)成分termcomponent
多詞詞條的詞之一,或單詞詞條的組成部分之一(例如語(yǔ)素)
術(shù)語(yǔ)庫(kù)termbase
術(shù)語(yǔ)數(shù)據(jù)庫(kù)
包含術(shù)語(yǔ)數(shù)據(jù)集合的數(shù)據(jù)庫(kù)(3.29)。
術(shù)語(yǔ)數(shù)據(jù)集合terminologicaldatacollection
TDC
由術(shù)語(yǔ)條目(3.5)及其相關(guān)的元數(shù)據(jù)和文檔信息組成的資源。
示例TBX文檔實(shí)例,ISO1087。
[來(lái)源:ISO16642:2017,3.21,已修改——在定義中,使用“概念條目”而不是“術(shù)語(yǔ)條目”,
添加示例。]
工作語(yǔ)言workinglanguage
概念條目(3.5)中用于描述目標(biāo)語(yǔ)言(3.18)內(nèi)容的元語(yǔ)言。
4基本原理和概念
TBX是指由兩個(gè)交互組件組成的框架:一個(gè)核心結(jié)構(gòu)和一個(gè)用于定義數(shù)據(jù)分類模塊的形式體系。核
心結(jié)構(gòu)用諸如RelaxNG(RNG)之類的模式定義語(yǔ)言來(lái)表示。(核心也由它自己的數(shù)據(jù)分類模塊來(lái)表示。)
這種基于組件的方法支持包含在不同術(shù)語(yǔ)數(shù)據(jù)集合中的不同類型的術(shù)語(yǔ)數(shù)據(jù)或數(shù)據(jù)類目。該方法反映
了術(shù)語(yǔ)標(biāo)記框架(TMF),因?yàn)楹诵慕Y(jié)構(gòu)會(huì)反映符合ISO16642的TMF抽象數(shù)據(jù)模型。此外,它有助于明
確描述TBX框架內(nèi)任何兩種專用語(yǔ)的共同點(diǎn)(核心結(jié)構(gòu))以及它們之間的差異(在各自的數(shù)據(jù)分類模
塊中表示)。這兩個(gè)組件的組合定義了一種特定的專用語(yǔ)。沒有專用語(yǔ)指示符的“TBX”不是一種文件
格式,它不是一種術(shù)語(yǔ)標(biāo)記語(yǔ)言,它本身也不是一種專用語(yǔ)。
由于術(shù)語(yǔ)數(shù)據(jù)集合差異很大,所以TBX框架假定沒有任何一種專用語(yǔ)可以滿足所有用戶需求。TBX
框架內(nèi)的所有專用語(yǔ)都遵循第8章中描述的核心結(jié)構(gòu)。核心結(jié)構(gòu)的RelaxNG模式在附錄C中引用,元素
和屬性在附錄A中描述。附錄C中引用了核心結(jié)構(gòu)的RelaxNG模式,附錄A中描述了元素和屬性。
4
GB/TXXXXX—XXXX
專用語(yǔ)在允許哪些數(shù)據(jù)類目,以及這些數(shù)據(jù)類目可能出現(xiàn)在概念條目的什么級(jí)別方面可能有所不
同。這些對(duì)核心結(jié)構(gòu)的約束在一個(gè)或多個(gè)數(shù)據(jù)分類模塊中得以正式表示。
數(shù)據(jù)分類模塊,或簡(jiǎn)稱為模塊,是一個(gè)設(shè)計(jì)符合TBX的專用語(yǔ)時(shí)使用的可允許的數(shù)據(jù)類目及其約
束的列表。約束是數(shù)據(jù)類目的允許內(nèi)容(包括標(biāo)準(zhǔn)選項(xiàng)列表值域的子集)和可能出現(xiàn)數(shù)據(jù)類目的概念條
目的級(jí)別(參見第8章)。
注:TBX信息網(wǎng)站[15]上提供了示例數(shù)據(jù)分類模塊。
建議TBX的制訂者遵守ISO標(biāo)準(zhǔn)和行業(yè)準(zhǔn)則,這些準(zhǔn)則規(guī)范了術(shù)語(yǔ)管理的原則和方法以及術(shù)語(yǔ)
數(shù)據(jù)集合的內(nèi)容和質(zhì)量,例如第2章和參考文獻(xiàn)中所描述的。
TBX文檔實(shí)例中展現(xiàn)的信息應(yīng)該是面向概念的。除非另有說(shuō)明,否則假定單個(gè)條目中的術(shù)語(yǔ)是同義
詞。
此外,如果有兩個(gè)系統(tǒng)都完全支持某個(gè)給定的TBX專用語(yǔ),那么當(dāng)術(shù)語(yǔ)數(shù)據(jù)從一個(gè)系統(tǒng)導(dǎo)出并導(dǎo)
入另一個(gè)系統(tǒng)時(shí),該專用語(yǔ)中的信息可以被保留。在TBX的上下文中,互操作性就意味著這種數(shù)據(jù)留
存。當(dāng)兩個(gè)系統(tǒng)使用不同的TBX專用語(yǔ)時(shí),互操作性會(huì)降低,并且可能會(huì)丟失數(shù)據(jù)類目及其內(nèi)容。因
此,在不指明專用語(yǔ)的情況下聲稱符合TBX,并不能保證任何程度的互操作性。
5數(shù)據(jù)類目
概述
數(shù)據(jù)類目代表了術(shù)語(yǔ)和概念的有關(guān)信息,例如/partofspeech/和/definition/。附錄B中提
供了術(shù)語(yǔ)庫(kù)中常用的數(shù)據(jù)類目列表,這些和其他數(shù)據(jù)類目的描述可在數(shù)據(jù)類目存儲(chǔ)庫(kù)DatCatInfo[10]
中找到。如果使用另一個(gè)數(shù)據(jù)類目存儲(chǔ)庫(kù)來(lái)描述數(shù)據(jù)類目,它也應(yīng)符合ISO12620。
在運(yùn)行文本中,例如在本文檔中,數(shù)據(jù)類目名稱用正斜杠括起來(lái)(例如/partofspeech/)。在
TBX文檔實(shí)例中,以及在聲明了TBX專用語(yǔ)的數(shù)據(jù)類目的數(shù)據(jù)分類模塊中,應(yīng)使用駝峰式大小寫(例
如partOfSpeech)。DatCatInfo中提供了行業(yè)公認(rèn)的駝峰式數(shù)據(jù)類目名稱。如果附錄B中的數(shù)據(jù)類目
用于TBX文檔實(shí)例,則應(yīng)使用附錄B中的名稱。
核心結(jié)構(gòu)模塊中指定的數(shù)據(jù)類目
在TBX中,以下數(shù)據(jù)類目在TBX-Core結(jié)構(gòu)中聲明,因此可用于所有TBX專用語(yǔ),并且在所有樣式中
以相同的方式表示(參見第6章):
-/date/
-/term/
-/note/
數(shù)據(jù)分類模塊中指定的數(shù)據(jù)類目
某一特定TBX專用語(yǔ)所需的所有未包含在TBX-Core中的數(shù)據(jù)類目都記錄在該專用語(yǔ)的數(shù)據(jù)分類
模塊中(參見第9章)。這樣的附加數(shù)據(jù)類目可以包括/definition/、/partofspeech/、/context/、
/termtype/等等。一個(gè)簡(jiǎn)單的數(shù)據(jù)分類模塊,例如Min模塊,引入了/definition/,但緊接著,一
個(gè)例如Basic之類的附加模塊通過添加/context/和其他數(shù)據(jù)類目進(jìn)一步擴(kuò)展了模型。因此,TBX-Basic
專用語(yǔ)由TBX-Core、TBX-Min和TBX-Basic模塊組成。
6DCA和DCT樣式
5
GB/TXXXXX—XXXX
有兩種XML樣式可用于表示術(shù)語(yǔ)數(shù)據(jù):DCA(作為屬性的數(shù)據(jù)類目)和DCT(作為標(biāo)簽的數(shù)據(jù)類目)。
DCA是本文檔中示例所使用的樣式。
—DCA:<termNotetype="partOfSpeech">adjective</termNote>
—DCT:<partOfSpeech>adjective</partOfSpeech>
在DCA樣式中,大多數(shù)數(shù)據(jù)類目都表示為核心結(jié)構(gòu)中聲明的元素之一(在這種情況下,<termNote>)
的type屬性的值(在上述情況中:/partofspeech/)。
在DCT樣式中,大多數(shù)數(shù)據(jù)類目都反映在元素通用標(biāo)識(shí)符名稱中。與此數(shù)據(jù)類目相關(guān)聯(lián)的相應(yīng)核
心結(jié)構(gòu)元素可選擇性地表示為metaType屬性的值。。例如:
<partOfSpeechmetaType="termNote">形容詞</partOfSpeech>
在這兩種情況下,數(shù)據(jù)類目的值都是XML元素的內(nèi)容。這兩種樣式是同構(gòu)的。也就是說(shuō),它們可
以通過算法來(lái)回轉(zhuǎn)換而不損失信息。即使省略了metaType屬性(例如<partOfSpeech>形容詞
</partOfSpeech>),如果算法可以訪問一個(gè)展現(xiàn)了了每個(gè)數(shù)據(jù)類目相關(guān)的核心結(jié)構(gòu)元素的表格,則這兩
種表示方法仍然可以從一種轉(zhuǎn)換為另一種。
DCA樣式強(qiáng)調(diào)TBX專用語(yǔ)之間的相似性。DCA還允許使用通用XML解析器在第一級(jí)針對(duì)相同的
模式(核心結(jié)構(gòu))驗(yàn)證所有TBX專用語(yǔ)。
對(duì)于習(xí)慣使用不同元素名稱而不是通過屬性值細(xì)化元素的XML用戶來(lái)說(shuō),DCT樣式看起來(lái)更熟悉。
注:有關(guān)DCT樣式的更多信息可在TBX信息網(wǎng)站[15]上找到。
7專用語(yǔ)
概述
很少有術(shù)語(yǔ)集合或應(yīng)用程序使用完全相同的數(shù)據(jù)類目集。TBX是一個(gè)靈活的框架,因?yàn)樗试S用戶
群選擇他們自己的數(shù)據(jù)類目。如此一來(lái),他們可以創(chuàng)建適合自身需求的自己的專用語(yǔ)。一種TBX專用
語(yǔ)遵循核心結(jié)構(gòu)并實(shí)現(xiàn)一個(gè)或多個(gè)定義的數(shù)據(jù)分類模塊。
專用語(yǔ)命名
專用語(yǔ)名稱應(yīng)以“TBX-”前綴開頭,以專用語(yǔ)指示符結(jié)尾,例如“Basic”,即TBX-Basic。盡管專
用語(yǔ)沒有標(biāo)準(zhǔn)化,但行業(yè)團(tuán)體和公司在過去已經(jīng)宣布了他們自己的數(shù)據(jù)模型,以便在公共環(huán)境中共享。
公共專用語(yǔ)名稱可以發(fā)布,從而可供協(xié)作使用,例如在TBX信息網(wǎng)站上。
所有TBX專用語(yǔ)都建立在TBX-Core模塊之上,該模塊包含第8節(jié)中描述的基本數(shù)據(jù)類目。TBX
專用語(yǔ)通過添加一組數(shù)據(jù)分類模塊來(lái)擴(kuò)展核心。例如,一種常見的行業(yè)專用語(yǔ)TBX-Basic由三個(gè)模塊
組成:TBX-Core、TBX-Min和TBX-Basic(見9.6)。
如果通過添加一個(gè)或多個(gè)數(shù)據(jù)分類模塊擴(kuò)展了某個(gè)專用語(yǔ),則應(yīng)在該專用語(yǔ)名稱中添加一個(gè)有意
義的名稱限定符,并用句點(diǎn)“.”分隔開。
示例TBX-Basic.Seo,其中Seo是一個(gè)模塊的名稱,該模塊向TBX-Basic專用語(yǔ)中添加一個(gè)或
多個(gè)數(shù)據(jù)類目,在這種情況下,包括用于搜索引擎優(yōu)化(SEO)的數(shù)據(jù)類目。
注1:TBX信息網(wǎng)站[15]上提供了公共TBX專用語(yǔ)或其專用擴(kuò)展之間的建議子集關(guān)系。
注2:模塊和專用語(yǔ)都以“TBX-”前綴開頭,并通過描述符“模塊”或“專用語(yǔ)”結(jié)合它們的名稱來(lái)加以區(qū)分。
專用語(yǔ)示例
本小節(jié)描述了一種虛構(gòu)的TBX專用語(yǔ),稱為TBX-Sample專用語(yǔ)。出于說(shuō)明目的,這種專用語(yǔ)允
許使用最少的術(shù)語(yǔ)信息。
TBX-Sample專用語(yǔ)定義為TBX-Core模塊與TBX-Fiction模塊的組合:
6
GB/TXXXXX—XXXX
TBX-Sampledialect=TBX-Core模塊+TBX-Fiction模塊
注:此示例演示了模塊名稱和專用語(yǔ)名稱的不同。
TBX-Fiction模塊中包含的數(shù)據(jù)類目(及其附帶的約束)如表1所示:
表1TBX-Fiction模塊的模塊定義
姓名PID分類值級(jí)別
定義/datcat/DC-168<descrip>注釋文本概念入口,langSec
學(xué)科領(lǐng)域/datcat/DC-489<descrip>金融、制造概念入口
術(shù)語(yǔ)類型/datcat/DC-2677<termNote>縮寫形式,完整形式
請(qǐng)注意,任何具有<termNote>核心結(jié)構(gòu)(分類)元素的數(shù)據(jù)類目都被核心結(jié)構(gòu)限制在termSec級(jí)
別。因此,/termtype/的級(jí)別不需要指明。
TBX-Fiction模塊的TBX模塊說(shuō)明(TBXMD)見附錄C。
可選模塊屬性將數(shù)據(jù)類目標(biāo)識(shí)為屬于TBX-Fiction模塊。
ExampleTBX-Sampledialect文檔實(shí)例:
<?xmlversion="1.0"encoding="UTF-8"?>
<tbxxmlns:tbx3="urn:iso:std:iso:30042:ed-2"type="TBX-Sample"style="dca"
xml:lang="en">
<tbxHeader>
<fileDesc>
<sourceDesc>
<p>Asampletermbaseconsistingofoneconceptentry</p>
</sourceDesc>
</fileDesc>
</tbxHeader>
<text>
<body>
<conceptEntryid="c1">
<descriptype="definition"module="Fiction">asumofmoneythat
isexpectedtobepaidbackwithinterest</descrip>
<descriptype="subjectField"module="Fiction">finance</descrip>
<langSecxml:lang="en">
<termSec>
<term>loan</term>
<termNotetype="termType"module="Fiction">
fullForm</termNote>
</termSec>
</langSec>
<langSecxml:lang="fr">
<termSec>
<term>pret</term>
<termNotetype="termType"module="Fiction">
7
GB/TXXXXX—XXXX
fullForm</termNote>
</termSec>
</langSec>
</conceptEntry>
</body>
</text>
</tbx>
專用語(yǔ)符合TBX的要求
TBX文檔實(shí)例中遵循相同專用語(yǔ)的數(shù)據(jù)是可互換的。通過定義行業(yè)認(rèn)可的專用語(yǔ)并將其提供給公
眾使用,可預(yù)計(jì)到世界范圍內(nèi)的術(shù)語(yǔ)數(shù)據(jù)集合將有更強(qiáng)的互操作性。
要使一種專用語(yǔ)符合TBX,它應(yīng):
a)是一種XML標(biāo)記語(yǔ)言;
b)有一個(gè)符合要求的專用語(yǔ)名稱(見7.2);
c)由核心結(jié)構(gòu)模塊加上零個(gè)或多個(gè)附加兼容模塊組成;
d)由不重疊的模塊組成(見第9章)(如有多個(gè)模塊);
e)遵循核心模塊及其包含的任何其他模塊的所有約束。
注:不重疊意味著相同的數(shù)據(jù)類目不會(huì)出現(xiàn)在同一專用語(yǔ)的兩個(gè)模塊中。如果數(shù)據(jù)類目有相同的PID(持久標(biāo)識(shí)符),
則認(rèn)為它們是相同的。
一種符合TBX規(guī)范的新專用語(yǔ)的規(guī)范約束如下:
a)新的專用語(yǔ)應(yīng)基于TBX-Core模塊(見第8章);
注:如果希望與已發(fā)布的行業(yè)專用語(yǔ)兼容,則可以從該專用語(yǔ)的已發(fā)布信息中選擇一個(gè)或多個(gè)數(shù)據(jù)分類模塊,例如
TBX信息網(wǎng)站[15]。
b)如果任何現(xiàn)有模塊中都不包含所需的數(shù)據(jù)類目,則應(yīng)按照第9章中的準(zhǔn)則創(chuàng)建一個(gè)新模塊;
c)專用語(yǔ)應(yīng)按照7.2中的命名規(guī)則命名。
TBX專用語(yǔ)既可以是公共專用語(yǔ),也可以是私人專用語(yǔ)。公共專用語(yǔ)響應(yīng)了可識(shí)別的實(shí)踐社區(qū)的需
求,并由全面的專用語(yǔ)描述進(jìn)行記錄。
注:希望分享專用語(yǔ)的用戶可以將他們的信息發(fā)布在可公開訪問的網(wǎng)站上(無(wú)需登錄),例如TBX信息網(wǎng)站[15]。
驗(yàn)證TBX文檔實(shí)例
TBX文檔實(shí)例的擴(kuò)展名為.tbx。
TBX是一個(gè)定義專用語(yǔ)的框架,因此不需要使用任何特定的驗(yàn)證方法或模式定義語(yǔ)言。制訂者可以
使用多種方法來(lái)驗(yàn)證TBX文檔實(shí)例。
為符合TBX的要求,一個(gè)TBX文檔實(shí)例應(yīng)滿足以下標(biāo)準(zhǔn):
a)它應(yīng)該是格式良好的XML;
b)應(yīng)符合第8章和附錄A中闡述的TBX核心結(jié)構(gòu);
c)它應(yīng)指定兼容專用語(yǔ)的名稱作為<tbx>根元素的type屬性的值;
注:沒有在根元素上聲明專用語(yǔ)名稱的TBX文檔實(shí)例不符合該文檔。它的內(nèi)容是不可預(yù)測(cè)的,因此不可互操作。
d)它應(yīng)根據(jù)包含指定專用語(yǔ)約束的集成模式(或等效模式)進(jìn)行驗(yàn)證。如果驗(yàn)證XML文檔實(shí)例
時(shí),模式表示之間存在差異,則應(yīng)滿足本文檔的要求;
注:如果<tbx>根元素的type屬性值是TBX-Core,則TBX文檔實(shí)例不包含不在核心中的數(shù)據(jù)類目。
盡管個(gè)別專用語(yǔ)本身并沒有標(biāo)準(zhǔn)化,但任何聲稱符合該標(biāo)準(zhǔn)的專用語(yǔ)都可以作為公共或私人專用
語(yǔ)發(fā)布在TBXInfo[15]之類的易于訪問的網(wǎng)站上。
8
GB/TXXXXX—XXXX
用于驗(yàn)證的模式應(yīng)使用符合ISO/IEC19757-2和ISO/IEC19757-3的既定的模式定義語(yǔ)言,例如RNG
和Schematron。TBX-Core的RNG模式示例可在TBX信息網(wǎng)站[15]上找到。它可以擴(kuò)展為包括數(shù)
據(jù)分類模塊的約束,從而生成一個(gè)集成模式,該模式可用于驗(yàn)證給定專用語(yǔ)的TBX文檔實(shí)例。
合規(guī)TBX的要求
常見的TBX代理包括導(dǎo)入、導(dǎo)出、修改和補(bǔ)充。修飾符不會(huì)更改TBX文檔實(shí)例的專用語(yǔ),而豐富
器會(huì)使用來(lái)自一個(gè)或多個(gè)附加模塊的數(shù)據(jù)來(lái)擴(kuò)展TBX專用語(yǔ)文檔實(shí)例,所以生成的TBX專用語(yǔ)文檔
實(shí)例符合超集專用語(yǔ)定義。
TBX代理的導(dǎo)出、導(dǎo)入、修改或補(bǔ)充TBX兼容數(shù)據(jù),應(yīng)滿足以下要求:
導(dǎo)出:
——應(yīng)生成符合7.5的TBX文檔實(shí)例;
——應(yīng)導(dǎo)出聲明專用語(yǔ)的所有模塊中所需的所有數(shù)據(jù)類目;
——對(duì)于附錄B中的數(shù)據(jù)類目,應(yīng)使用附錄B中所示的數(shù)據(jù)類目名稱;
示例:在TBX中,數(shù)據(jù)類目/context/是包含該術(shù)語(yǔ)的一段文本。如果特定術(shù)語(yǔ)庫(kù)為此目標(biāo)使用/example/,則
導(dǎo)出器會(huì)將/example/的所有實(shí)例轉(zhuǎn)換為/context/。
——應(yīng)導(dǎo)出符合行業(yè)慣例的TBX數(shù)據(jù)類目定義的數(shù)據(jù)類目(見第5章);
——可以導(dǎo)出可用術(shù)語(yǔ)數(shù)據(jù)的子集。
注:只要子集符合所聲明的專用語(yǔ)名稱,術(shù)語(yǔ)庫(kù)的子集(一定數(shù)量的條目)和條目本身的子集(數(shù)據(jù)類目的特定選
擇)就符合條件。
導(dǎo)入:
——應(yīng)根據(jù)目標(biāo)術(shù)語(yǔ)庫(kù)定義導(dǎo)入所有數(shù)據(jù)類目(如果在導(dǎo)入的TBX專用語(yǔ)文檔實(shí)例中可用);
——如果導(dǎo)入符不支持導(dǎo)入的文檔實(shí)例中聲明的TBX專用語(yǔ),則可以導(dǎo)入對(duì)應(yīng)于子集專用語(yǔ)的
數(shù)據(jù)類目的子集;
——可以通過特殊轉(zhuǎn)換器將目標(biāo)術(shù)語(yǔ)庫(kù)定義中缺少的數(shù)據(jù)類目轉(zhuǎn)換為/note/;
——如果導(dǎo)入的TBX文檔實(shí)例不符合其<tbx>根元素上指定的專用語(yǔ)名稱,則應(yīng)拒絕它。
修飾符:
——不應(yīng)影響對(duì)<tbx>根元素上聲明的專用語(yǔ)的遵守;
——不應(yīng)更改指定為<tbx>根元素上的type屬性值的專用語(yǔ)名稱;
——可以添加目標(biāo)術(shù)語(yǔ)庫(kù)定義允許的任何數(shù)據(jù)類目,同時(shí)遵守其約束;
——可以添加和刪除條目。添加的條目應(yīng)包含為目標(biāo)術(shù)語(yǔ)庫(kù)定義的所有強(qiáng)制性數(shù)據(jù)類目的數(shù)據(jù)。
補(bǔ)充:
——應(yīng)按照專用語(yǔ)命名要求(見7.2)修改指定為<tbx>根元素上的type屬性值的專用語(yǔ)名稱符
合。
示例:<tbxxmlns="urn:iso:std:iso:30042:ed-2"type="TBX-Basic.Seo"style="dca"xml:lang="en">
所有進(jìn)程都應(yīng)創(chuàng)建相關(guān)的日志文件,以捕捉任何信息損失或沖突。
8核心結(jié)構(gòu)
概述
核心結(jié)構(gòu)定義了所有TBX專用語(yǔ)中使用的通用結(jié)構(gòu)和數(shù)據(jù)類目。
如果對(duì)核心結(jié)構(gòu)的某些技術(shù)方面有沖突或爭(zhēng)議,本節(jié)中的描述優(yōu)先于所有模式表示(RNG、DTD、XCS
等)。
注3:TBXInfo網(wǎng)站[15]提供了一個(gè)符合本條款的RNG模式,必要時(shí)可以作為其他模式的模型。
9
GB/TXXXXX—XXXX
注4:本節(jié)中描述的核心結(jié)構(gòu)使用DCA風(fēng)格。
TBX-Core命名空間是:uzn:iso:std:iso:30042:ed-2
上述命名空間應(yīng)用作所有專用語(yǔ)的TBX文檔實(shí)例的默認(rèn)命名空間。
元模型
核心結(jié)構(gòu)反映了TMF(ISO16642)元模型,如圖1所示。術(shù)語(yǔ)數(shù)據(jù)集合(TDC)與TBX文檔實(shí)例相對(duì)應(yīng)。
圖1TBX元模型
基數(shù):
—TDC應(yīng)包含恰好一個(gè)GI(1..1)、最多一個(gè)CI(0..1)和任意數(shù)量的CE(0..*)。
—一個(gè)CE可以包含任意數(shù)量的LS(0..*)。
—一個(gè)LS可以包含任意數(shù)量的TS(0..*)。
一個(gè)TBX文檔實(shí)例中最高級(jí)別的XML元素是<tbx>元素(指定了屬性中的樣式和專用語(yǔ)),它由一
個(gè)<tbxHeader>元素和一個(gè)<text>元素組成(見圖2)。
圖2中的<text>元素由<body>元素中的概念條目和<back>元素中的可選的補(bǔ)充信息組成。
<tbxHeader>元素對(duì)應(yīng)于TMF元模型中的全局信息,包含對(duì)整個(gè)術(shù)語(yǔ)數(shù)據(jù)集合的描述(在<fileDesc>
元素中)和該集合的主要修訂歷史(在<revisionDesc>元素中)。<tbxHeader>的結(jié)構(gòu)和內(nèi)容相關(guān)要求
見附錄A。
<body>元素中的每個(gè)概念條目都記錄了有關(guān)一個(gè)單一概念的所有術(shù)語(yǔ)和相關(guān)信息。因此,概念條目
包含在核心結(jié)構(gòu)元素<conceptEntry>中。
10
GB/TXXXXX—XXXX
注
?=可選,但只允許一個(gè)
+=至少需要一項(xiàng)
Nosign=應(yīng)只出現(xiàn)一次
圖2TBX結(jié)構(gòu)
概念條目中元素的位置
8.3.1可能出現(xiàn)在多個(gè)級(jí)別的元素
表2中描述的核心結(jié)構(gòu)元素(在圖3中由auxInfo表示并在圖4中詳細(xì)說(shuō)明)可能出現(xiàn)在條目的三個(gè)
級(jí)別中的任何一個(gè):概念級(jí)別(<conceptEntry>),語(yǔ)言級(jí)別(<langSec>),術(shù)語(yǔ)級(jí)別(<termSec>)。
表2可能出現(xiàn)在多個(gè)級(jí)別的元素
一個(gè)符合ISO8601-1和ISO8601-2格式的日期。允許的日期值應(yīng)符合ISO8601-1和ISO8601-2并使用
<date>
yyyy-mm-dd格式。日期元素用于<transacGrp>元素。
提供有關(guān)所討論節(jié)點(diǎn)的描述性信息。描述信息的類型由數(shù)據(jù)類目表示,它被實(shí)例化為type屬性的值。如數(shù)
<descrip>據(jù)分類模塊中所示,數(shù)據(jù)類目可能被限制在條目的某些級(jí)別上。它可能單獨(dú)出現(xiàn),也可能嵌套在一個(gè)
<descripGrp>元素中(如果需要將附加信息與描述相關(guān)聯(lián)起來(lái),例如管理信息)。
包含一個(gè)<descrip>元素,后面有零個(gè)或多個(gè)
<descripGrp>
<descripNote>,<admin>,<adminGrp>,<transacGrp>,<note>,<ref>,和<xref>元素。
包含有關(guān)節(jié)點(diǎn)的管理性質(zhì)的信息,例如信息的來(lái)源,或者它適用的項(xiàng)目或客戶。管理信息的類型由數(shù)據(jù)類
<admin>目表示,它被實(shí)例化為type屬性的值。它可以單獨(dú)出現(xiàn),也可以嵌套在一個(gè)<adminGrp>元素中(如果需要
提供額外的信息,例如注釋或參考)。
<adminGrp>包含一個(gè)<admin>元素,后面有零個(gè)或多個(gè)<adminNote>,<note>,<ref>,和<xref>元素。
<adminNote>包含一些管理信息,例如注釋或其他文本的來(lái)源。
11
GB/TXXXXX—XXXX
包含一個(gè)<transac>元素,后面有零個(gè)或多個(gè)<transacNote>,<date>,<note>,<ref>,和<xref>元素。它包
<transacGrp>含有關(guān)交易的信息,例如執(zhí)行日期或執(zhí)行人。日期由<date>元素指定,負(fù)責(zé)交易的個(gè)人或?qū)嶓w的名稱由
<transacNote>元素指定。
<note>包含任何類型的注釋。
<ref>指向<tbx>元素另一個(gè)元素的交叉引用。
<xref>使用URI(URL或其他Web地址)指向外部對(duì)象的交叉引用。
注
+=至少需要一項(xiàng)
*=可選,允許一個(gè)或多個(gè)
Nosign=應(yīng)只出現(xiàn)一次
圖3概念條目
12
GB/TXXXXX—XXXX
注
*=可選,允許一個(gè)或多個(gè)
Nosign=應(yīng)只出現(xiàn)一次
圖4輔助信息
8.3.2僅在術(shù)語(yǔ)級(jí)別出現(xiàn)的元素
條目層次中的術(shù)語(yǔ)級(jí)別與圖3中的<termSec>相對(duì)應(yīng)。它包含一個(gè)<term>元素,后面有零個(gè)或多個(gè)
<termNote>和/或<termNoteGrp>元素,在后面是8.3.1中描述的、并由auxInfo實(shí)體引用的任何元素。
表3中是僅在術(shù)語(yǔ)級(jí)別出現(xiàn)的元素。
表3僅出現(xiàn)在術(shù)語(yǔ)級(jí)別的元素
<term>包含一個(gè)術(shù)語(yǔ)。
<termNoteGrp>一個(gè)嵌套元素,允許一個(gè)<termNote>,后面是額外的管理或交易信息,<note>,或者<xref>元素。
根據(jù)type屬性的值,提供有關(guān)一個(gè)術(shù)語(yǔ)的不同類型的信息。例如,它可能包含性別或詞性之類的語(yǔ)法
<termNote>
信息,對(duì)其他相關(guān)術(shù)語(yǔ)的引用,還有術(shù)語(yǔ)的來(lái)源或用于什么項(xiàng)目之類的管理信息等。
核心結(jié)構(gòu)的三個(gè)層次出現(xiàn)在幾乎所有的術(shù)語(yǔ)數(shù)據(jù)集合中。術(shù)語(yǔ)組件的附加級(jí)別僅用于描述術(shù)語(yǔ)部
分屬性的術(shù)語(yǔ)數(shù)據(jù)集合,例如多單詞術(shù)語(yǔ)中的單個(gè)單詞或構(gòu)成單個(gè)單詞術(shù)語(yǔ)的詞素。這個(gè)被封裝在
<termCompSec>中的術(shù)語(yǔ)組件級(jí)別通過一個(gè)專用模塊實(shí)現(xiàn)。
注:參見附錄C和TBX信息網(wǎng)站[15]以獲得關(guān)于術(shù)語(yǔ)組件模塊的支持信息。
元素類型
8.4.1起到分類或分組作用的元素
幾個(gè)關(guān)鍵的核心結(jié)構(gòu)元素起分類作用,將具有相似目的的數(shù)據(jù)類目分組,后者被實(shí)例化為核心結(jié)構(gòu)
元素上的type屬性的值。例如,<descrip>元素主要包含對(duì)一個(gè)概念的描述(例如它的主題字段),
<termNote>元素描述了術(shù)語(yǔ)的屬性(例如它的詞性或它出現(xiàn)的上下文),<admin>元素包含各種管理信
息(例如來(lái)源和用戶名)。在數(shù)據(jù)分類模塊中聲明被允許作為這些元素的類型值的數(shù)據(jù)類目。例如,元
素<descriptype="definition">對(duì)應(yīng)于/definition/數(shù)據(jù)類目,并且,事實(shí)上數(shù)據(jù)分類模塊中聲明
了在核心結(jié)構(gòu)中聲明的<descrip>元素允許/definition/作為其類型屬性的值。
這些TBX分類要素包括以下內(nèi)容:
—<admin>
—<adminNote>
—<descrip>
—<descripNote>
—<termNote>
—<transac>
—<transacNote>
—<ref>
—<xref>
有一些起分組作用的嵌套元素,它們還與核心結(jié)構(gòu)元素上type屬性的兩種特殊用途有關(guān)。第一種情
況涉及元素<refObjectSec>,它是一個(gè)嵌套元素,包含一組項(xiàng)目(被引用對(duì)象)。它的type屬性表征了
13
GB/TXXXXX—XXXX
子元素,即被引用的對(duì)象(參見10.2、10.3和10.6中的示例)。例如,type屬性值“bibl”表示引用
的對(duì)象是書目。這是繼承原則的一個(gè)例子,其中子元素繼承其父元素的type屬性。
第二種情況涉及<termNoteGrp>,<transacGrp>和<descripGrp>,它們也是嵌套元素。這些元素不應(yīng)
具有type屬性。在這些情況下,類型屬性應(yīng)在主要子元素上顯示。參見10.7中<transacGrp>的例子。這
個(gè)例子表明,<transacGrp>描述的交易的類型被表示為子元素<transac>的內(nèi)容。這是反向繼承原理的
一個(gè)例子。
8.4.2表示數(shù)據(jù)類目的元素
核心結(jié)構(gòu)中直接代表數(shù)據(jù)類目的元素列表,請(qǐng)參見第5章。
8.4.3內(nèi)聯(lián)標(biāo)記元素
內(nèi)聯(lián)標(biāo)記元素用于指定文本字符串的語(yǔ)言或功能,或用于使TBX文檔實(shí)例各種其他標(biāo)記(例如HTML
或文本處理標(biāo)記)。包含需要保留但不需要處理的各種其他標(biāo)記在術(shù)語(yǔ)管理功能期間。這些標(biāo)記需要保
留,但在術(shù)語(yǔ)管理功能中不需要處理。內(nèi)聯(lián)標(biāo)記元素是核心的一部分。TBX支持以下元素:
—<foreign>
—<hi>
—<sc>
—<ec>
—<ph>
<sc>,<ec>和<ph>的內(nèi)容模型采用了ISO21720(XLIFF2.0版)。其他元素是TBX特有的。
元素<sc>,<ec>和<ph>旨在與ISO21720中的相應(yīng)元素進(jìn)行映射。TBX代理應(yīng)遵守ISO21720中規(guī)定
的對(duì)相應(yīng)元素及其屬性的所有相關(guān)約束和處理要求。
ISO21720中,屬性id和startRef的數(shù)據(jù)類型是xsd:NMTOKEN,并且根據(jù)具有XLIFF特定唯一性
要求的XLIFF特定片段識(shí)別機(jī)制起作用。它們?cè)赥BX中對(duì)應(yīng)的屬性的數(shù)據(jù)類型分別為xsd:ID和
xsd:IDREF,并遵循標(biāo)準(zhǔn)的XML片段標(biāo)識(shí)機(jī)制。在TBX中,數(shù)據(jù)類型為xsd:NMTOKEN的XLIFF屬
性dataRef被替換為數(shù)據(jù)類型為xsd:IDREF的屬性target。屬性disp、equiv、isolated、subType
和type的行為應(yīng)與XLIFF中的完全相同,以便于映射。
<foreign>元素用于標(biāo)記與周圍文本語(yǔ)言不同的文本段。可選的xml:lang屬性可用于標(biāo)識(shí)此元素中
包含的文本的語(yǔ)言,如下例所示。
示例1:<note>泡菜是一種韓國(guó)菜,由腌制、發(fā)酵的蔬菜組成。這個(gè)詞來(lái)源于<foreignxml:lang="ko-
KR">??</foreign>用韓語(yǔ)。</note>。
<hi>元素為各種處理目的劃定了一段文本,例如標(biāo)記數(shù)學(xué)表達(dá)式,或標(biāo)記一個(gè)定義或其他文本字段
中的隱含術(shù)語(yǔ)。在<term>元素中也允許使用<hi>元素來(lái)標(biāo)記術(shù)語(yǔ)的一部分,例如下標(biāo)或上標(biāo)中的字符,
或術(shù)語(yǔ)中的斜體及其他需要不同格式的組件。以下示例顯示了術(shù)語(yǔ)“canopy”定義中的一個(gè)隱含術(shù)語(yǔ)。
示例2:<descriptype="definition">a的擴(kuò)展的、傘狀的部分<hitype="entailedTerm"target="CID1234">降
落傘</hi></descrip>.
<sc>元素用于表示成對(duì)的原始代碼序列中的第一個(gè)(例如,HTML<strong>標(biāo)記的開始部分)。在同
一個(gè)封閉的<descrip>元素中,每個(gè)<sc>之后應(yīng)該有一個(gè)相應(yīng)的<ec>元素,除非它被標(biāo)記為孤立代碼。
<ec>元素用于表示成對(duì)的原始代碼序列中的最后一個(gè)(例如,結(jié)尾的</strong>標(biāo)記)。在同一個(gè)
封閉的<descrip>元素中,每個(gè)<ec>之前應(yīng)該有一個(gè)相應(yīng)的<sc>元素,除非它被標(biāo)記為孤立代碼。
下面的示例顯示了HTML中的一些文本,后面是其作為/context/的TBX表示。
示例3:<p>板球是一種用球棒和球在被稱為<i>地面</i>的大場(chǎng)地上進(jìn)行的運(yùn)動(dòng)。</p>.
14
GB/TXXXXX—XXXX
<descriptype="context">板球是一種用球棒和球在廣闊的場(chǎng)地上進(jìn)行的運(yùn)動(dòng),被稱為<scid="i1"type="fmt"
subtype="xlf:i"/>地面<ecstartRef="i1"type="fmt"subtype="xlf:i"/>.</descrip>
原始數(shù)據(jù)不得與線性內(nèi)聯(lián)內(nèi)容混合。如果需要保留原始數(shù)據(jù)以供以后處理或重用,則應(yīng)使用一個(gè)
target屬性來(lái)引用包含在TBX附錄中的原始數(shù)據(jù)。數(shù)據(jù)模型和使用說(shuō)明見10.8。
下面是一個(gè)需要包含或映射在附錄中的原始數(shù)據(jù)結(jié)構(gòu)的示例(使用內(nèi)聯(lián)標(biāo)記中的一個(gè)target屬性)。
示例4:<originalData>
<dataid="d1"><i></data>
數(shù)據(jù)id="d2"></i></data>
</originalData>
除非屬性-值對(duì)isolated="yes"用于標(biāo)記孤立代碼,否則在<sc>中需要使用id屬性,并且在<ec>中
需要使用startRef屬性,這樣,每個(gè)末端代碼就能明確地鏈接到它的起始代碼,反之亦然。
startRef和isolated="yes"機(jī)制為TBX提供了支持,以標(biāo)記重疊或其他格式不正確的代碼范圍,
如以下不正確但可能的HTML構(gòu)造:
示例5:這是<i>一些嵌套不當(dāng)?shù)?lt;b>示例HTML</b></i>標(biāo)記。
上面的標(biāo)記將用<sc>和<ec>表示如下:
示例6:這是<scid="1"type="fmt"subtype="xlf:i"/>一些<scid="2"type="fmt"subtype="xlf:b"/>示例
HTML<ecstartRef="1"type="fmt"subtype="xlf:i"/>標(biāo)記<ecstartRef="2"type="fmt"subtype="xlf:b"/>嵌套不
當(dāng)。
下面是一個(gè)需要包含或映射在附錄中的原始數(shù)據(jù)結(jié)構(gòu)的例子:
示例7:<originalData>
<dataid="d1"><i></data>
<dataid="d2"><b></data>
<dataid="d3"></i></data>
<dataid="d4"></b></data>
</originalData>
id屬性的值在其共同封裝的<descrip>元素中應(yīng)該是唯一的。
最后,<ph>元素用于表示原生獨(dú)立代碼或此類代碼的序列(例如HTML<br>標(biāo)簽)。它不應(yīng)用于表
示出現(xiàn)在邏輯對(duì)中的代碼或配對(duì)代碼的孤立部分:
示例8:<descriptype="context">板球是一種在被稱為場(chǎng)地的大場(chǎng)地上用球棒和球進(jìn)行的運(yùn)動(dòng)。<phid=”d1"
type="fmt"subtype="xlf:lb"/>每個(gè)階段的比賽稱為一局,在此期間,一支球隊(duì)擊球,試圖得分盡可能多的得分。
</descrip>.
下面是一個(gè)需要包含或映射在附錄中的原始數(shù)據(jù)結(jié)構(gòu)的例子:
示例9:<originalData>
<dataid="d1"><br/></data>
</originalData>
屬性
8.5.1類型
在DCA樣式中,核心結(jié)構(gòu)元素上的type屬性指定了一個(gè)數(shù)據(jù)類目。例如,<descrip
type="definition">表示/definition/數(shù)據(jù)類目。
8.5.2xml:lang
15
GB/TXXXXX—XXXX
<tbx>根元素應(yīng)具有xml:lang屬性。xml:lang屬性的值通過TBX文檔實(shí)例向下繼承,直到被另一個(gè)
xml:lang屬性覆蓋。因此,<tbx>元素中指定的語(yǔ)言就是整個(gè)TBX文檔實(shí)例的工作語(yǔ)言。每個(gè)<langSec>
元素也應(yīng)有一個(gè)xml:lang屬性來(lái)表示此語(yǔ)言部分描述的語(yǔ)言。這是語(yǔ)言部分的目標(biāo)語(yǔ)言。除非被子元素
上的另一個(gè)xml:lang屬性覆蓋,否則一個(gè)語(yǔ)言部分中所有元素的內(nèi)容都被假定為采用了<langSec>元素
的xml:lang屬性所指定的語(yǔ)言。這不適用于作為選項(xiàng)列表值的元素的內(nèi)容。因此,除非另有說(shuō)明,否則
概念入口級(jí)別的<descriptype="definition">元素的內(nèi)容應(yīng)采用TBX文檔實(shí)例的工作語(yǔ)言,并且語(yǔ)
言部分中的注釋應(yīng)使用與該語(yǔ)言部分相同的語(yǔ)言,除非另有明確的xml:lang屬性指定。
IETFBCP47[13]中確定了TBX中的xml:lang屬性的允許值。
8.5.3id和目標(biāo)
id和target屬性共同作用,以在同一TBX文檔實(shí)例中的元素之間明確指向。例如,一個(gè)條目:
<conceptEntryid="database-5574">
...(“獵犬”條目)
</conceptEntry>
可以被另一個(gè)條目所指向:
<conceptEntryid="database-5523">
<descriptype="superordinateConceptGeneric"target="database-5574">打獵
狗</descrip>
...(“獵犬”[一種獵犬]的條目)
</conceptEntry>
第二個(gè)條目中的內(nèi)容“獵犬”是為了顯示目的。它為指向目標(biāo)條目的鏈接提供了一個(gè)可見的標(biāo)簽。
target屬性應(yīng)指向<xref>的一個(gè)外部對(duì)象。的target屬性的值應(yīng)是一個(gè)使用HTTP或HTTPS協(xié)議
的絕對(duì)外部URL。
8.5.4模塊
可選模塊屬性可用于DCA樣式標(biāo)記,以指示從中選擇數(shù)據(jù)類目的模塊。此屬性有助于與DCT樣
式標(biāo)記的并行性,后者具有命名空間機(jī)制來(lái)指示數(shù)據(jù)類目的模塊。Module/模塊屬性的值是所述模塊的
規(guī)定名稱。
文本類型
TBX中元素和屬性的默認(rèn)文本類型是符合XSD:string的無(wú)限制的字符串(純文本)。
為TBX元素聲明了兩個(gè)額外的混合數(shù)據(jù)實(shí)體:
基本文本:除了純文本,基本文本可能包含一個(gè)或多個(gè)<hi>元素來(lái)表示一些高度受限的內(nèi)聯(lián)標(biāo)記樣
式?;疚谋局饕糜?lt;term>。但是,它也用于表達(dá)如<descriptype="shortFormFor">之類的術(shù)語(yǔ)的
數(shù)據(jù)類目的內(nèi)容,這種限制在數(shù)據(jù)分類模塊中被聲明為一種約束。
注釋文本:除了基本文本中允許的<hi>之外,注釋文本還允許<foreign>,<sc/>,<ec/>,和<ph/>。
注釋文本由核心結(jié)構(gòu)元素使用,這些元素表示具有潛在內(nèi)聯(lián)標(biāo)記要求的數(shù)據(jù)類目,例如/definition/
或/usagenote/。在DCA樣式中,這些數(shù)據(jù)類目用<descrip>或者<termNote>元素來(lái)表示,因此這兩個(gè)
元素默認(rèn)允許注釋文本,但這可能在數(shù)據(jù)分類模塊中被進(jìn)一步約束。
字符集和編碼
TBX文檔實(shí)例應(yīng)采用Unicode,符合ISO/IEC10646、UTF-8或UTF-16或UTF-32。
16
GB/TXXXXX—XXXX
9定義數(shù)據(jù)分類模塊
概述
本節(jié)詳細(xì)說(shuō)明了現(xiàn)有模塊不適合創(chuàng)建特定專用語(yǔ)的情況下,定義一個(gè)新數(shù)據(jù)分類模塊的過程,描述
了旨在用于公共專用語(yǔ)的數(shù)據(jù)分類模塊的要求。對(duì)于供私人使用的模塊,本節(jié)的內(nèi)容只是建議。
模塊的規(guī)范定義應(yīng)以散文形式編寫(7.3中提供了一個(gè)模塊定義的例子)。此外,TBX模塊描述
(TBXMD)形式可用于編寫一個(gè)模塊的機(jī)器可處理描述(參見附錄C)。
定義一個(gè)模塊有四個(gè)步驟:
1)命名該模塊;
2)選擇一個(gè)或多個(gè)數(shù)據(jù)類目;
3)定義數(shù)據(jù)類目屬性;
4)定義數(shù)據(jù)類目約束。
命名模塊
模塊名稱應(yīng)為NMTOKEN。模塊名稱在公共模塊中是應(yīng)唯一的。如果模塊是專門為某個(gè)專用語(yǔ)創(chuàng)建
的,該模塊不必與專用語(yǔ)同名。
模塊名稱不得包含“.”字符,因?yàn)樵撟址糜谝褦U(kuò)展的專用語(yǔ)名稱。
“核心”是為本文檔中定義的核心結(jié)構(gòu)保留的名稱,不得用于命名任何其他模塊。
選擇數(shù)據(jù)類目
DatCatInfo[10]中提供了行業(yè)認(rèn)可的數(shù)據(jù)類目。如果附錄B或DatCatInfo中不存在所需的數(shù)據(jù)
類目,則可以為該模塊定義一個(gè)新類別。
符合TBX的模塊不應(yīng)引入與TBX核心結(jié)構(gòu)中聲明的數(shù)據(jù)類目的語(yǔ)義意圖重復(fù)或重疊的新數(shù)據(jù)類
目(參見第5條)。如果多個(gè)符合TBX的模塊被用于單個(gè)專用語(yǔ)中,則它們不應(yīng)有任何共同的數(shù)據(jù)類
目,因?yàn)樵赥BX專用語(yǔ)的
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 車位使用權(quán)轉(zhuǎn)移合同協(xié)議
- 房地產(chǎn)開發(fā)合同書
- 標(biāo)準(zhǔn)車位租賃合同模板
- 土地征收補(bǔ)償合同實(shí)施細(xì)則
- 品牌代理合作合同權(quán)利轉(zhuǎn)讓協(xié)議
- 醫(yī)用耗材供應(yīng)合同
- 腎上腺皮質(zhì)激素及其相關(guān)藥物的臨床藥理學(xué)課件
- 文化展覽客戶需求挖掘考核試卷
- 拖拉機(jī)品牌建設(shè)與傳播考核試卷
- 機(jī)床制造業(yè)生產(chǎn)效率提升與精益生產(chǎn)考核試卷
- 2025人教版一年級(jí)下冊(cè)數(shù)學(xué)教學(xué)進(jìn)度表
- DeepSeek教案寫作指令
- 休學(xué)復(fù)學(xué)申請(qǐng)書
- 北京2025年02月北京市地質(zhì)礦產(chǎn)勘查院所屬事業(yè)單位公開招考工作人員筆試歷年典型考題(歷年真題考點(diǎn))解題思路附帶答案詳解
- DeepSeek零基礎(chǔ)到精通手冊(cè)(保姆級(jí)教程)
- 瓷磚鋪貼勞務(wù)承包協(xié)議書
- 2025年四川司法警官職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試近5年??及鎱⒖碱}庫(kù)含答案解析
- 新建污水處理廠工程EPC總承包投標(biāo)方案(技術(shù)標(biāo))
- 《宏觀經(jīng)濟(jì)管理研究》課件
- 蘇教版五年級(jí)下冊(cè)數(shù)學(xué)全冊(cè)教案設(shè)計(jì)
- GB/T 36548-2024電化學(xué)儲(chǔ)能電站接入電網(wǎng)測(cè)試規(guī)程
評(píng)論
0/150
提交評(píng)論