(高清版)GB∕T 37688-2019 信息技術(shù) 流式文檔互操作性的度量_第1頁
(高清版)GB∕T 37688-2019 信息技術(shù) 流式文檔互操作性的度量_第2頁
(高清版)GB∕T 37688-2019 信息技術(shù) 流式文檔互操作性的度量_第3頁
(高清版)GB∕T 37688-2019 信息技術(shù) 流式文檔互操作性的度量_第4頁
(高清版)GB∕T 37688-2019 信息技術(shù) 流式文檔互操作性的度量_第5頁
已閱讀5頁,還剩9頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

ICS35.240.20GB/T37688—2019信息技術(shù)流式文檔互操作性的度量國家市場監(jiān)督管理總局中國國家標準化管理委員會GB/T37688—2019 I 2術(shù)語和定義、縮略語 6互操作性度量的應(yīng)用 6附錄A(資料性附錄)模型應(yīng)用的例子 7 IGB/T37688—2019本標準按照GB/T1.1—2009給出的規(guī)則起草。請注意本文件的某些內(nèi)容可能涉及專利。本文件的發(fā)布機構(gòu)不承擔識別這些專利的責任。本標準由全國信息技術(shù)標準化技術(shù)委員會(SAC/TC28)提出并歸口。1GB/T37688—2019信息技術(shù)流式文檔互操作性的度量本標準規(guī)定了度量流式文檔互操作性所使用的模型結(jié)構(gòu)和方法。本標準適用于流式文檔的編寫者和使用者在文檔生存周期中對文檔的創(chuàng)建、編輯、修改和評閱等2.1.12.1.22.1.3文檔內(nèi)容與顯現(xiàn)式樣的組織形式。2.1.42.1.5由若干功能點組成的系統(tǒng)。2.1.6功能點的重要度degreeofimportance功能點在文檔使用中的重要程度。2.1.7功能點的可轉(zhuǎn)換度degreeoftranslation功能點從一種文檔格式描述轉(zhuǎn)換為另一種文檔格式描述的難易程度。2.1.8一種文檔系統(tǒng)從一種文檔格式描述轉(zhuǎn)換為另一種文檔格式描述的能力。下列縮略語適用于本文件。2GB/T37688—2019DI:功能點的重要度(DegreeofImportance)DT:功能點的可轉(zhuǎn)換度(DegreeofTransformability)ODF:面向辦公應(yīng)用的開放文檔格式(OpenDocumentFormatforOfficeApplications)OOXML:開放辦公文檔XML格式(OfficeOpenXMLFileFormats)UOF:統(tǒng)一辦公文檔格式(UniformOfficeDocumentFormat)3文檔互操作性分類性時一定與文檔格式相關(guān)。功能點從一種文檔格式A轉(zhuǎn)換到文檔格式B的互操作性并不一定等同于文檔互操作性是以所涉及的功能點的互操作性為基礎(chǔ)的,其實質(zhì)是一個功能點集合從一個文檔格式轉(zhuǎn)換到另一種文檔格式的能力。為文檔格式的互操作性和文檔實例的互操作性。目前已經(jīng)發(fā)布了多種流式文檔格式標準,例如UOF、00XML、ODF等。這些文檔格式標準中定義的功能點和文檔結(jié)構(gòu)都不完全相同,因此兩個標準之間不能形成100%的功能點映射。文檔格式間的互操作性主要是指一種文檔格式的所有功能點轉(zhuǎn)換到另外一種格式上的能力,是對一個文檔實例只包含若干功能點,即由一個功能點集合構(gòu)成。文檔實例可以采用不同的文檔格式文檔實例間的互操作性是指一個采用特定文檔格式描述的文檔實例轉(zhuǎn)換到另一種文檔格式描述的能力。文檔實例的互操作性是由其功能點集合決定的。由于每個功能點在不同格式間的映射能力不4互操作性度量模型互操作性度量模型包含概念層和參數(shù)層,具體說明見5.2和5.3。概念層描述文檔中功能點的概念如圖1所示。3GB/T37688—2019標題標題元數(shù)據(jù)文檔章節(jié)—整體-部分作者段落概念層UOFOO參數(shù)層1概念層中的概念體系表示為節(jié)點和邊構(gòu)成的樹型結(jié)構(gòu)。節(jié)點為文檔功能點。例如,段落(Paragraph)和句(Run)。邊表示概念之間的關(guān)聯(lián),一般為整體-部分(whole-part)關(guān)聯(lián)。例如,圖1中數(shù)據(jù)”包含子功能點“題目”(Title)和“作者”(Author)等;功能點“章節(jié)”包含子功能點“段落”參數(shù)層描述用于度量文檔互操作性的信息。模型中只為概念層中樹的葉節(jié)點指定資源信息。參數(shù)按照其描述信息的用途分為兩類:a)映射參數(shù):描述概念層中底層功能點與具體文檔格式的映射關(guān)系。詳細說明見4.3.2。4GB/T37688—2019——所屬類型(Type):表示特定的文檔格式,如Type=“UOF”、Type=“OOXML”或Type=“ODF”?!恢?Location):表示該功能點在所指定的文檔格式中所處的物理文件。對于文檔格式不支——值(Value):表示功能點在所處的物理文件中所映射的元素或?qū)傩缘木唧w位置。對于采用XML描述的文檔格式而言,參數(shù)值宜用XPath來描述,即功能點所對應(yīng)元素(或?qū)傩?的XPath。大多數(shù)文檔格式都采用了打包的形式,即一個文檔由若干物理文件組成。此時,“位置”用來指定功能點對應(yīng)的元素(或?qū)傩?所屬物理文件在包中的相對位置及文件名。例如,對于圖1中功能點“作者”,明該功能點在UOF格式中,位于物理文件“mtea.xml”,功能點對應(yīng)元素的XPath為“/元:元數(shù)據(jù)_5200/元:作者_5204”。對于僅采用單文件而不采用打包形式的文檔格式而言,Location=“.”。4.3.3功能點的重要度功能點的重要度(DI)的賦值方法應(yīng)采用如下三種方法之一:a)基于人工評價的三級由領(lǐng)域?qū)<覍δ茳c的重要度進行評價,分為三級,其中:——3級:指流式文檔必備的功能點,量化為數(shù)值1;——2級:指流式文檔常用的功能點,量化為數(shù)值0.6;——1級:指流式文檔中很少用到的功能點,量化為數(shù)值0.3。例如,表A.1中“DI(fi)”列即采用三級賦值的方法。b)基于大量的文檔實例進行統(tǒng)計,利用功能點的使用頻度來評價DI值,使用頻度越高的功能點DI值越大。設(shè)文檔集合為D,共包含N個文檔實例。功能點f;的DI值為該功能點在所有樣本文檔中出現(xiàn)的總次數(shù)與樣本文檔中所有功能點出現(xiàn)的總次數(shù)之和的比值。具體描述如式(1)。此方法評估出的DI值反映的是功能點使用頻率的整體情況。其中,N;(fi)表示功能點f;在樣本文檔d;中出現(xiàn)的次數(shù)。c)基于一個特定的文檔實例,利用功能點的使用頻度來評價DI值。在一個特定的文檔實例中,某個功能點的使用情況可能會與方法b)得出的DI值存在矛盾。例如,對于功能點f?和f?,利用式(1)得出的結(jié)果為p(f?)>p(f?),即功能點fi的重要度比f?高。但是在文檔實例d?中,f?并沒有被用到,而f?出現(xiàn)了很多次。很顯然,針對文檔d?,通過方法b)獲得的DI值并不能體現(xiàn)功能點在d?中的重要度。此時,宜采用公式(2)的方法計算DI值。即功能點f:在特定文檔d;中的重要度為:該功能點在d;中出現(xiàn)的次數(shù)與d;中所有功能點出現(xiàn)次數(shù)總和之比?!?2)在方法b)和方法c)中,功能點的重要度(DI)根據(jù)該功能點的使用頻度確定。重要度DI的取值在[0,1]區(qū)間之內(nèi),其中——[0,0.3]區(qū)間內(nèi)表示該功能點很少使用;——(0.3,0.6)區(qū)間內(nèi)表示常用功能點;——[0.6,1.0]區(qū)間內(nèi)表示必備的功能點。5GB/T37688—20194.3.4功能點的可轉(zhuǎn)換度功能點的可轉(zhuǎn)換度(DT)使用類型和值兩個屬性來描述:——類型(Type):形式是“A2B”,表示由格式A轉(zhuǎn)換到格式B;——值(Value):取值為范圍為[0,1]。其中,[0,0.3]表示該功能點無法轉(zhuǎn)換或很難轉(zhuǎn)換,(0.3,0.6)表示轉(zhuǎn)換難度中等,(0.6,1.0)表示容易轉(zhuǎn)換。功能點的可轉(zhuǎn)換度體現(xiàn)的是功能點的互操作性,是文檔格式和文檔實例互操作性的基礎(chǔ)。功能點的可轉(zhuǎn)換度主要由領(lǐng)域?qū)<疫M行評價,分為三級:——容易轉(zhuǎn)換:一個功能點從格式A轉(zhuǎn)換到格式B時,信息可以完全保留;——中等難度:一個功能點從格式A轉(zhuǎn)換到格式B時,信息可以保留大部分;——難以轉(zhuǎn)換:一個功能點從格式A轉(zhuǎn)換到格式B時,信息難以保留或無法映射。為了便于互操作度量的量化評價,將容易轉(zhuǎn)換、中等難度和難以轉(zhuǎn)換分別標記為數(shù)值1、0.6和0.3,用于描述功能點的DT值。例如,表A.1中“DTooxML?oDF(f;)”列給出的是功能點從OOXML轉(zhuǎn)換到ODF的可轉(zhuǎn)換度。5互操作性度量方法5.1互操作性的分級度量文檔系統(tǒng)互操作性采用分級的方式進行度量,分為三個級別:a)互操作性良好當文檔系統(tǒng)從格式A轉(zhuǎn)換到格式B時,文檔系統(tǒng)中的所有或絕大部分功能點在A中的描述都在B中都存在相應(yīng)的描述,使得文檔的內(nèi)容和式樣信息在轉(zhuǎn)換的過程中不會或基本不會產(chǎn)生損失,認為該文檔系統(tǒng)的互操作性良好。此類文檔系統(tǒng)中,很多的功能點在A中的描述都能在B中存在簡單的一對一映射或一對多映射。b)互操作性一般當文檔系統(tǒng)從格式A轉(zhuǎn)換到格式B時,文檔系統(tǒng)中的功能點在兩種格式中都有類似地描述,使得文檔的內(nèi)容和式樣信息在轉(zhuǎn)換的過程中產(chǎn)生部分損失,或者信息雖然能夠保留但是映射關(guān)系復雜,此時認為該文檔系統(tǒng)的互操作性一般。此類文檔系統(tǒng)中,功能點不能簡單地進行一對一映射或一對多映射,會存在A中的n個功能點與B中的m個功能點映射的情況,轉(zhuǎn)換方式較為復雜。c)互操作性差當文檔系統(tǒng)從格式A轉(zhuǎn)換到格式B時,存在部分功能點難以轉(zhuǎn)換,導致轉(zhuǎn)換后丟失的信息量較多,認為該文檔系統(tǒng)的互操作性差。此類文檔系統(tǒng)中,最差的情況是A中支持的功能點在B中不支持。5.2互操作性的量化度量根據(jù)度量模型中的參數(shù),一個文檔系統(tǒng)從格式A轉(zhuǎn)換到格式B的互操作性可通過量化的方式進行度量。量化評價互操作性時,應(yīng)綜合考慮文檔系統(tǒng)涉及的功能點集合,對其中所有功能點的重要度DI和可轉(zhuǎn)換度DT之積求和,然后除以功能點的總數(shù),以這個均值來衡量該文檔系統(tǒng)的互操作性。互操作性度量見式(3):6GB/T37688—2019——tAi是TA的第i個功能點;——DI(tA)為4.3.3中所述功能點tA;的重要度;在無法直接度量兩個文檔實例(如A,C)的互操作性時,可以度量經(jīng)由中間格式的互操作性。即,將TA替換成文檔格式標準A涉及的所有功能點集合時,式(3)可以計算兩種文檔格式標準之間的互操作性。6互操作性度量的應(yīng)用文檔應(yīng)用中可以根據(jù)需要設(shè)定互操作性的閾值。當互操作性小于閾值時,應(yīng)該調(diào)整文檔實例中互操作性差的功能點,代之以互操作性較好的功能點,以提高文檔整體的互操作性。附錄A給出了2個使用互操作度量模型的應(yīng)用案例。7GB/T37688—2019(資料性附錄)模型應(yīng)用的例子A.1初始格式為00XML的模型應(yīng)用的例子本部分給出一個例子,說明如何使用互操作度量模型。假設(shè)用戶用00XML格式寫一個文檔(如圖A.1所示),其他用戶使用支持ODF格式的文檔編輯器打開它。實際上,用戶可以使用0OXML中的不同功能點集合來設(shè)計一些看起來相同的文檔。但這些文檔從0OXML到ODF的互操作性卻不盡通知請于2016年12月1日14:00參加年終匯報會。圖A.1一個實例文檔的視圖假設(shè)已建立好一個文檔互操作性度量模型。基于該度量模型,用戶可以根據(jù)度量結(jié)果從多個備選方案中選擇互操作性高的文檔。例如,用戶設(shè)計了兩個文檔,分別稱為實例1和實例2,它們使用的功能點集合不同,如表A.1所列類似,指明實例2中是否使用了該功能點?!癉TooxML?oDr(fi)”列:給出功能點從格式0OXML轉(zhuǎn)換到格式ODF時,功能點f;使用式(1)分別度量文檔實例1和實例2的互操作性,Interop(OOXML,ODF)值的計算結(jié)果為:實例1為0.907,實例2為0.926。由此可知,實例2的互操作性較高。其主要差異在于,對于“通知”下面8GB/T37688—2019的橫線,實例1使用功能點“句邊框”而實例2使用功能點“段落邊框”,(段落邊框)>序號功能點f實例1實例21元數(shù)據(jù)——摘要1111112元數(shù)據(jù)——字符數(shù)111113元數(shù)據(jù)——創(chuàng)建日期114元數(shù)據(jù)——創(chuàng)建應(yīng)用1115元數(shù)據(jù)——編輯時間1111116元數(shù)據(jù)——編輯次數(shù)1111117元數(shù)據(jù)——關(guān)鍵詞1111181111119元數(shù)據(jù)——頁數(shù)1111元數(shù)據(jù)——主題11111元數(shù)據(jù)——標題lllll1元數(shù)據(jù)——詞數(shù)1111元數(shù)據(jù)——段落數(shù)1111段落首行縮進值111111段落自動行高值0111段落固定行高值11111段后絕對值11111段后相對值0101段落邊框11101段落縮進絕對值11111段前絕對值1111段前相對值10111頁面上邊距11111頁面下邊距111111頁面右邊距11111頁面左邊距111句邊框010段落文本對齊11110段落文本加黑111111A.2初始格式為UOF的模型應(yīng)用的例子本部分的例子用于說明互操作度量模型的應(yīng)用。假設(shè)用戶用UOF格式生成一個實例文檔(如圖9GB/T37688—2019A.2所示),對該文檔抽取功能點集合,然后分別計算該文檔是從UOF到00XML的互操性Sim(UOF,0OXML)和從UOF到ODF的互操性Sim(UOF,ODF)。其度量方法和過程與A.1類似,經(jīng)過 Sim(UOF,ODF)=0.84圖A.2一個UOF實例文檔的視圖從互操性度量結(jié)果可以得出該實例文檔到另外兩種格式的互操性存在差異。為了分析互操性差異,本部分給出一些關(guān)于互操性參數(shù)的統(tǒng)計數(shù)據(jù)。本實例文檔中涉及的功能點個數(shù)為41個,關(guān)于DI值和DT值的統(tǒng)計數(shù)據(jù)如表A.2和表A.3所示。表A.2文檔實例中

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論