![WH-T 100-2023 漢文古籍版式描述規(guī)范_第1頁(yè)](http://file4.renrendoc.com/view3/M01/38/00/wKhkFmYd-IyAG5yIAACsrBFN2wo387.jpg)
![WH-T 100-2023 漢文古籍版式描述規(guī)范_第2頁(yè)](http://file4.renrendoc.com/view3/M01/38/00/wKhkFmYd-IyAG5yIAACsrBFN2wo3872.jpg)
![WH-T 100-2023 漢文古籍版式描述規(guī)范_第3頁(yè)](http://file4.renrendoc.com/view3/M01/38/00/wKhkFmYd-IyAG5yIAACsrBFN2wo3873.jpg)
![WH-T 100-2023 漢文古籍版式描述規(guī)范_第4頁(yè)](http://file4.renrendoc.com/view3/M01/38/00/wKhkFmYd-IyAG5yIAACsrBFN2wo3874.jpg)
![WH-T 100-2023 漢文古籍版式描述規(guī)范_第5頁(yè)](http://file4.renrendoc.com/view3/M01/38/00/wKhkFmYd-IyAG5yIAACsrBFN2wo3875.jpg)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
ICSCCS中華人民共和國(guó)文化行業(yè)標(biāo)準(zhǔn)WH/T100—2023漢文古籍版式描述規(guī)范TheformatdescriptionforChineseancientbooks2023-09-09發(fā)布2023-12-09實(shí)施中華人民共和國(guó)文化和旅游部發(fā)布IWH/T100一2023前言 1范圍 2規(guī)范性引用文件 3術(shù)語(yǔ)和定義 4基本原則 4.1客觀描述 4.2描述唯一 4.3易實(shí)現(xiàn) 4.4可擴(kuò)展 5漢文古籍版式描述 5.2基于XML的版式描述 WH/T100一2023本文件按照GB/T1.1—2020《標(biāo)準(zhǔn)化工作導(dǎo)則第1部分:標(biāo)準(zhǔn)化文件的結(jié)構(gòu)和起草規(guī)則》的規(guī)定起草。請(qǐng)注意本文件的某些內(nèi)容可能涉及專利。本文件的發(fā)布機(jī)構(gòu)不承擔(dān)識(shí)別專利的責(zé)任。本文件由中華人民共和國(guó)文化和旅游部提出。本文件由全國(guó)圖書館標(biāo)準(zhǔn)化技術(shù)委員會(huì)(SAC/TC389)歸口。本文件起草單位:國(guó)家圖書館、天津圖書館、北京漢王數(shù)字科技有限公司。本文件主要起草人:肖禹、陳紅彥、張毅、董馥榮、李志峰、胡艷杰、白帆、王昭、杜立功、趙依澍1WH/T100一2023漢文古籍版式描述規(guī)范本文件對(duì)漢文古籍版式描述進(jìn)行了規(guī)范,給出了版式描述的規(guī)范性要求。本文件適用于對(duì)漢文古籍文本化加工結(jié)果的描述。2規(guī)范性引用文件下列文件中的內(nèi)容通過文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文件,僅該日期對(duì)應(yīng)的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。GB/T3792—2021信息與文獻(xiàn)資源描述GB/T4894—2009信息與文獻(xiàn)術(shù)語(yǔ)GB/T18793—2002信息技術(shù)可擴(kuò)展置標(biāo)語(yǔ)言(XML)1.0GB/T21712—2008古籍修復(fù)技術(shù)規(guī)范與質(zhì)量要求GB/T31219.2—2014圖書館館藏資源數(shù)字化加工規(guī)范第2部分:文本資源3術(shù)語(yǔ)和定義下列術(shù)語(yǔ)和定義適用于本文件。古籍a(chǎn)ncientbooks1911年以前(含1911年)在中國(guó)書寫或印刷的書籍。[來源:GB/T3792—2021,3.18]書葉page按文稿順序排列的書寫、印制的單張紙葉。[來源:GB/T21712—2008,2.9]版框arectangularframeintowhichpagesengraving書葉(3.2)正面圖文四邊的圍欄,一般指印刷的書。[來源:GB/T21712—2008,2.10]版心middleofpage書葉(3.2)左右對(duì)折的正中、在折葉時(shí)取作中縫標(biāo)準(zhǔn)的條狀行格。雕版印刷的書籍版心通常印有書名、卷次、葉碼,有的還印有一版文字總數(shù)、刊刻機(jī)構(gòu)以及刻工姓氏等。[來源:GB/T21712—2008,2.11]版式format漢文古籍的版面格式。2WH/T100一2023版式XML文件formatXMLfile符合GB/T18793—2002要求,對(duì)具有同一樣式的書葉(3.2)共同擁有的版式(3.5)特點(diǎn)進(jìn)行描述的XML文件。文本text以字符、符號(hào)、詞、短語(yǔ)、段落、句子、表格或者其他字符排列形成的數(shù)據(jù),用于表達(dá)意義,其解釋基本上取決于讀者對(duì)于某種自然語(yǔ)言或者人工語(yǔ)言的知識(shí)。[來源:GB/T4894—2009,4.1.1.2.4]圖像image用各種觀測(cè)系統(tǒng)以不同形式和手段觀測(cè)客觀世界而獲得的,可以直接或間接作用于人眼進(jìn)而產(chǎn)生視知覺的實(shí)體。[來源:GB/T31219.2—2014,3.3]4基本原則4.1客觀描述對(duì)漢文古籍版式特點(diǎn)、文本內(nèi)容和位置、插圖大小和位置等內(nèi)容的描述客觀準(zhǔn)確。有無版框、四周單邊、四周雙邊、左右雙邊、大小字等。4.2描述唯一每個(gè)書葉描述方式唯一,且每個(gè)描述數(shù)據(jù)解釋方式唯一,沒有歧義。擁有統(tǒng)一版式的多個(gè)書葉,版式相關(guān)數(shù)據(jù)描述方式唯一,包括版框位置、版心位置、文本行數(shù)、每行文字?jǐn)?shù)、文字大小等。4.3易實(shí)現(xiàn)版式描述形式簡(jiǎn)單,使XML文件容易加工和解釋,利于漢文古籍文本后續(xù)更深層次加工使用。4.4可擴(kuò)展可對(duì)XML進(jìn)行擴(kuò)展以適應(yīng)更多的漢文古籍樣式,例如新的字符修飾樣式等。擴(kuò)展部分是新增加的內(nèi)容,不使用已有的內(nèi)容代替,不與已有內(nèi)容發(fā)生邏輯沖突。5漢文古籍版式描述漢文古籍版式描述存放目錄可分為3個(gè)層級(jí):第一層級(jí)為書文件夾;第二層級(jí)為卷冊(cè)文件夾;第三層級(jí)為書葉XML文件夾、書葉圖像文件夾及摳圖文件夾。其中,書文件夾和卷冊(cè)文件夾的命名可自定義,書葉XML文件夾名稱應(yīng)為“XML”,書葉圖像文件夾名稱應(yīng)為“Image”,摳圖文件夾名稱應(yīng)為“Cutout”。存放目錄結(jié)構(gòu)見圖1:3WH/T100一2023圖1漢文古籍版式描述數(shù)據(jù)存儲(chǔ)目錄結(jié)構(gòu)示意圖漢文古籍版式描述存放目錄中內(nèi)容應(yīng)符合以下要求:a)書文件夾存放一部書的所有數(shù)據(jù)。書文件夾下包括一個(gè)書XML文件和一個(gè)或者多個(gè)卷冊(cè)文件夾。b)卷冊(cè)文件夾包括一個(gè)卷冊(cè)XML文件、一個(gè)版式XML文件、一個(gè)XML文件夾、一個(gè)Image文件夾和一個(gè)Cutout文件夾。c)卷冊(cè)XML文件描述卷冊(cè)包含的書葉和書葉的順序。d)版式XML文件描述卷冊(cè)的版式信息。e)XML文件夾存放卷冊(cè)中的書葉XML文件。f)Image文件夾存放卷冊(cè)中的書葉原始圖像。g)Cutout文件夾存放卷冊(cè)中的所有插圖和集外字、模糊字的摳圖。h)漢文古籍版式描述數(shù)據(jù)保存在版式XML和書葉XML中。5.2基于XML的版式描述5.2.1版式XML文件版式XML文件用來統(tǒng)一描述卷冊(cè)中書葉的版式信息,有助于書葉樣式嚴(yán)格統(tǒng)一,其命名規(guī)則為:Format.xml,版式XML文件的標(biāo)簽及其屬性見表1:表1版式XML文件標(biāo)簽XML標(biāo)簽名注解說明屬性樣例屬性名稱注解說明文檔類型定義定義文檔版本編碼版本XML文件的版本編碼文字編碼根節(jié)點(diǎn)根節(jié)點(diǎn)版本版式XML文件的版本版式列表定義一組版式無無無4WH/T100一2023表1版式XML文件標(biāo)簽(續(xù))XML標(biāo)簽名注解說明屬性樣例屬性名稱注解說明版式義一種版式name版式的名稱用戶對(duì)版式的命名版式的基準(zhǔn)DPI根據(jù)版式的基準(zhǔn)DPI,可將版式中的像素值轉(zhuǎn)換為毫版式的書葉寬版式書葉寬度的像素值版式的書葉高版式書葉高度的像素值版式的書葉版框位置版式書葉版框的像素位置,版式作用于哪些書葉確定哪些書葉使用該版式范圍/>奇偶性文本版式列表定義一組文本版式無無無文本版式定義一個(gè)文本版式文本的區(qū)域位置文本的矩形區(qū)域位置,屬性值為矩形的左上右下4邊字體ID字體列表中的一個(gè)字體ID段落樣式ID段落樣式列表中的一個(gè)段落樣式ID對(duì)齊方式豎排上對(duì)齊)豎排下對(duì)齊)文字方向圖像列表定義一組無無無義一個(gè)圖像name版式圖像的文件名版式所需圖像的文件名,圖/>圖像的區(qū)域位置值為矩形的左上右下4邊線段列表定義一組線段無無無線段一條線段起始點(diǎn)起始點(diǎn)坐標(biāo)的像素值結(jié)束點(diǎn)結(jié)束點(diǎn)坐標(biāo)的像素值線寬像素?cái)?shù)線寬5WH/T100一2023表1版式XML文件標(biāo)簽(續(xù))XML標(biāo)簽名注解說明屬性樣例屬性名稱注解說明矩形框列表定義一組矩形框無無無矩形框義一個(gè)矩形框矩形框的區(qū)域位置屬性值為矩形框的左上右下4邊的像素值以符號(hào)線寬像素?cái)?shù)線寬邊框欄線信息節(jié)點(diǎn)信息示無邊框欄線版心寬度像素?cái)?shù)距離的像素?cái)?shù)隔的4個(gè)值依次表示左上右下4個(gè)方向上內(nèi)外框線示沒有內(nèi)框線num版心左側(cè)行數(shù)版心左側(cè)行數(shù)num版心右側(cè)行數(shù)版心右側(cè)行數(shù)是否顯示欄線從右向左按順序描述,用允許值為空字符串,值為空時(shí)顯示所有欄線欄線寬欄線像素寬度外邊框?qū)捦膺吙蛳袼貙挾葍?nèi)邊框像素寬度字體列表定義一組字體無無無字體一種字體字體ID區(qū)分字體,在使用該字體的name字體的名稱用戶對(duì)字體的命名字體類型字體在字體文件中的名稱,加字符“@”表示豎排字號(hào)字體大小,以像素為單詞,也是字體的高度值字體寬度縮放比例字間距位置類型如果處于上文定義的版框區(qū)域以外,則不用來進(jìn)行高起計(jì)算6WH/T100一2023表1版式XML文件標(biāo)簽(續(xù))XML標(biāo)簽名注解說明屬性樣例屬性名稱注解說明字體一種字體字體風(fēng)格風(fēng)格可以疊加,如值為1+2+4,表示文字加粗、斜段落樣式列表定義一組段落樣式無無無段落樣式定義一種段落樣式段落樣式ID區(qū)分段落樣式,在使用該段落樣式的地方引用此id值name段落樣式用戶對(duì)段落樣式的命名行間距行與前一行之間的像素距離首字距版框位置像素?cái)?shù),計(jì)算高起邊框時(shí)用到尾字距版框位置像素?cái)?shù)5.2.2書葉XML文件書葉XML文件用來描述漢文古籍每一個(gè)書葉的具體信息,具體XML標(biāo)簽和屬性見表2:表2書葉XML文件標(biāo)簽XML標(biāo)簽名注解說明屬性樣例屬性名稱注解說明文檔類型定義定義文檔版本編碼版本XML文件的版本編碼文字編碼根節(jié)點(diǎn)根節(jié)點(diǎn)版本書葉XML文件的版本書葉描述書葉內(nèi)容書葉的書中具有唯一性書葉的基準(zhǔn)DPI根據(jù)書葉的基準(zhǔn)DPI,可將書葉中的像素值轉(zhuǎn)換為毫米、厘米等物理長(zhǎng)度值7WH/T100一2023表2書葉XML文件標(biāo)簽(續(xù))XML標(biāo)簽名注解說明屬性樣例屬性名稱注解說明書葉描述書葉內(nèi)容書葉寬書葉寬度的像素值書葉高書葉高度的像素值書葉版框位置隔開的4個(gè)數(shù)值,依次代表左上右下的像素值name書葉圖像書葉文件對(duì)應(yīng)的原圖的名稱文本版式對(duì)應(yīng)的文字列表定義一組文本版式對(duì)應(yīng)的文字無無無文本版式對(duì)應(yīng)的文字點(diǎn),該文字的坐標(biāo)及字體效果等從版式文件中取得無無無圖文區(qū)域列表定義一組圖文區(qū)域無無無插圖圖像定義一個(gè)插圖圖像插圖區(qū)域位置插圖的矩形區(qū)域位置,屬性值為矩形的左上右下4邊的像素值以017-KT-001.jpg"/>name插圖的圖像文件名文本區(qū)域blocks的子節(jié)點(diǎn),定義一個(gè)文本區(qū)域文本區(qū)域位置文本的矩形區(qū)域位置,屬性值為矩形的左上右下4邊的像素值以文本行行文本行的區(qū)域位置文本行的矩形區(qū)域位置,屬性值為矩形的左上右下4邊的像素值欄的索引值屬性信息為空時(shí)表示沒有分欄文字方向段落樣式ID段落樣式定義見版式文件大小字8WH/T100一2023表2書葉XML文件標(biāo)簽(續(xù))XML標(biāo)簽名注解說明屬性樣例屬性名稱注解說明文本字符定義一個(gè)文本字符文本字符位置文本字符的矩形區(qū)域位置,屬性值為矩形的左上右下4邊的像素字體ID字體定義見版式文件角度單個(gè)字符的旋轉(zhuǎn)角度表意文字描述字符串表意文字描述字符串模糊字
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 推動(dòng)高標(biāo)準(zhǔn)辦學(xué)水平提升的實(shí)操方案
- 出售叉車門架子合同范例
- 出售塔吊電纜合同范本
- 利于甲方合同范例
- 買賣牛肉合同范本
- 2025年P(guān)LC行業(yè)市場(chǎng)趨勢(shì)分析報(bào)告
- 出售高欄貨車合同范本
- 農(nóng)村房屋框架購(gòu)買合同范本
- 2025年度水利工程合同索賠預(yù)防與糾紛處理機(jī)制
- 傳媒公司主播簽約合同范本
- 精神障礙患者的社交技巧訓(xùn)練
- 危險(xiǎn)物品管理制度
- 門靜脈炎護(hù)理課件
- 重慶八中2024屆高三12月高考適應(yīng)性月考卷(四) 語(yǔ)文試卷(含答案)
- 基礎(chǔ)研究成果向臨床轉(zhuǎn)化的實(shí)踐與挑戰(zhàn)
- 建筑構(gòu)造(下冊(cè))
- 電流互感器試驗(yàn)報(bào)告
- 蔣中一動(dòng)態(tài)最優(yōu)化基礎(chǔ)
- 華中農(nóng)業(yè)大學(xué)全日制專業(yè)學(xué)位研究生實(shí)踐單位意見反饋表
- 付款申請(qǐng)英文模板
- 七年級(jí)英語(yǔ)閱讀理解10篇(附答案解析)
評(píng)論
0/150
提交評(píng)論