標準解讀

《GB/T 36338-2018 信息處理用藏文文獻文本信息標記規(guī)范》是一項國家標準,旨在為藏文文獻的數(shù)字化處理提供一套統(tǒng)一的信息標記規(guī)則。該標準主要針對藏文電子文檔中的文字、段落、標題等元素如何進行結(jié)構(gòu)化和語義化的標注給出指導,以便于這些文獻能夠在不同的軟件系統(tǒng)間被正確解析與利用。

在具體內(nèi)容上,《GB/T 36338-2018》定義了一系列標簽(或稱為元素),每個標簽都有其特定用途,用來描述文本的不同部分或?qū)傩?。例如,可能會有專門用于標識文章標題、作者姓名、出版日期等信息的標簽。通過使用這些預定義好的標簽來包裹相應的內(nèi)容,可以使得計算機程序更容易識別并處理藏語文獻中的關(guān)鍵信息。

此外,該標準還可能涵蓋了關(guān)于如何表示特殊字符、音標符號以及非標準寫法等方面的指南,這對于確保藏文內(nèi)容在網(wǎng)絡(luò)環(huán)境下的準確傳輸非常重要。同時,它也可能包含了對XML或其他標記語言語法的具體要求,因為這類語言常被用來實現(xiàn)復雜的文檔結(jié)構(gòu)標記。


如需獲取更多詳盡信息,請直接參考下方經(jīng)官方授權(quán)發(fā)布的權(quán)威標準文檔。

....

查看全部

  • 現(xiàn)行
  • 正在執(zhí)行有效
  • 2018-06-07 頒布
  • 2019-01-01 實施
?正版授權(quán)
GB/T 36338-2018信息處理用藏文文獻文本信息標記規(guī)范_第1頁
GB/T 36338-2018信息處理用藏文文獻文本信息標記規(guī)范_第2頁
GB/T 36338-2018信息處理用藏文文獻文本信息標記規(guī)范_第3頁
GB/T 36338-2018信息處理用藏文文獻文本信息標記規(guī)范_第4頁
免費預覽已結(jié)束,剩余20頁可下載查看

下載本文檔

GB/T 36338-2018信息處理用藏文文獻文本信息標記規(guī)范-免費下載試讀頁

文檔簡介

ICS3524001

L70..

中華人民共和國國家標準

GB/T36338—2018

信息處理用藏文文獻文本信息標記規(guī)范

SpecificationonTibetanliteraturetextmarkupforinformationprocessing

2018-06-07發(fā)布2019-01-01實施

國家市場監(jiān)督管理總局發(fā)布

中國國家標準化管理委員會

GB/T36338—2018

目次

前言

…………………………Ⅰ

范圍

1………………………1

規(guī)范性引用文件

2…………………………1

術(shù)語和定義

3………………1

藏文文獻的標記框架

4……………………1

藏文文獻文本基本屬性的標記

5…………2

藏文文獻文本結(jié)構(gòu)信息的標記

6…………4

藏文文獻文本標記規(guī)范

7…………………8

附錄資料性附錄更敦群培文集的標記范例

A()《》TEI……………18

GB/T36338—2018

前言

本標準按照給出的規(guī)則起草

GB/T1.1—2009。

請注意本文件的某些內(nèi)容可能涉及專利本文件的發(fā)布機構(gòu)不承擔識別這些專利的責任

。。

本標準由全國信息技術(shù)標準化技術(shù)委員會提出并歸口

(SAC/TC28)。

本標準起草單位中國電子技術(shù)標準化研究院西北民族大學西藏自治區(qū)藏語文工作委員會辦公

:、、

室西藏大學青海師范大學西藏自治區(qū)工業(yè)與信息化廳中國標準化研究院中國科學院軟件研究所

、,、、、、

青海民族大學中國藏學研究中心民族出版社北京北大方正電子有限公司濰坊北大青鳥華光照排有

、、、、

限公司

。

本標準主要起草人多拉扎西加熊濤尼瑪才讓楊本加多杰卓瑪索南才讓冷本扎西劉匯丹

:、、、、、、、、、

仁青卓么項見措格桑多吉黃鶴鳴才讓加

、、、、。

GB/T36338—2018

信息處理用藏文文獻文本信息標記規(guī)范

1范圍

本標準規(guī)定了藏文數(shù)字文獻的文本信息標記

。

本標準適用于藏文語料庫建設(shè)及藏文各種文獻的數(shù)字化標記

2規(guī)范性引用文件

下列文件對于本文件的應用是必不可少的凡是注日期的引用文件僅注日期的版本適用于本文

。,

件凡是不注日期的引用文件其最新版本包括所有的修改單適用于本文件

。,()。

信息處理文本和辦公系統(tǒng)標準通用置標語言

GB/T14814—1993(SGML)

3術(shù)語和定義

下列術(shù)語和定義適用于本文件

。

31

.

藏文文獻Tibetanliterature

由藏文包括古藏文及梵文轉(zhuǎn)寫構(gòu)成的各種文獻

()。

32

.

文本置標語言textencodinginitiativeTEI

;

一種定義電子文檔結(jié)構(gòu)和描述其內(nèi)容的國際標準語言

。

注1目前在信息處理界電子圖書館相關(guān)計劃中普遍使用的置標語言適用于對電子形式的全文的編碼和描述

:,。

注2元數(shù)據(jù)標準同時也規(guī)定了可供數(shù)據(jù)交換的標準編碼格式采用文件格式

:TEI,SGML。

33

.

班智達Bantita

梵語意為學識淵博的學者專指參與經(jīng)典翻譯的印度等地學者

,,。

注班智達和譯師分為藏文文獻厘定前與厘定后兩種

:。

4藏文文獻的標記框架

適用于對電子形式的全文的編碼和描述元數(shù)據(jù)標準同時也規(guī)定了可供數(shù)據(jù)交換的標準

TEI。TEI

編碼格式使用規(guī)定的作為其編碼語言格式具有很大限度的靈活

,GB/T14814—1993SGML。TEI

性綜合性可擴展性能支持對各種類型或特征的文檔進行編碼元數(shù)據(jù)標記可以對語料庫的文

、、,。TEI

本屬性信息與文本結(jié)構(gòu)信息進行規(guī)范的標記

文檔也是一個文檔一般有四個部分題名文本前的信息

TEI,SGML,:teiHeader(),front(),body

正文文本后的信息對電子文本對象的描述對正文前的信息描述包含

(),back()。TeiHeader:

溫馨提示

  • 1. 本站所提供的標準文本僅供個人學習、研究之用,未經(jīng)授權(quán),嚴禁復制、發(fā)行、匯編、翻譯或網(wǎng)絡(luò)傳播等,侵權(quán)必究。
  • 2. 本站所提供的標準均為PDF格式電子版文本(可閱讀打印),因數(shù)字商品的特殊性,一經(jīng)售出,不提供退換貨服務。
  • 3. 標準文檔要求電子版與印刷版保持一致,所以下載的文檔中可能包含空白頁,非文檔質(zhì)量問題。

評論

0/150

提交評論