DB12-T 1303-2024 地方志數(shù)字化加工技術(shù)規(guī)范_第1頁
DB12-T 1303-2024 地方志數(shù)字化加工技術(shù)規(guī)范_第2頁
DB12-T 1303-2024 地方志數(shù)字化加工技術(shù)規(guī)范_第3頁
DB12-T 1303-2024 地方志數(shù)字化加工技術(shù)規(guī)范_第4頁
DB12-T 1303-2024 地方志數(shù)字化加工技術(shù)規(guī)范_第5頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

01.140.20CCS

A

1412 DB12/T

1303—2024地方志數(shù)字化加工技術(shù)規(guī)范Technical

specification

digital

of

天津市市場監(jiān)督管理委員會 發(fā)

布DB12/T

1303—2024 本文件按照GB/T

—《標(biāo)準(zhǔn)化工作導(dǎo)則 第1部分:標(biāo)準(zhǔn)化文件的結(jié)構(gòu)和起草規(guī)則》的規(guī)定起草。本文件由天津市地方志編修委員會辦公室提出并歸口。本文件起草單位:天津市地方志編修委員會辦公室、天津市地方志館。慶福、王靚、鄧瀅、柳楊。DB12/T

1303—2024地方志數(shù)字化加工技術(shù)規(guī)范1 范圍元數(shù)據(jù)結(jié)構(gòu)等內(nèi)容。本文件適用于地方志紙質(zhì)文獻(xiàn)數(shù)字化及出版電子書籍的加工處理。2 規(guī)范性引用文件文件。GB/T

2260—2007中華人民共和國行政區(qū)劃代碼GB/T

22373—2008 標(biāo)準(zhǔn)文獻(xiàn)元數(shù)據(jù)GB/T

—2014 圖書館館藏資源數(shù)字化加工規(guī)范

第2部分:文本資源DA/T

—2017 紙質(zhì)檔案數(shù)字化規(guī)范3 術(shù)語和定義下列術(shù)語和定義適用于本文件。3.1地方志 local

域自然、政治、經(jīng)濟(jì)、文化、社會和生態(tài)建設(shè)年度現(xiàn)狀的資料性文獻(xiàn)。3.2地方志資源local

chronicle

resources包括但不限于地方志書、地方年鑒、期刊、地方史等地方志書刊類資源。3.3數(shù)字化 digitization利用計算機(jī)技術(shù)將模擬信號轉(zhuǎn)換為數(shù)字信號的處理過程。[DA/T

31—2017,定義

3.4地方志數(shù)字化 digitization

of

paper-based

據(jù)、數(shù)字圖像間的相互關(guān)聯(lián)關(guān)系的處理過程。3.5分辨率 resolution單位長度內(nèi)圖像包含的點數(shù)或素數(shù),一般用3.6準(zhǔn)確率 precision文本文件中正確識別的字符數(shù)與總字符數(shù)之比,即準(zhǔn)確率=(正確識別字符數(shù)/總字符數(shù))×100%。DB12/T

1303—20243.7光學(xué)字符識別 optical

character

字符識別方法將形狀翻譯成計算機(jī)文字的過程。3.8元數(shù)據(jù) metadata描述信息資源或數(shù)據(jù)的數(shù)據(jù)。[GB/T

22373—2008,定義3.3]3.9元素 element元數(shù)據(jù)的基本語義單位,描述元數(shù)據(jù)的基本實體。3.10簡單型 simple

type不具有子元素的元素所對應(yīng)的元素類型。3.11容器型 container

type具有子元素且本身不能被賦值的元素所對應(yīng)的元素類型。3.12復(fù)合型

type本身可以被賦值且在一定條件下可以具有子元素的元素所對應(yīng)的元素類型。4 地方志數(shù)字化加工流程及質(zhì)量要求4.1 基本要求4.1.1 完整性地方志數(shù)字化資源的類型、內(nèi)容、元數(shù)據(jù)信息應(yīng)保證完整。4.1.2 規(guī)范性地方志數(shù)字化資源的數(shù)據(jù)格式、數(shù)據(jù)文件命名、數(shù)據(jù)存儲應(yīng)保證規(guī)范。4.1.3 有效性碼混亂、圖像失真等無法使用的錯誤。4.1.4 準(zhǔn)確性地方志數(shù)字化資源的文字、圖像、版式文件、資源掛接、元數(shù)據(jù)應(yīng)保證準(zhǔn)確。4.1.5 合規(guī)性A,填寫《地方志數(shù)字資源移交登記表》。4.2 加工流程包括但不限于:建立目錄數(shù)據(jù)庫、掃描紙質(zhì)文獻(xiàn)、

識別、制作書簽。4.3 建立目錄數(shù)據(jù)庫4.4.3.2.2 圖像放大到

200%

0.5

。4.4.3.2.2 圖像放大到

200%

0.5

。目錄數(shù)據(jù)庫數(shù)據(jù)規(guī)則的制定應(yīng)符合附錄

C

數(shù)字資源命名要求應(yīng)符合本文件

4.7

的要求。4.4 掃描紙質(zhì)文獻(xiàn)4.4.1 加工范圍包括封面、版權(quán)頁、目錄、正文、附錄、插頁、封底等從封面到封底的全部頁面。4.4.2 加工格式地方志數(shù)字資源在形成過程中可采用通用格式,在歸檔時要轉(zhuǎn)為版式文件,版式文件格式應(yīng)與國家允許的格式一致,目前可采用雙層OFD、雙層PDF或矢量PDF格式。雙層OFD、雙層PDF文件圖像所使用的圖像格式為JPG;矢量PDF文件文字使用矢量字庫,圖像采用高質(zhì)量方式。4.4.3 加工要求4.4.3.1 頁面要求頁面中圖像層和文字層的文字對位要準(zhǔn)確,頁面完整,無缺頁、重頁,頁碼順序顛倒等情況發(fā)生。文字簡繁體參照原書處理。4.4.3.2 圖像要求4.4.3.2.1 圖像精度不少于

300dpi,如原件質(zhì)量較差或字體很小,字跡密集,可適當(dāng)提高分辨率。04.4.3.2.3 含彩色插圖的頁面為彩色圖像;含灰度插圖的頁面為灰度圖像;其他頁面,為黑白圖像。4.5 OCR

使用相關(guān)軟件對地方志文獻(xiàn)進(jìn)行文字識別。OCR確率應(yīng)在以上,表格準(zhǔn)確率應(yīng)在以上。4.6 制作書簽書實際順序,書簽?zāi)軠?zhǔn)確跳轉(zhuǎn)到其對應(yīng)的位置。4.7 命名要求地方志數(shù)字資源以其具有的唯一標(biāo)識符命名,編碼由15位組成。前2ZSNJ“FS”代表地方史。第3位代表地方志資源內(nèi)容所屬類別,編碼規(guī)則按照中國圖書館分類法,其中A~X為專業(yè)性地方志資源(包括專門年鑒和專門志書)的類別編碼,Z為綜合型地方志資源(包括綜合年鑒和綜合志書)的類別編碼。第4~96位為地方志資源所屬地行政區(qū)劃代碼,應(yīng)符合GB/T

2260—2007

中華人民共和國行政區(qū)劃代碼的要求。第10~134位為地方志記事下限的年份。第14~1500則01代表第一卷、02代表第二卷,依次類推。ZS

Z

120104

2010

00

2010

1979-2010DB12/T

1303—20244.8 出版電子書籍的加工處理4.8.1 格式轉(zhuǎn)換要求文字內(nèi)容能夠被正確檢索和拷貝,與原書版面保持一致。其中外文數(shù)字、標(biāo)點、符號等均應(yīng)采用半角。4.8.2 加工及書簽要求出版電子書籍的加工處理應(yīng)符合本文件4.4.3的要求,書簽應(yīng)符合本文件4.6的要求。4.9 存儲結(jié)構(gòu)要求4.9.1 元數(shù)據(jù)收集XLS、XML、格式。4.9.2 XML

格式要求4.9.2.1XML文件的規(guī)格應(yīng)遵循UTF-8

18030。4.9.2.2XML

文件要求大小寫正確、嵌套正確。4.9.2.3 元數(shù)據(jù)的

B。4.9.3存儲結(jié)構(gòu)及實例括雙層OFD或PDF(含書簽)和元數(shù)據(jù)文件,均以其標(biāo)識符來命名,存儲結(jié)構(gòu)應(yīng)符合圖1。圖

1存儲實例5元數(shù)據(jù)著錄要求5.1 元數(shù)據(jù)的組成M1DB12/T

1303—2024由基本數(shù)據(jù)元素組成,包括題名、責(zé)任者、標(biāo)識符、日期、數(shù)字加工信息、館藏信息等元素。5.2 元數(shù)據(jù)的分類5.2.1元數(shù)據(jù)從概念層次上區(qū)分為為描述元數(shù)據(jù)和管理元數(shù)據(jù)。5.2.2 描述元數(shù)據(jù)由基本元素組成,包括題名、責(zé)任者等信息。5.2.3 管理元數(shù)據(jù)由實體書的來源信息、館藏信息和數(shù)字化加工元素組成,包括數(shù)字化加工機(jī)構(gòu)、數(shù)字化加工交付時間等信息。5.3 元數(shù)據(jù)的描述方法5.3.1 中文名稱由一個對象稱謂的中文詞或短語構(gòu)成。5.3.2 英文標(biāo)簽由一個對象稱謂的英文詞或短語構(gòu)成。5.3.3 定義說明數(shù)據(jù)元素范圍的定義或說明,描述信息對象的一段文字。5.3.4 目的描述數(shù)據(jù)元素的必要性和作用。5.3.5 必備性數(shù)據(jù)元素的選擇性屬性。5.3.6 重復(fù)性數(shù)據(jù)元素的可重復(fù)性屬性。5.3.7 元素類型數(shù)據(jù)元素所屬的類型,分為簡單型、容器型、復(fù)合型。5.3.8 數(shù)據(jù)類型由字符、數(shù)字、數(shù)值和日期等類型構(gòu)成。5.3.9 取值范圍數(shù)據(jù)元素所涉及的取值范圍。5.3.10 注釋對數(shù)據(jù)元素的進(jìn)一步說明。5.4 元數(shù)據(jù)索引表元數(shù)據(jù)索引見表1。表1表1 元數(shù)據(jù)索引表M2M3M4M5M6M7M8M9M10M11M12M13M14M15M16M17M18M19M20M21M22M23M24M25M26M27M28M29M30M31M32M33M34M35M36M37M38M39M40M41M42M43M44M45M46M47M48DB12/T

1303—DB12/T

1303—2024見附錄C。DB12/T

1303—2024

附錄 A(規(guī)范性)地方志數(shù)字資源移交登記表各單位向同級地方志館移交地方志數(shù)字資源應(yīng)填寫《地方志數(shù)字資源移交登記表》,應(yīng)符合表

。表A.1

地方志數(shù)字資源移交登記表1.2.3.4.

5.6.7.

DB12/T

1303—2024附錄B(規(guī)范性)元數(shù)據(jù)的

<xs:element

name="title"

<xs:element

<xs:element

<xs:element

<xs:element

type="xs:dateTime"/>

<xs:element

<xs:element

<xs:element

type="xs:string"/>

maxOccurs="unbounded"/>

<xs:element

minOccurs="0"/><xs:element

minOccurs="0"/><xs:element

minOccurs="0"/><xs:element

<xs:element

minOccurs="0"/><xs:element

minOccurs="0"/>

minOccurs="0"

DB12/T

1303—2024<xs:element

<xs:element

name="standardOfExecution"

minOccurs="0"/><xs:element

</xs:element>

<xs:element

type="xs:string"

<xs:element

minOccurs="0"/>

type="xs:string"

minOccurs="0"

<xs:element

</xs:element>M2creatorM1titleM3dominantAgencyM4sponsorDB12/T

1303—2024附錄C(規(guī)范性)元數(shù)據(jù)具體描述元數(shù)據(jù)的具體描述見表

。表

C.1

元數(shù)據(jù)具體描述M7對地方志資源摘要、編輯說明、凡例的描述M6regionM5otherCreator描述地方志資源的主辦單位或編纂單位,提供檢索DB12/T

DB12/T

1303—2024M8abstractM10tableOfContentsM9usual對地方志資源的編寫情況、背景、體例進(jìn)行說明M11date明確地方志資源纂修、出版時間,提供檢索DB12/T

1303DB12/T

1303—2024M14identifier每一份地方志資源均設(shè)置唯一標(biāo)識,便于保存和利用M13issuedM12createdM15resourceTypeDB12/T

DB12/T

1303—2024M18lowerLimitM17areaNumber明確地方志資源所屬地區(qū)的行政區(qū)劃代碼M16booksNumber依據(jù)中國圖書館分類法,明確地方志資源的圖書分類號M19DB12/T

DB12/T

1303—2024M22relation與當(dāng)前地方志資源關(guān)聯(lián)的其他地方志資源描述與當(dāng)前地方志資源關(guān)聯(lián)的其他地方志資源,建立關(guān)聯(lián)M20copyrightM21languagevolNumber0002DB12/T

DB12/T

1303—2024M24publicationNumber記錄地方志資源的ISBNCNM25publisherM23publishingInformationM26PrintingUnitDB12/T

1303DB12/T

1303—2024M27bookSizeM29wordNumberM28printNumberM30pageCountDB12/T

DB12/T

1303—2024M32digitialInfoM33digitalSourceM31priceM34digitialUnitDB12/T

DB12/T

1303—M36standardOfExecutionM37sourceInfo方志館獲得地方志資源的行為方式及作品出處M35leadDateDB12/T

DB12/T

1303—2024M39sourceFromM38sourceType描述方志館獲得地方志資源的行為方式M40collectInfoM41collectorName便于查找對應(yīng)的紙質(zhì)地方志資源DB12/T

1303DB12/T

1303—2024M44collectDateM42便于查找對應(yīng)的紙質(zhì)地方志資源M43shelfCode便于查找對應(yīng)的紙質(zhì)地方志資源M45collectPeriodDB12/T

DB12/T

1303—2024M46M48描述紙質(zhì)地方志資源的完整殘缺程度,提供檢索M47integrity描述紙質(zhì)地

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論