關(guān)于制定中文元數(shù)據(jù)標(biāo)準(zhǔn)的思考_第1頁
關(guān)于制定中文元數(shù)據(jù)標(biāo)準(zhǔn)的思考_第2頁
關(guān)于制定中文元數(shù)據(jù)標(biāo)準(zhǔn)的思考_第3頁
關(guān)于制定中文元數(shù)據(jù)標(biāo)準(zhǔn)的思考_第4頁
關(guān)于制定中文元數(shù)據(jù)標(biāo)準(zhǔn)的思考_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

關(guān)于制定中文元數(shù)據(jù)標(biāo)準(zhǔn)的思考【內(nèi)容提要】作者認(rèn)為,中文元數(shù)據(jù)標(biāo)準(zhǔn)應(yīng)以DC為基本框架,并完全遵循和保留DC的結(jié)構(gòu)、特點(diǎn)及擴(kuò)展方式等,堅(jiān)決防止CNMARC化傾向;中文元數(shù)據(jù)標(biāo)準(zhǔn)應(yīng)形成一個(gè)完整的體系,對所涉及的相關(guān)的中文標(biāo)準(zhǔn)、規(guī)則、方案等,按照通用性、易用性等原則進(jìn)行修改和制定;這一標(biāo)準(zhǔn)體系應(yīng)成為全球各類中文信息資源著錄和檢索的標(biāo)準(zhǔn)。

【摘

題】信息資源建設(shè)與管理

元數(shù)據(jù)是“關(guān)于數(shù)據(jù)的數(shù)據(jù)”或“關(guān)于數(shù)據(jù)的結(jié)構(gòu)化數(shù)據(jù)”,現(xiàn)在常說的元數(shù)據(jù),是特指在標(biāo)記語言(SGML、HTML、XML)環(huán)境下,對網(wǎng)絡(luò)信息資源進(jìn)行描述的解決方案,主要是用于網(wǎng)絡(luò)信息資源的發(fā)現(xiàn)、存儲(chǔ)、管理和檢索利用。在當(dāng)前網(wǎng)絡(luò)信息呈異常迅猛發(fā)展之勢,大量的多樣性的數(shù)字化資源,使得信息的利用和查找十分困難。為了解決這一問題,在國外已有了很多的元數(shù)據(jù)研究項(xiàng)目和成果,建立和運(yùn)行了一些描述網(wǎng)絡(luò)信息資源的元數(shù)據(jù)模式。元數(shù)據(jù)的應(yīng)用,為網(wǎng)絡(luò)信息資源的有序組織、適度控制和高效檢索利用,提供了便利的條件。近年來,中文網(wǎng)絡(luò)信息資源也在迅速增長,盡快研究和制定中文核心元數(shù)據(jù)標(biāo)準(zhǔn),已是非常迫切的了。在制定中文元數(shù)據(jù)標(biāo)準(zhǔn)時(shí),既要考慮到中文元數(shù)據(jù)處理的特殊性和中文資源的應(yīng)用特點(diǎn),更要從全球的信息大環(huán)境出發(fā),分析、研究和借鑒國際上先進(jìn)的、通用的元數(shù)據(jù)標(biāo)準(zhǔn),在盡量保持與國際標(biāo)準(zhǔn)接軌的基礎(chǔ)上,制定符合中文資源應(yīng)用需要的擴(kuò)展與應(yīng)用規(guī)范。

1中文元數(shù)據(jù)標(biāo)準(zhǔn)應(yīng)以DC為基本框架

在國際上眾多的元數(shù)據(jù)方案中,Dublin

Core

Element

Set(都柏林核心元素集,簡稱DC),以其結(jié)構(gòu)簡單、語意互通和可擴(kuò)展等特性,事實(shí)上已成為國際范圍內(nèi)通用的網(wǎng)絡(luò)信息資源描述的元數(shù)據(jù)標(biāo)準(zhǔn)。DC經(jīng)過幾次國際會(huì)議的研討和修訂,已逐步完善和成熟。所以,制定中文元數(shù)據(jù)標(biāo)準(zhǔn)應(yīng)以DC元數(shù)據(jù)為基本框架。國內(nèi)在四五年前就已開始了對DC的探討和研究,但至今尚未完全形成依托中文環(huán)境的DC元數(shù)據(jù)標(biāo)準(zhǔn)。當(dāng)前應(yīng)進(jìn)一步加緊深入地對其進(jìn)行研究和規(guī)范,形成中文元數(shù)據(jù)的一個(gè)標(biāo)準(zhǔn)核心集,以適應(yīng)中文網(wǎng)絡(luò)信息資源的發(fā)展。中文元數(shù)據(jù)標(biāo)準(zhǔn)應(yīng)完全按照DC元數(shù)據(jù)集來建立,在具體作法上要注意以下一些問題。

(1)完全按照DC元數(shù)據(jù)的框架結(jié)構(gòu)來制定中文元數(shù)據(jù)標(biāo)準(zhǔn)。由于網(wǎng)絡(luò)信息資源在時(shí)空上的廣泛性和開放性,與傳統(tǒng)的文獻(xiàn)著錄的相對封閉性有著很大的不同,因此,中文元數(shù)據(jù)標(biāo)準(zhǔn)的制定,應(yīng)強(qiáng)調(diào)與國際接軌,保持完整的一致性。也就是說要完全遵循DC元數(shù)據(jù)的框架結(jié)構(gòu)來構(gòu)建中文元數(shù)據(jù)標(biāo)準(zhǔn),而不應(yīng)該提出“以DC為主,參考其它元數(shù)據(jù)標(biāo)準(zhǔn)”來搞中文元數(shù)據(jù)標(biāo)準(zhǔn)。我們應(yīng)汲取CNMARC的教訓(xùn),避免把中文元數(shù)據(jù)標(biāo)準(zhǔn)搞成“CNDC”。中文元數(shù)據(jù)標(biāo)準(zhǔn)應(yīng)該只是對DC元數(shù)據(jù)進(jìn)行本地化和中文化的處理,對它的內(nèi)涵、外延等用中文予以標(biāo)準(zhǔn)地詮釋,方便使用中文的著錄者和檢索者理解與利用,僅對于著錄和檢索中文信息資源的一些特殊性和應(yīng)用特點(diǎn)等有限的方面進(jìn)行規(guī)范的規(guī)定和定義。

(2)中文元數(shù)據(jù)標(biāo)準(zhǔn)的制定,應(yīng)完全保留DC元數(shù)據(jù)的基本特點(diǎn)。一般地講,內(nèi)在性、可擴(kuò)展性、獨(dú)立句法結(jié)構(gòu)、可選擇性、可重復(fù)性和可修飾性是DC的6大特點(diǎn),在實(shí)踐中集中地表現(xiàn)為DC元數(shù)據(jù)的簡易性、通用性、兼容性以及靈活的可擴(kuò)展性,這些特性是DC能夠成為一個(gè)國際上通行的元數(shù)據(jù)標(biāo)準(zhǔn)的原因,也是建議中文元數(shù)據(jù)標(biāo)準(zhǔn)應(yīng)完全按DC來制定的理由。因此,在制定中文元數(shù)據(jù)標(biāo)準(zhǔn)時(shí),要完全保留DC的基本特點(diǎn),不應(yīng)有任何的更改。在國內(nèi)有些使用DC元數(shù)據(jù)時(shí),將某些元素規(guī)定為“不可重復(fù)”或“必備”等等,這種做法是不可取的。

(3)應(yīng)以國際通行的DC修飾限定詞作為中文元數(shù)據(jù)的規(guī)范和擴(kuò)展的依據(jù),而不應(yīng)采用其它形式。DC修飾詞提供了對元數(shù)據(jù)的擴(kuò)展描述,可以縮小元素的含義范圍,使其更具有專指性,或是對元素進(jìn)行規(guī)范性說明。目前,DC已正式確定了三類修飾:模式體系、語言種類和類型。如為了表達(dá)不同的日期,在使用“Data(日期)”這一元素時(shí),可以增添“Created(創(chuàng)建)”、“Valid(有效)”、“Issued(發(fā)行)”、“Modified(修改)”等修飾詞。在中文元數(shù)據(jù)標(biāo)準(zhǔn)中,不應(yīng)把這些元素的修飾詞解釋為子元素。元素與加了修飾詞的元素沒有主次之分,修飾詞并不改變元素本身的定義。元數(shù)據(jù)標(biāo)準(zhǔn)中,不應(yīng)出現(xiàn)子元素的提法。元素的修飾限定和規(guī)范,是元數(shù)據(jù)元素的內(nèi)在特性,是元素的不同表現(xiàn)形式,絕不能把元素和加了修飾詞的元素看作是元素與子元素的關(guān)系,應(yīng)堅(jiān)決防止中文元數(shù)據(jù)標(biāo)準(zhǔn)的MARC化傾向(在MARC中就有的字段、子字段之分)。元素與加了修飾詞的元素或多個(gè)附加了修飾詞的元素同時(shí)出現(xiàn),是元數(shù)據(jù)的元素可重復(fù)性的體現(xiàn)。

2中文元數(shù)據(jù)標(biāo)準(zhǔn)應(yīng)形成一個(gè)完整的體系

中文元數(shù)據(jù)標(biāo)準(zhǔn)是整個(gè)網(wǎng)絡(luò)上中文信息資源及中文電子出版物等的著錄和檢索的工具,其應(yīng)用范圍是很廣泛的。因此,制定中文元數(shù)據(jù)標(biāo)準(zhǔn)的同時(shí),還應(yīng)對所涉及的相關(guān)的標(biāo)準(zhǔn)、規(guī)則和條例等進(jìn)行研究、修改和制定,并逐步完善其推廣應(yīng)用機(jī)制,使中文元數(shù)據(jù)標(biāo)準(zhǔn)逐步形成一個(gè)完整的體系,更好地服務(wù)于日益發(fā)展的中文網(wǎng)絡(luò)信息資源的開發(fā)和應(yīng)用。與中文元數(shù)據(jù)標(biāo)準(zhǔn)相配套使用的一系列標(biāo)準(zhǔn)、規(guī)則和條例等的制定、修訂,要本著易用性、通用性、國際性和規(guī)范化、標(biāo)準(zhǔn)化、自動(dòng)化的原則進(jìn)行。這方面的工作主要的有以下一些:

(1)修訂和完善各類中文信息的代碼體系,并盡量與國際通用的代碼一致起來。制定有關(guān)中文的“資源類型表”、“格式類型表”、“關(guān)聯(lián)值列表”等,以規(guī)范中文信息資源的著錄和檢索利用。

(2)制定有關(guān)中文關(guān)鍵詞選詞截詞等規(guī)則,以適應(yīng)中文信息資源的自動(dòng)化著錄和檢索。制定中文網(wǎng)頁及電子出版物、數(shù)據(jù)庫等的制作規(guī)范和條例。

(3)編制一個(gè)簡單易用,能夠適應(yīng)數(shù)字化信息著錄和檢索的“中文信息資源樹形分類表”。目前圖書館界廣泛應(yīng)用的《中圖法》,其分類體系和類目設(shè)置均無法適應(yīng)網(wǎng)絡(luò)時(shí)代信息分類的要求。

(4)建立一個(gè)像OCLC的CORC項(xiàng)目那樣的中文元數(shù)據(jù)在線編目系統(tǒng),免費(fèi)提供中文網(wǎng)頁或電子出版物的元數(shù)據(jù)自動(dòng)生成。還應(yīng)建立CNMARC與中文元數(shù)據(jù)的映射表,提供CNMARC數(shù)據(jù)向中文元數(shù)據(jù)格式的轉(zhuǎn)換等服務(wù)。

(5)仿照印刷文獻(xiàn)的在版編目(CIP)規(guī)定,制定中文網(wǎng)頁和電子出版物的在版元數(shù)據(jù)著錄規(guī)定,以行政手段強(qiáng)制要求所有正式注冊的中文網(wǎng)頁及電子出版物等,必須具備元數(shù)據(jù)著錄項(xiàng)目,實(shí)現(xiàn)中文網(wǎng)絡(luò)信息資源的作者著錄,使中文元數(shù)據(jù)能夠較快地在大范圍內(nèi)推廣,方便中文資源的高效利用。

3中文元數(shù)據(jù)標(biāo)準(zhǔn)應(yīng)是全球各類中文信息資源著錄和檢索的標(biāo)準(zhǔn)

網(wǎng)絡(luò)信息資源發(fā)展迅速、包羅萬象,且具有廣泛性、開放性和分布式的特征,任何一種元數(shù)據(jù)都難以滿足所有的需要。因此,元數(shù)據(jù)的標(biāo)準(zhǔn)框架應(yīng)是一種可擴(kuò)展的核心集,以應(yīng)付各種需要。DC就是這樣一種元數(shù)據(jù)集,以DC為基本框架構(gòu)建的中文元數(shù)據(jù)標(biāo)準(zhǔn)也應(yīng)是一種可擴(kuò)展的核心元數(shù)據(jù)集。中文元數(shù)據(jù)標(biāo)準(zhǔn)除了要完整地保持國

際通用的擴(kuò)展外,還應(yīng)制定一些適應(yīng)中文資源應(yīng)用所需的擴(kuò)展,并對這類特殊的擴(kuò)展進(jìn)行規(guī)范和控制。所有的元素或擴(kuò)展的元素修飾限定詞的著錄標(biāo)識(shí),仍以DC規(guī)定的規(guī)范的英文名稱來標(biāo)識(shí),不應(yīng)用中文來標(biāo)識(shí)。

中文核心元數(shù)據(jù)是各類中文數(shù)字化信息的描述、管理、保存和利用的標(biāo)準(zhǔn),它必須是能夠應(yīng)用于各種領(lǐng)域的數(shù)字化資源,如數(shù)字圖書館、電子政府、網(wǎng)絡(luò)商務(wù)、各類數(shù)據(jù)庫、電子出版物等等方面,也應(yīng)是用于整個(gè)Internet網(wǎng)絡(luò)中文信息的統(tǒng)一標(biāo)準(zhǔn),能夠?qū)崿F(xiàn)異構(gòu)資源間的互操作,在更廣的范圍內(nèi)實(shí)現(xiàn)中文信息資源的共建共享。因此,中文元數(shù)據(jù)標(biāo)準(zhǔn)的研究制定,絕不能僅僅局限在圖書館界人員,而應(yīng)在更大的范圍內(nèi),采取開放式的研討方式。我們都知道,DC元數(shù)據(jù)是由圖書館、計(jì)算機(jī)、網(wǎng)絡(luò)等方面的專家和學(xué)者共同研討的產(chǎn)物,我們也應(yīng)借鑒這一經(jīng)驗(yàn),而且參與者的學(xué)科范圍和專業(yè)領(lǐng)域要更擴(kuò)大一些,這樣制定出的中文元數(shù)據(jù)標(biāo)準(zhǔn),才能廣泛地應(yīng)用于各學(xué)科領(lǐng)域,成為中文信息資源描述的基礎(chǔ)的跨領(lǐng)域的元數(shù)據(jù)集。

中文元數(shù)據(jù)標(biāo)準(zhǔn)應(yīng)是全球所有中文資源著錄和檢索的標(biāo)準(zhǔn),應(yīng)得到海內(nèi)外從事中文信息資源建設(shè)的專家學(xué)者的廣泛支持和參與,采取聯(lián)合、協(xié)作、共建共享的方式,加強(qiáng)合作,避免重復(fù)開發(fā)。使制定出的中文元數(shù)據(jù)標(biāo)準(zhǔn)具有更為廣泛的適用性和權(quán)威性,并形成一個(gè)國際通用的中文元數(shù)據(jù)標(biāo)準(zhǔn)體系,推動(dòng)全世界的中文數(shù)字化信息資源的建設(shè)和發(fā)展。

收稿日期:20XX-06-09

【參考文獻(xiàn)】

1王新.都柏林核心集綜述.情報(bào)理論與實(shí)踐,2000,(5)

2趙慧勤.網(wǎng)絡(luò)信息資源組織——Dublin

Core元數(shù)據(jù).情

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論