信息資源的描述元數(shù)據(jù)課件_第1頁
信息資源的描述元數(shù)據(jù)課件_第2頁
信息資源的描述元數(shù)據(jù)課件_第3頁
信息資源的描述元數(shù)據(jù)課件_第4頁
信息資源的描述元數(shù)據(jù)課件_第5頁
已閱讀5頁,還剩57頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

信息資源的描述信息資源的描述1本節(jié)學習目標信息資源組織的語言工具SGMLHTMLXML信息資源組織的元數(shù)據(jù)DCMARC信息資源組織的數(shù)據(jù)庫方法本節(jié)學習目標信息資源組織的語言工具2一、信息資源組織的語言工具

信息組織的基本目標是對信息外在特征和內(nèi)容特征加以描述,實現(xiàn)信息有序化。需要從內(nèi)容、結(jié)構(gòu)和顯示三方面著手。針對上述三個要求,提出標記語言的方法。其基本思想是給文獻需要加注部分置于不同類型和名稱的標簽,這些標簽不僅能夠標注文獻的內(nèi)容和結(jié)構(gòu)也能標注其表現(xiàn)形式。本節(jié)介紹三種標記語言:SGML、HTML、XML。一、信息資源組織的語言工具信息組織的31.1SGML

SGML(standardgeneralizedmarkuplanguage)標準通用標記語言,是所有電子文檔標記語言的起源。SGML認為一個典型的文檔由結(jié)構(gòu)、內(nèi)容和樣式三部分組成。文獻類型定義DTD為組織文檔的元素提供一個框架。SGML的缺點:SGML龐大復雜的選項雖然使其有較高的靈活性,但是導致應用程序開發(fā)困難;SGML文件不易在Web上傳播,全面實現(xiàn)瀏覽器非常困難;廠商不支持。1.1SGML41.2HTMLHTML(hypertextmarkuplanguage)超文本標記語言,簡單易用,提供一種文本結(jié)構(gòu)和格式,使其在瀏覽器上呈現(xiàn)給訪問的用戶,它是Web上的通用語言。HTML的主要功能為:發(fā)布信息:出版聯(lián)網(wǎng)文檔,向全世界發(fā)布信息;獲取信息:通過超鏈接檢索和獲取信息;交流信息:設計交易單(form),實現(xiàn)交互,方便及時交流信息。1.2HTML5信息資源的描述元數(shù)據(jù)課件6HTML的基本結(jié)構(gòu)<html>//文件開始標記<head>//文件的頭部開始標記<title>HTML</title>//頭部</head>//頭部結(jié)束標記<body>//文件的主體開始標記Hello,HTML!</body>//主體結(jié)束標記</html>//文件結(jié)束標記實例HTML的基本結(jié)構(gòu)實例71.3XML

XML(ExtensibleMarkupLanguage)即可擴展標記語言,XML是一種簡單的數(shù)據(jù)存儲語言,使用一系列簡單的標記描述數(shù)據(jù),而這些標記可以用方便的方式建立,極其簡單易于掌握和使用。XML與HTML的設計區(qū)別是:XML是用來存儲數(shù)據(jù)的,重在數(shù)據(jù)本身。而HTML是用來定義數(shù)據(jù)的,重在數(shù)據(jù)的顯示模式。XML的特點:靈活性與簡潔性;開放性與可擴展性、實用性和高效性。XML主要應用:多媒體信息處理、科學研究、電子商務、數(shù)字圖書館等。1.3XML8XML和HTML的不同可以歸納為3點:XML擴展性比HTML強XML可以創(chuàng)建個性化的標記語言,可以提供更多的數(shù)據(jù)操作,HTML只能局限于按一定的格式在終端顯示出來。XML的語法比HTML嚴格由于XML的擴展性強,它需要穩(wěn)定的基礎規(guī)則來支持擴展。它的嚴格規(guī)則為:1、起始和結(jié)束的標簽相匹配2、嵌套標簽不能相互嵌套3、區(qū)分大小寫XML與HTML互補在現(xiàn)階段,XML可以轉(zhuǎn)化成相應的HTML,來適應當前瀏覽器的需求。XML和HTML的不同可以歸納為3點:9XML文檔結(jié)構(gòu)<?xmlversion="1.0"encoding="UTF-8"standalone="yes"?><mytag>Hi,XML!</mytag>versionXML文檔所使用的版本encoding指明XML文檔編碼使用的字符集standalone指明XML文檔有沒有使用外部標記聲明,yes表明是一個獨立文檔,no表明在其內(nèi)部使用了其他文檔或資源。實例XML文檔結(jié)構(gòu)實例10二、信息資源描述2.1信息資源描述信息資源描述(Informationdescription)是根據(jù)信息資源組織和檢索的需要,依據(jù)一定的規(guī)則和標準,對信息資源的主題內(nèi)容、形式特征、物質(zhì)形態(tài)等進行分析、選擇、記錄的活動。

信息資源描述的結(jié)果是一條有關該信息資源的書目數(shù)據(jù)記錄,由若干信息描述項組成。信息記錄也稱為元數(shù)據(jù)(Metadata)。信息資源描述實質(zhì)上是一個按照一定規(guī)則分析和選擇數(shù)據(jù)的過程。二、信息資源描述2.1信息資源描述112.2元數(shù)據(jù)元數(shù)據(jù)(Metadata)是描述數(shù)據(jù)的數(shù)據(jù)(datathatdescribesdata)或關于數(shù)據(jù)的數(shù)據(jù)(dataaboutdata)。它是促進數(shù)據(jù)處理和標引數(shù)據(jù)的數(shù)據(jù),也是人們組織和發(fā)現(xiàn)信息資源的數(shù)據(jù)。

圖書館書目卡片搜索引擎圖書題名著者出版者分類號主題詞ISBN號流水號館藏號等資源類型Web頁面標題作者主題關鍵詞內(nèi)容摘要等2.2元數(shù)據(jù)圖書館書目卡片搜索引擎圖書題名資源類型12元數(shù)據(jù)(Metadata)的主要功能如下:描述Internet數(shù)據(jù)內(nèi)容和本質(zhì)特征,存儲相應的檢索路徑使Internet數(shù)據(jù)便于發(fā)現(xiàn),提高信息資源的查全率和查準率提供數(shù)據(jù)之間的關系,指出相關數(shù)據(jù)的地址和存取方法對Internet資源進行分類,有效選擇用戶所感興趣的信息。對某些缺少文本的數(shù)據(jù)(聲音、圖像等)進行文字說明,以便對描述對象有一個完整的描述。元數(shù)據(jù)(Metadata)的主要功能如下:13示例:<HTML><HEAD><TITLE>NationalDigitalLibrary</TITLE><METAname=“detscription”content=“Youcanretrieveanythingyouwanttoknow”><METAname=“keywords”content=“digitalbook,database,pictures,file,films”><METAhttp-equiv="content-type"content="text/html;charset=GB2312"/><METAname=“robots”content=“all”></HEAD></HTML>實例示例:實例142.3信息資源描述的規(guī)范信息資源的描述需要根據(jù)檢索系統(tǒng)的要求,確定描述的成分和特征,按一定的次序和形式加以記錄。為了一致、有效地對信息資源進行描述,便于不同機構(gòu)和信息系統(tǒng)之間信息交換,信息描述需依據(jù)一定的描述規(guī)范進行操作。傳統(tǒng)文獻信息資源網(wǎng)絡信息資源國際標準書目著錄(ISBD)《文獻著錄總則》(GB3792.1-83)《文后參考文獻著錄規(guī)則》(GB7714-2005)《都柏林核心集》(DublinCore,DC)《政府信息定位服務》(governmentinformationlocatorservice,GILS)參考文獻[1]林豪慧,孫麗芳.信息資源檢索與利用[M].電子工業(yè)出版社.2008:9[2]王晨.應用型本科、高職院校信息檢索課現(xiàn)狀調(diào)查及教學模式改革[J].教育與職業(yè).2008(5):118-1202.3信息資源描述的規(guī)范傳統(tǒng)文獻信息資源網(wǎng)絡信息資源國際標152.4信息描述項目及符號由于揭示對象不同,因而信息描述記錄單元—元數(shù)據(jù)的格式、項目和符號等也有所不同。產(chǎn)品/商品產(chǎn)品/商品名稱、型號、規(guī)格、用途、性能、包裝、價格、生產(chǎn)廠家、聯(lián)系地址等企業(yè)法人代表姓名、企業(yè)名稱、成立日期、職工總數(shù)、固定資產(chǎn)額、廠址、通信聯(lián)絡途徑、主要產(chǎn)品或經(jīng)營范圍、企業(yè)所獲榮譽及業(yè)績、近期經(jīng)營狀況等科研成果科研成果名稱、主持或完成者、立項時間、項目來源、完成時間、成果形式、所達到的水平、社會反響等2.4信息描述項目及符號產(chǎn)品/商品產(chǎn)品/商品名稱、型號、規(guī)16三、信息資源描述的元數(shù)據(jù)3.1都柏林核心元數(shù)據(jù)(DC)

DublinCore(DC)是國際組織DublinCoreMetadataInitiative擬定的用于標識電子資源的一種簡要目錄模式。DC是由15個Metadata系統(tǒng),其主要目的是為了揭示和組織網(wǎng)絡上的信息資源(包括文本及圖像等)。

DC元數(shù)據(jù)編輯器http://www.ukoln.ac.uk/metadata/dcdot/

DC元數(shù)據(jù)元素集參考描述如下表所示:三、信息資源描述的元數(shù)據(jù)3.1都柏林核心元數(shù)據(jù)(DC)17元素名字標識定義Title資源名Title賦予資源名稱Creator創(chuàng)建者Creator創(chuàng)建資源內(nèi)容的主要責任者Subject主題和關鍵詞Subject資源內(nèi)容的主題描述Description說明Description對資源內(nèi)容的說明Publisher出版者Publisher使資源成為可以取得和利用狀態(tài)的責任者Contributor其它責任者Contributor對資源內(nèi)容創(chuàng)建做出貢獻的其他責任者Data日期Data與資源本身生命周期中的一個事件相關的日期元素名字標識定義Title資源名Title賦予資源名稱Cre18元素名字標識定義Type類型Type資源內(nèi)容的特征和類型Format形式Format資源的物理或數(shù)字化的表現(xiàn)形式Identifier資源標識符Identifier給定的文本環(huán)境中對資源的參照引用Source來源Source對一個資源的參照,而當前資源是源自這一參照資源Language語種Language描述資源知識內(nèi)容的語種Relation關聯(lián)Relation對相關資源的參照Coverage覆蓋范圍Coverage資源內(nèi)容所涉及的外延與覆蓋范圍Rights權限管理Rights有關資源本身所有的或被賦予的權限信息元素名字標識定義Type類型Type資源內(nèi)容的特征和類型Fo19從DC的15項元數(shù)據(jù)可以看出:15個元素大致分為三類:對資源內(nèi)容的描述:題名、主題、描述、來源、語種、關聯(lián)和覆蓋范圍;對外部屬性的描述:日期、類型、格式和標識;對知識產(chǎn)權的描述:創(chuàng)建者、出版者、責任者和權限管理。比較全面地概括了電子資源的主要特征涵蓋了資源的重要檢索點(1、2、3)、輔助檢索點或關聯(lián)檢索點(5、6、10、11、13)、有價值的說明性信息(4、7、8、9、12、14、15)。簡介、規(guī)范,不僅使用于電子文獻目錄,也適用于各類電子化的公務文檔目錄及產(chǎn)品、商品、藏品目錄等,有很好的使用性。從DC的15項元數(shù)據(jù)可以看出:20DC用RDF/XML對圖片的描述/o/p/2010-02-16shtmlDC用RDF/XML對圖片的描述http://sports.213.2資源描述框架(RDF)

RDF是資源描述框架(thesourcedescriptionframework)的縮寫。資源是所有Web上被命名的、具有URI(unifiedresourceidentifier,統(tǒng)一資源描述符)的對象(網(wǎng)頁、XML文檔中的元素等)。描述是對資源屬性的陳述,表明資源的特性。框架是與被描述資源無關的通用模型。RDF以XML(extensiblemarkuplanguage)語言作為其宿主語法,來推動Internet數(shù)據(jù)的開發(fā)。

RDF定義了一種通用的框架,即資源—屬性—值的三元組,來描述Web上的各種資源。3.2資源描述框架(RDF)22示例:<rdf:RDFxmlns:rdf=“/1999/02/22-synax-ns#”xmlns:dc=/metadata/dublin-core#xmlns:dced=/metadata/dced-v1#>第一行:指定rdf命名空間的具體地址第二行:定義DC命名空間的來源的網(wǎng)址第三行:指定都柏林核心教育元數(shù)據(jù)的命名空間地址

為了方便管理交換信息資源,用元數(shù)據(jù)描述Web上的數(shù)據(jù),由于不同元數(shù)據(jù)之間具有不同的結(jié)構(gòu),為了實現(xiàn)元數(shù)據(jù)之間的可互操作,采用RDF來處理不同類型的元數(shù)據(jù)集合,并使計算機可以理解。RDF的建立基于XML,兩者結(jié)合解決了信息建立與信息描述的開放機制,有利于資源共享,尤其為語義網(wǎng)提供技術支持。示例:23

3.3MARC

MARC(machinereadablecatalogue)是機器可讀目錄的簡稱,是一種經(jīng)過人們編輯、組織的數(shù)字化書目記錄的集合。

MARC將傳統(tǒng)的卡片目錄的內(nèi)容以標準數(shù)據(jù)形式記錄在光磁載體上供用戶利用計算機等設備查閱,它主要記載文獻的書目信息和存儲地址,記錄格式統(tǒng)一。具有存儲載體空間小、容量大、復制速度快、易于收藏和攜帶,并可產(chǎn)生出多類型的卡片式或書本式目錄,便于實現(xiàn)對資源的有效管理,在圖書文獻機構(gòu)中具有相當重要的地位。

MARC書目記錄的總體結(jié)構(gòu)定義為記錄頭標區(qū)、目次區(qū)、數(shù)據(jù)區(qū)和記錄分隔符四部分。3.3MARC24CNMARC格式

CNMARC是中國機讀目錄的縮寫,用于中國國家書目機構(gòu)同其他國家書目機構(gòu)及中國國內(nèi)圖書館與情報部門之間,以標準的計算機可讀形式交換書目信息。

0XX標識塊7XX知識責任塊1XX編碼信息塊8XX國際使用塊2XX著錄信息塊9XX國內(nèi)使用塊3XX附注塊4XX款目連接塊5XX相關題名塊6XX主題分析塊

如圖示CNMARC格式如圖示25DC與MARC的比較著錄目的不同DC提供給搜索引擎,MARC為用戶檢索館藏所用著錄對象不同DC數(shù)字化信息資源,MARC描述實體的書目數(shù)據(jù)著錄格式不同DC由15個基本元素組成,有可選擇性,只要確保最低限度的7個元素,就符合著錄標準;MARC遵守標準記錄結(jié)構(gòu),包括頭標區(qū)、地址目次區(qū)、數(shù)據(jù)字段區(qū)DC與MARC的比較26著錄主體不同DC是一種結(jié)構(gòu)化的元數(shù)據(jù),支持字段查詢,創(chuàng)建者和信息提供者無需培訓就能進行資源描述;MARC需要專門的計算機軟件系統(tǒng),而且要遵循一系列規(guī)定,編制一條記錄時工作人員需要經(jīng)過培訓。著錄方式不同DC側(cè)重對文獻內(nèi)容、內(nèi)部結(jié)構(gòu)或標準及管理方面描述MARC注重對文獻類型特征的描述揭示關系不同DC不能揭示資源間的相互關系,MARC一定程度上可以著錄主體不同27描述詳盡程度不同DC的設計主要以檢索為目的MARC描述詳盡數(shù)據(jù)質(zhì)量控制不同DC沒有規(guī)定資源描述的依據(jù),不利于保證描述內(nèi)容的一致性,檢索的可靠性不能保證MARC在著錄時有嚴格控制,較好保證了不同主體對同一資源描述的一致性。描述詳盡程度不同28四、信息組織的數(shù)據(jù)庫方法數(shù)據(jù)庫的發(fā)展階段數(shù)據(jù)模型典型代表第一代有向連通圖層次式數(shù)據(jù)庫和網(wǎng)狀數(shù)據(jù)庫第二代二維表關系數(shù)據(jù)庫第三代屬性(attribute)方法(method)或操作(operation)面向?qū)ο蟮臄?shù)據(jù)庫四、信息組織的數(shù)據(jù)庫方法數(shù)據(jù)庫的發(fā)展階段數(shù)據(jù)模型典型代表第一29信息的三種世界客觀世界

信息世界

機器世界

認識,抽象

轉(zhuǎn)換

客觀存在

概念模型

數(shù)據(jù)模型

信息的三種世界客觀世界信息世界30

數(shù)據(jù)庫是各個部門、企業(yè)應用所涉及到的數(shù)據(jù)的集合。它不僅反映數(shù)據(jù)本身所表達的內(nèi)容,而且還反映數(shù)據(jù)之間的聯(lián)系。由于計算機不能直接處理現(xiàn)實世界中的具體事物,所以人們必須事先將具體事物轉(zhuǎn)換成計算機能夠處理的數(shù)據(jù)。在數(shù)據(jù)庫系統(tǒng)的形式化結(jié)構(gòu)中如何抽象、表示、處理現(xiàn)實世界中的信息和數(shù)據(jù)呢?這就是數(shù)據(jù)庫的數(shù)據(jù)模型。通過數(shù)據(jù)模型這個工具來抽象、表示和處理現(xiàn)實世界中的信息和數(shù)據(jù)。數(shù)據(jù)庫是各個部門、企業(yè)應用所涉及到的數(shù)31信息資源的描述信息資源的描述32本節(jié)學習目標信息資源組織的語言工具SGMLHTMLXML信息資源組織的元數(shù)據(jù)DCMARC信息資源組織的數(shù)據(jù)庫方法本節(jié)學習目標信息資源組織的語言工具33一、信息資源組織的語言工具

信息組織的基本目標是對信息外在特征和內(nèi)容特征加以描述,實現(xiàn)信息有序化。需要從內(nèi)容、結(jié)構(gòu)和顯示三方面著手。針對上述三個要求,提出標記語言的方法。其基本思想是給文獻需要加注部分置于不同類型和名稱的標簽,這些標簽不僅能夠標注文獻的內(nèi)容和結(jié)構(gòu)也能標注其表現(xiàn)形式。本節(jié)介紹三種標記語言:SGML、HTML、XML。一、信息資源組織的語言工具信息組織的341.1SGML

SGML(standardgeneralizedmarkuplanguage)標準通用標記語言,是所有電子文檔標記語言的起源。SGML認為一個典型的文檔由結(jié)構(gòu)、內(nèi)容和樣式三部分組成。文獻類型定義DTD為組織文檔的元素提供一個框架。SGML的缺點:SGML龐大復雜的選項雖然使其有較高的靈活性,但是導致應用程序開發(fā)困難;SGML文件不易在Web上傳播,全面實現(xiàn)瀏覽器非常困難;廠商不支持。1.1SGML351.2HTMLHTML(hypertextmarkuplanguage)超文本標記語言,簡單易用,提供一種文本結(jié)構(gòu)和格式,使其在瀏覽器上呈現(xiàn)給訪問的用戶,它是Web上的通用語言。HTML的主要功能為:發(fā)布信息:出版聯(lián)網(wǎng)文檔,向全世界發(fā)布信息;獲取信息:通過超鏈接檢索和獲取信息;交流信息:設計交易單(form),實現(xiàn)交互,方便及時交流信息。1.2HTML36信息資源的描述元數(shù)據(jù)課件37HTML的基本結(jié)構(gòu)<html>//文件開始標記<head>//文件的頭部開始標記<title>HTML</title>//頭部</head>//頭部結(jié)束標記<body>//文件的主體開始標記Hello,HTML!</body>//主體結(jié)束標記</html>//文件結(jié)束標記實例HTML的基本結(jié)構(gòu)實例381.3XML

XML(ExtensibleMarkupLanguage)即可擴展標記語言,XML是一種簡單的數(shù)據(jù)存儲語言,使用一系列簡單的標記描述數(shù)據(jù),而這些標記可以用方便的方式建立,極其簡單易于掌握和使用。XML與HTML的設計區(qū)別是:XML是用來存儲數(shù)據(jù)的,重在數(shù)據(jù)本身。而HTML是用來定義數(shù)據(jù)的,重在數(shù)據(jù)的顯示模式。XML的特點:靈活性與簡潔性;開放性與可擴展性、實用性和高效性。XML主要應用:多媒體信息處理、科學研究、電子商務、數(shù)字圖書館等。1.3XML39XML和HTML的不同可以歸納為3點:XML擴展性比HTML強XML可以創(chuàng)建個性化的標記語言,可以提供更多的數(shù)據(jù)操作,HTML只能局限于按一定的格式在終端顯示出來。XML的語法比HTML嚴格由于XML的擴展性強,它需要穩(wěn)定的基礎規(guī)則來支持擴展。它的嚴格規(guī)則為:1、起始和結(jié)束的標簽相匹配2、嵌套標簽不能相互嵌套3、區(qū)分大小寫XML與HTML互補在現(xiàn)階段,XML可以轉(zhuǎn)化成相應的HTML,來適應當前瀏覽器的需求。XML和HTML的不同可以歸納為3點:40XML文檔結(jié)構(gòu)<?xmlversion="1.0"encoding="UTF-8"standalone="yes"?><mytag>Hi,XML!</mytag>versionXML文檔所使用的版本encoding指明XML文檔編碼使用的字符集standalone指明XML文檔有沒有使用外部標記聲明,yes表明是一個獨立文檔,no表明在其內(nèi)部使用了其他文檔或資源。實例XML文檔結(jié)構(gòu)實例41二、信息資源描述2.1信息資源描述信息資源描述(Informationdescription)是根據(jù)信息資源組織和檢索的需要,依據(jù)一定的規(guī)則和標準,對信息資源的主題內(nèi)容、形式特征、物質(zhì)形態(tài)等進行分析、選擇、記錄的活動。

信息資源描述的結(jié)果是一條有關該信息資源的書目數(shù)據(jù)記錄,由若干信息描述項組成。信息記錄也稱為元數(shù)據(jù)(Metadata)。信息資源描述實質(zhì)上是一個按照一定規(guī)則分析和選擇數(shù)據(jù)的過程。二、信息資源描述2.1信息資源描述422.2元數(shù)據(jù)元數(shù)據(jù)(Metadata)是描述數(shù)據(jù)的數(shù)據(jù)(datathatdescribesdata)或關于數(shù)據(jù)的數(shù)據(jù)(dataaboutdata)。它是促進數(shù)據(jù)處理和標引數(shù)據(jù)的數(shù)據(jù),也是人們組織和發(fā)現(xiàn)信息資源的數(shù)據(jù)。

圖書館書目卡片搜索引擎圖書題名著者出版者分類號主題詞ISBN號流水號館藏號等資源類型Web頁面標題作者主題關鍵詞內(nèi)容摘要等2.2元數(shù)據(jù)圖書館書目卡片搜索引擎圖書題名資源類型43元數(shù)據(jù)(Metadata)的主要功能如下:描述Internet數(shù)據(jù)內(nèi)容和本質(zhì)特征,存儲相應的檢索路徑使Internet數(shù)據(jù)便于發(fā)現(xiàn),提高信息資源的查全率和查準率提供數(shù)據(jù)之間的關系,指出相關數(shù)據(jù)的地址和存取方法對Internet資源進行分類,有效選擇用戶所感興趣的信息。對某些缺少文本的數(shù)據(jù)(聲音、圖像等)進行文字說明,以便對描述對象有一個完整的描述。元數(shù)據(jù)(Metadata)的主要功能如下:44示例:<HTML><HEAD><TITLE>NationalDigitalLibrary</TITLE><METAname=“detscription”content=“Youcanretrieveanythingyouwanttoknow”><METAname=“keywords”content=“digitalbook,database,pictures,file,films”><METAhttp-equiv="content-type"content="text/html;charset=GB2312"/><METAname=“robots”content=“all”></HEAD></HTML>實例示例:實例452.3信息資源描述的規(guī)范信息資源的描述需要根據(jù)檢索系統(tǒng)的要求,確定描述的成分和特征,按一定的次序和形式加以記錄。為了一致、有效地對信息資源進行描述,便于不同機構(gòu)和信息系統(tǒng)之間信息交換,信息描述需依據(jù)一定的描述規(guī)范進行操作。傳統(tǒng)文獻信息資源網(wǎng)絡信息資源國際標準書目著錄(ISBD)《文獻著錄總則》(GB3792.1-83)《文后參考文獻著錄規(guī)則》(GB7714-2005)《都柏林核心集》(DublinCore,DC)《政府信息定位服務》(governmentinformationlocatorservice,GILS)參考文獻[1]林豪慧,孫麗芳.信息資源檢索與利用[M].電子工業(yè)出版社.2008:9[2]王晨.應用型本科、高職院校信息檢索課現(xiàn)狀調(diào)查及教學模式改革[J].教育與職業(yè).2008(5):118-1202.3信息資源描述的規(guī)范傳統(tǒng)文獻信息資源網(wǎng)絡信息資源國際標462.4信息描述項目及符號由于揭示對象不同,因而信息描述記錄單元—元數(shù)據(jù)的格式、項目和符號等也有所不同。產(chǎn)品/商品產(chǎn)品/商品名稱、型號、規(guī)格、用途、性能、包裝、價格、生產(chǎn)廠家、聯(lián)系地址等企業(yè)法人代表姓名、企業(yè)名稱、成立日期、職工總數(shù)、固定資產(chǎn)額、廠址、通信聯(lián)絡途徑、主要產(chǎn)品或經(jīng)營范圍、企業(yè)所獲榮譽及業(yè)績、近期經(jīng)營狀況等科研成果科研成果名稱、主持或完成者、立項時間、項目來源、完成時間、成果形式、所達到的水平、社會反響等2.4信息描述項目及符號產(chǎn)品/商品產(chǎn)品/商品名稱、型號、規(guī)47三、信息資源描述的元數(shù)據(jù)3.1都柏林核心元數(shù)據(jù)(DC)

DublinCore(DC)是國際組織DublinCoreMetadataInitiative擬定的用于標識電子資源的一種簡要目錄模式。DC是由15個Metadata系統(tǒng),其主要目的是為了揭示和組織網(wǎng)絡上的信息資源(包括文本及圖像等)。

DC元數(shù)據(jù)編輯器http://www.ukoln.ac.uk/metadata/dcdot/

DC元數(shù)據(jù)元素集參考描述如下表所示:三、信息資源描述的元數(shù)據(jù)3.1都柏林核心元數(shù)據(jù)(DC)48元素名字標識定義Title資源名Title賦予資源名稱Creator創(chuàng)建者Creator創(chuàng)建資源內(nèi)容的主要責任者Subject主題和關鍵詞Subject資源內(nèi)容的主題描述Description說明Description對資源內(nèi)容的說明Publisher出版者Publisher使資源成為可以取得和利用狀態(tài)的責任者Contributor其它責任者Contributor對資源內(nèi)容創(chuàng)建做出貢獻的其他責任者Data日期Data與資源本身生命周期中的一個事件相關的日期元素名字標識定義Title資源名Title賦予資源名稱Cre49元素名字標識定義Type類型Type資源內(nèi)容的特征和類型Format形式Format資源的物理或數(shù)字化的表現(xiàn)形式Identifier資源標識符Identifier給定的文本環(huán)境中對資源的參照引用Source來源Source對一個資源的參照,而當前資源是源自這一參照資源Language語種Language描述資源知識內(nèi)容的語種Relation關聯(lián)Relation對相關資源的參照Coverage覆蓋范圍Coverage資源內(nèi)容所涉及的外延與覆蓋范圍Rights權限管理Rights有關資源本身所有的或被賦予的權限信息元素名字標識定義Type類型Type資源內(nèi)容的特征和類型Fo50從DC的15項元數(shù)據(jù)可以看出:15個元素大致分為三類:對資源內(nèi)容的描述:題名、主題、描述、來源、語種、關聯(lián)和覆蓋范圍;對外部屬性的描述:日期、類型、格式和標識;對知識產(chǎn)權的描述:創(chuàng)建者、出版者、責任者和權限管理。比較全面地概括了電子資源的主要特征涵蓋了資源的重要檢索點(1、2、3)、輔助檢索點或關聯(lián)檢索點(5、6、10、11、13)、有價值的說明性信息(4、7、8、9、12、14、15)。簡介、規(guī)范,不僅使用于電子文獻目錄,也適用于各類電子化的公務文檔目錄及產(chǎn)品、商品、藏品目錄等,有很好的使用性。從DC的15項元數(shù)據(jù)可以看出:51DC用RDF/XML對圖片的描述/o/p/2010-02-16shtmlDC用RDF/XML對圖片的描述http://sports.523.2資源描述框架(RDF)

RDF是資源描述框架(thesourcedescriptionframework)的縮寫。資源是所有Web上被命名的、具有URI(unifiedresourceidentifier,統(tǒng)一資源描述符)的對象(網(wǎng)頁、XML文檔中的元素等)。描述是對資源屬性的陳述,表明資源的特性??蚣苁桥c被描述資源無關的通用模型。RDF以XML(extensiblemarkuplanguage)語言作為其宿主語法,來推動Internet數(shù)據(jù)的開發(fā)。

RDF定義了一種通用的框架,即資源—屬性—值的三元組,來描述Web上的各種資源。3.2資源描述框架(RDF)53示例:<rdf:RDFxmlns:rdf=“/1999/02/22-synax-ns#”xmlns:dc=/metadata/dublin-core#xmlns:dced=/metadata/dced-v1#>第一行:指定rdf命名空間的具體地址第二行:定義DC命名空間的來源的網(wǎng)址第三行:指定都柏林核心教育元數(shù)據(jù)的命名空間地址

為了方便管理交換信息資源,用元數(shù)據(jù)描述Web上的數(shù)據(jù),由于不同元數(shù)據(jù)之間具有不同的結(jié)構(gòu),為了實現(xiàn)元數(shù)據(jù)之間的可互操作,采用RDF來處理不同類型的元數(shù)據(jù)集合,并使計算機可以理解。RDF的建立基于XML,兩者結(jié)合解決了信息建立與信息描述的開放機制,有利于資源共享,尤其為語義網(wǎng)提供技術支持。示例:54

3.3MARC

MARC(machinereadablecatalogue)是機器可讀目錄的簡稱,是一種經(jīng)過人們編輯、組織的數(shù)字化書目記錄的集合。

MARC將傳統(tǒng)的卡片目錄的內(nèi)容以標準數(shù)據(jù)形式記錄在光磁載體上供用戶利用計算機等設備查閱,它主要記載文獻的書目信息和存儲地址,記錄格式統(tǒng)一。具有存儲載體空間小、容量大、復制速度快、易于收藏和攜帶,并可產(chǎn)生出多類型的卡片式或書本式目錄,便于實現(xiàn)對資源的有效管理,在圖書文獻機構(gòu)中具有相當重要的地位。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論