![信息資源的描述元數(shù)據(jù)課件_第1頁](http://file4.renrendoc.com/view/5679a1164cc2e966d62c515b2645ee1c/5679a1164cc2e966d62c515b2645ee1c1.gif)
![信息資源的描述元數(shù)據(jù)課件_第2頁](http://file4.renrendoc.com/view/5679a1164cc2e966d62c515b2645ee1c/5679a1164cc2e966d62c515b2645ee1c2.gif)
![信息資源的描述元數(shù)據(jù)課件_第3頁](http://file4.renrendoc.com/view/5679a1164cc2e966d62c515b2645ee1c/5679a1164cc2e966d62c515b2645ee1c3.gif)
![信息資源的描述元數(shù)據(jù)課件_第4頁](http://file4.renrendoc.com/view/5679a1164cc2e966d62c515b2645ee1c/5679a1164cc2e966d62c515b2645ee1c4.gif)
![信息資源的描述元數(shù)據(jù)課件_第5頁](http://file4.renrendoc.com/view/5679a1164cc2e966d62c515b2645ee1c/5679a1164cc2e966d62c515b2645ee1c5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
信息資源的描述本節(jié)學(xué)習(xí)目標(biāo)信息資源組織的語言工具SGMLHTMLXML信息資源組織的元數(shù)據(jù)DCMARC信息資源組織的數(shù)據(jù)庫(kù)方法一、信息資源組織的語言工具
信息組織的基本目標(biāo)是對(duì)信息外在特征和內(nèi)容特征加以描述,實(shí)現(xiàn)信息有序化。需要從內(nèi)容、結(jié)構(gòu)和顯示三方面著手。針對(duì)上述三個(gè)要求,提出標(biāo)記語言的方法。其基本思想是給文獻(xiàn)需要加注部分置于不同類型和名稱的標(biāo)簽,這些標(biāo)簽不僅能夠標(biāo)注文獻(xiàn)的內(nèi)容和結(jié)構(gòu)也能標(biāo)注其表現(xiàn)形式。本節(jié)介紹三種標(biāo)記語言:SGML、HTML、XML。1.1SGML
SGML(standardgeneralizedmarkuplanguage)標(biāo)準(zhǔn)通用標(biāo)記語言,是所有電子文檔標(biāo)記語言的起源。
SGML認(rèn)為一個(gè)典型的文檔由結(jié)構(gòu)、內(nèi)容和樣式三部分組成。文獻(xiàn)類型定義DTD為組織文檔的元素提供一個(gè)框架。
SGML的缺點(diǎn):SGML龐大復(fù)雜的選項(xiàng)雖然使其有較高的靈活性,但是導(dǎo)致應(yīng)用程序開發(fā)困難;SGML文件不易在Web上傳播,全面實(shí)現(xiàn)瀏覽器非常困難;廠商不支持。1.2HTML
HTML(hypertextmarkuplanguage)超文本標(biāo)記語言,簡(jiǎn)單易用,提供一種文本結(jié)構(gòu)和格式,使其在瀏覽器上呈現(xiàn)給訪問的用戶,它是Web上的通用語言。
HTML的主要功能為:發(fā)布信息:出版聯(lián)網(wǎng)文檔,向全世界發(fā)布信息;獲取信息:通過超鏈接檢索和獲取信息;交流信息:設(shè)計(jì)交易單(form),實(shí)現(xiàn)交互,方便及時(shí)交流信息。HTML的基本結(jié)構(gòu)<html>//文件開始標(biāo)記<head>//文件的頭部開始標(biāo)記
<title>HTML</title>//頭部</head>//頭部結(jié)束標(biāo)記<body>//文件的主體開始標(biāo)記
Hello,HTML!</body>//主體結(jié)束標(biāo)記</html>//文件結(jié)束標(biāo)記實(shí)例1.3XML
XML(ExtensibleMarkupLanguage)即可擴(kuò)展標(biāo)記語言,XML是一種簡(jiǎn)單的數(shù)據(jù)存儲(chǔ)語言,使用一系列簡(jiǎn)單的標(biāo)記描述數(shù)據(jù),而這些標(biāo)記可以用方便的方式建立,極其簡(jiǎn)單易于掌握和使用。
XML與HTML的設(shè)計(jì)區(qū)別是:XML是用來存儲(chǔ)數(shù)據(jù)的,重在數(shù)據(jù)本身。而HTML是用來定義數(shù)據(jù)的,重在數(shù)據(jù)的顯示模式。
XML的特點(diǎn):靈活性與簡(jiǎn)潔性;開放性與可擴(kuò)展性、實(shí)用性和高效性。
XML主要應(yīng)用:多媒體信息處理、科學(xué)研究、電子商務(wù)、數(shù)字圖書館等。XML和HTML的不同可以歸納為3點(diǎn):
XML擴(kuò)展性比HTML強(qiáng)
XML可以創(chuàng)建個(gè)性化的標(biāo)記語言,可以提供更多的數(shù)據(jù)操作,HTML只能局限于按一定的格式在終端顯示出來。
XML的語法比HTML嚴(yán)格由于XML的擴(kuò)展性強(qiáng),它需要穩(wěn)定的基礎(chǔ)規(guī)則來支持?jǐn)U展。它的嚴(yán)格規(guī)則為:
1、起始和結(jié)束的標(biāo)簽相匹配
2、嵌套標(biāo)簽不能相互嵌套
3、區(qū)分大小寫
XML與HTML互補(bǔ)在現(xiàn)階段,XML可以轉(zhuǎn)化成相應(yīng)的HTML,來適應(yīng)當(dāng)前瀏覽器的需求。XML文檔結(jié)構(gòu)<?xmlversion="1.0"encoding="UTF-8"standalone="yes"?><mytag>Hi,XML!</mytag>versionXML文檔所使用的版本encoding指明XML文檔編碼使用的字符集standalone指明XML文檔有沒有使用外部標(biāo)記聲明,yes表明是一個(gè)獨(dú)立文檔,no表明在其內(nèi)部使用了其他文檔或資源。實(shí)例二、信息資源描述2.1信息資源描述信息資源描述(Informationdescription)是根據(jù)信息資源組織和檢索的需要,依據(jù)一定的規(guī)則和標(biāo)準(zhǔn),對(duì)信息資源的主題內(nèi)容、形式特征、物質(zhì)形態(tài)等進(jìn)行分析、選擇、記錄的活動(dòng)。
信息資源描述的結(jié)果是一條有關(guān)該信息資源的書目數(shù)據(jù)記錄,由若干信息描述項(xiàng)組成。信息記錄也稱為元數(shù)據(jù)(Metadata)。信息資源描述實(shí)質(zhì)上是一個(gè)按照一定規(guī)則分析和選擇數(shù)據(jù)的過程。2.2元數(shù)據(jù)元數(shù)據(jù)(Metadata)是描述數(shù)據(jù)的數(shù)據(jù)(datathatdescribesdata)或關(guān)于數(shù)據(jù)的數(shù)據(jù)(dataaboutdata)。它是促進(jìn)數(shù)據(jù)處理和標(biāo)引數(shù)據(jù)的數(shù)據(jù),也是人們組織和發(fā)現(xiàn)信息資源的數(shù)據(jù)。
圖書館書目卡片搜索引擎圖書題名著者出版者分類號(hào)主題詞ISBN號(hào)流水號(hào)館藏號(hào)等資源類型Web頁面標(biāo)題作者主題關(guān)鍵詞內(nèi)容摘要等元數(shù)據(jù)(Metadata)的主要功能如下:描述Internet數(shù)據(jù)內(nèi)容和本質(zhì)特征,存儲(chǔ)相應(yīng)的檢索路徑使Internet數(shù)據(jù)便于發(fā)現(xiàn),提高信息資源的查全率和查準(zhǔn)率提供數(shù)據(jù)之間的關(guān)系,指出相關(guān)數(shù)據(jù)的地址和存取方法對(duì)Internet資源進(jìn)行分類,有效選擇用戶所感興趣的信息。對(duì)某些缺少文本的數(shù)據(jù)(聲音、圖像等)進(jìn)行文字說明,以便對(duì)描述對(duì)象有一個(gè)完整的描述。示例:<HTML><HEAD><TITLE>NationalDigitalLibrary</TITLE><METAname=“detscription”content=“Youcanretrieveanythingyouwanttoknow”><METAname=“keywords”content=“digitalbook,database,pictures,file,films”><METAhttp-equiv="content-type"content="text/html;charset=GB2312"/><METAname=“robots”content=“all”></HEAD></HTML>實(shí)例2.3信息資源描述的規(guī)范信息資源的描述需要根據(jù)檢索系統(tǒng)的要求,確定描述的成分和特征,按一定的次序和形式加以記錄。為了一致、有效地對(duì)信息資源進(jìn)行描述,便于不同機(jī)構(gòu)和信息系統(tǒng)之間信息交換,信息描述需依據(jù)一定的描述規(guī)范進(jìn)行操作。傳統(tǒng)文獻(xiàn)信息資源網(wǎng)絡(luò)信息資源國(guó)際標(biāo)準(zhǔn)書目著錄(ISBD)《文獻(xiàn)著錄總則》(GB3792.1-83)《文后參考文獻(xiàn)著錄規(guī)則》(GB7714-2005)《都柏林核心集》(DublinCore,DC)《政府信息定位服務(wù)》(governmentinformationlocatorservice,GILS)參考文獻(xiàn)[1]林豪慧,孫麗芳.信息資源檢索與利用[M].電子工業(yè)出版社.2008:9[2]王晨.應(yīng)用型本科、高職院校信息檢索課現(xiàn)狀調(diào)查及教學(xué)模式改革[J].教育與職業(yè).2008(5):118-1202.4信息描述項(xiàng)目及符號(hào)由于揭示對(duì)象不同,因而信息描述記錄單元—元數(shù)據(jù)的格式、項(xiàng)目和符號(hào)等也有所不同。產(chǎn)品/商品產(chǎn)品/商品名稱、型號(hào)、規(guī)格、用途、性能、包裝、價(jià)格、生產(chǎn)廠家、聯(lián)系地址等企業(yè)法人代表姓名、企業(yè)名稱、成立日期、職工總數(shù)、固定資產(chǎn)額、廠址、通信聯(lián)絡(luò)途徑、主要產(chǎn)品或經(jīng)營(yíng)范圍、企業(yè)所獲榮譽(yù)及業(yè)績(jī)、近期經(jīng)營(yíng)狀況等科研成果科研成果名稱、主持或完成者、立項(xiàng)時(shí)間、項(xiàng)目來源、完成時(shí)間、成果形式、所達(dá)到的水平、社會(huì)反響等三、信息資源描述的元數(shù)據(jù)3.1都柏林核心元數(shù)據(jù)(DC)
DublinCore(DC)是國(guó)際組織DublinCoreMetadataInitiative擬定的用于標(biāo)識(shí)電子資源的一種簡(jiǎn)要目錄模式。
DC是由15個(gè)Metadata系統(tǒng),其主要目的是為了揭示和組織網(wǎng)絡(luò)上的信息資源(包括文本及圖像等)。
DC元數(shù)據(jù)編輯器http://www.ukoln.ac.uk/metadata/dcdot/
DC元數(shù)據(jù)元素集參考描述如下表所示:元素名字標(biāo)識(shí)定義Title資源名Title賦予資源名稱Creator創(chuàng)建者Creator創(chuàng)建資源內(nèi)容的主要責(zé)任者Subject主題和關(guān)鍵詞Subject資源內(nèi)容的主題描述Description說明Description對(duì)資源內(nèi)容的說明Publisher出版者Publisher使資源成為可以取得和利用狀態(tài)的責(zé)任者Contributor其它責(zé)任者Contributor對(duì)資源內(nèi)容創(chuàng)建做出貢獻(xiàn)的其他責(zé)任者Data日期Data與資源本身生命周期中的一個(gè)事件相關(guān)的日期元素名字標(biāo)識(shí)定義Type類型Type資源內(nèi)容的特征和類型Format形式Format資源的物理或數(shù)字化的表現(xiàn)形式Identifier資源標(biāo)識(shí)符Identifier給定的文本環(huán)境中對(duì)資源的參照引用Source來源Source對(duì)一個(gè)資源的參照,而當(dāng)前資源是源自這一參照資源Language語種Language描述資源知識(shí)內(nèi)容的語種Relation關(guān)聯(lián)Relation對(duì)相關(guān)資源的參照Coverage覆蓋范圍Coverage資源內(nèi)容所涉及的外延與覆蓋范圍Rights權(quán)限管理Rights有關(guān)資源本身所有的或被賦予的權(quán)限信息從DC的15項(xiàng)元數(shù)據(jù)可以看出:15個(gè)元素大致分為三類:對(duì)資源內(nèi)容的描述:題名、主題、描述、來源、語種、關(guān)聯(lián)和覆蓋范圍;對(duì)外部屬性的描述:日期、類型、格式和標(biāo)識(shí);對(duì)知識(shí)產(chǎn)權(quán)的描述:創(chuàng)建者、出版者、責(zé)任者和權(quán)限管理。比較全面地概括了電子資源的主要特征涵蓋了資源的重要檢索點(diǎn)(1、2、3)、輔助檢索點(diǎn)或關(guān)聯(lián)檢索點(diǎn)(5、6、10、11、13)、有價(jià)值的說明性信息(4、7、8、9、12、14、15)。簡(jiǎn)介、規(guī)范,不僅使用于電子文獻(xiàn)目錄,也適用于各類電子化的公務(wù)文檔目錄及產(chǎn)品、商品、藏品目錄等,有很好的使用性。DC用RDF/XML對(duì)圖片的描述/o/p/2010-02-16shtml3.2資源描述框架(RDF)
RDF是資源描述框架(thesourcedescriptionframework)的縮寫。資源是所有Web上被命名的、具有URI(unifiedresourceidentifier,統(tǒng)一資源描述符)的對(duì)象(網(wǎng)頁、XML文檔中的元素等)。描述是對(duì)資源屬性的陳述,表明資源的特性??蚣苁桥c被描述資源無關(guān)的通用模型。
RDF以XML(extensiblemarkuplanguage)語言作為其宿主語法,來推動(dòng)Internet數(shù)據(jù)的開發(fā)。
RDF定義了一種通用的框架,即資源—屬性—值的三元組,來描述Web上的各種資源。示例:<rdf:RDF
xmlns:rdf=“/1999/02/22-synax-ns#”
xmlns:dc=/metadata/dublin-core#
xmlns:dced=/metadata/dced-v1#>第一行:指定rdf命名空間的具體地址第二行:定義DC命名空間的來源的網(wǎng)址第三行:指定都柏林核心教育元數(shù)據(jù)的命名空間地址
為了方便管理交換信息資源,用元數(shù)據(jù)描述Web上的數(shù)據(jù),由于不同元數(shù)據(jù)之間具有不同的結(jié)構(gòu),為了實(shí)現(xiàn)元數(shù)據(jù)之間的可互操作,采用RDF來處理不同類型的元數(shù)據(jù)集合,并使計(jì)算機(jī)可以理解。RDF的建立基于XML,兩者結(jié)合解決了信息建立與信息描述的開放機(jī)制,有利于資源共享,尤其為語義網(wǎng)提供技術(shù)支持。
3.3MARC
MARC(machinereadablecatalogue)是機(jī)器可讀目錄的簡(jiǎn)稱,是一種經(jīng)過人們編輯、組織的數(shù)字化書目記錄的集合。
MARC將傳統(tǒng)的卡片目錄的內(nèi)容以標(biāo)準(zhǔn)數(shù)據(jù)形式記錄在光磁載體上供用戶利用計(jì)算機(jī)等設(shè)備查閱,它主要記載文獻(xiàn)的書目信息和存儲(chǔ)地址,記錄格式統(tǒng)一。具有存儲(chǔ)載體空間小、容量大、復(fù)制速度快、易于收藏和攜帶,并可產(chǎn)生出多類型的卡片式或書本式目錄,便于實(shí)現(xiàn)對(duì)資源的有效管理,在圖書文獻(xiàn)機(jī)構(gòu)中具有相當(dāng)重要的地位。
MARC書目記錄的總體結(jié)構(gòu)定義為記錄頭標(biāo)區(qū)、目次區(qū)、數(shù)據(jù)區(qū)和記錄分隔符四部分。CNMARC格式
CNMARC是中國(guó)機(jī)讀目錄的縮寫,用于中國(guó)國(guó)家書目機(jī)構(gòu)同其他國(guó)家書目機(jī)構(gòu)及中國(guó)國(guó)內(nèi)圖書館與情報(bào)部門之間,以標(biāo)準(zhǔn)的計(jì)算機(jī)可讀形式交換書目信息。
0XX標(biāo)識(shí)塊7XX知識(shí)責(zé)任塊
1XX編碼信息塊8XX國(guó)際使用塊
2XX著錄信息塊9XX國(guó)內(nèi)使用塊
3XX附注塊
4XX款目連接塊
5XX相關(guān)題名塊
6XX主題分析塊
如圖示DC與MARC的比較著錄目的不同DC提供給搜索引擎,MARC為用戶檢索館藏所用著錄對(duì)象不同DC數(shù)字化信息資源,MARC描述實(shí)體的書目數(shù)據(jù)著錄格式不同DC由15個(gè)基本元素組成,有可選擇性,只要確保最低限度的7個(gè)元素,就符合著錄標(biāo)準(zhǔn);MARC遵守標(biāo)準(zhǔn)記錄結(jié)構(gòu),包括頭標(biāo)區(qū)、地址目次區(qū)、數(shù)據(jù)字段區(qū)著錄主體不同DC是一種結(jié)構(gòu)化的元數(shù)據(jù),支持字段查詢,創(chuàng)建者和信息提供者無需培訓(xùn)就能進(jìn)行資源描述;MARC需要專門的計(jì)算機(jī)軟件系統(tǒng),而且要遵循一系列規(guī)定,編制一條記錄
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- Rilmazolam-生命科學(xué)試劑-MCE-2242
- cis-N-Acetyl-S-4-hydroxy-2-buten-1-yl-L-cysteine-d3-生命科學(xué)試劑-MCE-7054
- 3-4-MDPA-hydrochloride-生命科學(xué)試劑-MCE-3492
- 二零二五年度離婚后財(cái)產(chǎn)分割與共同生活費(fèi)用承擔(dān)協(xié)議
- 2025年度養(yǎng)老服務(wù)機(jī)構(gòu)專用房產(chǎn)租賃協(xié)議
- 二零二五年度貨車運(yùn)輸貨物跟蹤與反饋合同
- 2025年度股份占比協(xié)議書模板:知識(shí)產(chǎn)權(quán)入股股份占比協(xié)議書
- 二零二五年度企業(yè)食堂衛(wèi)生安全責(zé)任合同
- 2025年度越野輪車銷售與服務(wù)協(xié)議
- 跨學(xué)科知識(shí)體系的整合與實(shí)踐
- 不老莓行業(yè)分析
- STARCCM基礎(chǔ)培訓(xùn)教程
- 地理標(biāo)志專題通用課件
- 《小英雄雨來》讀書分享會(huì)
- 【人教版】九年級(jí)化學(xué)上冊(cè)全冊(cè)單元測(cè)試卷【1-7單元合集】
- 中央導(dǎo)管相關(guān)血流感染防控
- 混合動(dòng)力汽車發(fā)動(dòng)機(jī)檢測(cè)與維修中職PPT完整全套教學(xué)課件
- 產(chǎn)時(shí)子癇應(yīng)急演練文檔
- 小學(xué)美術(shù)-《神奇的肥皂粉》教學(xué)設(shè)計(jì)學(xué)情分析教材分析課后反思
- 測(cè)量管理體系內(nèi)審檢查表
- 班組月度考核評(píng)分表
評(píng)論
0/150
提交評(píng)論