




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第四講元數(shù)據(jù)9/13/20231信息管理系第四講元數(shù)據(jù)8/1/20231信息管理系元數(shù)據(jù)(MetaData),就是“描述數(shù)據(jù)的數(shù)據(jù)”或“關(guān)于數(shù)據(jù)的結(jié)構(gòu)化數(shù)據(jù)”。哈佛大學(xué)數(shù)字圖書館項目定義:元數(shù)據(jù)是幫助查找、存取、使用和管理信息資源的信息。一、元數(shù)據(jù)概念9/13/20232信息管理系元數(shù)據(jù)(MetaData),就是“描述數(shù)據(jù)的數(shù)具體:元數(shù)據(jù)是用來描述數(shù)據(jù)本身的內(nèi)容特征和其它特征的數(shù)據(jù),目地是加強對網(wǎng)絡(luò)信息資源的發(fā)現(xiàn)、識別、開發(fā)、組織和評價,而且對相關(guān)的信息資源進行選擇、定位、調(diào)用,追蹤資源在使用過程中的變化,實現(xiàn)信息資源的整合、有效管理和長期保存。9/13/20233信息管理系具體:8/1/20233信息管理系例如:文獻信息資源,元數(shù)據(jù)可以是目錄、索引、摘要及主題等文獻特征和屬性。從元數(shù)據(jù)的提供者角度來看,元數(shù)據(jù)能改進針對文檔的檢索能力,特別是搜索的精確度、以及對資源的控制和管理問題。對于電子文檔所存在的格式和控制方法多樣性問題,元數(shù)據(jù)能支持用戶決策過程。9/13/20234信息管理系例如:8/1/20234信息管理系DL信息體系結(jié)構(gòu)9/13/20235信息管理系DL信息體系結(jié)構(gòu)8/1/20235信息管理系元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù)(dataaboutdata),此術(shù)語指任何用于幫助網(wǎng)絡(luò)電子資源的識別、描述和定位的數(shù)據(jù)。元數(shù)據(jù)是關(guān)于數(shù)據(jù)的結(jié)構(gòu)化的數(shù)據(jù)(structureddataaboutdata)。9/13/20236信息管理系8/1/20236信息管理系元數(shù)據(jù)是與對象相關(guān)的數(shù)據(jù),此數(shù)據(jù)使其潛在的用戶不必預(yù)先具備對這些對象的存在或特征的完整認識。元數(shù)據(jù)是對信息包(Informationpackage)的編碼描述,其目的在于提供一個中間級別的描述,使得人們據(jù)此就可以做出選擇而無需檢索大量不相關(guān)的全文文本。9/13/20237信息管理系元數(shù)據(jù)是與對象相關(guān)的數(shù)據(jù),此數(shù)據(jù)使其潛在的用戶不必預(yù)先具備對?元數(shù)據(jù),即代表性的數(shù)據(jù),通常被定義為數(shù)據(jù)之數(shù)據(jù)。它包含用于描述信息對象的內(nèi)容和位置的數(shù)據(jù)元素集,促進了網(wǎng)絡(luò)環(huán)境中信息對象的發(fā)展和檢索。9/13/20238信息管理系?元數(shù)據(jù),即代表性的數(shù)據(jù),通常被定義為數(shù)據(jù)之數(shù)據(jù)。它包含用于應(yīng)用于不同領(lǐng)域的Metadata格式
網(wǎng)絡(luò)資源:DublicCore、ROADSTemplate、CDF(ChannelDefinitionFormat)、WebCollections文獻資料:MARC(with856Field),DublicCore人文科學(xué):TEIHeader(TextEncodingInitiativeHeader)社會科學(xué)數(shù)據(jù)集:ICPSRSGMLCodebook(Inter-universityConsortiumforPoliticalandSocialResearch)博物館與藝術(shù)作品:CIMI(ComputerInterchangeofMuseumInformation)、CDWA(CategoriesfortheDescriptionofWorksofArts)、RLGREACHElementSet.9/13/20239信息管理系應(yīng)用于不同領(lǐng)域的Metadata格式8/1/20239信息視覺資料:VRA(VisualResourcesAssociation)CoreCategoriesforVisualResources音樂資料:SMDL(StandardMusicDescriptionLanguage)政府信息:GILS(GovernmentInformationLocatorService)地理空間信息:FGDC/CSDGM(FederalGeographicDataCommittee/ContentStandardsforDigitalGeospatialMetadata)9/13/202310信息管理系視覺資料:VRA(VisualResourcesAss數(shù)字圖像:MOA2metadata、CDLmetadata、OpenArchivesFormat、VRACore、NISO/CLIR/RLGTechnicalMetadataforImages檔案庫與資源集合:EAD(EncodingArchivalDescription)技術(shù)報告:RFC1807:AformatforBibliographicRecordsFTP文件和FTP文件庫:IAFATemplates(InternetAnonymousFTPArchivesTemplates)連續(xù)圖像:MPEG-79/13/202311信息管理系數(shù)字圖像:MOA2metadata、CDLmetadata二、元數(shù)據(jù)的目的9/13/202312信息管理系二、元數(shù)據(jù)的目的8/1/202312信息管理系9/13/202313信息管理系8/1/202313信息管理系9/13/202314信息管理系8/1/202314信息管理系9/13/202315信息管理系8/1/202315信息管理系三、元數(shù)據(jù)結(jié)構(gòu)9/13/202316信息管理系三、元數(shù)據(jù)結(jié)構(gòu)8/1/202316信息管理系9/13/202317信息管理系8/1/202317信息管理系9/13/202318信息管理系8/1/202318信息管理系9/13/202319信息管理系8/1/202319信息管理系9/13/202320信息管理系8/1/202320信息管理系3語義結(jié)構(gòu):9/13/202321信息管理系3語義結(jié)構(gòu):8/1/202321信息管理系9/13/202322信息管理系8/1/202322信息管理系9/13/202323信息管理系8/1/202323信息管理系9/13/202324信息管理系8/1/202324信息管理系9/13/202325信息管理系8/1/202325信息管理系9/13/202326信息管理系8/1/202326信息管理系9/13/202327信息管理系8/1/202327信息管理系9/13/202328信息管理系8/1/202328信息管理系9/13/202329信息管理系8/1/202329信息管理系資源描述框架(ResourceDescriptionFramework)數(shù)據(jù)描述模式而且采用基于XML的句法提供語義、結(jié)構(gòu)、句法三個層次的互操作能力模塊化的互操作能力有些數(shù)據(jù)化信息需要不同的元數(shù)據(jù)描述,RDF對集成這些元數(shù)據(jù)非常有用。四、元數(shù)據(jù)描述框架RDF9/13/202330信息管理系資源描述框架(ResourceDescriptionFrRDF是一個與任何特定語法無關(guān)的抽象的資源表達模式,用來反映資源(Resource)、屬性(Property)與屬性值(Value)資源resource屬性property屬性值value語句statement9/13/202331信息管理系RDF是一個與任何特定語法無關(guān)的抽象的資源表達模式,用來反映換言之…“張三是由以下網(wǎng)址所標識的資源的作者:/tsgzz/99-3/p22.htm”/tsgzz/99-3/p22.htm作者author張三9/13/202332信息管理系換言之…/ts/tsgzz/99-3/p22.htm作者author張三<rdf:RDF><rdf:Descriptionabout=”/tsgzz/99-3/p22.htm”><作者>張三</作者></rdf:Description></rdf:RDF>RDF基于XML的描述實例:RDF描述實例9/13/202333信息管理系/tsgzz//tsgzz/99-3/p22.htmDC:Creator張三DublinCore基于RDF的描述:<rdf:RDFxmlns:rdf="/1999/02/22-rdf-syntax-ns#"xmlns:dc="/dc/elements/1.0/">
<rdf:Descriptionabout=”/tsgzz/99-3/p22.htm”><dc:Creator>張三</dc:Creator></rdf:Description></rdf:RDF>基于RDF的DC描述實例9/13/202334信息管理系/tsgzz/1)/1999/02/22-rdf-syntax-ns#RDF標準申明2)dc="/dc/elements/1.0/DC標準申明Notes:9/13/202335信息管理系1)/1999/02/22五、元數(shù)據(jù)種類由于網(wǎng)上數(shù)字資源的形態(tài)各異,既有論文、會議錄等普通電子文本,也有圖像、聲音、網(wǎng)頁等,不同形式的數(shù)字資源對數(shù)據(jù)格式的要求也不一樣,因此現(xiàn)在有多種描述網(wǎng)絡(luò)數(shù)字資源的元數(shù)據(jù)格式,到目前為止還沒有出現(xiàn)成熟的統(tǒng)一格式。
兩種:Marc、DC9/13/202336信息管理系五、元數(shù)據(jù)種類由于網(wǎng)上數(shù)字資源的形態(tài)各異,既有論文、1MARC(Machine-ReadableCatalogue)元數(shù)據(jù)
機讀目錄格式MARC是圖書情報領(lǐng)域廣泛應(yīng)用的標準格式,國際通用的MARC標準為USMARC和UNIMARC標準。我國的MARC標準(CNMARC)是在UNIMARC標準的基礎(chǔ)上加以補充規(guī)定形成的。由于多語種圖書文獻的存在,目前我國的機讀書目數(shù)據(jù)實際上是以CNMARC和US-MARC為主,其他MARC格式為輔的現(xiàn)狀。9/13/202337信息管理系1MARC(Machine-ReadableCataloMARC格式可由四個部分組成,其中記錄頭標區(qū)固定為24個字符長,為記錄處理提供基本參數(shù)。地址目次區(qū)由若干目次項組成,每個目次項為定長12個字符,標識某MARC字段在整個MARC流中的位置。數(shù)據(jù)字段區(qū)由一些可變長的數(shù)據(jù)字段組成,除了001字段和005字段由數(shù)據(jù)和一個字段分隔符組成外,其余每個字段都有兩個指示符,后接若干子字段。9/13/202338信息管理系MARC格式可由四個部分組成,8/1/202338信息管整個MARC數(shù)據(jù)流經(jīng)檢測有效才能成為書目數(shù)據(jù)庫的正式書目數(shù)據(jù)。MARC元數(shù)據(jù)格式——主要用于描述圖書文獻資源。9/13/202339信息管理系整個MARC數(shù)據(jù)流經(jīng)檢測有效才能成為書目數(shù)據(jù)庫的正式書目數(shù)MARC局限性:
(1)MARC描述手段往往只適用于圖書館;(2)MARC需要在專門的軟件系統(tǒng)中使用,而且不太適應(yīng)互聯(lián)網(wǎng)的環(huán)境;(3)修訂程序相當復(fù)雜,而且非常緩慢;(4)適用于完整的、靜止的信息內(nèi)容的處理,不易處理動態(tài)的多媒體信息;(5)編制一條機讀目錄不僅需要經(jīng)過嚴格的專門訓(xùn)練,而且需要花一定的時間。9/13/202340信息管理系MARC局限性:8/1/202340信息管理系
2、DC元數(shù)據(jù)簡介
1995年3月,在美國俄亥俄州的都柏林召開的第一屆元數(shù)據(jù)研討會上,52位來自圖書館界、電腦網(wǎng)絡(luò)界專家共同研究產(chǎn)生。目的是希望建立一套描述網(wǎng)絡(luò)電子文獻的方法,以便網(wǎng)上信息檢索。其中心議題是如何用一個簡單的元數(shù)據(jù)記錄來描述種類繁多的電子資源,使非圖書館專業(yè)人員都能夠了解和使用著錄格式,來描述網(wǎng)上資源。經(jīng)過與會代表的商討和辯論,產(chǎn)生了一個精簡的元數(shù)據(jù)集——都柏林核心元素集(DublinCoreElementSet),簡稱都柏林核心(DC)。
9/13/202341信息管理系2、DC元數(shù)據(jù)簡介8/1/202341信息管理系DC由15個基本元素構(gòu)成。由于它具有簡練、易于理解、可擴展、能與其他元數(shù)據(jù)形式進行橋接等性能,能較好地解決網(wǎng)絡(luò)資源的發(fā)現(xiàn)、控制和管理問題,使它成為一個較好的網(wǎng)絡(luò)資源描述元數(shù)據(jù)集,已經(jīng)成為美國國家標準,并正在逐步成為世界公認的標準。9/13/202342信息管理系DC由15個基本元素構(gòu)成。由于它具有簡練、易于理解DC產(chǎn)生與發(fā)展屆次舉辦時間主辦國舉辦地主辦組織DC-11995.3美國Dublin,OhioOCLC、NCSADC-21996.4英國WarwickOCLC、UKOLNDC-31996.9美國Dublin,OhioOCLC、CNIDC-41997.3澳大利亞CanberraOCLC、DSTC、NLADC-51997.10芬蘭HelsinkiOCLC、NLFDC-61998.11美國WashingtonD.C.OCLC、TLCDC-71999.10德國FrankfurtOCLCDC-82000.10加拿大OttawaOCLC、CNI、IFLADC-92001.10日本TokyoOCLC、NII、JSTDC20022002.10意大利FlorenceOCLCDC20032003.9美國西雅圖OCLC9/13/202343信息管理系DC產(chǎn)生與發(fā)展屆次舉辦時間主辦國舉辦地主辦組織DC-11991)、DC元數(shù)據(jù)的類型9/13/202344信息管理系1)、DC元數(shù)據(jù)的類型8/1/202344信息管理系2)詳細描述9/13/202345信息管理系2)詳細描述8/1/202345信息管理系9/13/202346信息管理系8/1/202346信息管理系9/13/202347信息管理系8/1/202347信息管理系9/13/202348信息管理系8/1/202348信息管理系9/13/202349信息管理系8/1/202349信息管理系9/13/202350信息管理系8/1/202350信息管理系9/13/202351信息管理系8/1/202351信息管理系9/13/202352信息管理系8/1/202352信息管理系3)DC修飾詞(分為兩類):(1)元素的進一步限制該類修飾詞使元素的含義更為狹窄或?qū)V?進一步限定的元素繼承了未限定元素的外延,便具有更為嚴格的內(nèi)涵。如果使用者不明白經(jīng)過進一步限定的術(shù)語的特指含義,可以忽略修飾詞,直接將它作為未修飾的元數(shù)據(jù)元素來理解。用于修飾元素的進一步限定的定義應(yīng)該可以方便的得到。9/13/202353信息管理系3)DC修飾詞(分為兩類):8/1/202353信息管理系元素限定屬性說明TitleAlternative替代標題Creater暫無限制屬性9/13/202354信息管理系元素限定屬性說9/13/202355信息管理系8/1/202355信息管理系元素限定屬性說明SubjectLCSH國會圖書館主題詞表*MeSH國家醫(yī)學(xué)圖書館主題詞表*DDC杜威十進分類表*LCC國會圖書館分類表*UDC國際十進分類表*9/13/202356信息管理系元素限定屬性說明9/13/202357信息管理系8/1/202357信息管理系元素限定屬性說明DescriptiontableOfContents目次Abstract文摘Publisher暫無限制屬性9/13/202358信息管理系元素限定屬性9/13/202359信息管理系8/1/202359信息管理系9/13/202360信息管理系8/1/202360信息管理系9/13/202361信息管理系8/1/202361信息管理系9/13/202362信息管理系8/1/202362信息管理系元素限定屬性說明Contributor暫無限制詞DateCreated制作日期Valid有效日期Available可獲得日期Issued發(fā)表日期Modified修改日期DCMIPeriodDCMI日期編碼*W3C-DTFW3C-DTF日期編碼*9/13/202363信息管理系元素限定屬性9/13/202364信息管理系8/1/202364信息管理系元素限定屬性說明TypeDCMITypeDCMI資源類別編碼*9/13/202365信息管理系元素限定屬性9/13/202366信息管理系8/1/202366信息管理系元素限定屬性說明FormatExtent資源范圍Medium物理載體IMTinternet資源格式*9/13/202367信息管理系元素限定屬性9/13/202368信息管理系8/1/202368信息管理系9/13/202369信息管理系8/1/202369信息管理系9/13/202370信息管理系8/1/202370信息管理系9/13/202371信息管理系8/1/202371信息管理系9/13/202372信息管理系8/1/202372信息管理系9/13/202373信息管理系8/1/202373信息管理系9/13/202374信息管理系8/1/202374信息管理系元素限定屬性說明IdentifierURI資源唯一標識符號*9/13/202375信息管理系元素限定屬性9/13/202376信息管理系8/1/202376信息管理系9/13/202377信息管理系8/1/202377信息管理系元素限定屬性說明Source暫無限制詞LanguageISO639-2ISO639-2語種代碼*RFC1766RFC1766語種代碼*9/13/202378信息管理系元素限定屬性9/13/202379信息管理系8/1/202379信息管理系9/13/202380信息管理系8/1/202380信息管理系元素限定屬性說明RelationIsVersionOf是另一種資源的一個版本HasVersion有其他資源作為其他版本IsreplacedBy被另一資源取代RePlaces取代另一資源IsRequiredBy被另一資源所需要Requires需要一資源IsPartOf是另一資源的一部分HasPart有另一資源作為一部分IsReferencedBy被另一資源所參見9/13/202381信息管理系元素限定屬性說元素限定屬性說明RelationReferences參見另一資源IsFormatOf是另一資源的另一格式HasFormat有另外格式URI使用URI描述關(guān)聯(lián)資源*9/13/202382信息管理系元素限定屬性說9/13/202383信息管理系8/1/202383信息管理系9/13/202384信息管理系8/1/202384信息管理系9/13/202385信息管理系8/1/202385信息管理系9/13/202386信息管理系8/1/202386信息管理系9/13/202387信息管理系8/1/202387信息管理系9/13/202388信息管理系8/1/202388信息管理系9/13/202389信息管理系8/1/202389信息管理系9/13/202390信息管理系8/1/202390信息管理系9/13/202391信息管理系8/1/202391信息管理系9/13/202392信息管理系8/1/202392信息管理系9/13/202393信息管理系8/1/202393信息管理系9/13/202394信息管理系8/1/202394信息管理系9/13/202395信息管理系8/1/202395信息管理系9/13/202396信息管理系8/1/202396信息管理系9/13/202397信息管理系8/1/202397信息管理系9/13/202398信息管理系8/1/202398信息管理系9/13/202399信息管理系8/1/202399信息管理系9/13/2023100信息管理系8/1/2023100信息管理系9/13/2023101信息管理系8/1/2023101信息管理系9/13/2023102信息管理系8/1/2023102信息管理系9/13/2023103信息管理系8/1/2023103信息管理系9/13/2023104信息管理系8/1/2023104信息管理系9/13/2023105信息管理系8/1/2023105信息管理系9/13/2023106信息管理系8/1/2023106信息管理系元素限定屬性說明Rights暫無限制詞9/13/2023107信息管理系元素限定屬性元素限定屬性說明CoverageSpatial空間范圍DCMIPointDCMI空間坐標系統(tǒng)*ISO3166ISO3166國家名稱代碼*DCMIBoxDCMI地理區(qū)限描述體系*TGNGetty地理名稱敘詞表*temporal時間范圍DCMIPeriodDCMI時期體系*W3C-DTFW3C-DTF時間編碼體系*9/13/2023108信息管理系元素限定屬性說9/13/2023109信息管理系8/1/2023109信息管理系9/13/2023110信息管理系8/1/2023110信息管理系9/13/2023111信息管理系8/1/2023111信息管理系9/13/2023112信息管理系8/1/2023112信息管理系9/13/2023113信息管理系8/1/2023113信息管理系(2)編碼體系該類修飾詞說明元素值所屬的編碼體系,以幫助理解值的含義。采用來自控制詞表的表征符號(例如分類法主題詞標中的術(shù)語)具有特定意義,或以一定形式組成的字符串表示正規(guī)的符號。如果一種編碼體系無法被客戶機或代理所理解,它的值仍能被人類所理解。用于修飾的編碼體系必須有清晰明確的說明,并能夠方便的得到.9/13/2023114信息管理系(2)編碼體系8/1/2023114信息管理系DCMI自己的編碼規(guī)則:9/13/2023115信息管理系DCMI自己的編碼規(guī)則:8/1/2023115信息管理系9/13/2023116信息管理系8/1/2023116信息管理系9/13/2023117信息管理系8/1/2023117信息管理系9/13/2023118信息管理系8/1/2023118信息管理系9/13/2023119信息管理系8/1/2023119信息管理系4)、DC的作用是:
(1)支持簡單而含有信息量的元數(shù)據(jù),以滿足廣大用戶和群體的需要。(2)提供一個共享語義學(xué)標準,使得用各種不同規(guī)則編目的元數(shù)據(jù)可以直接交換。9/13/2023120信息管理系4)、DC的作用是:8/1/2023120信息管理系1)簡單性。DC是非專業(yè)層面提出來的,其目的是為網(wǎng)頁制作者提供一種網(wǎng)絡(luò)信息的著錄格式,以供用戶查找與定位所需信息。與傳統(tǒng)的目錄卡片及MARC格式相比,DC簡單。2)靈活性。DC的每一著錄項目都是可以選擇的,也是可以重復(fù)的。網(wǎng)絡(luò)制作人員可以根據(jù)網(wǎng)頁的內(nèi)容與特征選擇需要項目,允許不同專業(yè)團體根據(jù)專業(yè)要求對其進行調(diào)整。5)DC特點:9/13/2023121信息管理系1)簡單性。5)DC特點:8/1/2023121信息管理系3)擴展性。DC的整個框架是可以擴展的,每個標記元素均可重復(fù)使用或有選擇地使用。允許
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 撫州新課標小學(xué)數(shù)學(xué)試卷
- 福州高三中考數(shù)學(xué)試卷
- 甘肅中考二模數(shù)學(xué)試卷
- 高一導(dǎo)學(xué)案數(shù)學(xué)試卷
- 德州八年級期末數(shù)學(xué)試卷
- 高考不同組合的數(shù)學(xué)試卷
- 高中廣東小高考數(shù)學(xué)試卷
- 2025年05月南昌大學(xué)第二附屬醫(yī)院高層次人才招聘142人筆試歷年專業(yè)考點(難、易錯點)附帶答案詳解
- 2025年05月2025內(nèi)蒙古赤峰市阿魯科爾沁旗衛(wèi)生健康系統(tǒng)招聘擬聘用人員筆試歷年專業(yè)考點(難、易錯點)附帶答案詳解
- 2025至2030池塘撇油機行業(yè)市場深度研究與戰(zhàn)略咨詢分析報告
- 中國古代文學(xué)史(全套)課件
- 普通高考考生戶籍情況審查登記表
- 暴力恐怖襲擊事件
- 金屬纏繞墊(1002)要點課件
- 局限期小細胞肺癌放療進展課件
- 教師情緒和壓力疏導(dǎo)課件
- 駐足思考201305講解
- 打印機租賃項目實施方案
- 法律顧問服務(wù)公開招標評分表
- 聚氨酯發(fā)泡膠MSDS
- 2022年《國際貿(mào)易地理》課程教案
評論
0/150
提交評論