元數(shù)據(jù)與科學(xué)數(shù)據(jù)信息的組織及管理_第1頁
元數(shù)據(jù)與科學(xué)數(shù)據(jù)信息的組織及管理_第2頁
元數(shù)據(jù)與科學(xué)數(shù)據(jù)信息的組織及管理_第3頁
元數(shù)據(jù)與科學(xué)數(shù)據(jù)信息的組織及管理_第4頁
元數(shù)據(jù)與科學(xué)數(shù)據(jù)信息的組織及管理_第5頁
已閱讀5頁,還剩21頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

元數(shù)據(jù)與科學(xué)數(shù)據(jù)信息的組織和管理秦健美國雪城大學(xué)信息研究學(xué)院2004年數(shù)字圖書館前沿問題高級研討班2023/3/291ADL2004深圳提要科學(xué)數(shù)據(jù)信息資源的范圍美國政府和民間利用元數(shù)據(jù)管理利用科學(xué)數(shù)據(jù)信息的做法科學(xué)數(shù)據(jù)信息元數(shù)據(jù)的標(biāo)準(zhǔn)下一步的計劃2023/3/292ADL2004深圳背景(1)伴隨計算技術(shù)的發(fā)展產(chǎn)生了大量的科學(xué)觀察和模擬數(shù)據(jù)專門學(xué)科領(lǐng)域的數(shù)據(jù)量以tensofterabytes計,許多學(xué)科正在計劃建造更大的數(shù)據(jù)庫用于組織這些數(shù)據(jù)的概念及相關(guān)關(guān)系復(fù)雜性增加從這些數(shù)據(jù)庫中抽取知識無異于一個巨大的挑戰(zhàn),必須動用最強的系統(tǒng)來應(yīng)付這樣的挑戰(zhàn)2023/3/293ADL2004深圳背景(2)數(shù)字化圖書館、數(shù)據(jù)網(wǎng)格(datagrids),及永久性檔案一體化的發(fā)展國會圖書館國家數(shù)字化信息基礎(chǔ)和保護計劃(LibraryofCongressNationalDigitalInformationInfrastructureandPreservationProgram)國家檔案紀(jì)錄管理局以數(shù)據(jù)格為基礎(chǔ)的永久性檔案樣品利用數(shù)據(jù)網(wǎng)格建立國家科學(xué)基金會科學(xué)數(shù)字化圖書館知識之間相互關(guān)系的產(chǎn)生、管理、及檢索是信息技術(shù)面臨的主要挑戰(zhàn)Next2023/3/294ADL2004深圳TheBIRNdatagridBack2023/3/295ADL2004深圳科學(xué)數(shù)據(jù)信息資源的范圍觀察模擬數(shù)據(jù)Observationandsimulationdata分類術(shù)語表Taxonomies數(shù)學(xué)表達式Mathematicalexpressions分子、化學(xué)、基因表達式Molecular,chemical,andgenomicexpressions結(jié)構(gòu)、物理、計算模型Structural,physicalandcomputationalmodels表格、圖形、圖表、地圖、圖片Tables,graphs,charts,mapsandimages實地與試驗筆記Fieldandlaboratorynotebooks圖書及其它學(xué)術(shù)文獻Monographsandotherscholarlydocuments述評Criticalreviewsanddiscourse實用分類系統(tǒng)Ontologies學(xué)術(shù)文獻參考目錄Bibliographicreferencestoscholarlyliterature2023/3/296ADL2004深圳美國政府和民間利用元數(shù)據(jù)

管理利用科學(xué)數(shù)據(jù)信息的做法(1)醞釀(1992-1994):政府機構(gòu)牽頭制定標(biāo)準(zhǔn)開發(fā)(1995-1998):研究實施對策將標(biāo)準(zhǔn)草案推出,發(fā)動公眾對標(biāo)準(zhǔn)草案提修改意見標(biāo)準(zhǔn)定稿,編制標(biāo)準(zhǔn)使用指南整合服務(wù)(1999-現(xiàn)在)通過建立元數(shù)據(jù)通道,整合分散的科學(xué)數(shù)據(jù)信息利用新的信息技術(shù)研究深層次組織科學(xué)數(shù)據(jù)信息提供服務(wù)的方法2023/3/297ADL2004深圳美國政府和民間利用元數(shù)據(jù)

管理利用科學(xué)數(shù)據(jù)信息的做法(2)整合服務(wù)(續(xù))具體過程:建立跨政府部門的聯(lián)合委員會(CENDI)委員會下設(shè)兩個關(guān)鍵的研究組:核心政策組與技術(shù)設(shè)計組在目標(biāo)、政策、和設(shè)計方面取得一致意見為瀏覽建立分類類目選取、編目、索引政府各部門的資源聯(lián)合委員會與政府有關(guān)的項目(如)掛鉤2002年春天試運轉(zhuǎn)2002年12月正式運行:

2023/3/298ADL2004深圳美聯(lián)邦科學(xué)聯(lián)盟成員農(nóng)業(yè)部商業(yè)部國防部教育部能源部公共衛(wèi)生部內(nèi)務(wù)部環(huán)境保護局國家航空航天部國家科學(xué)基金會

由CENDI支持協(xié)調(diào)2023/3/299ADL2004深圳目標(biāo)為從事科學(xué)工作的公民,包括專業(yè)科學(xué)人員、學(xué)生、教師、工商業(yè)人士、及任何對科學(xué)有興趣的公眾,提供跨部門的檢索通道來查找和使用經(jīng)過選取的權(quán)威性的美國政府有關(guān)科學(xué)技術(shù)的信息資源。2023/3/2910ADL2004深圳美聯(lián)邦科學(xué)聯(lián)盟元數(shù)據(jù)通道(1)該元數(shù)據(jù)整合中心集結(jié)了各個學(xué)科領(lǐng)域的數(shù)據(jù)庫,用戶發(fā)一個檢索指令,可以同時檢索分布于全美國的科學(xué)數(shù)據(jù)信息2023/3/2911ADL2004深圳美聯(lián)邦科學(xué)聯(lián)盟元數(shù)據(jù)通道(2)檢索過程的界面:2023/3/2912ADL2004深圳美聯(lián)邦科學(xué)聯(lián)盟的信息資源最主要的特點是信息的來源和權(quán)威性所收集的信息是有各部門的信息管理人員或圖書館員選取,而不是像商業(yè)網(wǎng)站的自動收集信息內(nèi)容都產(chǎn)生于政府資助的研究開發(fā)項目或類似的有美國政府投入的活動各部門負(fù)責(zé)對聯(lián)邦科學(xué)聯(lián)盟中屬于本部門的信息內(nèi)容進行更新2023/3/2913ADL2004深圳科學(xué)數(shù)據(jù)信息元數(shù)據(jù)的標(biāo)準(zhǔn)(1)BiologicalDataProfileEcologicalMetadataLanguage(EML)ContentStandardforDigitalGeospatialMetadata(CSDGM):Governmentstandardforgeospatialmetadata/metadata/contstan.htmlGeographyMarkupLanguage,v2.0/gml/01-029/GML2.htmlNeesML(NetworkforEarthquakeEngineeringSimulationMetadataLanguage)/repository/index.html2023/3/2914ADL2004深圳科學(xué)數(shù)據(jù)信息元數(shù)據(jù)的標(biāo)準(zhǔn)(2)BiologicalDataProfile所有元素分成七大類:標(biāo)識(Identification)數(shù)據(jù)質(zhì)量(Dataquality)空間數(shù)據(jù)組織(Spatialdataorganization)空間參照(Spatialreference)實體和特性信息(Entityandattributeinformation)發(fā)行(Distribution)元數(shù)據(jù)參考信息(Metadatareference)2023/3/2915ADL2004深圳科學(xué)數(shù)據(jù)信息元數(shù)據(jù)的標(biāo)準(zhǔn)(3)1.1 引用文獻信息1.2 描述(文摘、目的、補充信息)1.3 內(nèi)容所涉及的時間1.4 狀態(tài)(進展、維護及更新1.5 空間地理數(shù)據(jù)1.6 關(guān)鍵詞(主題、地點、層次、時間)1.7 檢索限制1.8 使用限制1.9 聯(lián)系信息1.10 圖片瀏覽1.11 數(shù)據(jù)集制作單位或人員1.12 安全信息1.13 原始數(shù)據(jù)集環(huán)境1.14 交叉參照1.15 分析工具(分析工具描述、工具檢索信息、工具聯(lián)系信息、工具有關(guān)文獻)標(biāo)識(Identification)類下的主要子類:2023/3/2916ADL2004深圳科學(xué)數(shù)據(jù)信息元數(shù)據(jù)的標(biāo)準(zhǔn)(4)關(guān)鍵詞是標(biāo)識類的一個子類,共分主題、地點、層次、時間四大塊。主題時間層次地點2023/3/2917ADL2004深圳科學(xué)數(shù)據(jù)信息元數(shù)據(jù)的標(biāo)準(zhǔn)(5)2.1 特性準(zhǔn)確性(特性準(zhǔn)確性報告、計量特性準(zhǔn)確性評估)2.2 邏輯一致性報告2.3 完整性報告2.4 位置精確性(橫向位置精確性報告、縱向位置精確性報告)2.5 數(shù)據(jù)獲取方法及有關(guān)文獻(方法、來源、過程步驟)數(shù)據(jù)質(zhì)量信息(Dataquality)2023/3/2918ADL2004深圳科學(xué)數(shù)據(jù)信息元數(shù)據(jù)的標(biāo)準(zhǔn)(6)5.1 詳細(xì)描述(特性名稱、定義、定義來源,特性允許值范圍、特性允許值的起始日期和終止日期、特性值的精確性信息)

5.2 綜述性的描述(實體和特性綜述、實體和特性細(xì)節(jié)的相關(guān)文獻)實體和特性信息(Entityandattributeinformation)2023/3/2919ADL2004深圳科學(xué)數(shù)據(jù)信息元數(shù)據(jù)的標(biāo)準(zhǔn)(7)6.1 發(fā)行者6.2 資源描述6.3 發(fā)行責(zé)任6.4 標(biāo)準(zhǔn)訂購過程(電子傳送信息、電子傳送方法、收費、定購須知、所需時間)6.5 特別訂購過程6.6 技術(shù)要求6.7 可訂購時間信息發(fā)行信息(Distributioninformation)2023/3/2920ADL2004深圳科學(xué)數(shù)據(jù)信息元數(shù)據(jù)的標(biāo)準(zhǔn)(8)7.1 元數(shù)據(jù)日期7.2 元數(shù)據(jù)復(fù)核日期7.3 元數(shù)據(jù)未來復(fù)核日期7.4 元數(shù)據(jù)聯(lián)系信息7.5 元數(shù)據(jù)標(biāo)準(zhǔn)名7.6 元數(shù)據(jù)標(biāo)準(zhǔn)版本7.7 元數(shù)據(jù)時間轉(zhuǎn)換7.8 元數(shù)據(jù)檢索限制7.9 元數(shù)據(jù)使用限制7.10 元數(shù)據(jù)安全信息7.11 元數(shù)據(jù)擴展元數(shù)據(jù)參照信息(MetadataReferenceInformation)2023/3/2921ADL2004深圳部分BiologicalDataProfile元素<!ELEMENTmetadata(idinfo,dataqual?,spdoinfo?,spref?,eainfo?,distinfo*,metainfo)><!ELEMENTidinfo(citation,descript,timeperd,status,spdom?,keywords,taxonomy?,accconst,useconst,ptcontac?,browse*,datacred?,secinfo?,native?,crossref*,tool*)><!ELEMENTcitation(citeinfo)><!ELEMENTdescript(abstract,purpose,supplinf?)><!ELEMENTtimeperd(timeinfo,current)><!ELEMENTstatus(progress,update)><!ELEMENTspdom(descgeog,bounding,dsgpoly*)><!ELEMENTbounding(westbc,eastbc,northbc,southbc,boundalt?)><!ELEMENTdsgpoly(dsgpolyo,dsgpolyx*)><!ELEMENTdsgpolyo((grngpoin,grngpoin,grngpoin,grngpoin+)|gring)><!ELEMENTdsgpolyx((grngpoin,grngpoin,grngpoin,grngpoin+)|gring)><!ELEMENTgrngpoin(gringlat,gringlon)>2023/3/2922ADL2004深圳科學(xué)數(shù)據(jù)信息元數(shù)據(jù)的標(biāo)準(zhǔn)(8)小結(jié):元數(shù)據(jù)標(biāo)準(zhǔn)的龐大和復(fù)雜性:對具體系統(tǒng)實施是一個巨大的挑戰(zhàn)對元數(shù)據(jù)制作人員有較高的技能要求需要進行大量的培訓(xùn)工作檢索:聯(lián)邦科學(xué)聯(lián)盟網(wǎng)站提供按學(xué)科的跨數(shù)據(jù)庫檢索,分散的站點提供精細(xì)專業(yè)瀏覽和檢索2023/3/2923ADL2004深圳科學(xué)聯(lián)盟的下一步發(fā)展計劃繼續(xù)加入內(nèi)容完善規(guī)范內(nèi)容選擇和編目指南審查評估目前的分類表開展與政府其它門戶網(wǎng)站的連接接納新的聯(lián)盟成員開發(fā)支持性和能持久的資源2023/3/2924ADL2004深圳經(jīng)驗與教訓(xùn)建立科學(xué)數(shù)據(jù)信息的元數(shù)據(jù)標(biāo)準(zhǔn)是一個復(fù)雜的過程,需要有一個核心工作委員會來主持、協(xié)調(diào),制定政策、設(shè)計、及實施計劃元數(shù)據(jù)標(biāo)準(zhǔn)的模式:線性元素結(jié)構(gòu)不適合規(guī)模發(fā)展缺乏靈活性、可擴展性需要大量培訓(xùn)工作人員需要開發(fā)專用軟件和程序來實施元數(shù)據(jù)規(guī)范詞表的開發(fā)得到重視,并在元數(shù)據(jù)的可互操作性方面發(fā)揮

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論