![科技資源共享 科技資源信息集成規(guī)范 征求意見(jiàn)稿_第1頁(yè)](http://file4.renrendoc.com/view11/M02/19/0D/wKhkGWVm2tOALP0MAAGHrf924-c332.jpg)
![科技資源共享 科技資源信息集成規(guī)范 征求意見(jiàn)稿_第2頁(yè)](http://file4.renrendoc.com/view11/M02/19/0D/wKhkGWVm2tOALP0MAAGHrf924-c3322.jpg)
![科技資源共享 科技資源信息集成規(guī)范 征求意見(jiàn)稿_第3頁(yè)](http://file4.renrendoc.com/view11/M02/19/0D/wKhkGWVm2tOALP0MAAGHrf924-c3323.jpg)
![科技資源共享 科技資源信息集成規(guī)范 征求意見(jiàn)稿_第4頁(yè)](http://file4.renrendoc.com/view11/M02/19/0D/wKhkGWVm2tOALP0MAAGHrf924-c3324.jpg)
![科技資源共享 科技資源信息集成規(guī)范 征求意見(jiàn)稿_第5頁(yè)](http://file4.renrendoc.com/view11/M02/19/0D/wKhkGWVm2tOALP0MAAGHrf924-c3325.jpg)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1科技資源共享科技資源信息集成規(guī)范下列文件中的內(nèi)容通過(guò)文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文件,僅該日期對(duì)應(yīng)的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修GB/T30522科技平臺(tái)元數(shù)據(jù)標(biāo)準(zhǔn)化基本原則與方法是指從事現(xiàn)代科技服務(wù)和科技活動(dòng)所需的資源,包括大型科學(xué)儀器設(shè)備、研究實(shí)驗(yàn)基地、自然科技資源、科學(xué)數(shù)據(jù)、科技圖書文獻(xiàn)、科技成果以及科普科學(xué)活動(dòng)或科技知識(shí)的信息載體,包括結(jié)構(gòu)化的數(shù)據(jù),如標(biāo)準(zhǔn)的科技資源元數(shù)據(jù);非結(jié)構(gòu)化的數(shù)科技資源元數(shù)據(jù)metadataofscientifi是指科技資源信息的數(shù)據(jù),用來(lái)描述科技資源的內(nèi)容科技資源目錄catalogofscientific是指符合一定標(biāo)準(zhǔn)格式的、用于描述科技資源的數(shù)據(jù)或信息,一般從科權(quán)所有人、領(lǐng)域分類、內(nèi)容簡(jiǎn)介、服務(wù)機(jī)構(gòu)、服務(wù)方式等方面,對(duì)科技資源進(jìn)行簡(jiǎn)明但較為全面的描通過(guò)信息采集或匯交等方式,將分散的、異構(gòu)異質(zhì)的科技資源元數(shù)據(jù)信息聚合在一起,形成統(tǒng)一規(guī)范的科技資源元數(shù)據(jù)信息,便于科技資源管理、檢索和共2從多層次描述科技資源元數(shù)據(jù)信息,并將科技資源信息統(tǒng)一轉(zhuǎn)換為指定格式或標(biāo)是指計(jì)算機(jī)數(shù)據(jù)庫(kù)中的一個(gè)虛擬表,包含一系列帶有名稱的列和行數(shù)據(jù)。虛擬表在使用上4縮略語(yǔ)CSTR:科技資源標(biāo)識(shí)(ChinaScienceandTechnologyResGAV:全局視圖(global-as-vGLAV:全局局部視圖(global-local-as-vISTR:科技資源信息集成(informationintegrationofscientificandtechnologicalMSTR:科技資源元數(shù)據(jù)(metadataofscientificandtechnologicalresource科技資源信息集成的對(duì)象是多源異構(gòu)的科技資源元數(shù)據(jù)或相關(guān)信息,科技資源信2)對(duì)于語(yǔ)法異構(gòu)的元數(shù)據(jù)域,應(yīng)根據(jù)需求而將其統(tǒng)一轉(zhuǎn)換成指定的語(yǔ)法格式,并合并為同一元b)科技資源信息集成應(yīng)處理元數(shù)據(jù)異構(gòu)的歧義2)對(duì)于語(yǔ)義差別較大且能夠整合為更高級(jí)別語(yǔ)義概念的元數(shù)據(jù)域(如:對(duì)于論文作者而言,c)科技資源信息集成應(yīng)能適應(yīng)科技資源多領(lǐng)域和e)科技資源信息集成應(yīng)參照或基于科技資源元數(shù)據(jù)信息模3科技資源信息集成(ISTR)指的是對(duì)科技資源元數(shù)據(jù)(MSTR)的集成。科技資源元數(shù)據(jù)集成分為a)采集層包括元數(shù)據(jù)采集和元數(shù)據(jù)清洗模塊,負(fù)責(zé)將多源異構(gòu)科技資源元數(shù)據(jù)存儲(chǔ)為統(tǒng)一的格式b)處理層包括模式匹配、中間模式、模式映射以及數(shù)據(jù)融合等四個(gè)模塊,負(fù)責(zé)將異構(gòu)異質(zhì)的科技c)呈現(xiàn)層包括數(shù)據(jù)查詢引擎和標(biāo)準(zhǔn)化輸出模元數(shù)據(jù)服務(wù)機(jī)構(gòu)給出的數(shù)據(jù)接口獲取相應(yīng)的數(shù)據(jù)信息、通過(guò)與元數(shù)據(jù)服務(wù)機(jī)構(gòu)共享資源池獲取數(shù)據(jù);4缺失值處理靜態(tài)采集方式包括從靜態(tài)數(shù)據(jù)文件中獲取元數(shù)據(jù)信息等。靜態(tài)數(shù)據(jù)文件包括結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)缺失值處理b)元數(shù)據(jù)清洗:元數(shù)據(jù)清洗包括對(duì)科技資源元數(shù)據(jù)缺首先需要將多個(gè)異構(gòu)異質(zhì)科技資源元數(shù)據(jù)作為采集層的輸入,經(jīng)元數(shù)據(jù)采集模塊處理后得到統(tǒng)一存儲(chǔ)格式的科技資源元數(shù)據(jù),再經(jīng)元數(shù)據(jù)清洗模塊的清洗,完成對(duì)元數(shù)據(jù)自身缺失值、多源數(shù)據(jù)庫(kù)元數(shù)據(jù)清洗經(jīng)采集層匯聚和清洗的科技資源元數(shù)據(jù)具有異質(zhì)性,將異質(zhì)的科技資源元數(shù)結(jié)構(gòu)中,再根據(jù)科技資源元數(shù)據(jù)自身數(shù)據(jù)類型的特點(diǎn)存儲(chǔ)到多源數(shù)據(jù)庫(kù)成的標(biāo)準(zhǔn)屬性,這些屬性稱為科技資源元數(shù)據(jù)的關(guān)鍵屬性。中間模式為關(guān)鍵屬性組成b)屬性匹配:科技資源模式中的所有屬性與中間模式中的屬性應(yīng)相對(duì)應(yīng),可采用一對(duì)一、一對(duì)多c)模式映射:根據(jù)屬性匹配的結(jié)果建立每個(gè)科技資源源模式和中間模式之間的模式映射。模式映):):3)全局局部視圖(GLAV):將中間模式和5元數(shù)據(jù)處理層人工校驗(yàn)屬性匹配人工屬性匹配基于機(jī)器學(xué)習(xí)的概率匹配人工校驗(yàn)?zāi)J接成淙斯つJ接成涓怕誓J接成鋽?shù)據(jù)融合數(shù)據(jù)庫(kù)1數(shù)據(jù)庫(kù)2數(shù)據(jù)庫(kù)3數(shù)據(jù)庫(kù)4多源數(shù)據(jù)庫(kù)d)數(shù)據(jù)融合:不同科技資源元數(shù)據(jù)在為同一個(gè)實(shí)體的同一屬性提供具體值時(shí),可能產(chǎn)生沖突。沖突可能由分類錯(cuò)誤、計(jì)算不正確、信息過(guò)期、語(yǔ)義解釋不一致或虛假信息等因素引起??萍假Y源元數(shù)據(jù)共享和傳播會(huì)擴(kuò)散或擴(kuò)大該沖突。數(shù)據(jù)融合可以有效解決該問(wèn)題,包括三種方式:元數(shù)據(jù)處理層人工校驗(yàn)屬性匹配人工屬性匹配基于機(jī)器學(xué)習(xí)的概率匹配人工校驗(yàn)?zāi)J接成淙斯つJ接成涓怕誓J接成鋽?shù)據(jù)融合數(shù)據(jù)庫(kù)1數(shù)據(jù)庫(kù)2數(shù)據(jù)庫(kù)3數(shù)據(jù)庫(kù)4多源數(shù)據(jù)庫(kù)處理層首先將經(jīng)采集層處理的科技資源元數(shù)據(jù)作為處理層的輸入,由中間模式模塊生成該領(lǐng)域內(nèi)科技資源的統(tǒng)一視圖,中間模式包括人工創(chuàng)建中間模式與基于文法與予于基于文法與予以聚類的概率中間模式處理后還需進(jìn)行人工校驗(yàn)過(guò)程。屬性匹配模塊根據(jù)屬性間相似度生成各科技資源源模式與中間模式的對(duì)應(yīng)關(guān)系,屬性匹配包括人工費(fèi)屬性匹配、基于機(jī)器學(xué)習(xí)的概率匹配兩種方式。模式映射模塊根據(jù)語(yǔ)義關(guān)系生成源模式中數(shù)據(jù)與中間模式中數(shù)據(jù)的映射方法,再經(jīng)數(shù)據(jù)融合模塊處理以解決科技資源沖突值問(wèn)題,集成過(guò)程中可以使用科技資源標(biāo)識(shí)(CSTR)資源。最后把不同科技資源屬性的映射關(guān)系存入屬性關(guān)系數(shù)據(jù)庫(kù)可以與其他科技資源集成系統(tǒng)共享屬性關(guān)系數(shù)據(jù)庫(kù),使得數(shù)據(jù)融合過(guò)程更加便利。元數(shù)據(jù)處屬性關(guān)系數(shù)據(jù)庫(kù)屬性關(guān)系數(shù)據(jù)庫(kù)中間模式人工創(chuàng)建中間模式基于文法與語(yǔ)義聚類的概率中間模式 人工校驗(yàn)/呈現(xiàn)層根據(jù)科技資源元數(shù)據(jù)共享和集成的需求與標(biāo)準(zhǔn),將科技資源元數(shù)據(jù)輸出為特定的標(biāo)準(zhǔn)形式。與多源數(shù)據(jù)庫(kù)中的科技資源元數(shù)據(jù)進(jìn)行映射,把不同的語(yǔ)義成分映射到規(guī)范的元數(shù)6屬性關(guān)系數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)2數(shù)據(jù)庫(kù)3數(shù)據(jù)庫(kù)4b)標(biāo)準(zhǔn)化輸出:輸出結(jié)果分為結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化屬性關(guān)系數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)2數(shù)據(jù)庫(kù)3數(shù)據(jù)庫(kù)4呈現(xiàn)層通過(guò)標(biāo)準(zhǔn)輸入接口接收用戶提出的科技資源元數(shù)據(jù)需求,再根據(jù)標(biāo)準(zhǔn)解析結(jié)果和處理層得到的屬性關(guān)系映射結(jié)果,通過(guò)數(shù)據(jù)查詢引擎得到所需數(shù)據(jù),最后通過(guò)標(biāo)準(zhǔn)化輸出模塊元數(shù)據(jù)呈現(xiàn)層數(shù)據(jù)庫(kù)1屬性關(guān)系數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)4數(shù)據(jù)庫(kù)2數(shù)據(jù)庫(kù)3元數(shù)據(jù)呈現(xiàn)層數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)17現(xiàn)有國(guó)家林草種質(zhì)資源庫(kù)、國(guó)家重要野生植物種質(zhì)資源庫(kù)、國(guó)家作物種質(zhì)資源庫(kù)需要與生物相關(guān)的科技資源元數(shù)據(jù)進(jìn)行集成。圖A.1為待集成的生物資源信息,每個(gè)資源機(jī)構(gòu)所定義的生物資源屬性各其中,國(guó)家林草種質(zhì)資源庫(kù)生物資源信息的元數(shù)據(jù)字段為(資源編號(hào),種質(zhì)名稱,科名,屬名,A.2采集層所示生物種質(zhì)與實(shí)驗(yàn)材料資源信息中缺失值被賦8特征描述等信息為元數(shù)據(jù)的關(guān)鍵信息,確定了中間模式的共同屬性為(資
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030全球活塞連桿套件行業(yè)調(diào)研及趨勢(shì)分析報(bào)告
- 家電維修合同協(xié)議書正規(guī)范本
- 垃圾桶項(xiàng)目采購(gòu)合同
- 出租車租賃合同模板
- 2025居間合同協(xié)議書范本
- 產(chǎn)品全國(guó)總代理合同范本年
- 宣傳欄制作安裝合同書
- 委托合同范文年
- 2025年中圖版八年級(jí)歷史上冊(cè)階段測(cè)試試卷
- 2024年高考政治(安徽卷)真題詳細(xì)解讀及評(píng)析
- 數(shù)字經(jīng)濟(jì)學(xué)導(dǎo)論-全套課件
- 動(dòng)物檢疫技術(shù)-動(dòng)物檢疫的對(duì)象(動(dòng)物防疫與檢疫技術(shù))
- 中考記敘文閱讀
- 《計(jì)算機(jī)應(yīng)用基礎(chǔ)》-Excel-考試復(fù)習(xí)題庫(kù)(含答案)
- 產(chǎn)科溝通模板
- 2023-2024學(xué)年四川省成都市小學(xué)數(shù)學(xué)一年級(jí)下冊(cè)期末提升試題
- GB/T 7462-1994表面活性劑發(fā)泡力的測(cè)定改進(jìn)Ross-Miles法
- GB/T 2934-2007聯(lián)運(yùn)通用平托盤主要尺寸及公差
- GB/T 21709.13-2013針灸技術(shù)操作規(guī)范第13部分:芒針
- 2022年青島職業(yè)技術(shù)學(xué)院?jiǎn)握姓Z(yǔ)文考試試題及答案解析
- 急診科進(jìn)修匯報(bào)課件
評(píng)論
0/150
提交評(píng)論