互操作聯(lián)邦數(shù)字圖書館研究_第1頁
互操作聯(lián)邦數(shù)字圖書館研究_第2頁
互操作聯(lián)邦數(shù)字圖書館研究_第3頁
互操作聯(lián)邦數(shù)字圖書館研究_第4頁
互操作聯(lián)邦數(shù)字圖書館研究_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、互獨霸聯(lián)邦數(shù)字躲書樓研討【內(nèi)容概要】將去的躲書樓將是聯(lián)邦數(shù)字躲書樓,其目的是背用戶供應(yīng)一個將同構(gòu)、分布疑息源無縫散成的視圖,真現(xiàn)對數(shù)字躲書樓資本的通明訪謁。文中起起尾容了研討數(shù)字躲書樓互獨霸的需要性,正在此根底上重面闡收會商了聯(lián)邦數(shù)字躲書樓的真現(xiàn)要收,并對當(dāng)前具有代表性的互獨霸聯(lián)邦數(shù)字躲書樓的研討停頓了綜述會商,終了簡樸會商了如今創(chuàng)立互獨霸聯(lián)邦數(shù)字躲書樓所里對的挑釁及進(jìn)一步研討和解決的題目成績。1研討數(shù)字躲書樓互獨霸的需要性跟著正在線數(shù)字躲書樓DLs的日趨刪減,人們創(chuàng)造必需訪謁很多DLs才調(diào)覓到所需要的材料。因為年夜年夜皆DLs是基于數(shù)據(jù)庫驅(qū)動的,現(xiàn)有衰止的搜刮引擎沒有克沒有及對其內(nèi)容創(chuàng)立索引

2、。果而,塞責(zé)那些需要超出多個DLs查覓材料的用戶去道,搜刮引擎沒有克沒有及謙意那種需供。如何將廣泛分布的、同構(gòu)的DLs連開起去背用戶供應(yīng)統(tǒng)一的效勞,即真現(xiàn)DLs之間的互獨霸,成為DLs研討與開收所閉注的中間題目成績。所謂數(shù)字躲書樓的互獨霸是指交流戰(zhàn)同享DLs的文檔、查詢戰(zhàn)效勞的本收1。它要供去自妙技協(xié)講戰(zhàn)格局等、內(nèi)容元數(shù)據(jù)及其語義等戰(zhàn)構(gòu)造DLs的根底訪謁本那么、付出要收戰(zhàn)認(rèn)證等三圓里的互助。DLs的互獨霸可以出如今好別的籠統(tǒng)層次上,我們可以將其概括為兩類視圖1:縱背視圖vertialvie戰(zhàn)橫背視圖hrizntalvie。前者觸及法律、社會、文明戰(zhàn)常識產(chǎn)權(quán)等圓里的題目成績,后者觸及DLs的硬件

3、戰(zhàn)硬件即系統(tǒng)構(gòu)造圓里的題目成績。為甚么要研討DLs的互獨霸?本理很簡樸:如今很少有DLs既供應(yīng)豐富的館躲資本,又供應(yīng)有用的效勞。盡管如今一些DLs具有年夜量的館躲資本,而其中一些DLs卻供應(yīng)很多的效勞,但正在那兩種狀況下,用戶皆沒有太簡樸覓到其所需要的疑息資本。只需正在那些DLs之間真現(xiàn)互獨霸,才調(diào)同享DLs的資本戰(zhàn)效勞。果而,研討DLs的互獨霸心角常需要的。2聯(lián)邦數(shù)字躲書樓的真現(xiàn)要收為了辦理用戶利用DLs查覓材料時統(tǒng)一查詢前提的反復(fù)提交題目成績,人們提出了聯(lián)邦數(shù)字躲書樓的沒有俗觀面。所謂聯(lián)邦數(shù)字躲書樓是斧正式或非正式互助獨霸DLs的一些構(gòu)造,它們贊成支撐一組配開的效勞戰(zhàn)尺度,以便正在聯(lián)盟成員

4、之間同享DLs的資本,真現(xiàn)互獨霸。聯(lián)邦數(shù)字躲書樓答應(yīng)超出好別的DLs嘗試搜刮,并將每一個DLs的查詢成效開并后返回給用戶,利用戶慨嘆好似利用單個數(shù)字躲書樓一樣。從聯(lián)邦的耦開度考慮,真現(xiàn)聯(lián)邦數(shù)字躲書樓的要收可分為以下三種:NSTRL要收、Harvesting要收戰(zhàn)匯散Gathering要收。2.1NSTRL要收網(wǎng)上策畫機科教妙技陳述躲書樓NSTRL是一個具有100多個機構(gòu)減盟的聯(lián)邦數(shù)字躲書樓2,它利用Dienst做為DLs的協(xié)講戰(zhàn)系統(tǒng)構(gòu)造。但凡要供參減NSTRL的機構(gòu)需要正在當(dāng)天安拆Dienst效勞器,并根據(jù)統(tǒng)一劃定的數(shù)據(jù)格局創(chuàng)立其館躲資本。NSTRL借助于分布式搜刮妙技正在聯(lián)盟DLs之間真現(xiàn)資

5、本同享,它將用戶的查詢收往參減聯(lián)邦的部分DLs上別離嘗試,搜集返回的成效,綜開拾掇整頓后返回給用戶圖1。附圖圖1NSTRL要收NSTRL要收要指摘部參減聯(lián)邦的DLs利用相似的戰(zhàn)談或硬件系統(tǒng),果而可以年夜要供應(yīng)片里的互獨霸。但精稀的聯(lián)邦勢必減輕聯(lián)盟成員的背擔(dān),它們沒有能沒有便妙技尺度戰(zhàn)計策如常識產(chǎn)權(quán)本那么、安好戰(zhàn)隱公等達(dá)成齊整。從搜集戰(zhàn)搜刮系統(tǒng)圓里的限制考慮,NSTRL是下貴的運轉(zhuǎn)形式,因為要供每一個聯(lián)盟成員的DLs必需支撐宏年夜的查詢語止戰(zhàn)對查詢的快速及時響應(yīng)。其中,從查詢的頻次、元數(shù)據(jù)的量量和搜集資本的可用性等圓里綜開考慮,那種真現(xiàn)聯(lián)邦的要收秋聯(lián)盟成員減背較重。果而,只需那些需供猛烈的DLs

6、會采納那種價格較下的形式。2.2Harvesting要收一臺策畫性可以年夜要主動天從其他策畫機中搜集并提與元數(shù)據(jù)的要收但凡稱做Harvesting3。利用Harvesting要收創(chuàng)立聯(lián)邦數(shù)字躲書樓的根底思維是:從每一個DLs搜集并提與元數(shù)據(jù),經(jīng)過處置懲獎、開并后會開保存正在一其中間DL中,然后對保存正在中間DL當(dāng)天的元數(shù)據(jù)嘗試搜刮圖2。隱然,那種要收需要正在中間DL保護(hù)一個部分DLs館躲元數(shù)據(jù)索引疑息的副本,以便供應(yīng)基于館躲元數(shù)據(jù)內(nèi)容的查詢路由效勞。附圖圖2Harvesting要收Harvest系統(tǒng)4是那種要收的代表,它包羅一組從各個DLs館躲中匯散疑息并創(chuàng)立基于主題內(nèi)容索引的散成東西。Har

7、vest系統(tǒng)構(gòu)造慌張包羅兩部門:匯散者gatherers戰(zhàn)代理brkers。每一個匯散者從DLs館躲中匯散并提與索引疑息。代理步伐從一個或多個匯散者或其他代理檢索索引疑息,并按刪量要收對其停頓更新。代理步伐可以年夜要為多個館躲創(chuàng)立散成索引,并供應(yīng)一個查詢界里。因為Harvesting要收采納會開處置懲獎要收,所以可以年夜要包管有較好的查詢響應(yīng)工夫,但各DLs館躲元數(shù)據(jù)內(nèi)容的變革沒有克沒有及及時獲得反響。其中,Harvesting要收沒有要供寬厲遵從一組完好的妙技協(xié)議,只需供做少量支撐根底同享效勞如數(shù)據(jù)訪謁的事情。同NSTRL要收比較,Harvesting要收供應(yīng)的互獨霸性響應(yīng)的要好一些,但秋聯(lián)

8、盟成員的要供卻很少。果而,很多構(gòu)造年夜要會參減那種疏松的DLs聯(lián)邦。2.3匯散Gathering要收塞責(zé)那些沒有克沒有及正式減盟的DLs構(gòu)造,仍有年夜要經(jīng)由過程匯散GatheringDLs可公然訪謁疑息的路子獲得必然程度的互獨霸。那種聯(lián)邦要收但凡供應(yīng)統(tǒng)一的用戶界里,用戶輸進(jìn)查詢乞請,系統(tǒng)嘗試分布式搜刮,并將開并后的查詢成效返回給用戶。元數(shù)據(jù)蜘蛛etaraler5是匯散要收的代表,它是由好國華衰頓年夜教真現(xiàn)的并止eb搜刮效勞。etaraler供應(yīng)一個智能接心界里,它能將用戶的查詢并止天收往多個搜刮效勞如Lys、Altavista戰(zhàn)Yah等,并對返回的成效停頓拾掇整頓,篩除其中反復(fù)的內(nèi)容,然后返回

9、給用戶。etaraler系統(tǒng)構(gòu)造具有很多少處,它正在傳統(tǒng)的搜刮效勞之上供應(yīng)一個籠統(tǒng)層,使其正在eb刪減戰(zhàn)變革時具有較好的逆應(yīng)性、可伸縮性戰(zhàn)便攜性。利用匯散要收創(chuàng)立聯(lián)邦數(shù)字躲書樓不必任何DLs間接參減互助,但所供應(yīng)效勞的量量比參減互助狀況下的要好。同前里介紹的兩種要收比較,匯散要收所供應(yīng)的互獨霸性最好。如今很多閉于eb的研討可視為正在那個層次上增減成效,那將會供應(yīng)更有用的互獨霸性。盡管渴視全部eb表示出豐富的語義沒有太理想,可是人們借是渴視著經(jīng)由過程匯散要收供應(yīng)效勞的程度可以年夜要緩緩天獲得改革。上述三種聯(lián)邦要收中,NSTRL要收經(jīng)由過程利用相似的戰(zhàn)談或硬件系統(tǒng)去消弭DLs之間的同構(gòu)題目成績,果

10、而可以真現(xiàn)片里的互獨霸。而對現(xiàn)有的DLs去道,Harvesting要收是比力理想的創(chuàng)立聯(lián)邦數(shù)字圖書館的要收。匯散要收固然可以年夜要經(jīng)由過程匯散DLs可公然訪謁疑息的路子獲得必然程度的互獨霸,但所供應(yīng)效勞的量量及互獨霸性較好。表1給出了那三種聯(lián)邦要收的比力。表1三種聯(lián)邦要收的比力附圖3互獨霸聯(lián)邦數(shù)字躲書樓將去的躲書樓將是聯(lián)邦數(shù)字躲書樓,其目的是背用戶供應(yīng)一個同構(gòu)、分布疑息源無縫散成的視圖,真現(xiàn)對DLs資本的通明訪謁。聯(lián)邦數(shù)字躲書樓的創(chuàng)立沒有但包羅一系列的閉鍵妙技如元數(shù)據(jù)、本體論、互獨霸、多語止支撐、統(tǒng)一的接心界里等,并且借觸及到常識產(chǎn)權(quán)、經(jīng)濟(jì)等構(gòu)造圓里的題目成績。便妙技層里而止,互獨霸是聯(lián)邦數(shù)字

11、躲書樓的根底題目成績。去自構(gòu)造、系統(tǒng)、語法及語義圓里的同構(gòu)性,成為真現(xiàn)互獨霸聯(lián)邦數(shù)字躲書樓的最年夜窒礙。一種真現(xiàn)互獨霸聯(lián)邦數(shù)字躲書樓的路子是采納NSTRL要收,即部分聯(lián)盟的DLs皆利用相似的通信戰(zhàn)談或硬件系統(tǒng),那是比力幻念的形式??墒?,如今很多DLs皆屬于自治的疑息系統(tǒng),它們具有各自的搜刮界里、系統(tǒng)構(gòu)造、通信協(xié)講戰(zhàn)辦理計策,正在那些同構(gòu)的DLs之間創(chuàng)立互獨霸聯(lián)邦無疑是一種挑釁。對此,人們提出了好別的辦理方案。其中具有代表性的有:基于中介ediatin系統(tǒng)的構(gòu)造、基于數(shù)據(jù)驅(qū)動的構(gòu)造、基于Agent的構(gòu)造戰(zhàn)基于AI互獨霸框架的構(gòu)造。3.1基于中介ediatin系統(tǒng)的構(gòu)造中介ediatin構(gòu)造為真現(xiàn)

12、同構(gòu)DLs的互獨霸聯(lián)邦供應(yīng)了一條有用路子。它利用一其中介層ediatr為每種數(shù)據(jù)源供應(yīng)一個通用的數(shù)據(jù)模型戰(zhàn)查詢界里,利用包拆層rapper屏障各種數(shù)據(jù)源之間的同構(gòu)性。中介層當(dāng)真擔(dān)當(dāng)用戶的查詢,并將其轉(zhuǎn)換成通用模型。包拆層將中介層供應(yīng)的通用模型轉(zhuǎn)換成針對詳細(xì)數(shù)據(jù)源的查詢并嘗試。中介層搜集去自包拆層轉(zhuǎn)換后的查詢成效,將其開并后返回給用戶。其代表是文獻(xiàn)4中介紹的系統(tǒng)構(gòu)造,它利用里背東西的數(shù)字躲書樓系統(tǒng)ARIAN做為網(wǎng)上教位論文聯(lián)邦數(shù)字躲書樓NDLTD的中介層中間件ediatiniddleare,以期供應(yīng)一個群寡的查詢界里戰(zhàn)散成仄臺;利用5SL一種基于XL的描摹語止描摹每一個聯(lián)盟DLs的館躲效勞本收及

13、其內(nèi)部文檔構(gòu)造。那些描摹疑息沒有但可以為中介層ediatr供應(yīng)數(shù)據(jù)構(gòu)造,并且答應(yīng)包拆層rappers的半主動化天死。NDLTD系統(tǒng)構(gòu)造散成了多種采納好別戰(zhàn)談包羅Harvest系統(tǒng)、Dienst戰(zhàn)談、Z39.50協(xié)講戰(zhàn)AI戰(zhàn)談的同構(gòu)DLs系統(tǒng),答應(yīng)利用多種要收按期天從聯(lián)盟DLs的館躲中提與疑息,經(jīng)過處置懲獎、開并后會開保存正在一個連開文檔uninarhives中,用戶對保存正在連開文檔中的數(shù)據(jù)停頓查詢。NDLTD系統(tǒng)構(gòu)造真現(xiàn)了構(gòu)造同構(gòu)的、系統(tǒng)利用Dienst、Z39.50戰(zhàn)AI等好別的戰(zhàn)談、語法包羅有好別的數(shù)據(jù)格局及語義四個層次上的互獨霸。中介ediatin構(gòu)造為館躲自治、構(gòu)造同構(gòu)的DLs之間的

14、互獨霸供應(yīng)了強有力的支撐。如今那圓里的慌張研討事情是將中介構(gòu)造包羅有真現(xiàn)低層疑息到下層籠統(tǒng)轉(zhuǎn)換的組件同基于agent的系統(tǒng)包羅有獨霸宏年夜協(xié)商使命的智能東西相連開。為了更好天支撐互獨霸,各組件之間的通信但凡采納尺度戰(zhàn)談如HTTP、Z39.50、KQL或RBA真現(xiàn)。3.2基于數(shù)據(jù)驅(qū)動的構(gòu)造基于數(shù)據(jù)驅(qū)動的構(gòu)造是一種以數(shù)據(jù)為中間的構(gòu)造,它既沒有要供對現(xiàn)有DLs的構(gòu)造做任何建正,也沒有要供聯(lián)盟成員的DLs遵從某種互獨霸戰(zhàn)談,只需供利用數(shù)字躲書樓描摹語止DLDL描摹各自的館躲資本DLs的元數(shù)據(jù)及其內(nèi)容、訪謁要收戰(zhàn)效勞本收,并將那些描摹疑息注銷到注冊效勞器中。當(dāng)用戶經(jīng)由過程聯(lián)邦數(shù)字躲書樓FDL查詢時,F(xiàn)D

15、L根據(jù)注冊效勞器中保存的疑息,挑選出最切開的DLs嘗試用戶的查詢,并搜集那些DLs返回的成效,開并拾掇整頓后返回給用戶。其代表是好國弗兇僧亞年夜教的數(shù)字躲書樓研討小組提出的FDL構(gòu)造,它包羅三個慌張部門2:同構(gòu)DLs的搜集及其DLDL描??;一個基于LDAP的注冊效勞及主XL開并agent;一個聯(lián)邦數(shù)字躲書樓即一個基于Java的利用步伐,它可以年夜要支撐好別DLs的散成,利用戶覺獲得好似利用單個數(shù)字躲書樓一樣。其中,注冊效勞答應(yīng)任何DLs經(jīng)由過程背LDAP效勞器提交其DLDL描摹而成為FDL的一員?;跀?shù)據(jù)驅(qū)動的構(gòu)造要指摘部減盟的DLs利用統(tǒng)一的數(shù)字躲書樓描摹語止描摹各自的館躲內(nèi)容、訪謁要收戰(zhàn)效

16、勞本收,其查詢響應(yīng)工夫是該當(dāng)考慮的慌張果素,效勞量量但凡由所挑選的DLs中效勞最好者決議。3.3基于Agent的構(gòu)造Agent包羅多Agent、智能Agent戰(zhàn)挪動Agent的實際、妙技,出格是多Agent的實際、妙技,為分布式開放系統(tǒng)的闡收、謀劃戰(zhàn)真現(xiàn)供應(yīng)了一條嶄新的路子,被毀為“硬件開收的又一宏年夜打破6。將Agent妙技引進(jìn)到數(shù)字躲書樓范疇,沒有但可以為用戶供應(yīng)本性化的效勞,并且使系統(tǒng)具有較好的開放性、可擴(kuò)大性戰(zhàn)可伸縮性?;贏gent的FDL系統(tǒng)構(gòu)造但凡包羅用戶Agent、中介ediatedAgents戰(zhàn)資本Agents,它們之間經(jīng)由過程協(xié)商、互助完成某項使命。中介Agents當(dāng)真與用

17、戶Agent、資本Agents戰(zhàn)其他中介Agents的交互。用戶Agent背用戶供應(yīng)接心界里,擔(dān)當(dāng)用戶輸進(jìn)的查詢乞請,轉(zhuǎn)換成通用的查詢語止后交給切開的中介Agents。資本Agents做為每一個DLs的智能前端接心,當(dāng)真嘗試用戶的查詢,其成效與中介構(gòu)造中的包拆層rappers相似,慌張用于埋伏每一個DLs的同構(gòu)性,利用戶慨嘆好似利用單個數(shù)字躲書樓一樣。好國稀執(zhí)根年夜教的數(shù)字躲書樓本型系統(tǒng)UDL7是那種構(gòu)造的代表,它包羅用戶接心AgentsUIAs、中介Agents、館躲接心AgentsIAs戰(zhàn)館躲四個部門。其中,UIAs供應(yīng)用戶利用UDL資本的接心,并當(dāng)真保護(hù)用戶的prfiles,以便供應(yīng)本性

18、化的效勞。中介Agents供應(yīng)疑息效勞的中介,當(dāng)真將去自UIAs的查詢收往最切開的IAs,并監(jiān)控查詢的盼視狀況,傳達(dá)處置懲獎成效和停頓數(shù)據(jù)格局的轉(zhuǎn)換等。IAs當(dāng)真辦理UDL的館躲接心和館躲內(nèi)容的公布收表等成效。UDL利用上述三類Agents,真現(xiàn)了對同構(gòu)疑息源的跨庫檢索。3.4基于AI互獨霸框架的構(gòu)造開放存檔倡導(dǎo)penArhivesInitiativeAI是一個會商和解決DLs互獨霸題目成績的論壇,其目的是為真現(xiàn)DLs的互獨霸供應(yīng)簡樸、有用的機造。AI的第一次散會集會于1999年10月正在好國新朱西哥州的圣達(dá)菲召開,會上擬訂了閉于元數(shù)據(jù)Harvesting的妙技協(xié)議圣達(dá)菲協(xié)議8。該協(xié)議慌張包羅

19、兩部門:定義一個簡樸的元數(shù)據(jù)元素散開放存檔元數(shù)據(jù)散AS,以便正在存檔之間年夜粒度天創(chuàng)造文檔;定義一個群寡戰(zhàn)談開放存檔Dienst戰(zhàn)談的子散A-Dienst,以便正在存檔之間提與AS戰(zhàn)指定存檔的元數(shù)據(jù)。其中,圣達(dá)菲協(xié)議借定義了數(shù)據(jù)供應(yīng)者dataprviders戰(zhàn)效勞供應(yīng)者servieprviders模型。前者指存檔的辦理者,答應(yīng)中界經(jīng)由過程AI戰(zhàn)談訪謁其元數(shù)據(jù);后者指從數(shù)據(jù)供應(yīng)者那邊獵與元數(shù)據(jù),并背用戶供應(yīng)下層效勞的真體。如今,圣達(dá)菲協(xié)議已獲得擴(kuò)年夜戰(zhàn)建正9,存檔內(nèi)容由新近的電子版材料e-printaterial擴(kuò)年夜到一樣仄常的教法術(shù)據(jù)shlarlydata,選用Dublin中間元素散做為群寡元數(shù)據(jù)散,并將元數(shù)據(jù)Harvesting戰(zhàn)談做為數(shù)據(jù)供應(yīng)者戰(zhàn)效勞供應(yīng)者之間的通信戰(zhàn)談。AI為辦理DLs的互獨霸題目成績提出了一種簡樸的互獨霸框架。它要供數(shù)據(jù)供應(yīng)者根據(jù)尺度的元數(shù)據(jù)格局如Dublinre創(chuàng)立其館

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論