




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
p2p模式文件共享系統(tǒng)多關(guān)鍵詞檢索問題研究
1混合式p2p模型近年來,平等模型(也稱為p2p、pee-tope或點(diǎn))由于其結(jié)構(gòu)靈活,已被迅速開發(fā),充分利用邊緣資源。其主要的應(yīng)用領(lǐng)域包括文件共享、分布式存儲(chǔ)、協(xié)同工作等,其中又以文件共享為最典型的代表,如BT和Napster。從系統(tǒng)結(jié)構(gòu)角度看,BT和Napster等系統(tǒng)都不是純P2P模型,它們利用中央服務(wù)器集中管理各種索引并執(zhí)行檢索,資源的請(qǐng)求者在服務(wù)器上檢索到所需資源的存放節(jié)點(diǎn)后直接從該節(jié)點(diǎn)或節(jié)點(diǎn)的集合下載,P2P的模式只體現(xiàn)在資源的存放和傳輸上。這種混合式P2P模型的大量流行很大程度上得益于其方便的資源檢索模式。但它也存在一些缺點(diǎn):需要中央服務(wù)器使得整個(gè)系統(tǒng)的構(gòu)建不夠靈活,另外,中央服務(wù)器的性能、穩(wěn)定性等都有可能成為系統(tǒng)的瓶頸。因此,多種無中央服務(wù)器的純P2P模型被提出,如Gnutella、CAN、Chord等。這些純P2P模型可以進(jìn)一步分為兩種類型:無結(jié)構(gòu)純P2P模型和結(jié)構(gòu)化的純P2P模型。無結(jié)構(gòu)模型以Gnutella為典型代表,系統(tǒng)組織十分靈活,在搜索過程中采用TTL-Flooding算法,其缺點(diǎn)是會(huì)導(dǎo)致極大的網(wǎng)絡(luò)流量和較長的響應(yīng)時(shí)間;結(jié)構(gòu)化的純P2P模型是目前的研究重點(diǎn),它們大部分基于分布式哈希表(DistributedHashTable,簡稱DHT)技術(shù),查詢被嚴(yán)格地“路由”。這類算法解決了P2P系統(tǒng)的構(gòu)建、信息的定位等問題。但在路由性能、節(jié)點(diǎn)加入和退出時(shí)的結(jié)構(gòu)維護(hù)、安全、多關(guān)鍵字復(fù)雜檢索等問題上還需要進(jìn)一步的研究。本文聚焦在無中央服務(wù)器的純P2P文件共享系統(tǒng)中的多關(guān)鍵字復(fù)雜檢索問題,提出基于分布化元數(shù)據(jù)管理的P2P文件共享模型,通過元數(shù)據(jù)的管理解決結(jié)構(gòu)化純P2P系統(tǒng)中的多關(guān)鍵詞復(fù)雜檢索問題。2現(xiàn)有的計(jì)算方法對(duì)“檢索”的支持是文件共享系統(tǒng)的核心功能之一。若系統(tǒng)采用有服務(wù)器的混合型P2P模型,可以利用中央服務(wù)器的管理功能提供基于關(guān)鍵詞的檢索:在中央服務(wù)器上存放所有節(jié)點(diǎn)共享的文件的關(guān)鍵詞索引;各個(gè)節(jié)點(diǎn)上用戶的檢索請(qǐng)求都發(fā)送到服務(wù)器上處理,并將結(jié)果返回給用戶,用戶根據(jù)此結(jié)果進(jìn)行點(diǎn)對(duì)點(diǎn)通信,獲得所需文件。但在純P2P模型中,對(duì)關(guān)鍵詞檢索的支持存在一個(gè)顯而易見的問題:由于沒有中央服務(wù)器,關(guān)鍵詞索引只能分散存放,那么,資源的請(qǐng)求者如何才能檢索到他所需要的資源呢?目前的方法主要有以下兩大類:(1)以Gnutella為代表的TTL-Flooding方法:資源請(qǐng)求者向系統(tǒng)中的某個(gè)節(jié)點(diǎn)發(fā)出檢索請(qǐng)求,節(jié)點(diǎn)將此請(qǐng)求發(fā)送給它所知道的系統(tǒng)中的其他節(jié)點(diǎn),請(qǐng)求中包含Time-To-Live的計(jì)數(shù)信息。任何節(jié)點(diǎn)在接收到檢索請(qǐng)求后,將Time-To-Live的計(jì)數(shù)減1,然后轉(zhuǎn)發(fā)此請(qǐng)求。同時(shí),將檢索請(qǐng)求和本地共享文件的信息進(jìn)行比較,如果匹配表示查詢成功,向發(fā)起查詢的節(jié)點(diǎn)返回信息。(2)與CAN、Chord類似的基于DHT的方法:若系統(tǒng)中任何一個(gè)節(jié)點(diǎn)有新的文件提供共享,必須對(duì)此文件的某個(gè)特征值(如文件名)進(jìn)行Hash計(jì)算,根據(jù)計(jì)算的結(jié)果定位到相關(guān)節(jié)點(diǎn),在此節(jié)點(diǎn)上存放文件的索引信息。對(duì)于檢索操作來說,在檢索開始之前,同樣地,對(duì)要檢索的內(nèi)容的某個(gè)特征值(如文件名)進(jìn)行Hash計(jì)算,根據(jù)計(jì)算的結(jié)果定位到某節(jié)點(diǎn),以此節(jié)點(diǎn)作為“根據(jù)地”進(jìn)行查詢。此類方法有一個(gè)類似的關(guān)鍵計(jì)算過程———通過被檢索對(duì)象的某特征值得到一個(gè)目的地節(jié)點(diǎn),從此目的節(jié)點(diǎn)能夠直接或間接地得到被檢索的對(duì)象。為了討論方便,本文中我們稱其為計(jì)算過程(1):上述兩種方式各有優(yōu)缺點(diǎn),目前很多研究都聚焦于提高這些方式的檢索效率,但對(duì)其多關(guān)鍵詞檢索功能支持的研究卻十分缺乏。在純P2P結(jié)構(gòu)的文件共享系統(tǒng)中,為了使其檢索功能盡可能地接近有中央服務(wù)器的系統(tǒng),以下幾個(gè)關(guān)鍵問題必須解決:(1)由于系統(tǒng)中無中央服務(wù)器,無法建立集中索引,所有共享文件的描述信息只能分散存放,這些描述信息必須使用平臺(tái)無關(guān)的統(tǒng)一格式,目前可以借助元數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)行規(guī)范,哪種元數(shù)據(jù)標(biāo)準(zhǔn)能夠最好的滿足分布化管理的需求,同時(shí)支持多關(guān)鍵詞檢索?(2)每個(gè)共享文件的描述信息分散存放,存放時(shí)應(yīng)采用何種策略,才能在檢索時(shí)方便地利用這些分散的“索引”?(3)如何進(jìn)行檢索組織和優(yōu)化,使得系統(tǒng)對(duì)檢索的支持能夠兼顧功能和性能?本文接下來的討論將針對(duì)以上三個(gè)問題展開。3基于分散化元數(shù)據(jù)的p2p文件共享模型3.1節(jié)點(diǎn)之間的交換對(duì)等本文提出的P2P文件共享模型是基于純P2P模型的,系統(tǒng)中每個(gè)節(jié)點(diǎn)完全對(duì)等,節(jié)點(diǎn)和節(jié)點(diǎn)之間通過消息的轉(zhuǎn)發(fā)交換信息,完成發(fā)布、檢索、更新等操作,通過文件傳輸交換共享文件。對(duì)于其中的任何一個(gè)節(jié)點(diǎn),其結(jié)構(gòu)如圖1所示。3.2元數(shù)據(jù)組合檢索一般來說,在文件共享系統(tǒng)中,每個(gè)共享文件的元數(shù)據(jù)表述越豐富,用戶檢索時(shí)的“線索”就越多。對(duì)于一個(gè)給定的應(yīng)用系統(tǒng)來說,檢索支持的優(yōu)秀與否取決于應(yīng)用的需求。例如,文獻(xiàn)檢索系統(tǒng)需要關(guān)鍵詞、標(biāo)題、全文等各種條件的組合檢索,而視頻文件的檢索最好能夠提供演員、導(dǎo)演、劇情等組合檢索,不同的應(yīng)用中元數(shù)據(jù)集合不同。因此,文件共享模型中的的元數(shù)據(jù)描述必須使用有擴(kuò)展能力的方法??紤]到這些不同的需求,本模型中的元數(shù)據(jù)管理目標(biāo)總結(jié)為:(1)具有可擴(kuò)展性,以保證不同應(yīng)用的需求;(2)平臺(tái)無關(guān)性,使用平臺(tái)無關(guān)的記錄方式記錄,保證P2P系統(tǒng)能夠工作于異構(gòu)環(huán)境下;(3)元數(shù)據(jù)結(jié)構(gòu)靈活,以保證能夠基于各種metadata的組合進(jìn)行檢索。考慮到這些目標(biāo),在本模型中我們使用RDF規(guī)范作為元數(shù)據(jù)描述標(biāo)準(zhǔn)。3.2.1準(zhǔn)確的計(jì)算模型資源描述框架(ResourceDescriptionFramework,簡稱RDF)是由W3C定義的一種描述資源的語言。RDF的定義目標(biāo)是表達(dá)關(guān)于Web資源的元數(shù)據(jù),如Web頁面的標(biāo)題、作者和修改時(shí)間,Web文檔的版權(quán)和許可信息等。將“Web資源(Webresource)”這一概念一般化后,RDF可被用于表達(dá)關(guān)于任何可在Web上被標(biāo)識(shí)的事物的信息,即使有時(shí)它們不能被直接從Web上獲取。RDF提供了一種用于表達(dá)這一信息、并使其能在應(yīng)用程序間交換而不喪失語義的通用框架。RDF的基本思想:被描述的事物具有一些屬性(properties),而這些屬性各有其值(values);對(duì)資源的描述可以通過指定其屬性和值來進(jìn)行。RDF用一套特定的術(shù)語來表達(dá)描述中的各個(gè)部分。分別稱為主體(subject)、謂詞(predicate用于區(qū)分主體的各個(gè)不同屬性)和客體(object)。例如,“《基于分布化元數(shù)據(jù)管理的P2P文件共享模型研究》的作者是楊靜”這個(gè)描述里的不同部分用RDF術(shù)語來說就是:主體是“《基于分布化元數(shù)據(jù)管理的P2P文件共享模型研究》”,謂詞是詞“作者”,客體是“楊靜”。RDF的目標(biāo)是做出機(jī)器可處理的描述。那么,上面的描述若要適合機(jī)器處理,還需要兩個(gè)基本條件:(1)一個(gè)機(jī)器可處理的標(biāo)識(shí)符系統(tǒng),用來標(biāo)識(shí)陳述中的主體,謂詞,客體,同時(shí)這個(gè)標(biāo)識(shí)符系統(tǒng)能夠保證標(biāo)識(shí)的唯一性;(2)一種機(jī)器可處理的語言,用于表示這些陳述并讓這些陳述可在機(jī)器間交流。幸運(yùn)的是,現(xiàn)有的Web體系結(jié)構(gòu)提供了這兩個(gè)必需的工具:URI(UniformResourceIdentifier,全球資源統(tǒng)一標(biāo)識(shí))和XML。因此,在本文提出的模型中,對(duì)于所有可共享的文件,其元數(shù)據(jù)都規(guī)范為(主體,謂詞,客體)的三元組形式。并使用RDF規(guī)范的XML格式將這些三元組記錄下來。具體的記錄方式可參考RDFPrimer。在解決了元數(shù)據(jù)的描述和記錄之后,我們必須考慮到元數(shù)據(jù)的存儲(chǔ)問題,在一個(gè)完全分布化的P2P系統(tǒng)中,這些信息存放在何處才能使系統(tǒng)能夠利用這些信息完成檢索?3.2.2合理的信息發(fā)布由于在純P2P系統(tǒng)中不存在中央服務(wù)器,關(guān)于所有共享文件的三元組信息只能存放在各個(gè)分布的節(jié)點(diǎn)上。若忽略所有開銷,在每個(gè)節(jié)點(diǎn)存放所有元數(shù)據(jù)描述的副本,檢索問題就能夠在任何節(jié)點(diǎn)得到解決。但這種方式顯然開銷過大。因此,必須以合適的方式分布化地存儲(chǔ)這些信息。從文件共享者的角度來看,就是必須將共享文件的元數(shù)據(jù)信息以合理的方式發(fā)布。以Gnutella為代表的文件共享模型采用廣播方式檢索,其基本思想是“遍歷”所有節(jié)點(diǎn),元數(shù)據(jù)信息理論上來說放在任意一個(gè)節(jié)點(diǎn)均可。而在其他純P2P模式中,查詢消息都是有選擇地轉(zhuǎn)發(fā),查詢消息“經(jīng)過”的節(jié)點(diǎn)是有限的,只有這些節(jié)點(diǎn)上的元數(shù)據(jù)信息才能被訪問到。因此,作者在本模型中采用了分布式的元數(shù)據(jù)管理方法:對(duì)某一個(gè)共享文件的元數(shù)據(jù),拆分為若干元數(shù)據(jù)描述后分別發(fā)布致不同的節(jié)點(diǎn),其原理如圖2所示。對(duì)于某一共享文件的元數(shù)據(jù)集,對(duì)其中的每個(gè)元組依次進(jìn)行處理:對(duì)每一個(gè)元組(Sj,Pi,Oi),根據(jù)其屬性的值Oi,計(jì)算出一個(gè)節(jié)點(diǎn)標(biāo)識(shí)NodeIDi,在本文中,我們稱“標(biāo)識(shí)為NodeIDi的節(jié)點(diǎn)管理三元組(Sj,Pi,Oi)”,或“三元組(Sj,Pi,Oi)的管理節(jié)點(diǎn)是標(biāo)識(shí)為NodeIDi的節(jié)點(diǎn)”。在圖1所示的節(jié)點(diǎn)結(jié)構(gòu)中,“本節(jié)點(diǎn)負(fù)責(zé)管理的元數(shù)據(jù)集合”即存放所有由本節(jié)點(diǎn)管理的三元組。以此為基礎(chǔ),作者進(jìn)一步對(duì)純P2P系統(tǒng)中檢索機(jī)制進(jìn)行擴(kuò)展,使其能夠支持對(duì)多關(guān)鍵詞的檢索。3.3純p2p系統(tǒng)的多關(guān)鍵詞搜索3.3.1檢索節(jié)點(diǎn)國保護(hù)單關(guān)鍵詞檢索中有兩個(gè)要素:屬性及屬性的值。如檢索“‘標(biāo)題’為‘基于DMM的P2P文件共享模型’的文章”,則檢索要素是屬性“標(biāo)題”和屬性的值“基于DMM的P2P文件共享模型”。我們可以把檢索要求描述為:“給定(X,Pk,Ok)中Pk,Ok的值,求X的值”。檢索過程如下:(1)可從任意節(jié)點(diǎn)發(fā)起檢索。在檢索發(fā)起節(jié)點(diǎn)Nodebegin,利用本文第2部分的計(jì)算過程(1)得到節(jié)點(diǎn)標(biāo)識(shí)NodeIDk;(2)Nodebegin發(fā)送檢索消息給標(biāo)識(shí)為NodeIDk的節(jié)點(diǎn)Nodek;(3)在節(jié)點(diǎn)Nodek上,訪問由Nodek負(fù)責(zé)管理的元數(shù)據(jù)集,比較此元數(shù)據(jù)集中的每一個(gè)三元組(Sj,Pi,Oi),若Oi=Ok且Pi=Pk,則Sj是X的解,X=X∪{Sj};(4)向Nodebegin發(fā)送檢索結(jié)果X。在具體的實(shí)現(xiàn)中,我們用URIs(即URIref,稱為URI引用,在RDF規(guī)范中用于標(biāo)識(shí)陳述中的主體、謂詞和客體)標(biāo)識(shí)Sj,URIs中可包含URL,根據(jù)這個(gè)URL可以定位到共享的文件,用戶通過文件傳輸支持獲得文件副本。3.3.2復(fù)雜搜索3.3.2.對(duì)于共享的文件的檢索“與”操作的檢索要求可以描述為:“給定(X,Pi,Oi)和(X,Pj,Oj)中Pi,Oi,Pj,Oj的值,求同時(shí)滿足兩個(gè)三元組的X的值”。直觀地檢索方式是對(duì)兩個(gè)檢索條件分別求解,得到集合X1和X2,最后向用戶返回兩個(gè)集合的交集X,X=X1∩X2。但此方式效率并不高。在本文提出的模型中,由于每個(gè)節(jié)點(diǎn)上都保存了自己共享的文件的三元組信息,因此,只需要進(jìn)行一次檢索,在檢索得到的結(jié)果中就另一個(gè)檢索條件進(jìn)行比較即可,即:首先對(duì)“與”操作中的任意一個(gè)檢索條件(X,Pi,Oi)進(jìn)行處理,返回集合X1,對(duì)X1中的每個(gè)元素x,在x的存儲(chǔ)節(jié)點(diǎn)上取得關(guān)于x的所有三元組,對(duì)其中每個(gè)三元組(x,Pk,Ok)的Pk和Ok與檢索條件中的Pj,Oj進(jìn)行比較,若Pj=Pk且Oj=Ok,則x為檢索的解。事實(shí)上,多個(gè)條件的“與”操作也只需進(jìn)行一次檢索過程,在檢索得到的結(jié)果集中再就其他條件進(jìn)行比較。3.3.2.2.或“或”操作的實(shí)現(xiàn)較為簡單:單獨(dú)處理每一個(gè)檢索條件,將結(jié)果取合集。3.3.2.分布式無中央服務(wù)器“非”操作的檢索要求可以描述為:“給定Pj,Oj,求系統(tǒng)中所有滿足下述條件的x:若對(duì)x存在描述(x,Pj,Oi),則Oi≠Oj”。在本文討論的無中央服務(wù)器的模型中,任何一個(gè)節(jié)點(diǎn)上都不存在系統(tǒng)中所有共享文件的全集,因此,很難保證“非”操作的“查全”(即所有符合條件的對(duì)象都能夠被檢索到)。考慮到效率問題,可以在每個(gè)節(jié)點(diǎn)上保存最近幾次檢索的返回結(jié)果,對(duì)在該節(jié)點(diǎn)上發(fā)起的“非”操作檢索,以此集合作為隨機(jī)集合Z;以Pj,Oj為檢索條件進(jìn)行單關(guān)鍵詞檢索,檢索返回結(jié)果Y,最終向用戶返回X=Z-Y。3.3.2.“與”操作容易實(shí)現(xiàn)快速檢索條件基于上述三個(gè)操作的組合檢索,可以在返回結(jié)果中通過集合運(yùn)算得到。從上面的分析可以看出,“與”操作的優(yōu)化空間最大,因此,對(duì)包含“與”操作的復(fù)雜查詢的優(yōu)化原則是使“與”操作盡量移動(dòng)到檢索條件的最外層。限于篇幅,本文中不加以具體討論。4基于p-grid的dct算法為了驗(yàn)證本文提出的模型的可行性和正確性,作者開發(fā)了試驗(yàn)系統(tǒng)。并使用實(shí)驗(yàn)室的20臺(tái)PC機(jī)進(jìn)行了測(cè)試。試驗(yàn)系統(tǒng)建立在純P2P結(jié)構(gòu)的P-Grid文件共享模型基礎(chǔ)之上,P-Grid是由KarlAberer為首的P-Grid工作組研究提出的DHT算法的純P2P模型。選擇P-Grid模型的原因是其計(jì)算復(fù)雜度較低,研究小組事先已經(jīng)實(shí)現(xiàn)了系統(tǒng)原型,只需要在系統(tǒng)中增加發(fā)布和檢索模塊即可實(shí)現(xiàn)本文提出的支持多關(guān)鍵詞檢索的共享模型。4.1節(jié)點(diǎn)的創(chuàng)建模型P-Grid系統(tǒng)具有以下一些特征:(1)數(shù)據(jù)對(duì)象d由二進(jìn)制的標(biāo)識(shí)符來標(biāo)識(shí):(2)節(jié)點(diǎn)p也對(duì)應(yīng)于一個(gè)二進(jìn)制的標(biāo)識(shí)符:節(jié)點(diǎn)標(biāo)識(shí)符對(duì)應(yīng)于樹型結(jié)構(gòu)中的一條路徑,稱為節(jié)點(diǎn)路徑。(3)每個(gè)節(jié)點(diǎn)均負(fù)責(zé)管理一個(gè)搜索區(qū)間,節(jié)點(diǎn)p管理數(shù)據(jù)對(duì)象d的條件是:path(p)是key(d)的前綴。節(jié)點(diǎn)p稱為數(shù)據(jù)對(duì)象d的管理節(jié)點(diǎn)。而數(shù)據(jù)對(duì)象d由節(jié)點(diǎn)q提供共享,對(duì)象本身存儲(chǔ)在節(jié)點(diǎn)q上,節(jié)點(diǎn)q稱為數(shù)據(jù)對(duì)象d的存儲(chǔ)節(jié)點(diǎn)。(4)對(duì)于path(p)的任一長度為n的前綴b1…bn,節(jié)點(diǎn)p都維護(hù)了一張路由表,該表分層記錄了其它節(jié)點(diǎn)p′的地址,其中第n層中的節(jié)點(diǎn)p′和p具有長度為n的公共前綴,但第n+1位的值不同。路由表的第n層中p′構(gòu)成的集合記作refs(p,n),當(dāng)檢索請(qǐng)求的前n位和path(p)一致,但第n+1位與path(p)不匹配時(shí),節(jié)點(diǎn)p可通過refs(p,n)將請(qǐng)求路由到適當(dāng)?shù)墓?jié)點(diǎn)。P-Grid系統(tǒng)具體的結(jié)構(gòu)和檢索方法見參考文獻(xiàn)。此模型的關(guān)鍵:節(jié)點(diǎn)用二進(jìn)制串標(biāo)識(shí);作為一個(gè)文件共享系統(tǒng),將文件名作為關(guān)鍵特征,文件名在經(jīng)過映射后產(chǎn)生一個(gè)二進(jìn)制串key(d),根據(jù)key(d)通過節(jié)點(diǎn)間的轉(zhuǎn)發(fā)最終將d的描述信息存放于d的管理節(jié)點(diǎn)。4.2文件公共系統(tǒng)的實(shí)現(xiàn)根據(jù)本文提出的文件共享模型,只需要在原系統(tǒng)中添加發(fā)布和檢索模塊即可實(shí)現(xiàn)支持多關(guān)鍵詞檢索的文件共享系統(tǒng)。4.2.1文件特征描述擴(kuò)展對(duì)每個(gè)共享的文件,必須根據(jù)應(yīng)用的需求提供符合RDF規(guī)范的描述。在本實(shí)驗(yàn)系統(tǒng)中,對(duì)文件特征的描述我們使用了Dublincore核心元數(shù)據(jù)集,因此,對(duì)用戶提供的查詢也只基于此核心數(shù)據(jù)集,在實(shí)際的系統(tǒng)中,可以利用RDF規(guī)范的名空間擴(kuò)展進(jìn)行元數(shù)據(jù)描述擴(kuò)展,相應(yīng)地進(jìn)行查詢擴(kuò)展。下例所示為某文件的共享描述片段:4.2.2元數(shù)據(jù)發(fā)布在進(jìn)行發(fā)布時(shí),上例中的共享文件元數(shù)據(jù)信息拆分為:4.2.3關(guān)鍵信息檢索多關(guān)鍵詞檢索時(shí)的效率由幾個(gè)關(guān)鍵部分決定:映射、定位、定位后在管理文件中查找(如果需要進(jìn)行“與”操作優(yōu)化,再到存儲(chǔ)節(jié)點(diǎn)中比較),查詢結(jié)果返回。映射和定位由原P2P模型決定了效率,因此,定位到某一節(jié)點(diǎn)后,在此節(jié)點(diǎn)負(fù)責(zé)管理的元數(shù)據(jù)集合中查找是此模型檢索效率的一個(gè)關(guān)鍵點(diǎn)。也就是說,管理的信息以何種方式組織是影響系統(tǒng)檢索效率的一個(gè)重要環(huán)節(jié)。最簡單、擴(kuò)展性最好的方法是信息都以XML文件的方式存儲(chǔ),在XML文件中進(jìn)行檢索,使用訪問效率較高的SAX(SimpleAPIforXML)解析方式對(duì)XML文檔進(jìn)行一次掃描完成查找。另外,本實(shí)驗(yàn)系統(tǒng)中還嘗試了使用LDAP目錄方式來組織管理信息,利用其檢索效率高的特點(diǎn)支持檢索,但這種方式需要在節(jié)點(diǎn)上啟動(dòng)額外的LDAP目錄服務(wù),系統(tǒng)的靈活性受到限制。4.2.4描述組合檢索本實(shí)驗(yàn)系統(tǒng)元數(shù)據(jù)描述采用了DublinCore元數(shù)據(jù)集,支持對(duì)共享文件的題名(Title)、創(chuàng)建者(Creator)、主題(Subject)、描述(Description)、出版者(Publisher)、其他責(zé)任者(Contributor)、日期(Date)、類型(Type)、格式(Format)、標(biāo)識(shí)符(Identifier)、來源(Source)、語種(Language)、關(guān)聯(lián)(Relation)、覆蓋范圍(Coverage)和權(quán)限(Rights)等15個(gè)描述的組合檢索。4.3分布式元數(shù)據(jù)存儲(chǔ)節(jié)拍實(shí)驗(yàn)系統(tǒng)建立在P-Grid訪問模型之上,但對(duì)于其他采用結(jié)構(gòu)化純P2P模型的文件共享系統(tǒng)來說,同樣只需要增加發(fā)布和檢索模塊即可完成多關(guān)鍵詞檢索的功能。在功能增強(qiáng)的同時(shí),系統(tǒng)不可避免地產(chǎn)生新的開銷:計(jì)算開銷:對(duì)每個(gè)共享文件的元數(shù)據(jù)在發(fā)布以前必須進(jìn)行映射計(jì)算,對(duì)節(jié)點(diǎn)計(jì)算能力是一個(gè)新的負(fù)擔(dān);消息轉(zhuǎn)發(fā):每個(gè)元數(shù)據(jù)的發(fā)布都
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 合作預(yù)算合同范本
- 售后回購融資合同范例
- 二人合伙養(yǎng)狗合同范本
- 賣房定金違約合同范本
- 個(gè)人店面裝修合同范本
- 1內(nèi)9折回購合同范本
- 會(huì)展安裝設(shè)計(jì)合同范本
- 單位院子改造合同范本
- 單位刮大白合同范本
- 公司車輛洗車合同范例
- 靜脈留置針完整版課件
- GB/T 24475-2023電梯遠(yuǎn)程報(bào)警系統(tǒng)
- 統(tǒng)編教材四年級(jí)下冊(cè)語文第二單元教學(xué)解讀及建議1
- 《中式面點(diǎn)技藝(第二版)》教案(高教版)
- 六年級(jí)下冊(cè)數(shù)學(xué)同步學(xué)堂
- 通信施工安全生產(chǎn)培訓(xùn)(登高作業(yè)施工專題)
- 2015產(chǎn)后出血技能評(píng)分表new
- 人教版五年級(jí)下冊(cè)口算題大全(全冊(cè)齊全)
- 企業(yè)生產(chǎn)管理-9S現(xiàn)場(chǎng)管理培訓(xùn)PPT課件教材講義
- 護(hù)學(xué)崗值班登記表
- 2023年山東醫(yī)學(xué)高等專科學(xué)校高職單招(語文)試題庫含答案解析
評(píng)論
0/150
提交評(píng)論