(計(jì)算機(jī)應(yīng)用技術(shù)專業(yè)論文)對等網(wǎng)絡(luò)有效搜索機(jī)制研究.pdf_第1頁
(計(jì)算機(jī)應(yīng)用技術(shù)專業(yè)論文)對等網(wǎng)絡(luò)有效搜索機(jī)制研究.pdf_第2頁
(計(jì)算機(jī)應(yīng)用技術(shù)專業(yè)論文)對等網(wǎng)絡(luò)有效搜索機(jī)制研究.pdf_第3頁
(計(jì)算機(jī)應(yīng)用技術(shù)專業(yè)論文)對等網(wǎng)絡(luò)有效搜索機(jī)制研究.pdf_第4頁
(計(jì)算機(jī)應(yīng)用技術(shù)專業(yè)論文)對等網(wǎng)絡(luò)有效搜索機(jī)制研究.pdf_第5頁
已閱讀5頁,還剩99頁未讀 繼續(xù)免費(fèi)閱讀

(計(jì)算機(jī)應(yīng)用技術(shù)專業(yè)論文)對等網(wǎng)絡(luò)有效搜索機(jī)制研究.pdf.pdf 免費(fèi)下載

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

摘要 摘要 近年來睫羞i n t e r n e t 馳飛遙發(fā)聶,圈終袋寬懿成售增嬲 蔓及計(jì)算壤詩算g & 力 的大大提商,對等網(wǎng)絡(luò)引起了來自工業(yè)界和學(xué)術(shù)界越來越多的關(guān)注。對等網(wǎng)絡(luò)通 遘躥等幫分鑫式豹方式,在網(wǎng)絡(luò)審不閼節(jié)蠢瘸提供空闕戇c p u 處理黥力,磁盤 空間以及網(wǎng)絡(luò)帶寬的共孥。同任何大規(guī)模的分布式系統(tǒng)一樣,對等網(wǎng)絡(luò)系統(tǒng)成功 與西不僅仗在于箕潮絡(luò)結(jié)構(gòu)酌合理幫有簸,在糧大程度上取決予其資源查找楓稍 的靈活性和可擴(kuò)展性。國際上許多一流的大學(xué)和研究機(jī)構(gòu)都在積極從拳這方兩的 研究,國內(nèi)的相關(guān)研究剃起步較晚,本文將系統(tǒng)介紹作者在攻讀博士學(xué)位期間進(jìn) 行的有關(guān)對等網(wǎng)終有效搜索機(jī)制的磺究及取褥的一些成栗。 除了采用中央目錄服務(wù)器的集中式對等網(wǎng)絡(luò)之外,從網(wǎng)絡(luò)拓?fù)渖蠈Φ染W(wǎng)絡(luò)大 致霹激分兔無結(jié)鞠對等瓣絡(luò)幫蘩予分蠢式哈希表豹結(jié)擒鼗難等翊絡(luò)。蠢結(jié)構(gòu)對等 網(wǎng)絡(luò)采用類似泛洪的盲目搜索機(jī)制,雖然可以支持靈活的查詢,但搜索的效率和 可擴(kuò)展往都較低。結(jié)構(gòu)純對等網(wǎng)絡(luò)依據(jù)文檔標(biāo)諼符迸彳亍查找,可擴(kuò)震穗和查找效 率都很高,但不能直接支持多關(guān)鍵字的搜索。 本文籬先提蹦了無結(jié)構(gòu)對等網(wǎng)絡(luò)中基于興趣域的搜索模型,文檔通過元數(shù)據(jù) 進(jìn)行燃述,元數(shù)攘采用r d f 框絮以提供對文檔更睪塞靈活的攙述。像奪榻闌無 數(shù)據(jù)的不同節(jié)點(diǎn)同屬于一個興趣域。搜索請求在興趣域中進(jìn)行傳播可以大大提高 接索效率。逶過元數(shù)據(jù)選擇塞蜀蠢元數(shù)據(jù)鬣翻凝豢l 霹戳逡一步提高援索煞效攀。 模型分析和模擬實(shí)驗(yàn)驗(yàn)、證了基于興趣域搜索模型的有效性。 之后攢出了終構(gòu)純對等網(wǎng)絡(luò)中多關(guān)鍵字搜索模鍪,通過在簡單多關(guān)鍵字羧索 模型基礎(chǔ)上引入多關(guān)鍵字關(guān)聯(lián)的搜索模型可以大大降低霧關(guān)鍵字搜索對網(wǎng)絡(luò)帶 寬的消耗,模擬災(zāi)驗(yàn)也駿證了這一點(diǎn)。提出的基于文檔元數(shù)據(jù)完全表達(dá)式的多關(guān) 鍵字搜索模型以節(jié)點(diǎn)棗鑲空閑為代儈,霹以只謗鯔單個節(jié)點(diǎn)寵成多關(guān)鍵字搜索, 并進(jìn)一步提出了旗于關(guān)鍵字插入路徑后退的負(fù)載均衡機(jī)制。 最螽提出了嫠于語義豹殛意舞羚對等網(wǎng)絡(luò)覆索模型,逶過將語義攘索瑟和對 等網(wǎng)絡(luò)層分離實(shí)現(xiàn)更靈活的搜索功能。提出了文檔語義描述符的概念,用于進(jìn)行 搜索請求豹江配和路由。提出了文穢語義予空間韻概念,通過和文檔窩聞的分離 實(shí)現(xiàn)搜索與網(wǎng)絡(luò)拓?fù)錈o關(guān)。為了進(jìn)一步提高搜索的性能,提出了查詢歷史楓镥4 和 沿諗語義描述符緩存機(jī)制,減少了搜索過程訪問的節(jié)點(diǎn)數(shù)目并增大了搜索成功概 率,模撼安驗(yàn)驗(yàn)涯了這些壤剃對搜索性能戇改進(jìn)。 關(guān)鍵誦:對等網(wǎng)絡(luò);覆索:元數(shù)據(jù);趣城 語義海墓 a b s t r a c t w i t ht h e r a p i dg r o w t ho fi n t e r n e ta n dc o m p u t i n gp o w e r , p e e r - t o - p e e r ( p 2 p ) n e t w o r k sh a v eg a i n e dm u c ha t t e n t i o nf r o mb o t hi n d u s t r i a la n da c a d e m i cf i e l d s p 2 p n e t w o r k ss h a r ei d l ec p up o w e r , f r e ed i s k s p a c ea n dn e t w o r kb a n d w i d t hb e t w e e n d i f f e r e n tn o d e si nad i s t r i b u t e da n de q u a lw a y a sf o ra n yh e a v i l yu s e dl a r g e d i s t r i b u t e ds y s t e m s ,t h ee f f e c t i v e n e s so fap 2 pn e t w o r kl a r g e l yd e p e n d so nt h e v e r s a t i l i t ya n ds c a l a b i l i t y0 f i 乜s e a r c h m e c h a n i s m b e s i d e sc e n t r a l i z e ds y s t e m s p 2 pn e t w o r k sc a r lb er o u g h l yc l a s s i f i e di n t ot w o c a t e g o r i e s :u n s t r u c t u r e d a n dd h t - b a s e ds t r u c t u r e dp 2 pn e t w o r k s s e a r c h m e c h a m i s m si nu n s t r u c t e dp 2 pn e t w o r k sa l ei n h e r e n t l yb l i n d ,w h i c hm a k e st h es e a r c h i n e f f i c i e n ta n du n s c a l a b l e w h i l es t r u c t u r e dp 2 pn e t w o r k s c a r t p r o v i d e s e a r c h e f f i c i e n c ya n ds c a l a b i l i t yb yd e p l o y i n g i d e n t i f i e r - b a s e ds e a r c hm e c h a n i s m ,t h e yf a i lt o s u p p o r t f l e x i b l em u l t i k e y w o r ds e a r c hl i k eu n s t r u c t u r e dp 2 pn e t w o r k sd o i nt h e t h e s i s ,a n i n t e r e s t - d o m a i nb a s e ds e a r c hm o d e li nu n s t r u c t u r e dp 2 p n e t w o r k si s p r o p o s e d 。d o c u m e n t s a r ed e s c r i b e d b y m e t a d a t a u s i n g r d e i n t e r e s t d o m a i ni sf o r m e db yn o d e ss h a r i n gs a m em e t a d a t a s e a r c hr e q u e s t sa r e p r o p a g a t e dw i t h i nt h ei n t e r e s t - d o m a i na n d t h u se f f i c i e n t 。m e t a d a t as e l e c t i o nw i n d o w a n dm e t a d a t ar e p l i c a t i o nc a l lf u r t h e ri m p r o v et h es e a r c he f f i c i e n c y m o d e la n a l y s i s a n ds i m u l a t i o n s p r o v e t h ee f f i c t i v e n e s so f t h e p r o p o s e ds e a r c h m e c h a n i s m a f t e r 也a t am u l t i k e y w o r ds e a r c hm o d e lb a s e do nk e y w o r da s s o c i a t i o ni n s t r u c t u r e dp 2 pn e t w o r k si s p r o p o s e d t h es e a r c hm o d e li n c u r sm u c hl e s s n e t w o r k t r a f f i ct h a nt h en a i v em u l t i k e y w o r ds e a r c hm o d e l ,w h i c hi sp r o v e db ys i m u l a t i o n s 。 a n o t h e r m u l t i k e y w o r ds e a r c hm o d e l b a s e do nm e t a d a t a c o m p l e t eq u e r ye x p r e s s i o ni s p r o p o s e d ,w h i c h c a nf i n i s ha m u l t i - k e y w o r d s e a r c hb yc o n t a c t i n gj u s to n en o d ea tt h e c o s to f d i s k s p a c e t or e d u c et h ec o s t ,al o a d b a l a c i n gm e c h a n i s m i sa l s op r o p o s e d f i n a l l y , as e m a n t i c * b a s e ds e a r c hm o d e l o v e ra r b i t r a r yt o p o l o g yi np 2 pn e t w o r k s i sp r o p o s e di nt h et h e s i s b ys e p a r a t i n gs e m a n t i cs e a r c hl a y e rf r o mp 2 pl a y e r , t h e p r o p o s e dm o d e lc a np r o v i d ev e r yf l e x i b i l es e a r c hf u n c t i o n s s e m a n t i cd e s c r i p t o ri s u s e dt o p e r f o r mq u e r ym a t c h i n ga n dr o u t i n g t h r o u g ht h em e c h a n i s m so fq u e r y h i s t o r ya n dc a c h i n g o fs e m a n t i cd e s c r i p t o r sa l o n gt h es e a r c hp a t h ,t h ep e r f o r m a n c eo f t h es e a r c hm o d e li sh i g h l yi m p r o v e d ,w h i c hi sa l s os h o w e db ys i m u l a t i o n s k e yw o r d s :p e e r - t o p e e r ;s e a r c h ;m e t a d a t a ;i n t e r e s t - d o m a i n ;s e m a n c t i cv e c t o r 2 第1 章緒論 1 1 什么怒對等網(wǎng)絡(luò) 第1 章緒論 對等潮絡(luò)( p e e r - t o - p e e rn e t w o r k ) 是運(yùn)玨箏興怒懿熱門掰絡(luò)技術(shù),它瀲燮了 人們使用網(wǎng)絡(luò)的方式,也為未來網(wǎng)絡(luò)的發(fā)展提供了一秘毅的思路,財寒( f o r t u n e ) 雜志更將對簿網(wǎng)絡(luò)列為影嫡i n t e m e t 米來的四項(xiàng)秘技之一。顧名愚義,對簿網(wǎng)絡(luò) 打破了傳統(tǒng)的客戶機(jī)服務(wù)器模式,對簿網(wǎng)絡(luò)中的每個節(jié)點(diǎn)的地位都怒對等的。 每個節(jié)點(diǎn)既充當(dāng)服務(wù)器,為其他節(jié)點(diǎn)掇供服務(wù),間時也享用其他節(jié)點(diǎn)提供的服務(wù)。 對等網(wǎng)絡(luò)最為入 _ j 掰熟翔的斑麗穗子文件共享,鍘翻著名的n a p s t e r 【1 就怒利用 對等弼絡(luò)為愛象者鬟供桶互共事音樂文件酶一種服務(wù),并取褥了壓夫的成秘。對 等瓣絡(luò)靜概念勢不羈鞭予文傳鵑共李,它奩對等節(jié)熹之淄共事姿源幫黻勢,胃浚 共攀的計(jì)算規(guī)資源包括處理器的計(jì)算能力、存馕器秘磁數(shù)空閥等。對等嘲絡(luò)另一 個蓑名麴例子是搜尋步 太空鎪慧生愈頸墾s e t i h o m e 【2 】,這個項(xiàng)晷邋過共享瓤 i n t e r n e t 相聯(lián)的數(shù)目龐大的個人電腦的摩閑c p u 時聞來分析大型射電望遠(yuǎn)鏡搜集 的外太空信息,并期望從這些信息中找到外太空智慧生命的痕跡。 對等隨絡(luò)的概念其實(shí)稷翠虢有,襁直到近舉來隨著h a t e r n e t 觴飛速發(fā)藩、兩 絡(luò)帶寬豹蔽倍增嬲渡及計(jì)算瓿計(jì)算能力韻大大掇離,對等麗絳又虢一耱耨麓形式 弓l 起了人 j 麓美注。黻i n t e m e t 上豹信息嘗找爻鍘,i n t e m e t 上豹餐穗倍怠挺爆謄# 性墁長,但利用現(xiàn)有的餒侮搜索弓l 輦絨者門戶嬲涎瓤很雉找到實(shí)時信愚,因?yàn)闊o 論是剝溺c r a w l e r 搜瀑i n t e m e t 的搜索弓 擎還是對i n t e r n e t 內(nèi)容進(jìn)褥分類鼴門戶網(wǎng) 站郝無法以實(shí)對的方式處理不斷畿變化和增長的i n t e m e t 。頑將來則可能通過對 等網(wǎng)絡(luò)技術(shù),建立一種分布式的搜索引擎,每個提供信息服務(wù)的節(jié)點(diǎn)都對自己保 存的信惑編涮索瑤j ,并釃答其他節(jié)點(diǎn)的查詢請求,實(shí)現(xiàn)實(shí)時的查詢。 雖然邋年來弼絡(luò)帶燕成績瑤長,餐燕門滔杰仍然越來越熱,不臻囂負(fù),辯空 閑豹鏈漆帶寬毅自自浪費(fèi)。裁弼對等溺絡(luò)撬供豹分布式結(jié)構(gòu),可虢有效穩(wěn)衡負(fù)載, 充分剝賜黲塞。計(jì)算規(guī)的計(jì)算疑力按照摩拳定律程飛速的增長,但增宓鞋的詩冀能 力勞未被充分的挖撼,對等潮終為充分挖掇計(jì)弊楓空閹豹詩舞力提供了霹縫。 目前有關(guān)對等網(wǎng)絡(luò)的研究方興寒艾,國際上許多知名的大公司和一濾躺磺究 機(jī)構(gòu)及大學(xué)紛紛加入到對等網(wǎng)絡(luò)的研究行列中,并取得了一批盟著的成果。計(jì)算 機(jī)閼絡(luò)和數(shù)據(jù)通信領(lǐng)域簸具稅威的國際會議a c ms i g c o m mc o n f e r e n c e 3 1 自2 0 0 1 年起每年都會簸表數(shù)篇對等嗣絡(luò)磷究的最新論文,論文內(nèi)容涵盞了從對 等溺絡(luò)釃體系結(jié)構(gòu)薊瓷涿鴦我等蘸要方謠。這臻都寵分表弱了工照界和學(xué)術(shù)弊對 第1 章緒論 于對等網(wǎng)終技術(shù)的重援萋鞋其發(fā)騷的潛力。 國內(nèi)有關(guān)對等網(wǎng)絡(luò)的研究起步較晚,但j 履兩年有些高校通過和國外的研究機(jī) 辮或駑校會幸箏等方式邇程積掇秀矮穗關(guān)麴磅究。本文攙系統(tǒng)套綏終者奩攻瀆_ | 簿圭 學(xué)位期間進(jìn)行的有關(guān)對等網(wǎng)絡(luò)有效搜索機(jī)制的研究及取得的一毖成果。 1 2 對等網(wǎng)絡(luò)的應(yīng)用 對等嘲絡(luò)作為一靜凝興的網(wǎng)絡(luò)技術(shù),必將催生全新的應(yīng)用形式。雖然目前對 等閼絡(luò)主隳應(yīng)用在文件共享領(lǐng)域,戧根據(jù)辯等網(wǎng)絡(luò)工作組委員會( p e e r - t o - p e e r w o r k i n gg r o u p c o m m i t t e e ) 4 1 緞定義,它逐可以農(nóng)褒煌上有以下幾穢主要應(yīng)孀: 1 協(xié)同合作( c o l l a b o r a t i o n ) 對等潮絡(luò)胃激詿一個工佟奎縫建立和管理目步及菲閹步懿協(xié)同合佟,著掇離 他們的效率。利用對等網(wǎng)絡(luò)技術(shù),可以增進(jìn)成員間的合作效率和促進(jìn)生產(chǎn)力,減 少夜多個項(xiàng)目闊褥評估藕協(xié)調(diào)的靖簡,每個成員都可敬謗同最新的數(shù)據(jù)、充分分 享彼此的資源。 2 邊緣服務(wù)( e d g es e r v i c e ) 對等閼絡(luò)技寒霹數(shù)疑甓跨越不闋選域戇大型企業(yè)雀其內(nèi)部更有效魄提供著 傳遞信息,所謂邊緣服務(wù)就是指利用大型企業(yè)內(nèi)部存取信息的地域性,讓信息存 儲連更靠遙最終灞戶煞節(jié)燾上,幫礴絡(luò)豹邊緣。緩粥一家大鍪酌跨國公霹幕蘩透 過i n t e m e t 向其壘球的員工提供統(tǒng)一的培訓(xùn)課程。如果培訓(xùn)課稷的錄像存儲在中 央敝務(wù)器剮狠可能會造成網(wǎng)絡(luò)擁塞;知果在每個分都所農(nóng)地增加服務(wù)器存儲堵硼 課程錄像又會增加成本。利用對等網(wǎng)絡(luò),只褥將培訓(xùn)課程傳至備地的一個員工螅 計(jì)算機(jī)上,其他員工就可以通過對等網(wǎng)絡(luò)的方式得到培訓(xùn)錄像。 3 。分蠢式詩算( d i s t r i b u t e dc o m p u t i n g ) 對等網(wǎng)絡(luò)運(yùn)算可以幫助企業(yè)擁有強(qiáng)大的運(yùn)算熊力。通過網(wǎng)絡(luò)聯(lián)結(jié)在一起的包 括潮繡計(jì)算梳、個久詩算輥農(nóng)肉豹空閑c p u 時褥及存鏞空闋辮可充分裁愛。據(jù) f 5 1 在2 0 0 1 年初的估計(jì)。全球通過i n t e m e t 相聯(lián)的個人計(jì)算機(jī)可以提供至少i 0 0 億m h z 的c p u 處理能力和1 0 0 0 0 千千晁字節(jié)( t e r a b y t e ) 的存儲空間,可以預(yù) 計(jì),這些數(shù)據(jù)已經(jīng)遠(yuǎn)遠(yuǎn)小予囂前的實(shí)際數(shù)字。利用對等網(wǎng)絡(luò)技術(shù)來充分整合這些 閑鼴的計(jì)算機(jī)資源,不但可以為公司節(jié)省大項(xiàng)目的運(yùn)算成本,也不需只是為此大 矮甄瑤鬏夕 添鬟糗器設(shè)備,繁餐在溪 孛上靛支出。| ;圭i n t e l 公鐲為鍘,該公司美 國總部的員工就曾利用時差的影響,在i n t e l 公司設(shè)在以色列的分部的工程師們 下斑豁露闊,懣過基于對等瓣絡(luò)的分布式楚瑾程凈n e t b a t c h ,糕焉譴稍馥色舞溺 行空閑的計(jì)算機(jī)在八周內(nèi)完成了一個芯片的設(shè)計(jì)。沒有對等網(wǎng)絡(luò),這個項(xiàng)目至少 需要兩倍的時間才能完成。i n t e l 估計(jì)它利蔫對等闡絡(luò)節(jié)省的包括購買設(shè)備和縮短 4 第1 摩綣論 項(xiàng)疆周期黲費(fèi)鼴至少巍5 億美元【5 1 。 4 智能代理( i n t e l l i g e n ta g e n t ) 磐毖技理霹戳運(yùn)愛辯等網(wǎng)終技術(shù),魂態(tài)瓣在薅終圭一起送行耱弱z 終。運(yùn)行 于不同節(jié)點(diǎn)計(jì)算機(jī)( 如不同操作系統(tǒng)域不同的程序語言) 間的代理可以進(jìn)行信息 的傳遞幫格式轉(zhuǎn)換,代理還可瀲在對等網(wǎng)絡(luò)酌環(huán)境之下按事情豹優(yōu)先綴來藏行它 被安排的工作。 除了上面介紹的這數(shù)對等網(wǎng)絡(luò)常見的碰用之井,隨著對等網(wǎng)絡(luò)技術(shù)的逐漸成 熟,還產(chǎn)生了一些毅的艨鼴。如在【6 】申所提到蛇,可以通過對等網(wǎng)絡(luò)改變i n t e r n e t 現(xiàn)有的層次化的d n s 結(jié)構(gòu),建立分布式的繁于對鐐網(wǎng)絡(luò)的域名服務(wù)系統(tǒng);利用 薪出疆豹蒸予分淼式晗蘩表豹磚等網(wǎng)終縫穩(wěn),霹猷建立霹靠夔弱絡(luò)文 拳系統(tǒng) 利 用對等網(wǎng)絡(luò)技術(shù),建立分布式的電子郵件系統(tǒng),在郵件發(fā)送者和接受者之闖建立 直羧豹鏈按,不必遙過螽# 律服務(wù)器;剩角對等溺絡(luò)技術(shù)迸行受載筠麓,耢j 如臻來 緩角牮某些熱門網(wǎng)站的w e b 服務(wù)器上的負(fù)載等。 1 3 對等網(wǎng)絡(luò)研究的意義 對等爨終豹磺究基蔫藿黎上正處予毫潮驗(yàn)段。馘美爨先嘲,莢匿爨家皇然毒睪 學(xué)纂金( n a t i o n a ls c i e n c ef o u n d a t i o n ) 2 0 0 2 年度全部的資助總額為1 億4 千4 百 萬美元,藹其中逡1 0 8 , 6 靜1 2 衡萬美元震予資勁由m 疆等五家美國一流夫?qū)W秘研 究機(jī)構(gòu)聯(lián)合申請的對等網(wǎng)絡(luò)研究課題i r i s 項(xiàng)目【7 】。i r i s 項(xiàng)目的周期為五年, 其鞫標(biāo)是研制一個安全的、容錯的、分布式的數(shù)掭存儲系統(tǒng),或者簡單說,一個 終極的對等網(wǎng)絡(luò)系統(tǒng)。髓翦參與i r i s 項(xiàng)目的研究人員已經(jīng)取褥了一批成果,并 發(fā)襲了大嫩的論文。 國內(nèi)關(guān)于對等網(wǎng)絡(luò)豹磅究則別囂起步,哭奏少數(shù)見鬟大學(xué)纛扶事這嘉囂麴磺 究工作,而且成果不多。和其他已經(jīng)旗本成熟的領(lǐng)域不同,對等網(wǎng)絡(luò)研究從長遠(yuǎn) 來豢還其怒麗辯開始,溺蠢有飄會在這個矮城內(nèi)取褥蓍舔主一流豹戒菜秘領(lǐng)先靜 地使。雖然目前辯等網(wǎng)絡(luò)主要用于文件共拳,但對等網(wǎng)絡(luò)所提供的自組織的、分 布式的、以及節(jié)點(diǎn)間協(xié)聞合作的特傲使其可戳鞋 羹未來入們對計(jì)算更多的要求。 正如本章拜頭所說匏,也許對等網(wǎng)終會改變來來人們使用網(wǎng)絡(luò)的基本方式。 1 4 對等網(wǎng)絡(luò)褫究的關(guān)鍵閩題 對等麓絡(luò)酶褥究方兩主簧餐括體系結(jié)梭、援索提裁、潮絡(luò)安全戳及瓷源薷瑾 等方面。目前來糈,對等網(wǎng)絡(luò)的體系結(jié)構(gòu)發(fā)展方向是基于分布式哈希表的結(jié)構(gòu)化 對禱網(wǎng)絡(luò)。但無結(jié)構(gòu)對等兩絡(luò)由于冀管理簡單,搜索機(jī)制靈活,所以仍將在巢些 第l 章緒論 領(lǐng)域中得到廣泛的應(yīng)用。對等嬲絡(luò)的安全聞題主要是如傅在一個開放的巧境中茨 止惡意節(jié)點(diǎn)的攻擊,可以通過建立節(jié)點(diǎn)間的信譽(yù)機(jī)制等措旌改善對等網(wǎng)絡(luò)的安 全。 同任何大規(guī)模的分布式系統(tǒng)一樣,對等網(wǎng)絡(luò)系統(tǒng)成功與否不僅僅在于其網(wǎng)絡(luò) 結(jié)擒豹臺毽葙有效,在綴大程褒主取決于萁資源查援寢翻的靈活性和可擴(kuò)震往。 有效的搜索機(jī)制一直是對等網(wǎng)絡(luò)研究最活躍的領(lǐng)域之一,鼠然不斷有新的搜索機(jī) 制被提出,但還沒有哪釋搜索機(jī)制可以睨顙而出,成為最佳選擇。本論文將針 對這一峨鼷麗展開,希輟能為運(yùn)一方向的磷究提供一些鴦益的僚鑒。 1 。s 本文主要王作和章節(jié)安排 1 5 。1 本文主要工捧 本文烹要研究了在不同拓粹約束豹對等瞬絡(luò)中如河遺行有效的搜索。針對無 結(jié)構(gòu)對等網(wǎng)絡(luò)和結(jié)構(gòu)化對等網(wǎng)絡(luò)分別提出了新的搜索模型,并驗(yàn)證了玄們的存效 性。最后提出了可以構(gòu)建于任意拓?fù)涞膶Φ染W(wǎng)絡(luò)之上的蘩于語義的搜索模型。 本文主要敲了下垂一些鴦蔻竣工?。?1 ) 掇出了覓結(jié)構(gòu)對等網(wǎng)絡(luò)中基于興趣域的搜索機(jī)制。通過r d f 對文梢進(jìn) 行撼述,并存德在文檔元數(shù)據(jù)中。定義了存德鞠嗣元數(shù)蕹戇不溺節(jié)淼溺 屬一個興趣域,通過將搜索請求在興趣域中傳播可以大大提礴無結(jié)構(gòu)對 等網(wǎng)絡(luò)巾原來肖目搜索模型的效率。通過元數(shù)據(jù)選擇窗口和興趣域中韻 元數(shù)據(jù)笈制機(jī)制可以進(jìn)一步提高搜索的效率。模型分析和模擬實(shí)驗(yàn)驗(yàn)證 了所提機(jī)制的肖效性。 2 ) 提囊了續(xù)旃純磚等鼴絡(luò)孛多關(guān)鍵字搜索的蘧秘裁裁。褒楚擎多關(guān)鍵字攫 索模型的基礎(chǔ)上提出了多關(guān)鍵字關(guān)聯(lián)的搜索模烈,通過記錄關(guān)鍵字之間 豹關(guān)聯(lián)關(guān)系勢傈存美聯(lián)緊密豹關(guān)鍵字對癱文檔戮表豹交集可敬減少節(jié) 點(diǎn)間的交互和豳此引發(fā)的網(wǎng)絡(luò)流量,并通過模擬實(shí)驗(yàn)進(jìn)行了驗(yàn)證。提出 了基于文檔元數(shù)據(jù)韻多關(guān)鍵字搜索模壅,通過將文檔元數(shù)據(jù)襲達(dá)為憲全 焱詢表達(dá)式的形式勢取代文檔標(biāo)識德存健在關(guān)鍵字節(jié)點(diǎn)可以大大降低 對網(wǎng)絡(luò)帶寬的消耗,但代價是增加了對節(jié)點(diǎn)存儲空間的消耗,由此進(jìn)一 步提出了澮關(guān)漣字捶入路緞囂退戇受載:晦衡攫鍘。 3 ) 提出了然于語義的任意拓?fù)鋵Φ雀浇j(luò)搜索模型。通過將語義搜索層和對 等兩絡(luò)藩分離,實(shí)磊躉靈活靜搜索功箍。提密語義箍述符幫語義予空闖 的概念,利用文檔語義描述符進(jìn)行搜索的匹配和路由,利用語義子空間 保存語義描述符并實(shí)現(xiàn)和文檔的分離。掇出了焱詢歷史和沿途語義描述 6 第l 章縫論 符的緩存極制,進(jìn)一步提建了搜索的性能,改進(jìn)機(jī)制的有效蛙通過模數(shù) 實(shí)驗(yàn)得到了驗(yàn)證。 1 5 2 全文章節(jié)安排 第2 章介紹對等網(wǎng)絡(luò)按照不同拓?fù)浣Y(jié)構(gòu)的分類,以及各類中的典毅系統(tǒng),并 套綏了這夔系統(tǒng)采薅懿攘索撬鍘及其不是幫全文鼷到靜饕景躲滾。第3 章援密了 無結(jié)構(gòu)對等網(wǎng)絡(luò)中基于興趣域的搜索模型。第4 章提出了結(jié)構(gòu)化對等網(wǎng)絡(luò)中多關(guān) 鍵字的搜索模型和改進(jìn)方案,淤及負(fù)載均衡的楓翻。第5 章提出了基予語義納任 意撅撲搜索模型。最后一章對金文進(jìn)行了總結(jié),指出下一步的工作方向,并對對 等網(wǎng)絡(luò)的研究進(jìn)行了展勰。 , 第2 章對等嘲絡(luò)研究現(xiàn)狀及背景知識 第2 章對等網(wǎng)絡(luò)研究現(xiàn)狀及背景翔識 從最初以n a p s t e r 為代表的有麓中央目錄服務(wù)器的對等網(wǎng)絡(luò)結(jié)構(gòu),發(fā)展到后 來戳g n u t e l l a 為代表晌凳全分布式的覓結(jié)構(gòu)對等潮絡(luò)和提供節(jié)杰匿名發(fā)稚和獲 取文檔豹f r e e n e t ,髯蘩戮c a n 、c h o r d 、p a s t r y 籀t a p e s t r y 等為代表酌基予分奄 式噲希襲躲鐿構(gòu)純對簿穗絡(luò),瓣等網(wǎng)絡(luò)熬發(fā)震掰經(jīng)了大致三令除段,分別采建了 不同的資源定位和路婦模型。零章姆對這三秘最霪袋的對等網(wǎng)絡(luò)模型加以分纓, 并撼述三種慰等喇絡(luò)模壁中靛一些典型系統(tǒng),重點(diǎn)攢述它們所采翔的搜索釩鍛娃 及現(xiàn)有機(jī)制存在豹不怒。本章矮后對全文用到的一魑背景知識加以介紹。 2 。 集中式對等瑟絡(luò)系統(tǒng) 對等慰絳黃先雩 起人織戇注意是扶n a p s t e r 簿代開始豹,n a p s t e r 雖然不愚嚴(yán) 格意義上最早的對等網(wǎng)終,但卻是第一個通過i n t e m e t 獲得大規(guī)模應(yīng)用并取得巨 大成功的對等網(wǎng)終系絞。拋開法律上的因素不談,n a p s t e r 的成功得蘸予其采用 的綦于中央翻錄服務(wù)器的集中式對等嗣絡(luò)結(jié)構(gòu)?;柚醒肽夸浄?wù)器的對簿嘲絡(luò) 搜索模激工作方式如圖2 1 所示。圖中每個節(jié)點(diǎn)向中央肖錄服務(wù)器提交本地存儲 的文檔爨錄,并滏囂淥l 夔務(wù)器編鍘文校的素弓l 。節(jié)煮淘中央蘑淥黻務(wù)器發(fā)怒接索 請求,并出秘錄輟務(wù)器檢索本逑文踏索季l 囂返鬻存德玨醞文糖靜節(jié)熹逑簸。文襤 鶼下載纛按在搜索譴濃戇發(fā)起節(jié)點(diǎn)幫期望文檔麴存德螢愨之潺遴李亍,不再逶道中 央目錄服務(wù)器。 闡2 1 萋予巾交強(qiáng)錄耱務(wù)器納搜索橫擻 以n a p s t e r 為例,掰有節(jié)點(diǎn)共事酌文檔目漿存儲在一個中央目錄目酸務(wù)器上。 耨加入的節(jié)熹將其螫共攀靜文檔弱錄上傳剿秘添自餮務(wù)器,并國該駐務(wù)器對這蘩萄 錄稽怠避行索弓l 。節(jié)點(diǎn)纛找?guī)拖螺d文檔酶過程蕊下: g 第2 章對等魁絡(luò)研究現(xiàn)狀及背景知識 1 ) 當(dāng)節(jié)點(diǎn)a 震要凌技某個文檔時,該節(jié)點(diǎn)兩中央服務(wù)器撾交查詢請求,指 明欲查詢文檔的某些精性,例如作糟、關(guān)鍵字等。 2 ) 中突鼴務(wù)器逶過檢索移壤戇霞錄索零l ,找到共享該文毯戇舞務(wù)節(jié)點(diǎn),并 返回它們的i p 地址列表。 3 節(jié)點(diǎn)a 遴避院較返霞期表中各個節(jié)點(diǎn)p i n g 操佟完成熬時窩,選擇一個 時延最小的節(jié)點(diǎn)b 。 4 1 節(jié)點(diǎn)a 贏接連接節(jié)點(diǎn)b 并究成文檔下載,這一過程不再通道中央礴錄 暇務(wù)器。 從上面的過程我們可以著到,由于采用了中央目錄服務(wù)器,n a p s t e r 可以提 供快速難確懿接素騷努。攘索靛方式瞧可黻緞靈溪,其靈活程發(fā)秘準(zhǔn)確發(fā)取決予 用戶提供給目錄服務(wù)器的文檔目錄信息的翔實(shí)程度。但是這種結(jié)構(gòu)最大的缺陷在 于辮擴(kuò)袋穗不商,集中式韻孛央器錄服務(wù)器容易成為系統(tǒng)的蒎頸。n a p s t e r 靛另 外個缺陷是安眾性較蒺,密碼以明文傳輸,沒有認(rèn)證機(jī)制,不能提供匿名。 2 。2 無縫構(gòu)對等網(wǎng)絡(luò)系統(tǒng) 無結(jié)槐戇對笛網(wǎng)終系統(tǒng)袋用完全分毒式螅接羚雛梭,之疑以稱篡為“禿結(jié) 構(gòu)”,是和下一節(jié)將要介紹的結(jié)構(gòu)化對等網(wǎng)絡(luò)相對的。無結(jié)構(gòu)對等網(wǎng)絡(luò)中每個節(jié) 點(diǎn)之闖是淀較松散豹關(guān)系,節(jié)杰茲麓入幫嵩開僅鬟遵循一些籬擎靜麓爨。禿維梅 對鐮網(wǎng)絡(luò)中每個節(jié)點(diǎn)保存各自共享的文檔,由于不再存在中央目錄服務(wù)器,每個 節(jié)點(diǎn)對本玩保存的文檔進(jìn)行索弓l ,并轉(zhuǎn)發(fā)竣應(yīng)答其他節(jié)點(diǎn)的羧索請求。 在無結(jié)構(gòu)對簿網(wǎng)絡(luò)中,由予缺乏中央爨錄服務(wù)器且文檔并不存儲在特定的節(jié) 點(diǎn)上,所以資源查找最基本臼勺方式怒泛洪( f l o o d i n g ) 或類似泛洪的宵目搜索。 圖2 。2 是蘩予泛浹搜索模型黲示剿,圖孛每令節(jié)點(diǎn)熟憋接到豹搜索遺求轉(zhuǎn)發(fā)繪艨 有的鄰居節(jié)點(diǎn),并由鄰居節(jié)點(diǎn)進(jìn)一步轉(zhuǎn)發(fā)給更多的鄰居節(jié)點(diǎn),贏至找到期望的文 整藏者這翻系統(tǒng)允許靜最大搜索霧數(shù)焉援索失效。螽采娥凌我到輯需豹文擋,那 么搜索請求的發(fā)起節(jié)點(diǎn)直接從期望文檔的保存節(jié)點(diǎn)那里下載所需文檔。 擎 第2 章對等鼬絡(luò)研究理狀及弩最知識 墅2 2 基于泛洪靜搜索模型 由于采用完全分布式的網(wǎng)絡(luò)拓?fù)?,無結(jié)構(gòu)對等網(wǎng)絡(luò)避免了集中式對等網(wǎng)絡(luò)中 中受舀錄敝務(wù)器帶來的系統(tǒng)瓶頹的閩題。但 j = j 予無結(jié)構(gòu)對等潮絡(luò)中缺乏有效麴搜 索機(jī)制,只采用泛洪成類似泛洪的宙耳搜索方式,導(dǎo)致在網(wǎng)絡(luò)中產(chǎn)生過度的流 量,間樣影響了系統(tǒng)的可擴(kuò)展性。本文第3 章將著重介紹作者提出的在糞g n u t e l l a 靜蘢結(jié)茲慰等贐終中漿灝穎熬搜索掇鍘,以及它對系統(tǒng)搜索牲裁露霹擴(kuò)震牲黲攫 高。本節(jié)將對無縮構(gòu)對等網(wǎng)絡(luò)中的典型系統(tǒng)做一介紹。 2 2 1g n u t e l l a g n u t e l l af 8 1 怒無結(jié)構(gòu)對等網(wǎng)絡(luò)中的典型系統(tǒng),其他一些采用和g n u t e l l a 類似 設(shè)計(jì)的對等溺絡(luò)系統(tǒng)通常被稱為“類g n u t e l l a ”( g n u t e l l a 1 i k e ) 的無鰩構(gòu)對等網(wǎng) 絡(luò)系統(tǒng)。g n u t e l l a 的協(xié)議規(guī)范在【9 】中有詳細(xì)的描述。簡瓷之,g n u t e l l a 是一個用 于文檔共事的對鋒網(wǎng)絡(luò)系統(tǒng),謹(jǐn)通過將搜索請求同時轉(zhuǎn)發(fā)給盡可能多的鄰居節(jié)點(diǎn) 進(jìn) 亍文檔蛇援索,它還逶過設(shè)爨大予零的h l 僮寒限制每個搜索請求簧援的范 圍以避免過多的網(wǎng)絡(luò)流爨。對于大量分布在系統(tǒng)中的熱門文檔,g n u t e l l a 的工作 方式逮較蠢效。德對予分毒奩系統(tǒng)中少量繁點(diǎn)上翡舔鴦文檔,c m u t e l l a 只能通過 設(shè)簧較大的t t l 值才能有效的找到,但這又會產(chǎn)生大量的網(wǎng)絡(luò)流量。r i t t e r 通過 對g n u t e t l a 的援索協(xié)議迸寫亍分析發(fā)現(xiàn),對予一個能含1 8 個字節(jié)的援索請求,如 果將它同時轉(zhuǎn)發(fā)饗8 個鄰居節(jié)點(diǎn)著冀將t t l 也設(shè)為8 ,那么僅僅文檔的定位就掩 產(chǎn)生約1 2 g 字節(jié)的總流量 1 0 1 。 麓7 提毫g n u t e l l a 靜可擴(kuò)曩蛙,入囂】紛紛提壤了各秘改進(jìn)憋g n u t e l | a 攜議。 m o h r 在 1 1 】中提出了對g n u t e l l a 協(xié)議進(jìn)行擴(kuò)展,除了原肖的關(guān)鍵字搜索之外,增 鴦妥了逶過文檔內(nèi)容啥黍篷迸露接索瓣方式,霉美減鄉(xiāng)系統(tǒng)中有麓不同名字靛鞠蕊 文檔對搜索性能的影響。t h a d a n i 提出在g n u t e l l a 的搜索請求中同時包含元數(shù)據(jù) 和熒鍵字訝以提高搜索韻精度0 2 。r o h r s 提出通過在朔鄰節(jié)點(diǎn)之間交換各國保 l o 第2 章對等瞬辮醪 究現(xiàn)狀盈營爨知識 存文檔的關(guān)鍵字的方案來降低搜索轂?zāi)覊ㄐ?,提裹g n u t e l t a 蜓可擴(kuò)展陡 1 3 l 。l v 等在 1 4 1 中提出通過利用g n u t e l l a 網(wǎng)絡(luò)中的辮質(zhì)性,限制發(fā)往帶寬較小節(jié)點(diǎn)的搜 索請求數(shù)鬟,圈露增援黢往帶賽較大繁蠢豹羧素謗求數(shù)量來攝意g n u t e l l a 翁冒擴(kuò) 展性。s r i p a n i d k u l t h a i 通過研究g n u t e l l a 中搜索字符串的分布規(guī)律,發(fā)現(xiàn)它們遵 循z i 醛分稚,遴兩挺賚并通避實(shí)驗(yàn)驗(yàn)證,在系統(tǒng)節(jié)熹串緩存哪些最常被援索的 查詢結(jié)果可以大大降低網(wǎng)絡(luò)上由泛洪弓i 發(fā)的流量,提高系統(tǒng)的可擴(kuò)展性 1 5 】。此 外,s i n g l a 等還掇出了u l t r a p e e r sf 1 6 的改避方案,該方案選擇g n u t e l l a 網(wǎng)絡(luò)中 有整較高帶寬和計(jì)算2 力的節(jié)點(diǎn)擔(dān)當(dāng)超級節(jié)點(diǎn)的是色,具體方寨同下裁將要分纓 的基于f a s t t r a c k 的對等網(wǎng)絡(luò)系統(tǒng)類似。關(guān)于提高g n u t e l l a 可擴(kuò)展性的最新進(jìn)展 來囊 1 7 1 ,c h a w a t h e 等逶過對g n u t e l l a 羲設(shè)詩增熱了浚量控鍘、動態(tài)撅羚調(diào)楚、 以及用隨機(jī)步搜索替代泛洪搜索等改進(jìn)提出了一種新的無結(jié)構(gòu)對等網(wǎng)絡(luò)g i a ,并 驗(yàn)誕了它穗對于g n u t e l l a 三至五個數(shù)藿綴系統(tǒng)容蠢豹提離。 隨機(jī)步( r a n d o mw a l k ) 搜索從本質(zhì)上和泛洪搜索機(jī)制類似,都屬于盲目搜 索。和泛洪將搜索請求轉(zhuǎn)發(fā)給所有鄰精節(jié)點(diǎn)豹方式不同。隨機(jī)步采取的轉(zhuǎn)發(fā)方式 是將搜索潺求睫極轉(zhuǎn)發(fā)繪鄰魅節(jié)點(diǎn)中馳一個。一個隨機(jī)步定義為一個搜索進(jìn)程, 該搜索迸稷隨機(jī)的將用戶發(fā)出的搜索請求轉(zhuǎn)發(fā)給當(dāng)前節(jié)點(diǎn)的鄰居節(jié)點(diǎn)中的一個, 壹奎找至期望文檔,或者達(dá)到凝大兔誨搜索黟& 數(shù)囂搜索失敗。c o h e n 等在t 1 8 e e 證明了泛洪搜索的方式并不比隨機(jī)搜索個鄰居節(jié)點(diǎn)更加有效。 幫泛法援索糯潷,隧梳多疆索可戳丈大降低辯閼絡(luò)帶寬靜消耗,掇商系統(tǒng)的 可擴(kuò)展性,但是隨機(jī)步搜索方i 弋的一個主要缺陷是搜索的延時比較大。假設(shè)一個 隨機(jī)步搜索進(jìn)程需要經(jīng)過t 步才能完成搜索請求,那么n 個髓機(jī)步進(jìn)程同時進(jìn) 行搜索需要經(jīng)過的平均跳數(shù)為t n ,即搜索延時纓短為賑來的1 n 。采用n 令睫 機(jī)步的搜索方案帶來的網(wǎng)絡(luò)中流量的增加和單隨機(jī)步相比是線形的,并不會像泛 洪搜索郡群在弱絡(luò)中產(chǎn)燕遘量麴滾量,囂辯遴降低了擎涎褪步搜索帶來鮑辯廷, 因此是在網(wǎng)絡(luò)帶寬的消耗和搜索時延之間的一種折衷方案。 l v 等在【1 9 】串通過模擬實(shí)驗(yàn)驗(yàn)證了無結(jié)構(gòu)對等網(wǎng)絡(luò)中多隨機(jī)步搜索方案的 有效性,得出1 6 至6 4 個隨機(jī)步是b b 較恰當(dāng)?shù)倪x擇。實(shí)驗(yàn)表明采用多個隨機(jī)步的 搜索機(jī)制可以將泛洪搜索在網(wǎng)絡(luò)中產(chǎn)生的流量降低兩個數(shù)量級。g k a n t s i d i s 等在 2 0 e e 進(jìn)一步對炎結(jié)構(gòu)對等網(wǎng)絡(luò)中鮑隧?xiàng)鞑剿阉麇嘈辛丝芰糠衷?,勞摟基?dāng)瓣等 網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)是現(xiàn)出較強(qiáng)的簇的特性以及同一個節(jié)點(diǎn)惠復(fù)發(fā)出類似的搜索請 求辯,漣凝步搜索霹豁獲褥魄泛洪搜索雯努靜結(jié)萊。 2 。2 2f a s t t r a e k f a s t t r a c k 1 2 1 是箱子開發(fā)無結(jié)構(gòu)對等網(wǎng)絡(luò)系統(tǒng)的一個軟件德,基于f a s t t r a e k 第2 章對等嬲終研究現(xiàn)狀及背景知識 的對薅鼴終系統(tǒng)包括g r o k s t e r 【2 2 ,k a z a a 2 3 1 ,以及m o r p h e u s 【2 4 】等。這些系 統(tǒng)的共同特點(diǎn)就慰都包禽了“超級節(jié)點(diǎn)”( s u p e r p e e r ) 的概念。超級節(jié)點(diǎn)的結(jié)構(gòu) 整蘩了集中式對等隧終系統(tǒng)秘炎c m u t e l l a 豹完全分密式對等薅終系統(tǒng)豹佬點(diǎn),逶 過選擇系統(tǒng)中那些有著較高帶寬、較大的內(nèi)存和存儲空間以及較強(qiáng)的c p u 處理 麓力豹節(jié)煮為超綴節(jié)點(diǎn),并逶避超級幫點(diǎn)存儲其周闌箕穩(wěn)節(jié)點(diǎn)共享文秘靜索雩| 來 提商搜索的性能。超級節(jié)點(diǎn)除了繼續(xù)扮演本身的普通節(jié)點(diǎn)角色之外,迸擔(dān)當(dāng)周部 目錄服務(wù)器的角德,但和類似n a p s t e r 的集中式對等網(wǎng)絡(luò)系統(tǒng)中的中央目錄服務(wù) 器不同的楚,超級節(jié)點(diǎn)的選擇是動念靛,它們像鑿遐節(jié)點(diǎn)一樣,隨時可自& 離搿網(wǎng) 絡(luò),一旦系統(tǒng)發(fā)現(xiàn)某個越級節(jié)點(diǎn)不再工作,就采用某種選舉機(jī)制通過比較某個區(qū) 域淺節(jié)點(diǎn)瓣c p u 楚理熊力、內(nèi)存稆存鐮空闕匏大小以及嬲終蟄寬的麓低等資源 信息重新選擇一個資源豐富的節(jié)點(diǎn)擔(dān)任超級節(jié)點(diǎn)。 系統(tǒng)中繁點(diǎn)對于菜個姿滾豹查我褥善兔被發(fā)送給它所在區(qū)域的超綴節(jié)煮,翔 果這個超級節(jié)點(diǎn)沒有存儲關(guān)于該資源的任何信息,那么該超級節(jié)點(diǎn)繼續(xù)將查詢請 求轉(zhuǎn)發(fā)給其他超級節(jié)點(diǎn),這種轉(zhuǎn)發(fā)方式通常鏈泛洪的方式。僅在超級節(jié)點(diǎn)之間通 過髭洪轉(zhuǎn)發(fā)搜索試求可以大大降低對鼴絡(luò)靜寬的濺艇,露且可以在較少的跳數(shù)內(nèi) 覆靛系統(tǒng)中較多的節(jié)點(diǎn)。但為了維護(hù)周圍節(jié)點(diǎn)共享文檔的索引,超級節(jié)點(diǎn)本囊的 溺終豢寬瀵耗仍然攝大。采嗣怒綴節(jié)杰懿方式,掇裹了搜索豹羧蓋范潮,璜撩了 搜索系統(tǒng)中稀有文檔的成功概率。圖2 3 是旗于超級節(jié)點(diǎn)的搜索模型豕例。圖中 節(jié)點(diǎn)2 商它新藩涎域?qū)忟o超級節(jié)點(diǎn)3 上傳箕本翅文稻索零| ;節(jié)點(diǎn)1 商它掰在涎域 的超級節(jié)點(diǎn)4 發(fā)起搜索請求:節(jié)點(diǎn)4 沒有在本地存儲的文檔索引中找到匹配文檔, 于怒向其他超級節(jié)點(diǎn)泛洪轉(zhuǎn)發(fā)節(jié)點(diǎn)1 的搜索請求;超級節(jié)點(diǎn)3 收到援索請求后, 檢糞本地狂健蛉文檔素弓l ,發(fā)現(xiàn)節(jié)煮2 存鎂有匹醞魄文戡;節(jié)感3 將搜索結(jié)聚返 回給節(jié)點(diǎn)4 ,節(jié)點(diǎn)4 將結(jié)果返回節(jié)點(diǎn)1 ;節(jié)點(diǎn)1 聯(lián)系節(jié)點(diǎn)2 ,完成對期望文檔的 下羧。 第2 章對等髓綣研究現(xiàn)狀及背景知識 2 2 。3j x t a 圖2 3 基于超級節(jié)點(diǎn)的搜索模型 j x t a 項(xiàng)目 2 5 1 是由s u n 徽系統(tǒng)公司開發(fā)的一個對等網(wǎng)絡(luò)皮鼴平螽,它采用 基于x m l 和j a v a 的設(shè)計(jì)方式,主舜設(shè)計(jì)目標(biāo)是躊平臺、應(yīng)用的廣泛性、以及 不裁應(yīng)用之間的藏搡佟瞧。j x t a 采鯔t 三鼷鰉設(shè)計(jì)模式:核。層由受責(zé)節(jié)患約 發(fā)現(xiàn)、加入、刪除及內(nèi)窯共享等機(jī)制的節(jié)點(diǎn)組,負(fù)責(zé)消息傳輸?shù)墓?jié)點(diǎn)管道,和負(fù) 責(zé)訪潤控制及受載均餐等功煞靜節(jié)贏整控三部分繾藏;綴務(wù)菇包含節(jié)點(diǎn)肉餐索 引、搜索、緩存、以及對不同應(yīng)用的跨平臺支持的功能;應(yīng)用層通過服務(wù)層提供 的備種服務(wù),構(gòu)建各種基于j x t a 架構(gòu)的跨平臺對等網(wǎng)絡(luò)應(yīng)用。 j x t a 的搜索機(jī)制幽節(jié)點(diǎn)和搜索中心( s e a r c hh u b ) 構(gòu)成,搜索中心通豢選 擇那些高帶寬和商性能的節(jié)點(diǎn),每個節(jié)點(diǎn)扮演三種不同的角色:注冊糟、內(nèi)釋的 提供者及淤費(fèi)考。內(nèi)容提供節(jié)杰將對痰疼容戇元數(shù)據(jù)信惑主袋劐搜索審0 ;援素 中心收到搜索請求后,將其路由到合適的內(nèi)容提供節(jié)點(diǎn)那里。對j x t a 的搜索機(jī) 弗l 在【2 翻鞠f 2 7 】中有概簧的敘述。簸方式上葫,j x t a 酌援索稅鑭和蓊舔奔紹的基 于超級節(jié)點(diǎn)的搜索相類似,區(qū)別在于j x t a 中的搜索中心對搜索請求的路由方式 和越級節(jié)點(diǎn)不同,但j x t a 搜索框架的具體工作細(xì)節(jié)并沒有公殲。圖2 4 描述了 j x 姒搜索機(jī)制的基本糕架。 o o 第2 章對等時蜷研究現(xiàn)狀及背景螺識 2 。2 4f r e e n e t 潮2 4 基本d x t a 擅索框懿 f r e e n e t 【2 8 1 是一個究全分布式的,支持匿名的文檔存儲和獲取韻對等網(wǎng)絡(luò)系 統(tǒng)。嚴(yán)摻意義上,f r e e n e t 共不是像g n u t e l l a 那攆完全炙縫構(gòu)泌對等嘲絡(luò)系統(tǒng), 它可以歸為介于無結(jié)構(gòu)對等網(wǎng)絡(luò)和下一節(jié)將要介紹的結(jié)構(gòu)化對等網(wǎng)絡(luò)之間的一 類巍著松散結(jié)擒鶼對等網(wǎng)絡(luò)系統(tǒng)。c l a r k e 程 2 9 ,3 0 1 孛對f r e e n e t 豹設(shè)計(jì)骰了詳綢 的描述。f r e e n e t 設(shè)計(jì)的一個煎要目標(biāo)是支持文檔的發(fā)布者、存儲者、和請求者 的濺名性,為了實(shí)現(xiàn)這一強(qiáng)稱,f r e e n e t 中采用了和其 魏無結(jié)擒對等闞絡(luò)不閼的 文檔路由、接入及搜索方式。 f r e e n e t 中主器用到了兩種標(biāo)識符,一種是c h k ( c o n t e n t - h a s hk e y ) ,另外 一秘是s s k ( s i g n e d s u b s p a c ek e y ) ,c h k 照來?xiàng)濣円晌膿П旧?,覆s s k 則羈寒爨 識存儲c h k 的文檔。c h k 通過對文檔全文進(jìn)行哈希變換得到,而s s k 則通過 對發(fā)奄文糨蠲戶靛公鑰虢及恭述文撩瓣文本信惑避行晗希交換褥到,埝蔫交換算 法采用的是s h a - 1 【3 1 1 ,s h a - 1 可以保證對于不同輸入而生成相同哈希值的概率 幾乎為零。c h k 和s s k 在f r e e n e t 中有著不同韻作用:c h k 怒面向系統(tǒng)的,系 1 4 第2 章對等卿辮研究理狀盈背景婦識 統(tǒng)邋過c h k 路由、插入秘搜索文檔;薅s s k 里4 楚主要蘑向熙戶的,用戶可以逯 過對文檔簡要的描述找到自己感興趣的內(nèi)容,并通過s s k 找到c h k ,最終在系 絞中找到爨霉文撼。失了黠文摟內(nèi)騫提供繯護(hù),f r e e n e t 在文穢發(fā)毒之蘺逶道隨 機(jī)產(chǎn)生的加密密鑰對文檔內(nèi)容進(jìn)行加密,c h k 隨同解密密鑰一同存儲在s s k 所 標(biāo)談的文耥中。 f r e e n e t 通過s s k 為每個用戶創(chuàng)建一個瓤有的文檔名空間,可以更好的管理 不間用戶備自發(fā)布的文檔,只有名空問的所有者可以向其中寫入文檔,其他確戶 只能讀取名空聞中的文檔。為了生成s s k ,姆個用戶首先髓枧生成一對公鑰積私 鑰,私鑰用來對s s k 標(biāo)識的文檔簽名,以提供某種程度的文檔完整性。對于將 要發(fā)毒熬每個文檔,蠲戶提供一個燕短懿撰述,鍘翔 t e x t p h i l o s o p h y c o n f u c i u s a n a l e e t s ,通過對公鑰和描述文本分別進(jìn)行哈希變換,并 將結(jié)果連羧起來囂次進(jìn)行猞希嶷換,最終褥蠲該文檔鶼s s k 。s s k 蠲來菰諼存 儲文檔c h k 值和解密鐓鑰的文檔。關(guān)于文檔的簡騷描述和用戶的公鑰一起以帶 外( o u t o f - b a n d ,例如公布在菜個w e b 服務(wù)器上) 的方式發(fā)布出去。粥戶對一個 文檔的請求需要經(jīng)過鼴個步驟;酋先遇過文檔蛇描述信息和公鑰褥到s s k ,勢通 過s s k 得到包含文檔c h k 和解密密鑰的文檔;然后通過該文檔中的c h k 和解 密鬻鎊褥到最終瓣蜜豹文檔。這耱?qū)ξ臋n翔按謗閹熬努楚在予文擋豹囂瑟變?nèi)旄?加容易,由于文檔更新通常只是內(nèi)容的改變,而其描述信息是不變的,即s s k 絳掩不變,所以哭需將羹新燾文檔生成韻新c h k 靜氌替換籀應(yīng)s s k 搿標(biāo)識文檔 中的舊c h k 值即可,這對文檔的請求者是透明的。 f r e e n e t 中文檔的搜索請求是基于文檔標(biāo)識符進(jìn)行路由的,和在類g n u t e l l a 的籠結(jié)構(gòu)對等網(wǎng)絡(luò)中的囊曩搜索不同,f r e e n e t 采用靛是一罩申基于節(jié)點(diǎn)路l j 羥襲中 “掇示”信息的深度優(yōu)先搜索方式。所謂“提示”信息指的是存儲在節(jié)點(diǎn)路由表 中的形掘( 振識霉孥,節(jié)纛遮蛙) 豹二囂縫。每令節(jié)患逶道魄較| | 芟裂戇文檔標(biāo)諼符 和路由表中的各個標(biāo)識符,選擇一個數(shù)值最接近的表項(xiàng),并將收到的文檔標(biāo)識符 路港翻該襲頊串對應(yīng)靛節(jié)點(diǎn)。翔栗萊個節(jié)贏我不掰臺適的節(jié)熹來轉(zhuǎn)發(fā)搜索請求, 則將搜索請求返闡前一個節(jié)點(diǎn),前一個節(jié)點(diǎn)繼續(xù)將搜索請求轉(zhuǎn)發(fā)給路婦表中搬向 的下一個最接近節(jié)點(diǎn)。德一過程直持續(xù)到找到存儲匹配文檔的節(jié)點(diǎn),或者達(dá)到 最大搜索跳數(shù)最搜索失敗。 如果搜索成功,目的節(jié)點(diǎn)將所請求的文檔沿著搜索請求的來路原路返回,途 孛經(jīng)過戇每個螢愨都臻窩該文攫豹一個戮本,勞遴遘添鴦鬟蘸一個苓點(diǎn)籀返基文檔 的標(biāo)識符更新其路由表,直至返回搜索請求的發(fā)起節(jié)點(diǎn)。由于搜索請求和文檔返 回的路徑都是通過途中多個節(jié)點(diǎn)串聯(lián)起來的,每個節(jié)點(diǎn)都保留了文檔的副本并謊 稱融己是搜索的發(fā)起者戲者文檔的持有者,所以很難確定哪一個節(jié)點(diǎn)發(fā)起了搜索 1 5 第2 章對等嚼絡(luò)研究現(xiàn)狀及背景知識 請求以及哪一個節(jié)點(diǎn)存鼴了贗請求敕文摟,扶恧實(shí)現(xiàn)了黢名。搜索過程如圖2 5 所示。圖中節(jié)點(diǎn)1 發(fā)起搜索請求,并轉(zhuǎn)發(fā)給節(jié)點(diǎn)2 ;節(jié)點(diǎn)2 將搜索請求轉(zhuǎn)發(fā)繪路 由表中露繁熹 襲來文樓據(jù)識德最接送懿表壤對黢懿葦煮3 ;節(jié)熹3 沒有匹醞文 檔,返回節(jié)點(diǎn)2 ;節(jié)點(diǎn)2 繼續(xù)將搜索請求轉(zhuǎn)發(fā)給下一個最接近節(jié)點(diǎn)4 ;節(jié)點(diǎn)4 將 援索請求轉(zhuǎn)發(fā)給節(jié)贏l ,節(jié)點(diǎn)1 沒有疆配文檔

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論