網(wǎng)絡(luò)信息資源檢索和利用第二次作業(yè)_第1頁(yè)
網(wǎng)絡(luò)信息資源檢索和利用第二次作業(yè)_第2頁(yè)
網(wǎng)絡(luò)信息資源檢索和利用第二次作業(yè)_第3頁(yè)
網(wǎng)絡(luò)信息資源檢索和利用第二次作業(yè)_第4頁(yè)
網(wǎng)絡(luò)信息資源檢索和利用第二次作業(yè)_第5頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余1頁(yè)可下載查看

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、«網(wǎng)絡(luò)信息資源檢索與利用課程實(shí)驗(yàn)第2次實(shí)驗(yàn)報(bào)告實(shí)驗(yàn)容及基本要求:實(shí)驗(yàn)項(xiàng)目名稱:網(wǎng)絡(luò)搜索引擎的應(yīng)用實(shí)驗(yàn)類型:驗(yàn)證每組人數(shù):1 實(shí)驗(yàn)容及要求:1 .請(qǐng)分別針對(duì)網(wǎng)絡(luò)資源目錄使用的分類方法進(jìn)行舉例。2 . 在 yahoo 的分類目錄中找到一條路徑指向論文 /Summer98/koumoutsakos.pdf。3 .在新浪網(wǎng)的分類目錄中找到一條路徑指向?qū)W校的:4 .在sohu的分類目錄中找到一條路徑指向網(wǎng)頁(yè):book.sohu./newbook/5 .請(qǐng)指出yahoo,sina,sohu 的分類目錄之間的異同和優(yōu)劣(500字以)6 .請(qǐng)了解google和baid

2、u在進(jìn)行關(guān)鍵詞檢索中語(yǔ)法的異同,并說(shuō)明這兩者在針對(duì)某一主題進(jìn)行檢索時(shí)檢索結(jié)果的差異以及對(duì)檢索意圖理解準(zhǔn)確度的差異。實(shí)驗(yàn)結(jié)果:1.請(qǐng)分別針對(duì)網(wǎng)絡(luò)資源目錄使用的分類方法進(jìn)行舉例。(1) 主題分類法(2) 學(xué)科分類法(3) 圖書(shū)分類法(4) 分面組配法2 . 在 yahoo 的分類目錄中找到一條路徑指向論文 /Summer98/koumoutsakos.pdf。電 di 向E iwl 店以mwftftflfflgoiiviilwK pdf帝雷甌型JBH土卡才里E電目鼻翻Lg旬,3%修界府用科網(wǎng)用字巧鳥(niǎo)聲QQwww »*口MT網(wǎng)第i一一也用百度豆犀 工在 Mi

3、g 的 M st a #踮1冠 M 叼河由文 G dts.3LanlortL»*j15ujimnw,Ha|ik3um制33干通也/壯劃黑目巾脾力一口帆I(xiàn)工闊I偵二# ZtlMEUCI 9 K4aj 匕n4 u q 口才菱趣M t afT 9h 30 ? R q 啦 11MflwrxL startwd碼能置駐苗*1用理內(nèi)馨*二min" E 田g 瞇H 目*二由 sUDTdeAWuaniwS&AWEigz&QNd r. ili0I川通看4M5i3if'5L73|A. 30l2-4iS-14rfr*dua*Ddl網(wǎng)蕓132近原位置與n用*叫王雀二省科引尋售

4、邕IEE號(hào)司一 丫idq 的舊口A1141第昭的H同H電文 i£r.mhr±«kriri*H.kNjmaifutdr->d九 « PRPWrZ H T+R*-*MIWSPISW ; *w "Jid 喟必捕看wwwJD7»J.3En>lruNdJTaddMue 3EI"anda. . 2013431-EBt若世土工基目皿階*也軀f隼巧心國(guó)1巾FMWW *T4 3 .在新浪網(wǎng)的分類目錄中找到一條路徑指向?qū)W校的:tk丸原鼻 皿心需言趕士看|庭位士二|寺正寶家|船【推勺|事梅孰生三鼠|萌Ml |主知安|若"HS

5、h支二二 1:收二 1H 一 £E3*工血宜吸此r有如炯,問(wèn)2里1停北野舸花 怙七原蘆 二用七與三用 5三番酒Rifi好楠* WI1MJI 9GgFW*響xflm4«工蚪本科“過(guò)岫刖上端H.-IflfcM 審lLF11K3.M liZ-ftt-國(guó)dM:i 鼻注 lift Bakd狙4.在sohu的分類目錄中找到一條路徑指向網(wǎng)頁(yè):book.sohu./newbook/5.請(qǐng)指出yahoo,sina,sohu的分類目錄之間的異同和優(yōu)劣(500字以)(一)Yahoo (.)Yahoo是世界上最著名的網(wǎng)絡(luò)資源目錄。Yahoo的魅力,就在于它的可瀏覽式等級(jí)主題目錄。Yahoo按照主題

6、建立分類索引,提供全面的分類體系結(jié)構(gòu),并結(jié)合高質(zhì)量的檢索軟件,成為 網(wǎng)絡(luò)檢索工具的佼佼者和等級(jí)式風(fēng)絡(luò)資源目錄的典型代表。Yahoo采用多標(biāo)準(zhǔn)高類、多維展開(kāi)的方式,能夠?yàn)槟骋恍畔⒃丛谄渚薮蟮姆诸惖燃?jí)結(jié)構(gòu)中提供不同的路徑分支入口,保證了從不同的路徑,為檢索相同容的不同用戶提供服務(wù)。對(duì)于交替類目,Yahoo利用了符號(hào)“來(lái)表示,起到了類似于相關(guān)參照的作用,能夠指引用戶由某一子類目進(jìn)入Yahoo的瀏覽性等級(jí)結(jié)構(gòu)的其他分支中。(二)Open Directory ( )Open directory是手工編輯的目錄導(dǎo)航式搜索引擎,它由四萬(wàn)多名志愿者編輯標(biāo)引加工數(shù)據(jù)并組織類目,自稱為世界上最權(quán)威

7、的人工編輯的搜索引擎。大多數(shù)志愿者都對(duì)自己負(fù)責(zé)的部分相當(dāng)感興趣,有的就是該領(lǐng)域的專家權(quán)威,因此 Open directory 中有不少分類的容, 特別是一些邊緣學(xué)科或冷門(mén)學(xué)科,要比Yahoo提供的全面得多,有的甚至在Yahoo中根本找不到對(duì)應(yīng)白分類。 Open Directory -開(kāi)放目錄專案提供了一種以互聯(lián)網(wǎng)自我組織與管理的方式進(jìn)行發(fā)展用來(lái)滿足快速增長(zhǎng)的數(shù)量。隨著互聯(lián)網(wǎng)的增長(zhǎng),網(wǎng)民數(shù)量也隨之增加。這些網(wǎng)民能夠編輯管理一小部分,并且提供負(fù)責(zé)更多的編輯工作,整理清除沒(méi)有用的信息容,只保留最好的容。Open directory也提供關(guān)鍵詞檢索,分為簡(jiǎn)單檢索和高級(jí)檢索。在簡(jiǎn)單檢索中,支持布爾邏輯檢

8、索。在高級(jí)檢索中提供了相關(guān)的選擇,包括選擇只檢索類目、只檢索站點(diǎn)等。同時(shí)它還提供了與其他搜索引擎的。Open directory是一個(gè)非常有前景的網(wǎng)絡(luò)資源目錄,它可無(wú)限擴(kuò)展的編輯人員,為其今后的發(fā)展注入了極大的活力,它的資源收錄的增長(zhǎng)速度,容的更新頻次,都是其他網(wǎng)絡(luò)資源目錄所無(wú)法比擬的。同時(shí),它詳盡的類目體系,開(kāi)放的管理體制,都形成了其獨(dú)用的特色,成為用戶獲取網(wǎng)絡(luò)信息資源的重要門(mén)戶。(三)搜狐(.sohu.)搜狐的網(wǎng)絡(luò)資源目錄堪稱是我國(guó)第一部系統(tǒng)的分類法,對(duì)其他中主文網(wǎng)絡(luò)資源目錄的發(fā)展起到了積極的促進(jìn)作用。 搜狐網(wǎng)絡(luò)資源目錄的分類體系的編制,基本上堅(jiān)持了在符合科學(xué)性原則的前提下,充分考慮資源和

9、用戶的查詢習(xí)慣的原則。在搜狐的分類體系結(jié)構(gòu)中包括18個(gè)大類,涵蓋了 50000多個(gè)不同層次的子類目,形成了一個(gè)十分龐大的樹(shù)狀結(jié)構(gòu),幾乎涉及所有的行業(yè)或者領(lǐng)域。 它采用了 “縱向成枝、 橫向成網(wǎng)”、“主題法與分面組配法結(jié)合”的分 類方式,根據(jù)的主題,首先把分為18個(gè)大類,再按細(xì)分主題層層分下去。然后,再根據(jù)不同用戶的使用習(xí)慣,以及不同的分類標(biāo)準(zhǔn), 把不同類目下“相關(guān)”的類目起來(lái), 從而形 成搜狐的“網(wǎng)狀”分類體系。搜狐的分類法以主題分類為主設(shè)立了娛樂(lè)休閑、工商經(jīng)濟(jì)、電腦網(wǎng)絡(luò)、分司企業(yè)、教育培訓(xùn)、文學(xué)、藝術(shù)、體育健身、新聞媒體、衛(wèi)生健康、科學(xué)技術(shù)、生活服務(wù)、旅游交通、社會(huì)文化、政法軍事、社會(huì)科學(xué)、

10、個(gè)人主頁(yè)17個(gè)大類,另外結(jié)合分面組配的方法設(shè)立“國(guó)家與地區(qū)”類目, 把其他17個(gè)大類下的所有又按所屬地域進(jìn)行分類, 因?yàn)榇蠖鄶?shù)都具有地域性, 也便于用戶直接查找。 搜狐的資源目錄同樣是按照信息所屬的類 別,層層點(diǎn)擊查找信息,所以用目錄時(shí)首先要考慮清楚想要查找的信息屬于哪個(gè)類別。6.請(qǐng)了解google和baidu在進(jìn)行關(guān)鍵詞檢索中語(yǔ)法的異同,并說(shuō)明 這兩者在針對(duì)某一主題進(jìn)行檢索時(shí)檢索結(jié)果的差異以及對(duì)檢索意圖 理解準(zhǔn)確度的差異。百度搜索引擎使用了高性能的“網(wǎng)絡(luò)蜘蛛”程序自動(dòng)的在互聯(lián)網(wǎng)中搜索信息,可定制、高擴(kuò)展性的調(diào)度算法使得搜索器能在極短的時(shí)間收集到最大數(shù)量的互聯(lián)網(wǎng)信息。百度搜索引擎的特點(diǎn)1 .基

11、于字詞結(jié)合的信息處理方式。巧妙解決了中文信息的理解問(wèn)題,極提高了搜索的準(zhǔn)確 性和查全率。2 .支持主流的中文編碼標(biāo)準(zhǔn)。包括GBK雙字碼擴(kuò)展規(guī))、GB2312(簡(jiǎn)體)、BIG5(繁體),并且能夠在不同的編碼之間轉(zhuǎn)換。3 .智能相關(guān)度算法。采用了基于容和基于超鏈分析相結(jié)合的方法進(jìn)行相關(guān)度評(píng)價(jià),能夠客 觀分析網(wǎng)頁(yè)所包含的信息,從而最大限度保證了檢索結(jié)果相關(guān)性。4 .檢索結(jié)果能標(biāo)示豐富的網(wǎng)頁(yè)屬性(如標(biāo)題、網(wǎng)址、時(shí)間、大小、編碼、摘要等 ),并突出用戶的查詢串,便于用戶判斷是否閱讀原文。5 .百度搜索支持二次檢索(又稱漸進(jìn)檢索或逼進(jìn)檢索)??稍谏洗螜z索結(jié)果中繼續(xù)檢索,逐 步縮小查找圍,直至達(dá)到最小、最準(zhǔn)

12、確的結(jié)果集。利于用戶更加方便地在海量信息中找到自 己真正感興趣的容。6 .相關(guān)檢索詞智能推薦技術(shù)。在用戶第一次檢索后,會(huì)提示相關(guān)的檢索詞,幫助用戶查找 更相關(guān)的結(jié)果,統(tǒng)計(jì)表明可以促進(jìn)檢索量提升10-20%。7 .運(yùn)用多線程技術(shù)、 高效的搜索算法、穩(wěn)定的 UNIX平臺(tái)、和本地化的服務(wù)器,保證了最快 的響應(yīng)速度。百度搜索引擎在中國(guó)境提供搜索服務(wù),可大大縮短檢索的響應(yīng)時(shí)間(一個(gè)檢索的平均響應(yīng)時(shí)間小于 0.5秒)8 .可以提供一周、二周、四周等多種服務(wù)方式??梢栽?天之完成網(wǎng)頁(yè)的更新,是目前更新時(shí)間最快、數(shù)據(jù)量最大的中文搜索引擎。9 .檢索結(jié)果輸出支持容類聚、類聚、容類聚+類聚等多種方式。支持用戶選擇

13、時(shí)間圍,提高用戶檢索效率。10 .智能性、可擴(kuò)展的搜索技術(shù)保證最快最多的收集互聯(lián)網(wǎng)信息。擁有目前世界上最大的中文信息庫(kù),為用戶提供最準(zhǔn)確、最廣泛、最具時(shí)效性的信息提供了堅(jiān)實(shí)基礎(chǔ)。11 .分布式結(jié)構(gòu)、精心設(shè)計(jì)的優(yōu)化算法、 容錯(cuò)設(shè)計(jì)保證系統(tǒng)在大訪問(wèn)量下的高可用性、高擴(kuò)展性、高性能和高穩(wěn)定性。12 .高可配置性使得搜索服務(wù)能夠滿足不同用戶的需求。13 .先進(jìn)的網(wǎng)頁(yè)動(dòng)態(tài)摘要顯示技術(shù)。14 .獨(dú)有百度快照,15 .支持多種高級(jí)檢索語(yǔ)法,使用戶查詢效率更高、結(jié)果更準(zhǔn)。已支持“+”(AND)、“-"(NOT)、“|"(OR)、“site: "、“l(fā)ink: ",還將繼

14、續(xù)增加其它高效的搜索語(yǔ)法。Google作為全球最大的多語(yǔ)言搜索引擎,在國(guó)際上占有的市場(chǎng)越來(lái)越大,成為互聯(lián)網(wǎng)最具潛力的企業(yè),以下就介紹下 GOOGLE索引擎的主要特點(diǎn):1 .特有的PR技術(shù),PR能夠?qū)W(wǎng)頁(yè)的重要性做出客觀的評(píng)價(jià)。PR是GOOGL呼價(jià)一個(gè)質(zhì)量高低的重要標(biāo)準(zhǔn),PR分為十個(gè)等級(jí),從容不 1至10, PR越高代表質(zhì)量和權(quán)威性越高,排名也就越罪刖。2 .更新和收錄快,GOOGL敢錄新站一般在十個(gè)工作日左右,是所有搜索引擎收錄最快的, 更新也比較穩(wěn)定,一般一個(gè)星期都會(huì)有大的更新。3 .重視的文字描述和的質(zhì)量,的文字描述也就是做用的文字,這個(gè)文字對(duì) GOOGL琲名起一 定作用,因此我們建議如果要做某些關(guān)鍵詞, 在交換時(shí)要用這個(gè)關(guān)鍵詞做鏈向你, 的質(zhì)量與 的權(quán)威性和與你站是否相關(guān)有關(guān),權(quán)威越高側(cè)你站獲得的排名越好,4 .重視Description 描述,多次研究發(fā)現(xiàn),那些在GOOGL排名好的在描述中勻含有關(guān)鍵詞, 而且有些重復(fù)二次,因此可推斷其對(duì)描述還是相當(dāng)重視。五、超文本匹配分析:Google的搜索引擎同時(shí)也分析網(wǎng)頁(yè)容。 并不采用單純掃描基于網(wǎng)頁(yè)的 文本(發(fā)布商可以通過(guò)元標(biāo)記控制這類文本 )的方式,而是

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論