網(wǎng)絡(luò)信息資源檢索與利用第二次作業(yè)_第1頁
網(wǎng)絡(luò)信息資源檢索與利用第二次作業(yè)_第2頁
網(wǎng)絡(luò)信息資源檢索與利用第二次作業(yè)_第3頁
網(wǎng)絡(luò)信息資源檢索與利用第二次作業(yè)_第4頁
網(wǎng)絡(luò)信息資源檢索與利用第二次作業(yè)_第5頁
已閱讀5頁,還剩1頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

網(wǎng)絡(luò)信息資源檢索與利用 課程實(shí)驗(yàn)第 2 次實(shí)驗(yàn)報(bào)告實(shí)驗(yàn)內(nèi)容及基本要求:實(shí)驗(yàn)項(xiàng)目名稱: 網(wǎng)絡(luò)搜索引擎的應(yīng)用實(shí)驗(yàn)類型: 驗(yàn)證每組人數(shù): 1實(shí)驗(yàn)內(nèi)容及要求: 1. 請(qǐng)分別針對(duì)網(wǎng)絡(luò)資源目錄使用的分類方法進(jìn)行舉例。2. 在yahoo的分類目錄中找到一條路徑指向網(wǎng)站論文:/Summer98/koumoutsakos.pdf。3. 在新浪網(wǎng)的分類目錄中找到一條路徑指向?qū)W校的網(wǎng)站:4. 在sohu的分類目錄中找到一條路徑指向網(wǎng)頁:/newbook/5. 請(qǐng)指出yahoo,sina,sohu的分類目錄之間的異同和優(yōu)劣(500字以內(nèi))6. 請(qǐng)了解google和baidu在進(jìn)行關(guān)鍵詞檢索中語法的異同,并說明這兩者在針對(duì)某一主題進(jìn)行檢索時(shí)檢索結(jié)果的差異以及對(duì)檢索意圖理解準(zhǔn)確度的差異。實(shí)驗(yàn)結(jié)果:1. 請(qǐng)分別針對(duì)網(wǎng)絡(luò)資源目錄使用的分類方法進(jìn)行舉例。(1) 主題分類法(2) 學(xué)科分類法(3) 圖書分類法(4) 分面組配法2. 在yahoo的分類目錄中找到一條路徑指向網(wǎng)站論文:/Summer98/koumoutsakos.pdf。3. 在新浪網(wǎng)的分類目錄中找到一條路徑指向?qū)W校的網(wǎng)站:4. 在sohu的分類目錄中找到一條路徑指向網(wǎng)頁:/newbook/5. 請(qǐng)指出yahoo,sina,sohu的分類目錄之間的異同和優(yōu)劣(500字以內(nèi))(一)Yahoo()Yahoo 是世界上最著名的網(wǎng)絡(luò)資源目錄。Yahoo的魅力,就在于它的可瀏覽式等級(jí)主題目錄。Yahoo按照主題建立分類索引,提供全面的分類體系結(jié)構(gòu),并結(jié)合高質(zhì)量的檢索軟件,成為網(wǎng)絡(luò)檢索工具的佼佼者和等級(jí)式風(fēng)絡(luò)資源目錄的典型代表。Yahoo采用多標(biāo)準(zhǔn)高類、多維展開的方式,能夠?yàn)槟骋恍畔⒃丛谄渚薮蟮姆诸惖燃?jí)結(jié)構(gòu)中提供不同的路徑分支入口,保證了從不同的路徑,為檢索相同內(nèi)容的不同用戶提供服務(wù)。對(duì)于交替類目,Yahoo利用了符號(hào)“”來表示,起到了類似于相關(guān)參照的作用,能夠指引用戶由某一子類目進(jìn)入Yahoo的瀏覽性等級(jí)結(jié)構(gòu)的其他分支中。(二)Open Directory()Open directory是手工編輯的目錄導(dǎo)航式搜索引擎,它由四萬多名志愿者編輯標(biāo)引加工數(shù)據(jù)并組織類目,自稱為世界上最權(quán)威的人工編輯的搜索引擎。大多數(shù)志愿者都對(duì)自己負(fù)責(zé)的部分相當(dāng)感興趣,有的就是該領(lǐng)域的專家權(quán)威,因此Open directory中有不少分類的內(nèi)容,特別是一些邊緣學(xué)科或冷門學(xué)科,要比Yahoo提供的全面得多,有的甚至在Yahoo中根本找不到對(duì)應(yīng)的分類。Open Directory - 開放目錄專案提供了一種以互聯(lián)網(wǎng)自我組織與管理的方式進(jìn)行發(fā)展用來滿足快速增長(zhǎng)的網(wǎng)站數(shù)量。隨著互聯(lián)網(wǎng)的增長(zhǎng),網(wǎng)民數(shù)量也隨之增加。這些網(wǎng)民能夠編輯管理一小部分網(wǎng)站,并且提供負(fù)責(zé)更多的編輯工作,整理清除沒有用的信息內(nèi)容,只保留最好的內(nèi)容。Open directory也提供關(guān)鍵詞檢索,分為簡(jiǎn)單檢索和高級(jí)檢索。在簡(jiǎn)單檢索中,支持布爾邏輯檢索。在高級(jí)檢索中提供了相關(guān)的選擇,包括選擇只檢索類目、只檢索站點(diǎn)等。同時(shí)它還提供了與其他搜索引擎的鏈接。Open directory是一個(gè)非常有前景的網(wǎng)絡(luò)資源目錄,它可無限擴(kuò)展的編輯人員,為其今后的發(fā)展注入了極大的活力,它的資源收錄的增長(zhǎng)速度,內(nèi)容的更新頻次,都是其他網(wǎng)絡(luò)資源目錄所無法比擬的。同時(shí),它詳盡的類目體系,開放的管理體制,都形成了其獨(dú)用的特色,成為用戶獲取網(wǎng)絡(luò)信息資源的重要門戶網(wǎng)站。(三)搜狐()搜狐的網(wǎng)絡(luò)資源目錄堪稱是我國第一部系統(tǒng)的網(wǎng)站分類法,對(duì)其他中主文網(wǎng)絡(luò)資源目錄的發(fā)展起到了積極的促進(jìn)作用。搜狐網(wǎng)絡(luò)資源目錄的分類體系的編制,基本上堅(jiān)持了在符合科學(xué)性原則的前提下,充分考慮網(wǎng)站資源和用戶的查詢習(xí)慣的原則。在搜狐的分類體系結(jié)構(gòu)中包括18個(gè)大類,涵蓋了50000多個(gè)不同層次的子類目,形成了一個(gè)十分龐大的樹狀結(jié)構(gòu),幾乎涉及所有的行業(yè)或者領(lǐng)域。它采用了“縱向成枝、橫向成網(wǎng)”、“主題法與分面組配法結(jié)合”的分類方式,根據(jù)網(wǎng)站的主題,首先把網(wǎng)站分為18個(gè)大類,再按細(xì)分主題層層分下去。然后,再根據(jù)不同用戶的使用習(xí)慣,以及不同的分類標(biāo)準(zhǔn),把不同類目下“相關(guān)”的類目“鏈接”起來,從而形成搜狐的“網(wǎng)狀”分類體系。搜狐的網(wǎng)站分類法以主題分類為主設(shè)立了娛樂休閑、工商經(jīng)濟(jì)、電腦網(wǎng)絡(luò)、分司企業(yè)、教育培訓(xùn)、文學(xué)、藝術(shù)、體育健身、新聞媒體、衛(wèi)生健康、科學(xué)技術(shù)、生活服務(wù)、旅游交通、社會(huì)文化、政法軍事、社會(huì)科學(xué)、個(gè)人主頁17個(gè)大類,另外結(jié)合分面組配的方法設(shè)立“國家與地區(qū)”類目,把其他17個(gè)大類下的所有網(wǎng)站又按所屬地域進(jìn)行分類,因?yàn)榇蠖鄶?shù)網(wǎng)站都具有地域性,也便于用戶直接查找。搜狐的網(wǎng)站資源目錄同樣是按照信息所屬的類別,層層點(diǎn)擊查找信息,所以用目錄時(shí)首先要考慮清楚想要查找的信息屬于哪個(gè)類別。6. 請(qǐng)了解google和baidu在進(jìn)行關(guān)鍵詞檢索中語法的異同,并說明這兩者在針對(duì)某一主題進(jìn)行檢索時(shí)檢索結(jié)果的差異以及對(duì)檢索意圖理解準(zhǔn)確度的差異。百度搜索引擎使用了高性能的“網(wǎng)絡(luò)蜘蛛”程序自動(dòng)的在互聯(lián)網(wǎng)中搜索信息,可定制、高擴(kuò)展性的調(diào)度算法使得搜索器能在極短的時(shí)間內(nèi)收集到最大數(shù)量的互聯(lián)網(wǎng)信息。百度搜索引擎的特點(diǎn)1. 基于字詞結(jié)合的信息處理方式。巧妙解決了中文信息的理解問題,極大地提高了搜索的準(zhǔn)確性和查全率。2. 支持主流的中文編碼標(biāo)準(zhǔn)。包括GBK(漢字內(nèi)碼擴(kuò)展規(guī)范)、GB2312(簡(jiǎn)體)、BIG5(繁體),并且能夠在不同的編碼之間轉(zhuǎn)換。3. 智能相關(guān)度算法。采用了基于內(nèi)容和基于超鏈分析相結(jié)合的方法進(jìn)行相關(guān)度評(píng)價(jià),能夠客觀分析網(wǎng)頁所包含的信息,從而最大限度保證了檢索結(jié)果相關(guān)性。4. 檢索結(jié)果能標(biāo)示豐富的網(wǎng)頁屬性(如標(biāo)題、網(wǎng)址、時(shí)間、大小、編碼、摘要等),并突出用戶的查詢串,便于用戶判斷是否閱讀原文。5. 百度搜索支持二次檢索(又稱漸進(jìn)檢索或逼進(jìn)檢索)。可在上次檢索結(jié)果中繼續(xù)檢索,逐步縮小查找范圍,直至達(dá)到最小、最準(zhǔn)確的結(jié)果集。利于用戶更加方便地在海量信息中找到自己真正感興趣的內(nèi)容。6. 相關(guān)檢索詞智能推薦技術(shù)。在用戶第一次檢索后,會(huì)提示相關(guān)的檢索詞,幫助用戶查找更相關(guān)的結(jié)果,統(tǒng)計(jì)表明可以促進(jìn)檢索量提升10-20%。7. 運(yùn)用多線程技術(shù)、高效的搜索算法、穩(wěn)定的UNIX平臺(tái)、和本地化的服務(wù)器,保證了最快的響應(yīng)速度。百度搜索引擎在中國境內(nèi)提供搜索服務(wù),可大大縮短檢索的響應(yīng)時(shí)間(一個(gè)檢索的平均響應(yīng)時(shí)間小于0.5秒)8. 可以提供一周、二周、四周等多種服務(wù)方式。可以在7天之內(nèi)完成網(wǎng)頁的更新,是目前更新時(shí)間最快、數(shù)據(jù)量最大的中文搜索引擎。9. 檢索結(jié)果輸出支持內(nèi)容類聚、網(wǎng)站類聚、內(nèi)容類聚+網(wǎng)站類聚等多種方式。支持用戶選擇時(shí)間范圍,提高用戶檢索效率。10. 智能性、可擴(kuò)展的搜索技術(shù)保證最快最多的收集互聯(lián)網(wǎng)信息。擁有目前世界上最大的中文信息庫,為用戶提供最準(zhǔn)確、最廣泛、最具時(shí)效性的信息提供了堅(jiān)實(shí)基礎(chǔ)。11. 分布式結(jié)構(gòu)、精心設(shè)計(jì)的優(yōu)化算法、容錯(cuò)設(shè)計(jì)保證系統(tǒng)在大訪問量下的高可用性、高擴(kuò)展性、高性能和高穩(wěn)定性。12. 高可配置性使得搜索服務(wù)能夠滿足不同用戶的需求。13. 先進(jìn)的網(wǎng)頁動(dòng)態(tài)摘要顯示技術(shù)。14. 獨(dú)有百度快照,15. 支持多種高級(jí)檢索語法,使用戶查詢效率更高、結(jié)果更準(zhǔn)。已支持“+”(AND)、“-”(NOT)、“|”(OR)、“site:”、“l(fā)ink:”,還將繼續(xù)增加其它高效的搜索語法。Google作為全球最大的多語言搜索引擎,在國際上占有的市場(chǎng)越來越大,成為互聯(lián)網(wǎng)最具潛力的企業(yè),以下就介紹下GOOGLE搜索引擎的主要特點(diǎn):1.特有的PR技術(shù),PR 能夠?qū)W(wǎng)頁的重要性做出客觀的評(píng)價(jià)。PR是GOOGLE評(píng)價(jià)一個(gè)網(wǎng)站質(zhì)量高低的重要標(biāo)準(zhǔn),PR分為十個(gè)等級(jí),從容不1至10,PR越高代表網(wǎng)站質(zhì)量和權(quán)威性越高,排名也就越靠前。2.更新和收錄快,GOOGLE收錄新站一般在十個(gè)工作日左右,是所有搜索引擎收錄最快的,更新也比較穩(wěn)定,一般一個(gè)星期都會(huì)有大的更新。3.重視鏈接的文字描述和鏈接的質(zhì)量,鏈接的文字描述也就是做鏈接用的文字,這個(gè)文字對(duì)GOOGLE排名起一定作用,因此我們建議如果網(wǎng)站要做某些關(guān)鍵詞,在交換鏈接時(shí)要用這個(gè)關(guān)鍵詞做鏈向你網(wǎng)站,鏈接的質(zhì)量與鏈接網(wǎng)站的權(quán)威性和與你站是否相關(guān)有關(guān),權(quán)威越高側(cè)你站獲得的排名越好,4.重視Description描述,多次研究發(fā)現(xiàn),那些在GOOGLE排名好的網(wǎng)站在描述中勻含有關(guān)鍵詞,而且有些重復(fù)二次,因此可推斷其對(duì)描述還是相當(dāng)重視。五、超文本匹配分析:Google 的搜索引擎同時(shí)也分析網(wǎng)頁內(nèi)容。并不采用單純掃描基于網(wǎng)頁的文本(網(wǎng)站發(fā)布商可以通過元標(biāo)記控制這類文本)的方式,而是分析網(wǎng)頁的全部?jī)?nèi)容以及字體、分區(qū)及每個(gè)文字精確位置等因素。同時(shí)還會(huì)分析相鄰網(wǎng)頁的內(nèi)容,以確保返回與用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論