




已閱讀5頁,還剩1頁未讀, 繼續(xù)免費閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
網(wǎng)絡信息資源檢索與利用 課程實驗第 2 次實驗報告實驗內(nèi)容及基本要求:實驗項目名稱: 網(wǎng)絡搜索引擎的應用實驗類型: 驗證每組人數(shù): 1實驗內(nèi)容及要求: 1. 請分別針對網(wǎng)絡資源目錄使用的分類方法進行舉例。2. 在yahoo的分類目錄中找到一條路徑指向網(wǎng)站論文:/Summer98/koumoutsakos.pdf。3. 在新浪網(wǎng)的分類目錄中找到一條路徑指向?qū)W校的網(wǎng)站:4. 在sohu的分類目錄中找到一條路徑指向網(wǎng)頁:/newbook/5. 請指出yahoo,sina,sohu的分類目錄之間的異同和優(yōu)劣(500字以內(nèi))6. 請了解google和baidu在進行關(guān)鍵詞檢索中語法的異同,并說明這兩者在針對某一主題進行檢索時檢索結(jié)果的差異以及對檢索意圖理解準確度的差異。實驗結(jié)果:1. 請分別針對網(wǎng)絡資源目錄使用的分類方法進行舉例。(1) 主題分類法(2) 學科分類法(3) 圖書分類法(4) 分面組配法2. 在yahoo的分類目錄中找到一條路徑指向網(wǎng)站論文:/Summer98/koumoutsakos.pdf。3. 在新浪網(wǎng)的分類目錄中找到一條路徑指向?qū)W校的網(wǎng)站:4. 在sohu的分類目錄中找到一條路徑指向網(wǎng)頁:/newbook/5. 請指出yahoo,sina,sohu的分類目錄之間的異同和優(yōu)劣(500字以內(nèi))(一)Yahoo()Yahoo 是世界上最著名的網(wǎng)絡資源目錄。Yahoo的魅力,就在于它的可瀏覽式等級主題目錄。Yahoo按照主題建立分類索引,提供全面的分類體系結(jié)構(gòu),并結(jié)合高質(zhì)量的檢索軟件,成為網(wǎng)絡檢索工具的佼佼者和等級式風絡資源目錄的典型代表。Yahoo采用多標準高類、多維展開的方式,能夠為某一信息源在其巨大的分類等級結(jié)構(gòu)中提供不同的路徑分支入口,保證了從不同的路徑,為檢索相同內(nèi)容的不同用戶提供服務。對于交替類目,Yahoo利用了符號“”來表示,起到了類似于相關(guān)參照的作用,能夠指引用戶由某一子類目進入Yahoo的瀏覽性等級結(jié)構(gòu)的其他分支中。(二)Open Directory()Open directory是手工編輯的目錄導航式搜索引擎,它由四萬多名志愿者編輯標引加工數(shù)據(jù)并組織類目,自稱為世界上最權(quán)威的人工編輯的搜索引擎。大多數(shù)志愿者都對自己負責的部分相當感興趣,有的就是該領(lǐng)域的專家權(quán)威,因此Open directory中有不少分類的內(nèi)容,特別是一些邊緣學科或冷門學科,要比Yahoo提供的全面得多,有的甚至在Yahoo中根本找不到對應的分類。Open Directory - 開放目錄專案提供了一種以互聯(lián)網(wǎng)自我組織與管理的方式進行發(fā)展用來滿足快速增長的網(wǎng)站數(shù)量。隨著互聯(lián)網(wǎng)的增長,網(wǎng)民數(shù)量也隨之增加。這些網(wǎng)民能夠編輯管理一小部分網(wǎng)站,并且提供負責更多的編輯工作,整理清除沒有用的信息內(nèi)容,只保留最好的內(nèi)容。Open directory也提供關(guān)鍵詞檢索,分為簡單檢索和高級檢索。在簡單檢索中,支持布爾邏輯檢索。在高級檢索中提供了相關(guān)的選擇,包括選擇只檢索類目、只檢索站點等。同時它還提供了與其他搜索引擎的鏈接。Open directory是一個非常有前景的網(wǎng)絡資源目錄,它可無限擴展的編輯人員,為其今后的發(fā)展注入了極大的活力,它的資源收錄的增長速度,內(nèi)容的更新頻次,都是其他網(wǎng)絡資源目錄所無法比擬的。同時,它詳盡的類目體系,開放的管理體制,都形成了其獨用的特色,成為用戶獲取網(wǎng)絡信息資源的重要門戶網(wǎng)站。(三)搜狐()搜狐的網(wǎng)絡資源目錄堪稱是我國第一部系統(tǒng)的網(wǎng)站分類法,對其他中主文網(wǎng)絡資源目錄的發(fā)展起到了積極的促進作用。搜狐網(wǎng)絡資源目錄的分類體系的編制,基本上堅持了在符合科學性原則的前提下,充分考慮網(wǎng)站資源和用戶的查詢習慣的原則。在搜狐的分類體系結(jié)構(gòu)中包括18個大類,涵蓋了50000多個不同層次的子類目,形成了一個十分龐大的樹狀結(jié)構(gòu),幾乎涉及所有的行業(yè)或者領(lǐng)域。它采用了“縱向成枝、橫向成網(wǎng)”、“主題法與分面組配法結(jié)合”的分類方式,根據(jù)網(wǎng)站的主題,首先把網(wǎng)站分為18個大類,再按細分主題層層分下去。然后,再根據(jù)不同用戶的使用習慣,以及不同的分類標準,把不同類目下“相關(guān)”的類目“鏈接”起來,從而形成搜狐的“網(wǎng)狀”分類體系。搜狐的網(wǎng)站分類法以主題分類為主設立了娛樂休閑、工商經(jīng)濟、電腦網(wǎng)絡、分司企業(yè)、教育培訓、文學、藝術(shù)、體育健身、新聞媒體、衛(wèi)生健康、科學技術(shù)、生活服務、旅游交通、社會文化、政法軍事、社會科學、個人主頁17個大類,另外結(jié)合分面組配的方法設立“國家與地區(qū)”類目,把其他17個大類下的所有網(wǎng)站又按所屬地域進行分類,因為大多數(shù)網(wǎng)站都具有地域性,也便于用戶直接查找。搜狐的網(wǎng)站資源目錄同樣是按照信息所屬的類別,層層點擊查找信息,所以用目錄時首先要考慮清楚想要查找的信息屬于哪個類別。6. 請了解google和baidu在進行關(guān)鍵詞檢索中語法的異同,并說明這兩者在針對某一主題進行檢索時檢索結(jié)果的差異以及對檢索意圖理解準確度的差異。百度搜索引擎使用了高性能的“網(wǎng)絡蜘蛛”程序自動的在互聯(lián)網(wǎng)中搜索信息,可定制、高擴展性的調(diào)度算法使得搜索器能在極短的時間內(nèi)收集到最大數(shù)量的互聯(lián)網(wǎng)信息。百度搜索引擎的特點1. 基于字詞結(jié)合的信息處理方式。巧妙解決了中文信息的理解問題,極大地提高了搜索的準確性和查全率。2. 支持主流的中文編碼標準。包括GBK(漢字內(nèi)碼擴展規(guī)范)、GB2312(簡體)、BIG5(繁體),并且能夠在不同的編碼之間轉(zhuǎn)換。3. 智能相關(guān)度算法。采用了基于內(nèi)容和基于超鏈分析相結(jié)合的方法進行相關(guān)度評價,能夠客觀分析網(wǎng)頁所包含的信息,從而最大限度保證了檢索結(jié)果相關(guān)性。4. 檢索結(jié)果能標示豐富的網(wǎng)頁屬性(如標題、網(wǎng)址、時間、大小、編碼、摘要等),并突出用戶的查詢串,便于用戶判斷是否閱讀原文。5. 百度搜索支持二次檢索(又稱漸進檢索或逼進檢索)??稍谏洗螜z索結(jié)果中繼續(xù)檢索,逐步縮小查找范圍,直至達到最小、最準確的結(jié)果集。利于用戶更加方便地在海量信息中找到自己真正感興趣的內(nèi)容。6. 相關(guān)檢索詞智能推薦技術(shù)。在用戶第一次檢索后,會提示相關(guān)的檢索詞,幫助用戶查找更相關(guān)的結(jié)果,統(tǒng)計表明可以促進檢索量提升10-20%。7. 運用多線程技術(shù)、高效的搜索算法、穩(wěn)定的UNIX平臺、和本地化的服務器,保證了最快的響應速度。百度搜索引擎在中國境內(nèi)提供搜索服務,可大大縮短檢索的響應時間(一個檢索的平均響應時間小于0.5秒)8. 可以提供一周、二周、四周等多種服務方式。可以在7天之內(nèi)完成網(wǎng)頁的更新,是目前更新時間最快、數(shù)據(jù)量最大的中文搜索引擎。9. 檢索結(jié)果輸出支持內(nèi)容類聚、網(wǎng)站類聚、內(nèi)容類聚+網(wǎng)站類聚等多種方式。支持用戶選擇時間范圍,提高用戶檢索效率。10. 智能性、可擴展的搜索技術(shù)保證最快最多的收集互聯(lián)網(wǎng)信息。擁有目前世界上最大的中文信息庫,為用戶提供最準確、最廣泛、最具時效性的信息提供了堅實基礎(chǔ)。11. 分布式結(jié)構(gòu)、精心設計的優(yōu)化算法、容錯設計保證系統(tǒng)在大訪問量下的高可用性、高擴展性、高性能和高穩(wěn)定性。12. 高可配置性使得搜索服務能夠滿足不同用戶的需求。13. 先進的網(wǎng)頁動態(tài)摘要顯示技術(shù)。14. 獨有百度快照,15. 支持多種高級檢索語法,使用戶查詢效率更高、結(jié)果更準。已支持“+”(AND)、“-”(NOT)、“|”(OR)、“site:”、“l(fā)ink:”,還將繼續(xù)增加其它高效的搜索語法。Google作為全球最大的多語言搜索引擎,在國際上占有的市場越來越大,成為互聯(lián)網(wǎng)最具潛力的企業(yè),以下就介紹下GOOGLE搜索引擎的主要特點:1.特有的PR技術(shù),PR 能夠?qū)W(wǎng)頁的重要性做出客觀的評價。PR是GOOGLE評價一個網(wǎng)站質(zhì)量高低的重要標準,PR分為十個等級,從容不1至10,PR越高代表網(wǎng)站質(zhì)量和權(quán)威性越高,排名也就越靠前。2.更新和收錄快,GOOGLE收錄新站一般在十個工作日左右,是所有搜索引擎收錄最快的,更新也比較穩(wěn)定,一般一個星期都會有大的更新。3.重視鏈接的文字描述和鏈接的質(zhì)量,鏈接的文字描述也就是做鏈接用的文字,這個文字對GOOGLE排名起一定作用,因此我們建議如果網(wǎng)站要做某些關(guān)鍵詞,在交換鏈接時要用這個關(guān)鍵詞做鏈向你網(wǎng)站,鏈接的質(zhì)量與鏈接網(wǎng)站的權(quán)威性和與你站是否相關(guān)有關(guān),權(quán)威越高側(cè)你站獲得的排名越好,4.重視Description描述,多次研究發(fā)現(xiàn),那些在GOOGLE排名好的網(wǎng)站在描述中勻含有關(guān)鍵詞,而且有些重復二次,因此可推斷其對描述還是相當重視。五、超文本匹配分析:Google 的搜索引擎同時也分析網(wǎng)頁內(nèi)容。并不采用單純掃描基于網(wǎng)頁的文本(網(wǎng)站發(fā)布商可以通過元標記控制這類文本)的方式,而是分析網(wǎng)頁的全部內(nèi)容以及字體、分區(qū)及每個文字精確位置等因素。同時還會分析相鄰網(wǎng)頁的內(nèi)容,以確保返回與用
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 企業(yè)職工安全教育培訓體系構(gòu)建
- 糖尿病??谱o理小組介紹
- 2025年度農(nóng)業(yè)主導品種申報表
- 防治地方病宣傳主題班會教育
- 七年級科學期中模擬卷(全解全析)(浙教版2024)
- 重慶市江津中學2024-2025學年高二下學期期中考試地理試題(原卷版)
- 知網(wǎng)課程系統(tǒng)學習
- 2018年高考英語二輪復習增分篇專題巧突破專題一語法專題限時檢測(八)特殊句式及其他
- 教育主題班會教案
- 聶梅生:房地產(chǎn)形勢分析與房地產(chǎn)投融資創(chuàng)新
- DB12 T1230-2023 政務信息資源共享 總體框架
- 管道拆除專項施工方案
- 廣西壯族自治區(qū)馬山縣實驗高中-雙休背后:從“要我學”到“我要學”的轉(zhuǎn)變-高三家長會【課件】
- GB/Z 27021.13-2025合格評定管理體系審核認證機構(gòu)要求第13部分:合規(guī)管理體系審核與認證能力要求
- 湖南省長沙市四大名校2024-2025學年高三2月月考語文試題(原卷版+解析版)
- 《政府采購管理研究的國內(nèi)外文獻綜述》5500字
- 糖尿病護理查房提出問題
- 2024年國網(wǎng)浙江省電力有限公司招聘考試真題
- 微專題2 質(zhì)量守恒定律的應用(解析版)
- 分析化學考試題(附參考答案)
- 廣東省廣州市越秀區(qū)2025年中考一模歷史模擬試題(含答案)
評論
0/150
提交評論