大型綜合性搜索引擎介紹_第1頁
大型綜合性搜索引擎介紹_第2頁
大型綜合性搜索引擎介紹_第3頁
大型綜合性搜索引擎介紹_第4頁
大型綜合性搜索引擎介紹_第5頁
已閱讀5頁,還剩54頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、大型綜合性搜索引擎介紹第1頁,共59頁,2022年,5月20日,14點32分,星期二大型綜合性搜索引擎介紹第2頁,共59頁,2022年,5月20日,14點32分,星期二1、 網絡信息檢索工具與方法一、網絡信息檢索的特點二、網絡信息檢索工具三、網絡信息檢索的方法第3頁,共59頁,2022年,5月20日,14點32分,星期二一、網絡信息檢索的特點1、存取范圍覆蓋Internet上所有資源2、傳統(tǒng)檢索方法與全新檢索技術相結合3、用戶界面友好且操作方便4、具備良好的導航和編輯功能5、用戶透明度第4頁,共59頁,2022年,5月20日,14點32分,星期二二、網絡信息檢索工具網絡信息檢索工具按照不同標準

2、可以劃分不同類型:1、按照網絡信息資源類型劃分: WWW檢索工具、非WWW檢索工具2、按照檢索機制劃分: 關鍵詞檢索工具、分類目錄檢索工具、混合型檢索工具3、按照包含檢索工具數量劃分: 單一型檢索工具、多元型檢索工具4、按照檢索內容劃分: 綜合型檢索工具、專題型檢索工具、特殊型檢索工具第5頁,共59頁,2022年,5月20日,14點32分,星期二二、網絡信息檢索工具查Usenet新聞組資源的WAIS查FTP資源的Archie查Gopher資源的Veronica查Telent資源的Hytelent查WWW資源Search Engine(搜索引擎) 其中Search Engine 應用最為普及第6

3、頁,共59頁,2022年,5月20日,14點32分,星期二主要搜索引擎的建立時間及網址建立年月 搜索引擎的名稱及網址1994年4月WebCrawler1994年5月Lycos第7頁,共59頁,2022年,5月20日,14點32分,星期二1994年底Yahoo!1995年初Infoseek1995年10月AltaVista第8頁,共59頁,2022年,5月20日,14點32分,星期二2、 搜索引擎及其檢索一、搜索引擎的構成及工作原理用戶檢索策略搜索引擎用戶接口搜索引擎本地的摘要信息數據庫各萬維網站點資源訪問詳細信息反饋摘要信息反饋各記錄鏈接信息資源搜集第9頁,共59頁,2022年,5月20日,1

4、4點32分,星期二二、搜索引擎的功能搜索引擎有兩個主要的功能: 1、收集網絡信息資源,對其進行 索引并建立數據庫。 2、提供網絡的信息導航與檢索服 務(主要的功能)。第10頁,共59頁,2022年,5月20日,14點32分,星期二搜索引擎的基本檢索功能1、布爾邏輯檢索 邏輯與 (與、and、AND、 ) A and B AB 邏輯或(或、or、OR、|) A or B A;B;AB; 邏輯非(非、not、NOT、?。?A not B AAB第11頁,共59頁,2022年,5月20日,14點32分,星期二2、完全字符串檢索 采用雙引號“”代表字符串 精確查找 “知識經濟”知識經濟第12頁,共59

5、頁,2022年,5月20日,14點32分,星期二3、 截詞檢索(*) 前方一致檢索 擴大檢索范圍 nutri* nutria + nutrient + nutrilitei + nutriment + nutrition第13頁,共59頁,2022年,5月20日,14點32分,星期二4、字段限制檢索限定檢索詞在檢索結果中出現的位置,用來控制檢索結果的相關性。如:URL限制(url:) 主機名限制(host:) 標題限制(title:)第14頁,共59頁,2022年,5月20日,14點32分,星期二5、位置檢索 目前只有Alta Vista能提供 鄰近位置運算near運算。第15頁,共59頁,2

6、022年,5月20日,14點32分,星期二6、 +、- 檢索+:放在檢索詞前,表示該檢索詞在檢索結 果中必須出現。-:放在檢索詞前,表示該檢索詞在檢索結 果中不能出現。幾乎所有的搜索引擎都支持這種功能。如:+computer+virusCIH第16頁,共59頁,2022年,5月20日,14點32分,星期二搜索引擎的高級檢索功能1、自然語言檢索支持字、詞、句子檢索幾乎所有的搜索引擎都支持該功能如:知識經濟的支柱產業(yè) How has WTO developed?第17頁,共59頁,2022年,5月20日,14點32分,星期二2、模糊檢索當輸入一個檢索詞時,搜索引擎會把與該檢索詞相關的詞一并反饋,列

7、出供用戶選擇。相關性檢索如:在雅虎中國查找“搜索引擎”一詞時,模糊檢索會把“搜索引擎”、“搜尋引擎” 、“引擎”等相關的檢索詞一并列出。第18頁,共59頁,2022年,5月20日,14點32分,星期二3、概念檢索 用某一檢索詞進行檢索時,能同時對該詞同樣或類似概念的同義詞和近義詞進行檢索,以達到擴大檢索范圍,提高查全率的目的。如:Excite第19頁,共59頁,2022年,5月20日,14點32分,星期二4、區(qū)分大小寫檢索大多數搜索引擎在查詢中要區(qū)分大小寫小寫匹配大小寫字符大寫只匹配大寫字符第20頁,共59頁,2022年,5月20日,14點32分,星期二5、管道(|)檢索 用管道符(|)連接兩

8、個或者多個檢索詞,如 apple | disease,先對前一個檢索詞進行檢索,再在其檢索結果的基礎上對后一個檢索詞進行檢索,依次類推,以達到逐步縮小檢索范圍提高查準率的目的。第21頁,共59頁,2022年,5月20日,14點32分,星期二6、相關信息反饋檢索 提供與檢索結果類似的檢索結果。如: 雅虎中國的“相關網站、相關網頁、相關新聞”。 Lycos的“More Like This” Excite的“Search for more documents like this one”第22頁,共59頁,2022年,5月20日,14點32分,星期二7、范圍限制檢索在某一范圍內檢索指定的檢索詞。 分

9、類范圍、時間范圍、地域范圍、 信息來源、檢索詞位置、語種范圍、 特殊范圍第23頁,共59頁,2022年,5月20日,14點32分,星期二三、搜索引擎的分類1、根據信息檢索方式分類: 分類搜索引擎、關鍵詞搜索引擎、混合搜索引擎2、根據信息覆蓋范圍及適用用戶群分類: 綜合性搜索引擎、專用性搜索引擎 3、根據搜索范圍分類: 獨立搜索引擎、集成搜索引擎第24頁,共59頁,2022年,5月20日,14點32分,星期二四、搜索引擎常見的查詢方式按照搜索引擎提供的分類目錄逐級查詢,用戶一般不需要輸入檢索詞,而是按照查詢系統(tǒng)提供的幾種分類項目,選擇類別進行查詢,這種方式也叫分類檢索。用布爾邏輯組配方式查詢,這

10、種方式也叫定制搜索。(多個關鍵詞)第25頁,共59頁,2022年,5月20日,14點32分,星期二五、搜索引擎檢索的步驟1、輸入URL地址,登陸到搜索引擎 的主頁。2、輸入檢索提問式或點擊分類目錄, 進行實時的交互式的信息檢索。3、搜索引擎輸出HTML文件,并且翻 譯HTML,顯示檢索結果。第26頁,共59頁,2022年,5月20日,14點32分,星期二六、搜索引擎的選擇技巧查全率、查準率更新速度、死鏈接易用性、穩(wěn)定性搜索速度高級搜索的支持能力第27頁,共59頁,2022年,5月20日,14點32分,星期二七、常用搜索引擎簡介1、主要中文搜索引擎2、主要英文搜索引擎3、各具特色的專用搜索引擎第

11、28頁,共59頁,2022年,5月20日,14點32分,星期二主要中文搜索引擎百度是世界上規(guī)模最大的中文搜索引擎,擁有全球最大的中文網頁庫,每天處理來自一百多個國家的超過一億人次的搜索請求。第29頁,共59頁,2022年,5月20日,14點32分,星期二百度高級搜索主要中文搜索引擎第30頁,共59頁,2022年,5月20日,14點32分,星期二一搜()是雅虎公司基于全球領先的YST(Yahoo Search Technology)技術,在中國推出的搜索門戶。一搜具有簡潔專業(yè)、海量、客觀精準、國際化、穩(wěn)定高速等特點,是值得依賴的專業(yè)搜索門戶。主要中文搜索引擎第31頁,共59頁,2022年,5月2

12、0日,14點32分,星期二主要中文搜索引擎一搜高級搜索第32頁,共59頁,2022年,5月20日,14點32分,星期二主要中文搜索引擎雅虎中國第33頁,共59頁,2022年,5月20日,14點32分,星期二主要中文搜索引擎雅虎中國高級搜索第34頁,共59頁,2022年,5月20日,14點32分,星期二主要中文搜索引擎新浪第35頁,共59頁,2022年,5月20日,14點32分,星期二主要中文搜索引擎搜狐第36頁,共59頁,2022年,5月20日,14點32分,星期二主要中文搜索引擎網易第37頁,共59頁,2022年,5月20日,14點32分,星期二主要中文搜索引擎第38頁,共59頁,2022年

13、,5月20日,14點32分,星期二主要中文搜索引擎263搜索第39頁,共59頁,2022年,5月20日,14點32分,星期二主要英文搜索引擎Alta Vista :第40頁,共59頁,2022年,5月20日,14點32分,星期二主要英文搜索引擎Excite: 第41頁,共59頁,2022年,5月20日,14點32分,星期二主要英文搜索引擎Hotbot:第42頁,共59頁,2022年,5月20日,14點32分,星期二主要英文搜索引擎Hotbot:第43頁,共59頁,2022年,5月20日,14點32分,星期二主要英文搜索引擎Lycos:第44頁,共59頁,2022年,5月20日,14點32分,星

14、期二Google搜索引擎和百度搜索引擎Google搜索引擎百度搜索引擎第45頁,共59頁,2022年,5月20日,14點32分,星期二2.1 Google搜索引擎網址:Google是一個全自動搜索引擎,它是利用計算機程序直接在網頁中抓取相關字串?!癎oogle”一詞來源于“googol”(仍然是英文),是10的100次方,表示是一個非常巨大的數字的概念。正如其名,Google是一個功能強大、使用方便的搜索引擎。第46頁,共59頁,2022年,5月20日,14點32分,星期二與其他搜索引擎相比Google的優(yōu)點:1) 對于用戶所輸入的關鍵字,Google 會最大程度的尋求語義匹配。例如想查找有關

15、某人的網頁,但輸入“同音不同字的名” ,Google 也能找到你想要得信息?;蛘?,在查詢框中輸入作者的名字,所有文章與網頁都會被檢索,連那個網頁有轉載都會顯示出來。此外,Google 還包含有漢字的相關性 ,例如對中文簡體網站,找出對應的繁體網站,甚至是日文網站。2) Google還提供網頁快照(Cached)功能。 Google將檢索的網頁都做了一番“快照”,然后存放在自己的服務器上,當被搜索的內容站點當前不存在時,用戶可以用網頁快照功能。第47頁,共59頁,2022年,5月20日,14點32分,星期二Google檢索須知當檢索結果過多,需進一步縮小時,可選擇“縮小搜索”或在“結果中搜索”。

16、只要輸入更多的關鍵詞即可,或在不需要的關鍵詞前“-”號。注意“-”后應留一空格。Google 不支持OR檢索,也不區(qū)分英文大小寫,所有字母均當小寫處理。在專用詞語上加雙引號可以進行精確查詢,這在查找某個產品或專用術語時特別有用。第48頁,共59頁,2022年,5月20日,14點32分,星期二“-+=,”等也作為短語連接符。例如,盡管Micro-computer,不加引號,仍作為專用詞語處理。Google 會忽略http和com 等字樣,以及數字和單字,因為他們出現過頻繁,因此無助于檢索,還會減低速度。Google的“手氣不錯”功能將自動連接到Google推薦的網頁,無需再查其他結果,快速方便第

17、49頁,共59頁,2022年,5月20日,14點32分,星期二Google檢索示例第50頁,共59頁,2022年,5月20日,14點32分,星期二第51頁,共59頁,2022年,5月20日,14點32分,星期二第52頁,共59頁,2022年,5月20日,14點32分,星期二2.2 百度搜索引擎網址:第53頁,共59頁,2022年,5月20日,14點32分,星期二百度搜索引擎特點1)中國人自己開發(fā)研制的,適合中文網站搜索2)“網頁的相關檢索功能”例如輸入“手機”,在檢索的上方還會出現“手機的價格”、“手機鈴聲”等與“手機”相關的詞,此時再點一下“手機鈴聲”,則會檢索出“手機鈴聲”的結果3)在百度的檢索結果中,用戶可以選“重新查詢”;也可選“在結果中再查”則將在第一次的結果中在按新輸入的詞查詢,這相當于AND,結果會更精確些;選在“結果中去除”則將在第一次的結果中“減去”新輸入的詞查詢,相當于NOT。第54頁,共59頁,2022年,5月20日,14點32分,星期二4

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論