第三章 網(wǎng)絡(luò)信息檢索_第1頁
第三章 網(wǎng)絡(luò)信息檢索_第2頁
第三章 網(wǎng)絡(luò)信息檢索_第3頁
第三章 網(wǎng)絡(luò)信息檢索_第4頁
第三章 網(wǎng)絡(luò)信息檢索_第5頁
已閱讀5頁,還剩53頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第三章第三章 網(wǎng)絡(luò)信息檢索網(wǎng)絡(luò)信息檢索 v第一節(jié)第一節(jié) 網(wǎng)絡(luò)信息檢索工具與方法網(wǎng)絡(luò)信息檢索工具與方法 v第二節(jié)第二節(jié) 搜索引擎及其檢索搜索引擎及其檢索 第一節(jié)第一節(jié) 網(wǎng)絡(luò)信息檢索工具與方法網(wǎng)絡(luò)信息檢索工具與方法 一、一、網(wǎng)絡(luò)信息檢索的特點(diǎn)網(wǎng)絡(luò)信息檢索的特點(diǎn) 二、網(wǎng)絡(luò)信息檢索工具二、網(wǎng)絡(luò)信息檢索工具 三、三、網(wǎng)絡(luò)信息檢索的方法網(wǎng)絡(luò)信息檢索的方法 一、網(wǎng)絡(luò)信息檢索的特點(diǎn)一、網(wǎng)絡(luò)信息檢索的特點(diǎn) 1、存取范圍覆蓋、存取范圍覆蓋internet上所有資源上所有資源 2、傳統(tǒng)檢索方法與全新檢索技術(shù)相結(jié)合、傳統(tǒng)檢索方法與全新檢索技術(shù)相結(jié)合 3 3、用戶界面友好且操作方便用戶界面友好且操作方便 4、具備良好的

2、導(dǎo)航和編輯功能、具備良好的導(dǎo)航和編輯功能 5、用戶透明度、用戶透明度 二、網(wǎng)絡(luò)信息檢索工具二、網(wǎng)絡(luò)信息檢索工具 q 網(wǎng)絡(luò)信息檢索工具按照不同標(biāo)準(zhǔn)可以劃分不同類型:網(wǎng)絡(luò)信息檢索工具按照不同標(biāo)準(zhǔn)可以劃分不同類型: q 1、按照網(wǎng)絡(luò)信息資源類型劃分:按照網(wǎng)絡(luò)信息資源類型劃分: wwwwww檢索工具、非檢索工具、非wwwwww檢索工具檢索工具 q 2、按照檢索機(jī)制劃分:、按照檢索機(jī)制劃分: 關(guān)鍵詞檢索工具、分類目錄檢索工具、混合型檢索關(guān)鍵詞檢索工具、分類目錄檢索工具、混合型檢索 工具工具 q 3、按照包含檢索工具數(shù)量劃分:、按照包含檢索工具數(shù)量劃分: 單一型檢索工具、多元型檢索工具單一型檢索工具、多元

3、型檢索工具 4、按照檢索內(nèi)容劃分:、按照檢索內(nèi)容劃分: 綜合型檢索工具、專題型檢索工具、特殊型檢索工綜合型檢索工具、專題型檢索工具、特殊型檢索工 具具 二、網(wǎng)絡(luò)信息檢索工具二、網(wǎng)絡(luò)信息檢索工具 v查查usenetusenet新聞組資源的新聞組資源的waiswais v查查ftpftp資源的資源的archiearchie v查查gophergopher資源的資源的veronicaveronica v查查telenttelent資源的資源的hytelenthytelent 其中其中 應(yīng)用最為普及應(yīng)用最為普及 主要搜索引擎的建立時間及網(wǎng)址 建立年月建立年月 搜索引擎的名稱及網(wǎng)址搜索引擎的名稱及網(wǎng)址

4、1994年4月webcrawler http:/ 1994年5月lycos http:/ 1994年底yahoo! http:/ 1995年初infoseek http:/ 1995年10月altavista http:/ 第二節(jié)第二節(jié) 搜索引擎及其檢索搜索引擎及其檢索 一、搜索引擎的構(gòu)成及工作原理一、搜索引擎的構(gòu)成及工作原理 用用 戶戶 檢檢 索索 策策 略略 搜索搜索 引擎引擎 用戶用戶 接口接口 搜索引擎本地的搜索引擎本地的 摘要信息數(shù)據(jù)庫摘要信息數(shù)據(jù)庫 各萬維各萬維 網(wǎng)站點(diǎn)網(wǎng)站點(diǎn) 資源資源 訪問 詳細(xì)信息反饋 摘要信 息反饋 各記錄鏈接 信息資源搜集 二、搜索引擎的功能二、搜索引擎的功

5、能 搜索引擎有兩個主要的功能:搜索引擎有兩個主要的功能: 1、收集網(wǎng)絡(luò)信息資源,對其進(jìn)行收集網(wǎng)絡(luò)信息資源,對其進(jìn)行 索引并建立數(shù)據(jù)庫。索引并建立數(shù)據(jù)庫。 2、提供網(wǎng)絡(luò)的信息導(dǎo)航與檢索服、提供網(wǎng)絡(luò)的信息導(dǎo)航與檢索服 務(wù)(主要的功能)。務(wù)(主要的功能)。 搜索引擎的基本檢索功能搜索引擎的基本檢索功能 v1、布爾邏輯檢索、布爾邏輯檢索 v 邏輯與邏輯與 (與、(與、and、and、 ) v a and b ab v 邏輯或(或、邏輯或(或、or、or、|) v a or b a;b;ab; v 邏輯非(非、邏輯非(非、not、not、?。ⅲ。?v a not b aab 2 2、完全字符串檢索、完

6、全字符串檢索 采用雙引號采用雙引號“”“”代表字符串代表字符串 精確查找精確查找 “知識經(jīng)濟(jì)知識經(jīng)濟(jì)”知識經(jīng)濟(jì)知識經(jīng)濟(jì) o 3、 截詞檢索(截詞檢索(*) o 前方一致檢索前方一致檢索 o 擴(kuò)大檢索范圍擴(kuò)大檢索范圍 o nutri* nutria + nutrient + o nutrilitei + nutriment o + nutrition 4 4、字段限制檢索、字段限制檢索 限定檢索詞在檢索結(jié)果中出現(xiàn)的位置,限定檢索詞在檢索結(jié)果中出現(xiàn)的位置, 用來控制檢索結(jié)果的相關(guān)性。用來控制檢索結(jié)果的相關(guān)性。 如:如:urlurl限制(限制(urlurl:):) 主機(jī)名限制(主機(jī)名限制(hosth

7、ost:):) 標(biāo)題限制(標(biāo)題限制(titletitle:):) 5 5、位置檢索、位置檢索 目前只有目前只有alta vistaalta vista能提供能提供 鄰近位置運(yùn)算鄰近位置運(yùn)算nearnear運(yùn)算。運(yùn)算。 6 6、 + +、- - 檢索檢索 + +:放在檢索詞前,表示該檢索詞在檢索結(jié):放在檢索詞前,表示該檢索詞在檢索結(jié) 果中必須出現(xiàn)。果中必須出現(xiàn)。 - -:放在檢索詞前,表示該檢索詞在檢索結(jié):放在檢索詞前,表示該檢索詞在檢索結(jié) 果中不能出現(xiàn)。果中不能出現(xiàn)。 幾乎所有的搜索引擎都支持這種功能。幾乎所有的搜索引擎都支持這種功能。 如:如:+computer+virus+computer

8、+viruscihcih 搜索引擎的高級檢索功能搜索引擎的高級檢索功能 1 1、自然語言檢索、自然語言檢索 支持字、詞、句子檢索支持字、詞、句子檢索 幾乎所有的搜索引擎都支持該功能幾乎所有的搜索引擎都支持該功能 如:知識經(jīng)濟(jì)的支柱產(chǎn)業(yè)如:知識經(jīng)濟(jì)的支柱產(chǎn)業(yè) how has wto developedhow has wto developed? 2 2、模糊檢索、模糊檢索 當(dāng)輸入一個檢索詞時,搜索引擎會把與該檢索詞當(dāng)輸入一個檢索詞時,搜索引擎會把與該檢索詞 相關(guān)的詞一并反饋,列出供用戶選擇。相關(guān)的詞一并反饋,列出供用戶選擇。 相關(guān)性檢索相關(guān)性檢索 如:在雅虎中國查找如:在雅虎中國查找“搜索引擎搜

9、索引擎”一詞時,模糊一詞時,模糊 檢索會把檢索會把“搜索引擎搜索引擎”、“搜尋引擎搜尋引擎” ” 、 “引擎引擎”等相關(guān)的檢索詞一并列出。等相關(guān)的檢索詞一并列出。 3 3、概念檢索、概念檢索 用某一檢索詞進(jìn)行檢索時,能同時對用某一檢索詞進(jìn)行檢索時,能同時對 該詞同樣或類似概念的同義詞和近義詞該詞同樣或類似概念的同義詞和近義詞 進(jìn)行檢索,以達(dá)到擴(kuò)大檢索范圍,提高進(jìn)行檢索,以達(dá)到擴(kuò)大檢索范圍,提高 查全率的目的。如:查全率的目的。如:exciteexcite 4 4、區(qū)分大小寫檢索、區(qū)分大小寫檢索 大多數(shù)搜索引擎在查詢中要區(qū)分大小寫大多數(shù)搜索引擎在查詢中要區(qū)分大小寫 小寫小寫匹配大小寫字符匹配大小

10、寫字符 大寫大寫只只匹配大寫字符匹配大寫字符 5 5、管道(、管道(| |)檢索)檢索 用管道符(用管道符(| |)連接兩個或者多個檢索詞,)連接兩個或者多個檢索詞, 如如 apple | diseaseapple | disease,先對前一個檢索,先對前一個檢索 詞進(jìn)行檢索,再在其檢索結(jié)果的基礎(chǔ)上詞進(jìn)行檢索,再在其檢索結(jié)果的基礎(chǔ)上 對后一個檢索詞進(jìn)行檢索,依次類推,對后一個檢索詞進(jìn)行檢索,依次類推, 以達(dá)到逐步縮小檢索范圍提高查準(zhǔn)率的以達(dá)到逐步縮小檢索范圍提高查準(zhǔn)率的 目的。目的。 6 6、相關(guān)信息反饋檢索、相關(guān)信息反饋檢索 提供與檢索結(jié)果類似的檢索結(jié)果。如:提供與檢索結(jié)果類似的檢索結(jié)果。

11、如: 雅虎中國的雅虎中國的“相關(guān)網(wǎng)站、相關(guān)網(wǎng)頁、相相關(guān)網(wǎng)站、相關(guān)網(wǎng)頁、相 關(guān)新聞關(guān)新聞”。 lycoslycos的的“more like this”more like this” excite excite的的“search for more search for more documents like this one”documents like this one” 7 7、范圍限制檢索、范圍限制檢索 在某一范圍內(nèi)檢索指定的檢索詞。在某一范圍內(nèi)檢索指定的檢索詞。 分類范圍、時間范圍、地域范圍、分類范圍、時間范圍、地域范圍、 信息來源、檢索詞位置、語種范圍、信息來源、檢索詞位置、語種范圍、

12、特殊范圍特殊范圍 三、搜索引擎的分類搜索引擎的分類 1、根據(jù)信息檢索方式分類:、根據(jù)信息檢索方式分類: 分類搜索引擎、關(guān)鍵詞搜索引擎、混合分類搜索引擎、關(guān)鍵詞搜索引擎、混合 搜索引擎搜索引擎 2、根據(jù)信息覆蓋范圍及適用用戶群分類:、根據(jù)信息覆蓋范圍及適用用戶群分類: 綜合性搜索引擎、專用性搜索引擎綜合性搜索引擎、專用性搜索引擎 3、根據(jù)搜索范圍分類:、根據(jù)搜索范圍分類: 獨(dú)立搜索引擎、集成搜索引擎獨(dú)立搜索引擎、集成搜索引擎 四、搜索引擎常見的查詢方式四、搜索引擎常見的查詢方式 按照搜索引擎提供的分類目錄逐級按照搜索引擎提供的分類目錄逐級 查詢,用戶一般不需要輸入檢索詞,查詢,用戶一般不需要輸入

13、檢索詞, 而是按照查詢系統(tǒng)提供的幾種分類而是按照查詢系統(tǒng)提供的幾種分類 項(xiàng)目,選擇類別進(jìn)行查詢,這種方項(xiàng)目,選擇類別進(jìn)行查詢,這種方 式也叫式也叫分類檢索。分類檢索。 用布爾邏輯組配方式查詢,這種方式也用布爾邏輯組配方式查詢,這種方式也 叫定制搜索。(多個關(guān)鍵詞)叫定制搜索。(多個關(guān)鍵詞) 五、搜索引擎檢索的步驟五、搜索引擎檢索的步驟 1、輸入、輸入url地址,登陸到搜索引擎地址,登陸到搜索引擎 的主頁。的主頁。 2、輸入檢索提問式或點(diǎn)擊分類目錄,、輸入檢索提問式或點(diǎn)擊分類目錄, 進(jìn)行實(shí)時的交互式的信息檢索。進(jìn)行實(shí)時的交互式的信息檢索。 3、搜索引擎輸出、搜索引擎輸出html文件,并且翻文件,

14、并且翻 譯譯html,顯示檢索結(jié)果。,顯示檢索結(jié)果。 六、搜索引擎的選擇技巧六、搜索引擎的選擇技巧 查全率、查準(zhǔn)率查全率、查準(zhǔn)率 更新速度、死鏈接更新速度、死鏈接 易用性、穩(wěn)定性易用性、穩(wěn)定性 搜索速度搜索速度 高級搜索的支持能力高級搜索的支持能力 七、常用搜索引擎簡介七、常用搜索引擎簡介 1 1、主要中文搜索引擎、主要中文搜索引擎 2 2、主要英文搜索引擎、主要英文搜索引擎 3 3、各具特色的專用搜索引擎、各具特色的專用搜索引擎 主主 要要 中中 文文 搜搜 索索 引引 擎擎 百度是世界上規(guī)模最大的中文搜索引擎,擁有全球最大百度是世界上規(guī)模最大的中文搜索引擎,擁有全球最大 的中文網(wǎng)頁庫,每天

15、處理來自一百多個國家的超過一億的中文網(wǎng)頁庫,每天處理來自一百多個國家的超過一億 人次的搜索請求。人次的搜索請求。 百度高級搜索百度高級搜索 主主 要要 中中 文文 搜搜 索索 引引 擎擎 一搜(一搜()是雅虎公司基于全球領(lǐng)先的)是雅虎公司基于全球領(lǐng)先的ystyst (yahoo search technologyyahoo search technology)技術(shù),在中國推出的搜索)技術(shù),在中國推出的搜索 門戶。一搜具有簡潔專業(yè)、海量、客觀精準(zhǔn)、國際化、穩(wěn)門戶。一搜具有簡潔專業(yè)、海量、客觀精準(zhǔn)、國際化、穩(wěn) 定高速等特點(diǎn),是值得依賴的專業(yè)搜索門戶。定高速等特點(diǎn),是值得依賴的專業(yè)搜索門戶。 主主

16、要要 中中 文文 搜搜 索索 引引 擎擎 主主 要要 中中 文文 搜搜 索索 引引 擎擎 一搜高級搜索一搜高級搜索 主主 要要 中中 文文 搜搜 索索 引引 擎擎 雅虎中國雅虎中國 主主 要要 中中 文文 搜搜 索索 引引 擎擎 雅虎中國高級搜索雅虎中國高級搜索 主主 要要 中中 文文 搜搜 索索 引引 擎擎 新浪新浪 主主 要要 中中 文文 搜搜 索索 引引 擎擎 搜狐搜狐 主主 要要 中中 文文 搜搜 索索 引引 擎擎 網(wǎng)易網(wǎng)易 主主 要要 中中 文文 搜搜 索索 引引 擎擎 主主 要要 中中 文文 搜搜 索索 引引 擎擎 263263搜索搜索 主主 要要 英英 文文 搜搜 索索 引引 擎

17、擎 altavista:http:/ 主主 要要 英英 文文 搜搜 索索 引引 擎擎 excite:http:/ 主主 要要 英英 文文 搜搜 索索 引引 擎擎 hotbot:http:/ 主主 要要 英英 文文 搜搜 索索 引引 擎擎 hotbot:http:/ 主主 要要 英英 文文 搜搜 索索 引引 擎擎 lycos:http:/ google搜索引擎和百度搜索引擎 google搜索引擎 百度搜索引擎 2.1 google搜索引擎 網(wǎng)址:http:/ google是一個全自動搜索引擎,它是利 用計(jì)算機(jī)程序直接在網(wǎng)頁中抓取相關(guān)字 串。 “google”一詞來源于“googol”(仍然是 英

18、文) ,是10的100次方,表示是一個非常巨大 的數(shù)字的概念。正如其名,google是一 個功能強(qiáng)大、使用方便的搜索引擎。 與其他搜索引擎相比google的優(yōu)點(diǎn): 1) 對于用戶所輸入的關(guān)鍵字,google 會最大程度的尋 求語義匹配。 例如想查找有關(guān)某人的網(wǎng)頁,但輸入“同音不同字的 名” ,google 也能找到你想要得信息?;蛘?,在查詢 框中輸入作者的名字,所有文章與網(wǎng)頁都會被檢索, 連那個網(wǎng)頁有轉(zhuǎn)載都會顯示出來。此外,google 還包 含有漢字的相關(guān)性 ,例如對中文簡體網(wǎng)站,找出對應(yīng) 的繁體網(wǎng)站,甚至是日文網(wǎng)站。 2) google還提供網(wǎng)頁快照(cached)功能。 google將 檢索的網(wǎng)頁都做了一番“快照”,然后存放在自己的 服務(wù)器上,當(dāng)被搜索的內(nèi)容站點(diǎn)當(dāng)前不存在時,用戶 可以用網(wǎng)頁快照功能。 google檢索須知 當(dāng)檢索結(jié)果過多,需進(jìn)一步縮小時,可 選擇“縮小搜索”或在“結(jié)果中搜索”。 只要輸入更多的關(guān)鍵詞即可,或在不需 要的關(guān)鍵詞前“-”號。注意“-”后應(yīng)留一 空格。 google 不支持or檢

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論