因特網(wǎng)信息資源檢索-完整版課件_第1頁
因特網(wǎng)信息資源檢索-完整版課件_第2頁
因特網(wǎng)信息資源檢索-完整版課件_第3頁
因特網(wǎng)信息資源檢索-完整版課件_第4頁
因特網(wǎng)信息資源檢索-完整版課件_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

因特網(wǎng)信息資源檢索目錄索引類與全文搜索引擎特色信息檢索工具其他信息檢索工具元搜索引擎因特網(wǎng)信息檢索發(fā)展趨勢(shì)1.3.1因特網(wǎng)中的信息檢索搜索引擎是一種用于幫助因特網(wǎng)用戶查詢信息的搜索工具,它以一定的策略在因特網(wǎng)中搜集、發(fā)現(xiàn)信息,對(duì)信息進(jìn)行理解、提取、組織和處理,并為用戶提供檢索服務(wù),從而起到信息導(dǎo)航目的。1、目錄索引類與全文搜索引擎1.目錄索引類搜索引擎2.全文搜索引擎1、目錄索引類與全文搜索引擎類型舉例目錄類搜索引擎

全文搜索引擎

2、特色信息檢索工具地圖檢索音樂圖片3、其他信息檢索工具3、元搜索引擎元搜索引擎是一種調(diào)用其他多個(gè)獨(dú)立搜索引擎的引擎,是對(duì)多個(gè)獨(dú)立搜索引擎的整合、調(diào)用、控制和優(yōu)化,能方便地檢索多個(gè)搜索引擎,擴(kuò)大檢索范圍,提高檢索的全面性。3.3元搜索引擎的特點(diǎn)元搜索引擎在搜索的時(shí)候,用戶只需提交一次搜索請(qǐng)求,而且可以同時(shí)搜索多個(gè)數(shù)據(jù)庫,并根據(jù)多個(gè)搜索引擎的檢索結(jié)果進(jìn)行二次加工,如對(duì)檢索結(jié)果進(jìn)行重排和標(biāo)明檢索結(jié)果來源等,輸出給用戶。缺點(diǎn):一般支持AND、OR、NOT等操作,一般只使用簡(jiǎn)單、直接的搜索策略,并且檢索速度也慢。3.4搜索引擎的發(fā)展趨勢(shì)1、多媒體信息檢索

傳統(tǒng)的多媒體數(shù)據(jù)庫中,除了文本和數(shù)字還包括圖形、圖象、聲音、視頻、動(dòng)畫等各種媒體組合。但多媒體信息具有豐富的內(nèi)涵,如:圖象的顏色、紋理、形狀,動(dòng)畫中的運(yùn)動(dòng)、聲音和音調(diào)等。例如歌曲的旋律、音調(diào)、音質(zhì)等難以用文字描述。這正是基于內(nèi)容的音頻檢索需要研究和解決的問題,以期達(dá)到更深的檢索層次和更好的檢索效果。2、專業(yè)垂直搜索引擎專業(yè)垂直類搜索引擎只面向某一個(gè)特定的領(lǐng)域,專注于自己的特長和核心技術(shù),能夠保證對(duì)該領(lǐng)域信息的完全收錄和及時(shí)更新。信息檢索工具的工作原理搜索引擎是如何搜索信息的呢?你聽說過“網(wǎng)絡(luò)機(jī)器人”、“爬蟲”、“蜘蛛”嗎?他們只是搜索引擎的一個(gè)部分,叫“搜索器”三部分的作用1.搜索器:負(fù)責(zé)定期地自動(dòng)到各個(gè)網(wǎng)站上,把網(wǎng)頁抓下來,并順著頁面上的鏈接,持續(xù)不斷地抓取網(wǎng)頁。2.索引器:把搜索器抓來的網(wǎng)頁進(jìn)行分析,按照關(guān)鍵詞進(jìn)行索引,并存入服務(wù)器的數(shù)據(jù)庫中。3.檢索器:面向用戶,接受用戶提交的查詢字串,在索引數(shù)據(jù)庫中查詢,并將查詢結(jié)果反饋給用戶。全文搜索引擎的工作原理:3.3目錄索引類搜索引擎目錄索引類搜索引擎一般采用人工方式采集和存儲(chǔ)網(wǎng)絡(luò)信息,依靠手工為每個(gè)網(wǎng)絡(luò)確定一個(gè)標(biāo)題,并給出大概的描述,建立關(guān)鍵字索引,將其放入相應(yīng)的類目體系中。目錄索引類搜索引擎一般為一條鏈狀組成樹型結(jié)構(gòu):總目錄專題目錄鏈接網(wǎng)站目錄索引類搜索引擎最大的特點(diǎn)就是在查詢信息時(shí),事先可以沒有特定的信息檢索目標(biāo)(關(guān)鍵詞),通過瀏覽主題了解某一主題的相關(guān)資源。目錄索引類搜索引擎最大的缺點(diǎn):分類具有主觀性,花費(fèi)時(shí)間多,更新速度慢。選擇題1.目錄索引類搜索引擎一般采用什么方式采集和存儲(chǔ)信息()。A.人工方式B.蜘蛛程序C.關(guān)鍵字檢索D.檢索工具A2.下列不屬于搜索引擎中“搜索器”工作程序的是()。A.網(wǎng)絡(luò)機(jī)器人B.蜘蛛C.爬蟲D.CuteFTPD3.下列不屬于元搜索引擎特點(diǎn)的是()。A.搜索時(shí),用戶必須多次提交搜索請(qǐng)求B.可同時(shí)搜索多個(gè)數(shù)據(jù)庫C.一般支持AND、OR、NOT等操作D.一般只使用簡(jiǎn)單、直接的搜索策略A判斷題1.常用的兩種搜索引擎是目錄類搜索引擎和元搜索引擎。()2.為了適應(yīng)不同搜索群體的需要,許多搜索引擎一般都提供多語種檢索功能。()3.通過專業(yè)搜索引擎獲得的信息資源一般來說比較權(quán)威。()4.元搜索引擎的搜索范圍可以是多個(gè)搜索引擎的數(shù)據(jù)庫,而不局限于某一搜索引擎的數(shù)據(jù)庫內(nèi)。()×∨∨∨5.元搜索引擎通常只使用高級(jí)、間接的搜索策略,檢索速度快。()6.垂直搜索引擎只面向某一特定的領(lǐng)域,專注于自己的特長和核心技術(shù),能夠保證對(duì)該領(lǐng)域信息的完全收錄和及時(shí)更新。()7.網(wǎng)頁快照是搜索引擎把索引的網(wǎng)頁緩存在服務(wù)器中,這

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論