粵教版選修三因特網(wǎng)的應(yīng)用 因特網(wǎng)上的信息檢索_第1頁
粵教版選修三因特網(wǎng)的應(yīng)用 因特網(wǎng)上的信息檢索_第2頁
粵教版選修三因特網(wǎng)的應(yīng)用 因特網(wǎng)上的信息檢索_第3頁
粵教版選修三因特網(wǎng)的應(yīng)用 因特網(wǎng)上的信息檢索_第4頁
粵教版選修三因特網(wǎng)的應(yīng)用 因特網(wǎng)上的信息檢索_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

3.2因特網(wǎng)上的信息檢索你認(rèn)為真正的網(wǎng)絡(luò)高手是怎樣的??jī)?nèi)容概要文本搜索使用單個(gè)關(guān)鍵詞進(jìn)行搜索使用兩個(gè)及兩個(gè)以上關(guān)鍵詞進(jìn)行搜索直接輸入多個(gè)關(guān)鍵詞,關(guān)鍵詞之間用空格,這樣就表示“AND”關(guān)系;用減號(hào)“-”表示“非”,用于表示要求搜索結(jié)果不包含某些特定信息;加上雙引號(hào)。這在查找名言警句或?qū)S忻~時(shí)顯得格外有用搜索特殊格式的文件目前可搜索的文件格式:DOC、PPT、XLS、TXT文件;最精彩的,可搜索Flash文件:SWF文件、gif動(dòng)態(tài)圖片文件方法:關(guān)鍵詞filetype:

關(guān)鍵字.文件格式或關(guān)鍵字.文件格式搜索引擎的產(chǎn)生

隨著網(wǎng)絡(luò)中信息爆炸性地增長,信息分散儲(chǔ)存、數(shù)量多,網(wǎng)絡(luò)用戶想找到所需的信息如同大海撈針。為了滿足大眾的信息檢索需求,從事專業(yè)信息檢索的公司和搜索網(wǎng)站應(yīng)運(yùn)而生。搜索引擎是因特網(wǎng)上信息檢索的軟件系統(tǒng)。最早的搜索引擎出現(xiàn)于1994年4月。斯坦福大學(xué)的兩名博士生,美籍華人楊致遠(yuǎn)和美國人DavidFilo共同創(chuàng)辦了超級(jí)目錄索引雅虎(Yahoo),并成功地使搜索引擎的概念深入人心。從此搜索引擎進(jìn)入了高速發(fā)展時(shí)期。搜索引擎的分類及原理按照信息搜集方法和服務(wù)提供方式的不同,搜索引擎系統(tǒng)可以分為三大類:1.

目錄式搜索引擎:以人工方式或半自動(dòng)方式搜集信息,由編輯員查看信息之后,人工形成信息摘要,并將信息置于事先確定的分類框架中。信息大多面向網(wǎng)站,提供目錄瀏覽服務(wù)和直接檢索服務(wù)。該類搜索引擎因?yàn)榧尤肓巳说闹悄?,所以信息?zhǔn)確、導(dǎo)航質(zhì)量高,缺點(diǎn)是需要人工介入、維護(hù)量大、信息量少、信息更新不及時(shí)。這類搜索引擎的代表是:Yahoo、LookSmart、OpenDirectory、GoGuide等。2.

全文搜索引擎(機(jī)器人搜索引擎):由一個(gè)稱為蜘蛛(Spider)的機(jī)器人程序以某種策略自動(dòng)地在互聯(lián)網(wǎng)中搜集和發(fā)現(xiàn)信息,由索引器為搜集到的信息建立索引,由檢索器根據(jù)用戶的查詢輸入檢索索引庫,并將查詢結(jié)果返回給用戶。服務(wù)方式是面向網(wǎng)頁的全文檢索服務(wù)。該類搜索引擎的優(yōu)點(diǎn)是信息量大、更新及時(shí)、毋需人工干預(yù),缺點(diǎn)是返回信息過多,有很多無關(guān)信息,用戶必須從結(jié)果中進(jìn)行篩選。這類搜索引擎的代表是:AltaVista、NorthernLight、Excite、Infoseek、Inktomi、FAST、Lycos、Google;國內(nèi)代表為:“天網(wǎng)”、悠游、OpenFind等。3.元搜索引擎:這類搜索引擎沒有自己的數(shù)據(jù),而是將用戶的查詢請(qǐng)求同時(shí)向多個(gè)搜索引擎遞交,將返回的結(jié)果進(jìn)行重復(fù)排除、重新排序等處理后,作為自己的結(jié)果返回給用戶。服務(wù)方式為面向網(wǎng)頁的全文檢索。這類搜索引擎的優(yōu)點(diǎn)是返回結(jié)果的信息量更大、更全,缺點(diǎn)是不能夠充分使用所使用搜索引擎的功能,用戶需要做更多的篩選。這類搜索引擎的代表是WebCrawler、InfoMarket等。搜索引擎技術(shù)的發(fā)展趨勢(shì)1.提高搜索引擎對(duì)用戶檢索提問的理解。2.對(duì)檢索結(jié)果進(jìn)行進(jìn)一步處理。3.確定搜索引擎信息收集范圍,提高搜索引擎的針對(duì)性。2.索引器對(duì)所搜集的信息進(jìn)行提取和組織,并建立索引庫。1.搜索器在因特網(wǎng)中發(fā)現(xiàn)、搜集網(wǎng)頁信息。3.由檢索器根據(jù)用戶輸入的查詢關(guān)鍵詞,在索引中快速檢出相關(guān)文檔,進(jìn)行文檔與查詢內(nèi)容相關(guān)比較,對(duì)人、檢出的結(jié)果進(jìn)行排序、并將查詢返回給用戶。4.用戶接口:用戶接口的作用是輸入用戶查詢、顯示查詢結(jié)果、提供用戶相關(guān)性反饋機(jī)制。3.2.3搜索引擎的工作過程一個(gè)搜索引擎由搜索器、索引器、檢索器和用戶接口等四個(gè)部分組成搜索引擎的工作過程輸入查詢表達(dá)式檢索器查詢結(jié)果顯示查詢信息排序索引器搜索器采集結(jié)果索引數(shù)據(jù)庫用戶查詢查詢結(jié)果信息采集索引排序篩選用戶接口目錄索引類搜索引擎的工作原理一般采用人工方式采集和存儲(chǔ)網(wǎng)絡(luò)信息,依靠手工為每個(gè)網(wǎng)站確定一個(gè)標(biāo)題,并給出大概的描述,建立關(guān)鍵字索引,將其放入相應(yīng)的類目體系中。用戶自己的錯(cuò)誤初學(xué)者搜索時(shí)容易犯的6個(gè)低級(jí)錯(cuò)誤和解決方法常見錯(cuò)誤1:錯(cuò)別字經(jīng)常發(fā)生的一種錯(cuò)誤是,你輸入的關(guān)鍵詞含有錯(cuò)別字,改正了就好。常見錯(cuò)誤2:關(guān)健詞太常見搜索引擎對(duì)常見詞的搜索存在缺陷,因?yàn)檫@些詞曝光率太高了,以至于出現(xiàn)在成百萬網(wǎng)頁中,使得它們事實(shí)上不能被用來幫你找到什么有用的內(nèi)容。比如說搜索“電話”。常見錯(cuò)誤3:多義詞要小心使用多義詞,比如搜索“java”,你要找的信息究竟是太平洋上的一個(gè)島、一種著名的咖啡、還是一種計(jì)算機(jī)語言常見錯(cuò)誤4:不會(huì)輸關(guān)鍵詞,想要什么輸什么

搜索失敗的另一個(gè)常見原因是類似這樣的搜索:“現(xiàn)代愛情故事歌詞”常見錯(cuò)誤5:在錯(cuò)誤的地方搜索

有些信息不適合搜索,應(yīng)該直接到網(wǎng)站瀏覽,如論壇的內(nèi)容。常見錯(cuò)誤6:停用詞

停用詞主要見于英文搜索引擎中,指的是使用過于頻繁的單詞,如“is”、“i”、“what”、“it”等。一些搜索引擎在它的網(wǎng)頁庫里碰到這些詞時(shí)不會(huì)搜用戶自己的錯(cuò)誤如何

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論