因特網(wǎng)信息的查找-(2)課件_第1頁
因特網(wǎng)信息的查找-(2)課件_第2頁
因特網(wǎng)信息的查找-(2)課件_第3頁
因特網(wǎng)信息的查找-(2)課件_第4頁
因特網(wǎng)信息的查找-(2)課件_第5頁
已閱讀5頁,還剩29頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2.2因特網(wǎng)信息的查找知識(shí)點(diǎn)回顧:信息獲取的一般過程定位信息需求選擇信息

的來源確定信息獲取方法,獲取信息評(píng)價(jià)信息調(diào)整奇葩作業(yè)腳-鞋襪+草地=爸爸+媽媽+我=楓葉+小溪=一個(gè)噴嚏+一個(gè)噴嚏+一個(gè)噴嚏=所謂搜索引擎,就是用于在因特網(wǎng)上進(jìn)行信息查找的網(wǎng)絡(luò)工具,是一個(gè)提供信息“檢索”服務(wù)的網(wǎng)站。例:什么是搜索引擎元搜索引擎1995Yahoo!1994Gopher1993Archie1990第二代搜索目錄搜索Google1996Baidu1999……第三代搜索網(wǎng)頁搜索搜索引擎的發(fā)展歷史搜索引擎的起源——Archie

所有搜索引擎的祖先,是1990年由蒙特利爾的McGillUniversity三名學(xué)生發(fā)明的Archie(ArchieFAQ)。Archie是第一個(gè)自動(dòng)索引互聯(lián)網(wǎng)上匿名FTP網(wǎng)站文件的程序,但它還不是真正的搜索引擎。Archie是一個(gè)可搜索的FTP文件名列表,用戶必須輸入精確的文件名搜索,然后Archie會(huì)告訴用戶哪一個(gè)FTP地址可以下載該文件。

由于Archie深受歡迎,受其啟發(fā),NevadaSystemComputingServices大學(xué)于1993年開發(fā)了一個(gè)Gopher(GopherFAQ)搜索工具。它只支持文本,不支持圖像現(xiàn)在這個(gè)工具主要用在國(guó)外大型圖書館的信息檢索上。早期的另一個(gè)搜索工具Gopher

1994年4月,斯坦福大學(xué)的兩名博士生,美籍華人楊致遠(yuǎn)和DavidFilo共同創(chuàng)辦了Yahoo)。Yahoo目錄開始支持簡(jiǎn)單的數(shù)據(jù)庫搜索,因?yàn)閅ahoo!的數(shù)據(jù)是手工輸入的,所以不能真正被歸為搜索引擎,事實(shí)上只是一個(gè)可搜索的目錄。Yahoo!中收錄的網(wǎng)站,因?yàn)槎几接泻?jiǎn)介信息,所以搜索效率明顯提高。Yahoo!---幾乎成為20世紀(jì)90年代的因特網(wǎng)的代名詞。第二代搜索:目錄式搜索Yahoo!

1995年,一種新的搜索引擎形式出現(xiàn)了——元搜索引擎(MetaSearchEngine)。用戶只需提交一次搜索請(qǐng)求,由元搜索引擎負(fù)責(zé)轉(zhuǎn)換處理后提交給多個(gè)預(yù)先選定的獨(dú)立搜索引擎,并將從各獨(dú)立搜索引擎返回的所有查詢結(jié)果,集中起來處理后再返回給用戶。元搜索引擎概念上好聽,但搜索效果始終不理想,所以沒有哪個(gè)元搜索引擎有過強(qiáng)勢(shì)地位。

好聽不好用的元搜索引擎第三代搜索:網(wǎng)頁搜索它們都屬于網(wǎng)頁自動(dòng)搜索引擎,有的還帶有智能分析或搜索功能

按工作方式劃分

按檢索內(nèi)容劃分搜索引擎的分類

全文搜索引擎目錄索引類搜索引擎元搜索引擎通用型垂直型全文搜索引擎什么是關(guān)鍵詞就是您輸入搜索框中的文字,也就是您命令搜索引擎尋找的東西。提煉正確的關(guān)鍵詞無庸至疑,選擇正確的關(guān)鍵詞是一切的開始。學(xué)會(huì)從復(fù)雜搜索意圖中提練出最具代表性和指示性的關(guān)鍵詞對(duì)提高信息查詢效率至關(guān)重要。例如:多少級(jí)以上的地震會(huì)造成破壞?

a)4.5級(jí)b)5級(jí)c)6級(jí)關(guān)鍵詞:震級(jí)破壞全文搜索引擎的工作原理索引生成器(網(wǎng)頁數(shù)據(jù)庫)爬行器(蜘蛛)查詢檢索器(用戶查詢)因特網(wǎng)利用能夠從互聯(lián)網(wǎng)上自動(dòng)收集網(wǎng)頁的Spider系統(tǒng)程序,自動(dòng)訪問互聯(lián)網(wǎng),并沿著任何網(wǎng)頁中的所有URL爬到其它網(wǎng)頁,重復(fù)這過程,并把爬過的所有網(wǎng)頁收集回來。第一步:從互聯(lián)網(wǎng)上抓取網(wǎng)頁因特網(wǎng)第二步:建立索引數(shù)據(jù)庫由分析索引系統(tǒng)程序?qū)κ占木W(wǎng)頁進(jìn)行分析,提取相關(guān)網(wǎng)頁信息(包括網(wǎng)頁所在URL、編碼類型、頁面內(nèi)容包含的關(guān)鍵詞、關(guān)鍵詞位置、生成時(shí)間、大小、與其它網(wǎng)頁的鏈接關(guān)系等),根據(jù)一定的相關(guān)度算法進(jìn)行大量復(fù)雜計(jì)算,得到每一個(gè)網(wǎng)頁針對(duì)頁面內(nèi)容中及超鏈中每一個(gè)關(guān)鍵詞的相關(guān)度(或重要性),然后用這些相關(guān)信息建立網(wǎng)頁索引數(shù)據(jù)庫。搜索引擎的Spider一般要定期重新訪問所有網(wǎng)頁(各搜索引擎的周期不同,可能是幾天、幾周或幾月,也可能對(duì)不同重要性的網(wǎng)頁有不同的更新頻率),更新網(wǎng)頁索引數(shù)據(jù)庫,以反映出網(wǎng)頁內(nèi)容的更新情況,增加新的網(wǎng)頁信息,去除死鏈接,并根據(jù)網(wǎng)頁內(nèi)容和鏈接關(guān)系的變化重新排序。這樣,網(wǎng)頁的具體內(nèi)容和變化情況就會(huì)反映到用戶查詢的結(jié)果中。

第三步:檢索界面的建立當(dāng)用戶輸入關(guān)鍵詞搜索后,由搜索系統(tǒng)程序從網(wǎng)頁索引數(shù)據(jù)庫中找到符合該關(guān)鍵詞的所有相關(guān)網(wǎng)頁。因?yàn)樗邢嚓P(guān)網(wǎng)頁針對(duì)該關(guān)鍵詞的相關(guān)度早已算好,所以只需按照現(xiàn)成的相關(guān)度數(shù)值排序,相關(guān)度越高,排名越靠前。

最后,由頁面生成系統(tǒng)將搜索結(jié)果的鏈接地址和頁面內(nèi)容摘要等內(nèi)容組織起來返回給用戶。

全文搜索引擎的工作原理3、鏈接2、專題目錄總目錄——專題目錄——鏈接——網(wǎng)站4、網(wǎng)站目錄索引類搜索引擎類型舉例目錄索引

全文搜索目錄索引類與全文搜索引擎對(duì)比Google、百度、北大天網(wǎng)優(yōu)點(diǎn):檢索直接、方便,而且可使用布爾邏輯檢索、短語檢索等高級(jí)功能缺點(diǎn):繁多而雜亂Yahoo、搜狐、新浪優(yōu)點(diǎn):清晰方便地查找到某一大類信息并不嚴(yán)格限于查詢關(guān)鍵字缺點(diǎn):搜索范圍較全文搜索引擎要小許多,尤其是當(dāng)用戶選擇類型不當(dāng)時(shí),可能遺漏某些重要的信息源。元搜索引擎。在接受用戶查詢請(qǐng)求時(shí),同時(shí)在其他多個(gè)引擎上進(jìn)行搜索,并將結(jié)果返回給用戶。

百Google度:元搜索引擎優(yōu)點(diǎn):信息覆蓋面更加廣泛缺點(diǎn):高級(jí)檢索功能不完善,檢索結(jié)果沒有經(jīng)過處理著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的有北斗星等。全文搜索引擎:google,百度。可以搜索至每個(gè)頁面。目錄索引類搜索引擎:典型代表Yahoo,可以不用提供關(guān)鍵詞,按照分類也能檢索到相應(yīng)的網(wǎng)站,因此他對(duì)網(wǎng)站的檢索能力非常強(qiáng)。國(guó)內(nèi)的新浪,網(wǎng)易。元搜索引擎:可同時(shí)在多個(gè)搜索引擎上進(jìn)行搜索搜索引擎分類小結(jié)實(shí)際上:由分類搜索和全文搜索各有利弊,當(dāng)前許多搜索引擎都在朝著二者兼?zhèn)涞姆较虬l(fā)展,如谷歌、新浪、搜索、百度都設(shè)置了兩種搜索方式。全文搜索與關(guān)鍵詞搜索實(shí)戰(zhàn)——搜索技巧導(dǎo)學(xué)一:選擇合適的搜索引擎通過搜索引擎查閱與風(fēng)光攝影有關(guān)的個(gè)人主頁。通過搜索引擎查閱與風(fēng)光攝影有關(guān)的圖片。思考:全文搜索引擎和目錄索引類搜索引擎各自在什么情況下使用。

小結(jié):全文搜索引擎使用起來相對(duì)比較簡(jiǎn)單,但精確度相對(duì)差一些。目錄索引類搜索引擎精確度比較高,但使用起來相對(duì)比較麻煩。

此外,還有一些權(quán)威網(wǎng)站或者專業(yè)的搜索引擎供網(wǎng)上用戶查詢。全文搜索與關(guān)鍵詞搜索實(shí)戰(zhàn)——搜索技巧導(dǎo)學(xué)二:細(xì)化搜索條件請(qǐng)?jiān)囍诰W(wǎng)上找到余光中《鄉(xiāng)愁》的英語譯稿并思考搜索當(dāng)中最重要的是什么?1.你選用的搜索引擎是

2.你用的搜索關(guān)鍵詞是3.搜索引擎提供了多少網(wǎng)頁結(jié)果4.你最終在哪個(gè)網(wǎng)站上獲得了你想要的正確的譯稿

小結(jié):提煉出最具代表性和指示性的關(guān)鍵詞對(duì)提高信息查詢效率至關(guān)重要,同時(shí),搜索條件越具體,搜索引擎返回的結(jié)果越精確,有時(shí)輸入多個(gè)關(guān)鍵詞,可以獲得更精確的搜索結(jié)果。全文搜索與關(guān)鍵詞搜索實(shí)戰(zhàn)——搜索技巧導(dǎo)學(xué)三:用好邏輯命令小明在語文課上學(xué)了蘇軾寫的《念奴嬌—赤壁懷古》,他很喜歡這個(gè)詞牌,想從網(wǎng)上查找詞牌名為“念奴嬌”的其他宋詞,他找到最多的居然是伊能靜演唱的一首名為《念奴嬌》的流行歌曲。請(qǐng)分別使用“念奴嬌赤壁懷古”、“念奴嬌-赤壁懷古”等關(guān)鍵詞在百度上進(jìn)行搜索,觀察有什么區(qū)別?全文搜索與關(guān)鍵詞搜索實(shí)戰(zhàn)——搜索技巧邏輯運(yùn)算符:“與”運(yùn)算:and、&、空格、+,兩關(guān)鍵詞是“并且”的關(guān)系。“或”運(yùn)算:or、|,兩關(guān)鍵詞是“或者”的關(guān)系。“非”運(yùn)算:not、-,從搜索范圍中排除某項(xiàng)內(nèi)容。搜索技巧:邏輯符號(hào)的使用左右兩個(gè)關(guān)鍵詞同時(shí)滿足信息技術(shù)and歷史

信息技術(shù)+歷史

信息技術(shù)歷史左右兩個(gè)關(guān)鍵詞只有一個(gè)滿足即可信息技術(shù)or歷史信息技術(shù)|歷史排除后面的關(guān)鍵詞信息技術(shù)not歷史

信息技術(shù)–歷史信息

技術(shù)歷史信息

技術(shù)歷史信息

技術(shù)歷史邏輯符號(hào)的使用全文搜索與關(guān)鍵詞搜索實(shí)戰(zhàn)——搜索技巧導(dǎo)學(xué)四:強(qiáng)制搜索加英文雙引號(hào)或書名號(hào)一般在查詢名言警句或者專有名詞時(shí)顯得格外有用。補(bǔ)充:請(qǐng)?jiān)凇笆謾C(jī)”兩邊加上書名號(hào),觀察它和不加書名號(hào)有什么區(qū)別。搜索“www的歷史”,觀察加與不加英文雙引號(hào)的區(qū)別全文搜索與關(guān)鍵詞搜索實(shí)戰(zhàn)——搜索技巧導(dǎo)學(xué)五:適當(dāng)使用特征詞該技巧用于查找明星的個(gè)人資料頁。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論