




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第6章Internet網(wǎng)絡(luò)信息存取第一節(jié)網(wǎng)絡(luò)信息存取原理與方法
第二節(jié)Internet網(wǎng)絡(luò)存取系統(tǒng)及其檢索第三節(jié)網(wǎng)絡(luò)信息檢索策略與技巧復(fù)習(xí):1.要使用百度引擎搜索含有“油畫(huà)藝術(shù)”詞組的文本文件,使用的檢索策略應(yīng)為( )。2.要使用百度引擎搜索中標(biāo)題含有“污水處理”檢索詞的網(wǎng)頁(yè),使用的檢索策略為應(yīng)為( )。3.百度引擎檢索策略表達(dá)式:intitle:存款利率filetype:xls中運(yùn)用了( )和( )算符,其中filetype:xls的含義是( )。6.1概述(補(bǔ)充)Internet網(wǎng)絡(luò)上蘊(yùn)藏著非常豐富的信息資源,從電子期刊、電子工具書(shū)、商業(yè)信息、新聞、大學(xué)和專(zhuān)業(yè)機(jī)構(gòu)介紹、軟件、數(shù)據(jù)庫(kù)、圖書(shū)館資源、國(guó)際組織和政府出版物,到娛樂(lè)性信息等等。它已經(jīng)成為全球范圍內(nèi)傳播科研、教育、商業(yè)和社會(huì)信息的最主要的渠道。但要從這個(gè)信息海洋中準(zhǔn)確迅速地找到并獲得自己所需的信息,卻往往比較困難。正是為了解決這個(gè)問(wèn)題,從20世紀(jì)80年代起人們就開(kāi)發(fā)了各種網(wǎng)絡(luò)信息檢索工具。6.1網(wǎng)絡(luò)信息存取原理與方法6.1.1網(wǎng)絡(luò)信息檢索的特點(diǎn)(P190)
存取范圍覆蓋Internet上的幾乎所有資源Internet上的信息,包括WWW、FTP、Telnet、Usenet、Gopher等,用戶不必預(yù)先知道某種資源的具體地址。
傳統(tǒng)檢索方法與全新檢索技術(shù)相結(jié)合傳統(tǒng)檢索方法:布爾邏輯檢索、加權(quán)檢索、全文檢索、模糊檢索新的檢索技術(shù):超文本檢索注意:不同技術(shù)在不同網(wǎng)站上表現(xiàn)出不同的實(shí)現(xiàn)細(xì)節(jié)。
用戶界面友好且操作方便網(wǎng)絡(luò)信息存取工具采用C/S結(jié)構(gòu),交互方式較好,輸入檢索式,點(diǎn)擊檢索,即可獲得包括題目、內(nèi)容簡(jiǎn)介、HTTP地址等信息,并可進(jìn)一步獲得更為詳細(xì)的信息。可做書(shū)簽標(biāo)記,保留檢索歷史。良好的信息反饋和瞬間響應(yīng)功能。容易學(xué)習(xí)。
具備良好的導(dǎo)航和編輯功能網(wǎng)絡(luò)信息存取系統(tǒng)可用導(dǎo)航機(jī)制,了解資源在網(wǎng)絡(luò)圖中的位置。具有良好的編輯功能,可修改、增加、刪除結(jié)點(diǎn)和鏈。
用戶透明度6.1.2網(wǎng)絡(luò)信息檢索一般方法
瀏覽:順鏈而行
通過(guò)資源指南(ResourceGuide)來(lái)查找相應(yīng)的信息:專(zhuān)業(yè)人員利用自身對(duì)網(wǎng)絡(luò)信息資源的產(chǎn)生、傳遞與利用、分布機(jī)制的廣泛了解,對(duì)各種網(wǎng)絡(luò)信息資源采用采集、組織、評(píng)價(jià)、過(guò)濾、控制、檢索等手段開(kāi)發(fā)出的可供瀏覽和檢索的書(shū)目之書(shū)目,又稱(chēng)網(wǎng)上虛擬圖書(shū)館。資源指南分為綜合性資源指南和專(zhuān)業(yè)性資源指南。但是幾乎每過(guò)6個(gè)月就需要對(duì)其進(jìn)行更新,因此要注意是否過(guò)時(shí)。此外資源指南凝聚了專(zhuān)業(yè)人員的工作,值得參考。如:
利用網(wǎng)絡(luò)信息檢索工具WWW、FTP、Telnet、Gopher、Wais等性能優(yōu)越的信息查詢工具。
RSS:RSS是站點(diǎn)用來(lái)和其他站點(diǎn)間共享信息的一種簡(jiǎn)易方式,用戶只要使用相應(yīng)的客戶端工具就能在不打開(kāi)網(wǎng)站頁(yè)面情況下讀取自己感興趣的網(wǎng)站內(nèi)容。RSS的特點(diǎn):RSS閱讀器可以自動(dòng)更新新聞內(nèi)容,保持與網(wǎng)站內(nèi)容一致;可以定制多個(gè)RSS提要,所新聞?wù)铣蓡蝹€(gè)數(shù)據(jù)流;沒(méi)有廣告或圖片等內(nèi)容的騷擾,閱讀更加方便。
使用搜索軟件針對(duì)搜索引擎的不足,國(guó)內(nèi)出現(xiàn)了許多專(zhuān)業(yè)搜索軟件,其特點(diǎn)是搜索速度快,搜索范圍廣,同時(shí)啟動(dòng)多個(gè)搜索引擎進(jìn)行搜索。缺點(diǎn):需要安裝軟件,準(zhǔn)確性不高,個(gè)別軟件無(wú)法有效過(guò)濾重復(fù)信息。
充分利用E-mail獲取信息資源用戶加入電子論壇的專(zhuān)題討論組后,有關(guān)該專(zhuān)題所有言論會(huì)傳遞到用戶E-mail信箱,從而達(dá)到搜集、開(kāi)發(fā)與利用網(wǎng)絡(luò)信息的目的。用戶可以通過(guò)E-mail訂閱電子期刊,定期收到專(zhuān)題信息。6.1.3網(wǎng)絡(luò)信息存取工具網(wǎng)絡(luò)信息檢索工具(P193):在因特網(wǎng)上提供信息檢索服務(wù)的計(jì)算機(jī)系統(tǒng),其檢索對(duì)象往往是存在于因特網(wǎng)信息空間中各種類(lèi)型的網(wǎng)絡(luò)信息資源.網(wǎng)絡(luò)資源檢索工具分類(lèi):根據(jù)檢索工具檢索網(wǎng)絡(luò)資源類(lèi)型的不同,可以將其分為萬(wàn)維網(wǎng)檢索工具和非萬(wàn)維網(wǎng)檢索工具。萬(wàn)維網(wǎng)檢索工具主要檢索萬(wàn)維網(wǎng)站點(diǎn)上的資源,它們常被稱(chēng)為搜索引擎,而且由于萬(wàn)維網(wǎng)資源常以網(wǎng)頁(yè)的形式存在,它們的檢索結(jié)果常常被稱(chēng)為網(wǎng)頁(yè)。非萬(wàn)維網(wǎng)檢索工具主要檢索特殊類(lèi)型的信息資源,如Archie一檢索FTP文件;Veronica一搜索Gopher服務(wù)器;WAIS-查詢Usenet新聞組資源;DejaNews-檢索新聞組等。不過(guò)越來(lái)越多的萬(wàn)維網(wǎng)搜索引擎具備了檢索非萬(wàn)維網(wǎng)資源的功能,使它們成為檢索多類(lèi)網(wǎng)絡(luò)信息資源的集成化工具。為此,本章將搜索引擎為例介紹網(wǎng)絡(luò)信息檢索的基本原理和方法。搜索引擎的工作原理就像超市索引生成器(網(wǎng)頁(yè)數(shù)據(jù)庫(kù))爬行器(蜘蛛)查詢檢索器(用戶查詢)因特網(wǎng)6.1.4搜索引擎的工作原理搜索引擎并不真正搜索互聯(lián)網(wǎng),它搜索的實(shí)際上是預(yù)先整理好的網(wǎng)頁(yè)索引數(shù)據(jù)庫(kù)。真正意義上的搜索引擎,通常指的是收集了因特網(wǎng)上幾千萬(wàn)到幾十億個(gè)網(wǎng)頁(yè)并對(duì)網(wǎng)頁(yè)中的每一個(gè)詞(即關(guān)鍵詞)進(jìn)行索引,建立索引數(shù)據(jù)庫(kù)的全文搜索引擎。當(dāng)用戶查找某個(gè)關(guān)鍵詞的時(shí)候,所有在頁(yè)面內(nèi)容中包含了該關(guān)鍵詞的網(wǎng)頁(yè)都將作為搜索結(jié)果被搜出來(lái)。在經(jīng)過(guò)復(fù)雜的算法進(jìn)行排序后,這些結(jié)果將按照與搜索關(guān)鍵詞的相關(guān)度高低,依次排列?,F(xiàn)在的搜索引擎已普遍使用超鏈分析技術(shù),除了分析索引網(wǎng)頁(yè)本身的內(nèi)容,還分析所有指向該網(wǎng)頁(yè)的鏈接的URL、AnchorText,甚至鏈接周?chē)奈淖?。如網(wǎng)頁(yè)本身無(wú)“信息存貯與檢索”,但如有網(wǎng)頁(yè)用“信息存貯與檢索”指向這個(gè)網(wǎng)頁(yè),該網(wǎng)頁(yè)也會(huì)被找出。而且這類(lèi)網(wǎng)頁(yè)越多,或是鏈源越優(yōu)秀,該網(wǎng)頁(yè)排序也會(huì)越靠前。6.1.5搜索引擎的基本結(jié)構(gòu)(P194)用戶系統(tǒng)用戶接口搜索器索引器檢索器www信息資源FTP信息資源Gopher信息資源WAIS信息資源搜索引擎網(wǎng)絡(luò)網(wǎng)絡(luò)Telnet信息資源用戶服務(wù)組信息資源搜索器又稱(chēng)為Robot(機(jī)器人)、spider(蜘蛛)、webcrawler(爬行者)或Worm等。是一個(gè)自動(dòng)收集網(wǎng)頁(yè)的系統(tǒng)程序,其功能是日夜不停地在互聯(lián)網(wǎng)中漫游,“筢”回信息。它要盡可能多、盡可能快地搜集各種類(lèi)型的新信息,還要定期更新已經(jīng)搜集過(guò)的舊的信息,以避免死鏈。目前有兩種搜集信息的策略:從一個(gè)起始URL集合開(kāi)始,順著這些URL中的超鏈接,以寬度優(yōu)先、深度優(yōu)先或啟發(fā)式方式循環(huán)在互聯(lián)網(wǎng)中發(fā)現(xiàn)信息。這些起始URL可以是任意的URL,但常常是一些非常流行、包含很多鏈接的站點(diǎn),如Yahoo。將WEB空間按域名、IP地址或國(guó)家域名劃分,每個(gè)搜索器負(fù)責(zé)一個(gè)子空間的窮盡搜索。搜索器搜集的信息類(lèi)型多種多樣,包括網(wǎng)頁(yè)文件、有的搜索器能處理字處理文檔,甚至數(shù)據(jù)庫(kù)文件。搜索器將“筢”回的每個(gè)文檔過(guò)濾掉格式符,提取文本數(shù)據(jù)Fulltext。每個(gè)文檔對(duì)應(yīng)一個(gè)Fulltext文件,內(nèi)容包括網(wǎng)頁(yè)標(biāo)題、網(wǎng)頁(yè)URL、大小、時(shí)間、類(lèi)型、分類(lèi)等屬性及文本內(nèi)容,所有生成的這些文件交給Indexer進(jìn)行索引處理。搜索器一般要定期重新訪問(wèn)所有網(wǎng)頁(yè)(各搜索引擎的周期不同,可能是幾天、幾周或幾月,也可能對(duì)不同重要性的網(wǎng)頁(yè)有不同的更新頻率),更新網(wǎng)頁(yè)索引數(shù)據(jù)庫(kù),以反映出網(wǎng)頁(yè)內(nèi)容的更新情況,增加新網(wǎng)頁(yè)信息,去除死鏈接,并根據(jù)網(wǎng)頁(yè)內(nèi)容和鏈接關(guān)系的變化重新排序。這樣網(wǎng)頁(yè)的具體內(nèi)容和變化情況就會(huì)反映到用戶查詢的結(jié)果中。索引器:索引器的功能是理解搜索器所搜索的信息,由分析索引系統(tǒng)程序?qū)κ占貋?lái)的網(wǎng)頁(yè)進(jìn)行分析,提出相關(guān)網(wǎng)頁(yè)信息(包括網(wǎng)頁(yè)所在URL、編碼類(lèi)型、頁(yè)面內(nèi)容包含的關(guān)鍵詞、關(guān)鍵詞位置、生成時(shí)間、大小、與其他網(wǎng)頁(yè)的鏈接關(guān)系等),根據(jù)一定的相關(guān)度算法進(jìn)行大量復(fù)雜計(jì)算,得到每一個(gè)網(wǎng)頁(yè)針對(duì)頁(yè)面內(nèi)容及超鏈接中每一個(gè)關(guān)鍵詞的相關(guān)度(或重要性),然后用這些相關(guān)信息建立網(wǎng)頁(yè)索引數(shù)據(jù)庫(kù)。索引項(xiàng)分為客觀索引項(xiàng)和內(nèi)容索引項(xiàng)兩種。客觀索引項(xiàng)與文檔語(yǔ)義無(wú)關(guān),如作者、URL、更新時(shí)間、編碼、長(zhǎng)度、鏈接流行度等。內(nèi)容索引項(xiàng)用來(lái)反映文檔內(nèi)容,如關(guān)鍵詞及其權(quán)重、短語(yǔ)、單字等。一般而言,標(biāo)引的索引項(xiàng)越多,檢索的全面性越高,檢準(zhǔn)率就相對(duì)較低。檢索器:根據(jù)用戶的查詢?cè)谒饕龓?kù)中快速檢索出文檔,進(jìn)行文檔與查詢的相關(guān)度評(píng)價(jià),對(duì)將要輸出的結(jié)果進(jìn)行排序,并實(shí)現(xiàn)某種用戶相關(guān)性反饋機(jī)制,如基于內(nèi)容、基于鏈接分析的方法進(jìn)行相關(guān)度排序。用戶接口:輸入用戶查詢,顯示查詢結(jié)果,提供用戶相關(guān)性反饋機(jī)制。UI的主要目的是方便用戶使用搜索引擎,高效率、多方式地從搜索引擎中得到有效、及時(shí)的信息。包括簡(jiǎn)單接口和復(fù)雜接口兩種。簡(jiǎn)單接口只提供用戶輸入查詢串的文本框;復(fù)雜接口可以讓用戶對(duì)查詢進(jìn)行限制,如邏輯運(yùn)算、相近關(guān)系、域名范圍、出現(xiàn)位置、信息時(shí)間、長(zhǎng)度等。
搜索引擎工作原理用戶訪問(wèn)策略搜索引擎用戶界面接口搜索引擎本地的摘要信息數(shù)據(jù)庫(kù)各萬(wàn)維網(wǎng)站點(diǎn)資源各記錄鏈接詳細(xì)信息反饋訪問(wèn)摘要信息反饋6.1.6
搜索引擎的分類(lèi)(補(bǔ)充)
1.全文搜索引擎(FullTextSearchEngine)通過(guò)從互聯(lián)網(wǎng)上提取的各個(gè)網(wǎng)站的信息(以網(wǎng)頁(yè)文字為主)建立的數(shù)據(jù)庫(kù),檢索與用戶查詢條件匹配的相關(guān)記錄,然后按一定的排列順序?qū)⒔Y(jié)果返回給用戶。國(guó)外具代表性的有Google、Fast/AllTheWeb、AltaVista、Inktomi、Teoma、WiseNut等,國(guó)內(nèi)著名的有百度、中文搜索、北大天網(wǎng)等。
全文搜索引擎的優(yōu)點(diǎn):全文搜索、檢索功能強(qiáng)、信息更新速度快等。缺點(diǎn):提供的信息雖然多而全,但可供選擇的信息太多反而降低相應(yīng)的命中率,并且提供的查詢結(jié)果重復(fù)鏈接較多,層次結(jié)構(gòu)不清晰,給人一種繁多雜亂的感覺(jué)。
2.目錄索引類(lèi)搜索引擎(SearchIndex/Directory)目錄索引由人工建立,通過(guò)“人工方式”將站點(diǎn)進(jìn)行了分類(lèi),將該網(wǎng)站劃分到某個(gè)分類(lèi)下,再記錄一些摘要信息,對(duì)該網(wǎng)站進(jìn)行概述性的簡(jiǎn)要介紹,用戶提出搜索要求時(shí),搜索引擎只在網(wǎng)站的簡(jiǎn)介中搜索。
國(guó)外有代表性的有Yahoo雅虎、OpenDirectoryProject(DMOZ)、LookSmart、About等。國(guó)內(nèi)有搜狐(Sohu)、中文Yahoo、新浪(Sina)、網(wǎng)易搜索(NetEase)等。主要優(yōu)點(diǎn)有:①層次、結(jié)構(gòu)清晰,易于查找;②多級(jí)類(lèi)目,便于查詢到具體明確的主題;③內(nèi)容提要、分類(lèi)目錄下,有簡(jiǎn)明扼要的內(nèi)容,可以使用戶一目了然。缺點(diǎn):搜索范圍較小;更新速度慢;查詢交叉類(lèi)目時(shí)容易遺漏。3.元搜索引擎(MetaSearchEngine)元搜索引擎在接受用戶查詢請(qǐng)求時(shí),同時(shí)在其他多個(gè)引擎上進(jìn)行搜索,并將結(jié)果返回給用戶。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的有搜星搜索引擎。在搜索結(jié)果排列方面,有的直接按來(lái)源引擎排列搜索結(jié)果,如Dogpile,有的則按自定的規(guī)則將結(jié)果重新排列組合,如Vivisimo。除上述三大類(lèi)引擎外,還有以下幾種非主流形式:(1)集合式搜索引擎。如HotBot在2002年底推出的引擎。該引擎類(lèi)似META搜索引擎,但區(qū)別在于不是同時(shí)調(diào)用多個(gè)引擎進(jìn)行搜索,而是由用戶從提供的4個(gè)引擎當(dāng)中選擇,因此叫它“集合式”搜索引擎更確切些。(2)門(mén)戶搜索引擎。如AOLSearch、MSNSearch等雖然提供搜索服務(wù),但自身即沒(méi)有分類(lèi)目錄也沒(méi)有網(wǎng)頁(yè)數(shù)據(jù)庫(kù),其搜索結(jié)果完全來(lái)自其他引擎。(3)免費(fèi)鏈接列表(FreeForAllLinks,F(xiàn)FA)。這類(lèi)網(wǎng)站一般只簡(jiǎn)單地滾動(dòng)排列鏈接條目,少部分有簡(jiǎn)單的分類(lèi)目錄,不過(guò)規(guī)模比起Yahoo等目錄索引來(lái)要小得多。6.1.7搜索引擎的特點(diǎn)(補(bǔ)充):(1)搜索引擎是一個(gè)雙層C/S結(jié)構(gòu)的體系當(dāng)用戶訪問(wèn)搜索引擎時(shí):用戶端為客戶機(jī),向搜索引擎提出檢索請(qǐng)求,搜索引擎為服務(wù)器,檢索自己的索引數(shù)據(jù)庫(kù)并將檢索結(jié)果以應(yīng)答形式提交給用戶。當(dāng)搜索引擎采集數(shù)據(jù)時(shí):搜索引擎為客戶機(jī),向WWW站點(diǎn)等實(shí)際資源系統(tǒng)提出搜索請(qǐng)求,各類(lèi)實(shí)際資源系統(tǒng)為服務(wù)器,將有關(guān)數(shù)據(jù)(例如網(wǎng)頁(yè))作為應(yīng)答提交給搜索引擎。(2)搜索引擎是一個(gè)"網(wǎng)絡(luò)導(dǎo)航工具"與用于提供圖書(shū)館館藏信息的目錄系統(tǒng)相似,搜索引擎本身并不提供任何實(shí)際的Web文檔,而僅提供關(guān)于網(wǎng)頁(yè)的信息。搜索引擎為所采集的每一個(gè)網(wǎng)頁(yè)建立一條記錄,記錄包括對(duì)網(wǎng)頁(yè)的簡(jiǎn)單描述、標(biāo)題以及實(shí)際網(wǎng)頁(yè)所在服務(wù)器的URL等信息,這些記錄的集合就構(gòu)成了索引數(shù)據(jù)庫(kù)。搜索引擎通過(guò)對(duì)索引數(shù)據(jù)庫(kù)的采集與調(diào)用來(lái)實(shí)現(xiàn)網(wǎng)絡(luò)導(dǎo)航功能。6.1.8檢索方法(補(bǔ)充):搜索引擎常用的檢索方法有關(guān)鍵詞檢索和目錄瀏覽兩種形式。關(guān)鍵詞檢索:用戶直接輸入檢索詞,搜索引擎通過(guò)查找索引數(shù)據(jù)庫(kù)中包含有檢索詞的記錄來(lái)提供用戶所需的信息資源。檢索方便直接,而且可以使用邏輯算符、位置算符、截詞符等來(lái)構(gòu)成檢索式,可以限制檢索對(duì)象的地區(qū)、數(shù)據(jù)類(lèi)型、時(shí)間等,因而可準(zhǔn)確檢索滿足特定條件的網(wǎng)絡(luò)資源。關(guān)鍵詞什么是關(guān)鍵詞就是您輸入搜索框中的文字,也就是您命令搜索引擎尋找的東西。提煉正確的關(guān)鍵詞無(wú)庸至疑,選擇正確的關(guān)鍵詞是一切的開(kāi)始。學(xué)會(huì)從復(fù)雜搜索意圖中提練出最具代表性和指示性的關(guān)鍵詞對(duì)提高信息查詢效率至關(guān)重要,這方面的技巧(或者說(shuō)經(jīng)驗(yàn))是所有搜索技巧之母。例如:多少級(jí)以上的地震會(huì)造成破壞?
a)4.5級(jí)b)5級(jí)c)6級(jí)關(guān)鍵詞:震級(jí)造成破壞目錄瀏覽:用戶通過(guò)瀏覽層次型的目錄來(lái)尋找相關(guān)的信息資源。目錄按一定的主題分類(lèi)體系組織,并輔之年代、地區(qū)等分類(lèi)。用戶一般采取逐層瀏覽目錄、逐步細(xì)化來(lái)尋找合適的類(lèi)別直至具體資源。以雅虎網(wǎng)站為例。Yahoo把信息分為很多類(lèi),從藝術(shù)和商業(yè)到科學(xué)和社會(huì),可以選擇自己所需查詢的類(lèi)別點(diǎn)擊進(jìn)入。例如:我們打算查找與操作系統(tǒng)有關(guān)的網(wǎng)站,可以單擊“電腦與因特網(wǎng)”鏈接點(diǎn)進(jìn)入更細(xì)的分類(lèi)查詢。從中選擇“操作系統(tǒng)”,這時(shí)就會(huì)出現(xiàn)進(jìn)一步分類(lèi)和網(wǎng)站鏈接清單,然后從中選擇自己所需的站點(diǎn)進(jìn)入。6.1.9網(wǎng)絡(luò)信息檢索工具的功能(P198)
基本檢索功能
布爾邏輯檢索(NOT/nor/!、AND/and/&、OR/or/|)
字符串檢索(“”功能)
截詞檢索
字段限制檢索(題名,著者,關(guān)鍵詞等)
位置檢索
高級(jí)檢索功能
自然語(yǔ)言檢索(直接輸入自燃語(yǔ)言)
模糊檢索(搜尋相關(guān)概念,上下位概念)
概念檢索(指同義詞和近義詞)
區(qū)分大小寫(xiě)檢索
管道檢索(用管道符“|”表檢索順序)
相關(guān)信息反饋檢索(點(diǎn)擊相關(guān)網(wǎng)頁(yè),網(wǎng)站等。Yahoo,Lycos的“morelikethis”等)
檢索范圍限制(語(yǔ)言、地域、類(lèi)型、后綴、時(shí)間等)
6.1.10網(wǎng)絡(luò)信息檢索工具類(lèi)型(P196-198)
按照網(wǎng)絡(luò)信息資源類(lèi)型劃分
www檢索工具
非www檢索工具
按照檢索機(jī)制劃分(分析其優(yōu)缺點(diǎn))
關(guān)鍵詞檢索工具
分類(lèi)目錄檢索工具
混合型檢索工具
按照包含檢索工具數(shù)量劃分
單一型檢索工具
多元型檢索工具(并行,串行,ALL-IN-ONE方式)
按照檢索內(nèi)容劃分
綜合型檢索工具
專(zhuān)題型檢索工具
特殊型檢索工具6.1.9網(wǎng)絡(luò)檢索方法的發(fā)展(補(bǔ)充):隨著技術(shù)的進(jìn)步,不少原先僅在實(shí)驗(yàn)室內(nèi)進(jìn)行研究的檢索方法,已開(kāi)始應(yīng)用于網(wǎng)絡(luò)信息的檢索。加權(quán)檢索加權(quán)檢索,即在檢索時(shí),給某個(gè)檢索詞一定的權(quán)值,以表示其重要程度。在現(xiàn)有的網(wǎng)絡(luò)信息檢索工具中,多采用加、減號(hào)來(lái)表現(xiàn)檢索詞在檢索提問(wèn)中的分量。用加號(hào)表示某檢索詞一定要包含在檢索結(jié)果中,如檢索式“十亞洲十金融風(fēng)暴”的含義是:找出關(guān)于在亞洲發(fā)生的金融風(fēng)暴的信息,即檢索結(jié)果中必須同時(shí)含有“亞洲”和“金融風(fēng)暴”這兩個(gè)詞;用減號(hào)表示某檢索詞一定不能包含在檢索結(jié)果中,如檢索式“十亞洲十金融風(fēng)暴一南美洲”的含義檢索結(jié)果除一定包含"亞洲"和"金融風(fēng)暴"這兩個(gè)詞之外,還要排除關(guān)于南美洲的信息,即檢索結(jié)果中一定不能有"南美洲"這個(gè)詞。自然語(yǔ)言檢索自然語(yǔ)言檢索指用戶在檢索時(shí)可輸入自然語(yǔ)言表達(dá)的檢索要求,例如“pleasefindformesomethingaboutautomobilesaleinNewYorkstate”,檢索工具會(huì)按照提問(wèn)檢索出關(guān)于在紐約州(NewYorkstate)汽車(chē)銷(xiāo)售(automobilesale)的信息。這種檢索的基本處理過(guò)程是:檢索工具在收到用戶提問(wèn)后,首先利用一個(gè)禁用詞表從提問(wèn)中剔除那些沒(méi)有實(shí)質(zhì)主題意義的詞匯,例如各種副詞、介詞、代詞、常用請(qǐng)求詞(please、help、would、may等)、檢索提問(wèn)詞(find、search、locate、check、information、materials等),然后將余下的詞匯:紐約州(NewYorkstate)、汽車(chē)銷(xiāo)售(automobilesale)作為關(guān)鍵詞進(jìn)行檢索。相關(guān)信息反饋檢索在檢索過(guò)程中人們會(huì)發(fā)現(xiàn)某個(gè)結(jié)果非常符合自己需要,因此希望能進(jìn)一步檢索到與該結(jié)果類(lèi)似的結(jié)果,這稱(chēng)之為相關(guān)信息反饋檢索。在網(wǎng)絡(luò)環(huán)境中,相關(guān)信息反饋檢索可由檢索工具自動(dòng)進(jìn)行,例如Excite的"Searchformoredocumentslikethisone"檢索以及Lycos的"MoreLikeThis"檢索。
相關(guān)信息反饋檢索的基本原理是檢索工具將用戶所選定的結(jié)果網(wǎng)頁(yè)中包含的關(guān)鍵詞找出,通過(guò)它們?cè)谶@個(gè)網(wǎng)頁(yè)中出現(xiàn)的頻率和位置等來(lái)計(jì)算各自的相關(guān)度,然后選出相關(guān)度較高的詞匯作為下一步檢索的檢索詞。但由于詞匯選擇只考慮了詞匯出現(xiàn)的頻率和位置,而沒(méi)有考慮用戶對(duì)各個(gè)詞匯重要性的主觀判斷,所以其結(jié)果并不一定非常合適。模糊檢索簡(jiǎn)單地說(shuō),模糊檢索就是允許檢索單元和檢索提問(wèn)之間存在一定的差異,這種差異即“模糊”在檢索中的含義。模糊檢索中所指的差異往往來(lái)自于用戶在輸入檢索提問(wèn)時(shí)的輸入錯(cuò)誤,如少鍵入一個(gè)字,打錯(cuò)一個(gè)字母等等。另一類(lèi)差異來(lái)自某些詞匯不同的拼寫(xiě)形式,例如,單復(fù)數(shù),"catalog"和"catalogue"。這時(shí)檢索工具應(yīng)該能夠檢索到用正確詞匯或其它變形形式標(biāo)引的結(jié)果,而不是簡(jiǎn)單地告訴"輸入錯(cuò)誤"或"沒(méi)有結(jié)果"。概念檢索所謂概念檢索,是指當(dāng)用戶輸入一個(gè)檢索詞后,檢索工具不僅能檢索出包含這個(gè)具體詞匯的結(jié)果,還能檢索出包含那些與該詞匯同屬一類(lèi)概念的詞匯的結(jié)果。例如,檢索“automobile”時(shí)能找出包含“automobile”、“car”、“truck”、“van”、“bus”等任一詞匯的結(jié)果。又如,在查找“公共交通”這一概念時(shí),有關(guān)“公共汽車(chē)”或“地鐵”的信息也能隨之檢得。在此意義上,概念檢索實(shí)現(xiàn)了受控檢索語(yǔ)言的一部分功用,即考慮到了同義詞、廣義詞和狹義詞的使用。至今為止,Excite在概念檢索方面取得了比較明顯的成就。搜尋引擎查詢的方式關(guān)鍵字搜尋(keywordsearch)概念式搜尋(conceptsearch)網(wǎng)頁(yè)分類(lèi)目錄相關(guān)查詢(RelatedSearches)相似網(wǎng)頁(yè)(FindSimilar)結(jié)果再查詢(SearchWithin)建議使用適用時(shí)機(jī)所要查詢的資料非常明確時(shí),建議先利用概念式搜尋找到相關(guān)的資料,再利用關(guān)鍵字索引做廣泛的搜尋如果所要查詢的資料不太容易界定歸類(lèi),建議直接利用關(guān)鍵字搜尋引擎,但是最好能儘量將相關(guān)的關(guān)鍵字一一輸入查詢,才能得到較完整適用的資料。
此外,在網(wǎng)絡(luò)信息檢索領(lǐng)域還陸續(xù)出現(xiàn)了一些與檢索相關(guān)的功能,它們包括以下幾個(gè)方面:檢索提問(wèn)的修改與限制用戶在得到檢索結(jié)果之后,可選擇把新一輪的檢索范圍限制在已獲得的檢索結(jié)果之內(nèi),以提高檢索效率。此外,用戶可以在鍵入檢索提問(wèn)之前或獲得檢索結(jié)果之后,從語(yǔ)種(如英文或中文)、日期(如前一周或上個(gè)月)、地理范圍(如中國(guó)或美國(guó)紐約州)、域名范圍(如.edu或.com)、網(wǎng)絡(luò)信息類(lèi)型(如萬(wàn)維網(wǎng)或用戶網(wǎng))、信息媒介類(lèi)型(如文本信息或圖像信息)等方面進(jìn)行限制,以檢得更確切的信息。按相關(guān)度排列結(jié)果各種檢索工具都在檢索中計(jì)算檢索結(jié)果的相關(guān)度,并按相關(guān)度順序從高到低排列結(jié)果,許多還在每條結(jié)果旁給出相關(guān)度值。大多數(shù)檢索工具是通過(guò)計(jì)算檢索詞在每個(gè)結(jié)果中的出現(xiàn)次數(shù)和出現(xiàn)位置來(lái)計(jì)算相關(guān)度的,因此如果一個(gè)網(wǎng)頁(yè)中包含的檢索詞越多、出現(xiàn)的位置越重要(例如出現(xiàn)在網(wǎng)頁(yè)標(biāo)題中、網(wǎng)頁(yè)元數(shù)據(jù)中、網(wǎng)頁(yè)內(nèi)容標(biāo)題中),則這個(gè)網(wǎng)頁(yè)的相關(guān)度就越高。有的檢索工具還采用了其它輔助方式,例如Google就考慮了網(wǎng)頁(yè)被鏈接程度,如果有大量網(wǎng)頁(yè)鏈接到某一網(wǎng)頁(yè)或有一些非常重要的網(wǎng)頁(yè)鏈接到該網(wǎng)頁(yè),Google在計(jì)算網(wǎng)頁(yè)相關(guān)度時(shí),會(huì)增加該網(wǎng)頁(yè)的重要性。支持檢索與瀏覽并行允許用戶在瀏覽過(guò)程中,隨時(shí)在當(dāng)前所處的類(lèi)別中進(jìn)行檢索。檢索和瀏覽在信息查詢過(guò)程中各有其功用。一般地說(shuō),檢索便于有的放矢,直接獲取檢索結(jié)果;瀏覽利于邊查邊看,發(fā)現(xiàn)未曾預(yù)料的結(jié)果。支持檢索結(jié)果的翻譯和多語(yǔ)種檢索翻譯的語(yǔ)種現(xiàn)只有西文,如英文、法文、德文、西班牙文等等。英文和其它幾種語(yǔ)言可以對(duì)譯,如英文譯法文,法文又譯成英文。檢索結(jié)果的翻譯自然極大地方便了網(wǎng)絡(luò)用戶,但翻譯質(zhì)量的提高還有待于機(jī)器翻譯研究的新成果。
總之,從檢索功能來(lái)看,網(wǎng)絡(luò)信息檢索工具的發(fā)展已取得長(zhǎng)足的進(jìn)步。盡管如此,至今仍沒(méi)有一個(gè)網(wǎng)絡(luò)信息檢索工具可以完全支持上述所有功能。換言之,網(wǎng)絡(luò)檢索工具作為一個(gè)整體,已經(jīng)具備了相當(dāng)齊全和復(fù)雜的檢索功能,然而具體到單個(gè)檢索工具,它們的功能還有待完善。此外,與聯(lián)機(jī)和光盤(pán)環(huán)境下的檢索工具(如DIALOG,SilverPlatter)相比,網(wǎng)絡(luò)信息檢索工具的檢索功能還有待改進(jìn),尤其是在提高查準(zhǔn)率方面。6.1.11目前搜索引擎存在的主要問(wèn)題搜索引擎的原理起源于傳統(tǒng)的信息全文檢索理論,即計(jì)算機(jī)程序通過(guò)掃描每一篇文章中的每一個(gè)詞,建立以詞為單位的排序文件,檢索程序根據(jù)檢索詞在每一篇文章中出現(xiàn)的頻率和每一個(gè)檢索詞在一篇文章中出現(xiàn)的概率,對(duì)包含這些檢索詞的文章進(jìn)行排序,最后輸出排序的結(jié)果。
1.網(wǎng)絡(luò)搜索引擎目前存在的主要問(wèn)題(1)檢出的信息相關(guān)度低(2)檢出的重復(fù)信息多(3)信息更新慢,時(shí)效性差(4)覆蓋面有限
2.解決途徑建立搜索引擎數(shù)據(jù)庫(kù)時(shí)對(duì)WEB信息的唯一性進(jìn)行處理。需要應(yīng)用人工、自然語(yǔ)言識(shí)別等技術(shù)對(duì)WEB信息進(jìn)行處理,根據(jù)WEB信息的標(biāo)題、作者、關(guān)鍵詞和全文分析的結(jié)果對(duì)WEB進(jìn)行信息唯一性標(biāo)識(shí)。當(dāng)WEB信息出現(xiàn)在WEB站點(diǎn)時(shí)給出一個(gè)唯一的標(biāo)識(shí),如對(duì)原創(chuàng)WEB信息給予其原創(chuàng)標(biāo)識(shí)、標(biāo)題標(biāo)識(shí)、作者標(biāo)識(shí)、所在站點(diǎn)和位置的標(biāo)識(shí)、信息類(lèi)別標(biāo)識(shí)、首次刊登時(shí)間標(biāo)識(shí),由所有這些標(biāo)識(shí)或這些標(biāo)識(shí)的部分形成一個(gè)WEB信息的唯一標(biāo)識(shí);而對(duì)轉(zhuǎn)載的WEB信息,應(yīng)給予轉(zhuǎn)載者標(biāo)識(shí)、轉(zhuǎn)載位置標(biāo)識(shí)及原作標(biāo)識(shí)。
6.2網(wǎng)絡(luò)信息檢索策略與技巧(P223)6.2.1網(wǎng)絡(luò)信息檢索策略(1)明確搜索目標(biāo),確定檢索項(xiàng)
分析檢索課題的主題,選擇適當(dāng)?shù)臋z索關(guān)鍵詞以陳述句或疑問(wèn)句形式寫(xiě)下要檢索的主題,并確定關(guān)鍵詞或詞組;把最重要的概念定為檢索關(guān)鍵詞,并注意檢索詞的同義詞、單復(fù)數(shù)、拼寫(xiě)變異、單詞結(jié)尾的不同等;確定包含檢索主題的較廣的類(lèi)別,使用分類(lèi)檢索;選定可能包含檢索主題的組織或機(jī)構(gòu);如果主題范圍狹小,不防用兩三個(gè)關(guān)鍵詞試一試;不使用過(guò)于通俗簡(jiǎn)單的語(yǔ)詞;要注意一詞多義問(wèn)題。如筆記本:手寫(xiě)的本子?計(jì)算機(jī)?對(duì)檢索項(xiàng)進(jìn)行邏輯組配,構(gòu)造檢索表達(dá)式使用與、或、非;使用括號(hào)或引號(hào)組合關(guān)鍵詞;使用星號(hào)通配符等。(2)選定適合的檢索工具
掌握網(wǎng)上檢索工具的類(lèi)型與特點(diǎn)多元搜索引擎:首選;不能進(jìn)行有效的復(fù)雜信息檢索。關(guān)鍵詞檢索:特定信息查找;所用的引擎數(shù)據(jù)庫(kù)容量很大時(shí)。分類(lèi)目錄檢索:分類(lèi)明確的信息查找;文獻(xiàn)量有限,時(shí)滯問(wèn)題。分類(lèi)目錄加關(guān)鍵詞聯(lián)合檢索:先找到信息所屬范圍,在該分類(lèi)目錄下用關(guān)鍵詞檢索。垂直引擎檢索:特定的信息,如MP3、地圖等,最好用專(zhuān)門(mén)的MP3、地圖等搜索引擎。直接進(jìn)入信息源查找:詞組搜索太精確或一個(gè)詞組無(wú)法準(zhǔn)確表達(dá)所需信息時(shí),可直接到信息源查找.
熟悉要使用的檢索工具
注意收集具體的檢索網(wǎng)址關(guān)注、收集一些網(wǎng)上有用的、學(xué)術(shù)性強(qiáng)的檢索網(wǎng)頁(yè)。(3)正確對(duì)待檢索結(jié)果
可只閱讀搜尋結(jié)果的前面幾條信息:最符合條件的放在最前面.
縮小搜索范圍:返回結(jié)果不在最前面幾頁(yè)時(shí),可改變關(guān)鍵詞、改變搜索范圍、使用邏輯符and、引號(hào)等縮小查詢范圍.找不到網(wǎng)頁(yè)的對(duì)策:是否有拼寫(xiě)錯(cuò)誤、搜索關(guān)鍵詞間有矛盾嗎、換一種搜索引擎。認(rèn)真回顧檢查搜索方法并進(jìn)行糾正:改變檢索策略,查找相近頁(yè),發(fā)郵件給主頁(yè)管理者等。(4)提高上網(wǎng)速度,選擇最佳上網(wǎng)時(shí)間:節(jié)省上網(wǎng)時(shí)間和費(fèi)用,建立書(shū)簽體系、使用緩存、設(shè)置瀏覽器起始位置,選擇距離最近的網(wǎng)站,避免裝載圖像等。檢索學(xué)術(shù)性強(qiáng)的信息可選擇深夜,檢索娛樂(lè)或消費(fèi)的信息可選在白天。6.2.2網(wǎng)絡(luò)信息檢索技巧(P227)
擴(kuò)大檢索范圍降低檢索詞的專(zhuān)指度;調(diào)節(jié)檢索式的網(wǎng)羅度,如刪除某個(gè)不甚重要的概念組面;使用同義詞、近義詞查詢;使用all-in-one整合型檢索。
縮小檢索范圍提高檢索詞的專(zhuān)指度,用邏輯與連接,利用文獻(xiàn)的外表特征(類(lèi)型、語(yǔ)種、年代、學(xué)科等)進(jìn)行限定;利用前一次檢索的結(jié)果作為后一次檢索的基礎(chǔ)等。All-in-one:資源整合后的檢索平臺(tái),一次獲得所有相關(guān)資源。Ctrl+F連接到相關(guān)網(wǎng)頁(yè)后未發(fā)現(xiàn)相關(guān)文件,可能放在當(dāng)前網(wǎng)頁(yè)的底部,用Ctrl+F鍵在當(dāng)前網(wǎng)頁(yè)中查找特定文件。
給檢索結(jié)果做標(biāo)簽如果以后還可能用到的重復(fù)檢索,制成標(biāo)簽。
右切斷URL很長(zhǎng)的網(wǎng)址連接不上時(shí),或是返回很多的文檔網(wǎng)址時(shí),可右截?cái)郩RL直到連接成功。
猜測(cè)站點(diǎn)的URL根據(jù)URL的知識(shí)和對(duì)某些站點(diǎn)的了解構(gòu)造URL,如,或是某些網(wǎng)頁(yè)將1.html改為2.html等。6.3Google簡(jiǎn)介Google速度極快,據(jù)說(shuō)有10000多臺(tái)服務(wù)器;Google的搜索結(jié)果摘錄查詢網(wǎng)頁(yè)的含有關(guān)鍵字的內(nèi)容,搜索結(jié)果摘錄查詢網(wǎng)頁(yè)的部分具體內(nèi)容,而不僅僅是網(wǎng)站簡(jiǎn)介;Google智能化的“手氣不錯(cuò)”功能,提供可能最符合要求的網(wǎng)站;Google的“網(wǎng)頁(yè)快照”功能,能從GOOGLE服務(wù)器里直接取出緩存的網(wǎng)頁(yè)?;舅阉餍畔?duì)象選擇檢索提問(wèn)
輸入框檢索按鈕語(yǔ)種選擇基本搜索技巧在沒(méi)有任何限定情況下,Google自動(dòng)分解輸入的檢索詞;例如檢索:中南民族大學(xué),被自動(dòng)分解為:中南、民族、大學(xué)三個(gè)詞三個(gè)詞的任意組合的短語(yǔ)(術(shù)語(yǔ))都被認(rèn)為是檢索詞,并進(jìn)行檢索。Google默認(rèn)術(shù)語(yǔ)組合關(guān)系是“并且”、“與”;Google默認(rèn)搜索網(wǎng)頁(yè),需要搜索其它類(lèi)型資源,需要另外選擇活用Google搜索技巧
——「“”」的基本用法
檢索類(lèi):「“”」語(yǔ)意:查詢符合引號(hào)間的語(yǔ)句全體的網(wǎng)頁(yè)資料(強(qiáng)迫搜尋完整詞組)基本查詢語(yǔ)法:「“關(guān)鍵詞”」使用時(shí)機(jī):當(dāng)想要進(jìn)行確定短語(yǔ),而不進(jìn)行自動(dòng)關(guān)鍵詞拆分的檢索范例:「“蘋(píng)果好吃”」,以「蘋(píng)果好吃」四個(gè)字,作為完整的關(guān)鍵詞來(lái)查詢注意事項(xiàng):無(wú)活用Google搜索技巧
——「+」或「空格」的基本用法
檢索類(lèi):「+」或「空格」語(yǔ)意:和基本查詢語(yǔ)法:「關(guān)鍵詞1」+「空格」或「+」+「關(guān)鍵詞2」使用時(shí)機(jī):想要查詢兩個(gè)關(guān)鍵詞都包含的網(wǎng)頁(yè)范例:蘋(píng)果計(jì)算機(jī)或蘋(píng)果+計(jì)算機(jī),可以找到有關(guān)蘋(píng)果計(jì)算機(jī)相關(guān)資料的極大值注意事項(xiàng):使用「+」時(shí)不可以有空格活用Google搜索技巧
——「-」的基本用法
檢索類(lèi):「-」語(yǔ)意:“減去”基本查詢語(yǔ)法:「關(guān)鍵詞1」+「空格」或「-」+「關(guān)鍵詞2」使用時(shí)機(jī):從關(guān)鍵詞1檢索結(jié)果中取出含有關(guān)鍵詞2的部分資料范例:蘋(píng)果-計(jì)算機(jī),不會(huì)出現(xiàn)蘋(píng)果計(jì)算機(jī)等不相關(guān)的網(wǎng)頁(yè)資料注意事項(xiàng):在「-」號(hào)之間要先空一格活用Google搜索技巧
——「OR」的基本用法
檢索類(lèi):「OR」語(yǔ)意:或者基本查詢語(yǔ)法:「關(guān)鍵詞1」+「空格」+「OR」+「空格」+「關(guān)鍵詞2」使用時(shí)機(jī):查詢與關(guān)鍵詞1與關(guān)鍵詞2的相關(guān)數(shù)據(jù)范例:四級(jí)ORCET4,會(huì)按照「四級(jí)」→「CET4」→「四級(jí)CET4」這樣的檢索詞順序顯示檢索結(jié)果注意事項(xiàng):OR一定要大寫(xiě)活用Google搜索技巧
——「site」的基本用法
檢索類(lèi):site基本查詢語(yǔ)法:「關(guān)鍵詞」+「site」+「:」「網(wǎng)站名稱(chēng)」or「國(guó)別」使用時(shí)機(jī):1.查詢單一網(wǎng)站中的資料2.限定查詢資料的網(wǎng)頁(yè)國(guó)籍范例:CET4site:,在教育網(wǎng)中查找有關(guān)CET4的網(wǎng)頁(yè)資源注意事項(xiàng):在查詢的網(wǎng)站前面不可加上「http」以及「www」的網(wǎng)址部份連結(jié)的網(wǎng)頁(yè)活用Google搜索技巧
——「inurl」的基本用法檢索類(lèi):inurl基本查詢語(yǔ)法:「inurl」+「:」+「關(guān)鍵詞1」+「空格」+「關(guān)鍵詞2」使用時(shí)機(jī):想要更精確定位在網(wǎng)頁(yè)中的資料,針對(duì)特定連結(jié)做搜尋范例:inurl:mp3白樺林,檢索出所有資源URL中含有mp3、網(wǎng)頁(yè)中還有白樺林的網(wǎng)頁(yè)資源注意事項(xiàng):其實(shí)質(zhì)是URL字段對(duì)關(guān)鍵詞的包含關(guān)系,「inurl」后面續(xù)接的關(guān)鍵詞不可以有空格活用Google搜索技巧
——「intitle」的基本用法
檢索類(lèi):intiltle基本查詢語(yǔ)法:「intitle」+「:」+「關(guān)鍵詞1」+「空格」+「關(guān)鍵詞2」使用時(shí)機(jī):查詢特定標(biāo)題網(wǎng)頁(yè)中的資料范例:intitle:免費(fèi)軟件下載,檢索出所有資源網(wǎng)頁(yè)Title中含有免費(fèi)軟件下載的網(wǎng)頁(yè)資源注意事項(xiàng):「intitle」檢索語(yǔ)與關(guān)鍵詞間不可以有空格活用Google搜索技巧
——「filetype」的基本用法
檢索類(lèi):filetype基本查詢語(yǔ)法:「filetype」+「:」+「檔案類(lèi)型」+「空格」+「關(guān)鍵詞1」使用時(shí)機(jī):查詢特定類(lèi)別的文獻(xiàn)資料范例:filetype:DOC
保先教育,檢索出所有資源內(nèi)容包含保先教育的Word文檔資源注意事項(xiàng):適用此檢索方式之前,確定其網(wǎng)的文獻(xiàn)資源的擴(kuò)展名檢索結(jié)果顯示A檢索框
BGoogle搜索按鈕
C“手氣不錯(cuò)”按鈕“手氣不錯(cuò)?”按鈕自動(dòng)將您帶到Google推薦的網(wǎng)頁(yè)。
D結(jié)果數(shù)量設(shè)定菜單
E網(wǎng)頁(yè)標(biāo)題
G標(biāo)題下文本
H統(tǒng)計(jì)行
I縮進(jìn)顯示的查詢結(jié)果:首先顯示最合適的結(jié)果,其他的就以縮進(jìn)的形式排在下方.
J網(wǎng)址
K網(wǎng)頁(yè)快照
L文本大小
M相似網(wǎng)頁(yè):網(wǎng)頁(yè)性質(zhì)類(lèi)似的網(wǎng)頁(yè)
高級(jí)搜索
按照提示在相應(yīng)的檢索輸入框中,輸入檢索提問(wèn)。檢索提問(wèn)之間是邏輯“與”的關(guān)系。Google檢索技巧利用一些特色服務(wù),查詢特殊的信息結(jié)果,例如:貨幣轉(zhuǎn)換計(jì)算器股票查詢英漢互譯天氣查詢郵編區(qū)號(hào)手機(jī)號(hào)碼定義參見(jiàn)相應(yīng)的幫助文檔Google檢索實(shí)例檢索電影《神話》的下載地址分析:網(wǎng)頁(yè)多是介紹《神話》劇情的如果要提供下載,必定給出完整的URL電影資源的提供一般有http、rstp、mms、ftp幾種模式文件的擴(kuò)展名可能是rmvb、rm、asf、avi檢索方案:神話下載httpORrstpORmmsORftprmvbORrmORasfORaviGoogle的高級(jí)檢索例:高級(jí)檢索查找我國(guó)百白破疫苗接種率 包含全部字詞:我國(guó)百白破疫苗 包含以下完整字句:接種率為 搜索網(wǎng)頁(yè)語(yǔ)言:中文簡(jiǎn)體 網(wǎng)頁(yè)更新日期:過(guò)去一年
網(wǎng)域:僅.(僅在衛(wèi)生部網(wǎng)站中搜索)高級(jí)檢索實(shí)例Google的高級(jí)檢索Google網(wǎng)頁(yè)高級(jí)搜索界面Google網(wǎng)頁(yè)高級(jí)檢索結(jié)果例:查找與美國(guó)國(guó)立衛(wèi)生研究院類(lèi)似的網(wǎng)站(http://)。在SearchbyURL區(qū)域,F(xiàn)indwebpagessimilarto后輸入。點(diǎn)擊右側(cè)searchbyURL按鈕。例:查找網(wǎng)頁(yè)中含有美國(guó)國(guó)立衛(wèi)生研究院鏈接的網(wǎng)頁(yè)。在SearchbyURL區(qū)域,F(xiàn)indwebpagesthatlinkto后輸入。點(diǎn)擊右側(cè)searchbyURL按鈕。Google高級(jí)檢索實(shí)例Google網(wǎng)頁(yè)高級(jí)檢索結(jié)果翻譯網(wǎng)頁(yè)網(wǎng)頁(yè)字節(jié)數(shù)Google學(xué)術(shù)搜索含期刊論文、學(xué)位論文、圖書(shū)、預(yù)印本、文摘、技術(shù)報(bào)告等學(xué)術(shù)文獻(xiàn),文獻(xiàn)源自學(xué)術(shù)出版物、專(zhuān)業(yè)學(xué)會(huì)、預(yù)印本庫(kù)、大學(xué)及網(wǎng)上學(xué)術(shù)論文。http://按相關(guān)度排序,考慮全文、作者、出版物及被引情況。采取自動(dòng)分析與抽取引文的方法了解有關(guān)某一領(lǐng)域的學(xué)術(shù)文獻(xiàn);某一作者的著述,并提供書(shū)目信息Google學(xué)術(shù)搜索例:檢索有關(guān)電子商務(wù)市場(chǎng)規(guī)模的文獻(xiàn)包含全部字詞:
marketvalue包含任何一個(gè)字:
e-businesse-commerceGoogle學(xué)術(shù)搜索檢索結(jié)果翻譯功能某些搜索引擎提供了翻譯功能,如AltaVista和Google等,提供了多種語(yǔ)言(包括簡(jiǎn)繁中文)相互之間的翻譯服務(wù),并可按指定URL實(shí)時(shí)翻譯整個(gè)網(wǎng)頁(yè)。http://錯(cuò)別字改正Google、Baidu等網(wǎng)站的錯(cuò)別字改正軟件系統(tǒng)會(huì)對(duì)輸入的關(guān)鍵詞進(jìn)行自動(dòng)掃描,檢查有沒(méi)有錯(cuò)別字。如果發(fā)現(xiàn)用其他字詞搜索可能會(huì)有更好的結(jié)果,它能提供相應(yīng)提示來(lái)幫助糾正可能有的錯(cuò)別字。例如,搜索“互連網(wǎng)”,Google會(huì)自動(dòng)提示“您是不是要找:互聯(lián)網(wǎng)”。如果您點(diǎn)擊“互聯(lián)網(wǎng)”,Google將以“互聯(lián)網(wǎng)”作為關(guān)鍵詞進(jìn)行搜索。拼音識(shí)別在使用Google、Baidu等網(wǎng)站的全文搜索功能時(shí),如果我們不清楚關(guān)鍵詞的寫(xiě)法,但只要知道關(guān)鍵詞的拼音,搜索引擎會(huì)根據(jù)輸入的拼音查找對(duì)應(yīng)的最常用關(guān)鍵詞。例如,在上個(gè)例子中,我們只需要輸入“Hulianwang”,Google也會(huì)提示“您是不是要找:互聯(lián)網(wǎng)”。點(diǎn)擊這個(gè)鏈接即可以以“互聯(lián)網(wǎng)”為關(guān)鍵詞進(jìn)行查詢。計(jì)算器Google為用戶提供了一個(gè)內(nèi)置計(jì)算器。只需要在搜索字段中輸入算式,按一下回車(chē)鍵或者搜索就可以了。這個(gè)計(jì)算器可以用來(lái)做所有簡(jiǎn)單的計(jì)算,一些復(fù)雜的科學(xué)計(jì)算,單位換算,以及提供各種物理常數(shù)。
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 出生日期及長(zhǎng)期就業(yè)情況證明(6篇)
- 金融行業(yè)CRM數(shù)字化升級(jí)案例解析:2025年客戶關(guān)系管理智能化轉(zhuǎn)型報(bào)告001
- 學(xué)習(xí)中的點(diǎn)滴成長(zhǎng)話題的議論文12篇
- 工業(yè)互聯(lián)網(wǎng)平臺(tái)網(wǎng)絡(luò)切片技術(shù)安全防護(hù)2025年研究與應(yīng)用報(bào)告
- 工業(yè)互聯(lián)網(wǎng)平臺(tái)2025年網(wǎng)絡(luò)安全態(tài)勢(shì)感知技術(shù)標(biāo)準(zhǔn)規(guī)范研究報(bào)告
- 新能源汽車(chē)驅(qū)動(dòng)電機(jī)驅(qū)動(dòng)器控制系統(tǒng)優(yōu)化報(bào)告
- 山東省青島市2025年高三年級(jí)第二次適應(yīng)性檢測(cè)化學(xué)試題(解析版)
- 短視頻平臺(tái)內(nèi)容監(jiān)管政策實(shí)施與社會(huì)責(zé)任教育創(chuàng)新研究報(bào)告
- 2025年海上風(fēng)能資源評(píng)估模型構(gòu)建與深遠(yuǎn)海風(fēng)電項(xiàng)目規(guī)劃報(bào)告
- 2025-2030中國(guó)高壓發(fā)泡機(jī)行業(yè)競(jìng)爭(zhēng)態(tài)勢(shì)與投資前景預(yù)測(cè)報(bào)告
- 高中英語(yǔ)讀后續(xù)寫(xiě)教學(xué)策略的探究
- LaTeX科技排版課件
- 2023年河北交通投資集團(tuán)有限公司招聘筆試題庫(kù)及答案解析
- 反向傳播算法課件
- 企業(yè)質(zhì)量安全主體責(zé)任
- 南模自招試卷-2012年自主招生
- 數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)規(guī)范
- 固定資產(chǎn)報(bào)廢申請(qǐng)單
- 小學(xué)美術(shù)人美五年級(jí)上冊(cè)偶戲皮影研究課教案
- 工程結(jié)算審核定案表(模板)
- 開(kāi)工前安全安全生產(chǎn)條件審查表
評(píng)論
0/150
提交評(píng)論