第五講-網(wǎng)絡信息資源檢索_第1頁
第五講-網(wǎng)絡信息資源檢索_第2頁
第五講-網(wǎng)絡信息資源檢索_第3頁
第五講-網(wǎng)絡信息資源檢索_第4頁
第五講-網(wǎng)絡信息資源檢索_第5頁
已閱讀5頁,還剩145頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第五講網(wǎng)絡信息資源檢索主要內容1.搜索引擎2.FTP信息資源3.BBS信息資源4.USENET/Newsgroup信息資源5.LISTSERV/Mailinglist信息資源6.其他網(wǎng)絡資源搜索引擎搜索引擎發(fā)展搜索引擎原理搜索引擎主要技術搜索引擎系統(tǒng)分類搜索引擎的應用搜索引擎發(fā)展1990年以前,沒有任何人能搜索互聯(lián)網(wǎng)所有搜索引擎的祖先:Archie最早現(xiàn)代意義上的搜索引擎出現(xiàn)于1994年7月(Lycos

Yahoo!)搜索引擎原理搜索引擎的原理,可以看做三步:從互聯(lián)網(wǎng)上抓取網(wǎng)頁→建立索引數(shù)據(jù)庫→在索引數(shù)據(jù)庫中搜索排序搜索引擎并不真正搜索互聯(lián)網(wǎng),它搜索的實際上是預先整理好的網(wǎng)頁索引數(shù)據(jù)庫搜索引擎,也不能真正理解網(wǎng)頁上的內容,它只能機械的匹配網(wǎng)頁上的文字搜索引擎只能搜到它網(wǎng)頁索引數(shù)據(jù)庫里儲存的網(wǎng)頁文字信息。如果搜索引擎的網(wǎng)頁索引數(shù)據(jù)庫里應該有而你沒有搜出來,那是你的能力問題,學習搜索技巧可以大幅度提高你的搜索能力搜索引擎技術?algorithms

?artificialintelligence

?compileroptimization

?computerarchitecture

?computergraphics

?datacompression

?datamining

?filesystemdesign

?geneticalgorithms

?informationretrieval

?machinelearning

?naturallanguageprocessing

?operatingsystems

?profiling

?robotics

?textprocessing

?userinterfacedesign

?webinformationretrieval

?andmore!搜索引擎系統(tǒng)分類按照信息搜集方法和服務提供方式的不同,搜索引擎系統(tǒng)可以分為三大類:1.全文搜索引擎(Google,百度,中搜)2.目錄索引(Yahoo,DMOZ,LookSmart)3.元搜索引擎(METASearchEngine)(Dogpile)http:///http:///搜索引擎的應用網(wǎng)頁搜索特色搜索學術搜索商業(yè)搜索網(wǎng)頁搜索(Google)Google檢索網(wǎng)頁數(shù)量達42.8億,搜索引擎中排名第一;網(wǎng)頁圖片8.8億張

.Google支持多達132種語言,包括簡體中文和繁體中文;Google網(wǎng)站只提供搜索引擎功能,沒有花里胡哨的累贅;Google速度極快,超過50000臺服務器;Google的專利網(wǎng)頁級別技術PageRank能夠提供準確率極高的搜索結果;Google智能化的“手氣不錯”功能,提供可能最符合要求的網(wǎng)站;Google的“網(wǎng)頁快照”功能,能從Google服務器里直接取出緩存的網(wǎng)頁。Google具有獨到的圖片搜索功能;Google具有強大的新聞組搜索功能;Google具有二進制文件搜索功能(PDF,DOC,SWF等);Google還有很多尚在開發(fā)階段的令人吃驚的設想和功能。初階搜索搜索引擎最基本的語法:Google分別用“”(空格)、“-”和“OR”表示“與”“非”和“或”雜項語法通配符問題關鍵字的字母大小寫搜索整個短語或者句子搜索引擎忽略的字符以及強制搜索進階搜索

面已經(jīng)探討了Google的一些最基礎搜索語法。通常而言,這些簡單的搜索語法已經(jīng)能解決絕大部分問題了。不過,如果想更迅速更貼切找到需要的信息,你還需要了解更多的東西對搜索的網(wǎng)站進行限制site:如九寨溝site:在某一類文件中查找信息filetype:目前已經(jīng)可以支持13種文件類型,如doc,ppt,xls,swf,ps,jpg,gif,pdf如4Gfiletype:doc搜索的關鍵字包含在URL鏈接中inurl:如virusinurl:secutiry搜索的關鍵字包含在網(wǎng)頁標題中intitle:如intitle:交通規(guī)劃filetype:pdfinurl:示例:查找新浪網(wǎng)上九寨溝的圖片

搜索:“九寨溝site:”示例:關于4G的word文檔搜索:4Gfiletype:doc示例:網(wǎng)址中含security的關于virus的網(wǎng)頁搜索:virusinurl:secutiry示例:教育網(wǎng)中標題含有“交通規(guī)劃”的格式為pdf的文章搜索:intitle:交通規(guī)劃filetype:pdfinurl:目錄檢索

如果不想搜索廣泛的網(wǎng)頁,而是想尋找某些專題網(wǎng)站,可以訪問Google的分類目錄“http://directory.G/”,分類的網(wǎng)站目錄一般由專人負責,分類明確,信息集中目前Google使用的分類目錄采用了ODP的內容另外,Google根據(jù)其專業(yè)的“網(wǎng)頁級別”(PageRank)技術對目錄中登錄的網(wǎng)站進行了排序,可以讓一般的檢索更具高效率學術搜索大學搜索Google的其他杰出功能

網(wǎng)頁快照

單詞英文解釋

網(wǎng)頁翻譯

單詞糾錯

繁簡轉換

搜索結果過濾

百度學術搜索引擎學術搜索引擎Scirus是迄今為止因特網(wǎng)上最全面的科技專用搜索引擎,曾被著名的《搜索引擎觀察》(SearchEngineWatch)評為“最佳專業(yè)搜索引擎”。

Scirus覆蓋了167million個以上與科技相關的網(wǎng)頁

BasicSearch基本語法+-“”ANDORANDNOTau:ti:jo:ke:url:af:dom:JournalSources:ScienceDirect

BioMedCentral

PubmedWebSources

特色搜索FTP搜索引擎NewsGroup搜索引擎圖象搜索引擎新聞搜索引擎其他特色搜索引擎FTP搜索引擎FTP搜索引擎的功能是搜集匿名FTP服務器提供的目錄列表以及向用戶提供文件信息的查詢服務。由于FTP搜索引擎專門針對各種文件,因而相對WWW搜索引擎,尋找軟件、圖像、電影和音樂等文件時,使用FTP搜索引擎更加便捷北大天網(wǎng)中英文FTP搜索引擎

http:///http:///

號稱全球最大的FTP搜索引擎NewsGroup搜索引擎新聞論壇搜索引擎是專門搜索Newsgroups等信息的引擎,可能用此工具查詢自己感興趣的新聞論壇和討論組

Google搜索引擎http://盛名的新聞組搜索引擎

http://

CyberFiberNewsgroups

-DirectoryofnewsgroupsontheInternet.圖象搜索引擎基于網(wǎng)頁的圖像搜索

圖像元搜索引擎

基于圖片庫的圖像搜索

優(yōu)秀的圖像搜索引擎

GoogleYahoo畫廊

Yahoo圖像搜索引擎http:///新聞搜索引擎http:///其他特色搜索引擎尋人多媒體查詢個人信息查詢地圖及相關信息尋人搜索引擎多媒體搜索引擎查詢地圖信息

其他信息查詢2.FTP信息資源FTP(FileTransferProtocol)是TCP/IP協(xié)議的一種,它是在Internet網(wǎng)上使用最廣泛的一種服務,

可被用來在兩臺位于Internet網(wǎng)上的計算機之間傳輸(上傳或下載)文件。登錄成功后,可以進行文件搜索和文件傳送的操作。使用FTP幾乎可以傳送任何類型的文件。獲取FTP信息資源的主要方法使用FTP搜索引擎搜索FTP站點利用專用FTP軟件中“站點管理器”FTP搜索引擎FTP搜索引擎的功能是搜集匿名FTP服務器提供的目錄列表以及向用戶提供文件信息的查詢服務。由于FTP搜索引擎專門針對各種文件,因而相對WWW搜索引擎,尋找軟件、圖像、電影和音樂等文件時,使用FTP搜索引擎更加便捷。國內著名FTP搜索引擎

(1)北大天網(wǎng)FTP搜索

http:///(2)清華星空搜索

http:///(3)復旦大學歪酷強力FTP搜索引擎

/(4)西交大思源搜索

http:///(5)南航歪歪搜索

http:///(6)中科大天狼搜索

http:///國外著名的FTP搜索引擎(1)http://

號稱全球最大的FTP搜索引擎(2)http:///(3)http://

(4)訪問FTP信息資源的主要方法(1)FTP內部命令

(2)利用Web瀏覽器訪問FTP(3)利用專用FTP軟件(Cute-Ftp,Bp-Ftp,WS-Ftp),不用記復雜的命令。使用ftp命令使用web瀏覽器方式使用客戶端軟件(以Cuteftp為例)3、電子公告牌BBSBulletinBroardSystems,一種電子信息服務系統(tǒng)。早期BBS由教育機構或研究機構管理,現(xiàn)在多數(shù)網(wǎng)站都建立了自己的BBS系統(tǒng)。服務方式:一是需注冊(免費或收費);二是公開,允許免費連接。獲取BBS網(wǎng)址的途徑通過WWW檢索工具(比如:Yahoo、Google、AllinOne、Hotbot、Webcrawler、Infoseek、Lycos、Altavista等)來獲取BBS登陸軟件中的“地址簿”訪問BBS的方法Telnet方式,即計算機遠程登錄用BBS登錄軟件,如Sterm,Cterm通過WWW瀏覽器(如:IE等)瀏覽telnet方式客戶端軟件方式(以Cterm為例)web瀏覽器方式4.USENET/NewsgroupUsenet一詞來自于UserNetwork,Usenet里的新聞組信息以中央存儲的形式存放于某個位置(通常是一些分類目錄),通過軟件的管理允許用戶選擇定閱他們感興趣的主題閱讀、索引、刪除過期消息等。Usenet的最初構想是借助網(wǎng)絡進行技術信息交換,但是后來也用于非技術領域,例如社會新聞、業(yè)余愛好、個人興趣等主題。Usenet的最主要的特色是統(tǒng)一分組、全球轉信。當前,USERNET上討論題大致歸納出幾個大的類別。每個新聞組都有一個名稱,根據(jù)新聞組的名稱,大概就可以知道其討論的主題了。

biz.*商業(yè)類Comp.*電腦類

Sci.*自然科學類Soc.*社會類

Talk.*閑談類Rec.*娛樂類

Misc.*雜項Alt.*雜亂無規(guī)定主題類News.*與Netnews本身相關的信息國內著名新聞組

1.新凡

http:///

2.濟南萬千

news:///

3.寧波:

4.希網(wǎng)新聞組

國外著名新聞組:

1.Google新聞組

2.微軟新聞組:

3.Newsone新聞組

4.Realplayer新聞組

獲得新聞組資源的方法通過Web直接瀏覽使用新聞組閱讀軟件

OutlookExpressAgent

Newspro等通過web方式使用OutlookExpress預訂、

閱讀和發(fā)送新聞組5.Mailinglist/LISTSERV郵件列表(Mailinglist)是指一組成員的E-Mail地址列表。郵件列表的主要功能是為有共同興趣的一組用戶建立一種關聯(lián),使用戶彼此擁有一個網(wǎng)上交流的空間。加入郵件列表的用戶可以收到發(fā)給郵件列表的所有郵件,同時,也可通過郵件列表向所有其他組員發(fā)送信息。每個郵件列表都有管理員,負責維護郵件列表,進行日常管理。管理員分為兩種:一種是人,一種是稱為Listserv的計算機程序。這種用Listserv程序進行自動管理的郵件組,有時也稱為Listserv列表。Listserv是目前功能最強的郵件列表管理軟件。用戶用電子郵件向系統(tǒng)發(fā)送命令,系統(tǒng)用電子郵件回送執(zhí)行結果的信息。郵件列表的使用范圍1.新產(chǎn)品發(fā)布、與客戶保持聯(lián)系、產(chǎn)品的技術支持、信息反饋;2.組織俱樂部,吸引新用戶的加入,提供成員之間的交流工具;3.與同學和親友保持快速、方便的聯(lián)系;4.您可以主辦自己的電子雜志,通過郵件列表的方式,向數(shù)十萬用戶同時發(fā)送;5.當然,您還可以訂閱其他人建立的郵件列表,取得你感興趣的信息,同時可以參與討論。

郵件列表類型公開任何人可以在列表里發(fā)表信件封閉只有郵件列表里的成員才能發(fā)表信件,如同學通訊、技術討論等管制只有郵件列表管理者批準的信件才能發(fā)表,如產(chǎn)品信息發(fā)布、電子雜志等國內Mailinglist郵件列表檢索工具

(1)希網(wǎng)網(wǎng)絡

/(2)通易

http:///(3)網(wǎng)路

http:///maillist.asp

國外Mailinglist郵件列表檢索工具(1)CataList

http://www.L/lists/listref.html

(2)PubliclyAccessibleMailingLists

http:///internet/paml/(3)Lisztthemailinglistdirectory

http://

在收信人地址欄填寫服務器地址在郵件正文填寫命令行1.萬維網(wǎng)(WWW)信息資源(1)WebDirectory(網(wǎng)絡目錄)(2)VirtualLibrary(虛擬圖書館)(3)搜索引擎(4)看不見的網(wǎng)站(5)網(wǎng)絡百科全書(6)Blog信息資源(7)電子預印本(1)webDirectory(網(wǎng)絡目錄)網(wǎng)絡目錄(WebDirectory)——因特網(wǎng)上的目錄型檢索工具,又稱分類站點目錄、專題目錄或主題指南、站點導航系統(tǒng)等。網(wǎng)絡目錄一般采用人工方式采集和存儲網(wǎng)絡信息。但是,部分網(wǎng)絡目錄并不全是人工方式采集和組織信息,而是利用自動功能或者由用戶遞交的方式來豐富和補充資源。以某種分類法進行組織整理,并和檢索法集成。網(wǎng)絡目錄一般是通過引導網(wǎng)絡用戶的查詢概念(而不是確切的詞條)來幫助用戶找到所需的網(wǎng)絡信息。最著名的網(wǎng)絡目錄

Yahoo!

/

新浪

http:///

搜狗

http:///Googlehttp:///dirhpYahoo!目錄(最高層目錄)http:///二級目錄三級類目四級類目SiteListing(2)VirtualLibrary(虛擬圖書館)國內,許多人稱其為“學科導航”。針對某一學科或領域研究的需要,將Internet上有關的各種資源線索,包括與該學科領域有關的研究機構、實驗室、電子書籍、學術期刊、會議論壇、專家學者等的URLs系統(tǒng)地組織起來,存放于某一網(wǎng)頁,供用戶瀏覽或檢索。提供導航服務的一種工具??色@得大部分學科的網(wǎng)絡資源導航鏈接,被認為是世界上質量最高的虛擬圖書館,由各個領域志愿者提供資源并完成組織

http:///語言類虛擬圖書館/“知識管理”虛擬圖書館http:///km清華大學虛擬圖書館http:///chinese/virtual/index.html(3)搜索引擎(SearchEngine)搜索引擎的原理可以看做三步:從互聯(lián)網(wǎng)上抓取網(wǎng)頁→建立索引數(shù)據(jù)庫→在索引數(shù)據(jù)庫中搜索排序。使用技巧:

(1)不同目的的查詢應當選用不同的搜索引擎。

(2)適當?shù)剡\用語法規(guī)則進行組合搜索。

(3)靈活運用短語。GoogleScholar用于搜索學術文獻,包括同行評議的論文、學位論文、圖書、預印本、技術報告等,涉及各學科領域。

http:///Scirus是目前網(wǎng)上最全面、綜合性最強的科技文獻搜索引擎之一。

http:///http:///http:///(4)看不見的網(wǎng)站(InvisibleWebsite)看不見的網(wǎng)站是指在萬維網(wǎng)上可獲得的資源,但由于技術限制,或是由于特定選擇而不能或未被納入通用搜索引擎網(wǎng)頁索引中的文本網(wǎng)頁、文件或其他高質量的權威性信息資源。我們有時也叫它“深度網(wǎng)站”或“黑洞”。(InvisibleWeb、DeepWeb、HiddenWeb、DarkMatter)看不見的網(wǎng)站的類型可檢索性數(shù)據(jù)庫拒絕收錄的網(wǎng)頁如何利用看不見的網(wǎng)站資源Directsearch

http:///gary/direct.htmInternet圖書館員索引(LII)

http://CompletePlanethttp

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論