第五章網(wǎng)絡(luò)信息檢索_第1頁(yè)
第五章網(wǎng)絡(luò)信息檢索_第2頁(yè)
第五章網(wǎng)絡(luò)信息檢索_第3頁(yè)
第五章網(wǎng)絡(luò)信息檢索_第4頁(yè)
第五章網(wǎng)絡(luò)信息檢索_第5頁(yè)
已閱讀5頁(yè),還剩80頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第六章網(wǎng)絡(luò)信息及其檢索第一節(jié)因特網(wǎng)基礎(chǔ)知識(shí)第二節(jié)網(wǎng)絡(luò)信息資源簡(jiǎn)介第三節(jié)網(wǎng)絡(luò)信息獲取的一般方法第四節(jié)網(wǎng)絡(luò)信息檢索工具——搜索引擎第一節(jié)互聯(lián)網(wǎng)基礎(chǔ)知識(shí)2、互聯(lián)網(wǎng)發(fā)展的進(jìn)程1960年,美國(guó)國(guó)防部為支持國(guó)防研究項(xiàng)目而建立了一個(gè)試驗(yàn)網(wǎng)(ARPA),把幾所大學(xué)和研究機(jī)構(gòu)的計(jì)算機(jī)聯(lián)接到一起。1973年ARPA網(wǎng)擴(kuò)展成互聯(lián)網(wǎng),第一批接入的有英國(guó)和挪威計(jì)算機(jī)。1986年,美國(guó)國(guó)家科學(xué)基金會(huì)(NationalScienceFoundation,NSF)建立了大學(xué)之間互聯(lián)的骨干網(wǎng)絡(luò)NSFnet,這是因特網(wǎng)歷史上重要的一步。1994年,NSFNET轉(zhuǎn)為商業(yè)運(yùn)營(yíng)。九十年代開(kāi)始,整個(gè)網(wǎng)絡(luò)向公眾開(kāi)放。1994年我國(guó)正式接入因特網(wǎng)。

(一)互聯(lián)網(wǎng)的發(fā)展與組成1、互聯(lián)網(wǎng)(internet)的定義與功能定義:計(jì)算機(jī)網(wǎng)絡(luò)是將地理位置不同、功能獨(dú)立的多個(gè)計(jì)算機(jī)利用通信設(shè)備和線路互連起來(lái),以功能完善的網(wǎng)絡(luò)軟件實(shí)現(xiàn)網(wǎng)絡(luò)中資源共享和信息傳遞的系統(tǒng)。

功能:計(jì)算機(jī)用戶可以和其他連到網(wǎng)絡(luò)上的用戶一起共享網(wǎng)絡(luò)資源,如硬盤上的文件和打印機(jī)等設(shè)備,也可以和他們互相交換數(shù)據(jù)信息。

3、互聯(lián)網(wǎng)的組成

互聯(lián)網(wǎng)是通過(guò)一種分層結(jié)構(gòu)來(lái)實(shí)現(xiàn)的,從上到下分為四層:一、物理網(wǎng)二、協(xié)議三、應(yīng)用軟件四、信息4、網(wǎng)絡(luò)協(xié)議定義:計(jì)算機(jī)通信網(wǎng)絡(luò)中兩臺(tái)計(jì)算機(jī)之間進(jìn)行通信所必須共同遵守的規(guī)定或規(guī)則。主要的協(xié)議有:TCP/IP協(xié)議:保證各種不同類型的計(jì)算機(jī)網(wǎng)絡(luò)實(shí)現(xiàn)相互通信一套規(guī)則或協(xié)議。IP協(xié)議:是定義Internet上計(jì)算機(jī)之間的路由選擇,把不同網(wǎng)絡(luò)的物理地址轉(zhuǎn)換為Internet地址。常用的應(yīng)用協(xié)議:超文本傳輸協(xié)議Http和文件傳輸協(xié)議FTP(二)網(wǎng)絡(luò)地址和域名網(wǎng)絡(luò)地址Uniform

Resource

Locator(URL)是信息在網(wǎng)上的地址,用來(lái)定位和檢索WWW上的文檔。由四部分組成:

服務(wù)器標(biāo)識(shí)符(通信協(xié)議:http、ftp、news)、web服務(wù)器域名、文件路徑、文件名例如:/library/content.htm域名

為了使用和記憶方便,因特網(wǎng)采用了域名管理系統(tǒng),簡(jiǎn)稱DNS(DomainNameSystem),它是由代表一定意義的英文單詞的縮寫構(gòu)成

域名由若干部分組成,各部分之間用小數(shù)點(diǎn)分開(kāi),例如我校主機(jī)的域名是:“”。

域名與網(wǎng)絡(luò)信息資源的關(guān)系

由于Internet最初是在美國(guó)發(fā)源的,因此最早的域名并無(wú)國(guó)家標(biāo)識(shí),人們按用途把它們分為幾個(gè)大類,它們分別以不同的后綴結(jié)尾。隨著Internet向全世界的發(fā)展,除了edu、gov、mil、一般只在美國(guó)專用外,另外三個(gè)大類com、org、net則成為全世界通用,因此這三大類域名通常稱為國(guó)際域名。由于國(guó)際域名資源有限,各個(gè)國(guó)家、地區(qū)在域名最后加上了國(guó)家標(biāo)識(shí)段,由此形成了各個(gè)國(guó)家、地區(qū)自己的國(guó)內(nèi)域名,如:

.

中國(guó)的商業(yè).org.hk

香港的組織.net.jp

日本的網(wǎng)絡(luò)

com商業(yè)機(jī)構(gòu)org非營(yíng)利組織

edu教育機(jī)構(gòu)gov政府部門

net網(wǎng)管組織int國(guó)際組織

mil軍事部門info信息機(jī)構(gòu)地址的標(biāo)識(shí)技術(shù)——IP地址每一臺(tái)計(jì)算機(jī)都事先分配一個(gè)類似于電話號(hào)碼一樣的標(biāo)識(shí)地址,稱作網(wǎng)絡(luò)協(xié)議地址形式:四組小于256的十進(jìn)制表示。如:3

湖南工程學(xué)院圖書館技術(shù)部保存維普數(shù)據(jù)庫(kù)的一臺(tái)服務(wù)器的IP地址。分為動(dòng)態(tài)IP地址和靜態(tài)IP地址兩種。動(dòng)態(tài)IP地址指的是每次連線所取得的地址不同,靜態(tài)IP地址是指每次連線均為同樣固定的地址。通常一經(jīng)設(shè)定,變動(dòng)較少。(三)互聯(lián)網(wǎng)提供的主要服務(wù)環(huán)球網(wǎng)(WWW/Web)電子郵件(E-Mail)遠(yuǎn)程登錄(Telnet)文件傳輸(FTP)電子公告板(BBS)即時(shí)通訊(IM)博客與維客(blog/Winki)環(huán)球網(wǎng)(WWW/Web)

即是萬(wàn)維網(wǎng)(WWW-WorldWideWeb):是基于超文件的、方便用戶在因特網(wǎng)上搜索和瀏覽信息的信息服務(wù)系統(tǒng)。它將位于全世界因特網(wǎng)上不同地點(diǎn)的相關(guān)數(shù)據(jù)信息有機(jī)地紡織在一起。媒體形式可以是文本、圖片、動(dòng)畫、聲音等,可以跳轉(zhuǎn),“網(wǎng)上沖浪”。

萬(wàn)維網(wǎng),英文全稱為worldwideweb簡(jiǎn)寫WWW或web,它是internet提供的一種信息服務(wù),它把位于世界各地的相關(guān)信息有機(jī)地組織在一起。電子郵件(E-Mail)電子郵件(electronicmail,簡(jiǎn)稱E-mail,標(biāo)志:@,)是Internet應(yīng)用最廣的服務(wù),通過(guò)網(wǎng)絡(luò)的電子郵件系統(tǒng),用戶可以非??焖俚姆绞?,與世界上任何一個(gè)角落的網(wǎng)絡(luò)用戶聯(lián)系,這些電子郵件可以是文字、圖像、聲音等各種方式。同時(shí),用戶可以得到大量免費(fèi)的新聞、專題郵件。遠(yuǎn)程登錄(Telnet)

遠(yuǎn)程登錄是Internet上較早提供的服務(wù)。用戶通過(guò)Telnet命令使自己的計(jì)算機(jī)暫時(shí)成為遠(yuǎn)地計(jì)算機(jī)的終端,直接調(diào)用遠(yuǎn)地計(jì)算機(jī)的資源和服務(wù)。利用遠(yuǎn)程登錄,用戶可以實(shí)時(shí)使用遠(yuǎn)地計(jì)算機(jī)上對(duì)外開(kāi)放的全部資源,可以查詢數(shù)據(jù)庫(kù)、檢索資料,或利用遠(yuǎn)程計(jì)算完成只有巨型機(jī)才能做的工作。此外,Internet的許多服務(wù)是通過(guò)Telnet訪問(wèn)來(lái)實(shí)現(xiàn)的。

文件傳輸(FTP)

FileTransferProtocol(文件傳輸協(xié)議)的英文簡(jiǎn)稱。用于Internet上的控制文件的雙向傳輸。FTP的主要作用,就是讓用戶連接上一個(gè)遠(yuǎn)程計(jì)算機(jī)(這些計(jì)算機(jī)上運(yùn)行著FTP服務(wù)器程序)察看遠(yuǎn)程計(jì)算機(jī)有哪些文件,然后把文件從遠(yuǎn)程計(jì)算機(jī)上拷到本地計(jì)算機(jī),或把本地計(jì)算機(jī)的文件送到遠(yuǎn)程計(jì)算機(jī)去。BBS(電子公告板)BBS的英文全稱是BulletinBoardSystem,翻譯為中文就是“電子公告板”。BBS最早是用來(lái)公布股市價(jià)格等類信息的,當(dāng)時(shí)BBS連文件傳輸?shù)墓δ芏紱](méi)有,而且只能在蘋果計(jì)算機(jī)上運(yùn)行。BBS在國(guó)內(nèi)一般稱作網(wǎng)絡(luò)論壇,通過(guò)BBS系統(tǒng)可隨時(shí)取得最新的信息,也可以通過(guò)BBS系統(tǒng)來(lái)和別人討論各種有趣的話題。也可以交流信息資源。

即時(shí)通訊(IM)即時(shí)通訊(InstantMessaging的縮寫),這是一種可以讓使用者在網(wǎng)絡(luò)上建立某種私人聊天室的實(shí)時(shí)通訊服務(wù)。目前在互聯(lián)網(wǎng)上受歡迎的即時(shí)通訊軟件包括:QQ、MSN、百度hi、ICQ、飛信、Skype、新浪UC、GoogleTalk、阿里旺旺、天翼Live、網(wǎng)易泡泡等。博客(Blog)博客(Blog):由web和log兩個(gè)單詞組成,按字面意思就為網(wǎng)絡(luò)日記。一個(gè)對(duì)信息發(fā)布人無(wú)技術(shù)門檻的網(wǎng)絡(luò)平臺(tái),是一種通常由個(gè)人管理、不定期張貼新的文章的網(wǎng)站。博客上的文章通常根據(jù)張貼時(shí)間,以倒序方式由新到舊排列。維客(Winki)維客(Winki):Winki指一種超文本系統(tǒng)。這種超文本系統(tǒng)支持面向社群的協(xié)作式寫作,在維客頁(yè)面上,每個(gè)人都可瀏覽、創(chuàng)建、更改文本,系統(tǒng)可以對(duì)不同版本內(nèi)容進(jìn)行有效控制管理,所有的修改記錄都保存下來(lái),不但可事后查驗(yàn),也能追蹤、回復(fù)至本來(lái)面目。這也就意味著每個(gè)人都可以方便地對(duì)共同的主題進(jìn)行寫作、修改、擴(kuò)展或者探討。網(wǎng)絡(luò)硬盤(在線存儲(chǔ))又叫網(wǎng)絡(luò)U盤,網(wǎng)盤等,是網(wǎng)絡(luò)上提供給用戶在線存儲(chǔ)服務(wù)。它向用戶提供文件的存儲(chǔ)、訪問(wèn)、備份、共享等文件管理功能。你可以把它看成一個(gè)放在網(wǎng)絡(luò)上的硬盤,不管你是在家中、單位或其它任何地方,只要你連接到因特網(wǎng),你就可以存取、管理、編輯網(wǎng)盤里的文件。網(wǎng)友也可以訪問(wèn)和下載,你所共享的文件、圖片、視頻等等。第二節(jié)網(wǎng)絡(luò)信息資源簡(jiǎn)介一、概念二、特點(diǎn)三、類型四、信息傳播方式一、網(wǎng)絡(luò)信息資源概念

網(wǎng)絡(luò)信息資源是指信息資源以電子數(shù)據(jù)的形式存放在非印刷型的介質(zhì)中,并通過(guò)網(wǎng)絡(luò)通信手段,在計(jì)算機(jī)等終端上再現(xiàn)的信息的總和。二、網(wǎng)絡(luò)信息資源的特點(diǎn)內(nèi)容廣泛:信息資源覆蓋面廣,涵蓋了各學(xué)科領(lǐng)域,不管是專業(yè)學(xué)術(shù)研究還是生活?yuàn)蕵?lè)都可以在網(wǎng)絡(luò)上尋找結(jié)果。內(nèi)容生動(dòng):網(wǎng)絡(luò)資源有多種多樣信息類型和眾多的表現(xiàn)形式,既有文字、符號(hào)、聲音、表格、還有圖形、動(dòng)畫和圖象。內(nèi)容新穎:內(nèi)容新穎、深入,信息更新周期短,高速度傳遞,能及時(shí)獲取。共享性強(qiáng),獲取信息便捷:打破了地域和時(shí)空的限制,不管身在何地都可以與他人進(jìn)行面對(duì)面的交流,并很方便、快捷地獲取到世界各地的信息。網(wǎng)絡(luò)信息資源的特點(diǎn)(二)質(zhì)量不一:網(wǎng)絡(luò)信息質(zhì)量良莠不齊,由于資源來(lái)源分散,內(nèi)容龐雜,不可避免有大量灰暗的、毫無(wú)價(jià)值的虛假冗余信息。穩(wěn)定性差:各種信息資源處在不斷更新、淘汰的狀態(tài),可以隨時(shí)發(fā)布,也可以及時(shí)變更修改。信息資源的更新、消亡無(wú)法預(yù)測(cè)和控制,缺乏穩(wěn)定性。信息傳遞無(wú)序:許多新的信息不能及時(shí)傳遞,大量信息被埋沒(méi)。精確度低:由于沒(méi)有統(tǒng)一的經(jīng)營(yíng)管理機(jī)構(gòu),統(tǒng)一的發(fā)布標(biāo)準(zhǔn),信息編排混亂,針對(duì)某一主題的查找其結(jié)果往往不夠精確、不夠全面,不能令用戶滿意。三、網(wǎng)絡(luò)信息資源的類型按信息資源的來(lái)源分:1、政府信息資源:各級(jí)政府在網(wǎng)上發(fā)布的關(guān)于國(guó)家和政府的信息,包括新聞、統(tǒng)計(jì)信息、政策法規(guī)、政府檔案、部門職能介紹等。2、公眾信息資源:為社會(huì)公眾服務(wù)的機(jī)構(gòu)所擁有的信息,包括公共圖書、電視廣播、新聞出版、科技信息等。3、商用信息資源:商業(yè)性公司或商情咨詢公司為生產(chǎn)經(jīng)營(yíng)者或消費(fèi)者提供的有償或無(wú)償?shù)男畔?,如:產(chǎn)品、商情、咨詢等信息。網(wǎng)絡(luò)信息資源的類型

按信息的表現(xiàn)形式和內(nèi)容劃分1、全文型信息:它指直接在網(wǎng)上發(fā)行的電子期刊、網(wǎng)上報(bào)紙、印刷型期刊的電子版、政府出版物、標(biāo)準(zhǔn)全文等。電子版期刊:各專業(yè)期刊的網(wǎng)站,電子期刊的數(shù)據(jù)庫(kù)網(wǎng)站:龍?jiān)雌诳W(wǎng)、博看網(wǎng)

2、事實(shí)型信息各種新聞信息、天氣預(yù)報(bào),城市或景點(diǎn)介紹,工程實(shí)況、機(jī)構(gòu)名錄、字詞典、指南等。3、數(shù)值型信息各種統(tǒng)計(jì)數(shù)據(jù)、產(chǎn)品或商品的規(guī)格與價(jià)格統(tǒng)計(jì)數(shù)據(jù):國(guó)家統(tǒng)計(jì)局統(tǒng)計(jì)數(shù)據(jù)庫(kù)、中經(jīng)網(wǎng)統(tǒng)計(jì)數(shù)據(jù)庫(kù)、中國(guó)統(tǒng)計(jì)年鑒數(shù)據(jù)庫(kù)產(chǎn)品數(shù)據(jù):行業(yè)信息網(wǎng)站(中國(guó)機(jī)電網(wǎng))、價(jià)格數(shù)據(jù):4、數(shù)據(jù)庫(kù)類信息:數(shù)據(jù)庫(kù)公司的網(wǎng)上站點(diǎn)。如:萬(wàn)方數(shù)據(jù)、中國(guó)知網(wǎng)等行業(yè)聯(lián)合建立的網(wǎng)上信息查詢數(shù)據(jù)庫(kù)如:湖南省高等學(xué)校圖書館數(shù)字資源共享平臺(tái)

商業(yè)信息公司的數(shù)據(jù)庫(kù):如:中國(guó)資訊行()中文商業(yè)數(shù)據(jù)庫(kù)平臺(tái),專門從事中國(guó)商業(yè)經(jīng)濟(jì)資訊的收集、整理和傳播。專業(yè)數(shù)據(jù)庫(kù):如:法律圖書館(中國(guó)法律法規(guī)數(shù)據(jù)庫(kù))、中國(guó)專利信息中心(中國(guó)專利數(shù)據(jù)庫(kù))5、其他信息微信息:如博客、播客,BBS,聊天,郵件討論組,網(wǎng)絡(luò)新聞組等。實(shí)時(shí)活動(dòng)性信息:投資行情和分析、天氣預(yù)報(bào)、節(jié)目預(yù)告等。其它類型:圖形圖象,音樂(lè)影視、廣告等。四、網(wǎng)絡(luò)信息資源的傳播方式利用web傳播圖、文、音并茂的信息利用電子郵件傳播信息利用遠(yuǎn)程登錄利用遠(yuǎn)程計(jì)算機(jī)的有關(guān)信息資源利用網(wǎng)絡(luò)論壇(bbs)傳播信息利用Ftp傳播信息利用網(wǎng)絡(luò)硬盤傳播共享信息第三節(jié)網(wǎng)絡(luò)信息獲取的一般方法1、網(wǎng)絡(luò)地址法(直接訪問(wèn)法)2、與網(wǎng)友交流3、利用在線文檔分享平臺(tái)4、利用虛擬圖書館5、通過(guò)相關(guān)數(shù)據(jù)庫(kù)的網(wǎng)站6、搜索引擎法(網(wǎng)絡(luò)信息檢索工具)1、網(wǎng)絡(luò)地址法(直接訪問(wèn)法)利用各種媒介信息,了解有關(guān)網(wǎng)站的內(nèi)容,掌握這些網(wǎng)站(包括新的網(wǎng)站)的地址。

自動(dòng)化專業(yè)常用網(wǎng)站(綜合網(wǎng)站)

中國(guó)自動(dòng)化網(wǎng) / 中南民大論壇-自動(dòng)化版http:///thread.php?fid=49智捷自動(dòng)化公司

http:/// 東莞自動(dòng)化網(wǎng) http:/// 中國(guó)自動(dòng)化 http:/// 中國(guó)自動(dòng)化聯(lián)盟/ 自動(dòng)化系統(tǒng)工程 http:/// 控制網(wǎng)http:///中國(guó)工控網(wǎng)http:///中華工控網(wǎng)http:///自動(dòng)化網(wǎng)http:///自動(dòng)化專業(yè)常用網(wǎng)站(單片機(jī)網(wǎng)站)

21IC中國(guó)電子網(wǎng)

/EC66中國(guó)電子技術(shù)信息網(wǎng)

/電子工程專輯

http:///電子人博客

http:///電子先鋒(電子網(wǎng)站導(dǎo)航)

/website/index.htm搜電子

http:///凌陽(yáng)單片機(jī)

http:///PIC單片機(jī)學(xué)習(xí)網(wǎng)

/嵌入式資訊網(wǎng)

http:///硬道理電子技術(shù)交流網(wǎng)

http:///中國(guó)單片機(jī)世界

http:///21ICSEARCH(芯片搜索)

/模擬電子技術(shù)實(shí)驗(yàn)室

48/labonline/index.asp電子工程世界

http:///中國(guó)電子工程師博客網(wǎng)

http:///blog/index.html2、與網(wǎng)友交流通過(guò)BBS與網(wǎng)友交流、征求信息。學(xué)術(shù)論壇:

小木蟲(chóng)學(xué)術(shù)論壇:/bbs/

專業(yè)論壇:

自動(dòng)化論壇:

/3、利用在線文檔分享平臺(tái)文檔分享平臺(tái)是供網(wǎng)友在線分享文檔的開(kāi)放平臺(tái),在這里,用戶可以在線閱讀和下載涉及課件、習(xí)題、考試題庫(kù)、論文報(bào)告、專業(yè)資料、各類公文模板、法律文件、文學(xué)小說(shuō)等多個(gè)領(lǐng)域的資料。平臺(tái)上所累積的文檔,均來(lái)自熱心用戶的積極上傳。

中文在線文檔分享平臺(tái):

1、百度文庫(kù):2、豆丁網(wǎng):3、道客巴巴:4、新浪愛(ài)問(wèn)共享資料:

4、利用虛擬圖書館

是針對(duì)某一個(gè)學(xué)科或領(lǐng)域的研究者的需要,將互聯(lián)網(wǎng)上與這個(gè)學(xué)科或領(lǐng)域有關(guān)的各種資源線索,包括與該學(xué)科或領(lǐng)域有關(guān)的研究機(jī)構(gòu)、實(shí)驗(yàn)室、電子書籍、學(xué)術(shù)期刊、會(huì)議論壇、專家學(xué)者等的URLs(即統(tǒng)一資源地址,包括Http、Gopher、Ftp、Usenet等)系統(tǒng)地組織起來(lái),存放在某一個(gè)網(wǎng)站內(nèi),供大家瀏覽或者檢索。虛擬圖書館也叫“學(xué)科導(dǎo)航”。CALIS重點(diǎn)學(xué)科導(dǎo)航重點(diǎn)學(xué)科導(dǎo)航庫(kù)是“211工程”立項(xiàng)高校圖書館共建項(xiàng)目。其目的是建立在INTERNET網(wǎng)上的導(dǎo)航庫(kù),收集整理有關(guān)重點(diǎn)學(xué)科的網(wǎng)絡(luò)資源,為高校重點(diǎn)學(xué)科服務(wù),讓在重點(diǎn)學(xué)科領(lǐng)域的師生,以較快的速度了解本領(lǐng)域科技前沿研究動(dòng)向和國(guó)際發(fā)展趨勢(shì)。資源類型:大學(xué)研究院所、學(xué)會(huì)協(xié)會(huì)、組織機(jī)構(gòu)、免費(fèi)資源等。68中國(guó)知網(wǎng)學(xué)術(shù)資源導(dǎo)航中國(guó)知網(wǎng)學(xué)術(shù)資源導(dǎo)航,搜集上千種學(xué)術(shù)相關(guān)網(wǎng)絡(luò)資源,范圍覆蓋自然科學(xué)、技術(shù)工程、人文科學(xué)、社會(huì)科學(xué),提供學(xué)科導(dǎo)航、科研機(jī)構(gòu)導(dǎo)航和行業(yè)導(dǎo)航。http:///中國(guó)科技圖書文獻(xiàn)中心國(guó)家科技圖書文獻(xiàn)中心(NSTL)是一個(gè)虛擬的科技文獻(xiàn)信息服務(wù)機(jī)構(gòu),主要服務(wù)為免費(fèi)檢索及瀏覽文摘,網(wǎng)上訂購(gòu)全文,Email24小時(shí)之內(nèi)原文傳遞。還訂購(gòu)了許多電子資源,向全國(guó)用戶免費(fèi)開(kāi)放網(wǎng)址:NSTL的組成圖書館NSTL中國(guó)標(biāo)準(zhǔn)化研究院標(biāo)準(zhǔn)館中國(guó)計(jì)量科學(xué)研究院5、通過(guò)相關(guān)數(shù)據(jù)庫(kù)網(wǎng)站中國(guó)知網(wǎng)萬(wàn)方數(shù)據(jù)系統(tǒng)法律數(shù)據(jù)庫(kù)標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)專利數(shù)據(jù)庫(kù)第四節(jié)

網(wǎng)絡(luò)信息檢索工具——搜索引擎搜索引擎是一種用于幫助網(wǎng)絡(luò)用戶查詢信息的搜索工具,是網(wǎng)絡(luò)上的信息檢索系統(tǒng),它以一定的策略在Internet中搜集、發(fā)現(xiàn)信息,對(duì)信息進(jìn)行理解、提取、組織和處理,并為用戶提供檢索服務(wù),從而起到信息導(dǎo)航的目的。用戶系統(tǒng)用戶接口搜索器索引器檢索器WWW信息資源FTP信息資源Telent信息資源Ghopher信息資源WAIS信息資源用戶服務(wù)組信息資源搜索引擎網(wǎng)絡(luò)網(wǎng)絡(luò)一、搜索引擎的構(gòu)成及工作原理搜索引擎:搜索器、索引器、檢索器、用戶接口搜索引擎的工作原理(一)

主要由四部分構(gòu)成:1、搜索器:在互聯(lián)網(wǎng)中漫游,發(fā)現(xiàn)和搜集信息。2、索引器:分析搜索器所搜索到的信息,從中抽取出索引項(xiàng)生成文檔庫(kù)的索引表。3、檢索器:根據(jù)用戶的查詢,在索引庫(kù)快速檢出文檔,進(jìn)行文檔與查詢相關(guān)度的評(píng)價(jià),對(duì)輸出的結(jié)果排序。4、用戶接口:輸入用戶查詢、顯示查詢結(jié)果、提供用戶相關(guān)性、反饋機(jī)制。搜索引擎的工作原理(二)基本程序:從互聯(lián)網(wǎng)上抓取網(wǎng)頁(yè)建立索引數(shù)據(jù)庫(kù)在索引數(shù)據(jù)庫(kù)中搜索排序?qū)⑺阉鹘Y(jié)果的鏈接地址和頁(yè)面內(nèi)容組織起來(lái)返回給用戶。搜索引擎的工作原理(三)搜索引擎并不是真正搜索互聯(lián)網(wǎng),它實(shí)際上搜索的是預(yù)先整理好的網(wǎng)頁(yè)索引數(shù)據(jù)庫(kù)。搜索引擎并不能真正理解網(wǎng)頁(yè)上的內(nèi)容,只能機(jī)械的匹配網(wǎng)頁(yè)上的文字。各搜索引擎的排序和算法不同,抓取的網(wǎng)頁(yè)也不盡相同,所以檢索的結(jié)果會(huì)不同。最大的搜索引擎收集到的網(wǎng)頁(yè),只占互聯(lián)網(wǎng)上普通網(wǎng)頁(yè)的30%左右,還有大量網(wǎng)頁(yè),沒(méi)有抓取到。因此,用搜索引擎是無(wú)法獲得網(wǎng)上所有的信息的。二、搜索引擎的種類(一)根據(jù)搜索內(nèi)容分:綜合性搜索引擎專業(yè)性搜索引擎:又稱垂直搜索引擎。是針對(duì)某一個(gè)行業(yè)的專業(yè)搜索引擎,對(duì)網(wǎng)頁(yè)庫(kù)中的某類專門的信息進(jìn)行整合,定向分字段抽取出需要的數(shù)據(jù)進(jìn)行處理后返回給用戶。垂直搜索引擎索引

生活搜索:常用搜索查詢

酷訊搜索

可口網(wǎng)-食譜搜索

房老大-房產(chǎn)搜索

去哪兒-旅游搜索

新浪汽車搜索

頂九購(gòu)物搜索

實(shí)景城市地圖搜索口碑網(wǎng)生活搜索行業(yè)搜索:亨者電子商務(wù)搜索

商業(yè)搜索

農(nóng)業(yè)搜索

人力資源搜索

化工搜索

建材搜索

快遞查詢學(xué)術(shù)搜索:數(shù)據(jù)搜索

小說(shuō)搜索

電子圖書搜索

漢典漢語(yǔ)搜索

代碼搜索中英文例句搜索

醫(yī)學(xué)信息搜索

全球高校網(wǎng)址查詢

專業(yè)英語(yǔ)翻譯搜索網(wǎng)絡(luò)資源搜索:奇虎論壇搜索

北大天網(wǎng)FTP搜索

FTP搜索

電影字幕搜索

BT影視搜索

字體搜索(英)

圖片搜索其他特殊搜索:中央政府網(wǎng)站搜索

品牌搜索

中文姓氏查詢

招聘信息搜索

駕校搜索

優(yōu)庫(kù)搜人引擎

愛(ài)馬者搜索(英)

公司信息搜索(英)搜索引擎的種類(二)根據(jù)搜索范圍分類:獨(dú)立搜索引擎集成搜索引擎:又稱元搜索引擎。連接多個(gè)獨(dú)立搜索引擎,對(duì)一個(gè)檢索詞在若干個(gè)搜索引擎中同時(shí)進(jìn)行查詢,然后顯示出結(jié)果。其特點(diǎn)是:自身不采集信息,沒(méi)有信息庫(kù)。中文集成搜索引擎

覓搜

/

搜樂(lè)搜索

/

搜魅網(wǎng)

/

百狗搜

/

搜網(wǎng)全能搜索

/

搜索引擎的種類(三)按搜索信息的語(yǔ)種分類:?jiǎn)握Z(yǔ)種搜索引擎:多語(yǔ)種搜索引擎:可以同時(shí)檢索多個(gè)語(yǔ)種的網(wǎng)頁(yè)信息。

AltaVista

三、搜索引擎的基本檢索方式1、自然語(yǔ)言檢索2、相關(guān)檢索3、精確檢索4、分類檢索5、限制檢索6、布爾邏輯檢索7、截詞檢索1、自然語(yǔ)言檢索直接輸入一個(gè)字、詞、句,提交搜索引擎查詢,這是最基本的查詢方式。2、相關(guān)檢索當(dāng)輸入一個(gè)檢索詞時(shí),搜索引擎會(huì)把與該檢索詞相關(guān)的詞一并反饋列出,供用戶選擇。如:百度輸入“智能電梯”列出相關(guān)檢索詞:智能電梯控制系統(tǒng)、電梯智能系統(tǒng)、智能電梯管理系統(tǒng)、電梯智能化、智能建筑電梯安裝3、精確檢索

在查詢的關(guān)鍵詞兩邊加上雙引號(hào)“”,表示檢索到的信息必須與檢索詞完全相同,使得到的結(jié)果更加準(zhǔn)確?!白詣?dòng)控制理論”——自動(dòng)控制理論在查詢的關(guān)鍵詞兩邊加上書名號(hào)《》,表示檢索的信息為專有的名詞。如:查歌曲“雙截棍”用《雙截棍》查4、分類檢索搜索引擎提供了不同信息類型的分類檢索。如:百度:MP3、視頻、圖片、貼吧、新聞

Google:地圖、購(gòu)物、音樂(lè)必應(yīng):地圖、詞典搜搜:博客、問(wèn)問(wèn)、搜吧5、字段限制檢索

限定檢索詞在檢索結(jié)果中出現(xiàn)的位置,用來(lái)控制檢索結(jié)果的相關(guān)性。關(guān)鍵字的范圍限定大體可分為:分類限定、地域限定、時(shí)間限定、文檔類型限定、域名限定等。如:URL限制(inurl:)查詢的關(guān)鍵字出現(xiàn)在找到后的網(wǎng)頁(yè)url即鏈接地址中網(wǎng)站域名限制(site:)表示只在指定的網(wǎng)站中查找該資源標(biāo)題限制(intitle:)搜索網(wǎng)頁(yè)標(biāo)題含有該關(guān)鍵詞的頁(yè)面文件類型限制(filetype:)查詢需要的特定類型的文件,文檔(doc、pdf、ppt),圖片(bmp、jpg),視頻等。

6、布爾邏輯檢索默認(rèn)的連接符是“與(and)”,輸入兩個(gè)檢索詞,中間用空格,搜索引擎就會(huì)同時(shí)搜索兩個(gè)檢索詞。邏輯“或”:大寫的“OR”邏輯非的表示:減號(hào)前要空格。如:查有關(guān)“申花”企業(yè)申花–足球7、截詞檢索用“*”表示不考慮截取的部分。如:“基于*控制”四、搜索引擎的檢索策略(一)

選擇合適的檢索詞學(xué)會(huì)用兩個(gè)關(guān)鍵詞檢索對(duì)常見(jiàn)的關(guān)鍵詞要用其他詞加以說(shuō)明對(duì)多義詞要注意用其他的詞語(yǔ)加以區(qū)分注意同義詞、相關(guān)詞的檢索

根據(jù)檢索結(jié)果,調(diào)整檢索詞四、搜索引擎的檢索策略(二)

學(xué)會(huì)選擇和利用搜索引擎選擇合適的搜索引擎和網(wǎng)站搜索引擎的信息滯后周期從一周到一月不等,所以找最新內(nèi)容可以考慮去新聞網(wǎng)站。要查找較全面的信息,可考慮使用集成搜索引擎。查找專門的信息可以選擇搜索引擎的專項(xiàng)搜索或使用垂直搜索引擎。使用限制檢索,縮小檢索范圍對(duì)時(shí)間、網(wǎng)站、文件類型等限制五、常用中文搜索引擎1、google(谷歌)2、百度(baidu)3、搜狗(sogou)4、中國(guó)搜索(zhongsou)5、SOSO搜搜百度

1999年底,身在美國(guó)硅谷的李彥宏看到了中國(guó)互聯(lián)網(wǎng)及中文搜索引擎服務(wù)的巨大發(fā)展?jié)摿Γе夹g(shù)改變世界的夢(mèng)想,他毅然辭掉硅谷的高薪工作,攜搜索引擎專利技術(shù),與徐勇一同回國(guó),于2000年1月1日在中關(guān)村創(chuàng)建了百度公司。Google

Google是由斯坦福大學(xué)學(xué)生LarryPage和SergeyBrin共同開(kāi)發(fā)的全新的在線搜索引擎。是在第一代搜索引擎的基礎(chǔ)上發(fā)展起來(lái)的第二代搜索引擎的代表。目前被公認(rèn)為全球最大的搜索引擎。谷歌學(xué)術(shù)搜索谷歌網(wǎng)頁(yè)目錄搜索/谷歌VS百度:/enews/special/b&g/

調(diào)查顯示,用戶對(duì)百度不滿意主要包括將廣告與自然搜索結(jié)果混排、不完全提供來(lái)自海外的中文搜索結(jié)果、不夠客觀公正、相關(guān)性不好。而對(duì)谷歌不滿意主要包括:搜索不穩(wěn)定、網(wǎng)頁(yè)快照不能用、不提供MP3搜索和貼吧等服務(wù)。谷歌VS百度谷歌的搜索語(yǔ)法在百度中一般都適用谷歌是按照網(wǎng)頁(yè)級(jí)別來(lái)收錄的,只有達(dá)到一定的網(wǎng)頁(yè)級(jí)別,才會(huì)被Google收錄。百度則中文網(wǎng)頁(yè)盡可能都收錄。搜索結(jié)果的輸出:百度將廣告混合,谷歌明確將廣告放一邊;此外,谷歌搜索結(jié)果的輸出相關(guān)度更強(qiáng)。谷歌中、外文;百度中文為主。谷歌VS百度基本的搜索語(yǔ)法:filetype:搜索指定文件類型title(intitle):搜索標(biāo)題內(nèi)容site:搜索指定的網(wǎng)站inurl:搜索指定的網(wǎng)址intext:在文本正文里搜索相關(guān)的檢索詞

谷歌和百度的網(wǎng)頁(yè)搜索谷百度歌:/雅虎全能搜索1994年4月,斯坦

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論