




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、現(xiàn)代信息檢索系統(tǒng)現(xiàn)代信息檢索系統(tǒng)1、計算機(jī)信息檢索 脫機(jī)批處理檢索(1954-1965) 聯(lián)機(jī)檢索(1965-1991) 網(wǎng)絡(luò)化聯(lián)機(jī)檢索(1991-目前) 脫機(jī)批處理檢索(1954-1965) 1946年世界上第一臺電子計算機(jī)問世后,50年代初就有人開始研究其在信息檢索領(lǐng)域的應(yīng)用。50年代中期至60年代中后期是信息檢索的脫機(jī)批處理階段。當(dāng)時計算機(jī)還沒有連接通信網(wǎng),也沒有遠(yuǎn)程終端裝置,不能提供實時檢索(Question and Answer),只能進(jìn)行現(xiàn)刊文獻(xiàn)的定題檢索(Selective Dissemination of Information)和回溯性檢索(Retrospective Sea
2、rch),同時利用計算機(jī)編輯出版檢索性刊物。1954年,美國海軍機(jī)械實驗中心使用IBM701型機(jī),初步建成了計算機(jī)情報檢索系統(tǒng),這預(yù)示著以計算機(jī)檢索系統(tǒng)為代表的信息檢索自動化時期的到來。 聯(lián)機(jī)檢索(1965-1991) 1965年美國系統(tǒng)發(fā)展公司(SDC)研制成功ORBIT(on-line retrieval of Bibliographic Information-time Shared)聯(lián)機(jī)情報檢索軟件,開始了聯(lián)機(jī)情報檢索系統(tǒng)階段。與此同時,美國洛克希德公司研制成功了Dialog檢索系統(tǒng)。至今,該系統(tǒng)仍為世界上最著名的信息檢索系統(tǒng)。70年代衛(wèi)星通訊技術(shù)、微型計算機(jī)以及數(shù)據(jù)庫生產(chǎn)的同步發(fā)展,
3、使用戶得以沖破時間和空間的障礙,實現(xiàn)了國際聯(lián)機(jī)檢索。遠(yuǎn)程實時檢索多種數(shù)據(jù)庫是聯(lián)機(jī)檢索主要的優(yōu)點。計算機(jī)檢索技術(shù)從脫機(jī)階段進(jìn)入聯(lián)機(jī)信息檢索時期。聯(lián)機(jī)檢索是計算機(jī)技術(shù)、信息處理技術(shù)和現(xiàn)代通信技術(shù)三者的有機(jī)結(jié)合。 網(wǎng)絡(luò)化聯(lián)機(jī)檢索(1991-目前) Internet在六七十年代初見雛形,八十年代末開始迅速流行。此時,單純的手工檢索和機(jī)械檢索都顯露出各自或多或少的缺點,因此極有必要發(fā)展一種新型的信息檢索方式。在通信和網(wǎng)絡(luò)技術(shù)扶持下,出現(xiàn)了各種信息利用工具。如:WWW瀏覽器優(yōu)秀的萬維網(wǎng)有取代其他工具的趨勢;Windows平臺配備的性能優(yōu)良的電子郵件工具;思維機(jī)器公司推出了WAIS,允許用戶檢索整個因特網(wǎng)上
4、文本信息資源;明尼蘇達(dá)大學(xué)推出了Gopher,使用戶能十分容易地存取因特網(wǎng)上的信息資源;針對FTP資源的Archie;BBS等等。WAIS的進(jìn)一步發(fā)展,傳統(tǒng)的聯(lián)機(jī)檢索向因特網(wǎng)上遷移。網(wǎng)絡(luò)信息檢索系統(tǒng)包括了計算機(jī)在信息檢索領(lǐng)域表現(xiàn)出來的全部優(yōu)點。它是聯(lián)機(jī)檢索的高級階段,使人們可以在很短的時間里查找到全球的信息。值得指出的是,網(wǎng)絡(luò)信息環(huán)境的出現(xiàn),使得信息檢索研究的對象和范圍不斷擴(kuò)大,研究隊伍也突破了原有的以圖書情報領(lǐng)域的專家學(xué)者為主的框架,眾多的信息公司加入到研究開發(fā)信息檢索系統(tǒng)的行列。可以說,網(wǎng)絡(luò)使計算機(jī)信息檢索技術(shù)進(jìn)入一個嶄新發(fā)展階段,而網(wǎng)絡(luò)信息檢索又使得網(wǎng)上信息源利用率提高,信息組織更為有序
5、和高效??傊谝蛱鼐W(wǎng)的檢索系統(tǒng)成為網(wǎng)絡(luò)信息檢索系統(tǒng)的代表。 2、網(wǎng)絡(luò)數(shù)據(jù)庫檢索 網(wǎng)絡(luò)數(shù)據(jù)庫檢索系統(tǒng)是指用戶在自己的客戶端上,通過互聯(lián)網(wǎng)和瀏覽器界面對數(shù)據(jù)庫進(jìn)行檢索,這一類檢索系統(tǒng)都是基于互聯(lián)網(wǎng)的分布式特點開發(fā)和應(yīng)用的,即:數(shù)據(jù)庫分布式存儲,不同的數(shù)據(jù)庫分散在不同的數(shù)據(jù)庫生產(chǎn)者的服務(wù)器上;用戶分布式檢索,任何地方的終端都可以訪問并存儲數(shù)據(jù);數(shù)據(jù)分布式處理,任何數(shù)據(jù)都可以在網(wǎng)上的任何地點進(jìn)行處理。 網(wǎng)絡(luò)數(shù)據(jù)庫檢索系統(tǒng)的特點 網(wǎng)絡(luò)數(shù)據(jù)庫檢索系統(tǒng)的特點: 數(shù)據(jù)庫分布式存儲,且多存放在硬盤上,因此數(shù)量多,信息量大。同時由于超文本語言和超文本傳輸協(xié)議的作用,提供了大量相關(guān)資源的鏈接,使資源內(nèi)容更加豐富。
6、 數(shù)據(jù)庫內(nèi)容形式向多媒體化發(fā)展,不僅有文本,還有大量圖像、動畫、聲音等,給用戶提供了更為直觀的服務(wù)。 數(shù)據(jù)庫更新速度快,一般為日更新。 數(shù)據(jù)庫和系統(tǒng)分布式管理,響應(yīng)速度快。 檢索模式:客戶端/網(wǎng)關(guān)服務(wù)器/服務(wù)器方式為主,客戶方在微機(jī)上運作,分析從服務(wù)器上返回的數(shù)據(jù),給用戶顯示信息;服務(wù)方則給用戶提供客戶端應(yīng)用程序,通過網(wǎng)關(guān)分析處理各類請求,并提供數(shù)據(jù)服務(wù),提高了檢索效率。 應(yīng)用程序與數(shù)據(jù)隔離,數(shù)據(jù)相對獨立、完整、安全性好;但對客戶方來說,由于訪問是通過互聯(lián)網(wǎng)進(jìn)行的,安全性較差。 信息組織模式:非線性化,超文本形式,因此可以從某一資源點上快速、直接地指向相關(guān)資源鏈接點。 檢索機(jī)制:檢索功能強(qiáng),索
7、引多,多數(shù)通過WWW瀏覽器提供檢索,對非專業(yè)人員來說,易學(xué)易用。缺點是,不同的數(shù)據(jù)庫使用的檢索系統(tǒng)不同,檢索命令也不盡相同,仍需用戶不斷學(xué)習(xí)。 檢索環(huán)境寬松,檢索費用較聯(lián)機(jī)檢索低很多。但由于數(shù)據(jù)庫開發(fā)費用較高,價格較高,因此總體費用高于光盤檢索。網(wǎng)絡(luò)數(shù)據(jù)庫的發(fā)展興起于20世紀(jì)90年代中期,很快就得到了用戶的好評和廣泛使用,在網(wǎng)絡(luò)條件好的地區(qū)尤其如此。 3、搜索引擎檢索 百度搜索引擎GoogleGoogle搜索引擎搜索引擎 百度搜索引擎百度公司(B,Inc)于1999年底成立于美國硅谷,名字來自于“眾里尋她千百度”。百度是國內(nèi)最大的商業(yè)化全文搜索引擎,占國內(nèi)80%的市場份額。功能完備,搜索精度高
8、,除數(shù)據(jù)庫的規(guī)模及部分特殊搜索功能外,其他方面可與搜索引擎業(yè)界領(lǐng)軍人物Google相媲美,在中文搜索支持方面有些地方甚至超過了Google,是目前國內(nèi)技術(shù)水平最高的搜索引擎。為包括Lycos中國、T、21CN、廣州視窗等搜索引擎,以及中央電視臺、外經(jīng)貿(mào)部等機(jī)構(gòu)提供后臺數(shù)據(jù)搜索及技術(shù)支持。百度以4億的中文網(wǎng)頁,全球獨有的“超鏈分析”技術(shù),亞秒級的迅捷速度,龐大的服務(wù)器群,每分每秒接受來自全球各個國家的中文搜索請求,提供中文(簡/繁體)網(wǎng)頁搜索服務(wù)。百度一直以開發(fā)最符合中國人使用習(xí)慣的搜索引擎為己任,經(jīng)過三年努力,已成為世界上最強(qiáng)大的中文搜索引擎。百度搜索使用了高性能的“網(wǎng)絡(luò)蜘蛛”程序(Spide
9、r)自動的在互聯(lián)網(wǎng)中搜索信息,可定制、高擴(kuò)展性的調(diào)度算法使得搜索器能在極短的時間內(nèi)收集到最大數(shù)量的互聯(lián)網(wǎng)信息。在中國和美國均設(shè)有服務(wù)器,搜索范圍涵蓋中國大陸、香港、臺灣、澳門、新加坡等華語地區(qū)以及北美、歐洲的部分站點。百度搜索引擎提供三種檢索方式:分類檢索,普通檢索和高級檢索,提供“二次檢索”功能。 如果無法確定輸入什么關(guān)鍵詞才能找到滿意的資料,可先輸入一個簡單詞語搜索,百度會在搜索結(jié)果頁面的底部為提供“相關(guān)搜索”做參考,這些“相關(guān)搜索”是基于其它用戶使用的關(guān)鍵詞制作而成的。 GoogleGoogle搜索引擎搜索引擎 Google在 1998 年由斯坦福大學(xué)的博士生 Larry Page 和
10、Sergey Brin在其宿舍里創(chuàng)立,一年后進(jìn)入商業(yè)運營。Google 是由英文單詞“googol”變化而來。“googol”是美國數(shù)學(xué)家 Edward Kasner 的侄子 Milton Sirotta 創(chuàng)造的一個詞,表示 1 后邊帶有 100 個零的數(shù)字,經(jīng)“Mathematics and the Imagination”一書廣為流傳。Google 使用這個詞代表公司想征服網(wǎng)上無窮無盡資料的雄心,體現(xiàn)了公司整合網(wǎng)上海量信息的遠(yuǎn)大目標(biāo)。 Google的“蜘蛛”程序名為“Googlebot”,Google一般每隔28天派出“蜘蛛”程序檢索現(xiàn)有網(wǎng)站一定IP地址范圍內(nèi)的新網(wǎng)站,而對現(xiàn)有網(wǎng)站的更新則根據(jù)該網(wǎng)站的等級不同有快慢之分。一般來說,網(wǎng)站網(wǎng)頁等級越高,更新的頻率就越快。 搜索的網(wǎng)頁80億;圖片10億;Usenet信息10億,其中提供的帖子超過10億,時間可以追溯到1981年;可用語言100多種;搜索結(jié)果所采用的語言35;國際域名100多個;員工全球3,000多人。 Google 開發(fā)出了世界上最大的搜索引擎,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 茶葉購銷合作合同模板
- 家族遺產(chǎn)合同樣本
- 天津市實習(xí)學(xué)生勞動合同細(xì)則
- 電梯加裝項目合同模板
- 施工隊勞動合同簡明合同模板
- 農(nóng)村地區(qū)私人租地合同樣本協(xié)議
- 新版團(tuán)體人身意外傷害保險合同條款解析
- 房地產(chǎn)公司合同審核與管理制度
- 信息系統(tǒng)的測試與質(zhì)量保證考核試卷
- 孤殘兒童心理關(guān)愛與支持體系構(gòu)建方法研究考核試卷
- 《行政倫理學(xué)教程(第四版)》課件 第1、2章 行政倫理的基本觀念、行政倫理學(xué)的思想資源
- 拆除工程施工拆除進(jìn)度安排
- 絕緣技術(shù)監(jiān)督上崗員:廠用電設(shè)備技術(shù)監(jiān)督考試資料一
- 衛(wèi)生監(jiān)督村醫(yī)培訓(xùn)課件
- 動物的感覺器官
- 獵頭項目方案
- 2024年家庭教育指導(dǎo)師考試(重點)題庫及答案(含各題型)
- 直腸癌術(shù)后的康復(fù)護(hù)理
- 性商老師課程培訓(xùn)課件
- 拆除鍋爐可行性報告
- 全套ISO45001職業(yè)健康安全管理體系文件(手冊及程序文件)
評論
0/150
提交評論