網(wǎng)絡(luò)信息檢索_第1頁
網(wǎng)絡(luò)信息檢索_第2頁
網(wǎng)絡(luò)信息檢索_第3頁
網(wǎng)絡(luò)信息檢索_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、網(wǎng)絡(luò)信息檢索搜索引擎篇摘要:概述網(wǎng)絡(luò)信息檢索,主要針對(duì)搜索引擎進(jìn)行比較,參考一些文獻(xiàn)來對(duì)將來的 搜索引擎進(jìn)行合理的展望。關(guān)鍵字:網(wǎng)絡(luò)信息檢索搜索引擎發(fā)展趨勢(shì)實(shí)時(shí)搜索網(wǎng)絡(luò)信息檢索概述網(wǎng)絡(luò)信息檢索是指能夠通過網(wǎng)絡(luò)接受用戶的查詢指令,并向用戶提供符合其查 詢要求的網(wǎng)絡(luò)信息資源的過程??梢园丫W(wǎng)絡(luò)信息檢索理解為見多對(duì)象為網(wǎng)絡(luò)信息的 信息檢索。(西安電子科技大學(xué)出版社網(wǎng)絡(luò)信息檢索搜索引擎概述網(wǎng)絡(luò)信息檢索的應(yīng)用有搜索引擎,多媒體信息檢索,話題識(shí)別與跟蹤,信息過濾,問 題回答五個(gè)方面。本文主要講述搜索引擎的相關(guān)內(nèi)容。本文所稱的搜索引擎是指因特網(wǎng)上專門提供查詢服務(wù)的一類網(wǎng)站,這些網(wǎng)站通 過網(wǎng)絡(luò)搜索軟件(又稱為網(wǎng)

2、絡(luò)搜索機(jī)器人或網(wǎng)站登錄等方式,將因特網(wǎng)上大量網(wǎng)站的 頁面收集到本地,經(jīng)過加工處理而建庫,從而能夠?qū)τ脩籼岢龅母鞣N查詢做出響應(yīng),提 供用戶所需的信息。用戶的查詢途徑主要包括自由詞全文檢索、主題詞檢索、分類 檢索及其它特殊信息的檢索(企業(yè)、人名、電話黃頁等。著名搜索引擎Google,百度,yahoo中國Google是一家美國上市公司(公有股份公司,于1998年9月7日以私有股份公 司的形式創(chuàng)立,以設(shè)計(jì)并管理一個(gè)互聯(lián)網(wǎng)搜索引擎。Google公司的總部稱作 “Googolplex”,它位于加利福尼亞山景城。Google創(chuàng)始人Larry Page和Sergey Brin 在斯坦福大學(xué)的學(xué)生宿舍內(nèi)共同開發(fā)

3、了全新的在線搜索引擎,然后迅速傳播給全球 的信息搜索者。Google目前被公認(rèn)為是全球規(guī)模最大的搜索引擎。百度是中國的兩位海外留學(xué)生李彥宏和徐勇博士創(chuàng)建的中文搜索引擎。它擁有 目前世界上最大的中文信息庫,總量達(dá)到1億2千萬以上,并且還在以每天幾十萬頁 的速度快速增長。2000年1月,百度公司在中國成立了他的全資子公司百度網(wǎng)絡(luò)技 術(shù)(北京有限公司。隨后于同年10月成立了深圳分公司。2011年6月又在上海成立 了上海辦事處。2005年百度在美國的納斯達(dá)克上市,省委當(dāng)年全球資本市場上最為 引人注目的上市公司,百度由此進(jìn)入一個(gè)嶄新的發(fā)展階段。Yahoo中國是網(wǎng)站分類目錄的領(lǐng)頭軍,它以分類目錄,網(wǎng)站檢索

4、為主,附帶網(wǎng)頁全 文檢索,也是目前最重要的搜索服務(wù)網(wǎng)站。雅虎有中文,英文等十余種語言版本,每一版的內(nèi)容互不一樣??梢哉f,每一種不同的版本都是一種不同的,相 對(duì)獨(dú)立的搜索引擎。他們各自信息搜集方式的比較百度是最典型的一種自動(dòng)搜索引擎,google是一般典型的自動(dòng)搜索引擎。他們 由一個(gè)成為蜘蛛的機(jī)器人程序,由四部分組成的自動(dòng)索引。該搜索引擎的有點(diǎn)事信 息量過大,更新及時(shí),不需要人的干預(yù),缺點(diǎn)是搜到信息過多,許多無用信息需要用戶行 結(jié)果中篩選。Yahoo屬于分類搜索引擎。Yahoo并不是單純地提供所有網(wǎng)站網(wǎng)頁的全文檢索 服務(wù),而是將其收集到的網(wǎng)站及網(wǎng)頁分門別類加以索引和文摘(由人工完成,以一個(gè)分 層

5、的線性目錄來為用戶提供按圖索驥式的服務(wù)。該類搜索引擎因加入了人的智力, 所以信息準(zhǔn)確,導(dǎo)航質(zhì)量非常高,不足之處是需要人的介入,維護(hù)量大,信息量少,信息 更新不及時(shí)。綜合各個(gè)方面(本文只比較搜尋信息方式的不同,其他方面不加贅述,三大搜索引 擎各具千秋。從實(shí)用性來說,google的檢索功能強(qiáng)大、靈活,尤其是支持多種字段檢 索以及網(wǎng)頁的推薦功能,并可以安用戶的習(xí)慣設(shè)置檢索界面;百度收錄的中文信息覆 蓋面廣、數(shù)量大,更新快,注重服務(wù)的本地化;雅虎作為指南型分類檢索工具,在相對(duì) 查全率方面具有優(yōu)勢(shì)。我們可以根據(jù)各自的生活、工作、學(xué)習(xí)的需要,選擇一種適 合自己的搜索引擎,但是現(xiàn)有的搜索引擎也不是盡善盡美,

6、它們也或多或少的存在些 問題,希望它們能互相取長補(bǔ)短、不斷豐富、完善,更好的滿足用戶個(gè)性化的多遠(yuǎn)檢 索需求。搜索引擎的發(fā)展趨勢(shì)首先,搜索引擎將會(huì)更加注重強(qiáng)大的信息的整合能力,搜索結(jié)果通過多較多、 多數(shù)據(jù)渠道和多媒體的展現(xiàn)。譬如搜索北朝鮮,關(guān)于朝鮮的簡介、新聞、博客、論 壇、視頻、電視訪談、圖片,實(shí)時(shí)的微博,等等整齊排列。越來越注重實(shí)時(shí)搜索能力。擁有上億用戶的中文微博,各類社會(huì)關(guān)系網(wǎng)絡(luò),是 的任何人可以快速發(fā)布信息和個(gè)人感想?;谶@些信息大戰(zhàn)的實(shí)時(shí)搜索可提供靈活 的關(guān)鍵詞搜索,該可以提供很多關(guān)于地點(diǎn)敏感,人物敏感、情感敏感的搜索功能。發(fā) 展獨(dú)立的微博搜索和社會(huì)關(guān)系網(wǎng)絡(luò)搜索或者把微博和社會(huì)關(guān)系網(wǎng)絡(luò)

7、的內(nèi)容納入到通 用的搜索,都是實(shí)時(shí)搜索的重要應(yīng)用。iii .語義分析技術(shù)除了常規(guī)的自然語言處理包括分詞、抽取關(guān)鍵詞、適度的句 法分析、分類之外,還要進(jìn)行語義角色標(biāo)注和情感分析。iv.逐漸由搜到用的快速遷移。目前,多種形式的應(yīng)用平臺(tái)集合了最優(yōu)秀的應(yīng)用 程序。用戶搜索到響應(yīng)的應(yīng)用程序,就可以快速完成某一項(xiàng)任務(wù)。V.靈活的人機(jī)接口,利用自然語音、自然語言,圖像、配上基于地理位置的各項(xiàng)服務(wù)創(chuàng)造出嶄新搜索體驗(yàn),將會(huì)在移動(dòng)??停ㄈ玳_車愈顯重要。Vi.個(gè)性化。社會(huì)關(guān)系網(wǎng)絡(luò)和移動(dòng)互聯(lián)網(wǎng)的發(fā)展使得夢(mèng)寐以求的個(gè)性化搜索逐 步成為現(xiàn)實(shí)。它按照每個(gè)用戶的需求來進(jìn)行搜索,并且根據(jù)用戶以前的行為來定制 搜索結(jié)果的排列方式。另外還會(huì)提供強(qiáng)大的推薦功能。用戶大家桌面或手機(jī),系統(tǒng) 會(huì)根據(jù)你以往的搜索行為、你所處的位置和時(shí)間會(huì)自動(dòng)彈送你需要的信息供你查 閱。參考文獻(xiàn):1董守斌袁華網(wǎng)絡(luò)信息檢索,西安電子科技大學(xué),20102沈固朝網(wǎng)絡(luò)信息檢索:工具,方法,實(shí)踐,高等教育出版社,20043謝新洲網(wǎng)絡(luò)信息檢索技術(shù)與案例,北京圖書館出版社,20054新一代搜索引擎的研發(fā)戰(zhàn)略周明 HYPERLINK /Read/Read.aspx?id=40149463 /Read/Read.aspx?id=401494635百度百科 HYPERLINK /

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論