《信息檢索教程》第一章信息檢索基礎(chǔ)_第1頁
《信息檢索教程》第一章信息檢索基礎(chǔ)_第2頁
《信息檢索教程》第一章信息檢索基礎(chǔ)_第3頁
《信息檢索教程》第一章信息檢索基礎(chǔ)_第4頁
《信息檢索教程》第一章信息檢索基礎(chǔ)_第5頁
已閱讀5頁,還剩20頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第一章信息檢索基礎(chǔ)第一節(jié)信息概述一、信息的含義與特征隨著社會(huì)信息化進(jìn)程的加快,信息已經(jīng)滲透到社會(huì)生活各個(gè)領(lǐng)域,成為人類社會(huì)不可缺少的重要資源。人們的一切行為決策,小到一個(gè)人外出是否需要帶雨傘,大到國家的宏觀管理,都建立在相關(guān)信息獲取分析的基礎(chǔ)上。在當(dāng)今時(shí)代,信息的重要性日益凸現(xiàn)。(一)信息的含義信息(information)作為現(xiàn)今社會(huì)使用頻率最高的詞匯之一,顯現(xiàn)著時(shí)尚,蘊(yùn)涵著古老。(二)信息的特征1.可存儲(chǔ)性2.可傳遞性3.可轉(zhuǎn)換性4.可處理性5.可共享性6.可識別性7.依附性8.普遍性二、信息的功能和類型(一)信息的功能1.傳承人類文明,推進(jìn)社會(huì)發(fā)展2.提供決策依據(jù),提高決策效益3.保障有效控制,保證系統(tǒng)秩序4.發(fā)揮參考作用,推動(dòng)知識創(chuàng)新(二)信息的類型1.基于廣義信息概念的信息分類2.基于狹義信息概念的信息分類三、網(wǎng)絡(luò)環(huán)境下的信息變化

(一)因特網(wǎng)對信息的影響1.因特網(wǎng)引發(fā)了信息新的出版形式———網(wǎng)絡(luò)出版,形成了新型的網(wǎng)絡(luò)信息資源2.因特網(wǎng)使人類傳統(tǒng)的信息交流方式發(fā)生了根本性的變化3.因特網(wǎng)推動(dòng)了信息處理技術(shù)的發(fā)展(二)網(wǎng)絡(luò)環(huán)境下信息的新特點(diǎn)1.信息類型多樣化2.信息數(shù)量和內(nèi)容都得到了極大的豐富3.信息在分布上呈現(xiàn)出明顯的分散性4.信息共享程度提高第二節(jié)信息檢索的概念和作用一、信息檢索的概念信息檢索(InformationRetrieval)一詞最早出現(xiàn)在20世紀(jì)中期。1950年,美國數(shù)學(xué)家莫爾斯(CalvinW.Mooers)在一次國際數(shù)學(xué)會(huì)議上發(fā)表了論文《把信息檢索看作是時(shí)間性的通訊》,文中提出了信息檢索。(一)信息檢索的概念

從廣義的角度講,信息檢索包含信息存儲(chǔ)和信息獲取兩個(gè)過程。(二)信息檢索的原理信息檢索原理就是將特定的信息需求與存儲(chǔ)在檢索系統(tǒng)中的信息標(biāo)識進(jìn)行異同的比較與匹配,選取兩者相符或部分相符的信息予以輸出。(三)信息檢索的類型1.文獻(xiàn)檢索(DocumentRetrieval)2.數(shù)據(jù)檢索(DataRetrieval)3.事實(shí)檢索(FactRetrieval)(四)信息檢索的發(fā)展信息檢索的發(fā)展經(jīng)歷了這樣一些階段:1.手工檢索2.脫機(jī)批處理檢索3.聯(lián)機(jī)檢索階段4.光盤檢索階段5.網(wǎng)絡(luò)化聯(lián)機(jī)檢索階段二、信息檢索的意義和作用1.信息檢索是有效利用信息資源、實(shí)現(xiàn)其最大價(jià)值的科學(xué)方法2.信息檢索是再學(xué)習(xí)的工具,是獲取知識的有效途徑3.信息檢索能有效地提高科研工作的效率,節(jié)省人力物力及時(shí)間一、信息檢索系統(tǒng)的基本概念信息檢索系統(tǒng)是指根據(jù)特定的信息需求而建立起來的一種有關(guān)信息搜集、加工、存儲(chǔ)和檢索的程序化系統(tǒng),其主要目的是為人們提供信息服務(wù)。第三節(jié)信息檢索系統(tǒng)(一)信息檢索系統(tǒng)的組成要素1.信息2.檢索技術(shù)設(shè)備3.檢索語言及方法(二)信息檢索系統(tǒng)的工作原理

美國著名情報(bào)學(xué)家蘭卡斯特(F.WilfridLancaster)的圖示向我們展示了信息檢索系統(tǒng)的主要工作原理。信息檢索系統(tǒng)包括信息的存儲(chǔ)和獲取兩個(gè)部分,分別對應(yīng)信息的輸入和輸出過程。二、信息檢索系統(tǒng)的構(gòu)成1.信息選擇子系統(tǒng)2.信息索引子系統(tǒng)3.詞表管理子系統(tǒng)4.檢索子系統(tǒng)5.用戶同系統(tǒng)之間交互子系統(tǒng)6.匹配子系統(tǒng)三、信息檢索系統(tǒng)的分類(一)手工檢索系統(tǒng)1.書本式的手工檢索系統(tǒng)

2.卡片式的手工檢索系統(tǒng)(二)計(jì)算機(jī)檢索系統(tǒng)1.硬件2.軟件3.數(shù)據(jù)庫一、信息檢索效果評價(jià)信息檢索效果是利用檢索系統(tǒng)開展檢索服務(wù)時(shí)產(chǎn)生的有效結(jié)果。它衡量了檢索結(jié)果對用戶需求的滿足程度,是檢索系統(tǒng)性能的直接反映。第四節(jié)信息檢索效果(一)查全率(RecallRatio)和查準(zhǔn)率(PrecisionRatio)查全率和查準(zhǔn)率是由美國的佩里(J.W.Pery)和肯特(AllenKent)于20世紀(jì)50年代中期提出來的,后經(jīng)不斷改進(jìn)和完善,至今已成為評價(jià)檢索效果最常用的兩項(xiàng)關(guān)鍵指標(biāo)。(二)漏檢率(OmissionFactor)和誤檢率(NoiseFactor)漏檢率指漏檢相關(guān)文獻(xiàn)信息量與檢索系統(tǒng)中相關(guān)文獻(xiàn)信息總量的比率,它與查全率相對應(yīng)。(三)響應(yīng)時(shí)間(ResponseTime)響應(yīng)時(shí)間指在一次檢索過程中,用戶從開始向信息檢索系統(tǒng)提問到系統(tǒng)輸出檢索結(jié)果的全部時(shí)間。響應(yīng)時(shí)間的長短也是評價(jià)檢索系統(tǒng)效果的重要指標(biāo),直接反映著信息檢索的速度。二、影響檢索效果的因素(一)標(biāo)引的質(zhì)量(二)檢索語言的性能(三)檢索途徑的數(shù)量(四)檢索策略的優(yōu)劣(五)檢索人員的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論