信息檢索課件研究生課件:第三章:檢索系統(tǒng)的結構、評價及劃分_第1頁
信息檢索課件研究生課件:第三章:檢索系統(tǒng)的結構、評價及劃分_第2頁
信息檢索課件研究生課件:第三章:檢索系統(tǒng)的結構、評價及劃分_第3頁
信息檢索課件研究生課件:第三章:檢索系統(tǒng)的結構、評價及劃分_第4頁
信息檢索課件研究生課件:第三章:檢索系統(tǒng)的結構、評價及劃分_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第三章檢索系統(tǒng)的結構、評價指標及內(nèi)容劃分檢索系統(tǒng)的結構檢索系統(tǒng)的衡量指標檢索內(nèi)容的劃分一、檢索系統(tǒng)的構成(一)結構圖文獻源被選文獻概念分析將概念翻譯成系統(tǒng)語言文獻款目的集合(書目數(shù)據(jù)庫)提問表達式將概念翻譯成系統(tǒng)語言概念分析情報提問情報用戶情報存儲輸入情報檢索輸出標引匹配檢索策略系統(tǒng)詞表一、檢索系統(tǒng)的構成1、按文獻選擇子系統(tǒng)的特征來分,可分為:書目檢索系統(tǒng)數(shù)據(jù)檢索系統(tǒng)文本檢索系統(tǒng)綜合性檢索系統(tǒng)??菩詸z索系統(tǒng)2、按照詞表子系統(tǒng)的特征來分,可分為:控制詞匯的檢索系統(tǒng)非控制詞匯的檢索系統(tǒng)3、按照查詢子系統(tǒng)的特征來分,可分為:布爾邏輯檢索系統(tǒng)人工查詢系統(tǒng)二、檢索系統(tǒng)的衡量指標為了說明與衡量檢索效率,目前在文獻檢索理論中流行著幾個指標:即檢全率(recallfactor)檢準率(pertinencyfactor)漏檢率(omissionfactor)誤檢率(noisefactor)N

收錄的文獻總量X

有關文獻量M

檢出的文獻量W

檢出的有關文獻量二、檢索系統(tǒng)的衡量指標檢全率(recallfactor)=WX=檢出的有關文獻量有關文獻量檢準率(pertinencyfactor)=WM=檢出的有關文獻量檢出的文獻量漏檢率(omissionfactor)=1—WX誤檢率(noisefactor)=1—WM查全率與查準率彼此有反變的關系。在同一個檢索系統(tǒng)中,查全率提高,檢準率就會降低,反之亦然。查全100507525255075100查準三、檢索內(nèi)容的劃分

文獻的類型是多種多樣的,而人們檢索文獻的角度、深度和廣度更是復雜多樣。不同的檢索需求,不可能由一種檢索內(nèi)容來解決。為適應人們的多種信息查詢要求就產(chǎn)生了多種多樣的檢索內(nèi)容。

一般來講,分為以下幾種類型:(一)目錄(Bibliography)目錄是對圖書或者其他出版的文獻特征的記載和描述,其特點是:按種為單位進行記錄與報道,對文獻的描述比較簡單,只記錄其外部特征,按一定的方法組織排列成各種不同種類的目錄。比較重要的目錄有:國家書目出版社與書店目錄館藏目錄

聯(lián)合目錄專題文獻目錄1、國家書目這是對一個國家出版的全部圖書所作的登記統(tǒng)計性書目,可以反映一個國家文化、科學和出版事業(yè)的水平。2、館藏書目包括圖書館、情報部門的文獻館、資料室等等的藏書目錄,它不僅包含從市場采購的公開發(fā)行的資料,也包括用交換等方式得到的非賣品資料不僅包括現(xiàn)在發(fā)行的新書刊,而且包括一定歷史時期累積起來的全部資料,這對廣泛地檢索文獻是很重要的3、聯(lián)合書目是匯總若干個圖書館或其他收藏單位所藏文獻的目錄,從檢索角度來說,它可以免去分別查閱各個館藏目錄的麻煩,擴大文獻的獲取范圍。(二)索引(Index)所謂索引,就是將書籍、期刊等文獻中所刊載的論文題目、作者以及所討論的或者涉及到的學科主題、人名、地名、名詞術語、分子式、所引用的參考文獻等等,根據(jù)一定的需要,經(jīng)過分析,分別摘錄出來,著名其所在書刊中的頁碼并按一定的原則排列起來的工具。索引大致可以分為兩種:1、篇目索引:主要揭示的是期刊,報紙等文獻中的文章,并把文章的著者、篇名按字順排列起來。2、內(nèi)容索引:是將圖書、文章中所包含的事物、人名、地名、學術名詞等內(nèi)容要項摘錄出來而編成的索引。(三)文摘(Abstract)文摘是通過描述文獻的外部特征和簡明深入地摘錄文獻內(nèi)容的要點來報道文獻的一種檢索工具,其特點是以簡練的形式,將某一學科或專業(yè)的原始文獻的主題范圍、目的、方法等作簡略、準確的摘錄。文摘的類型主要有以下兩種:1、報道性文摘(informativeabstract)

是對文獻中情報的濃縮,,它基本上客觀地反映原文創(chuàng)造性本分的全部內(nèi)容。例如,各種研究方法和數(shù)據(jù)。2、指示性文

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論