檢索原理及技術(shù)信息檢索.ppt_第1頁
檢索原理及技術(shù)信息檢索.ppt_第2頁
檢索原理及技術(shù)信息檢索.ppt_第3頁
檢索原理及技術(shù)信息檢索.ppt_第4頁
檢索原理及技術(shù)信息檢索.ppt_第5頁
已閱讀5頁,還剩45頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第3章 檢索原理及檢索技術(shù),四川大學(xué)圖書館,目 錄 第1節(jié) 信息檢索原理 第2節(jié) 信息檢索技術(shù),第1節(jié) 信息檢索原理,一、信息檢索類型 二、信息檢索的效率 三、信息檢索步驟,一、信息檢索的類型,、文獻(xiàn)信息檢索 、數(shù)據(jù)信息檢索 3、事實信息檢索,、文獻(xiàn)信息檢索 書目信息檢索 全文信息檢索,書目信息檢索,以標(biāo)題、作者、原文來源、摘要及收藏地點為檢索對象的一類檢索稱之為書目信息檢索。 特點:檢索結(jié)果不直接解答用戶提出的技術(shù)問題,只提供有關(guān)線索。,例如:查 “我國城市居民奶制品消費習(xí)慣 ” 的有關(guān)文獻(xiàn)信息。 張明立.我國城市居民奶制品消費行為的調(diào)查分析 . 中國乳品工業(yè). 2002(3) 四川大學(xué)工學(xué)

2、圖書館收藏有原文。,全文信息檢索,以論文或?qū)@f明書的全文為檢索對象的一類檢索叫做全文信息檢索。 特點:檢索結(jié)果是與課題相關(guān)的論文或?qū)@f明書的全文。 是在書目信息檢索基礎(chǔ)上更深層次的內(nèi)容檢索。,數(shù)據(jù)信息檢索,以具有數(shù)量性質(zhì)并以數(shù)值形式表示的數(shù)據(jù)為檢索對象的一類檢索。 是一種確定性檢索。一般常用數(shù)據(jù)大全、手冊、年鑒進(jìn)行檢索。,事實信息檢索,以事項為檢索對象,檢索結(jié)果是有關(guān)某一事物的具體答案。如日本哪些公司在生產(chǎn)等離子電視機。 也是一種確定性檢索。一般常用手冊、年鑒、百科全書進(jìn)行檢索。,二、信息檢索效率,信息檢索效率是評價一個檢索系統(tǒng)性能優(yōu)劣的質(zhì)量標(biāo)準(zhǔn),它貫穿于信息的存儲和檢索的全過程。包括檢索

3、系統(tǒng)的可利用性,信息資源的可利用性和可獲得性,檢索系統(tǒng)之檢索技術(shù)的可利用性和友好性。其評價的具體指標(biāo)是 查全率 查準(zhǔn)率,查全率,利用檢索系統(tǒng)進(jìn)行某一課題檢索時,檢出的相關(guān)信息量(w)與該系統(tǒng)中存儲的相關(guān)信息量(X)的比率稱為查全率(R),用公式表示如下: R= ( 檢出文獻(xiàn)W/系統(tǒng)中存儲的文獻(xiàn)X ) 100%,查 準(zhǔn) 率,利用檢索系統(tǒng)進(jìn)行某一課題檢索時,檢 出的相關(guān)信息量(w)與檢出信息總量(M) 的比率稱為查準(zhǔn)率(P ),用公式表示如下: P=( 檢出的相關(guān)信息量W/檢出的所有信息量 M )100%,三、檢索步驟,1、明確檢索目的。 2、對檢索課題進(jìn)行分析,找出檢索詞。 3、制定檢索策略(包

4、括選檢索系統(tǒng)、選檢索途徑、編制檢索提問式)。 4、區(qū)分文獻(xiàn)類型。 5、整理信息線索,索取原始文獻(xiàn)。,第2節(jié) 信息檢索技術(shù),一、檢索技術(shù) 1 布爾檢索:見教材 2 近義檢索:見教材 3 截詞檢索:見教材 4 限制檢索:見教材 二、檢索技術(shù)應(yīng)用 三、如何選用關(guān)鍵詞,1 布爾檢索,布爾邏輯算符的形式及含義 (1)邏輯與 (2)邏輯或 (3)邏輯非,邏輯與,1、概念:邏輯與是一種具有概念交叉或概念限定關(guān)系的組配。 2、算符:“ * ” 或 “ AND ”,并且 3、特點:增強了專指度,提高了查準(zhǔn)率。 4、例:“微波” AND “通信”,邏輯或,1、概念:邏輯或是一種具有概念相同,概念相關(guān)的組配。 2、

5、算符: “ + ” 、 “ OR ”、“或者” 3、特點:擴大檢索范圍,提高了查全率。 4、舉例:“ 廢水 ” OR “ 污水,邏輯非,1、邏輯非是一種具有概念排除關(guān)系的組配。 2、算符: “ - ” 、 “ NOT ”、不包含 3、特點:排除不需要的概念,提高查準(zhǔn)率,但影響查全率。 4、舉例: “制藥廢水 NOT 放射廢水”,A,布爾邏輯組配圖,(a)邏輯與 A=619 B=23290 A AND B=54 (b)邏輯或 A=341 B=76 A OR B=364 (c)邏輯非 A=25283 B=4945 A NOT B=2431,工程索引EI,返回,中國知識產(chǎn)權(quán)局網(wǎng)站中國專利檢索,2、詞

6、位檢索,詞位檢索具有限定檢索詞的詞與詞之間位置關(guān)系的功能,可彌補布爾邏輯算符只是定性規(guī)定檢索詞的范圍,不確定相互位置和順序的缺陷。以提高檢準(zhǔn)率。,詞位檢索之一,(W)與(Nw) : 兩詞之間用“W”,表示其相鄰關(guān)系。詞之間不允許插入其它詞和字母,但允許有一空格或標(biāo)點符號。詞序不能顛倒。 SICHUAN (W) UNIVERSITY,nW,兩詞之間用“nW”,詞之間允許(非必需)插入n個其它詞和字母,詞序不能顛倒。 例如: laser(1w)printer,鄰位檢索之二,(N)與(nN) : 兩詞之間不能插入任何詞(或可以插 入n個詞)但詞序可以顛倒。 例如: air ( N ) polluti

7、on,網(wǎng)絡(luò)數(shù)據(jù)庫:NERA 、SAME,特點:限制檢索詞之間的位置關(guān)系,提高查準(zhǔn)率。 NERA表示兩詞之間不得多于9個詞,詞前后位置任意;(EI) SAME要求檢索詞在同一個句子中,檢索詞在句子中的順序任意。 (SCI),3、截詞檢索,截詞檢索是防止漏檢,提高查全率的一 種常用檢索技術(shù)。大多數(shù)網(wǎng)站都提供了截 詞檢索的功能。有的網(wǎng)站也叫做通配符或 詞干法。用或 ?表示。 有左截詞、右截詞和中截詞,右截詞,右截詞(又稱后截詞):是一種滿足前方一致的檢索。 例如: treat* 可檢出: treat 和 treatment 兩個詞。 右截詞分為有限和無限右截詞兩種。,1)有限右截詞:主要用于詞的單復(fù)

8、數(shù),動詞的詞尾變化等。 截詞符“ ?”截幾個字符,就在詞根后加幾個“?”。 Book? ? Book Books,2)無限右截詞:主要用于同根詞。在詞根后加一個“ ?” 或 “ * ” ,可檢出含有該詞根的所有記錄。,Computer? Computer Computers Computering Computered Computerization,中截詞,允許檢索詞中間有若干變化形式 例如:wom*n wom?n woman woman women women 常用于美英拼寫法不同和名詞單復(fù)數(shù)不一樣 的情況,4、限制檢索技術(shù),概念:限制檢索是將檢索詞限制在特定的范圍內(nèi)檢索。 常用的限制檢索

9、有:字段、文獻(xiàn)類型、語種 年代。 特點:限制查找的范圍,滿足課題對查全、 查準(zhǔn)的要求,二.檢索技術(shù)的應(yīng)用,中文科技期刊全文數(shù)據(jù)庫 傳統(tǒng)檢索方式,邏輯與檢索,邏輯或檢索,限制檢索,檢索技術(shù)在CNKI中的應(yīng)用,布爾檢索,限制檢索,詞位檢索(同段檢索),詞位檢索(同句檢索),關(guān)鍵詞選擇,關(guān)鍵詞的選擇 選定的關(guān)鍵詞應(yīng)符合課題主題;并應(yīng)列出常用中外文同義詞、縮寫詞, 以及核心關(guān)鍵詞的上下位類詞。 應(yīng)充分利用詞表、辭海、術(shù)語標(biāo)準(zhǔn)、詞典等工具書,以及從已檢出的文獻(xiàn)中,擴展檢索用詞。,關(guān)鍵詞的選擇應(yīng)注意, 立足規(guī)范詞,兼顧自由詞 詞的全稱、簡稱及縮寫字母 必要時應(yīng)向上下位類詞擴檢 注意外來詞的譯寫變化 慎用詞

10、組或短語,切記:同義詞是文獻(xiàn)檢索中的永恒難題!, 確定規(guī)范詞,兼顧自由詞 課題名稱:布魯氏菌病防治研究 1274 布魯氏菌病 Brucellosis 379 布氏桿菌病 Brucellosis 99 布魯氏桿菌病 Brucellosis 17 傳染性流產(chǎn) Epizootic abortion 13 波狀熱 Undulant fever 9 地中海熱 Mediterranean fever 8 馬爾他熱 Malta fever, 確定規(guī)范詞,兼顧自由詞,膠粘劑 9370 粘固劑 265 粘合劑 5291 膠結(jié)劑 141 粘結(jié)劑 3850 粘膠劑 122 粘接劑 1109 粘著劑 102 黏合劑 603 膠合劑 88 膠黏劑 519 粘附劑 75,檢索技術(shù)應(yīng)用示例,檢索課題:農(nóng)民工生存狀況調(diào)查 檢索詞: 檢索式:(農(nóng)民工+農(nóng)民+打工妹+打工仔) *(生活+生存+待遇),農(nóng)民工,打工妹,打工仔,生 存,生 活,待 遇,膜技術(shù)用于造紙廢水處理的研究進(jìn)展,檢索詞: 膜技術(shù): Membrane Technology 造紙廠:Paper Mills 造紙: Paper-making 廢 水: wastewater; 排出水:Effluent ; 污 水: sewage 處理:Treatment 凈

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論