情報檢索策略的制定課件_第1頁
情報檢索策略的制定課件_第2頁
情報檢索策略的制定課件_第3頁
情報檢索策略的制定課件_第4頁
情報檢索策略的制定課件_第5頁
已閱讀5頁,還剩65頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第二章 計算機檢索方法與檢索策略 第一節(jié) 計算機檢索基本方法 第二節(jié) 聚類組合法的應用 第三節(jié) 布爾邏輯算符檢索式編寫 第四節(jié) 制定情報檢索策略 第五節(jié) 調(diào)整情報檢索策略 Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 S一、計算機檢索基本方法 1. 布爾邏輯算符檢索法 是當今檢索理論中最成熟的理論之一,也是構(gòu)造檢索表達式最基本、最簡單的匹配模式。布爾邏輯檢索是通過布爾邏輯算符來實現(xiàn)的,這些運算符能把一些具有簡單概念的檢索詞(或檢索項)組配成為一個具有復雜概

2、念的檢索式,用以表達用戶的檢索要求。 邏輯運算符有三種:與、或、非 Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 S 邏輯與(and 或 *) 是一種用于交叉概念和限定關(guān)系的組配。它可以縮小減縮范圍,有利于提高查準率。例如:insulin and diabetes 凡是用and的檢索式,and兩側(cè)的檢索詞必須同時出現(xiàn)在同一條記錄中,該記錄才算命中。 Information Retrieval and Application Take the next st

3、ep Yunnan Agricultural University 2012 SA and Binsulin and diabetes AB 邏輯或(or 或 +) 是一種用于并列關(guān)系的組配。它可以擴大檢索范圍,防止漏檢,有利于提高查全率。例如:cancer or tumor 凡是用or的檢索式,or兩側(cè)的檢索詞只要有一個在一條記錄中出現(xiàn),該記錄就算命中。 Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 SA or B cancer or tumorAB 邏

4、輯非(not 或 -) 是一種排斥關(guān)系的組配。用來從原來的檢索范圍中排除不需要的概念,有利于提高查準率。例如:solar energy not nuclear 凡是用not的檢索式,not前面的檢索詞必須在記錄中出現(xiàn)而后面的檢索詞一定不能出現(xiàn),該記錄才算命中。 Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 SA not B Solar energy not nuclearBA提示 1 在使用“邏輯非”進行組配時特別注意,否則會出現(xiàn)漏檢。 如上例是查找有關(guān)太

5、陽能并排除核能方面的文獻,結(jié)果查到一篇有關(guān)一種替代核能燃料方面的文獻。 Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 S提示 2 在一個檢索式中,可以同時使用多個邏輯運算符,構(gòu)成一個復合邏輯檢索式。復合邏輯檢索式中,運算優(yōu)先級別從高至低依次是not、and、with、or,可以使用括號改變運算次序。 如(A or B)and C 先運算(A or B),再運算 and C Information Retrieval and Application Take

6、 the next step Yunnan Agricultural University 2012 S邏輯“與”的缺點 邏輯“與”只要求兩個檢索詞必須同時出現(xiàn)在同一篇文獻中,而沒有限定算符兩側(cè)檢索詞之間的位置關(guān)系,有時難免造成誤檢。 例如:查找“細菌對染料破壞”方面的文獻細菌 and 染料 and 破壞 檢索結(jié)果有“細菌對染料的破壞”方面的文獻,也會有“染料對細菌的破壞”方面的文獻 要排除后一部分的文獻,就需用位置算符限定詞與詞之間的位置關(guān)系。 Information Retrieval and Application Take the next step Yunnan Agricultur

7、al University 2012 S2. 位置算符檢索法 又稱鄰接算符(adjacent operators),適用于兩個檢索詞以指定間隔距離或者指定的順序出現(xiàn)的場合。跟and運算符類似,但比and運算符功能更具體。例如:查找“細菌對染料破壞”方面的文獻 Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 S 顯然其中有些記錄與課題要求毫無關(guān)系。位置運算符可以用于改進and運算符的這種不足之處,因此,它們可以看成是特殊功能的and運算符。 按照兩個檢索詞出現(xiàn)

8、的順序和距離,可以有多種位置運算符,而且對于同一功能的運算符,不同的檢索系統(tǒng)可能有不同的表達方式,也有的檢索系統(tǒng)不支持位置運算符,檢索之前應該先看看數(shù)據(jù)庫的幫助信息。 Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 S(2) (nW)(鄰詞位置算符,Word) 兩側(cè)檢索詞之間允許插入n個詞,包括系統(tǒng)禁用詞,詞序不能顛倒。 如:wear (nW)materials 可檢出 wear of materials Information Retrieval and

9、Application Take the next step Yunnan Agricultural University 2012 S(3)(N)算符中的N含義為“Near” 詞序可以顛倒,兩詞之間不許插詞,只允許出現(xiàn)空格或連字符號。例:cross(N)section 可檢出 cross section 和 section cross Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 S(F)與and的區(qū)別 (F)鄰近算符指定兩個檢索詞在同一個字段中出現(xiàn)。

10、而and布爾邏輯組配中的兩個檢索詞會出現(xiàn)在不同的字段中。 此外同位置運算符相比,and可以連接兩個以上的檢索詞,還可以兩個以上的檢索集合進行組配。例如:au=cheng, gengdong and cs=dalian and py=1998 Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 S(5)(S)(句子內(nèi)算符,Sentence ) 表示其兩側(cè)檢索詞必須出現(xiàn)在文獻記錄的同一句子(子字段)中,詞序不限,中間可加詞。 如:electric (S)plant

11、Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 S(6)(L)(主從關(guān)系算符,Link) 表示其兩側(cè)檢索詞之間有主從關(guān)系,前者為主,后者為副。L可用來連接主、副標題詞,它們被列在記錄的規(guī)范詞字段。 如:air pollution(L)control Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 S3. 截詞(Trunca

12、tion)檢索法 截詞有多種用途 詞尾截斷可得到該單詞所提及的所有詞語(單數(shù)和復數(shù)) 詞間切斷或通配符:可找到該單詞的所有變化形式或不同拼法。 ? = 一個字符 * = 一個或多個字符 Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 S例如: 檢索單復數(shù)和不同拼法等詞語 Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 S右

13、端截斷詞間截斷(通配符)Computer*ComputerComputers ComputeriseComputerizationOrgani *ationOrganizationOrganisation4. 檢索限定 字段限定包括TI、AB、DE、 AU;時間范圍限定PY; 分類限定CC;語種限定LA;文獻類型DT 等 字段限定也是調(diào)整檢索策略的一種重要手段。多數(shù)檢索系統(tǒng)對不指定字段的檢索詞通常在所有字段(all field)中進行檢索。 Information Retrieval and Application Take the next step Yunnan Agricultural

14、University 2012 S常用可檢索字段及含義: TI(Title)、AB(Abstract)、DE(Descriptors) ID(Identifiers)、AU(Author)、LA(Language) CS(Corporate Source)、SO(Source Publication) PY(Publication Year)、DT(Document Type) CC(Classification Code) Information Retrieval and Application Take the next step Yunnan Agricultural Universi

15、ty 2012 S二、聚類組合法的應用 是對構(gòu)造檢索式的思維過程加以總結(jié)和規(guī)范化的結(jié)果,是指對課題名稱按序?qū)嵤┤缦缕叻N操作:切分、刪除、替換、聚類、補充、增加、組合,從而生成檢索式的方法。 Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 S2. 詞語刪除 對切分后課題語句中不適宜作為檢索詞的詞進行刪除。有以下幾種情況的均可刪除。 不具有檢索意義的虛詞及非關(guān)鍵詞 例如:我國/農(nóng)業(yè)資源/的/合理/開發(fā)/與/利用/研究 (刪除)中國/農(nóng)業(yè)資源/開發(fā)利用 Infor

16、mation Retrieval and Application Take the next step Yunnan Agricultural University 2012 S 過寬的泛指詞和過窄的限定詞 如:動物飼料的近況、配方、生產(chǎn)工藝及其應用動物飼料/生產(chǎn)工藝 Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 S 存在蘊含關(guān)系的可合并詞 肺氣腫病人的血氧定量法 (切分)肺氣腫/病人/的/血氧定量法 (刪除)肺氣腫/血氧定量法 Information R

17、etrieval and Application Take the next step Yunnan Agricultural University 2012 S3. 概念替換 例如: 大氣中細菌濃度的計算方法 (替換)大氣污染/計算方法 Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 S4. 概念聚類 對切分出來的單元按語義進行聚類、同類合并。即將彼此相關(guān)的詞歸于一組。這些詞是指同義詞或彼此有依附關(guān)系的詞,亦即在檢索式中可以相互替換、相互補充以及相互等效的

18、詞。聚類的實質(zhì)是進行組面分析,經(jīng)過聚類,語句由詞的集合轉(zhuǎn)換為概念(組面)的集合。 Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 S(1)同類合并 例如:高層建筑的優(yōu)化設計 (切分) 高層/建筑/的/優(yōu)化/設計 (替換) 高層/建筑/優(yōu)化/結(jié)構(gòu)設計 (聚類) 高層建筑/優(yōu)化/結(jié)構(gòu)設計 Information Retrieval and Application Take the next step Yunnan Agricultural University

19、2012 S(2)同義詞補充 例1:檢索有關(guān)前蘇聯(lián)電視方面的文獻 檢索式: S1 (Soviet or USSR or Russia)4995篇 S2 (Television or TV or mass media)1168篇 組配式:S1 and S2 13篇 Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 S(3)相關(guān)詞補充 例2:肺氣腫病人的血氧定量法 (刪除)肺氣腫 and 血氧定量法 (補充)(肺氣腫or慢性阻塞or呼吸系統(tǒng)疾?。゛nd(血氧定量法

20、or血氣分析or呼吸功能實驗) Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 S(4)隱含概念擴展 例如: 大氣環(huán)境容量的研究 (切分) 大氣/環(huán)境容量/的/研究 (擴展)(蒙特卡洛模型 or 粒子模型) and 大氣環(huán)境容量 Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 S5. 增加限義詞 許多詞具有多重含義,即“一

21、詞多義”。一詞多義常常導致誤檢,為了解決由于檢索詞一詞多義而造成誤檢的問題,可以采用增加“限義詞”的手段來對檢索詞進行限義。 如: Cell and Tissue culture Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 S6. 概念組合 對概念組面及每個組面內(nèi)應包含的檢索詞已經(jīng)確定,將它們組合成完整的檢索式。通過詞的組合來組成詞組和句子,這是表達概念的基本方法。檢索詞的組合是通過布爾邏輯算符來進行連接的。如:(A or B or C)and D an

22、d E. Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 S三、布爾邏輯檢索式編寫 1. 邏輯運算符使用方法 布爾邏輯檢索式是檢索策略的邏輯表達式,其表達形式實際上是上述各步驟結(jié)果的綜合體現(xiàn),即使用合適的邏輯算符和位置算符,將各檢索詞進行組配,使之確切地表達課題的主題概念,符合檢索的需求。 Information Retrieval and Application Take the next step Yunnan Agricultural Universi

23、ty 2012 S例1:查找分別單獨論述微型汽車發(fā)動機和摩托車發(fā)動機的文獻,并要求排除那些同時論述這二個主題的文獻”。A-微型汽車 B-摩托車 C-發(fā)動機 檢索式: Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 S(A and C or B and C)not(A and B and C)(A and C or B and C)not(A and B )ABC文氏圖例2:查找論述太陽能或者風能的文獻,但不要其中又論及水能的文獻。 A-太陽能 B-風能 C-

24、水能檢索式:( A or B )not C Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 S文氏圖CAB例3:電視中暴力行為對兒童的影響。A-電視 B-暴力行為 C-兒童。檢索式: A and B and C Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 S文氏圖ABC文氏圖例4:檢索有關(guān)利用殺蟲劑控制蚜蟲方面的文獻。

25、 A-insecticde B-aphides C-control檢索式: A and B and C A and B提問:哪個是最佳檢索式? Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 SA and B and CABC文氏圖例5: 查找三氧化二砷與空氣污染方面的文獻。 A-三氧化二砷(As) B-空氣 C-污染檢索式:(Arsenic trioxide or As)and air and pollution Arsenic trioxide or A

26、s and air pollution Arsenic trioxide or As提問:在上述三個檢索式中,哪個為最佳或最合理檢索式?為什么? Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 S 例6:利用稻米糠皮提取天然食品色素 稻米 and 糠皮 and 提取 and 天然食品 and 色素 (稻米 or 糠皮)and 色素提問:上述二個檢索式中,哪個為最合理檢索式?為什么? Information Retrieval and Application

27、Take the next step Yunnan Agricultural University 2012 S2. 編寫邏輯檢索式一般原則 用and連接檢索詞,將出現(xiàn)頻率不高的詞放在and的左邊。 用or連接檢索詞,將出現(xiàn)頻率高的詞放在or 的左邊。 當用and和or兩種算符,并且連續(xù)使用多個or算符,or應放 在and的左邊(or部分用括號)。 Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 S3. 位置算符使用方法 例如:查找聚磷酸氨的制備方法方面的文

28、獻Ammonium(S)polyphosphate and(manufasyure or preparation)152篇Ammonium(S)polyphosphate(S)(manufasyure or preparation)17篇Ammonium(S)polyphosphoric acid(S)(manufasyure or preparation)4篇Polyphosphoric(L)Ammonium(S)(manufasyure or preparation)1篇Ammonium(S)polyphosph?(S)(manufasyure or preparation)38篇 Inf

29、ormation Retrieval and Application Take the next step Yunnan Agricultural University 2012 S編寫邏輯檢索式小結(jié) 使用and算符越多,限制條件就越多,查準率較高;使用or算符越多,連接的相關(guān)詞就越多,查全率也就越高;使用not算符去掉不相關(guān)的概念,可提高查準率。 在檢索式中不要連續(xù)使用多個and算符,以免限制過嚴而漏檢文獻,甚至查不到文獻。 Information Retrieval and Application Take the next step Yunnan Agricultural Univers

30、ity 2012 S四、制定檢索策略 檢索策略(Serches Tactic)是在分析課題檢索要求的基礎上,正確地選擇檢索詞,確定檢索途徑,科學運用邏輯算符、位置算符、截斷符、字段限定符等制定合理的檢索提問式的原則和方法。 Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 S1. 鮑納查爾斯(C. Bourne)檢索策略 最專指面優(yōu)先策略(下位類 或同類) 積木型概念組策略(OR AND) 引文珠型增長策略(單篇文獻 多篇文獻) 逐次分餾策略(上位類 下位類)

31、 見示例: Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 S(1)最專指面優(yōu)先策略(提高查準率) 例如:果蔬農(nóng)藥殘留量檢測與分析 (水果 or 蔬菜) and 農(nóng)藥殘留量 and 檢測 and 分析(2) (水果 or 蔬菜) and 農(nóng)藥殘留?and檢測(478) (水果 or 蔬菜) and 農(nóng)藥殘留量 and 檢測(38) (水果 or 蔬菜) and 農(nóng)藥?and 檢測 and 分析(60) Information Retrieval and Ap

32、plication Take the next step Yunnan Agricultural University 2012 S(2)積木型概念組策略(提高查全率) 例如:檢索氮磷鉀對煙草產(chǎn)量和品質(zhì)的影響 S1 (N or P or K ) S2 (Nitrogen or Phosphate or Potassium) S3 (Tobacco or Nicotiana) S4 (Quality or Yield) (S1 or S2)and S3 and S4 Information Retrieval and Application Take the next step Yunnan A

33、gricultural University 2012 S(3)引文珠型增長策略(擴大檢索范圍) 例如:檢索分子標記在植物育種中的應用 植物 and 分子標記 and 育種 相關(guān)詞: 抗病育種 抗病基因 遺傳標記 基因工程 基因圖譜 基因表達 Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 S(4)逐次分餾策略(縮小檢索范圍) 例如,檢索農(nóng)作物病蟲害控制方面的文獻 作物 and 病蟲害(998) 稻瘟病 and 控制(49) 小麥 and 銹病 and 防治

34、(300多篇) 玉米 and 螟蟲 and 防治(13) Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 S 下面以中國知網(wǎng)(CNKI)中的中國期刊全文數(shù)據(jù)庫為例,并結(jié)合課題要求,綜合運用、選擇不同的檢索路徑及方法。 Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 S Information Retrieval and A

35、pplication Take the next step Yunnan Agricultural University 2012 S初級檢索 Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 S初級檢索結(jié)果 Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 S標準檢索屬于限定檢索 Information Retrieval

36、and Application Take the next step Yunnan Agricultural University 2012 S高級檢索屬邏輯組配檢索 Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 S專業(yè)檢索屬限定檢索示例:SU=北京*奧運 and AB=環(huán)境保護 Information Retrieval and Application Take the next step Yunnan Agricultural University 2

37、012 S引文檢索可檢索作者或期刊論文被引情況 Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 S作者檢索可檢索其研究方向、基金項目、發(fā)表論文、平均被引頻次等 Information Retrieval and Application Take the next step Yunnan Agricultural University 2012 S科研基金檢索檢索科研項目資助論文 Information Retrieval and Application Take the next step Yunnan Agricultural Unive

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論