第四章計(jì)算機(jī)信息檢索技術(shù)_第1頁
第四章計(jì)算機(jī)信息檢索技術(shù)_第2頁
第四章計(jì)算機(jī)信息檢索技術(shù)_第3頁
第四章計(jì)算機(jī)信息檢索技術(shù)_第4頁
第四章計(jì)算機(jī)信息檢索技術(shù)_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第四章計(jì)算機(jī)信息檢索技術(shù)布爾邏輯檢索技術(shù)截詞檢索技術(shù)限制檢索技術(shù)詞位檢索技術(shù)

1.布爾邏輯檢索技術(shù)布爾邏輯檢索是當(dāng)今檢索理論中最成熟的理論之一,也是構(gòu)造檢索表達(dá)式最基本、最簡單的匹配模式。布爾邏輯檢索是通過布爾邏輯算符來實(shí)現(xiàn)的,這些算符能把具有簡單概念的檢索詞(或檢索項(xiàng))組配成為一個(gè)具有復(fù)雜概念的檢索式,用以表達(dá)用戶的檢索需求。布爾邏輯算符有三種:邏輯或(OR)、邏輯與(AND)和邏輯非(NOT),這三種算符表達(dá)不同的邏輯思想。用布爾邏輯進(jìn)行檢索,就是用OR、AND、NOT三種邏輯算符在數(shù)據(jù)庫中對相關(guān)文獻(xiàn)的定性篩選,這是最基本、最常用的一種檢索技術(shù)。B布爾邏輯檢索技術(shù)邏輯或(OR):擴(kuò)大檢索范圍,有利于提高查全率。邏輯與(AND):縮小檢索范圍,有利于提高查準(zhǔn)率。邏輯非(NOT):縮小檢索范圍,有利于提高查準(zhǔn)率。布爾邏輯算符的運(yùn)算次序:(1)優(yōu)先順序:NOT、AND、OR(1)自然順序使用布爾邏輯算符注意的問題:(1)邏輯或(1)邏輯非ABAABA+BA*BAB2.截詞檢索技術(shù)(1)截詞方式:按截?cái)嗟奈恢梅譃楹蠼財(cái)?、前截?cái)?、中截?cái)?;按截?cái)嗟淖址麛?shù)量分為有限截?cái)嗪蜔o限截?cái)唷#?)截?cái)喾枺?(ORBIT)、$(BRS)、?(DIALOG)截詞檢索的邏輯含義:physic*physic+physical+physician+physicist+physics(3)后截?cái)啵菏乔胺揭恢碌臋z索。詞的單復(fù)數(shù)年代作者同根詞(4)前截?cái)啵菏呛蠓揭恢碌臋z索。(5)中截?cái)啵河址Q內(nèi)嵌字符截?cái)唷⑵帘?、通用字符法。?)優(yōu)點(diǎn):可以擴(kuò)大檢索范圍,提高查全率;減少檢索詞的輸入量,簡化檢索步驟。3.限制檢索技術(shù)在檢索系統(tǒng)中,用來縮小或約束檢索結(jié)果的方法,稱之為限制檢索。限制檢索方式:利用前后綴符進(jìn)行的字段檢索利用系統(tǒng)規(guī)定的限制符限制檢索命令進(jìn)行的限制檢索3.1字段檢索字段檢索:限定檢索詞在數(shù)據(jù)庫記錄中出現(xiàn)的字段范圍的一種檢索方式。字段的類型:主題字段又稱基本檢索字段,它表示文獻(xiàn)的內(nèi)容特征,用后綴符表示,例/TI、/DE、/ID、/AB;非主題字段又稱輔助檢索字段,表示文獻(xiàn)的外部特征,用前綴符表示,例AU=、CS=、LA=、JN=、PY=。3.2使用限制符的限制檢索在一般聯(lián)機(jī)檢索系統(tǒng)中,還提供一類限制符,使用這類符號進(jìn)行檢索,可以從文獻(xiàn)的外部特征限制檢索結(jié)果,如命中文獻(xiàn)的文種、文獻(xiàn)類型、出版時(shí)間等。限制符的作用與前綴符一樣,用法與后綴符相同。例chess/PAT。限制符可以與前后綴符同時(shí)使用。3.3使用限制檢索命令的限制檢索限制檢索還可以利用各檢索系統(tǒng)提供的限制檢索命令進(jìn)行。如DIALOG系統(tǒng)的limit和limitall兩條檢索命令。4.原文檢索技術(shù)原文檢索技術(shù)是以原始記錄中詞與詞之間的特定位置關(guān)系為檢索對象的運(yùn)算。原文檢索技術(shù)分三種情況:詞位檢索同句檢索同字段檢索4.1詞位檢索詞位檢索又稱鄰接檢索,詞位檢索常用的算符有:(W)、(nW)算符:利用(W)算符連接后的多元詞成為一個(gè)固定詞組,(W)算符的嚴(yán)密性較強(qiáng)。(N)、(nN):(X)、(nX):4。2同句檢索同句檢索要求參加檢索運(yùn)算的兩個(gè)詞必須在自然句中出現(xiàn),其先后順序不變。同句檢索的位置算符為(S)。例:(BASICORCOBOLORPASCAL)(S)(PROGRAM*ORCOMPIL*)

上述檢索式等價(jià)于以下六個(gè)同句檢索式:BASIC(S)PROGRAM*BASIC(S)COMPIL*COBOL(S)PROGRAM*COBOL(S)COMPIL*PASCAL(S)PROGRAM*PASCAL(S)COMPIL*滿足以上六種情況之一的,即為命中文獻(xiàn)。4。3同字段檢索同字段檢索算符(F)、(L)。F是Field的縮寫,它表示此算符兩側(cè)的檢索詞必須同時(shí)出現(xiàn)在數(shù)據(jù)庫記錄的同一字段中,次序可變,字段的類型可用后綴符限定。L是Link的縮寫,它要求檢索詞同在敘詞字段中出現(xiàn),且具有詞表規(guī)定的等級關(guān)系。所以該算符只適用于有正式詞表,且詞表中具有從屬關(guān)系的數(shù)據(jù)庫。加權(quán)檢索加權(quán)檢索是某些檢索系統(tǒng)中提供的一種定量檢索技術(shù),作用是縮小檢索范圍、提高查準(zhǔn)率。加權(quán)是指根據(jù)檢索詞對檢索課題的重要程度,事先指定不同的權(quán)值。運(yùn)用加權(quán)檢索可以命中核心概念文獻(xiàn),例如有的檢索系統(tǒng)的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論