信息資源檢索教程_第1頁
信息資源檢索教程_第2頁
信息資源檢索教程_第3頁
信息資源檢索教程_第4頁
信息資源檢索教程_第5頁
已閱讀5頁,還剩48頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

信息資源檢索教程第1頁,共53頁,2023年,2月20日,星期日第四章計(jì)算機(jī)檢索技術(shù)計(jì)算機(jī)檢索的實(shí)質(zhì):匹配運(yùn)算計(jì)算機(jī)檢索技術(shù)檢索提問檢索表達(dá)式掃描、匹配識(shí)別數(shù)據(jù)庫檢索詞的組配技術(shù)計(jì)算機(jī)檢索技術(shù)檢索表達(dá)式的構(gòu)成規(guī)則檢索詞:主題詞、關(guān)鍵詞、名稱、分類號(hào)分子式等。檢索表達(dá)式:運(yùn)用各種運(yùn)算符,把檢索詞連接組配。第2頁,共53頁,2023年,2月20日,星期日第四章計(jì)算機(jī)檢索技術(shù)布爾邏輯位置邏輯截詞字段限制加權(quán)計(jì)算機(jī)檢索技術(shù)其他4.14.24.34.44.64.5第3頁,共53頁,2023年,2月20日,星期日4.1布爾邏輯檢索技術(shù)布爾邏輯檢索技術(shù)就是利用布爾邏輯算符進(jìn)行檢索項(xiàng)的邏輯組配,用以表達(dá)檢索者的提問概念。布爾邏輯算符指規(guī)定檢索詞之間相互關(guān)系的運(yùn)算符號(hào),在檢索表達(dá)式中起著邏輯組配的作用復(fù)雜概念的檢索式組配檢索詞檢索詞檢索詞簡(jiǎn)單第4頁,共53頁,2023年,2月20日,星期日4.1布爾邏輯檢索技術(shù)常用的布爾邏輯運(yùn)算符:

邏輯“與(AND)”

邏輯“或(OR)”

邏輯“非(NOT)”運(yùn)算順序第5頁,共53頁,2023年,2月20日,星期日4.1.1

邏輯“與”運(yùn)算符:AND或*用于交叉概念或限定關(guān)系的組配,實(shí)現(xiàn)檢索詞概念范圍的交集。

表達(dá)式:AandB或A*BBAnd兩側(cè)的檢索詞必須同時(shí)出現(xiàn)在檢索字段中檢出同時(shí)含有檢索詞A和檢索詞B的記錄A第6頁,共53頁,2023年,2月20日,星期日4.1.1

邏輯“與”作用縮小檢索范圍,提高查準(zhǔn)率。

舉例檢索“人口控制”或者“控制人口”方面的文獻(xiàn)信息。人口and控制返回第7頁,共53頁,2023年,2月20日,星期日4.1.2

邏輯“或”運(yùn)算符:OR或+

用于檢索詞并列關(guān)系(同義詞、近義詞)的組配,實(shí)現(xiàn)檢索詞概念范圍的并集。

表達(dá)式:AorB或A+BB在文獻(xiàn)記錄中只要含有檢索詞A和檢索詞B中的任何一個(gè)即算命中檢索出的記錄含有檢索詞A或者檢索詞BA第8頁,共53頁,2023年,2月20日,星期日4.1.2

邏輯“或”作用擴(kuò)大檢索范圍,防止漏檢,提高查全率。

舉例檢索“計(jì)算機(jī)”方面的文獻(xiàn)信息。計(jì)算機(jī)or電腦使用的注意事項(xiàng)如果檢索詞涉及表達(dá)整體概念,要針對(duì)具體情況分別列出每個(gè)表達(dá)部分概念的檢索詞,否則將出現(xiàn)漏檢。返回第9頁,共53頁,2023年,2月20日,星期日4.1.3

邏輯“非”運(yùn)算符:NOT或-

一種排斥關(guān)系的組配,用來從原來的檢索范圍中排除不需要的概念。

表達(dá)式:AnotB或A-BB適用于排除含有某個(gè)指定檢索詞的記錄A檢索出的記錄含有檢索詞A,但同時(shí)不含檢索詞B第10頁,共53頁,2023年,2月20日,星期日4.1.3

邏輯“非”作用縮小檢索范圍,增強(qiáng)檢索的準(zhǔn)確性。但使用不當(dāng),易排除有用文獻(xiàn)信息,從而導(dǎo)致漏檢

舉例檢索有關(guān)能源方面的文獻(xiàn)信息,但不包括核能。

energynotnuclear使用的注意事項(xiàng)兩個(gè)關(guān)系緊密的檢索詞不宜用not返回第11頁,共53頁,2023年,2月20日,星期日4.1布爾邏輯檢索技術(shù)優(yōu)先級(jí)高優(yōu)先級(jí)低NOTANDOR布爾邏輯運(yùn)算符的運(yùn)算順序返回第12頁,共53頁,2023年,2月20日,星期日4.2位置邏輯檢索技術(shù)位置邏輯檢索利用位置邏輯算符限定檢索詞之間的位置,或指定檢索詞在記錄中某一特定位置進(jìn)行檢索。位置算符又稱鄰接運(yùn)算符。位置邏輯檢索的作用表達(dá)各個(gè)檢索詞之間的順序與相對(duì)位置關(guān)系。與布爾邏輯檢索的區(qū)別使用布爾邏輯檢索時(shí),計(jì)算機(jī)只判斷參加運(yùn)算的檢索詞在數(shù)據(jù)庫記錄中出現(xiàn)與否,不能確定檢索詞之間的相對(duì)位置關(guān)系。而通過與位置算符配合使用可以減少檢索誤差。第13頁,共53頁,2023年,2月20日,星期日4.2位置邏輯檢索技術(shù)Dialog系統(tǒng)中的幾種位置算符同詞位檢索(W)——(With/Word)、(nW)

(N)——(NEAR)、(nN)同字段檢索(F)——(Field)(L)——(Link)其他位置算符(S)——(Subfield)(C)——(Citation)第14頁,共53頁,2023年,2月20日,星期日4.2.1同詞位檢索允許在連接的兩個(gè)詞之間最多夾入n個(gè)其他單元詞,只強(qiáng)調(diào)插入單元詞個(gè)數(shù)沒限定插入單元詞的具體范圍,同時(shí)詞序不能顛倒此算符兩側(cè)的檢索詞必須按輸入時(shí)的前后順序排列,而且所連接的詞之間除可以有一個(gè)空格或一個(gè)標(biāo)點(diǎn)符號(hào)或一個(gè)鏈接號(hào)外不得夾有任何其他單詞或字母(W)/()(nW)舉例舉例嚴(yán)密性強(qiáng)嚴(yán)密性差第15頁,共53頁,2023年,2月20日,星期日4.2.1同詞位檢索允許兩個(gè)檢索詞之間最多可以插入n個(gè)單詞,且這兩個(gè)檢索詞的詞序任意此算符兩側(cè)的檢索詞必須緊密相連,所連接的詞間不允許插入任何其他單詞或字母,但詞序可以顛倒(N)(nN)舉例舉例第16頁,共53頁,2023年,2月20日,星期日(N)舉例檢索式

chemistry(N)physics命中含有chemistryphysics或physicschemistry的文獻(xiàn)返回第17頁,共53頁,2023年,2月20日,星期日檢索式

economic(2N)recovery(nN)舉例命中含有economicrecovery或recoveryoftheeconomic的文獻(xiàn)返回第18頁,共53頁,2023年,2月20日,星期日(W)/()舉例檢索式

American()Literature命中有關(guān)AmericanLiterature或American,Literature的文獻(xiàn)返回第19頁,共53頁,2023年,2月20日,星期日(nW)舉例檢索式

knowledge(1W)economy命中有關(guān)knowledgeeconomy或knowledge-basedeconomy的文獻(xiàn)返回第20頁,共53頁,2023年,2月20日,星期日舉例舉例4.2.2同字段檢索(L)(F)表示此算符兩側(cè)的檢索詞必須同時(shí)出現(xiàn)在同一字段內(nèi)。如:篇名字段、文摘字段、敘詞字段等,但兩詞的詞序中間插入的次數(shù)不限。表示兩個(gè)檢索詞之間存在從屬關(guān)系或限制關(guān)系。如果其中一個(gè)為一級(jí)主題詞,另一個(gè)就為二級(jí)主題詞。第21頁,共53頁,2023年,2月20日,星期日(L)舉例檢索式

control(L)stability命中標(biāo)題含有control和stability兩個(gè)檢索詞的文獻(xiàn)記錄。返回第22頁,共53頁,2023年,2月20日,星期日(F)舉例檢索式

economic(F)knowledge命中標(biāo)題為“theEconomicImpactofKnowledge-Based”的文獻(xiàn)記錄。返回原因:算符兩側(cè)的檢索詞在同一標(biāo)題字段中第23頁,共53頁,2023年,2月20日,星期日4.2.3其他位置邏輯檢索(S)——(Subfield)

表示在此算副輛車的檢索詞必須出現(xiàn)在同一個(gè)子字段中,順序不變,中間可插入詞數(shù)不限。舉例

(basicorcobolorpascal)(S)(program*orcompil*)Basic(S)program*basic(S)compil*Cobol(S)program*cobol(S)compil*Pascal(S)program*pascal(S)compil*第24頁,共53頁,2023年,2月20日,星期日4.2.3其他位置邏輯檢索(C)——(Citation)

表示兩側(cè)的檢索詞只能出現(xiàn)在同一條記錄中,且對(duì)它們的相對(duì)位置或次序沒有任何限制,作用和布爾算符and完全相同第25頁,共53頁,2023年,2月20日,星期日位置邏輯算符的優(yōu)先順序C(S)(N)(W)(F)4.2位置邏輯檢索技術(shù)嚴(yán)謹(jǐn)寬松返回第26頁,共53頁,2023年,2月20日,星期日4.3截詞檢索技術(shù)實(shí)質(zhì)截詞檢索就是用截詞符號(hào)將檢索詞截?cái)啵脵z索詞的片段進(jìn)行匹配運(yùn)算。注意在截?cái)鄷r(shí),截?cái)嗟脑~干不能太短,詞干一般應(yīng)在3個(gè)字符以上,以免增加檢索時(shí)間,產(chǎn)生誤檢。第27頁,共53頁,2023年,2月20日,星期日4.3截詞檢索技術(shù)截詞形式按截詞的字符數(shù)量

有限截?cái)?、無限截?cái)喟唇卦~的位置

右截?cái)?、左截?cái)?、中間截?cái)嗟?8頁,共53頁,2023年,2月20日,星期日4.3.1按截詞數(shù)量截?cái)嘤邢藿財(cái)嘀赶薅ń厝ビ邢迋€(gè)字符。截?cái)喾?hào)

??——截?cái)?個(gè)字符

???——截?cái)?個(gè)字符依此類推。舉例輸入:product??

結(jié)果:含有product、products的記錄第29頁,共53頁,2023年,2月20日,星期日4.3.1按截詞數(shù)量截?cái)酂o限截?cái)鄼z索詞詞干可變化兩個(gè)以上字符時(shí),連續(xù)使用若干個(gè)“?”或“*”代替變化字符。用法

可同時(shí)查找含有該詞干的所有文獻(xiàn)記錄,亦可用于年代的查找。第30頁,共53頁,2023年,2月20日,星期日4.3.2其他截?cái)喾绞?.把截詞符號(hào)置放在一個(gè)檢索詞的中間;2.中截?cái)嗖辉试S有限截?cái)?.將截詞符號(hào)放在一個(gè)字符串左方,表示其左的有限或無限個(gè)字符不影響該字符串的檢索;2.實(shí)質(zhì):后方一致檢索1.最常用的截詞檢索技術(shù);2.放在字符串右方,表示其右有限或無限個(gè)字符不影響該字符串的檢索;3.實(shí)質(zhì):后截?cái)嗍乔胺揭恢聶z索后截?cái)嗲敖財(cái)嘀薪財(cái)嗯e例舉例舉例返回第31頁,共53頁,2023年,2月20日,星期日后截?cái)嗯e例輸入:

computer*檢索結(jié)果

computeracy

computerise

computerization

computers隱含OR運(yùn)算特性第32頁,共53頁,2023年,2月20日,星期日后截?cái)嘧⒁馐马?xiàng)后截?cái)嘀饕褂糜谌缦聨追N情況:檢索詞的單復(fù)數(shù)的描述;如:book?

同根詞的表達(dá);

如:chemi*可以檢索出chemical、

chemistry、chemist等同根詞年代的表達(dá);

如:20??(21世紀(jì)),199?(20世紀(jì)90年代)作者

如:Moyer*可以檢索出所有姓Moyer的作者返回第33頁,共53頁,2023年,2月20日,星期日前截?cái)嗯e例輸入:*computer檢索結(jié)果

microcomputer

minicomputer返回第34頁,共53頁,2023年,2月20日,星期日中截?cái)嗯e例輸入:

organi?ation檢索結(jié)果

organization

organisation中截?cái)嘀饕褂糜谌缦聨追N情況:檢索詞的拼寫方式存在美式、英式之分;檢索詞在某個(gè)元音位置出現(xiàn)的單復(fù)數(shù)不同;

如:man與men作用

擴(kuò)大檢索范圍,提高檢全率,減少檢索詞的輸入量返回第35頁,共53頁,2023年,2月20日,星期日4.4字段限制檢索技術(shù)在檢索系統(tǒng)中,通常有一些縮小或約束檢索結(jié)果的方法,稱為限制檢索。限制檢索的方式字段限制檢索1使用限制符檢索2第36頁,共53頁,2023年,2月20日,星期日4.4.1字段限制檢索特點(diǎn)及作用

使檢索出的文獻(xiàn)信息達(dá)到一定的專指度。將檢索詞限制在記錄的某個(gè)特定字段內(nèi)檢索,不但可以減輕機(jī)器負(fù)擔(dān),提高運(yùn)算速度,還可以使檢索結(jié)果更準(zhǔn)確。用法

將需要檢索的內(nèi)容限制在相關(guān)的字段內(nèi)。

如:作者姓名作者字段

關(guān)鍵詞關(guān)鍵詞或題名字段第37頁,共53頁,2023年,2月20日,星期日4.4.1字段限制檢索字段種類

基本字段:表達(dá)文獻(xiàn)內(nèi)容特征的字段

輔助字段:表達(dá)文獻(xiàn)外表特征的字段字段檢索形式

1.通過菜單選擇檢索字段

2.用命令的方式輸入字段限制算符篇名字段、文摘字段、敘詞字段、分類類目等作者、機(jī)構(gòu)、文獻(xiàn)類型、語種等返回第38頁,共53頁,2023年,2月20日,星期日4.4.2使用限制符檢索Web檢索方式通常通過菜單選擇檢索字段,在聯(lián)機(jī)Web高級(jí)檢索中,還可以用表示語種、文獻(xiàn)類型、出版國(guó)家、出版年代等額字段標(biāo)識(shí)符來限制檢索范圍。在Dialog系統(tǒng)中,用專門的字符表示不同字段。第39頁,共53頁,2023年,2月20日,星期日4.4.2使用限制符檢索前綴限制字符

AU= 限查特定作者

JN= 限查特定刊名

LA= 限查特定語種

PN= 限查特定專利號(hào)

PY= 限查特定年代后綴限制符

/TI 限在題目中查

/AB 限在文摘中查

/DE 限在敘詞標(biāo)引中查

查找2004年出版的英文或法文的宏觀經(jīng)濟(jì)學(xué)方面的期刊檢索式:(macroeconomics/de,ti,ab)ANDPY=2004AND(LA=ENORFR)ANDDT=Serial舉例限制字符的使用返回第40頁,共53頁,2023年,2月20日,星期日4.5加權(quán)檢索技術(shù)與其他檢索技術(shù)的區(qū)別基本方法

1.在每個(gè)檢索詞后面給定表示重要程度的數(shù)值,稱為權(quán)值。

2.檢索時(shí),查找這些檢索詞在數(shù)據(jù)庫記錄中是否存在

3.計(jì)算存在的檢索詞的權(quán)值總和。

4.權(quán)值之和達(dá)到或超過預(yù)先給定的闕值,即為命中其他檢索技術(shù)加權(quán)檢索技術(shù)側(cè)重點(diǎn)判定檢索詞或字符串在數(shù)據(jù)庫中,與別的檢索詞或字符串是什么關(guān)系判定檢索詞或字符串在滿足檢索邏輯后對(duì)文獻(xiàn)信息命中與否的影響程度返回第41頁,共53頁,2023年,2月20日,星期日4.6其他輔助檢索技術(shù)4.6.1信息的瀏覽式檢索與鏈接技術(shù)4.6.2檢索結(jié)果的翻譯和多語種(或跨語種)

檢索技術(shù)4.6.3檢索結(jié)果的后處理技術(shù)第42頁,共53頁,2023年,2月20日,星期日4.6.1信息的瀏覽式檢索與鏈接技術(shù)用戶在計(jì)算機(jī)檢索系統(tǒng)中,“瀏覽”方式的實(shí)現(xiàn)主要得益于超文本鏈接技術(shù)的成功應(yīng)用。某種信息組織結(jié)構(gòu)(或?qū)Ш綑C(jī)制)鏈接信息系統(tǒng)預(yù)定義相關(guān)或未曾預(yù)料的有用信息訪問、探尋提供第43頁,共53頁,2023年,2月20日,星期日4.6.1信息的瀏覽式檢索與鏈接技術(shù)搜索引擎

目前,基于瀏覽式檢索的技術(shù)方法已在網(wǎng)絡(luò)搜索引擎中得到了廣泛應(yīng)用,以Yahoo為首創(chuàng)的一類網(wǎng)絡(luò)搜索引擎就是通過分類目錄導(dǎo)航機(jī)制實(shí)現(xiàn)對(duì)同絡(luò)信息的瀏覽式檢索的。此外,超文本鏈接技術(shù)在傳統(tǒng)的基于關(guān)鍵詞匹配的信息檢索系統(tǒng)中,也越來越顯現(xiàn)出重要的應(yīng)用價(jià)值。第44頁,共53頁,2023年,2月20日,星期日4.6.1信息的瀏覽式檢索與鏈接技術(shù)參考文獻(xiàn)鏈接(CitedReference)相關(guān)記錄鏈接(RelatedRecords)被引次數(shù)鏈接

(TimesCited)內(nèi)鏈接第45頁,共53頁,2023年,2月20日,星期日被引次數(shù)鏈接舉例在系統(tǒng)檢索結(jié)果列表中,該鏈接點(diǎn)首先給出該文獻(xiàn)的被引用次數(shù),單擊該鏈接點(diǎn),系統(tǒng)會(huì)進(jìn)一步顯示引用該篇文獻(xiàn)的所有其他文獻(xiàn);點(diǎn)擊第46頁,共53頁,2023年,2月20日,星期日參考文獻(xiàn)鏈接舉例該鏈接點(diǎn)不僅可以顯示該檢索結(jié)果文獻(xiàn)所使用的參考文獻(xiàn)數(shù)量,單擊它還可顯示這些參考文獻(xiàn)的具體列表;點(diǎn)擊第47頁,共53頁,2023年,2月20日,星期日相關(guān)記錄鏈接通過該鏈接點(diǎn)可以查看在不同年份中與當(dāng)前所檢索的記錄共同引用同一篇(或多篇)參考文獻(xiàn)的一組文獻(xiàn),即相關(guān)記錄,并按共同引用參考文獻(xiàn)的多少排序。

第48頁,共53頁,2023年,2月20日,星期日4.6.1信息的瀏覽式檢索與鏈接技術(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論