版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
計算機檢索基礎(chǔ)知識東北大學(xué)圖書館1一、計算機檢索的概念計算機檢索就是指人們在計算機檢索網(wǎng)絡(luò)或終端上,使用特定的檢索指令、檢索詞和檢索策略,從計算機檢索系統(tǒng)的數(shù)據(jù)庫中檢索出所需要的信息,然后再由終端設(shè)備顯示、下載和打印的過程。廣義的計算機信息檢索包括兩個過程。(1)對原始信息加工處理并存貯在各種信息載體上一是對待加工的信息進行著錄,即按一定的規(guī)則進行描述,如文獻信息的名稱、責(zé)任者、語種、提要等,以便用戶識別信息。二是對待加工的信息進行標(biāo)引,利用主題詞表、分類表等工具,標(biāo)識出文獻信息的內(nèi)容特征,形成從內(nèi)容角度查找文獻信息的檢索點。(2)信息查詢過程就是用戶對檢索需求加以分析,明確檢索范圍,弄清主題概念,然后用系統(tǒng)語言或自然語言表示主題概念,形成檢索標(biāo)識及檢索策略,輸入計算機進行查找。這個過程實際上是計算機自動將用戶的檢索表達與數(shù)據(jù)庫中信息標(biāo)識進行比較匹配的過程。234567二、計算機信息檢索的分類1、按內(nèi)容和功能劃分
參考型數(shù)據(jù)庫以文檔的形式組織起來,提供文獻的題錄、文摘等書目信息。如:OCLC、CSA、EI全文型數(shù)據(jù)庫存儲文獻全文或其中的主要部分的源數(shù)據(jù)庫。KLUWER、ACM、中國學(xué)術(shù)期刊網(wǎng)事實型數(shù)據(jù)庫供查詢某一客體的基本事實或簡況,包括名錄、傳記等數(shù)據(jù)庫數(shù)值型數(shù)據(jù)庫提供各類數(shù)值型數(shù)據(jù)圖象數(shù)據(jù)庫以圖形、圖象為記錄單位82.根據(jù)檢索方式分:
(1)脫機檢索(2)聯(lián)機檢索(3)國際聯(lián)機檢索(4)網(wǎng)絡(luò)檢索91、脫機檢索是六十年代發(fā)展起來的批次檢索,用戶不與檢索系統(tǒng)發(fā)生直接聯(lián)系,只需把檢索要求送往檢索中心,由檢索人員在計算機主機旁進行文獻檢索的一種方式。優(yōu)點:價格便宜,無網(wǎng)絡(luò)通訊費,檢索費用由用戶平攤,隨機存儲。缺點:一次機會檢索,檢索結(jié)果延誤,委托性檢索。102.聯(lián)機檢索聯(lián)機檢索是用戶利用終端設(shè)備,通過通信網(wǎng)絡(luò)或通信線路與檢索系統(tǒng)聯(lián)機,進行“人機對話”,從檢索中心的數(shù)據(jù)庫查找所需要的文獻信息過程。特點:檢索的速度快,檢索結(jié)果可以得到及時修改。缺點:檢索費用高。113、國際聯(lián)機檢索該系統(tǒng)是70年代出現(xiàn)的一門現(xiàn)代化情報檢索手段,目前已發(fā)展到相當(dāng)高的水平,計算機聯(lián)機網(wǎng)絡(luò)和檢索終端已遍及世界所有主要國家和地區(qū)。特點:(1)可以實現(xiàn)資源共享;(2)檢索速度快;(3)信息資源專業(yè)化;(4)查全率和查準(zhǔn)率較高。12.OCLC:聯(lián)機計算機圖書館中心,是世界上最大的為讀者提供文獻信息機構(gòu)。有60個數(shù)據(jù)庫,提供會議錄、工業(yè)通告、圖書評論等信息。DIALOG有900多個數(shù)據(jù)庫,其中廣泛使用的有600多個,內(nèi)容涉及多個學(xué)科領(lǐng)域,文獻存儲量超過3億篇。134、網(wǎng)絡(luò)檢索NFSnet(美國國家科學(xué)基金會網(wǎng))于1990年徹底取代了美國國防部的計算機實驗網(wǎng)ARPANET而成為internet的主干網(wǎng),標(biāo)志互聯(lián)網(wǎng)時代的真正到來。進入互聯(lián)網(wǎng)時代,不但計算機及軟件技術(shù)、數(shù)字化技術(shù)、信息存貯技術(shù)、衛(wèi)星通信和網(wǎng)絡(luò)通信技術(shù)有了驚人的發(fā)展,而且超文本技術(shù)、WWW技術(shù)、網(wǎng)絡(luò)瀏覽等技術(shù)為信息的存貯、傳播、檢索提供了極大的便利。各類文獻信息數(shù)據(jù)庫紛紛進入通信網(wǎng)絡(luò),眾多的局域網(wǎng)、城域網(wǎng)、廣域網(wǎng)通過萬維網(wǎng)互聯(lián),網(wǎng)絡(luò)上的任何一個終端都可聯(lián)機檢索所有數(shù)據(jù)庫的數(shù)據(jù),使信息資源共享得以實現(xiàn)。14這個階段文獻信息數(shù)據(jù)庫不論從種類還是規(guī)模上都遠(yuǎn)遠(yuǎn)超過了以往各個階段,全文數(shù)據(jù)庫、多媒體數(shù)據(jù)庫更是其中的佼佼者;文獻信息檢索不再是單位內(nèi)部聯(lián)機檢索,價格昂貴的國際聯(lián)機檢索,而是通過各個接入網(wǎng)、交換網(wǎng)檢索互聯(lián)網(wǎng)各結(jié)點上的服務(wù)器的各類信息。15三、計算機信息檢索的服務(wù)方式計算機檢索系統(tǒng)按其服務(wù)功能可分為回溯檢索、定題檢索、人機對話和聯(lián)機訂購等服務(wù)方式。1、回溯檢索(RetrospectiveSearching,RS)回溯檢索服務(wù)是指追溯查找過去的信息,幫助信息用戶查找過去幾年甚至幾十年的文獻信息,使用戶一次檢索就可以全面了解某一課題在某一段時間中的發(fā)展情況?;厮輽z索服務(wù)適合申請專利、科研課題立項、科研成果鑒定時的查新,以及撰寫綜述性論文和編寫教材時信息的收集等。162、定題檢索(SelectiveDisseminationofInformation,SDI)定題檢索服務(wù)是根據(jù)用戶檢索課題的內(nèi)容,一次性輸入事先確定好的檢索提問式保存在檢索系統(tǒng)中,檢索系統(tǒng)根據(jù)數(shù)據(jù)庫更新周期,定期地對保存的檢索提問式進行檢索,將檢索出的最新文獻信息提供給用戶。定題檢索服務(wù)對于長期追蹤某一領(lǐng)域的新穎信息很適合。3、人機對話檢索這是用戶以交互方式直接訪問系統(tǒng)及數(shù)據(jù)庫、在線實時進行的檢索。用戶一旦輸入檢索提問,計算機檢索系統(tǒng)就可立即執(zhí)行,并在用戶終端顯示屏上輸出檢索結(jié)果。174、聯(lián)機訂購用戶通過聯(lián)機檢索得到的結(jié)果一般都是二次文獻,如果需要一次文獻,可以通過終端聯(lián)機訂購原始文獻的復(fù)印件或原文。現(xiàn)在多數(shù)大型檢索系統(tǒng)都提供這項服務(wù)。如:OCLC1819五、計算機檢索表達式
檢索表達式,是計算機檢索中用來表達用戶提問的一種邏輯運算式。它由檢索詞和各種布爾邏輯算符、位置算符、截詞符、限制符等系統(tǒng)允許使用的各種符號組合而成。1、布爾邏輯算符布爾邏輯算符的作用是把檢索詞連接起來,構(gòu)成一個檢索式的基本框架。常用的有3種。(1)邏輯與:用AND或*表示用于連接概念交叉和限定關(guān)系的檢索詞,以縮小檢索范圍,有利于提高查準(zhǔn)率。20例:airpollution
ANDcontrol
21(2)邏輯或:用OR或+表示用于連接并列關(guān)系的檢索詞,以擴大檢索范圍,防止漏檢,有利于提高查全率。例如:要檢索“太陽”方面的信息
SolarORsun22(3)邏輯非:用NOT或—表示,但在檢索詞為英文時建議使用NOT,以避免與詞間的分隔符“—”混淆。用于連接排除關(guān)系的檢索詞,即排除不需要的和影響檢索結(jié)果的概念,以提高查準(zhǔn)率。例如:energyNOTnuclear23()用布爾邏輯算符組配檢索詞構(gòu)成的檢索表達式,邏輯算符AND、OR、NOT的運算次序,在有括號的情況下,括號內(nèi)的邏輯運算先執(zhí)行,在無括號的情況下,不同的檢索系統(tǒng)中有不同的規(guī)定。用戶需要事先了解檢索系統(tǒng)的規(guī)定,避免邏輯運算次序處理不當(dāng)而造成錯誤的檢索結(jié)果,因為對同一個布爾邏輯提問式,不同的運算次序會有不同的檢索結(jié)果。Anot(BORC)AnotBORCABC242、位置算符位置邏輯符的作用是對復(fù)合檢索詞進行加工修飾,限定詞與詞之間位置關(guān)系,可彌補布爾邏輯算符只是規(guī)定檢索詞的范圍,使檢索結(jié)果的查準(zhǔn)率提高。位置算符常用的有6種。(1)(W)算符——含義為“with”表示兩個檢索詞緊挨著,詞序不能顛倒,中間不得插入其他詞、字母或代碼,但允許有空格或標(biāo)點符號,也可用()表示例如:communication(W)satellite
或“communication()satellite”系統(tǒng)將只檢索含有communicationsatellite詞組的記錄。25(2)(nW)算符——含義為“Word”它允許兩詞間插入最多為n個其他詞,包括實詞和系統(tǒng)禁用詞,詞序不可顛倒。如:“COMMUNICATION(2W)SATELLITE”時,系統(tǒng)將只檢索含有communicationsatellite,communicationthoughsatellite,communicationinthesatellite26(3)(N)算符——含義為“Near”
表示兩個檢索詞必須緊密相連,除開空格和標(biāo)點符號外,不得插入其他詞或字母,兩詞的詞序可以顛倒。(4)(nN)算符——是(N)算符的變形不同之處為允許兩詞間插入最多為n個其他詞包括實詞和系統(tǒng)禁用詞,且兩詞的詞序可以顛倒27舉例說明檢索策略為:“COTTON(2N)PROCESSING”時,凡含有cottonprocessing,processingofcotton和processingofEgyptiancotton的文獻記錄都算命中。28(5)(F)算符——含義為“Field”這個算符表示其兩側(cè)的檢索詞必須在同一字段(文獻著錄的基本單元,反映文獻外部特征或內(nèi)容特征的某一個項目,如同在題目字段或文摘字段)中出現(xiàn),詞序不限,中間可插任意檢索詞項。如:檢索策略:POLLUTION(F)CONTROL可查出controlandmanagementofindustrialpollution一檢索詞在同一題目字段中。29(6)(S)算符——含義為“Sentence”這個算符表示其兩側(cè)的檢索詞必須在同一句子(子字段)中出現(xiàn),兩詞的詞序可以顛倒。如:檢索策略:COMMUNICATION(S)SATELLITE將檢出含有communicationsatellite和satellitecommunication詞組的記錄。303、截詞算符它是使計算機保留檢索詞的相同詞干部分,允許檢索詞可有一定范圍的變化。截詞符一般有“?”、“*”(不同數(shù)據(jù)庫有不同的截詞符)(1)按截斷的字符數(shù)劃分:
有限截詞——截詞符“?”代表一個字符。如:base?可檢索出含有based,bases等詞的文獻。無限截詞——截詞符“*”代表任意個字符。如:adsor*可檢索出含有adsorb,adsorption,adsorbate等詞的文獻。31(2)按截斷的字符位置劃分:前方一致:允許詞尾有變化。如“Textile?”可同時檢出含有Textile和Textiles的文獻。后方一致:允許詞頭有變化。如“*polymer”可同時檢出含有有Homopolymer,Copolymer等詞的文獻。中間一致:詞頭、詞尾都可變化。如:“*Wave*”可檢出含有wave,waves,wavelet,microwave,wavelength等詞的文獻。中間屏蔽:允許中間的某些字母有變化。如:“Fib??s”相當(dāng)于查出含有Fibers和Fibres的文獻32使用截詞應(yīng)注意的幾個問題一是截詞符要緊接在詞干后面,截詞符和詞干之間不能有空格。二是避免將檢索詞的詞干截得過短,一般應(yīng)在三個字母以上。三是截詞應(yīng)該使用得合理。一般不可能出現(xiàn)詞尾變化的單詞,例如management,protection等,其后不必再使用截詞。四是從希望出現(xiàn)的單詞中取盡可能多的公共字母作為詞干,以提高查準(zhǔn)率,比如在對manage,managing,managed,management和manager作截詞運算時,詞干應(yīng)使用“manag*”,而不應(yīng)使用“man*”。
334、限制檢索限制檢索是通過限制檢索范圍,達到優(yōu)化檢索結(jié)果的方法。限制檢索的方式有多種,例如:進行字段檢索、使用限制符、采用限制檢索命令等。1)字段檢索它是把檢索詞限定在某個/些字段中,如果記錄的相應(yīng)字段中含有輸入的檢索詞則為命中記錄,否則不中。例如:查找微型機和個人計算機方面的文章。要求“微型機”一詞出現(xiàn)在敘詞字段、標(biāo)題字段或文摘字段中,“個人計算機”一詞出現(xiàn)在標(biāo)題字段或文摘字段中,檢索式可寫為:microcomputer?/de,ti,abORpersonalcomputer/ti,ab34又如:查找wang
wei寫的文章,可以輸入檢索式:au=wang
wei(有時檢索詞須放在雙引號內(nèi))/TI—篇名;如:Scontrol(w)pollution/ti/DE—敘詞;如:Saluminumcompounds/de/ID—標(biāo)引詞;如:Ssoap/id/AB—文摘詞;如:Scomputer/abAU——作者字段CS——著者單位字段如:CS=JIAOTONGUNIVERSITY352)使用限制符用表示語種、文獻類型、出版國家、出版年代等的字段標(biāo)識符來限制檢索范圍。例如:要查找1999年出版的英文或法文的微型機或個人計算機方面的期刊,則檢索式為(microcomputer?ORpersonalcomputer)ANDPY=1999AND(LA=ENORLA=FR)ANDDT=Serial363)、使用范圍符號如:Lessthan、Greaterthan、Fromto等,例:查找1989~1999年的文獻,可表示為:PY=1989:1999或者PY=1989toPY=1999例:查找2000年以來的計算機方面的文獻,可表示為computer?ANDGreaterthan199937檢索詞的擴展方法1.基于同物異名的名稱擴展法(1)尋找同一事物的學(xué)名和俗名、商品名和代號等如:貿(mào)易與商業(yè),便攜式錄音機和walkman,涉外與對外,刊物與雜志,(2)注意詞的全稱、簡稱及縮寫字母中國專利庫期刊庫乙型病毒性肝炎362270
乙型肝炎81536545
乙肝87021444
脫氧核糖核酸2232241DNA7831100162
DNA1268100162
38(3)注意外來詞的譯寫變化化學(xué)品:
danning——單寧,丹寧
formalin——福爾馬林,福馬林,甲醛
aspirin——阿斯匹林,阿司匹林,乙酰水楊酸地名:
Texas——得克薩斯,德克薩斯
California——加利福尼亞,加里福尼亞
SanFrancisco——圣弗朗西斯科,三藩,舊金山波爾茲曼64歐幾里德329
玻耳茲曼120歐幾里得231
玻爾茲曼238歐基里德5
波耳茲曼12歐幾理德3
波爾茨曼2歐氏幾何153
Boltzmann755
Euclid
400(注意上例中用英文名檢出的中文文獻最多!)
39(4)尋找同一事物名稱的近義詞和反義詞如:教學(xué)與培訓(xùn)、教育,研究與分析、比較,翻譯與直譯、意譯,美術(shù)與藝術(shù),英漢與漢英,檢測
testexaminecheck(5)如果是英語,尋找同一事物名詞的單復(fù)數(shù)、不同詞性、英美語的不同形式如:cheque與check,colour和color,stock和share等
402.基于內(nèi)容分析的概念擴展法(1)上位概念擴展法,分析檢索對象的學(xué)科歸屬。如:英語與外語,美術(shù)與藝術(shù),上海圖書館與公共圖書館,詞法與語法、專利與知識產(chǎn)權(quán)、繼承法與民法、唐詩與古詩、詞法與語法等(2)下位概念擴展法,又稱概念分析的樹形展開法。如:
應(yīng)用文電阻焊書信
函電
公文點焊縫焊凸焊
41(3)隱含概念擴展法如:“投資管理”的顯見主題是“投資管理”,隱含主題還有“投資法規(guī)”、“投資法律”。
42檢索表達式“吸煙與心臟病的關(guān)系”(smok*ORtobaccoORcigarette)
AND
(heartdiseaseORhearttroubleORheartattack)43六、檢索途徑組配1、高級檢索高級檢索是可以同時選擇多個不同檢索途徑、輸入不同檢索條件、兩個檢索條件的關(guān)系可用布爾邏輯算符表示的一種組合檢索442、二次檢索在簡單檢索或高級檢索基礎(chǔ)上開展的、選用新的檢索詞旨在進一步縮小檢索范圍進行逐次逼近的檢索,稱為二次檢索。二次檢索可以多次使用。45七、計算機信息檢索的步驟1分析課題:(1)一般課題概念分析方法;(2)關(guān)于隱含概念的分析;(3)核心概念的選取。2選擇數(shù)據(jù)庫原則
(1)按照課題的檢索要求和目的,選擇收錄文獻種類,專業(yè)覆蓋面,年代跨度對口的數(shù)據(jù)庫。(2)當(dāng)需要查找最新文獻信息時,選擇數(shù)據(jù)更新周期短的數(shù)據(jù)庫。(3)當(dāng)還需要獲取原文時,選取原文獲取較容易的數(shù)據(jù)庫。(4)要選好數(shù)據(jù)庫,就要弄清所選數(shù)據(jù)庫的標(biāo)引特征,不同檢索特點等。463、確定檢索途徑和檢索詞檢索途徑主要根據(jù)分析課題時確定的已知條件,以及所選定的檢索工具能夠提供的檢索途徑來決定。常用的檢索途徑有著者、分類、主題、文獻題名、文獻號、代碼、引文、文獻類型、出版時間、語種等。檢索詞是表達文獻信息需求的基本元素,是用戶輸入的檢索語詞,也是在計算機檢索系統(tǒng)中進行匹配的基本單元。檢索詞的確定要注意以下問題:優(yōu)先選用主題詞,使用該數(shù)據(jù)庫詞表中的主題詞檢索,可以獲得最佳的檢索效果;選用數(shù)據(jù)庫規(guī)定的代碼;盡量選用
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廣東外語外貿(mào)大學(xué)《企業(yè)生產(chǎn)物流》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東松山職業(yè)技術(shù)學(xué)院《項目管理與案例分析》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東水利電力職業(yè)技術(shù)學(xué)院《書法基礎(chǔ)》2023-2024學(xué)年第一學(xué)期期末試卷
- 七年級上冊《5.2.3 解一元一次方程 去括號》課件與作業(yè)
- 廣東南華工商職業(yè)學(xué)院《花式跳繩》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東梅州職業(yè)技術(shù)學(xué)院《創(chuàng)業(yè)經(jīng)營與廣告公司管理》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東嶺南職業(yè)技術(shù)學(xué)院《文獻檢索及研究方法》2023-2024學(xué)年第一學(xué)期期末試卷
- 八年級上冊英語課本
- 從起跑線出發(fā):小學(xué)一年級班主任的教學(xué)策略分享
- 【KS5u原創(chuàng)】2021年理綜生物試題4(解析版)
- 重癥感染和感染性休克治療新進展
- 涉警網(wǎng)絡(luò)負(fù)面輿情應(yīng)對與處置策略
- 5人小品《聚寶盆銀行》臺詞
- 小學(xué)道德與法治課活動設(shè)計方案
- 家電以舊換新風(fēng)險識別與應(yīng)對措施
- 混凝土結(jié)構(gòu)設(shè)計原理智慧樹知到期末考試答案2024年
- 全國兒童預(yù)防接種知識講座
- GMP理念在制藥工程項目中的應(yīng)用
- 灌區(qū)信息化方案
- 提高感染性休克集束化治療完成率工作方案
- 突發(fā)事件緊急醫(yī)學(xué)救援中的煙花爆竹傷處理培訓(xùn)
評論
0/150
提交評論