版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、一一 、信息檢索、信息檢索 知識介紹知識介紹 (六六)、機檢的有關(guān)知識、機檢的有關(guān)知識 常用的檢索方式常用的檢索方式 命令檢索(command search) 使用特定的操作命令來實施檢索 靈活快速地進行檢索 CS=(general (w) electric (f) Portland)菜單檢索(menu search) 方便,易掌握,稱“easy-to-use”檢索 多用于光盤檢索和web檢索 1、布爾邏輯檢索是當(dāng)今檢索理論中最成熟的理論之一,也是構(gòu)造檢索表達式最基本、最簡單的匹配模式。布爾邏輯檢索是通過布爾邏輯算符來實現(xiàn)的,這些運算符能把一些具有簡單概念的檢索詞(或檢索項)組配成為一個具有復(fù)
2、雜概念的檢索式,用以表達用戶的檢索要求。邏輯運算符有三種:與、或、非(1)、 邏輯與:一般用and或 *表示 是一種用于交叉概念和限定關(guān)系的組配它可以縮小檢索范圍,有利于提高查準(zhǔn)率。凡是用AND的檢索式,AND兩側(cè)的檢索詞必須同時出現(xiàn)在同一條記錄中,該記錄才算命中如: AU=CHENG, GENGDONG AND PY=1997-1998 Solar*Energy(2)、邏輯或:一般用or或 +表示, 少數(shù)數(shù)據(jù)庫用 | 表示 是一種用于并列關(guān)系的組配它可以擴大檢索范圍,防止漏檢,有利于提高查全率凡是用OR的檢索式,OR兩側(cè)的檢索詞只要有一個在一條記錄中出現(xiàn),該記錄就算命中如: (AU=QIU,
3、 DAHONG OR AU=QIU, D.H. OR AU=QIU, D H OR AU=QIU, DA-HONG OR AU=DAHONG, QIU) AND CS=DALIAN www + internet + network(3)、邏輯非:一般用一般用not或或-表示,表示, 少數(shù)數(shù)據(jù)庫用少數(shù)數(shù)據(jù)庫用#或或/表示表示 是一種排斥關(guān)系的組配用來從原來的檢索范圍中排除不需要的概念或影響檢索結(jié)果的概念,有利于提高查全率凡是用NOT的檢索式,NOT前面的檢索詞必須在記錄中出現(xiàn)而后面的檢索詞一定不能出現(xiàn),該記錄才算命中如: OPTICAL NOT FIBER EnergyNuclear優(yōu)先順序邏輯
4、運算符的優(yōu)先順序為NOT、AND、OR如果要改變運算順序需要用“()”如:A AND (B OR C) 邏輯“與”的缺陷邏輯“與”只要求兩個檢索詞必須同時出現(xiàn)在同一篇文獻中,而沒有限定算符兩側(cè)檢索詞之間的位置關(guān)系,有時難免造成誤檢。例如:查找“細(xì)菌對染料破壞”方面的文獻檢索詞:細(xì)菌、破壞、染料采用邏輯“與”組配:細(xì)菌 and 破壞 and 染料檢索結(jié)果:命中同時用這三個詞標(biāo)引的文獻 有“細(xì)菌對染料的破壞”方面的文獻 也會有“染料對細(xì)菌的破壞”方面的文獻 要排除后一部分的文獻,就需用位置算符限定詞與詞之間的位置關(guān)系。 2、位置運算符又稱鄰接算符(adjacent operators),適用于兩個
5、檢索詞以指定間隔距離或者指定的順序出現(xiàn)的場合。跟AND運算符類似,但比AND運算符功能更具體。比如:通過“communication AND satellite”進行檢索時,命中的文獻可能既含有“communication satellite”,又含有“satellite communication”;也可能含有“communication devices for satellite” “communication links without satellite”等等。顯然其中有些記錄與課題要求毫無關(guān)系。位置運算符可以用于改進AND運算符的這種不足之處,因此,它們可以看成是特殊功能的AND運算
6、符。按照兩個檢索詞出現(xiàn)的順序和距離,可以有多種位置運算符,而且對于同一功能的運算符,不同的檢索系統(tǒng)可能有不同的表達方式,也有的檢索系統(tǒng)不支持位置運算符,檢索之前應(yīng)該先看看數(shù)據(jù)庫的幫助信息。常用位置運算符有(w)、(n)、(s)、(f) (1). (W) (W)算符中的W含義為“With”。 詞序不許顛倒 兩詞之間不許插詞,只允許出現(xiàn)空格或連字符號(W)算符還可以使用其簡略形式()例如: CD(W)ROM 將命中 CD ROM 或 CD-ROM solar ( ) energy 檢出 solar energy (2). (nW)(nW)算符中的W 含義為“Word” 它允許兩詞中間可以插入0-n
7、個其他詞,包括系統(tǒng)禁用詞 詞序不變 例如:communication (2W) satellite將檢索出含有communication satellite、communication via satellite、communication on the satellite的記錄。 (3). (N) (N)算符中的N含義為“Near” 詞序可以顛倒 兩詞之間不許插詞,只允許出現(xiàn)空格或連字符號例: cross (N) section 可檢出 cross section 和 section cross (4). (nN)(nN)是(N)算符的變形 檢索詞之間允許插入0n個詞,包括系統(tǒng)禁用詞 詞序可
8、以顛倒例如: cotton (2N) processing可檢出cotton processing、processing of cotton、processing of Egyptian cotton (5). (S) (S)算符中的S含義為“Sentence” 詞序可以顛倒 兩詞必須出現(xiàn)在同一句子(子字段)中. (6). (F) (F)算符中的F含義為“Field” 兩詞必須出現(xiàn)在同一字段中 詞序不限例如:pollution (F) control可檢出control and management of industrial pollution (F)與and的區(qū)別(F)鄰近算符指定兩個檢索
9、詞在同一個字段中出現(xiàn),而AND布爾邏輯組配中的兩個檢索詞會出現(xiàn)在不同的字段中此外同位置運算符相比,AND可以連接兩個以上的檢索詞,還可以兩個以上的檢索集合進行組配。例如:au=cheng, gengdong AND cs=dalian AND py=1998 3、截詞算符截詞算符就是使計算機保留檢索詞中的相同詞干部分,允許檢索詞可有一定范圍的變化,這種功能可減少輸入步驟,簡化檢索程序,擴大檢索范圍,從而節(jié)省機時,降低費用,提高查全率。不同的數(shù)據(jù)庫有不同的截詞符,DIALOG系統(tǒng)用“?”,ORBIT系統(tǒng)用“+”,此外還有的系統(tǒng)用“$”或“*”截詞有前方一致、后方一致、中間一致和中間屏蔽四種形式。
10、截詞是計算機檢索中常用的方法,尤其是英語的單詞詞尾變化較多,為避免漏檢經(jīng)常要使用前方一致的截詞檢索。 (1). 前方一致也叫后截斷,將截詞符置于一個字符串的后面,以表示其后的有限或無限個字符的檢索。 無限截詞如:Physic?可檢出physic、physical、physican、physicalism 截斷兩個字符如: physic? 可檢出physic、physical、physican 截斷一個字符如: textile? ? 可檢出textitle、textitles中間有一個空格 (2). 后方一致(支持的檢索系統(tǒng)較少, EI光盤不支持)也叫前截斷,將截斷符置于一個字符串的前面,以表示
11、其前的無限個字符的檢索。均為無限截詞。如: ?polymer 可檢出polymer、copolymer、homopolymer (3).中間截斷也叫中間屏蔽如: defen?e 可檢出defence、defensefib?s 可檢出fibers和fibres (4).中間一致(支持的檢索系統(tǒng)較少, EI光盤不支持)詞頭詞尾都可變化如: ?wave? 可檢出wave、waves、microwave 利用計算機進行信息利用計算機進行信息 檢索的步驟檢索的步驟1、確定檢索目標(biāo)2、選擇數(shù)據(jù)庫3、編制檢索提問式4、上機檢索5、整理檢索結(jié)果并對檢索效率進行評價 1.確定檢索目標(biāo)確定檢索目標(biāo) 要進行信息檢索
12、,首先必須確定信息檢索的目標(biāo),即對信息用戶的需求進行具體的分析,這種分析應(yīng)主要包括以下內(nèi)容:n明確檢索的目的 明確用戶是要查新、查參考資料還是查詢論文被收錄或引用情況等,以便對檢索的查準(zhǔn)、查全和時間范圍的指標(biāo)要求有一個大致的了解,從而制定出符合情況的檢索策略。n課題分析 對課題內(nèi)容進行分析,找出核心概念和隱含概念,排除無關(guān)的概念,明確概念之間相互的邏輯關(guān)系。課題分析直接從項目名稱中確定 檢索概念例1:項目“聚乙烯的合成(synthesis of polyethylene) ”主要概念:聚乙烯、合成(synthesis、 polyethylene )檢索式: 聚乙烯 and 合成 Synthes
13、is and polyethylene課題分析找出隱含概念例2:項目“灌溉用的橡塑多孔管”Rubber-Plastic Porous Pipe For Irrigation 橡塑多孔管也稱為橡塑滲灌管,其主要原料為橡膠粉(由廢舊輪胎制得)和塑料(如粉狀聚乙烯)。隱含概念:橡膠、塑料 該產(chǎn)品主要用于農(nóng)林、園藝等方面的灌溉。主要概念:橡膠、塑料、多孔管、灌溉檢索式:(橡膠 or 塑料 or橡塑) and 多孔管 and 灌溉課題分析泛指概念具體化例3:項目“唐山綜合防災(zāi)的研究” 由于唐山是一個城市,因此該項目實際上是“城市綜合防災(zāi)的研究”。 該項目針對的主要災(zāi)害是地震、洪水和火災(zāi), 所采用的研究手
14、段是決策支持系統(tǒng)和專家系統(tǒng)。 防災(zāi) 地震、洪水、火災(zāi) 研究決策支持系統(tǒng)、專家系統(tǒng)主要概念:城市、地震、洪水、火災(zāi) 、決策支持系統(tǒng)、專家系統(tǒng)檢索式:城市 and (地震 or 洪水 or 火災(zāi))and (決策支持系統(tǒng) or 專家系統(tǒng))排除重復(fù)無關(guān)的概念可避免漏檢,節(jié)省檢索費用。例4:項目“河豚毒素的液相色譜分析” 從項目名稱上看,其主要概念為 “河豚毒素”、“液相色譜”和“分析”,但由于液相色譜本身就是一種分析方法,它隱含了“分析”這一概念主要概念: 河豚毒素、液相色譜檢索式:河豚毒素 and 液相色譜2.選用合適數(shù)據(jù)庫選用合適數(shù)據(jù)庫 根據(jù)檢索目標(biāo)分析所確定的檢索目的、涉及的學(xué)科范圍和信息類型,
15、選擇合適的數(shù)據(jù)庫。具體選擇過程中還應(yīng)考慮數(shù)據(jù)庫的類型(參考、全文還是電子期刊)、內(nèi)容(專利、標(biāo)準(zhǔn)、會議)、收錄的數(shù)據(jù)學(xué)科范圍、數(shù)據(jù)庫的更新周期,收錄文獻的語種等因素。例如,要查新就要選擇收錄文獻最全,更新周期快的數(shù)據(jù)庫;要看全文就要選用全文數(shù)據(jù)庫或電子期刊;要查標(biāo)準(zhǔn)或?qū)@鸵x擇標(biāo)準(zhǔn)庫或?qū)@麕臁?.使用適當(dāng)?shù)臋z索語言,使用適當(dāng)?shù)臋z索語言, 構(gòu)造檢索表達式構(gòu)造檢索表達式 分析各個檢索詞之間的位置關(guān)系和邏輯組配關(guān)系分析檢索詞應(yīng)該限定在哪個字段中檢索(是在所有基本索引中檢索還是限定在分類、主題、自由詞、文摘還是其他輔助索引字段中檢索?)4.上機檢索上機檢索 上機檢索是用戶的實際操作過程,檢索策略輸入
16、檢索系統(tǒng)后,系統(tǒng)響應(yīng)的檢索結(jié)果通常很難一次就能滿足課題的要求,例如,有時輸出的篇數(shù)太多,而且不相關(guān)的文獻所占的比例很大,而有時輸出的文獻數(shù)量太少,甚至為零。因此在檢索的過程中用戶需要不斷地根據(jù)檢索結(jié)果對檢索策略進行調(diào)整和修改,包括檢索詞的重新選取以及檢索提問式的重新構(gòu)造,經(jīng)過反復(fù)的檢索最終獲得比較滿意的檢索結(jié)果。(1)輸出篇數(shù)過多時)輸出篇數(shù)過多時 此時多數(shù)是由誤檢造成的,原因主要有以下幾點:1)沒有對檢索詞進行限制。包括字段限制,時間限制,分類限制等。2)主題概念不夠具體或具有多義性導(dǎo)致誤檢。例如,僅使用mathematics進行檢索結(jié)果很多,就需要調(diào)整檢索策略,將概念具體化。如:mathematics and economic 再如,檢索世界貿(mào)易組織僅輸入“WTO”,系統(tǒng)可能會檢索出“World Tourism Organization”(世界旅游組織)3) 對所選的檢索詞截詞截得過短。例如, 使用math? 將有太多的檢索結(jié)果。(2)輸出篇數(shù)過少時)輸出篇數(shù)過少時 此時多數(shù)是由漏檢造成的,原因可能有以下幾點:1)選用了不規(guī)范的主題詞或某些產(chǎn)品的俗稱、商品名作為檢索詞。例如,沒有使用學(xué)名“馬鈴薯”而使用了俗名“土豆”又如,沒有使用“表面活性劑”而使用了商品名稱“迪恩普”,都會造成漏檢。2)同義詞沒有充分考慮。例如,檢索“
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 人民版道德與法治九年級上冊第七課《生命之間》配套聽課評課記錄
- 湘教版七年級數(shù)學(xué)下冊第2章2.1.2冪的乘方與積的乘方(第1課時)聽評課記錄
- 人教版七年級數(shù)學(xué)上冊:1.2.1《有理數(shù)》聽評課記錄
- 冀教版數(shù)學(xué)九年級上冊《平行線分線段成比例》聽評課記錄1
- 《兩漢的科技和文化》聽課評課記錄1(新部編人教版七年級上冊歷史)
- 蘇教版四年級數(shù)學(xué)下冊期末復(fù)習(xí)口算練習(xí)題三
- 湘教版數(shù)學(xué)八年級上冊《小結(jié)練習(xí)》聽評課記錄
- 聽評課記錄數(shù)學(xué)二年級
- 小學(xué)生營養(yǎng)餐飯?zhí)霉ぷ魅藛T聘用合同范本
- 人員派遣租賃協(xié)議書范本
- 防洪防汛安全知識教育課件
- (正式版)FZ∕T 80014-2024 潔凈室服裝 通 用技術(shù)規(guī)范
- 新起點英語二年級下冊全冊教案
- 【幼兒園戶外體育活動材料投放的現(xiàn)狀調(diào)查報告(定量論文)8700字】
- 剪映專業(yè)版:PC端短視頻制作(全彩慕課版) 課件 第3章 短視頻剪輯快速入門
- 湖南省長沙市開福區(qū)青竹湖湘一外國語學(xué)校2023-2024學(xué)年九年級下學(xué)期一模歷史試題
- 帶狀皰疹與帶狀皰疹后遺神經(jīng)痛(HZ與PHN)
- 漢密爾頓抑郁和焦慮量表
- 風(fēng)電場事故案例分析
- 前列腺癌的診斷與治療
- 人教版八年級數(shù)學(xué)初中數(shù)學(xué)《平行四邊形》單元教材教學(xué)分析
評論
0/150
提交評論