信息檢索策略與實(shí)例分析_第1頁
信息檢索策略與實(shí)例分析_第2頁
信息檢索策略與實(shí)例分析_第3頁
信息檢索策略與實(shí)例分析_第4頁
信息檢索策略與實(shí)例分析_第5頁
已閱讀5頁,還剩37頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第10章信息檢索策略與實(shí)例分析1編輯ppt主要內(nèi)容10.1漏檢誤檢的原因分析及對策10.2檢索策略的調(diào)整10.3信息檢索綜合利用案例2編輯ppt10.1漏檢誤檢的原因

分析及對策3編輯ppt分析課題選擇檢索系統(tǒng)制定檢索策略獲取原始文獻(xiàn)文獻(xiàn)閱讀與分析評價(jià)查找文獻(xiàn)線索調(diào)整檢索策略調(diào)整課題方向信息檢索步驟4編輯ppt10.1.1課題分析不透課題分析是一切后續(xù)檢索的根底。分析課題首選手冊、百科全書、專著等三次文獻(xiàn)作為分析手段。?它們是該領(lǐng)域的學(xué)術(shù)專家和權(quán)威對以往研究的總結(jié),既有高度又有深度和廣度,讓人對該領(lǐng)域的研究有一種全局的了解和把握,同時(shí)可以對背景知識(shí)和相關(guān)名詞術(shù)語作全面的了解。?在此根底上去查詢新的文獻(xiàn),站得就比較高,既能見到樹木又能見到森林。5編輯ppt對新課題的了解越多,所走的彎路越少。課題內(nèi)涵的透徹分析?例1:檢索“乙醇的別離〞文獻(xiàn)檢索策略1:“乙醇AND別離〞——漏檢檢索策略2:“乙醇AND〔別離OR提純OR純化)〞——更全

6編輯ppt例2:檢索“垃圾處理方面〞文獻(xiàn)“處理〞一詞隱含著“回收〞、“再生〞等具體的處理方法。7編輯ppt提示與技巧檢索詞沒有表達(dá)出課題的隱含概念,是造成漏檢的重要原因。要透過外表的、顯性的表達(dá)詞,找出隱含概念的表達(dá)詞是需要相當(dāng)專業(yè)知識(shí)的,而有些專業(yè)知識(shí)又需要通過文獻(xiàn)檢索和閱讀后才能獲得,這就是檢索策略不能一蹴而就的根本原因。8編輯ppt10.1.2檢索詞概念過大或過小課題內(nèi)容的準(zhǔn)確定位

概念不能太大也不能太小

主題概念的范疇太大造成大量沒用的文獻(xiàn)被誤檢。

太小造成重要的的文獻(xiàn)被漏檢。9編輯ppt例1:“煤脫硫的最新工藝與技術(shù)〞假設(shè)用“煤脫硫〞作為主題概念,有1000多篇——概念太大。選擇更具體的概念“微波煤脫硫〞,有10多篇——概念定位恰當(dāng)。10編輯ppt例2:“論企業(yè)生產(chǎn)線的優(yōu)化〞檢索詞:“企業(yè)生產(chǎn)線〞與“優(yōu)化〞,檢索到的文獻(xiàn)很少分析:概念定位太小,所謂企業(yè)生產(chǎn)線的優(yōu)化,實(shí)際上是有關(guān)運(yùn)用計(jì)算機(jī)系統(tǒng)管理生產(chǎn)線的問題。答案:“企業(yè)生產(chǎn)線OR生產(chǎn)線〞與“計(jì)算機(jī)系統(tǒng)〞11編輯ppt提示與技巧概念是太大還是太小要視檢索結(jié)果而定,不斷調(diào)整的。概念太大可以利用邏輯運(yùn)算加以限制,比較容易。而概念太小要變大,需要較多的專業(yè)知識(shí)。上下位概念的替換是調(diào)整檢索策略的一種好方法。12編輯ppt10.1.3選擇的檢索詞過多多主題概念的選詞以“簡〞為主一課題是由A、B、C、D、E多個(gè)主題組合而成。假設(shè)A、B、C、D、E其中之一的檢索結(jié)果為零,那么檢索結(jié)果A*B*C*D*E=0。?解決方法:以必須使用的關(guān)鍵詞為核心詞?例1:課題“利用基因工程的手段提高植物中淀粉的含量〞?檢索策略:“基因工程〞AND“植物〞AND“淀粉〞AND“含量〞——檢索結(jié)果為零13編輯ppt分析:主題詞過多?答案:首先抓住最能反映課題主題概念的詞作為檢索詞,其他各詞視檢索結(jié)果斷定取舍,對于本課題,只有2個(gè)主題概念最為關(guān)鍵---“基因〞AND“淀粉〞。“最專指面優(yōu)先〞原那么〔MostSpecificFaceFirst〕14編輯ppt10.1.4布爾邏輯運(yùn)算符使用不當(dāng)邏輯檢索式的正確使用:課題:城際列車振動(dòng)對周圍環(huán)境的影響對此課題進(jìn)行分析,確定關(guān)鍵詞為:“鐵路〞/“列車〞/“軌道〞/“交通〞、“振動(dòng)〞/“動(dòng)力〞。15編輯ppt采用的檢索詞如下:鐵路:Railway軌道:Rail、Track交通:Traffic、Traffical列車:Train振動(dòng):Vibration、Vibrations動(dòng)力:dynamic、dynamical檢索式如下:([Rail*]or[Train*]or[Traffic*]or[Track*])and([Vibrat*]or[dynamic*])檢索字段:“Title〞or“Keywords〞or“Abstract〞16編輯ppt先組合第一和第二個(gè)檢索框的檢索詞,后再與第三個(gè)檢索框進(jìn)行組合。先組合第一和第二個(gè)檢索框的檢索詞,后再與第三個(gè)檢索框進(jìn)行組合。17編輯ppt先組合“vibrat*〞和“traffic*〞進(jìn)行檢索,然后與“rail*〞進(jìn)行檢索,把同義詞“traffic*〞和“rail*〞的檢索隔開了,不符合檢索策略。18編輯ppt將給出的檢索式在QuickSearch中實(shí)現(xiàn):

小建議:當(dāng)遇到多于三個(gè)檢索詞的多種組配檢索時(shí),可以采用專家檢索。

在QuickSearch檢索中,注意三個(gè)檢索框的檢索組合順序:先組合第一檢索框和第二檢索框的檢索詞,然后再與第三檢索框的檢索詞。在同義詞或相關(guān)詞組合檢索、并有多個(gè)主題進(jìn)行組配檢索時(shí),尤其要注意檢索框的輸入順序。19編輯ppt10.1.5人機(jī)“語言〞不一致自由語言與數(shù)據(jù)庫標(biāo)引語言的對應(yīng)自由語言A---檢索者所用的詞,往往較隨意,“想當(dāng)然〞數(shù)據(jù)庫標(biāo)引語言B---已固定存儲(chǔ)于計(jì)算機(jī)中,一般較標(biāo)準(zhǔn)假設(shè)A≠B,“對話〞不成功,檢索結(jié)果為020編輯ppt自由詞:維生素C(vitaminC);標(biāo)引詞:抗壞血酸〔ASCORBICACID〕?“超分子〞?自由詞〔直譯〕:supermolecular;標(biāo)引詞:macromolecular?例如:檢索“六行程發(fā)動(dòng)機(jī)〞的資料,把“六行程〞作主題詞時(shí),就不能找到相關(guān)資料,而用六沖程作為主題詞就可以找到。21編輯ppt?“標(biāo)引詞〞是用以描述文獻(xiàn)內(nèi)容特征的詞和詞組,由專業(yè)標(biāo)引人員抽選出的,經(jīng)過標(biāo)準(zhǔn)處理,可以防止漏檢。?“自由詞〞檢索方便,但會(huì)導(dǎo)致漏檢,需要把所有同義詞考慮齊全,才能防止漏檢。22編輯ppt10.1.6沒有選擇適宜的檢索途徑正確選擇檢索途徑對檢索途徑的選擇,遵循“寬進(jìn)嚴(yán)出〞的原那么,并根據(jù)檢索結(jié)果的多少來調(diào)整途徑。注意題名、關(guān)鍵詞、文摘等字段在檢索結(jié)果中的差異。假設(shè)檢索結(jié)果多了,可使用篇名途徑;少了,那么使用全文途徑。靈活運(yùn)用“文獻(xiàn)類型〞字段

23編輯ppt10.1.7對數(shù)據(jù)庫不熟悉正確選擇檢索系統(tǒng)

檢索工具種類繁多,各具特色,它們收錄

的文獻(xiàn)學(xué)科、類型、國別、語種范圍均各

有側(cè)重。應(yīng)根據(jù)課題的特點(diǎn)選擇檢索工具。

Ei偏重工程,不報(bào)道純理論,會(huì)議論文收

錄得多,是世界四大文獻(xiàn)索引之一。

SCI那么收錄涵蓋所有學(xué)科、側(cè)重根底理論

研究方面的文章,它的文獻(xiàn)品位高,可信

度大,并可以對文章的水平、著者的學(xué)術(shù)

水平作出評價(jià),尋找熱點(diǎn)課題等等。24編輯ppt?不同數(shù)據(jù)庫有各自的規(guī)那么,姓名、分子式、各種符號(hào)的寫法,檢索框的檢索順序均不盡相同,如果不了解就會(huì)造成很大的漏檢誤檢。如逗號(hào),括號(hào),連字符“-〞應(yīng)該用半角〔俗稱英文符號(hào)〕,假設(shè)用了全角〔俗稱中文符號(hào)〕,就會(huì)檢索不到。注意:PQDD是國外博碩士論文數(shù)據(jù)庫,檢索詞用“英文〞,而非“中文〞。25編輯ppt10.2檢索策略的調(diào)整26編輯ppt檢索策略與文獻(xiàn)檢索和閱讀的關(guān)系27編輯ppt制定檢索策略---查全查準(zhǔn)的關(guān)鍵?好的檢索策略不是一蹴而就的,而是“與時(shí)俱進(jìn)〞的!?“變〞是檢索策略永恒的主題。它會(huì)隨著對課題理解的深入而改變,“檢索→閱讀→策略修改→再檢索……〞,不斷調(diào)整,不斷完善。28編輯ppt查找和篩選文獻(xiàn)線索---提高查全查準(zhǔn)率

當(dāng)經(jīng)歷了前面一系列檢索得到結(jié)果時(shí),通過閱讀文摘,往往會(huì)發(fā)現(xiàn)檢索結(jié)果并不盡如人意,或相關(guān)性較差,或檢索結(jié)果太多或太少,這時(shí)需要進(jìn)一步調(diào)整檢索策略了。29編輯ppt10.2.1檢索結(jié)果相關(guān)性差

解決方案:重新分析課題,找出隱含在課題題名后面的相關(guān)檢索詞。

方法:先從檢索結(jié)果中選出你認(rèn)為相關(guān)性高的幾篇文獻(xiàn)線索,得到它們的原文,然后研讀,找出它們所表達(dá)的關(guān)鍵詞,然后再用這些關(guān)鍵詞去檢索。30編輯ppt10.2.2檢索結(jié)果太多原因1:主題、檢索詞、檢索入口過于寬泛導(dǎo)致誤檢,例如直接用“金屬玻璃〞、“燃料電池〞、“微波陶瓷〞等寬泛的概念查文獻(xiàn),解決方法是進(jìn)一步了解課題背景,明確研究定位;原因2:主題詞本身的多義性導(dǎo)致誤檢,例如,使用鄰苯二甲酸二壬酯的縮寫“DNP〞作為檢索詞檢索,結(jié)果找出的文獻(xiàn)含有“DNP鄰苯二甲酸二壬酯〞、“DNP動(dòng)態(tài)核極化〞、“DNP糖尿病患者〞、“DNP防老劑〞和“DNP外表活性劑〞等多種內(nèi)容;31編輯ppt原因3:檢索詞的截詞過短造成。例如,使用“Cata*〞檢索“Catalyst,使用“Prep*〞檢索“Preparation〞,都會(huì)造成誤檢。〔截詞的原那么是截到詞根,如Catalyst——Catalys*;Preparation——Prepar*〕。32編輯ppt原因4:詞組沒有用精確檢索造成。利用雙引號(hào)“〞實(shí)現(xiàn)對詞組的精確檢索。例檢索solarenergy這個(gè)主題,沒有加雙引號(hào)“〞,那么代表是普通檢索,只要檢索字段中出現(xiàn)solar和energy便符合檢索要求,不管這兩個(gè)詞出現(xiàn)的次序怎樣;假設(shè)加雙引號(hào)“〞那么表示solar必須在前,energy必須緊跟其后才符合。33編輯ppt檢索結(jié)果太多——細(xì)化檢索,縮小檢索范圍提高檢索詞的專指度,選用下位詞或?qū)V感暂^強(qiáng)的自由詞檢索。將檢索詞的檢索范圍限定在篇名、主題詞、關(guān)鍵詞字段,或進(jìn)行出版時(shí)間、語種、文獻(xiàn)類型等的限定。用NOT算符排除無關(guān)的術(shù)語和詞組。把增加的概念,用AND算符參加檢索式中。瀏覽局部中間檢索結(jié)果,從檢出的記錄中選取新的檢索詞對中間結(jié)果進(jìn)行限制。34編輯ppt10.2.3檢索結(jié)果太少?原因1:選用了不標(biāo)準(zhǔn)的主題詞或某些產(chǎn)品的俗稱、商品名作為檢索詞。例如:沒有使用“外表活性劑〞而使用了商品名稱“迪恩普〞,都會(huì)造成漏檢。?原因2:同義詞不全例如,查找“品牌〞時(shí),沒有考慮到“名牌〞、“牌號(hào)〞以及“商標(biāo)〞等檢索詞。35編輯ppt原因3:沒有綜合考慮檢索詞的上位概念或下位概念。例如,“燃料〞是上位概念,下位概念可以有“固體燃料〞,“液體燃料〞,“氣體燃料〞,甚至還有“煤〞,“油〞,“煤氣〞,“天然氣〞等,這些概念在查找“燃料〞時(shí),都應(yīng)該加以考慮。36編輯ppt檢索結(jié)果為零原因1:對數(shù)據(jù)庫的檢索規(guī)那么運(yùn)用錯(cuò)誤。譬如邏輯算符、通配符、中英文符號(hào)〔半角全角〕等問題,每個(gè)數(shù)據(jù)庫有不同的要求。在歐洲專利中,檢索不出帶逗號(hào)和短橫的分子式如1,3-Propanediol,但在Ei中卻能將其檢索出來。37編輯ppt原因2:確實(shí)沒有相關(guān)文獻(xiàn)。但不能因?yàn)闄z索篇數(shù)為零而放棄對相關(guān)內(nèi)容的查找。必要時(shí)可以將課題拆分,各自查找。例如,課題是關(guān)于“膜乳化〞,但在超星圖書館中檢索不到“膜乳化〞的書籍,于是將“膜乳化〞拆成“膜〞和“乳化〞分別檢索,發(fā)現(xiàn)有很多有用的三次文獻(xiàn)。38編輯ppt檢索結(jié)果太少——擴(kuò)展檢索范圍

對已確定的檢索詞進(jìn)行其同義詞、同義的相關(guān)詞、縮寫和全稱檢索,保證文獻(xiàn)的查全率,防止漏檢。

利用系統(tǒng)的助檢手段和功能。有的系統(tǒng)提供樹形詞表瀏覽,使我們可以用標(biāo)準(zhǔn)詞、相關(guān)詞、更廣義的上位詞進(jìn)行擴(kuò)展。

降低檢索詞的專指度,選用上位詞或相關(guān)詞檢索。

選用在所有字段或文摘字段中檢索。

去除文獻(xiàn)類型、年份、文種等文獻(xiàn)外表特征的限定。

刪除檢索策略中某一次要概念。

用OR算符把增加的同義詞或相關(guān)詞連接起來。

利用截詞。

選擇更適宜的數(shù)據(jù)庫進(jìn)行查找。39編輯ppt10.3

信息檢索綜合利用案例40編輯ppt例:某同學(xué)在實(shí)驗(yàn)中要求利用氣相燃燒合成的方法在陶瓷膜襯底上涂一層膜,但苦于不知道如何確定實(shí)驗(yàn)條件解決方法:到別人的研究工作中去尋找答案。通過對國內(nèi)外文獻(xiàn)的檢索,得到兩篇比較有價(jià)值的文獻(xiàn),一是丹麥研究者ThyboS于2004年4月發(fā)表在?JournalofCatalysis?上的?Flamespraydepositionofporouscatalystsonsurfacesandinmicrosystems?(簡稱文章1),另一篇為發(fā)表在某大學(xué)學(xué)報(bào)上的?SnO2薄膜的噴涂法制備?(簡稱文章2)。這兩篇文章采用的涂膜方法十分類似,都是一種熱噴涂的方法,其中都有關(guān)于襯底溫度控制的論述。而兩個(gè)作者卻有兩種完全不同的看法,文章1的作者認(rèn)為:“襯底的溫度高一些較好,噴

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論