第二講 網絡信息檢索基本方法_第1頁
第二講 網絡信息檢索基本方法_第2頁
第二講 網絡信息檢索基本方法_第3頁
第二講 網絡信息檢索基本方法_第4頁
第二講 網絡信息檢索基本方法_第5頁
已閱讀5頁,還剩68頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、LOGO2010-9-13第二講第二講 網絡信息檢索基本方法網絡信息檢索基本方法【目的與要求目的與要求】v 掌握布爾邏輯檢索等網絡信息檢索的基本技術。掌握布爾邏輯檢索等網絡信息檢索的基本技術。v 熟悉網絡信息檢索的途徑和步驟。熟悉網絡信息檢索的途徑和步驟?!局攸c重點】v 布爾邏輯語言、鄰近檢索、截詞檢索布爾邏輯語言、鄰近檢索、截詞檢索【難點難點】v 鄰近檢索鄰近檢索影響信息檢索質量的因素影響信息檢索質量的因素v 信息資源本身的質量對信息檢索的影響(魚龍混雜,參差不齊)信息資源本身的質量對信息檢索的影響(魚龍混雜,參差不齊)v 檢索軟件對信息檢索的影響(不同的搜索引擎,數據庫系統(tǒng))檢索軟件對信息

2、檢索的影響(不同的搜索引擎,數據庫系統(tǒng))v 用戶水平對信息檢索的影響用戶水平對信息檢索的影響 網絡信息檢索的基本技術網絡信息檢索的基本技術網絡信息檢索的基本途徑網絡信息檢索的基本途徑網絡信息檢索基本步驟網絡信息檢索基本步驟網絡信息檢索網絡信息檢索基本方法基本方法 MACTH計算機將檢索提計算機將檢索提問詞問詞文獻記錄標引詞文獻記錄標引詞信息檢索過程的實質:信息檢索過程的實質:智能檢索智能檢索 基本技術基本技術鄰近檢索鄰近檢索 字段限制字段限制檢索檢索 布爾邏輯檢索布爾邏輯檢索 截詞檢索截詞檢索 模糊檢索模糊檢索詞組檢索詞組檢索 一、網絡信息檢索的基本技術一、網絡信息檢索的基本技術1.布爾邏輯檢

3、索(布爾邏輯檢索(boolean logic)v 邏輯檢索是一種比較成熟、較為流行的檢索技術,現代的情報檢索系統(tǒng)大多都采用這種技術。v 邏輯檢索的基礎是邏輯運算,邏輯運算中最常用的是布爾邏輯運算符(boolean logic operator),v 它的作用主要是利用布爾邏輯算符將一些具有簡單的、表達某一主題概念的檢索單元(或檢索v 標識)組配成一個具有復雜概念的檢索式,以滿足課題檢索的要求。v 主要運算符有 “和(and,*)”、“或(or,+)”、“非(not,-)”。v運算優(yōu)先級順序為運算優(yōu)先級順序為NOT、AND、OR,可以用括號,可以用括號“( )”改變它們的運算順序。改變它們的運算

4、順序。如如A and (B or C),檢索順序為先檢索順序為先B或或C,然后再與然后再與A實例:實例:v【實例】在搜索引擎中輸入“電視臺-中央電視臺”,查詢結果不包含“中央電視臺”。邏輯算符舉例邏輯算符舉例查找關于查找關于“動物保護動物保護”的文獻:的文獻:v“動物動物 AND 保護保護” 查找有關冬蟲夏草的文獻:查找有關冬蟲夏草的文獻:v“冬蟲夏草冬蟲夏草 or 冬蟲草冬蟲草 or 蟲草蟲草” 查找關于能源方面的文章,但關于查找關于能源方面的文章,但關于“核能核能”的不要:的不要:v“energy not nuclear”(energy - nuclear)檢索西紅柿種植技術的相關文章:檢

5、索西紅柿種植技術的相關文章:v(西紅柿西紅柿+番茄番茄)*(種植種植+栽培栽培+培育培育)Exercise1:v 查找電子圖書的標準查找電子圖書的標準 (Digital book OR electronic book OR e-book OR online book) AND standardv Goolge的默認運算符就是邏輯的默認運算符就是邏輯“與與”,用空格、,用空格、“AND”和和“+”都表示,而邏輯都表示,而邏輯“非非”只能用只能用“-”而而不能用不能用“NOT”表示,邏輯表示,邏輯“或或”用用“OR”表示。表示。v 百度的默認運算符是邏輯百度的默認運算符是邏輯“與與”,空格均表示邏

6、輯,空格均表示邏輯“與與”。v 在在ISI Web of Knowledge平臺上,邏輯算符平臺上,邏輯算符“AND”、“NOT”、“OR”不區(qū)分大小寫,但不支不區(qū)分大小寫,但不支持以持以“*”、“-”、“+”代替。代替。v 在在Science Direct中,邏輯中,邏輯“非非”是用是用“AND NOT”表示,而不是我們常用的表示,而不是我們常用的“NOT”。2.詞組檢索(詞組檢索(phrase search)v 通常在所檢索詞上加通常在所檢索詞上加“”“”對所檢索詞視為詞組處理,表示檢索與對所檢索詞視為詞組處理,表示檢索與“”“”內形內形式完全相同的短語,以提高檢索的精度和準確度,因而也有

7、人稱之為式完全相同的短語,以提高檢索的精度和準確度,因而也有人稱之為“精精確檢索確檢索”(exact search)。)。v 例如:例如:“動物保護動物保護”,表示動物保護是個詞組,檢索結果動物和保護不能,表示動物保護是個詞組,檢索結果動物和保護不能分開。若不加分開。若不加“”“”,檢索結果可以是動物保護、動物多樣性保護、動物棲,檢索結果可以是動物保護、動物多樣性保護、動物棲息地保護、動物資源保護等形式。息地保護、動物資源保護等形式。v Science Direct用雙引號用雙引號“”“”表示寬松短語檢索,標點符號、連表示寬松短語檢索,標點符號、連字符、停用字等會被自動忽略,如檢索式為字符、停

8、用字等會被自動忽略,如檢索式為“heart attack”會會檢出包含檢出包含“heart attack”和和“heart-attack”的檢索結果。的檢索結果。v 在該數據庫中,精確檢索是用在該數據庫中,精確檢索是用“”表示。表示。v 鄰近檢索有時又被稱為位置算符檢索。v 因此,我們要利用位置邏輯算符來限定檢索詞與檢索詞之間的位置關系,從而使檢索出的文獻更確切地符合用戶要求,提高查準率。v 在不同的檢索系統(tǒng)中,所采用的位置算符是不同的,功能也有差異。在不同的檢索系統(tǒng)中,所采用的位置算符是不同的,功能也有差異。下面以全球最大的聯機檢索系統(tǒng)Dialog為例來說明位置算符的用法,OCLC也是如此。

9、3. 鄰近檢索(鄰近檢索(proximity search)布爾邏輯運算符和詞組檢索雖然能有效的擴大和縮小檢索范圍,但無法對檢索詞之間的相對位置進行限制 文獻記錄中詞語的相對次序或位置不同,所表達的意思可能不同又稱為位置算符檢索,用來規(guī)定檢索系統(tǒng)原始記錄中的檢索詞之間的特定位置關系 同樣一個檢索表達式中詞語的相對次序不同,其表達的檢索意圖也不一樣我們要利用位置邏輯算符來限定檢索詞與檢索詞之間的位置關系,從而使檢索出的文獻更確切地符合用戶要求,提高查準率。Eg:“粉末的摻合與顏料包裝 ”(W)WITH算符算符v 表示兩個檢索詞前后次序固定,二者之間只能間隔連字符、空格或表示兩個檢索詞前后次序固定

10、,二者之間只能間隔連字符、空格或者是逗號。者是逗號?!緦嵗龑嵗吭谠贠CLC中輸入中輸入communication w satellite;wN (with N)算符算符v 表示兩個檢索詞之間插有表示兩個檢索詞之間插有n個詞,但順序不能顛倒。個詞,但順序不能顛倒。v 表達式:表達式: A WN B AB兩詞靠近,次序為兩詞靠近,次序為A先先B后,中間最多可后,中間最多可加加n個詞。個詞。v 【實例實例】在在EBSCO中輸入中輸入communication w3 satellite; N(Near)算符算符 N( Near)表示兩個檢索詞可以互換順,二者之間只能間隔連字符、空格或者是逗號。v 表

11、達式:表達式:A N B :AB兩詞靠近,次序可變。兩詞靠近,次序可變?!緦嵗吭贠CLC中輸入communication n satellite; nN ( Near N)算符算符v 表示兩個檢索詞之間可以插入表示兩個檢索詞之間可以插入 n 個詞并且詞序可以顛個詞并且詞序可以顛倒倒v 表達式:表達式:A(nN)B:AB兩詞靠近,次序可變,中間兩詞靠近,次序可變,中間最多可加最多可加n個詞。個詞。【實例】在EBSCO中輸入communication n3 satellite;比較:在EBSCO中輸入source and law、source w2 law(F)Field (F)表示在此運算符兩

12、側的檢索詞必須同時出現在文獻記錄的同一)表示在此運算符兩側的檢索詞必須同時出現在文獻記錄的同一字段內,如出現在篇名字段、文摘字段等,但兩個詞的前后順序字段內,如出現在篇名字段、文摘字段等,但兩個詞的前后順序不限,夾在兩個詞之間的詞的個數也不限。不限,夾在兩個詞之間的詞的個數也不限。(S)算符算符v (S)算符表示在此運算符兩側的檢索詞必須同時出現在算符表示在此運算符兩側的檢索詞必須同時出現在文獻記錄的子字段或同一段話中,兩個詞次序不限,中間文獻記錄的子字段或同一段話中,兩個詞次序不限,中間插入詞的數量也不限。插入詞的數量也不限。4.截詞檢索截詞檢索(truncation/wildcat)v 截

13、詞檢索又稱部分一致檢索,是指在檢索標識中保留相同的部分,截詞檢索又稱部分一致檢索,是指在檢索標識中保留相同的部分,用相應的截詞符代替可變化部分。檢索中,計算機會將所有含有相用相應的截詞符代替可變化部分。檢索中,計算機會將所有含有相同部分標識的記錄全部檢索出來。截詞符用同部分標識的記錄全部檢索出來。截詞符用“?”或或“*”標識。標識。v 截詞檢索是預防漏檢,提高查全率,尤其適用于英語,常用于處理截詞檢索是預防漏檢,提高查全率,尤其適用于英語,常用于處理詞語的單復數,不同拼寫方式,相同詞根的近義詞,以及動詞的不詞語的單復數,不同拼寫方式,相同詞根的近義詞,以及動詞的不同形式等。同形式等。后截斷無限

14、截斷無限截斷同根詞檢索同根詞檢索如:physic?截詞檢索與截詞檢索算符PhysicphysicsphysicstphysicalismPhysicphysicsphysicst如:physic*有限截斷有限截斷單復數單復數中截斷中截斷用用于中美拼寫不同于中美拼寫不同和單復數和單復數前截斷前截斷同根詞檢同根詞檢索索m?nmanmenv 特別提示:特別提示:“*”、“?”的比較的比較v “*”,無限截詞,代表,無限截詞,代表0-無數個字符如無數個字符如regard*, 代表代表regard, regarding, regardless等。等。v “?”,有限截詞,代表,有限截詞,代表0-1個字符

15、,如個字符,如library?,?,library,librarys。5.字段限制檢索技術(字段限制檢索技術(field limiting) 組成數據庫的最小單位是記錄,一條完整的記錄中的每一個著錄事項為字段。組成數據庫的最小單位是記錄,一條完整的記錄中的每一個著錄事項為字段。一般來說,數據庫的記錄基本包括下列字段:一般來說,數據庫的記錄基本包括下列字段:v 題名(題名(TI,title)、v 關鍵詞(關鍵詞(KW,keyword)、v 主題詞(主題詞(DE, descriptor)、 v 文摘(文摘(AB,abstract)、v 全文(全文(FT, Full text)、v 作者(作者(AU

16、,author)、v 作者機構(作者機構(CS,Coporate Source)v 期刊名稱期刊名稱(JN,Journal)、v 出版國出版國(CO,Country)、v 出版年份出版年份(PY,Publication Year)、v 語種語種 (LA,Language)v 字段限制檢索就是通過限制字段和限制字段的范圍來縮小檢索結字段限制檢索就是通過限制字段和限制字段的范圍來縮小檢索結果,達到精確檢索的方法。果,達到精確檢索的方法。v 檢索方式主要有:限定字段檢索和限定范圍檢索檢索方式主要有:限定字段檢索和限定范圍檢索(1)限定字段檢索:將檢索詞限定在特定的字段中,一般有兩種表達方式。)限定字

17、段檢索:將檢索詞限定在特定的字段中,一般有兩種表達方式。 前綴方式,將檢索詞放在所限定的字段代碼之后,如用在著者(前綴方式,將檢索詞放在所限定的字段代碼之后,如用在著者(AU)、刊)、刊名(名(JN)、出版年()、出版年(PY)、語種()、語種(LA)等字段后,)等字段后, 例如:例如:AU=Evans,A., LA=Chinese 后綴方式,將檢索詞放在字段代碼之前,之后用字段限定符號:后綴方式,將檢索詞放在字段代碼之前,之后用字段限定符號:in 或或/;如:;如:Furniture/TI即家具一詞出現在題目中。即家具一詞出現在題目中。v (2)限定范圍檢索:是通過使用限定符來限制信息的檢索

18、范圍,以達到)限定范圍檢索:是通過使用限定符來限制信息的檢索范圍,以達到優(yōu)化檢索的方法。優(yōu)化檢索的方法。v 不同的檢索系統(tǒng)略有不同,常通過使用的有:不同的檢索系統(tǒng)略有不同,常通過使用的有:“=、=、:、:” 等。等。v 表達式:字段名表達式:字段名=(=、)、)v 例如:例如: PY=1995 即限定出版年份為即限定出版年份為1995及以后的文獻;及以后的文獻; PY=1996:2005即即1996年至年至2005年的文章年的文章思考:比較思考:比較3個檢索式檢索結果的不同個檢索式檢索結果的不同v “Information retrieval”/TI vInformation AND retr

19、ieval /TI vInformation(F) retrieval v不僅要求在題名字段中,還要求兩者必須與輸入的形式完全相同不僅要求在題名字段中,還要求兩者必須與輸入的形式完全相同 v只要求在題名字段中,而不嚴格限制它們是短語,如只要求在題名字段中,而不嚴格限制它們是短語,如“information organization methods for effective retrieval” v只需要在同一個字段中只需要在同一個字段中Exercise 2:v 查找華中科技大學羅俊院士查找華中科技大學羅俊院士1999年以來發(fā)表的文章?年以來發(fā)表的文章?v AU=Luo Jun AND(CS=

20、 Huazhong Univ* )AND PY=1999v 查找查找2002年出版或發(fā)表的關于克隆人立法方面的英文著作或論文。年出版或發(fā)表的關于克隆人立法方面的英文著作或論文。v “The legislation of human cloning” or human clone and legislat* and LA=English and PY=2002大多數網絡檢索工具都有類似于字段限制檢索的功能,可將查找范圍限制在大多數網絡檢索工具都有類似于字段限制檢索的功能,可將查找范圍限制在特定的范圍中,如:特定的范圍中,如:v 標題(標題(title)v 圖像(圖像(image)v 文本(文本(

21、text)v 統(tǒng)一資源定位符(統(tǒng)一資源定位符(url)v 網站(網站(site)v 鏈接(鏈接(link)v 舉例:舉例:url: Link: site:6. 區(qū)分大小寫檢索(區(qū)分大小寫檢索(case-sensitive)v china-china,China,CHINA v ChinaChina v Windows, windows 7. 模糊檢索(模糊檢索(fuzzy search)v 又稱概念檢索(相關檢索)又稱概念檢索(相關檢索) 。當我們輸入一個檢索詞時,搜索引擎不僅反饋。當我們輸入一個檢索詞時,搜索引擎不僅反饋包括了該關鍵詞

22、的網址,同時也發(fā)來與關鍵詞意義相近的內容。包括了該關鍵詞的網址,同時也發(fā)來與關鍵詞意義相近的內容。v 如如 “檢索檢索”, 查找查找,尋找尋找, 找尋找尋, 找一找找一找.v 如如 “土豆土豆”,模糊檢索的檢索結果中會返回包括,模糊檢索的檢索結果中會返回包括“土豆土豆”、“馬鈴薯馬鈴薯”、“洋芋洋芋”等含義相近或相關的內容。等含義相近或相關的內容。v 現在大多數搜索引擎都有這種功能,只不過模糊程度不同。現在大多數搜索引擎都有這種功能,只不過模糊程度不同。8.自然語言檢索(自然語言檢索(natural language search)v 即直接采用自然語言中的字、詞、句進行提問式檢索,即直接采用

23、自然語言中的字、詞、句進行提問式檢索,同一般口語一樣。同一般口語一樣。v 智能檢索智能檢索 v Could you please give me some information on English literature? v 這種智能檢索也是搜索引擎發(fā)展的趨勢。這種智能檢索也是搜索引擎發(fā)展的趨勢。v 實際檢索時,需要將上述各種方法綜合使用才能獲得最實際檢索時,需要將上述各種方法綜合使用才能獲得最佳檢索效果。如佳檢索效果。如“查找查找2000年以來年以來Peter Suber教教授撰寫的關于開放存取授撰寫的關于開放存取”的論文?可以構建檢索式為:的論文?可以構建檢索式為:Open Acces

24、s OR OA OR *free resources OR Open Source) AND(AU=Peter Suber)AND PY=2000。v 檢索式的構建不是一蹴而就的,需要根據檢索結果的多檢索式的構建不是一蹴而就的,需要根據檢索結果的多寡和精準程度進行不斷調整。另外需要特別注意的是,寡和精準程度進行不斷調整。另外需要特別注意的是,不同的檢索系統(tǒng)所使用的算符類型和符號各異,本文拘不同的檢索系統(tǒng)所使用的算符類型和符號各異,本文拘于篇幅無法一一列舉,因此使用檢索系統(tǒng)尤其是數據庫于篇幅無法一一列舉,因此使用檢索系統(tǒng)尤其是數據庫前必須瀏覽幫助系統(tǒng),詳細了解字段及算符的設置情況,前必須瀏覽幫助

25、系統(tǒng),詳細了解字段及算符的設置情況,以確定最合適的途徑進行檢索。以確定最合適的途徑進行檢索。二二. 網絡信息檢索的基本途徑網絡信息檢索的基本途徑v 即我們常說的檢索點即我們常說的檢索點Access Point 檢索點即是檢索信息或文獻時所通過或使用的渠道檢索點即是檢索信息或文獻時所通過或使用的渠道,而檢索工具提而檢索工具提供的檢索點是多種多樣的,它以檢索的對象文獻的特征而定。供的檢索點是多種多樣的,它以檢索的對象文獻的特征而定。 科技文獻有兩方面的特征,一是外表特征科技文獻有兩方面的特征,一是外表特征文獻載體的外表上文獻載體的外表上記明的易見的線索;二是文獻的內容特征記明的易見的線索;二是文獻

26、的內容特征即從文獻內部包含即從文獻內部包含的知識信息中的內隱的潛在的線索。的知識信息中的內隱的潛在的線索。1.按文獻外表特征的檢索途徑:按文獻外表特征的檢索途徑:v 名稱途徑名稱途徑即根據書名、刊名、篇名來查找文獻信息的途徑,它是把文獻名稱按照字順排列起來成為一個體系,構成書名檢索點、刊名檢索點和篇名檢索點。v 著者途徑著者途徑以著作者(個人著者、團體著者、專利發(fā)明人、專利權人、合同人及機構等),提供以作者字順為途徑的檢索點,以實現對知名專家或專業(yè)學術機構研究成果和科技成果的檢索。v 序號途徑序號途徑指通過號碼(包括報告號、合同號、專利號、標準號、館藏號、索取號、排架號等)查找文獻的途徑,這種

27、途徑主要是利用各種號碼索引來組織檢索,號碼索引 一般是按照字母順序和號碼順序編排。2.按文獻的內容特征的檢索途徑按文獻的內容特征的檢索途徑v 以文獻的內容特征作為檢索途徑。即按照課題要求來查找文獻的方法,更以文獻的內容特征作為檢索途徑。即按照課題要求來查找文獻的方法,更宜于用來檢索未知線索的文獻。宜于用來檢索未知線索的文獻。分類途徑分類途徑按學科體系查找文獻的途徑 ,主要利用分類目錄或分類 索引 的方法,通過利用專業(yè)知識確定所研究的課題所需文獻屬于什 么類別,它在個學科體系中的地位,再進行檢索的方法。主題途徑主題途徑通過文獻資料的內容主題進行檢索的途徑,即利用從文獻資料 中抽出來的或經過人工規(guī)

28、范化的能代表文獻資料內容實質的標 引詞來檢索,檢索詞可分為關鍵詞、標題詞、元詞、敘詞等幾 種類型。v 綜合來說,分類途徑和主題途徑是文獻檢索的常用途徑,但一些檢索綜合來說,分類途徑和主題途徑是文獻檢索的常用途徑,但一些檢索工具還提供了分子式索引、環(huán)系索引、化學物質索引、會議索引、圖書索工具還提供了分子式索引、環(huán)系索引、化學物質索引、會議索引、圖書索引等,作為某些專業(yè)與學科檢索用的輔導性檢索途徑。引等,作為某些專業(yè)與學科檢索用的輔導性檢索途徑。1.23從已知文獻特征選擇檢索途徑,如果事先已知文獻名稱、著者、從已知文獻特征選擇檢索途徑,如果事先已知文獻名稱、著者、序號等條件,應相應采用名稱索引、號

29、碼索引或有關的目錄索序號等條件,應相應采用名稱索引、號碼索引或有關的目錄索引。引。從檢索工具提供的索引選擇檢索途徑。從檢索工具提供的索引選擇檢索途徑。從課題檢索要求選擇檢索,課題學科范圍要求廣的應用特性從課題檢索要求選擇檢索,課題學科范圍要求廣的應用特性檢索檢索-主題途徑,范圍窄的采用分類途徑。主題途徑,范圍窄的采用分類途徑。3. 選擇檢索途徑的原則選擇檢索途徑的原則三三. 網絡信息檢索基本步驟網絡信息檢索基本步驟v 思考:思考: 我們想想完成一個檢索任務,哪些要素必不可少?我們想想完成一個檢索任務,哪些要素必不可少? 檢索詞、檢索式(檢索策略)、檢索途徑、檢索系統(tǒng)檢索詞、檢索式(檢索策略)、

30、檢索途徑、檢索系統(tǒng) 檢索前的準備工作檢索前的準備工作1.網絡信息檢索基本步驟示意圖網絡信息檢索基本步驟示意圖課題分析課題分析2.2.選擇檢索系選擇檢索系統(tǒng)統(tǒng)3.確定檢索確定檢索途徑和檢途徑和檢索方法索方法4.確定檢索詞確定檢索詞6.實施檢索、實施檢索、分析檢索分析檢索結果、索結果、索取原文取原文5.制定檢索制定檢索策略,編策略,編制檢索式制檢索式7.調整檢索調整檢索式,優(yōu)化式,優(yōu)化策略策略v 主要指明確檢索目的與要求。主要指明確檢索目的與要求。分析課題的主要內容及所涉及學科范圍,以便確定有關檢索標識(分分析課題的主要內容及所涉及學科范圍,以便確定有關檢索標識(分類)、檢索途徑和選擇合適的檢索工

31、具。類)、檢索途徑和選擇合適的檢索工具。分析課題所需信息的類型、文獻量、年代范圍、涉及語種、有關著者、分析課題所需信息的類型、文獻量、年代范圍、涉及語種、有關著者、機構等。機構等。確定課題對查新、查準和查全的指標要求,例如:確定課題對查新、查準和查全的指標要求,例如:v 若要了解某學科、理論、課題等最新進展和動態(tài),則要檢索最近的文獻信息,若要了解某學科、理論、課題等最新進展和動態(tài),則要檢索最近的文獻信息,強調強調“新新”字;字;v 若要解決研究中某具體問題,找出技術方案,則要求檢索有針對性、能解決實若要解決研究中某具體問題,找出技術方案,則要求檢索有針對性、能解決實際問題的文獻信息,強調際問題

32、的文獻信息,強調“準準”字;字;v 若要撰寫綜述、述評或專著等,要了解課題、事件的前因后果、歷史和發(fā)展,若要撰寫綜述、述評或專著等,要了解課題、事件的前因后果、歷史和發(fā)展,則要檢索詳盡、全面、系統(tǒng)的文獻信息,強調則要檢索詳盡、全面、系統(tǒng)的文獻信息,強調“全全”字。字。1.課題分析課題分析2.選擇檢索系統(tǒng)選擇檢索系統(tǒng)主要是根據課題的檢索要求選擇合適的檢索工具或數據庫,如:主要是根據課題的檢索要求選擇合適的檢索工具或數據庫,如:v 查找圖書查找圖書可用可用OPAC書目數據庫;書目數據庫;v 查學科術語或數據等查學科術語或數據等可用事實型數據庫、參考工具書或網絡搜索引擎;可用事實型數據庫、參考工具書

33、或網絡搜索引擎;v 撰寫學位論文、申請研究課題撰寫學位論文、申請研究課題盡可能選用一些收錄年份較長的綜合型和專業(yè)數據庫。盡可能選用一些收錄年份較長的綜合型和專業(yè)數據庫??紤]權威性數據庫考慮權威性數據庫;數據庫的學科專業(yè)范圍是否與課題的學科相吻合;數據庫的學科專業(yè)范圍是否與課題的學科相吻合;需要的是題錄、文摘信息還是全文信息,還是事實、圖形、數據等;需要的是題錄、文摘信息還是全文信息,還是事實、圖形、數據等;數據庫收錄的文獻類型、年限、更新周期,所需文獻信息在國別和語種是數據庫收錄的文獻類型、年限、更新周期,所需文獻信息在國別和語種是否符合檢索需求等。否符合檢索需求等。舉例:v 考慮學科范圍、信

34、息類型和數據量【例題】用_檢索-呋喃甲醇羧酸酯的合成、含有碳和氫元素的化合物的英文綜合學術性文獻。 A.外文Elsevier數據庫 B.外文農業(yè)類CAB文摘數據庫 C.外文農業(yè)類AGRICOLA數據庫 D.外文食品科技文摘數據庫FSTAv 了解收錄的文獻類型【例題】已知參考文獻:徐經長等.國際會計學.中國人民大學出版社.1999.要找原文,使用_檢索國際會計學。 A.中文科技期刊數據庫 B.中國人民大學報刊全文數據庫 C. 圖書館的館藏查詢 【例題】使用檢索CN03250961.8苗間除草機構密封傳動箱。A.維普中文科技期刊數據庫 B.圖書館館藏查詢C.中國人民大學報刊全文數據庫D.中國國家知

35、識產權 大 局專利數據庫E.中國國家科技圖書文獻中心(NSTL)【例題】用檢索編號是GB/T17302.2-1998的文獻A.中國國家知識產權局 B.中國國家科技圖書 專利數據庫 文獻中心(NSTL)C.國務院發(fā)展研究中心信息網 D. 中國標準信息服務網v 考慮信息的時間范圍 同一個數據庫版本不同,時效性也不一定相同。 例如清華大學圖書館收藏的工程索引(EI)各種載體及館藏的簡況比較: 印刷版(EI)月刊,年度更新,收錄文獻源2600種,館藏年限1968-1996。 光盤版(Ei Compendex)季度更新,收錄文獻源2600種,館藏年限19701997年。 網絡版(Ei Compendex

36、Web)包括光盤版(Ei Compendex)和Ei PageOne兩部分,半月更新,收錄文獻源5000種,館藏年限1970至今。 因此網絡版(Ei CompendexWeb)信息更新最快,量最大。3.確定檢索途徑和檢索方法確定檢索途徑和檢索方法檢索途徑主要有:分類、主題、著者、序號。檢索途徑主要有:分類、主題、著者、序號。v分類途徑:按文獻內容的學科分類體系查找文獻的途徑。在印刷型檢索工具中主要分類途徑:按文獻內容的學科分類體系查找文獻的途徑。在印刷型檢索工具中主要有分類目錄和分類索引。在計算機檢索系統(tǒng)中,則把文獻按分類聚類,通過層層點有分類目錄和分類索引。在計算機檢索系統(tǒng)中,則把文獻按分類

37、聚類,通過層層點擊進行檢索,或利用系統(tǒng)提供的分類號進行檢索。擊進行檢索,或利用系統(tǒng)提供的分類號進行檢索。v主題詞主題詞/關鍵詞途徑:按表達文獻主題內容的主題詞或關鍵詞作為標識查找文獻的關鍵詞途徑:按表達文獻主題內容的主題詞或關鍵詞作為標識查找文獻的途徑。途徑。v題名途徑:是根據文獻的標題或名稱,包括書名、刊名、篇名等來查找文獻的途徑題名途徑:是根據文獻的標題或名稱,包括書名、刊名、篇名等來查找文獻的途徑v著者途徑:是根據已知文獻著(編、譯)者的名稱查找文獻的途徑。著者途徑:是根據已知文獻著(編、譯)者的名稱查找文獻的途徑。v代碼途徑:如標準號、專利號、代碼途徑:如標準號、專利號、ISSN號等號

38、等v時間途徑:以文獻的時間范圍查找文獻的途徑。時間途徑:以文獻的時間范圍查找文獻的途徑。檢索方法檢索方法一般有直接檢索法、間接檢索法、追溯檢索法和循環(huán)檢索法四種。一般有直接檢索法、間接檢索法、追溯檢索法和循環(huán)檢索法四種。直接檢索法直接檢索法 又稱瀏覽法,是通過廣泛閱讀、瀏覽近半年的各類文獻資料來獲得所需的最新信息。同時,在課又稱瀏覽法,是通過廣泛閱讀、瀏覽近半年的各類文獻資料來獲得所需的最新信息。同時,在課題確定后,可閱讀百科全書、專業(yè)手冊、年鑒等參考工具書,了解課題的相關背景知識。題確定后,可閱讀百科全書、專業(yè)手冊、年鑒等參考工具書,了解課題的相關背景知識。 缺點:費時費力,具有一定的盲目性

39、和偶然性。缺點:費時費力,具有一定的盲目性和偶然性。間接檢索法間接檢索法 又稱系統(tǒng)檢索法,指借助于檢索工具或系統(tǒng)查找所需文獻的方法。常用的有順查法、倒查法和抽又稱系統(tǒng)檢索法,指借助于檢索工具或系統(tǒng)查找所需文獻的方法。常用的有順查法、倒查法和抽查法。查法。v 順查法:是以所查課題的起始年代為起點,由遠而近按時間順序查找文獻的方法,適合于大課題順查法:是以所查課題的起始年代為起點,由遠而近按時間順序查找文獻的方法,適合于大課題的檢索。優(yōu)點是查全率高,缺點是工作量大。的檢索。優(yōu)點是查全率高,缺點是工作量大。v 倒查法:是由從最新的文獻開始,由近到遠進行查找的方法。特點是效率高,查得的文獻比較新倒查法

40、:是由從最新的文獻開始,由近到遠進行查找的方法。特點是效率高,查得的文獻比較新穎,時常用于科技查新。穎,時常用于科技查新。v 抽查法:是根據檢索需求,抓住課題研究發(fā)展迅速、出版文獻較多的時間段進行集中檢索。抽查法:是根據檢索需求,抓住課題研究發(fā)展迅速、出版文獻較多的時間段進行集中檢索。 用這用這種方法能獲得一指具有代表性、反映學科發(fā)展水平的文獻。種方法能獲得一指具有代表性、反映學科發(fā)展水平的文獻。追溯法:利用文獻末尾所附的參考文獻為線索查找文獻的方法,這種檢索方法基于追溯法:利用文獻末尾所附的參考文獻為線索查找文獻的方法,這種檢索方法基于文獻之間的引用和被引用揭示了文獻主題之間存在著某種內在的

41、聯系。文獻之間的引用和被引用揭示了文獻主題之間存在著某種內在的聯系。v 追溯引文法:先查出一批與檢索課題有關的文獻,再以這批文獻后面的參考文追溯引文法:先查出一批與檢索課題有關的文獻,再以這批文獻后面的參考文獻作為線索,查找文獻的方法。獻作為線索,查找文獻的方法。v 引文索引法:利用引文索引,從被引文獻開始查找引用它的全部論文的方法。引文索引法:利用引文索引,從被引文獻開始查找引用它的全部論文的方法。 交替檢索法:間接檢索法和追溯法的結合。先利用檢索工具查得一批相關交替檢索法:間接檢索法和追溯法的結合。先利用檢索工具查得一批相關 文獻,然后再利用這批文獻所附的參考文獻進行追溯查找,文獻,然后再

42、利用這批文獻所附的參考文獻進行追溯查找, 如此交替使用,直至滿足檢索需求為止。如此交替使用,直至滿足檢索需求為止。4.確定檢索詞確定檢索詞概念的分析:概念的分析:任何一個特定的檢索課題,往往都是用若干個概念表達任何一個特定的檢索課題,往往都是用若干個概念表達的,將檢索課題從不同角度對課題內容進行概念分析,并針對每一個概念,的,將檢索課題從不同角度對課題內容進行概念分析,并針對每一個概念,選擇盡可能多的檢索詞。主題概念轉化而成的檢索詞應能準確、完整地表選擇盡可能多的檢索詞。主題概念轉化而成的檢索詞應能準確、完整地表達檢索課題的內容。達檢索課題的內容。如:檢索課題:如:檢索課題:“土壤環(huán)境條件對豆

43、科作物固氮作用的影響土壤環(huán)境條件對豆科作物固氮作用的影響” 土壤環(huán)境、豆科作物、固氮作用土壤環(huán)境、豆科作物、固氮作用漏檢漏檢 我們應利用自已所學的專業(yè)知識對課題進行深入細致的分析,把那些與課題關系密我們應利用自已所學的專業(yè)知識對課題進行深入細致的分析,把那些與課題關系密切、能全面、準確表達課題內容實質的詞一起作主題詞。切、能全面、準確表達課題內容實質的詞一起作主題詞。v 決定土壤環(huán)境條件的溫度、濕度、決定土壤環(huán)境條件的溫度、濕度、PH值等;值等;v 豆科作物中的大豆、花生等;豆科作物中的大豆、花生等;v 固氮作用中起重要作用的根瘤菌、固氮菌等。固氮作用中起重要作用的根瘤菌、固氮菌等。隱含概念的

44、分析隱含概念的分析 課題的隱含的概念和相關的內容需要從課題所屬的專業(yè)角度作深課題的隱含的概念和相關的內容需要從課題所屬的專業(yè)角度作深入分析,才能夠提煉出能夠確切反映課題內容的檢索概念。入分析,才能夠提煉出能夠確切反映課題內容的檢索概念。v 如:檢索如:檢索“人造金剛石人造金剛石”方面的文獻,方面的文獻, 其中其中“人造(人造(man made)的含義包括有)的含義包括有“人工合成(人工合成(synthetic)在內,單選用在內,單選用“man made”檢索會漏掉許多有用的文獻檢索會漏掉許多有用的文獻;v 檢索檢索“古代家具設計古代家具設計”的相關文獻的相關文獻 古代包括明代、清代、宋代等朝代

45、,不能僅以古代作為檢索詞。古代包括明代、清代、宋代等朝代,不能僅以古代作為檢索詞。確定檢索詞的規(guī)則確定檢索詞的規(guī)則a.要用哪些詞?要用哪些詞?v同義詞應盡量選全:同一概念的幾種表達式同義詞應盡量選全:同一概念的幾種表達式v同一名詞的單數、復數、動名詞、過去分詞等用截詞解決,如:同一名詞的單數、復數、動名詞、過去分詞等用截詞解決,如:child ,childrenv規(guī)范稱謂、俗稱、全稱、簡稱等,如:盤麗魚俗稱七彩神仙魚規(guī)范稱謂、俗稱、全稱、簡稱等,如:盤麗魚俗稱七彩神仙魚v充分利用選定主題概念的上位或下位概念,找不到課題對應的主題詞時,可采用最充分利用選定主題概念的上位或下位概念,找不到課題對應

46、的主題詞時,可采用最近一級的上位詞。近一級的上位詞。 如:如:“山核桃產品加工山核桃產品加工”方面的文章,如果方面的文章,如果“山核桃加工山核桃加工”沒有檢索記錄的話,就沒有檢索記錄的話,就得選得選“核桃加工核桃加工”作檢索詞作檢索詞v充分考慮相關的詞,如研究三帶雙鋸魚的生活習性,假如找不到相關的文獻,可以充分考慮相關的詞,如研究三帶雙鋸魚的生活習性,假如找不到相關的文獻,可以查找同屬或同種的魚類的研究資料,借以參考。查找同屬或同種的魚類的研究資料,借以參考。b.不用哪些詞?不用哪些詞?v 少用或不用對檢索課題意義不大的詞少用或不用對檢索課題意義不大的詞v 一般不選用動詞、形容詞、禁用詞,少用

47、或不用不能表達課題實質的高頻一般不選用動詞、形容詞、禁用詞,少用或不用不能表達課題實質的高頻詞詞v 詞義泛指過度大的詞:如詞義泛指過度大的詞:如“展望展望”趨勢、現狀、近況等,趨勢、現狀、近況等,“應用應用”作用、用途、用法等作用、用途、用法等v 詞義延伸過多的詞:如詞義延伸過多的詞:如“制造制造”制備、生產、加工、工藝等,制備、生產、加工、工藝等,“提提煉煉”精煉、提取、萃取、回收,以及諸如精煉、提取、萃取、回收,以及諸如“有機物有機物”、“無機物無機物”、“病蟲害病蟲害”等外延十分寬的概念等,一般都應轉換成具體的方法或材料、等外延十分寬的概念等,一般都應轉換成具體的方法或材料、化合物及具體

48、的病害與蟲害的名稱表示。化合物及具體的病害與蟲害的名稱表示。例:神經網絡在旋轉機械故障診斷中的應用研究例:神經網絡在旋轉機械故障診斷中的應用研究 1.1.本課題包含本課題包含“神經網絡神經網絡” “旋轉機械旋轉機械” “故障診斷故障診斷”三個概念三個概念,“,“應用應用”和和“研究研究”屬于意義過于寬泛的詞,不屬于意義過于寬泛的詞,不應該作為檢索詞。應該作為檢索詞。 2.2.擴展擴展 神經網絡:相關的上位詞有人工智能神經網絡:相關的上位詞有人工智能旋轉機械旋轉機械故障診斷:相關詞有故障定位、故障檢測,上位詞有故障診斷:相關詞有故障定位、故障檢測,上位詞有容錯技術容錯技術 3.3.檢索式:檢索式:(神經網絡(神經網絡 OR OR 人工智能)人工智能)ANDAND(旋轉機械)(旋轉機械)AND (AND (故障診斷故障診斷 OR OR 故障定位故障定位 OR OR 故障檢測故障檢測 OR OR 容錯技術)容錯技術)5.制定檢索策略,編制檢索式制定檢索策略,編制檢索式v 檢索策略通過編制檢索式,選擇檢索途徑來實施。檢索策略通過編制檢索式,選擇檢索途徑來實施。v 檢索式是檢索策略的邏輯表達式,指利用布爾邏輯運算符、位置算符

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論