信息檢索原理_第1頁
信息檢索原理_第2頁
信息檢索原理_第3頁
信息檢索原理_第4頁
信息檢索原理_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、本章主要內容:本章主要內容: 第三章主要講述信息資源的檢索原理、檢索語言及檢索技術。要求學生了解檢索語言和步驟,掌握布爾邏輯檢索、截詞檢索、限制檢索等基本檢索技術,能正確的制定檢索策略。本章的重點本章的重點:檢索功能、檢索算符、檢索策略本章的難點本章的難點:檢索式的制定和調整 1.1文獻信息存儲過程:將大量分散的文獻信息搜集起來,根據其內容特征或外表特征進行標引,形成表征這些文獻信息的特征標識,并存儲在一定的載體上,成為有查詢功能的檢索工具。1.2 標引:對文獻內容特征和外部特征進行分析形成概念標識,再依據一定的標準或規(guī)則(檢索語言:如分類號、主題詞、關鍵詞及著者選用規(guī)則等)將其用相應的標識充

2、分、準確地表達出來。1.3 文獻信息檢索過程:用戶根據自己的信息需求,提出檢索提問,然后使用有關的標引語言(也稱檢索語言)將擬定的檢索提問規(guī)范成檢索標識,用于檢索的過程。簡言之,信息檢索原理就是用戶將信息需求轉變?yōu)闄z索系統(tǒng)所能識別的檢索標識,與信息檢索系統(tǒng)中存儲的信息特征進行逐一比對,兩者完全一致或基本一致時,即為檢索命中信息,可按用戶要求從檢索系統(tǒng)中輸出。其檢索結果既可能是用戶需要的最終信息(一次信息),也可能是用戶需要的信息線索(二次信息),用戶可據此線索進一步進行判斷、篩選,以獲取所需要的最終信息。信息檢索原理圖網絡數據庫在網絡學術資源中占據重要位置,它的形式多樣,但我們仍然可以將其歸納

3、為以下三種類型:主要為館藏書目數據庫和文摘、索引數據庫;它們提供的是獲取文獻的信息和線索。其特點如下:(1)覆蓋的學科范圍廣,來源出版物量大。如SCI、EI數據庫等。(2)配有強大的檢索系統(tǒng),檢索途徑多,支持復雜的檢索式。(3)內容更新及時。如EI數據庫是每周更新(4)提供全文鏈接或收藏館信息包括全文電子期刊、電子圖書、學位論文、會議文獻、政府出版物、專利、標準等可直接獲取原文的數據庫,是近年來發(fā)展最快的數據庫資源。百科全書、科技手冊、電子詞典、統(tǒng)計年鑒等,是用來檢索數據、事實類問題的最佳參考信息源。 檢索功能是指檢索系統(tǒng)在檢索界面上提供給用戶的基本功能。它與系統(tǒng)的檢索技術是緊密結合的。比較通

4、用的檢索功能有:瀏覽、索引、詞表、簡單檢索、高級檢索、專家檢索、二次檢索等。上述檢索功能都是技術上較為成熟,在檢索系統(tǒng)中得到廣泛應用的。3.1瀏覽瀏覽檢索檢索(Browse)利用檢索系統(tǒng)提供的樹型結構,從“樹根”開始,逐層逐級打開,直到找到所需文獻。瀏覽功能最重要的作用就是為用戶提供一個知識體系,讓用戶可以俯瞰全貌,了解某一個方面信息總體情況。如主題瀏覽、分類瀏覽、文獻類型瀏覽等。例如例如: springerLink數據庫的瀏覽功能數據庫的瀏覽功能瀏覽檢索瀏覽檢索可選擇期刊、圖書、叢書、電子參考書及圖片等進行瀏覽檢索可選擇期刊、圖書、叢書、電子參考書及圖片等進行瀏覽檢索例如:按期刊名稱瀏覽(按

5、字順)例如:按期刊名稱瀏覽(按字順)點擊后打開點擊后打開本期內容本期內容3.2 3.2 索引索引檢索檢索(IndexIndex) 一些數據庫常將其文獻記錄的一個或幾個字段中具有實際檢索意義的詞,按字順排成一個表單式的索引,供用戶選擇檢索。索引的種類很多;如人名索引、出版物索引、地名索引、主題索引、機構索引等。如圖所示的如圖所示的(取自取自EI數據庫數據庫):在不清楚作者名稱是全稱還是縮寫的情況下使用:在不清楚作者名稱是全稱還是縮寫的情況下使用可節(jié)省檢索時間和保障查全率或查準率可節(jié)省檢索時間和保障查全率或查準率。索引檢索索引檢索用戶要檢索作者用戶要檢索作者“劉劍洪劉劍洪”發(fā)表的文獻;按傳統(tǒng)拼寫方

6、法為:發(fā)表的文獻;按傳統(tǒng)拼寫方法為:liu jianhong; 但經但經EI作者索引檢索發(fā)現,該名字在作者索引檢索發(fā)現,該名字在EI數據庫中的另外一種拼法為數據庫中的另外一種拼法為liu jian-hong 瀏覽索引瀏覽索引中所有包含有該詞的姓名,從而確定自己查找的人名,進而點擊作者姓名,即可看到作者列表。 索引與瀏覽最大的不同,就在于瀏覽提供給用戶的是一個樹狀結構的概念體系,而索引是一個簡單的線性列表。但在檢索界面上,索引和瀏覽有時合二為一,統(tǒng)稱為瀏覽,用戶在界面上看不到嚴格區(qū)分的索引和瀏覽功能,只在使用時有所不同。3.3詞表檢索詞表檢索詞表檢索是途徑。一些檢索系統(tǒng)把自己的詞表編入檢索系統(tǒng)。

7、用戶在確定檢索用主題詞的同時,可以直接進行檢索。主題詞檢索主題詞檢索系統(tǒng)出現的檢索結果如下;用戶可根據系統(tǒng)列出的系統(tǒng)出現的檢索結果如下;用戶可根據系統(tǒng)列出的有關主題詞按自己的需求進行選擇有關主題詞按自己的需求進行選擇3.4 簡單檢索(簡單檢索() 簡單檢索又稱基本檢索。即為用戶提供一個簡單的檢索界面,幫助非專業(yè)或初入門的用戶方便的提交檢索式。頁面上通常只有一個檢索框,不提供或提供很少的檢索入口(通常是在全文中進行檢索),類似于搜索引擎。 簡單檢索由于不能構造比較復雜、精細的檢索式,因此檢索結果不是很準確。例如:要檢索有關例如:要檢索有關“納米管納米管”(nanotubes)的文獻;的文獻;用戶

8、可直接將檢索輸入檢索框內,點擊用戶可直接將檢索輸入檢索框內,點擊Search健健 高級檢索可利用組配檢索和字段檢索來構造比較細致的檢索式,幫助用戶進行精確檢索。使檢索更為靈活,檢索結果更加準確。:布爾邏輯組配:library and information;位置算符組配:library (3w) information;-字段檢索是一種限制檢索詞在某一字段范圍出現的檢索方法。數據庫可供檢索字段有二種:一種是反映內容的主題字段,如:題名、敘詞、 標識詞和文摘等。另一種是反映形式特征的檢索字段,如:作者、文獻類型、語種、出版時間等。要求在要求在EBSCOEBSCO數據庫中檢索文章題目中出現數據庫中

9、檢索文章題目中出現“China economicChina economic”和文摘中出現和文摘中出現“WTO”WTO”的文獻的文獻, ,并限定并限定文獻出版的時間:文獻出版的時間:2000.12010.12000.12010.1EBSCO數據庫的高級檢索界面數據庫的高級檢索界面(China economic)/TI AND wto/AB););PY=2000.12010.1)中文名中文名英文名英文名縮寫縮寫摘要AbstractAB題目TitleTI機構名稱Author affiliation; Corporate Source; Organization; CompanyAFCSCN關鍵詞K

10、ey wordKW出版年Publication YearPY全文Full text;All fieldALL期刊名Source title; journal name; publication titleSTJNPT中文名中文名英文名英文名縮寫縮寫語言LanguageLA國際標準刊號ISSNSN國際標準書號ISBNBN文獻類型Document typeDT出版商PublisherPN 專家檢索可為專業(yè)用戶、資深用戶提供比較復雜的檢索界面。 專家檢索多為命令式檢索方式,適合熟悉檢索指令、檢索經驗豐富的用戶使用。用戶可將編制好的檢索式填到檢索框中,即可進行檢索。使用專家檢索可構造較復雜的檢索式,達

11、到較高的查全率和查準率,一般查新人員大多采用這種方式。39專家檢索專家檢索檢索式輸入框字段說明 檢索年代檢索實例:檢索實例:要求檢索以下詞組同時出現在文摘中的文獻light weight steel light weight steel autobodyautobody (WN AB -在EI數據庫中,表示將檢索詞限定在文摘內)43 專家檢索類似于一種命令式檢索專家檢索類似于一種命令式檢索,在專家檢索的界面上有一獨立的檢索框,用戶采用“within”命令(wn)和字段碼,可在特定的字段內進行檢索。例如:在文摘中查找“Laser beam cutting” ;可以表示為“Laser beam c

12、utting” wn AB; 在題名中查找(seatbelts OR seat belts) ;可表示為:(seatbelts OR seat belts) wn TI 專家檢索專家檢索采用布爾運算符(AND, OR, NOT)連接檢索詞。例如:輸入Gilbert, Barrie wn AU AND Analog Devices wn AF;則檢索出由Analog Devices(作者單位)的Barrie Gilbert(作者)編寫的文獻。 二次檢索是指在當前這次檢索結果范圍內,再次輸入不同的檢索詞,運用布爾邏輯檢索、截詞檢索等方式進行檢索。經過多次的二次檢索,逐漸縮小文獻范圍,使檢索結果更符合您的查詢目標。例如例如:檢索納米材料的有關文獻時,用“所有字段All field ”途徑,第一次輸入關鍵詞“納米材料Nano materials”,檢索出來的結果較多,共有89122條,這時可通過二次檢索,選擇“著者”途徑,從而

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論