課件講稿 第二章 信息檢索原理與檢索技術(shù)_第1頁
課件講稿 第二章 信息檢索原理與檢索技術(shù)_第2頁
課件講稿 第二章 信息檢索原理與檢索技術(shù)_第3頁
課件講稿 第二章 信息檢索原理與檢索技術(shù)_第4頁
課件講稿 第二章 信息檢索原理與檢索技術(shù)_第5頁
已閱讀5頁,還剩84頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第一次作業(yè)

1.如何提高信息素質(zhì),談?wù)勀愕牡膶W(xué)習(xí)方法或途徑。2.瀏覽我校圖書館網(wǎng)站,說出圖書館都收藏有哪些類型的文獻(xiàn)資源(信息源)?(列出3種以上)3.請用圖示的方法說明布爾邏輯檢索概念之間的邏輯關(guān)系。4.信息檢索步驟主要有哪些?5.列舉自己感興趣的3個(gè)課題,其中1個(gè)與所學(xué)專業(yè)有關(guān)。1交作業(yè)文件名為:學(xué)號姓名作業(yè)次數(shù),例如:1020王海1andwxy2008@163.com2文獻(xiàn)檢索姓名:

學(xué)號:

班級:

指導(dǎo)教師:

日期:

成績:

【作業(yè)要求】1.交作業(yè)文件名為:學(xué)號姓名作業(yè)次數(shù)2.態(tài)度認(rèn)真、頁面整潔。學(xué)號姓名作業(yè)次數(shù)3第二章信息檢索原理與技術(shù)2.1信息檢索原理2.2信息檢索語言2.3信息檢索技術(shù)2.4信息檢索方法42.1信息檢索原理2.1.1信息檢索原理2.1.2信息檢索類型2.1.3信息檢索系統(tǒng)2.1.4信息檢索途徑5

2.1.1信息檢索原理

信息檢索的概念:廣義的信息檢索包括信息的存儲和檢索兩個(gè)過程。信息存儲是將大量無序的信息集中起來,根據(jù)信息源的外部特征和內(nèi)容特征,經(jīng)過整理、分類、濃縮、標(biāo)引等處理,使其系統(tǒng)化、有序化,并按一定的技術(shù)要求建成具有檢索功能的數(shù)據(jù)庫或檢索系統(tǒng),供人們檢索和利用。信息檢索是指運(yùn)用編制好的檢索工具或檢索系統(tǒng),查找出滿足用戶要求的特定信息。6信息檢索的全過程應(yīng)包括兩個(gè)方面:(1)信息的標(biāo)引和存儲過程。(2)信息的需求分析和檢索過程。狹義的信息檢索:根據(jù)特定需求,運(yùn)用某種檢索工具,按照一定的方法,從大量文獻(xiàn)信息集合中迅速、準(zhǔn)確地查找出所需文獻(xiàn)或信息內(nèi)容的過程。這是一個(gè)信息存取的過程,是人、計(jì)算機(jī)和網(wǎng)絡(luò)共同作用下自動完成的。7信息檢索原理:

信息檢索是對信息集合與需求集合的匹配與選擇。也就是檢索提問標(biāo)識與存儲在檢索工具中的文獻(xiàn)標(biāo)引標(biāo)識進(jìn)行比較,兩者一致,或信息標(biāo)引的標(biāo)識包含著檢索提問標(biāo)識,則具有該標(biāo)識的信息就從檢索系統(tǒng)中輸出,輸出的信息就是檢索命中的信息。89102.1.2信息檢索類型

1.按檢索方式分

(1)手工檢索使用的檢索工具主要是書本型、卡片式的信息系統(tǒng),即目錄、索引、文摘和各類工具書。

(2)計(jì)算機(jī)檢索是指人們利用數(shù)據(jù)庫、計(jì)算機(jī)軟件技術(shù)、計(jì)算機(jī)網(wǎng)絡(luò)及通信系統(tǒng)進(jìn)行的信息檢索,其檢索過程是在人機(jī)的協(xié)同作用下完成的。

112.按系統(tǒng)中文件的組織方式分

(1)全文檢索全文檢索指檢索系統(tǒng)中存儲的是整篇文章乃至整本圖書。用戶根據(jù)個(gè)人的需要從中獲取有關(guān)的章、節(jié)、段、句等信息,并且還可以做各種統(tǒng)計(jì)和分析。

(2)超文本檢索超文本結(jié)構(gòu)類似于人類的聯(lián)想記憶結(jié)構(gòu),它采用了一種非線性的網(wǎng)狀結(jié)構(gòu)組織塊狀信息,沒有固定的順序,也不要求讀者必須按照某個(gè)順序來閱讀。采用這種網(wǎng)狀結(jié)構(gòu),各信息塊很容易按照信息的原始結(jié)構(gòu)或人們的“聯(lián)想”關(guān)系加以組織。

(3)超媒體檢索由于把多媒體信息引入超文本里,產(chǎn)生了多媒體超文本,也即超媒體。它是對超文本檢索的補(bǔ)充,其存儲對象超出了文本范疇,融人了靜態(tài)、動態(tài)圖像及聲音等多媒體信息。信息存儲結(jié)構(gòu)從單維發(fā)展到多維,存儲空間范圍不斷擴(kuò)大。12

(1)書目信息檢索(2)全文信息檢索(2)數(shù)據(jù)信息檢索(3)事實(shí)信息檢索

3.按檢索的內(nèi)容和目標(biāo)分13(1)書目信息檢索

以標(biāo)題、作者、原文來源、摘要及收藏地點(diǎn)為檢索對象,是一種相關(guān)性檢索。特點(diǎn):檢索結(jié)果不直接解答課題用戶提出的技術(shù)問題,只提供與之相關(guān)的線索。一般以目錄、索引、文摘為檢索工具。例如:查找有關(guān)“復(fù)雜環(huán)境下機(jī)器人研究”方面的國內(nèi)外文獻(xiàn)信息有哪些?檢索工具:中文科技期刊數(shù)據(jù)庫、EI、SCI等。

14(2)全文信息檢索是利用各種全文系統(tǒng)獲取有關(guān)的全文信息,如以論文或?qū)@f明書的全文為檢索對象,也是相關(guān)性檢索。特點(diǎn):書目信息檢索基礎(chǔ)上更深層次的內(nèi)容檢索一般以各種全文系統(tǒng)(如圖書、期刊數(shù)據(jù)庫)為檢索工具例如:檢索四川大學(xué)學(xué)報(bào)(工程科版),2010,(6)“電力鐵塔攀爬機(jī)器人夾持機(jī)構(gòu)設(shè)計(jì)與分析”一文檢索工具:中國期刊全文數(shù)據(jù)庫15(3)數(shù)據(jù)信息檢索以具有數(shù)量性質(zhì)并以數(shù)值形式表示的數(shù)據(jù)為檢索對象,是一種確定性檢索。特點(diǎn):檢索的結(jié)果是經(jīng)過測試和評價(jià)過的各種數(shù)據(jù),可用于比較分析和定量分析。一般以數(shù)據(jù)大全、手冊、年鑒等為檢索工具。例如:2010年全國行政區(qū)劃數(shù)據(jù)?檢索工具中國統(tǒng)計(jì)年鑒201116(4)事實(shí)信息檢索

以事項(xiàng)為檢索對象,檢索結(jié)果是有關(guān)某一事物的具體答案,也是一種確定性檢索。一般利用字詞典、年鑒、百科全書、手冊等為檢索工具例如:哥本哈根會議的主要內(nèi)容是什么?17小結(jié)書目信息檢索是利用各種目錄、題錄和文摘工具獲取有關(guān)信息的線索。全文信息檢索是利用各種全文系統(tǒng)獲取有關(guān)的全文信息。數(shù)據(jù)和事實(shí)檢索是利用各種參考工具書獲取有關(guān)的確定性數(shù)據(jù)或事實(shí)信息。

182.1.3信息檢索系統(tǒng)

信息檢索系統(tǒng)是擁有一定的存儲、檢索技術(shù)裝備、存儲有各種信息,并能為用戶檢索所需信息的服務(wù)工作系統(tǒng)。手工檢索系統(tǒng)

計(jì)算機(jī)檢索系統(tǒng)19計(jì)算機(jī)信息檢索系統(tǒng)的類型

(以內(nèi)容層次分)目錄:如圖書館聯(lián)機(jī)公共目錄OPAC題錄:如我國的《全國報(bào)刊索引》、美國的《社會科學(xué)引文索引》SSCI等;文摘:是以精練的語言把文獻(xiàn)信息的重要內(nèi)容、學(xué)術(shù)觀點(diǎn)、數(shù)據(jù)及結(jié)構(gòu)準(zhǔn)確地摘錄并按一定的著錄規(guī)則與排列方式編排,供用戶查閱使用的一種檢索工具;全文:檢索過程中,全文系統(tǒng)先提供題錄和文摘信息,同時(shí)給出全文鏈接,供選擇下載。如CNKI、EBSCO等全文數(shù)據(jù)庫。20計(jì)算機(jī)信息檢索系統(tǒng)的類型

(以存儲設(shè)備和檢索方式分)1954年美國海軍兵器實(shí)驗(yàn)所圖書館用IBM701型電子管計(jì)算機(jī)建立了世界上第一個(gè)情報(bào)檢索系統(tǒng)。脫機(jī)檢索系統(tǒng)聯(lián)機(jī)檢索系統(tǒng)世界著名的聯(lián)機(jī)系統(tǒng)有Dialog系統(tǒng)、STN系統(tǒng)光盤檢索系統(tǒng)網(wǎng)絡(luò)檢索系統(tǒng)212.1.4信息檢索途徑

檢索途徑與文獻(xiàn)信息的特征相關(guān)。文獻(xiàn)的特征:外部特征和內(nèi)容特征文獻(xiàn)的外部特征:題名、著者、出版發(fā)行項(xiàng)、代碼等;文獻(xiàn)的內(nèi)容特征:主要是指文獻(xiàn)內(nèi)容所屬學(xué)科范圍及所包含的主題,常用分類號、主題詞等來描述。根據(jù)文獻(xiàn)外部特征和內(nèi)容特征,信息檢索途徑分為兩大類。22題名:書名、刊名、會議名作者號碼:書號ISBN、ISSN、標(biāo)準(zhǔn)號、專利號出版:出版社、出版時(shí)間、地點(diǎn)文獻(xiàn)的著錄外部特征內(nèi)容特征分類號主題詞2324信息檢索途徑責(zé)任者途徑題名途徑代碼途徑引文途徑出版情況(出版時(shí)間、出版社)分類途徑主題詞途徑關(guān)鍵詞途徑25外部特征:

題名途徑著者途徑代碼途徑內(nèi)部特征:

分類途徑主題途徑26以文獻(xiàn)的外部特征為檢索途徑:題名途徑:文獻(xiàn)的名稱書名索引、會議名稱索引、書目索引、刊名索引等著者途徑:個(gè)人或機(jī)關(guān)團(tuán)體,作者、編者、譯者等。作者索引、作者目錄、個(gè)人作者索引、團(tuán)體作者索引、專利權(quán)人索引代碼途徑:文獻(xiàn)本身的特定序號:如科技報(bào)告號、專利號、標(biāo)準(zhǔn)號等事物本身具有的某種符號代碼:如分子式、元素符號、結(jié)構(gòu)式等27以文獻(xiàn)的內(nèi)容特征為檢索途徑:分類途徑:課題的學(xué)科屬性,學(xué)科分類體系利用學(xué)科分類表、分類目錄、分類索引若課題所需信息范圍較廣,應(yīng)選用分類途徑,這樣可以比較準(zhǔn)確地檢索到與課題相關(guān)領(lǐng)域的資料。

主題途徑:按主題內(nèi)容進(jìn)行檢索的途徑,它沖破了按學(xué)科分類的束縛,使分散在各個(gè)學(xué)科領(lǐng)域里的有關(guān)同一課題的信息集中于同一主題,當(dāng)課題所需信息范圍窄而具體時(shí),以主題途徑檢索為宜。28292.2信息檢索語言2.2.1檢索語言的類型2.2.2關(guān)鍵詞語言30

概念:檢索語言又稱標(biāo)引語言,是系統(tǒng)存儲和檢索時(shí)共同使用的一種約定語言,以達(dá)到信息存儲和檢索的一致性,提高檢索效率。2.2.1檢索語言的類型31檢索語言的類型

體系分類語言分類語言組配分類語言混合分類語言標(biāo)題詞語言主題語言關(guān)鍵詞語言敘詞語言單元詞語言32體系分類語言

也稱分類法國內(nèi):

《中國圖書館分類法》(第五版),簡稱《中圖法》國外:《杜威十進(jìn)分類法》DDC、《國際十進(jìn)分類法》UDC、《美國國會圖書館圖書分類法》LCC33《中圖法》

根據(jù)圖書資料的特點(diǎn),按照從總到分,從一般到具體的編制原則,確定分類體系,在五個(gè)基本部類的基礎(chǔ)上,組成二十二個(gè)大類?!吨袌D法》的標(biāo)記符號標(biāo)記采用漢語拼音字母與阿拉伯?dāng)?shù)字相結(jié)合的混合號碼。即用一個(gè)字母表示一個(gè)大類,以字母的順序反映大類的序列。字母后用數(shù)字表示大類以下類目的劃分。數(shù)字的編號使用小數(shù)制。五個(gè)基本部類:1.馬克思主義、列林主義、毛澤東思想2.哲學(xué)3.社會科學(xué)4.自然科學(xué)5.綜合性圖書3435確定課題分類的方法確定分類號是分類途徑檢索文獻(xiàn)的關(guān)鍵;單概念課題在相關(guān)的大類中由大而小逐步查找接近課題要求的類號;并列概念課題,凡有主次者,應(yīng)取其重點(diǎn)或主要研究對象歸類。例如,“新聞宣傳研究”,如側(cè)重新聞,取“G212新聞采訪和報(bào)道”,如側(cè)重宣傳,則取“G223廣播電視宣傳和群眾工作”;應(yīng)用性課題,應(yīng)在所應(yīng)用和受影響的類目中查找。研究一種理論、方法、工藝等在多方面應(yīng)用或?qū)Χ喾矫嬖斐捎绊懙恼n題,則在該理論、方法、工藝等本身所屬的類目中查找。上位類分類方法。課題在分類表中無符合要求的專指類目時(shí),可以歸入它的緊鄰上位類。362.2.2關(guān)鍵詞語言

關(guān)鍵詞語言是一種主題語言,它是直接從原文的標(biāo)題、摘要、全文和檢索課題中抽選出來的具有實(shí)質(zhì)意義的、未經(jīng)規(guī)范化處理的自然語言詞匯,作為存儲和檢索依據(jù)的一種檢索語言。37關(guān)鍵詞,就是你輸入搜索框中的文字,也就是你命令數(shù)據(jù)庫系統(tǒng)或搜索引擎尋找的東西。又稱檢索入口詞。

而那些對文獻(xiàn)主題無實(shí)質(zhì)意義的詞匯,如冠詞、介詞、連詞、某些副詞以及某些形容詞均不能做關(guān)鍵詞。(禁用詞表)38關(guān)鍵詞法一般不編關(guān)鍵詞表,而是相反,

編制“非關(guān)鍵詞表”或稱“禁用詞表”,如:aasbutfromheinofthatwasyouanatbyhadherisonthiswhich&arebeforhavehisitortowith39關(guān)鍵詞的選擇一、注意專業(yè)性不使用過于通俗簡單的詞語,比如,你想查找有關(guān)降雨量方面的信息,雖然它屬于天氣方面的,但如果你輸入的是“天氣”,就會返回大量與天氣有關(guān)的信息,而結(jié)果中充斥大量無關(guān)的信息,但如你直接輸入“降雨量”,就會獲得比較滿意的結(jié)果。

40二、具有代表性

要注意一詞多意的問題,很多詞具有一詞多意的特性。比如,筆記本,可以指用來手寫的本子,也作為筆記本電腦的簡稱。遇到這類詞,可能需要在搜索框中輸入盡量減少歧義的詞語,比如改輸入筆記本電腦。41三、注意使用“同義詞”往往同一件事情或事物,不同作者喜歡用不同的詞來表達(dá),這就造成了龐大的同義詞,如果偏偏你頭腦中的“同義詞”不是那么全,造成漏檢就不足為怪了。例:碳纖維——碳纖維、炭纖維42確定課題關(guān)鍵詞的步驟1.分析課題,提取概念。課題涉及的最主要的事物名稱應(yīng)作為首先考慮到的檢索概念;2.整理概念,擴(kuò)充同義詞匯。將分析所得概念分成若干個(gè)組面,每一組用同義詞、近義詞、縮寫詞、復(fù)數(shù)形式等予以擴(kuò)展;3.運(yùn)用分析所得詞匯試查,確定課題合用的關(guān)鍵詞。43示例1課題:外商投資管理關(guān)鍵詞:外商、投資、管理擴(kuò)展概念:獨(dú)資、合資、資本、股權(quán)、法規(guī)、規(guī)定課題涉及的最主要的事物名稱應(yīng)作為首選的檢索概念,擴(kuò)充同義詞和近義詞。44休息一會兒休息一會兒452.3信息檢索技術(shù)2.3.1布爾邏輯檢索2.3.2其它檢索技術(shù)(位置算符檢索、截詞檢索、字段限制檢索)462.3.1布爾邏輯檢索

信息檢索技術(shù)是指利用現(xiàn)代信息檢索系統(tǒng)如聯(lián)機(jī)數(shù)據(jù)庫、光盤數(shù)據(jù)庫和網(wǎng)絡(luò)數(shù)據(jù)庫檢索有關(guān)信息而采用的相關(guān)技術(shù),主要有

布爾邏輯檢索位置算符檢索截詞檢索字段限制檢索47布爾邏輯檢索

在數(shù)據(jù)庫檢索中,檢索提問涉及的概念往往不止一個(gè),而是同一個(gè)概念涉及多個(gè)同義詞或相關(guān)詞,為了準(zhǔn)確表達(dá)檢索提問,必須使用邏輯算符將不同的檢索詞組配起來。常用布爾邏輯檢索。布爾檢索技術(shù)使用的邏輯算符:

(1)邏輯與(2)邏輯或(3)邏輯非48邏輯與

檢索式:AANDB

A*B

概念:邏輯與是一種具有概念交叉或概念限定關(guān)系的組配。2.算符:“AND”或“*”或“并且”3.特點(diǎn):增強(qiáng)專指度,提高查準(zhǔn)率。4.舉例:液壓機(jī)AND

結(jié)構(gòu)優(yōu)化,表示兩個(gè)概念應(yīng)同時(shí)包含在一條記錄中49邏輯或檢索式AORB

A+B概念:邏輯或是一種具有概念相同或概念相關(guān)關(guān)系的組配。2.算符:“OR”或“+”或“或者”3.特點(diǎn):擴(kuò)大檢索范圍,提高查全率。4.舉例:廢水OR

污水,表示這兩個(gè)相關(guān)概念分別在一條記錄中出現(xiàn)或同時(shí)在一條記錄中出現(xiàn)。50邏輯非檢索式ANOTB

A-B1.概念:邏輯非是一種具有概念排除關(guān)系的組配。2.算符:“NOT

”或“-”3.特點(diǎn):提高查準(zhǔn)率,影響查全率。4.舉例:機(jī)器人NOT蛇形,表示檢索出的記錄中要排除含有“蛇形機(jī)器人”的記錄。51查詢時(shí)用的()+-*?!均為半角!布爾邏輯算符查詢時(shí)用的()+-*?!均為半角!但是我們可以根據(jù)需要用括號()改變執(zhí)行順序。52布爾邏輯算符說明邏輯算符

“與”

兩個(gè)檢索詞A和B在檢索結(jié)果中必須同時(shí)出現(xiàn)“或”

兩個(gè)檢索詞A和B在檢索結(jié)果中任一出現(xiàn)即可“非”

兩個(gè)檢索詞A和B的后一個(gè)B不在檢索結(jié)果中出現(xiàn)關(guān)系算符

“*”(and,且)中國+歷史(找到中國且含歷史之書目)“+”(or,或)中國*歷史(找到中國或含歷史之書目)“—”

(not,不是)中國—?dú)v史(找含中國但不含歷史之書目)()優(yōu)先算符例如:(知識or信息)and經(jīng)濟(jì),在實(shí)際查詢時(shí),真正的關(guān)鍵字是“知識經(jīng)濟(jì)”或“信息經(jīng)濟(jì)”。以上四種操作符可互相結(jié)合使用,但有一定的執(zhí)行先后次序,其優(yōu)先順序依次為:括號、NOT、AND、OR53例:政治經(jīng)濟(jì)學(xué)and于光遠(yuǎn)

政治經(jīng)濟(jì)學(xué)*于光遠(yuǎn)表示檢索出來的文獻(xiàn)既含“政治經(jīng)濟(jì)學(xué)”同時(shí)又含“于光遠(yuǎn)”的文獻(xiàn)。ABAandB或A*BABAorB或A+B例:政治經(jīng)濟(jì)學(xué)or于光遠(yuǎn)政治經(jīng)濟(jì)學(xué)+于光遠(yuǎn)表示含有“政治經(jīng)濟(jì)學(xué)”、“于光遠(yuǎn)”、“政治經(jīng)濟(jì)學(xué)”和“于光遠(yuǎn)”均為命中文獻(xiàn)。54檢索技術(shù)-布爾邏輯檢索:運(yùn)用布爾邏輯算符(Booleanoperators)對檢索詞進(jìn)行邏輯組配,表達(dá)兩個(gè)概念之間的邏輯關(guān)系。邏輯“與”(and):檢索時(shí),命中信息同時(shí)含有兩個(gè)概念,專指性強(qiáng);邏輯“或”(or):檢索時(shí),命中信息包含所有關(guān)于邏輯A或邏輯B或同時(shí)有A和B的,檢索范圍比and擴(kuò)大。邏輯“非”(not):命中信息只包括邏輯A,不包括邏輯B或同時(shí)有A和B的,排除了不需要的檢索詞。邏輯“異或”(xor):命中信息包含邏輯A,也包含邏輯B,但不包含同時(shí)含有A和B的信息。

55在不同的檢索系統(tǒng)里,布爾邏輯的運(yùn)算次序是不同的,會導(dǎo)致檢索結(jié)果的不同。通常運(yùn)算次序有這樣幾種形式:一是按算符出現(xiàn)的順序,如果是and、or、not,就按and、or、not的順序運(yùn)算;如果是or、not、and,就按or、not、and的順序運(yùn)算;二是默認(rèn)and優(yōu)先運(yùn)算,其次是or、not;三是默認(rèn)or優(yōu)先運(yùn)算,然后是and、not。一般來講,檢索系統(tǒng)的“幫助”文件中都會有這類說明,只要注意查看即可。

在中文數(shù)據(jù)庫里,布爾邏輯運(yùn)算符有時(shí)用and、or、not下拉菜單形式表示,供用戶選擇;有時(shí)用“*”號表示邏輯“與”,用“+”表示邏輯“或”,用“-”表示邏輯“非”。56邏輯算符的組合使用方法

(構(gòu)造檢索提問式是計(jì)算機(jī)信息檢索的關(guān)鍵)

檢索題“跨國公司經(jīng)營管理研究”:

提問式1:(跨國公司+跨國企業(yè)+跨國經(jīng)營)×管理=檢索結(jié)果90篇

提問式2:(跨國公司+跨國企業(yè)+跨國經(jīng)營)×管理×(1997+1996)=檢索結(jié)果35篇

57“論中國特色的社會保障制度”:提問式1:(社會保障制度+社會保險(xiǎn)制度)×(我國+中國)×(PY=1997+PY=1996)=檢索結(jié)果99篇提問式2:(社會保障制度+社會保險(xiǎn)制度+養(yǎng)老保險(xiǎn)+醫(yī)療保險(xiǎn)+失業(yè)保障)×(我國+中國)×(PY=1997+PY=1996)=檢索結(jié)果160篇

擴(kuò)展檢索的方法:

概念的擴(kuò)大;范圍的擴(kuò)大;增加同義詞;年代的擴(kuò)大。

582.3.2其它檢索技術(shù)1.位置算符檢索2.截詞檢索3.字段限制檢索59位置算符檢索:

即運(yùn)用位置算符(positionoperators)表示兩個(gè)檢索詞間的位置鄰近關(guān)系,又叫鄰接檢索(proximity)。這種檢索技術(shù)通常只出現(xiàn)在西文數(shù)據(jù)庫中,在全文檢索中應(yīng)用較多。如果說布爾邏輯算符是表示兩個(gè)概念之間的邏輯關(guān)系的話,位置算符表示的是兩個(gè)概念在信息中的實(shí)際物理位置關(guān)系。60位置算符檢索(續(xù))With(field):samefieldorsamesequenceNear:samesentencePre(precede):librarypresciencelibraryscience,librarywithscience,...w/n(Within):libraryw/nsciencelibraryscience,sciencelibrary,…Field:samefieldSame:sameparagraph61常用的位置算符62常用的位置算符(續(xù))63截詞檢索截詞檢索:用截詞符號“?”、“*”或“$”加在檢索詞的前后或中間,以檢索一組概念相關(guān)或同一詞根的詞。這種檢索方式可以擴(kuò)大檢索范圍,提高查全率,主要用于西文數(shù)據(jù)庫檢索。中文數(shù)據(jù)庫通常不使用這種技術(shù)。截詞檢索類型截詞方式根據(jù)截詞的位置不同,分為前截?cái)?、后截?cái)?、中截?cái)?;根?jù)截?cái)嗟臄?shù)量不同,分為有限截?cái)嗪蜔o限截?cái)唷?4截詞檢索(續(xù))后截?cái)啵杭辞胺揭恢聶z索,又稱右截?cái)?,截詞符放在被截詞的右邊,是最常用的截詞檢索技術(shù)。后截?cái)嘀饕糜谙铝袡z索:詞的單復(fù)數(shù)檢索,如company與companies;年代檢索,如199?(九十年代);詞根檢索,如socio*,可以檢索sociobiology,socioecology,sociology等20多個(gè)詞匯。前截?cái)啵航卦~符放在被截詞的左邊,可與后截?cái)嘁煌褂?。例如輸?magnetic,可檢electro-magnetic、electromagnetic、thermo-magnetic等。目前這種檢索技術(shù)應(yīng)用已經(jīng)極少。中截?cái)啵喊呀卦~符放在詞的中間。如organi?ation,可檢索organisation、organization。這種方式查找英美不同拼法的概念最有效。65截詞檢索(續(xù))舉例——符號:*,?,$后截?cái)啵簂ibrar*library,libraries,librarian,…前截?cái)啵?magneticmagnetic,electro-magnetic,electromagnetic,thermo-magnetic,…中截?cái)啵簅rgani?ationorganization,organisation66截詞檢索(續(xù))截詞類型:根據(jù)截?cái)嗟臄?shù)量不同,分為有限截?cái)嗪蜔o限截?cái)?。無限截?cái)啵翰幌拗票唤財(cái)嗟淖址麛?shù)量,例如輸入educat?,可以檢索educator,educators,educated,educating,education,educational,等等。有限截?cái)啵合拗票唤財(cái)嗟淖址麛?shù)量,例如輸入educat**,表示被截?cái)嗟淖址挥袃蓚€(gè),可以檢索educator,educated兩個(gè)詞。673.字段限定檢索技術(shù)(fieldlimit)

限定檢索:為了提高檢索的查準(zhǔn)率,縮小檢索的范圍,將檢索詞限定在特定的字段中進(jìn)行檢索。限定字段通常包括:

TI---篇名AB---文摘SH---主題詞AU---著者Cs---著者單位DT---文獻(xiàn)類型JN---期刊名LA---語種PY---年份CC---分類號

KW---關(guān)鍵詞

常用檢索字段符682.4信息檢索的方法與步驟2.4.1信息檢索方法2.4.2信息檢索步驟2.4.3信息檢索效率692.4.1信息檢索方法1.順查法2.倒查法3.抽查法4.追溯法5.循環(huán)法701、順查法

是指按照時(shí)間的順序,由遠(yuǎn)及近地利用檢索系統(tǒng)進(jìn)行文獻(xiàn)信息檢索的方法。這種方法能收集到某一課題的系統(tǒng)文獻(xiàn),它適用于較大課題的文獻(xiàn)檢索。例如,已知某課題的起始年代,現(xiàn)在需要了解其發(fā)展的全過程,就可以用順查法從最初的年代開始,逐漸向近期查找。優(yōu)點(diǎn)是查全率高,缺點(diǎn)是費(fèi)工費(fèi)時(shí)。712、倒查法

是由近及遠(yuǎn),從新到舊,逆著時(shí)間的順序利用檢索工具進(jìn)行文獻(xiàn)檢索的方法。此法的重點(diǎn)是放在近期文獻(xiàn)上。使用這種方法可以最快地獲得最新資料。

優(yōu)點(diǎn)是節(jié)約時(shí)間,缺點(diǎn)是漏檢率較高。723、抽查法

是指針對課題的特點(diǎn),選擇有關(guān)該課題的文獻(xiàn)信息最可能出現(xiàn)或最多出現(xiàn)的時(shí)間段,利用檢索工具進(jìn)行重點(diǎn)檢索的方法。能以較短時(shí)間獲取較多的文獻(xiàn),但前提是必須熟悉該課題的學(xué)科發(fā)展。734、追溯法

是指不利用一般的檢索系統(tǒng),而是利用文獻(xiàn)后所列的參考文獻(xiàn),逐一追查原文(被引用文獻(xiàn)),然后再從這些原文后所列的參考文獻(xiàn)目錄逐一擴(kuò)大文獻(xiàn)信息范圍,一環(huán)扣一環(huán)地追查下去的方法。它可以像滾雪球一樣,依據(jù)文獻(xiàn)間的引用關(guān)系,獲得更好的檢索結(jié)果。745、循環(huán)法(交替法)

又稱分段法或綜合法。它是分期交替使用前4種方法,以期取長補(bǔ)短,相互配合,獲得更好的檢索結(jié)果。

75

2.4.2信息檢索步驟1.分析檢索課題2.選擇檢索系統(tǒng)制定檢索策略擬定檢索表達(dá)式并實(shí)施檢索評價(jià)檢索結(jié)果并調(diào)整檢索策略獲取原始文獻(xiàn)并整理檢索結(jié)果761.分析檢索課題

課題分析是信息檢索的基礎(chǔ),分析得是否全面透徹,是檢索能否取得成功的關(guān)鍵。分析課題,首先應(yīng)分析信息需求、確定檢索要求。信息需求是檢索的出發(fā)點(diǎn),信息需求不同,檢索要求不同,對檢索效果的評價(jià)標(biāo)準(zhǔn)也不同。分析課題,主要是分析該課題的學(xué)科范圍、主題內(nèi)容、目的,了解背景知識和課題涉及的各種名詞術(shù)語及其相互關(guān)系,確定檢索結(jié)果的時(shí)間范圍、文獻(xiàn)類型、文種和需要的數(shù)量等。772.選擇檢索系統(tǒng)

檢索系統(tǒng)種類繁多、各具特色,收錄范圍各有測重。了解:常用檢索系統(tǒng)的學(xué)科和主題,收錄的時(shí)間范圍、文獻(xiàn)類型、來源、國別、語種,讀者對象、更新周期、系統(tǒng)中文獻(xiàn)著錄格式或記錄格式等等。選擇:通過檢索系統(tǒng)的簡介和幫助文件、各種“指南”,圖書館的參考指導(dǎo)信息等來指導(dǎo)選擇。

應(yīng)當(dāng)在課題分析的基礎(chǔ)上,根據(jù)課題的特點(diǎn)、信息需求、檢索目的,選擇專業(yè)對口、覆蓋范圍廣、更新及時(shí)、內(nèi)容準(zhǔn)確權(quán)威、檢索功能完備的檢索系統(tǒng)。

783.制定檢索策略—確定檢索途徑和檢索方法

確定檢索途徑一般信息檢索都根據(jù)文獻(xiàn)的內(nèi)部特征和外部特提供多種檢索途徑,包括分類、主題、著者、機(jī)構(gòu)等。應(yīng)根據(jù)課題要求和系統(tǒng)所提供的檢索途徑來確定。當(dāng)檢索課題內(nèi)容涉及面廣,文獻(xiàn)需求范圍較寬,泛指性較強(qiáng)時(shí),宜選用分類途徑;當(dāng)課題內(nèi)容較窄,文獻(xiàn)需求的專指性較強(qiáng)時(shí),宜選用主題途徑;檢索時(shí)可以根據(jù)需要結(jié)合使用幾種方法,以提高查全率。確定檢索方法常用檢索方法有常規(guī)法、追溯法、綜合法三種。分別應(yīng)用于不同的檢索目的和檢索要求,可以綜合運(yùn)用各種檢索方法,以達(dá)到更好的檢索效果。794.擬定檢索表達(dá)式并實(shí)施檢索

檢索詞要準(zhǔn)確、全面地表達(dá)課題內(nèi)容,不能太大也不能太??;如果檢索系統(tǒng)使用的是規(guī)范化檢索語言,應(yīng)當(dāng)依據(jù)該檢索系統(tǒng)采用的詞表或分類法,將需要檢索的概念用規(guī)范化的語言表達(dá)出來。系統(tǒng)如果是采用自然語言標(biāo)引的,應(yīng)當(dāng)盡量全面地選取相關(guān)的詞與詞組作為檢索詞,以免漏檢。當(dāng)檢索課題包含較復(fù)雜的主題內(nèi)容時(shí),應(yīng)明確所需檢索的概念及其相互關(guān)系,在確定檢索詞后,根據(jù)檢索詞之間的關(guān)系,用系統(tǒng)支持的算符以及提供的各種選項(xiàng),將這些詞組配起來形成檢索提問式,以充分表達(dá)信息需求,805.評價(jià)檢索結(jié)果并調(diào)整檢索策略檢索效果評價(jià)是根據(jù)一定的指標(biāo)對信息檢索活動取得的成果進(jìn)行客觀科學(xué)評價(jià),以進(jìn)一步完善檢索工作的過程。主要的評價(jià)指標(biāo)是:查全率和查準(zhǔn)率。查

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論