信息檢索與利用--第二講教材_第1頁
信息檢索與利用--第二講教材_第2頁
信息檢索與利用--第二講教材_第3頁
信息檢索與利用--第二講教材_第4頁
信息檢索與利用--第二講教材_第5頁
已閱讀5頁,還剩96頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、群號(hào):群號(hào):回顧:回顧: 信息、知識(shí)、情報(bào)、文獻(xiàn)的概念及關(guān)系 文獻(xiàn)的種類按文獻(xiàn)的載體:印刷型、微縮型、聲像型、機(jī)讀型按文獻(xiàn)的加工:零次文獻(xiàn)、一次文獻(xiàn)、二次文獻(xiàn)和三次文獻(xiàn)按文獻(xiàn)的出版:圖書、期刊、報(bào)紙、學(xué)位論文、會(huì)議文獻(xiàn)、專利文獻(xiàn)、標(biāo)準(zhǔn)文獻(xiàn)、科技報(bào)告、政府出版物、產(chǎn)品資料在德國(guó)柏林大學(xué)圖書館的大門上刻著這樣的一名言:這把金鑰匙就是信息檢索方法?,F(xiàn)代信息社會(huì),科技信息數(shù)量急劇增長(zhǎng),不僅數(shù)量龐大,而且增長(zhǎng)的速度也令人驚嘆!據(jù)統(tǒng)計(jì):非科技內(nèi)容的文獻(xiàn)每3050年才增長(zhǎng)1倍;科技文獻(xiàn)平均每科技文獻(xiàn)平均每7 78 8年增長(zhǎng)年增長(zhǎng)1 1倍;倍;如計(jì)算機(jī)科學(xué)的文獻(xiàn),每如計(jì)算機(jī)科學(xué)的文獻(xiàn),每2 23 3年就翻一番

2、年就翻一番;科技文獻(xiàn)內(nèi)容交叉重復(fù)、文獻(xiàn)失效加快、文獻(xiàn)出版分散等內(nèi)容交叉重復(fù)、文獻(xiàn)失效加快、文獻(xiàn)出版分散等都給文獻(xiàn)的利用帶來不便。但是但是,現(xiàn)代信息傳播技術(shù)的進(jìn)步,使信息檢索,電子原文傳遞現(xiàn)代信息傳播技術(shù)的進(jìn)步,使信息檢索,電子原文傳遞等現(xiàn)代化信息傳播方式得以實(shí)現(xiàn),人們可以利用互聯(lián)網(wǎng)多途徑、等現(xiàn)代化信息傳播方式得以實(shí)現(xiàn),人們可以利用互聯(lián)網(wǎng)多途徑、多選擇、多層次地檢索所需文獻(xiàn)信息多選擇、多層次地檢索所需文獻(xiàn)信息催生了信息檢索技術(shù)。催生了信息檢索技術(shù)。 信息檢索的概念及類型信息檢索的概念及類型 檢索途徑與檢索語言檢索途徑與檢索語言 檢索系統(tǒng)與檢索方法檢索系統(tǒng)與檢索方法 檢索步驟與檢索策略檢索步驟與檢

3、索策略 檢索技術(shù)與檢索效果檢索技術(shù)與檢索效果 學(xué)習(xí)目的學(xué)習(xí)目的 了解信息檢索原理了解信息檢索原理 掌握信息檢索技術(shù)掌握信息檢索技術(shù) 了解檢索步驟了解檢索步驟 了解檢索效果評(píng)價(jià)及調(diào)整方法了解檢索效果評(píng)價(jià)及調(diào)整方法 熟悉檢索語言和途徑熟悉檢索語言和途徑一、信息檢索的概念一、信息檢索的概念1 1、信息檢索的含義、信息檢索的含義(廣義的信息檢索)(廣義的信息檢索)(information storage & information storage & Information Retrieval)全稱為“信息存儲(chǔ)與檢索”,是指將信息按一定的方式組織和存儲(chǔ)起來,并根據(jù)用戶的需要找出有關(guān)信息

4、的過程。(狹義的信息檢索)(狹義的信息檢索)(Information Retrieval)為“信息存儲(chǔ)與檢索”的后半部分,通常稱為“信息查找”或“信息搜索”,是指從信息集合中找出用戶所需要的有關(guān)信息的過程。2. 2. 信息檢索的實(shí)質(zhì)信息檢索的實(shí)質(zhì) 信息檢索的實(shí)質(zhì)是將描述用戶所需信息信息檢索的實(shí)質(zhì)是將描述用戶所需信息的提問特征,與信息存儲(chǔ)的檢索標(biāo)識(shí)進(jìn)行比的提問特征,與信息存儲(chǔ)的檢索標(biāo)識(shí)進(jìn)行比較,從中找出與提問特征一致或基本一致的較,從中找出與提問特征一致或基本一致的信息。信息。 信息檢索是對(duì)信息集合與需求集合的匹信息檢索是對(duì)信息集合與需求集合的匹配與選擇。配與選擇。3. 3. 信息存儲(chǔ)與信息檢索

5、的關(guān)系信息存儲(chǔ)與信息檢索的關(guān)系 信息存儲(chǔ)與信息檢索是密不可分的兩個(gè)信息存儲(chǔ)與信息檢索是密不可分的兩個(gè)過程,同時(shí)又是互逆的。存儲(chǔ)是為了檢索,過程,同時(shí)又是互逆的。存儲(chǔ)是為了檢索,而檢索必須先要存儲(chǔ)。沒有存儲(chǔ)檢索就無從而檢索必須先要存儲(chǔ)。沒有存儲(chǔ)檢索就無從談起。這是存儲(chǔ)與檢索相輔相成、相互依存談起。這是存儲(chǔ)與檢索相輔相成、相互依存的辯證關(guān)系。的辯證關(guān)系。 原理示意圖如下圖所示。1. 1. 存儲(chǔ)存儲(chǔ)的存儲(chǔ)過程的存儲(chǔ)過程。是把描述“一次文獻(xiàn)”特征信息按照檢索語言規(guī)則,進(jìn)行規(guī)范標(biāo)引按照檢索語言規(guī)則,進(jìn)行規(guī)范標(biāo)引形成“二次文獻(xiàn)二次文獻(xiàn)”,并存儲(chǔ)在“文獻(xiàn)檢索系統(tǒng)”中,這就是對(duì)一次文獻(xiàn)組織加工和記錄的過程,即

6、建立建立“文獻(xiàn)檢索系統(tǒng)文獻(xiàn)檢索系統(tǒng)”2. 2. 檢索過程檢索過程是讀者根據(jù)“檢索課題”,分析出檢索提問詞檢索提問詞與與數(shù)據(jù)庫(kù)文獻(xiàn)記錄中的數(shù)據(jù)庫(kù)文獻(xiàn)記錄中的標(biāo)引詞標(biāo)引詞進(jìn)行對(duì)比,當(dāng)進(jìn)行對(duì)比,當(dāng)提問詞與標(biāo)引詞匹配一致時(shí),即為命中,檢索成提問詞與標(biāo)引詞匹配一致時(shí),即為命中,檢索成功。功。4. 4. 信息檢索的作用信息檢索的作用 1) 1) 避免重復(fù)研究或走彎路避免重復(fù)研究或走彎路 2) 2) 節(jié)省學(xué)習(xí)者的時(shí)間節(jié)省學(xué)習(xí)者的時(shí)間 3) 3) 是獲取新知識(shí)的捷徑是獲取新知識(shí)的捷徑 二、信息檢索的類型二、信息檢索的類型 按檢索內(nèi)容可分為:按檢索內(nèi)容可分為:數(shù)據(jù)信息檢索(Data Information Re

7、trieval) 、事實(shí)信息檢索(Fact Information Retrieval)和文獻(xiàn)信息檢索(Document Information Retrieval)按組織方式可分為:按組織方式可分為:全文檢索(Full-Text Retrieval) 、超文本檢索(Hyper-Text Retrieval )和超媒體檢索(Hyper-Media Retrieval)按檢索手段可分為:按檢索手段可分為:有手工檢索、機(jī)械檢索和計(jì)算機(jī)檢索按檢索內(nèi)容或檢索目標(biāo)分 1) 文獻(xiàn)型信息檢索 文獻(xiàn)型信息檢索是指利用檢索工具或檢文獻(xiàn)型信息檢索是指利用檢索工具或檢索系統(tǒng)查找文獻(xiàn)的過程,索系統(tǒng)查找文獻(xiàn)的過程,包括

8、文獻(xiàn)線索檢索包括文獻(xiàn)線索檢索和文獻(xiàn)全文檢索。和文獻(xiàn)全文檢索。 文獻(xiàn)線索檢索是指利用檢索工具或檢索文獻(xiàn)線索檢索是指利用檢索工具或檢索系統(tǒng)查找文獻(xiàn)的出處,檢索結(jié)果是文獻(xiàn)線索。系統(tǒng)查找文獻(xiàn)的出處,檢索結(jié)果是文獻(xiàn)線索。 文獻(xiàn)全文檢索是以文獻(xiàn)所含的全部信息文獻(xiàn)全文檢索是以文獻(xiàn)所含的全部信息作為檢索內(nèi)容,即檢索系統(tǒng)存儲(chǔ)的是整篇文作為檢索內(nèi)容,即檢索系統(tǒng)存儲(chǔ)的是整篇文章或整部圖書的全部?jī)?nèi)容。文獻(xiàn)全文檢索是章或整部圖書的全部?jī)?nèi)容。文獻(xiàn)全文檢索是當(dāng)前計(jì)算機(jī)信息檢索的發(fā)展方向之一。當(dāng)前計(jì)算機(jī)信息檢索的發(fā)展方向之一。2) 事實(shí)型信息檢索 事實(shí)型信息檢索是以特定客觀事實(shí)為事實(shí)型信息檢索是以特定客觀事實(shí)為檢索對(duì)象,借助

9、于提供事實(shí)檢索的檢索工具檢索對(duì)象,借助于提供事實(shí)檢索的檢索工具與數(shù)據(jù)庫(kù)進(jìn)行撿索。其檢索結(jié)果為基本事實(shí)。與數(shù)據(jù)庫(kù)進(jìn)行撿索。其檢索結(jié)果為基本事實(shí)。如某個(gè)字、詞的查找,某一詩(shī)詞文句的查找,如某個(gè)字、詞的查找,某一詩(shī)詞文句的查找,某一年、月、日的查找,某一地名的查找,某一年、月、日的查找,某一地名的查找,某一人物的查找,某一機(jī)構(gòu)的查找某一事某一人物的查找,某一機(jī)構(gòu)的查找某一事件的查找,某一法規(guī)制度的查找,某一圖像件的查找,某一法規(guī)制度的查找,某一圖像的查找,某一數(shù)據(jù)、參數(shù)、公式或化學(xué)分子的查找,某一數(shù)據(jù)、參數(shù)、公式或化學(xué)分子式的查找等。式的查找等。 3) 數(shù)據(jù)型信息檢索 數(shù)據(jù)型信息檢索是一種確定性檢索

10、,數(shù)據(jù)型信息檢索是一種確定性檢索,是以數(shù)值或圖表形式表示的數(shù)據(jù)為檢索對(duì)象是以數(shù)值或圖表形式表示的數(shù)據(jù)為檢索對(duì)象的信息檢索,又稱的信息檢索,又稱“數(shù)值檢索數(shù)值檢索”。檢索系統(tǒng)。檢索系統(tǒng)中存儲(chǔ)的是大量的數(shù)據(jù),這些數(shù)據(jù)既包括物中存儲(chǔ)的是大量的數(shù)據(jù),這些數(shù)據(jù)既包括物質(zhì)的各種參數(shù)、電話號(hào)碼、銀行賬號(hào)、觀測(cè)質(zhì)的各種參數(shù)、電話號(hào)碼、銀行賬號(hào)、觀測(cè)數(shù)據(jù)、統(tǒng)計(jì)數(shù)據(jù)等數(shù)字?jǐn)?shù)據(jù),也包括圖表、數(shù)據(jù)、統(tǒng)計(jì)數(shù)據(jù)等數(shù)字?jǐn)?shù)據(jù),也包括圖表、圖譜、市場(chǎng)行情、化學(xué)分子式、物質(zhì)的各種圖譜、市場(chǎng)行情、化學(xué)分子式、物質(zhì)的各種特性等非數(shù)字?jǐn)?shù)據(jù)。特性等非數(shù)字?jǐn)?shù)據(jù)。按系統(tǒng)中信息的組織方式分 1) 全文檢索 指檢索系統(tǒng)中存儲(chǔ)的是整篇文章乃至指檢

11、索系統(tǒng)中存儲(chǔ)的是整篇文章乃至整本圖書。用戶根據(jù)個(gè)人的需求從中獲取有整本圖書。用戶根據(jù)個(gè)人的需求從中獲取有關(guān)的章、節(jié)、段、句等信息,并且還可以做關(guān)的章、節(jié)、段、句等信息,并且還可以做各種統(tǒng)計(jì)和分析。各種統(tǒng)計(jì)和分析。2) 超文本檢索 超文本結(jié)構(gòu)類似于人類的聯(lián)想記憶結(jié)超文本結(jié)構(gòu)類似于人類的聯(lián)想記憶結(jié)構(gòu),它采用了一種非線性的網(wǎng)狀結(jié)構(gòu)組織塊構(gòu),它采用了一種非線性的網(wǎng)狀結(jié)構(gòu)組織塊狀信息,沒有固定的順序也不要求讀者必狀信息,沒有固定的順序也不要求讀者必須按照某個(gè)順序來閱讀。采用這種網(wǎng)狀結(jié)構(gòu),須按照某個(gè)順序來閱讀。采用這種網(wǎng)狀結(jié)構(gòu),各信息塊很容易按照信息的原始結(jié)構(gòu)或人們各信息塊很容易按照信息的原始結(jié)構(gòu)或人們的

12、的“聯(lián)想聯(lián)想”關(guān)系加以組織。關(guān)系加以組織。3) 超媒體檢索 由于把多媒體信息引入超文本里產(chǎn)由于把多媒體信息引入超文本里產(chǎn)生了多媒體超文本,也即超媒體。它是對(duì)超生了多媒體超文本,也即超媒體。它是對(duì)超文本檢索的補(bǔ)充,其存儲(chǔ)對(duì)象超出了文本范文本檢索的補(bǔ)充,其存儲(chǔ)對(duì)象超出了文本范疇,融入了靜態(tài)、動(dòng)態(tài)圖像及聲音等多媒體疇,融入了靜態(tài)、動(dòng)態(tài)圖像及聲音等多媒體信息。信息存儲(chǔ)結(jié)構(gòu)從單維發(fā)展到多維,存信息。信息存儲(chǔ)結(jié)構(gòu)從單維發(fā)展到多維,存儲(chǔ)空間范圍不斷擴(kuò)大。儲(chǔ)空間范圍不斷擴(kuò)大。按檢索手段可分為:按檢索手段可分為:手工檢索:是人直接用手、眼、手工檢索:是人直接用手、眼、 腦組織、查找印刷型文獻(xiàn)的檢索。具有直腦組織

13、、查找印刷型文獻(xiàn)的檢索。具有直觀、靈活、無需各種設(shè)備和上機(jī)費(fèi)用的優(yōu)點(diǎn)。觀、靈活、無需各種設(shè)備和上機(jī)費(fèi)用的優(yōu)點(diǎn)。 機(jī)械信息檢索:機(jī)械信息檢索:2020世紀(jì)世紀(jì)5050年代開始年代開始, ,過渡階段過渡階段, ,分機(jī)電信息檢索和光電信息分機(jī)電信息檢索和光電信息檢索。檢索。 機(jī)電:使用諸如打孔機(jī)、驗(yàn)孔機(jī)、分類機(jī)等機(jī)電設(shè)備記錄二次文獻(xiàn),用機(jī)電:使用諸如打孔機(jī)、驗(yàn)孔機(jī)、分類機(jī)等機(jī)電設(shè)備記錄二次文獻(xiàn),用電刷作為檢索元件的信息檢索系統(tǒng)。電刷作為檢索元件的信息檢索系統(tǒng)。 光電:使用縮微照相記錄二次文獻(xiàn),以膠卷或膠片邊緣部分若干黑白小光電:使用縮微照相記錄二次文獻(xiàn),以膠卷或膠片邊緣部分若干黑白小方塊的不同組合做

14、檢索標(biāo)志,利用光電檢索元件查找文獻(xiàn)的系統(tǒng)。方塊的不同組合做檢索標(biāo)志,利用光電檢索元件查找文獻(xiàn)的系統(tǒng)。計(jì)算機(jī)檢索:將檢索提問標(biāo)識(shí)與存儲(chǔ)在數(shù)據(jù)庫(kù)中的標(biāo)引標(biāo)識(shí)自動(dòng)進(jìn)行比較,計(jì)算機(jī)檢索:將檢索提問標(biāo)識(shí)與存儲(chǔ)在數(shù)據(jù)庫(kù)中的標(biāo)引標(biāo)識(shí)自動(dòng)進(jìn)行比較,含有該標(biāo)識(shí)選出相匹配的信息就會(huì)從數(shù)據(jù)庫(kù)中并通過計(jì)算機(jī)輸出的過程。含有該標(biāo)識(shí)選出相匹配的信息就會(huì)從數(shù)據(jù)庫(kù)中并通過計(jì)算機(jī)輸出的過程。第二節(jié)第二節(jié) 檢索途徑與檢索語言檢索途徑與檢索語言一、檢索途徑一、檢索途徑 1. 1. 以文獻(xiàn)的外部特征為檢索途徑以文獻(xiàn)的外部特征為檢索途徑 1) 1) 題名途徑題名途徑 文獻(xiàn)題名是指文獻(xiàn)的名稱,如圖書的書名、期刊文獻(xiàn)題名是指文獻(xiàn)的名稱,如

15、圖書的書名、期刊的刊名、報(bào)紙的報(bào)紙名稱、光盤的光盤名稱等。它的刊名、報(bào)紙的報(bào)紙名稱、光盤的光盤名稱等。它是認(rèn)識(shí)一篇文獻(xiàn)的起點(diǎn)。通過題名途徑可查找圖書、是認(rèn)識(shí)一篇文獻(xiàn)的起點(diǎn)。通過題名途徑可查找圖書、期刊、單篇文獻(xiàn)。檢索工具中的書名索引、會(huì)議名期刊、單篇文獻(xiàn)。檢索工具中的書名索引、會(huì)議名稱索引、書目索引、刊名索引等都提供了從題名進(jìn)稱索引、書目索引、刊名索引等都提供了從題名進(jìn)行文獻(xiàn)檢索的途徑。行文獻(xiàn)檢索的途徑。 2) 2) 著者途徑著者途徑 文獻(xiàn)著者是指對(duì)文獻(xiàn)內(nèi)容負(fù)有責(zé)任的個(gè)人或機(jī)文獻(xiàn)著者是指對(duì)文獻(xiàn)內(nèi)容負(fù)有責(zé)任的個(gè)人或機(jī)關(guān)團(tuán)體,也就是我們常說的作者、編者、譯者等。關(guān)團(tuán)體,也就是我們常說的作者、編者、

16、譯者等。著者途徑也是人們檢索文獻(xiàn)經(jīng)常使用的一條途徑,著者途徑也是人們檢索文獻(xiàn)經(jīng)常使用的一條途徑,包含個(gè)人著者、團(tuán)體著者、專利發(fā)明人、專利權(quán)人、包含個(gè)人著者、團(tuán)體著者、專利發(fā)明人、專利權(quán)人、合同戶、學(xué)術(shù)會(huì)議主辦單位等。利用責(zé)任者途徑檢合同戶、學(xué)術(shù)會(huì)議主辦單位等。利用責(zé)任者途徑檢索文獻(xiàn),主要利用的是作者索引、作者目錄、個(gè)人索文獻(xiàn),主要利用的是作者索引、作者目錄、個(gè)人作者索引、團(tuán)體作者索引、專利權(quán)人索引等。作者索引、團(tuán)體作者索引、專利權(quán)人索引等。 3) 代碼途徑 很多文獻(xiàn)因其本身特點(diǎn)有特定序號(hào),如科技報(bào)很多文獻(xiàn)因其本身特點(diǎn)有特定序號(hào),如科技報(bào)告號(hào)、專利號(hào)、標(biāo)準(zhǔn)號(hào)、信息收藏單位的入藏號(hào)、告號(hào)、專利號(hào)、

17、標(biāo)準(zhǔn)號(hào)、信息收藏單位的入藏號(hào)、ISBNISBN、ISSNISSN等。代碼途徑就是依據(jù)文獻(xiàn)信息出版時(shí)等。代碼途徑就是依據(jù)文獻(xiàn)信息出版時(shí)所編的代碼順序來檢索文獻(xiàn)信息的途徑。這些序號(hào)所編的代碼順序來檢索文獻(xiàn)信息的途徑。這些序號(hào)往往具有唯一性,可以據(jù)此識(shí)別特定的文獻(xiàn)信息。往往具有唯一性,可以據(jù)此識(shí)別特定的文獻(xiàn)信息。依據(jù)這些序號(hào)數(shù)字順序可編制序號(hào)索引,提供序號(hào)依據(jù)這些序號(hào)數(shù)字順序可編制序號(hào)索引,提供序號(hào)檢索途徑。同時(shí),許多檢索系統(tǒng)利用事物本身具有檢索途徑。同時(shí),許多檢索系統(tǒng)利用事物本身具有的某種符號(hào)代碼編制成分子式、元素符號(hào)、結(jié)構(gòu)式的某種符號(hào)代碼編制成分子式、元素符號(hào)、結(jié)構(gòu)式等索引,提供從特定符號(hào)代碼順

18、序進(jìn)行檢索的途徑,等索引,提供從特定符號(hào)代碼順序進(jìn)行檢索的途徑,如化合物索引。如化合物索引。2. 以文獻(xiàn)的內(nèi)容特征為檢索途徑 1) 分類途徑 分類途徑是以課題的學(xué)科屬性為出發(fā)點(diǎn),分類途徑是以課題的學(xué)科屬性為出發(fā)點(diǎn),按學(xué)科分類體系來查找文獻(xiàn)信息,以分類作按學(xué)科分類體系來查找文獻(xiàn)信息,以分類作為檢索點(diǎn),利用學(xué)科分類表、分類目錄、分為檢索點(diǎn),利用學(xué)科分類表、分類目錄、分類索引等按學(xué)科體系編排的檢索工具來查找類索引等按學(xué)科體系編排的檢索工具來查找有關(guān)某一學(xué)科或相關(guān)學(xué)科領(lǐng)域的文獻(xiàn)信息。有關(guān)某一學(xué)科或相關(guān)學(xué)科領(lǐng)域的文獻(xiàn)信息。它能滿足族性檢索的需求。它能滿足族性檢索的需求。 2) 主題途徑 主題途徑是利用信

19、息的主題內(nèi)容進(jìn)行檢主題途徑是利用信息的主題內(nèi)容進(jìn)行檢索的途徑,即利用從自然語言中抽象出來的,索的途徑,即利用從自然語言中抽象出來的,或者經(jīng)過人工規(guī)范化的、能夠代表信息內(nèi)容或者經(jīng)過人工規(guī)范化的、能夠代表信息內(nèi)容的標(biāo)引詞來檢索。它沖破了按學(xué)科分類的束的標(biāo)引詞來檢索。它沖破了按學(xué)科分類的束縛,使分散在各個(gè)學(xué)科領(lǐng)域里的有關(guān)同一課縛,使分散在各個(gè)學(xué)科領(lǐng)域里的有關(guān)同一課題的信息集中于同一主題,使用時(shí)就如同查題的信息集中于同一主題,使用時(shí)就如同查字典一樣方便和快捷。其最大優(yōu)點(diǎn)是把同性字典一樣方便和快捷。其最大優(yōu)點(diǎn)是把同性質(zhì)的事物集中于一處,使用戶在檢索時(shí)便于質(zhì)的事物集中于一處,使用戶在檢索時(shí)便于選取,而且將

20、同類事物集中在一起的方法符選取,而且將同類事物集中在一起的方法符合人們的工作和生活習(xí)慣,直接而準(zhǔn)確。合人們的工作和生活習(xí)慣,直接而準(zhǔn)確。 二、檢索語言 1. 檢索語言的含義 檢索語言是根據(jù)信息檢索的需要而創(chuàng)造的專供信檢索語言是根據(jù)信息檢索的需要而創(chuàng)造的專供信息存儲(chǔ)和信息檢索使用的一種人工語言。息存儲(chǔ)和信息檢索使用的一種人工語言。 檢索語言是在文獻(xiàn)信息檢索過程中使用的特定語檢索語言是在文獻(xiàn)信息檢索過程中使用的特定語言形式,它的作用在于促成信息檢索系統(tǒng)與檢索用言形式,它的作用在于促成信息檢索系統(tǒng)與檢索用戶的溝通。戶的溝通。 u當(dāng)存儲(chǔ)信息時(shí),當(dāng)存儲(chǔ)信息時(shí),檢索系統(tǒng)對(duì)文獻(xiàn)內(nèi)容進(jìn)檢索系統(tǒng)對(duì)文獻(xiàn)內(nèi)容進(jìn)行分

21、析,概括分析出若干能代表文獻(xiàn)內(nèi)行分析,概括分析出若干能代表文獻(xiàn)內(nèi)容的語詞并賦于一定的標(biāo)識(shí),如題名、容的語詞并賦于一定的標(biāo)識(shí),如題名、作者、主題詞等,作為存儲(chǔ)與檢索的依作者、主題詞等,作為存儲(chǔ)與檢索的依據(jù),然后納入到數(shù)據(jù)庫(kù)中。據(jù),然后納入到數(shù)據(jù)庫(kù)中。u當(dāng)檢索信息時(shí),當(dāng)檢索信息時(shí),檢索人員首先要對(duì)檢索檢索人員首先要對(duì)檢索課題進(jìn)行分析,同樣形成若干能代表信課題進(jìn)行分析,同樣形成若干能代表信息需求的語詞,然后通過檢索系統(tǒng)在數(shù)息需求的語詞,然后通過檢索系統(tǒng)在數(shù)據(jù)庫(kù)中匹配具有同樣語詞和標(biāo)識(shí)的文獻(xiàn),據(jù)庫(kù)中匹配具有同樣語詞和標(biāo)識(shí)的文獻(xiàn),找到自己所需的信息找到自己所需的信息。2. 檢索語言的類型 1)描述文獻(xiàn)外

22、部特征的語言 (1 1)題名語言)題名語言 (2 2)著者語言)著者語言 (3 3)代碼語言)代碼語言 (1 1)分類語言)分類語言按照學(xué)科范疇及知識(shí)之間的關(guān)系列出類目,并用數(shù)字、字母符號(hào)對(duì)類目按照學(xué)科范疇及知識(shí)之間的關(guān)系列出類目,并用數(shù)字、字母符號(hào)對(duì)類目進(jìn)行標(biāo)識(shí)的一種語言體系,也稱分類法。使用這種檢索語言建立的信息進(jìn)行標(biāo)識(shí)的一種語言體系,也稱分類法。使用這種檢索語言建立的信息檢索系統(tǒng)可以反映知識(shí)的從屬、派生、重合、交叉、并列等關(guān)系,用戶檢索系統(tǒng)可以反映知識(shí)的從屬、派生、重合、交叉、并列等關(guān)系,用戶因此可以鳥瞰全貌、觸類旁通,系統(tǒng)地掌握和利用一個(gè)學(xué)科或?qū)I(yè)范圍因此可以鳥瞰全貌、觸類旁通,系統(tǒng)地

23、掌握和利用一個(gè)學(xué)科或?qū)I(yè)范圍的知識(shí)相信息。的知識(shí)相信息。 分類語言是用分類號(hào)表達(dá)學(xué)科體系的各種概念,將各種概念按學(xué)科性質(zhì)分類語言是用分類號(hào)表達(dá)學(xué)科體系的各種概念,將各種概念按學(xué)科性質(zhì)進(jìn)行分類和系統(tǒng)排列。進(jìn)行分類和系統(tǒng)排列。2 2)描述文獻(xiàn)內(nèi)部特征的語言)描述文獻(xiàn)內(nèi)部特征的語言例:例:中國(guó)圖書館分類法 中國(guó)科學(xué)院圖書館圖書分類法中國(guó)人民大學(xué)圖書館圖書分類法杜威十進(jìn)分類法DDC國(guó)會(huì)圖書館分類法LCC(2 2)主題語言)主題語言 主題主題“是一組具有共性事物的總稱,是一組具有共性事物的總稱,用以表達(dá)文獻(xiàn)所論述和研究的具體對(duì)象和問用以表達(dá)文獻(xiàn)所論述和研究的具體對(duì)象和問題題”,即文獻(xiàn)的,即文獻(xiàn)的“中心內(nèi)

24、容中心內(nèi)容”。每種文獻(xiàn)都。每種文獻(xiàn)都包含著若干主題,研究或闡述一個(gè)或多個(gè)問包含著若干主題,研究或闡述一個(gè)或多個(gè)問題。主題詞就是表達(dá)主題概念的詞匯。題。主題詞就是表達(dá)主題概念的詞匯。 人工語言人工語言自然語言自然語言標(biāo)引工作量大標(biāo)引工作量大自動(dòng)標(biāo)引完成自動(dòng)標(biāo)引完成需要不斷維護(hù),管理成需要不斷維護(hù),管理成本高本高靈活、檢索入口多、靈活、檢索入口多、管理和維護(hù)成本低管理和維護(hù)成本低用戶不易掌握用戶不易掌握用戶易掌握,但不易用戶易掌握,但不易精確精確查全率不高查全率不高查準(zhǔn)率不高查準(zhǔn)率不高第三節(jié) 檢索系統(tǒng)與檢索方法一、檢索系統(tǒng) 1. 檢索系統(tǒng)的概念 信息檢索系統(tǒng)是為滿足信息用戶的檢索需求而建立起信息檢

25、索系統(tǒng)是為滿足信息用戶的檢索需求而建立起來的、以提供信息檢索為目的的信息存儲(chǔ)與檢索系統(tǒng)。來的、以提供信息檢索為目的的信息存儲(chǔ)與檢索系統(tǒng)。 可以說,一個(gè)信息檢索系統(tǒng)便是一定范圍文獻(xiàn)、信息可以說,一個(gè)信息檢索系統(tǒng)便是一定范圍文獻(xiàn)、信息的全部記錄的有序集合。的全部記錄的有序集合。2. 檢索系統(tǒng)的類型 (1) (1) 按加工手段和技術(shù)設(shè)備的不同,可將檢索系按加工手段和技術(shù)設(shè)備的不同,可將檢索系統(tǒng)分為:手工檢索系統(tǒng)、機(jī)械檢索系統(tǒng)、計(jì)算機(jī)檢統(tǒng)分為:手工檢索系統(tǒng)、機(jī)械檢索系統(tǒng)、計(jì)算機(jī)檢索系統(tǒng)。索系統(tǒng)。 (2) (2) 按載體形式不同,可分為卡片式、書本式、按載體形式不同,可分為卡片式、書本式、縮微式、磁性材

26、料式等檢索系統(tǒng)??s微式、磁性材料式等檢索系統(tǒng)。 (3) (3) 按著錄格式不同,可將檢索系統(tǒng)分為目錄、按著錄格式不同,可將檢索系統(tǒng)分為目錄、題錄、文摘、索引、全文檢索系統(tǒng)。題錄、文摘、索引、全文檢索系統(tǒng)。二、檢索方法 1. 常用法 常用法是利用檢索工具查找信息的一種方法,常用法是利用檢索工具查找信息的一種方法,因?yàn)檫@種方法是目前查找信息中最常使用的,故亦因?yàn)檫@種方法是目前查找信息中最常使用的,故亦稱常用法。稱常用法。 (1) (1) 順查法順查法 (2) (2) 倒查法倒查法 (3) (3) 抽查法抽查法 (1) (1) 順查法順查法 是指按年代由遠(yuǎn)及近的順序進(jìn)行查找的是指按年代由遠(yuǎn)及近的順序

27、進(jìn)行查找的方法,如檢索方法,如檢索“電視文化電視文化”這一課題,首先這一課題,首先要弄清起始時(shí)間,即要弄清起始時(shí)間,即“電視文化電視文化”產(chǎn)生的時(shí)產(chǎn)生的時(shí)間是哪一年,然后從這一年開始查起,一直間是哪一年,然后從這一年開始查起,一直查到當(dāng)前查到當(dāng)前“電視文化電視文化”方面的相關(guān)信息為止。方面的相關(guān)信息為止。這樣,這樣,“電視文化電視文化”課題就檢索完畢。這種課題就檢索完畢。這種方法的查全率和查準(zhǔn)率都較高,但是檢索整方法的查全率和查準(zhǔn)率都較高,但是檢索整個(gè)課題較費(fèi)時(shí)費(fèi)力。個(gè)課題較費(fèi)時(shí)費(fèi)力。 (2) (2) 倒查法倒查法 是指按年代由近及遠(yuǎn)的逆時(shí)間查找方法,是指按年代由近及遠(yuǎn)的逆時(shí)間查找方法,這種方

28、法多用于新課題、新觀點(diǎn)、新理論、這種方法多用于新課題、新觀點(diǎn)、新理論、新技術(shù)的檢索,檢索的重點(diǎn)在近期信息上,新技術(shù)的檢索,檢索的重點(diǎn)在近期信息上,只需查到基本滿足需要時(shí)為止。使用這種方只需查到基本滿足需要時(shí)為止。使用這種方法可以最快地獲得新資料,而且近期資料總法可以最快地獲得新資料,而且近期資料總是既概括、引用前期的成果,又反映最新的是既概括、引用前期的成果,又反映最新的水平和動(dòng)向,因此這種方法比較省力,但查水平和動(dòng)向,因此這種方法比較省力,但查全率不高。全率不高。 (3) (3) 抽查法抽查法 是一種針對(duì)學(xué)科發(fā)展特點(diǎn),抓住該學(xué)科是一種針對(duì)學(xué)科發(fā)展特點(diǎn),抓住該學(xué)科發(fā)展迅速、信息發(fā)表較多的年代發(fā)

29、展迅速、信息發(fā)表較多的年代( (信息的高峰信息的高峰期期) ),抽出一段時(shí)間,抽出一段時(shí)間( (幾年或十幾年幾年或十幾年) ),再進(jìn)行,再進(jìn)行逐年檢索的方法。這種方法費(fèi)時(shí)較少,獲得逐年檢索的方法。這種方法費(fèi)時(shí)較少,獲得信息較多,檢索效率較高。但是這種方法的信息較多,檢索效率較高。但是這種方法的成功率和有效率必須建立在熟悉學(xué)科發(fā)展特成功率和有效率必須建立在熟悉學(xué)科發(fā)展特點(diǎn)的基礎(chǔ)上。也就是說,只有對(duì)該學(xué)科或課點(diǎn)的基礎(chǔ)上。也就是說,只有對(duì)該學(xué)科或課題的發(fā)展熟悉的情況下,才適合使用。題的發(fā)展熟悉的情況下,才適合使用。2. 追溯法 追溯法是一種跟蹤查找的方法,即以文追溯法是一種跟蹤查找的方法,即以文獻(xiàn)后

30、面所附的參考文獻(xiàn)為線索,逐一追溯查獻(xiàn)后面所附的參考文獻(xiàn)為線索,逐一追溯查找相關(guān)文獻(xiàn)的方法。找相關(guān)文獻(xiàn)的方法。3. 循環(huán)法 循環(huán)法是常用法和追溯法的結(jié)合,檢循環(huán)法是常用法和追溯法的結(jié)合,檢索時(shí),先利用檢索工具查出一批文獻(xiàn),然后索時(shí),先利用檢索工具查出一批文獻(xiàn),然后選擇出與檢索課題針對(duì)性較強(qiáng)的文獻(xiàn),再按選擇出與檢索課題針對(duì)性較強(qiáng)的文獻(xiàn),再按文獻(xiàn)后所附的參考文獻(xiàn)回溯查找,不斷擴(kuò)大文獻(xiàn)后所附的參考文獻(xiàn)回溯查找,不斷擴(kuò)大檢索線索,分期分段地交替進(jìn)行,循環(huán)下去,檢索線索,分期分段地交替進(jìn)行,循環(huán)下去,直到滿意為止。直到滿意為止。4. 檢索方法的選擇原則 (1) (1) 檢索條件檢索條件 (2) (2) 檢

31、索要求檢索要求 (3) (3) 學(xué)科特點(diǎn)學(xué)科特點(diǎn) 第四節(jié)第四節(jié) 檢索技術(shù)與檢索效果檢索技術(shù)與檢索效果一、常用檢索技術(shù) 1. 布爾邏輯檢索 1) 邏輯與“AND” 邏輯與(邏輯與(ANDAND或或“”)是反映概念之間)是反映概念之間交叉和限定關(guān)系的一種組配方式,用以縮小交叉和限定關(guān)系的一種組配方式,用以縮小檢索范圍,減少輸出結(jié)果,提高查準(zhǔn)率。檢索范圍,減少輸出結(jié)果,提高查準(zhǔn)率。 A AND B A AND B表示同時(shí)含有表示同時(shí)含有A A、B B兩檢索項(xiàng)兩檢索項(xiàng)的才為檢索結(jié)果的才為檢索結(jié)果 2) 邏輯或“OR” 邏輯或(邏輯或(OROR或或“+”+”)是反映概念之間)是反映概念之間并列關(guān)系的一種

32、組配方式,使用它相當(dāng)于增并列關(guān)系的一種組配方式,使用它相當(dāng)于增加檢索詞主題的同義詞與近義詞,可擴(kuò)大檢加檢索詞主題的同義詞與近義詞,可擴(kuò)大檢索范圍、增加輸出結(jié)果,提高查全率。索范圍、增加輸出結(jié)果,提高查全率。 A OR B A OR B表示文獻(xiàn)信息中凡含有檢索表示文獻(xiàn)信息中凡含有檢索詞詞A A或者檢索詞或者檢索詞B B或者同時(shí)含有檢索詞或者同時(shí)含有檢索詞A A和和B B的的即為命中結(jié)果即為命中結(jié)果 3) 邏輯非“NOT” 邏輯非(邏輯非(NOTNOT或或“”)可以用來排除)可以用來排除不希望出現(xiàn)的檢索詞,它與邏輯與不希望出現(xiàn)的檢索詞,它與邏輯與“AND”AND”的的作用類似,能夠縮小命中信息的范

33、圍,提高作用類似,能夠縮小命中信息的范圍,提高檢索的查準(zhǔn)率。檢索的查準(zhǔn)率。 A NOT B A NOT B用于從包含用于從包含A A的文獻(xiàn)信息范的文獻(xiàn)信息范圍中減去含有圍中減去含有B B的內(nèi)容的內(nèi)容布爾邏輯檢索布爾邏輯檢索: 即運(yùn)用布爾邏輯算符對(duì)檢索詞進(jìn)行邏輯組配即運(yùn)用布爾邏輯算符對(duì)檢索詞進(jìn)行邏輯組配,表達(dá)表達(dá)兩個(gè)概念之間的邏輯關(guān)系兩個(gè)概念之間的邏輯關(guān)系 ,有三種,有三種:布爾邏輯用在何處?布爾邏輯用在何處?布爾邏輯用在何處?布爾邏輯用在何處?布爾邏輯檢索詞之間的邏輯關(guān)系?檢索詞之間的邏輯關(guān)系?布爾邏輯布爾邏輯And, or, notCNK高級(jí)檢索界面高級(jí)檢索界面EBSCO高級(jí)檢索界面高級(jí)檢索

34、界面AB4.4.) 布爾邏輯算符的運(yùn)算及次序布爾邏輯算符的運(yùn)算及次序 ,如:如:car and industry ,檢中結(jié)果中必須檢中結(jié)果中必須同時(shí)含同時(shí)含有有 car 和和 industry 才符合要求。才符合要求。運(yùn)算符為運(yùn)算符為AndAnd、* *、& &表示;檢索時(shí)表示;檢索時(shí), ,命中信息同時(shí)含有兩個(gè)概念命中信息同時(shí)含有兩個(gè)概念, ,專指專指性強(qiáng)性強(qiáng). .可以縮小檢索范圍可以縮小檢索范圍, ,提高查準(zhǔn)率。提高查準(zhǔn)率。 如:如:college or university ,檢中結(jié)果中檢中結(jié)果中 含有含有 college 或或 university 任一個(gè)就符合檢索要求任

35、一個(gè)就符合檢索要求. .運(yùn)算符為運(yùn)算符為 Or Or 、或、或“+ +”表示。檢索時(shí),命中信息包含所有關(guān)于邏輯表示。檢索時(shí),命中信息包含所有關(guān)于邏輯A A或邏輯或邏輯B B或同時(shí)有或同時(shí)有A A和和B B的,可以擴(kuò)大檢索范圍,提高查全率。的,可以擴(kuò)大檢索范圍,提高查全率。如如 television not cable, 檢中結(jié)果中檢中結(jié)果中出現(xiàn)出現(xiàn) television 但不能出現(xiàn)但不能出現(xiàn) cable 電纜電纜.運(yùn)算符(運(yùn)算符( Not Not 、或、或“- -”表示,命中信息包含邏輯表示,命中信息包含邏輯A A,不包含邏輯,不包含邏輯B,B, 可以排除不必要的信息,提高查準(zhǔn)率。可以排除不必

36、要的信息,提高查準(zhǔn)率。4.4.優(yōu)先級(jí)運(yùn)算優(yōu)先級(jí)運(yùn)算:(:( ) Not And Or (EBSCO 規(guī)則)規(guī)則) 2、截詞檢索、截詞檢索在西文數(shù)據(jù)庫(kù)中廣泛用。在西文數(shù)據(jù)庫(kù)中廣泛用。截詞檢索是用截?cái)嘣~的一個(gè)局部進(jìn)行的檢索,凡是滿足這個(gè)截詞檢索是用截?cái)嘣~的一個(gè)局部進(jìn)行的檢索,凡是滿足這個(gè)截詞所有字符截詞所有字符( (串串) )的記錄,系統(tǒng)都為命中。的記錄,系統(tǒng)都為命中。 * *、?、?均可以均可以 表示截詞的截?cái)喾?hào),各檢索系統(tǒng)有不同的表示截詞的截?cái)喾?hào),各檢索系統(tǒng)有不同的規(guī)定,沒有統(tǒng)一標(biāo)準(zhǔn)。規(guī)定,沒有統(tǒng)一標(biāo)準(zhǔn)。分為:分為:有限截詞有限截詞即一個(gè)截詞符只代表一個(gè)字符;即一個(gè)截詞符只代表一個(gè)字符;無

37、限截詞無限截詞即即一個(gè)截詞符可代表多個(gè)字符。一個(gè)截詞符可代表多個(gè)字符。按截詞的位置劃分為:按截詞的位置劃分為: 前截、中截、后截:前截、中截、后截:前截?cái)啵ê蠓揭恢拢河址Q左截?cái)啵敖財(cái)啵ê蠓揭恢拢河址Q左截?cái)?,截詞符在詞的左邊,例截詞符在詞的左邊,例將截詞符將截詞符“* *”置于詞干的左邊。置于詞干的左邊。 如:如:* *computer,其含義為:其含義為:computer、microcomputers等詞皆為命中詞。等詞皆為命中詞。中截?cái)嘀薪財(cái)?通配符或屏蔽通配符或屏蔽)是把截?cái)喾?hào)置于一個(gè)檢索詞的中間,是把截?cái)喾?hào)置于一個(gè)檢索詞的中間,“?” 只替代一個(gè)字符,只替代一個(gè)字符, (EBS

38、CO規(guī)則)規(guī)則)例如:輸入例如:輸入ne?t,可檢索出,可檢索出neat, nest,next 。后截?cái)嗍乔胺揭恢聶z索,又稱右截?cái)?,后截?cái)嗍乔胺揭恢聶z索,又稱右截?cái)?,截詞符放在被截詞的右截詞符放在被截詞的右邊,是最常用的檢索技術(shù)邊,是最常用的檢索技術(shù),例如:,例如:“*” 可以替代一個(gè)以上字符串,(可以替代一個(gè)以上字符串,(EBSCO規(guī)則)規(guī)則)例如:輸入例如:輸入comput* * ,可檢出,可檢出computer,computing 等等。等等。限制截?cái)啵合拗平財(cái)啵菏窃跈z索詞詞干后面加若干個(gè)截詞符,表示限制是在檢索詞詞干后面加若干個(gè)截詞符,表示限制可變化的字符數(shù)??勺兓淖址麛?shù)。例:例:e

39、ducat* 相當(dāng)于相當(dāng)于educated 教育,教育,Educator 教育家,教育家,根據(jù)截?cái)嗟臄?shù)量不同可分為:根據(jù)截?cái)嗟臄?shù)量不同可分為:無限截?cái)啵翰幌拗票唤財(cái)嗟淖址麛?shù)量;無限截?cái)啵翰幌拗票唤財(cái)嗟淖址麛?shù)量;有限截?cái)啵合拗票唤財(cái)嗟淖址麛?shù)量,有限截?cái)啵合拗票唤財(cái)嗟淖址麛?shù)量,例如例如educat*,可以檢索,可以檢索educator,educated。各檢索系統(tǒng)有不同的規(guī)定,沒有統(tǒng)一標(biāo)準(zhǔn)各檢索系統(tǒng)有不同的規(guī)定,沒有統(tǒng)一標(biāo)準(zhǔn)。使用時(shí)要注意看使用時(shí)要注意看3. 限制檢索 1) 檢索系統(tǒng)中的限制檢索 在檢索系統(tǒng)中,使用縮小和限定檢索范在檢索系統(tǒng)中,使用縮小和限定檢索范圍的方法稱為限制檢索。限定檢索條件

40、多種圍的方法稱為限制檢索。限定檢索條件多種多樣,主要和常用的是字段限制。多樣,主要和常用的是字段限制。 其中,主題字段如題名(其中,主題字段如題名(TitleTitle)、敘)、敘詞(詞(DescriptorDescriptor)、標(biāo)識(shí)詞()、標(biāo)識(shí)詞(IdentifierIdentifier)、)、文摘(文摘(AbstractAbstract)等;非主題字段如作者)等;非主題字段如作者(AuthorAuthor)、文獻(xiàn)類型()、文獻(xiàn)類型(Document TypeDocument Type)、)、語種(語種(LanguageLanguage)、出版年份()、出版年份(Publication P

41、ublication YearYear)等。)等。 2) 搜索引擎中的限制檢索 搜索引擎中的字段檢索多表現(xiàn)為前綴符搜索引擎中的字段檢索多表現(xiàn)為前綴符限制形式,其中,表示內(nèi)容特征的主題字段限制形式,其中,表示內(nèi)容特征的主題字段有有TitleTitle,KeywordsKeywords,SubjectSubject,SummarySummary等;等;表示外部特征的非主題字段限制有表示外部特征的非主題字段限制有imageimage,texttext,appletapplet等;此外,搜索引擎還提供了等;此外,搜索引擎還提供了帶有典型網(wǎng)絡(luò)檢索特征的字段限制類型。帶有典型網(wǎng)絡(luò)檢索特征的字段限制類型。

42、限定字段檢索限定字段檢索是指在是指在限定的字段范圍檢索限定的字段范圍檢索 (range searching) ,達(dá)到優(yōu)化檢索結(jié),達(dá)到優(yōu)化檢索結(jié)果的方法。特別在使用自由詞進(jìn)行全文檢索時(shí),需要用字段限制檢果的方法。特別在使用自由詞進(jìn)行全文檢索時(shí),需要用字段限制檢索的范圍。被指定的字段也稱檢索入口,檢索時(shí),系統(tǒng)只對(duì)指定字索的范圍。被指定的字段也稱檢索入口,檢索時(shí),系統(tǒng)只對(duì)指定字段進(jìn)行匹配運(yùn)算,提高了效率和查準(zhǔn)率,字段檢索常用代碼來表示,段進(jìn)行匹配運(yùn)算,提高了效率和查準(zhǔn)率,字段檢索常用代碼來表示,常用的字段代碼如下表常用的字段代碼如下表 所示:所示:檢索字段檢索字段檢索入口檢索入口檢索途徑檢索途徑位置

43、檢索位置檢索位置算符檢索在西文數(shù)據(jù)庫(kù)中廣泛使用,能提高檢索的準(zhǔn)確性位置算符檢索在西文數(shù)據(jù)庫(kù)中廣泛使用,能提高檢索的準(zhǔn)確性,當(dāng)要求兩個(gè)檢索詞在記錄中位置當(dāng)要求兩個(gè)檢索詞在記錄中位置相鄰相鄰/ /相連相連時(shí),可使用位置算符。時(shí),可使用位置算符。下面介紹幾種數(shù)據(jù)庫(kù)經(jīng)常使用的位置運(yùn)算符:下面介紹幾種數(shù)據(jù)庫(kù)經(jīng)常使用的位置運(yùn)算符:1.W - WithW W 算符是算符是WithWith的縮寫,表示在此算符兩側(cè)的檢索詞必須按輸入時(shí)的前兩側(cè)的檢索詞必須按輸入時(shí)的前后順序排列,不能顛倒。后順序排列,不能顛倒。例:例:intelligent (W) robot? (智能機(jī)器人智能機(jī)器人 ) (Ei Compend

44、ex Plus)Wn( 或或nW) 表示在此算符表示在此算符兩側(cè)的檢索詞必須按輸入時(shí)的前后順序排列,兩側(cè)的檢索詞必須按輸入時(shí)的前后順序排列,不能顛倒。但允許在連接的兩個(gè)詞之間最多插入不能顛倒。但允許在連接的兩個(gè)詞之間最多插入n n個(gè)單元詞個(gè)單元詞。 例:例:intelligent w1 robot* (OCLC FirstSearch) 2. N NearN算符是算符是Near的縮寫,表示此算符的縮寫,表示此算符兩側(cè)的檢索詞必須緊密相連,所連兩側(cè)的檢索詞必須緊密相連,所連接的詞之間不允許插入任何其他單詞或字母。但詞序可以顛倒。接的詞之間不允許插入任何其他單詞或字母。但詞序可以顛倒。例:例: i

45、ntelligent Near robot* ( Ei CPX Web)算符算符作用作用表達(dá)式表達(dá)式檢索結(jié)果檢索結(jié)果W、W/N、WITH兩詞相鄰,兩詞相鄰,詞語詞語出現(xiàn)次序固定出現(xiàn)次序固定Education(w)schoolEducation WITH schoolEducation schoolEducation schoolsnW兩詞相鄰,按順兩詞相鄰,按順序排列,詞間可序排列,詞間可插入插入n個(gè)詞個(gè)詞Education(1w)schoolEducation schoolEducation schoolsEducation and music schoolPRE兩詞相鄰兩詞相鄰,詞語詞語出

46、現(xiàn)次序固定出現(xiàn)次序固定Education PRE schoolEducation schoolEducation schools算符算符作用作用表達(dá)式表達(dá)式檢索結(jié)果檢索結(jié)果N、NEAR、ADJ兩詞相鄰,順兩詞相鄰,順序可顛倒序可顛倒Education(N)schoolEducation NEAR schoolEducation schoolEducation schoolsSchool of educationnN兩詞相鄰,順兩詞相鄰,順序可顛倒序可顛倒,兩詞兩詞間可插入間可插入n個(gè)個(gè)詞詞Education (1N) schoolEducation schoolSchool of educat

47、ionSchool of music and educationF兩詞同在一個(gè)兩詞同在一個(gè)字段中字段中Education (F) schoolSAME兩詞同在一個(gè)段兩詞同在一個(gè)段落中落中Education SAME school3 3)文獻(xiàn)檢索新分法)文獻(xiàn)檢索新分法目前信息檢索類型出現(xiàn)一種新的三分法:即文本檢索、數(shù)值檢目前信息檢索類型出現(xiàn)一種新的三分法:即文本檢索、數(shù)值檢索、聲頻與視頻檢索。索、聲頻與視頻檢索。1. 1. 文本檢索文本檢索文本檢索文本檢索(Text Retrieval)是文獻(xiàn)信息檢索的一部分,是指是文獻(xiàn)信息檢索的一部分,是指根據(jù)文本內(nèi)容,如關(guān)鍵字、語意等對(duì)文本集合進(jìn)行檢索、分類

48、、根據(jù)文本內(nèi)容,如關(guān)鍵字、語意等對(duì)文本集合進(jìn)行檢索、分類、過濾等。過濾等。如:如:.DOC.DOC、.PDF.PDF、.PPT.PPT、.XLS.XLS、.TXT.TXT等等格式。格式。2. 2. 數(shù)值(數(shù)據(jù))檢索數(shù)值(數(shù)據(jù))檢索狹義的數(shù)值檢索僅指從某數(shù)據(jù)集合中查出所需要的數(shù)據(jù)。狹義的數(shù)值檢索僅指從某數(shù)據(jù)集合中查出所需要的數(shù)據(jù)。回答:回答:“世界上最長(zhǎng)的鐵路大橋有多長(zhǎng)?世界上最長(zhǎng)的鐵路大橋有多長(zhǎng)?”之類的問題。之類的問題。3. 3. 事實(shí)檢索事實(shí)檢索事實(shí)檢索是以文獻(xiàn)中抽取的事項(xiàng)為檢索內(nèi)容的檢索,或稱事實(shí)檢索是以文獻(xiàn)中抽取的事項(xiàng)為檢索內(nèi)容的檢索,或稱“事事項(xiàng)檢索項(xiàng)檢索”?;卮穑夯卮穑骸笆澜缟献铋L(zhǎng)

49、的鐵路大橋是哪一條?世界上最長(zhǎng)的鐵路大橋是哪一條?”之類的問題。之類的問題。4. 4. 聲頻與視頻檢索聲頻與視頻檢索1 1)對(duì)于音頻信息來說,其基于內(nèi)容檢索的主要類型有:)對(duì)于音頻信息來說,其基于內(nèi)容檢索的主要類型有: 語音檢索; 音樂檢索; 其他音頻檢索。2 2)其基于內(nèi)容檢索的主要類型有:)其基于內(nèi)容檢索的主要類型有: 基于顏色特征的檢索; 基于形狀特征的檢索; 基于紋理特征的檢索; 忌與視頻動(dòng)態(tài)特征的檢索; 其他檢索,二、檢索效果 1. 檢索效果評(píng)價(jià) 1) 檢索效果評(píng)價(jià)的指標(biāo) 檢索效果是指檢索系統(tǒng)檢索信息的有檢索效果是指檢索系統(tǒng)檢索信息的有效程度,反映了檢索系統(tǒng)的檢索能力。效程度,反映了

50、檢索系統(tǒng)的檢索能力。 (1) (1) 質(zhì)量標(biāo)準(zhǔn)質(zhì)量標(biāo)準(zhǔn) (2) (2) 費(fèi)用標(biāo)準(zhǔn)費(fèi)用標(biāo)準(zhǔn) (3) (3) 時(shí)間標(biāo)準(zhǔn)時(shí)間標(biāo)準(zhǔn)1) 檢索效果評(píng)價(jià)的指標(biāo)表2.2 檢索效果評(píng)價(jià)22表 a檢出的相關(guān)文獻(xiàn)量;檢出的相關(guān)文獻(xiàn)量; c未檢出的相關(guān)文獻(xiàn)量;未檢出的相關(guān)文獻(xiàn)量; ac系統(tǒng)相關(guān)文獻(xiàn)總量。系統(tǒng)相關(guān)文獻(xiàn)總量。b檢出的非相關(guān)文獻(xiàn)量;檢出的非相關(guān)文獻(xiàn)量;ab檢出的文獻(xiàn)總量;檢出的文獻(xiàn)總量;d未檢出的非相關(guān)文獻(xiàn)量未檢出的非相關(guān)文獻(xiàn)量2) 查全率和查準(zhǔn)率 (1) 查全率 查全率是指檢索出的相關(guān)信息量與系統(tǒng)查全率是指檢索出的相關(guān)信息量與系統(tǒng)中的相關(guān)信息總量之比。中的相關(guān)信息總量之比。 (2) 查準(zhǔn)率 查準(zhǔn)率是指檢

51、索出的相關(guān)信息量與檢索查準(zhǔn)率是指檢索出的相關(guān)信息量與檢索出的信息總量之比。出的信息總量之比。2. 檢索效果優(yōu)化 (1) (1) 提高檢索系統(tǒng)的質(zhì)量提高檢索系統(tǒng)的質(zhì)量 (2) (2) 提高用戶利用檢索系統(tǒng)的能力提高用戶利用檢索系統(tǒng)的能力 (3) (3) 制定優(yōu)化的檢索策略制定優(yōu)化的檢索策略 (3) (3) 制定優(yōu)化的檢索策略制定優(yōu)化的檢索策略 提高查全率的方法提高查全率的方法 為了提高查全率,往往通過采用提高為了提高查全率,往往通過采用提高檢索詞的泛指度,選全同義詞、近義詞,多檢索詞的泛指度,選全同義詞、近義詞,多用截詞符;減少使用邏輯用截詞符;減少使用邏輯“與與”、邏輯、邏輯“非非”運(yùn)算符,增

52、加使用邏輯運(yùn)算符,增加使用邏輯“或或”運(yùn)算符;取消運(yùn)算符;取消某些限制符,在多字段或全文中檢索;采用某些限制符,在多字段或全文中檢索;采用分類號(hào)檢索等多種方法。分類號(hào)檢索等多種方法。 (3) (3) 制定優(yōu)化的檢索策略制定優(yōu)化的檢索策略 提高查準(zhǔn)率的方法提高查準(zhǔn)率的方法 為了提高查準(zhǔn)率,往往通過采用提高為了提高查準(zhǔn)率,往往通過采用提高檢索詞的專指度,增加或者使用下位詞及專檢索詞的專指度,增加或者使用下位詞及專指性較強(qiáng)的自由詞,少用截詞符;增加使用指性較強(qiáng)的自由詞,少用截詞符;增加使用邏輯邏輯“與與”、邏輯、邏輯“非非”運(yùn)算符,減少邏輯運(yùn)算符,減少邏輯“或或”運(yùn)算符;多用限制符或限制字段;用運(yùn)算

53、符;多用限制符或限制字段;用文獻(xiàn)的外部特征限制等多種方法。文獻(xiàn)的外部特征限制等多種方法。 第五節(jié)第五節(jié) 檢索步驟與檢索策略檢索步驟與檢索策略一、檢索步驟 1 1分析檢索課題分析檢索課題 2 2選擇檢索系統(tǒng)選擇檢索系統(tǒng) 3 3確定檢索途徑和檢索方法確定檢索途徑和檢索方法 4 4構(gòu)建檢索式構(gòu)建檢索式 5 5檢索并調(diào)整檢索策略檢索并調(diào)整檢索策略 6 6獲取原文獲取原文在進(jìn)行資料檢索之前,必須分析研究課題,制定檢索需求描在進(jìn)行資料檢索之前,必須分析研究課題,制定檢索需求描述,索取原始文獻(xiàn),學(xué)習(xí)了解新知識(shí),調(diào)整檢索策略。述,索取原始文獻(xiàn),學(xué)習(xí)了解新知識(shí),調(diào)整檢索策略。第一步、分析檢索課題第一步、分析檢索

54、課題1. 分析檢索課題,明確以下問題:分析檢索課題,明確以下問題: 分析課題分析課題:課題的主要內(nèi)容以及所涉及的知識(shí)點(diǎn)?課題的主要內(nèi)容以及所涉及的知識(shí)點(diǎn)? 明確需要的文獻(xiàn)特征:明確需要的文獻(xiàn)特征:即需要的文獻(xiàn)種類,語種,年代以即需要的文獻(xiàn)種類,語種,年代以及文獻(xiàn)量?及文獻(xiàn)量? 明確查詢的側(cè)重點(diǎn):明確查詢的側(cè)重點(diǎn):對(duì)查新,查準(zhǔn),查全的指標(biāo)要求?對(duì)查新,查準(zhǔn),查全的指標(biāo)要求? 確定所需的文獻(xiàn)應(yīng)該具備的外部特征?確定所需的文獻(xiàn)應(yīng)該具備的外部特征? 確定所需的文獻(xiàn)應(yīng)該具備的內(nèi)部特征確定所需的文獻(xiàn)應(yīng)該具備的內(nèi)部特征?一般課題檢索分析一般課題檢索分析(1 1)是找具體問題的準(zhǔn)確答案?)是找具體問題的準(zhǔn)確答

55、案?使用目的是解決問題,或作為論據(jù)和引證。查找事實(shí)或數(shù)值使用目的是解決問題,或作為論據(jù)和引證。查找事實(shí)或數(shù)值型信息大多屬于此類。型信息大多屬于此類。(2 2)是查找特定文獻(xiàn)?)是查找特定文獻(xiàn)?根據(jù)某一篇文獻(xiàn)的線索查找原文;根據(jù)某一篇文獻(xiàn)的線索查找原文;或報(bào)考某導(dǎo)師的研究生,查詢其所有發(fā)表的文章。或報(bào)考某導(dǎo)師的研究生,查詢其所有發(fā)表的文章。對(duì)這種檢索課題、類型很簡(jiǎn)單,只要正確選擇了檢索工具和對(duì)這種檢索課題、類型很簡(jiǎn)單,只要正確選擇了檢索工具和參考資源,便可以一步到位查到所需要的信息,很快地達(dá)到參考資源,便可以一步到位查到所需要的信息,很快地達(dá)到檢索目的。檢索目的。(3 3)是對(duì)某一問題的大致了解

56、?)是對(duì)某一問題的大致了解?對(duì)于這種類型的檢索課題,只需要瀏覽一些簡(jiǎn)短的摘要或者對(duì)于這種類型的檢索課題,只需要瀏覽一些簡(jiǎn)短的摘要或者參考幾篇概論性文章就可以了。參考幾篇概論性文章就可以了。有的課題則需要搜集各種翔實(shí)、深入的信息,才能圓滿完成。有的課題則需要搜集各種翔實(shí)、深入的信息,才能圓滿完成。研究課題檢索分析研究課題檢索分析研究課題通常是學(xué)術(shù)水平較高,專業(yè)較深的課題研究課題通常是學(xué)術(shù)水平較高,專業(yè)較深的課題.撰寫綜述、研究報(bào)告撰寫綜述、研究報(bào)告查全查全撰寫綜述或研究報(bào)告,講求系統(tǒng)全面,必須以時(shí)間為軸做縱向、深撰寫綜述或研究報(bào)告,講求系統(tǒng)全面,必須以時(shí)間為軸做縱向、深度的考察。對(duì)課題做全面的調(diào)

57、查研究,了解整個(gè)發(fā)展過程。度的考察。對(duì)課題做全面的調(diào)查研究,了解整個(gè)發(fā)展過程。包括書包括書籍、期刊、報(bào)紙、報(bào)告、政府出版物。籍、期刊、報(bào)紙、報(bào)告、政府出版物。撰寫研究報(bào)告、學(xué)術(shù)論文撰寫研究報(bào)告、學(xué)術(shù)論文查準(zhǔn)查準(zhǔn)撰寫研究報(bào)告、學(xué)術(shù)論文,需要在具體細(xì)微的專業(yè)問題做深入的專撰寫研究報(bào)告、學(xué)術(shù)論文,需要在具體細(xì)微的專業(yè)問題做深入的專題研究,在充分掌握材料和該領(lǐng)域重要研究成果的基礎(chǔ)上,提出創(chuàng)題研究,在充分掌握材料和該領(lǐng)域重要研究成果的基礎(chǔ)上,提出創(chuàng)新性的觀點(diǎn)或論斷,這是基本要求。新性的觀點(diǎn)或論斷,這是基本要求。做新技術(shù)、新理論的研究做新技術(shù)、新理論的研究動(dòng)態(tài)動(dòng)態(tài)在做新技術(shù)、新理論的研究時(shí),需要查閱某一專

58、題的最前沿和最新在做新技術(shù)、新理論的研究時(shí),需要查閱某一專題的最前沿和最新資料,了解研究動(dòng)態(tài)、發(fā)展趨勢(shì)。資料,了解研究動(dòng)態(tài)、發(fā)展趨勢(shì)。做同類研究項(xiàng)目比較做同類研究項(xiàng)目比較查新查新在做同類研究項(xiàng)目比較時(shí),或做創(chuàng)新性的課題項(xiàng)目、研究成果或要在做同類研究項(xiàng)目比較時(shí),或做創(chuàng)新性的課題項(xiàng)目、研究成果或要求較高的學(xué)位論文,求較高的學(xué)位論文,必須保證取材的數(shù)量和學(xué)術(shù)質(zhì)量達(dá)到一定的深必須保證取材的數(shù)量和學(xué)術(shù)質(zhì)量達(dá)到一定的深度和廣度,重點(diǎn)參考各種學(xué)術(shù)品質(zhì)較高的期刊論文、會(huì)議論文、研度和廣度,重點(diǎn)參考各種學(xué)術(shù)品質(zhì)較高的期刊論文、會(huì)議論文、研究報(bào)告、學(xué)位論文、重要專著等;究報(bào)告、學(xué)位論文、重要專著等;明確課題明確課

59、題對(duì)文獻(xiàn)的需求量?對(duì)文獻(xiàn)的需求量?在確定了檢索課題的類型之后,在此基礎(chǔ)上,還要在確定了檢索課題的類型之后,在此基礎(chǔ)上,還要考慮下面幾個(gè)問題:考慮下面幾個(gè)問題:(1)該課題需要的)該課題需要的文獻(xiàn)量?文獻(xiàn)量?(2)該課題查檢文獻(xiàn)的)該課題查檢文獻(xiàn)的廣度與深度如何?廣度與深度如何?(3)該課題對(duì))該課題對(duì)時(shí)效性時(shí)效性有什么要求?有什么要求?(4)該課題對(duì)文獻(xiàn)資料的數(shù)據(jù)類型是否有所限定或)該課題對(duì)文獻(xiàn)資料的數(shù)據(jù)類型是否有所限定或側(cè)重?側(cè)重?第二步、選擇檢索工具或數(shù)據(jù)庫(kù)第二步、選擇檢索工具或數(shù)據(jù)庫(kù)目前,常用文獻(xiàn)類型及選擇檢索的數(shù)據(jù)庫(kù)如下:目前,常用文獻(xiàn)類型及選擇檢索的數(shù)據(jù)庫(kù)如下:1. 1. 數(shù)字圖書館

60、數(shù)字圖書館(1)超星數(shù)字圖書館:)超星數(shù)字圖書館:http:/ http:/ 2. 數(shù)字期刊、特種文獻(xiàn)數(shù)字期刊、特種文獻(xiàn)(1)讀秀學(xué)術(shù)搜索:)讀秀學(xué)術(shù)搜索:http:/ EBSCOhost http:/ 確定檢索途徑確定檢索途徑1. 1. 以文獻(xiàn)的以文獻(xiàn)的內(nèi)容特征內(nèi)容特征為檢索途徑為檢索途徑分類檢索途徑:分類檢索途徑:是是從學(xué)科分類角度來查找文獻(xiàn)的一種途徑。從學(xué)科分類角度來查找文獻(xiàn)的一種途徑。 特點(diǎn):族性檢索,特點(diǎn):族性檢索,會(huì)檢索到一批相關(guān)文獻(xiàn)。會(huì)檢索到一批相關(guān)文獻(xiàn)。主題檢索途徑:主題檢索途徑:是從是從文獻(xiàn)主題內(nèi)容角度來檢索文獻(xiàn)的一種途徑。文獻(xiàn)主題內(nèi)容角度來檢索文獻(xiàn)的一種途徑。 特點(diǎn):特性檢索,特點(diǎn):特性檢索,適合比較具體專深

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論