文獻(xiàn)信息檢索與利用_第1頁(yè)
文獻(xiàn)信息檢索與利用_第2頁(yè)
文獻(xiàn)信息檢索與利用_第3頁(yè)
文獻(xiàn)信息檢索與利用_第4頁(yè)
文獻(xiàn)信息檢索與利用_第5頁(yè)
已閱讀5頁(yè),還剩55頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、文獻(xiàn)信息檢索與利用文獻(xiàn)信息檢索與利用(基本概念篇)(基本概念篇)第一章第一章 緒論緒論第一節(jié)信息檢索的意義和作用第一節(jié)信息檢索的意義和作用第二節(jié)文獻(xiàn)、信息基本知識(shí)第二節(jié)文獻(xiàn)、信息基本知識(shí)第三節(jié)文獻(xiàn)檢索系統(tǒng)第三節(jié)文獻(xiàn)檢索系統(tǒng)第一節(jié)第一節(jié)信息檢索的意義和作用信息檢索的意義和作用1、信息檢索是現(xiàn)代人才的基本生存技能信息檢索是現(xiàn)代人才的基本生存技能2、信息檢索是現(xiàn)代人才信息素質(zhì)的重要方面信息檢索是現(xiàn)代人才信息素質(zhì)的重要方面3、信息檢索是科學(xué)交流的重要途徑、信息檢索是科學(xué)交流的重要途徑4、信息檢索是開發(fā)信息資源的工具、信息檢索是開發(fā)信息資源的工具5、信息檢索是管理決策的基礎(chǔ)、信息檢索是管理決策的基礎(chǔ)6、

2、信息檢索是避免重復(fù)研究的必由之路信息檢索是避免重復(fù)研究的必由之路7、信息檢索是治學(xué)之道、信息檢索是治學(xué)之道第二節(jié)第二節(jié) 文獻(xiàn)、信息基本知識(shí)文獻(xiàn)、信息基本知識(shí)(一一)基本概念基本概念1、信息:、信息:消除對(duì)客觀事物認(rèn)識(shí)的不定性的東西,是符號(hào)、信號(hào)或消息所包含的內(nèi)容。2、知識(shí):、知識(shí):人們對(duì)自然和社會(huì)的認(rèn)識(shí)和描述的總和。3、文獻(xiàn):、文獻(xiàn):記載有知識(shí)的載體。 4、出版物:、出版物:可以理解為文獻(xiàn)的表現(xiàn)形式或承載物,大多 數(shù)情況下等同于文獻(xiàn)。 5、信息源:、信息源:產(chǎn)生信息的事物,在本課程中,指文獻(xiàn)信息源。6、信息資源:、信息資源:可以理解為信息源所含的信息本身,是信息源的內(nèi)含。在大多數(shù)場(chǎng)合,信息源、

3、信息資源、文獻(xiàn)信息資源是同義的。7、信息檢索:利用一定的工具從大量的信息資源中迅速、準(zhǔn)確地查找出與特定的要求有關(guān)的信息。本課程中,信息檢索、文獻(xiàn)檢索、文獻(xiàn)信息檢索信息檢索、文獻(xiàn)檢索、文獻(xiàn)信息檢索視為同一概念。(二)文獻(xiàn)的構(gòu)成要素知識(shí)內(nèi)容知識(shí)內(nèi)容文獻(xiàn)中記錄信息和知識(shí),這是文獻(xiàn)的靈魂。符號(hào)系統(tǒng)符號(hào)系統(tǒng) 表達(dá)知識(shí)信息的手段,包括語(yǔ)言、文字、圖畫、表格、公式、編碼、音響、圖象、聲像等 。文獻(xiàn)載體文獻(xiàn)載體 信息內(nèi)容存儲(chǔ)的依附體,包括印刷型文獻(xiàn)、音像制品、機(jī)讀資料等。記錄方式記錄方式刻劃、手寫、機(jī)械印刷、拍攝和電腦錄入、掃描等生產(chǎn)方式。 (三)、文獻(xiàn)的類型:按載體劃分(三)、文獻(xiàn)的類型:按載體劃分 按載體

4、劃分按載體劃分印刷型文獻(xiàn)印刷型文獻(xiàn)感光型文獻(xiàn)感光型文獻(xiàn)機(jī)讀型文獻(xiàn)機(jī)讀型文獻(xiàn)說明:多數(shù)著作把文獻(xiàn)分為印刷型、縮微型、視聽型、說明:多數(shù)著作把文獻(xiàn)分為印刷型、縮微型、視聽型、機(jī)讀型四種,而以甲骨、竹簡(jiǎn)、金石、帛等為載體的文獻(xiàn)較機(jī)讀型四種,而以甲骨、竹簡(jiǎn)、金石、帛等為載體的文獻(xiàn)較少見,這里不討論少見,這里不討論。 印刷型文獻(xiàn)(紙本文獻(xiàn))印刷型文獻(xiàn)(紙本文獻(xiàn))載體:紙張載體:紙張實(shí)例:圖書、雜志、報(bào)紙實(shí)例:圖書、雜志、報(bào)紙記錄手段:印刷、抄寫記錄手段:印刷、抄寫特點(diǎn):可直接閱讀,方便特點(diǎn):可直接閱讀,方便使用;不利于檢索和保存;使用;不利于檢索和保存;收藏文獻(xiàn)占用空間大。收藏文獻(xiàn)占用空間大。 感光型文

5、獻(xiàn)感光型文獻(xiàn)載體:載體:感光材料感光材料 實(shí)例:實(shí)例:縮微平片、電影膠片、幻燈片縮微平片、電影膠片、幻燈片記錄手段:記錄手段:縮微技術(shù)、攝影技術(shù)縮微技術(shù)、攝影技術(shù)特點(diǎn):特點(diǎn):體積?。粌r(jià)格低;不能直接閱讀體積??;價(jià)格低;不能直接閱讀 機(jī)讀型文獻(xiàn)(電子文獻(xiàn))機(jī)讀型文獻(xiàn)(電子文獻(xiàn))載體:載體:磁性材料、光盤磁性材料、光盤實(shí)例:實(shí)例:磁盤、光盤、磁帶磁盤、光盤、磁帶記錄手段:記錄手段:磁記錄、編碼技術(shù)磁記錄、編碼技術(shù)特點(diǎn):特點(diǎn):存儲(chǔ)密度高、速度快存儲(chǔ)密度高、速度快; ;便便于遠(yuǎn)距離傳輸;易復(fù)制于遠(yuǎn)距離傳輸;易復(fù)制; ;成本高;成本高;不能直接閱讀。不能直接閱讀。 按出版形式的不同按出版形式的不同 圖圖

6、 書書*連續(xù)出版物連續(xù)出版物 特種文獻(xiàn)特種文獻(xiàn)研究報(bào)告研究報(bào)告* *會(huì)議文獻(xiàn)會(huì)議文獻(xiàn)* *專利文獻(xiàn)專利文獻(xiàn)* *技術(shù)標(biāo)準(zhǔn)技術(shù)標(biāo)準(zhǔn)* *學(xué)位論文學(xué)位論文* *產(chǎn)品樣本產(chǎn)品樣本* *技術(shù)檔案技術(shù)檔案* *期刊期刊*報(bào)紙報(bào)紙*(三)、按出版形式劃分(三)、按出版形式劃分(十大信息源十大信息源)圖書的含義圖書的含義 凡篇幅達(dá)凡篇幅達(dá)49頁(yè)以頁(yè)以上并構(gòu)一個(gè)書目單元上并構(gòu)一個(gè)書目單元的文獻(xiàn)稱為圖書。未的文獻(xiàn)稱為圖書。未達(dá)到達(dá)到49頁(yè)的,可稱為頁(yè)的,可稱為小冊(cè)子。小冊(cè)子。圖書的特征圖書的特征 * 主題突出,內(nèi)容系統(tǒng)全面,論述全面深入,主題突出,內(nèi)容系統(tǒng)全面,論述全面深入,知識(shí)成熟穩(wěn)定。適合于學(xué)習(xí)型讀者知識(shí)成

7、熟穩(wěn)定。適合于學(xué)習(xí)型讀者 * 出版的周期長(zhǎng),因而其內(nèi)容一般就缺乏出版的周期長(zhǎng),因而其內(nèi)容一般就缺乏最新的研究成果。最新的研究成果。 期期 刊刊定義定義 期刊又稱雜志,它是指期刊又稱雜志,它是指圍繞某個(gè)專題的定期或不定圍繞某個(gè)專題的定期或不定期連續(xù)出版的出版物。名稱期連續(xù)出版的出版物。名稱統(tǒng)一、開本固定、有連續(xù)的統(tǒng)一、開本固定、有連續(xù)的序號(hào)、匯集了多位作者分別序號(hào)、匯集了多位作者分別撰寫的多篇文章。撰寫的多篇文章。期刊的特點(diǎn)期刊的特點(diǎn)A、期刊以品種為單位形成知識(shí)流;、期刊以品種為單位形成知識(shí)流;B、出版周期短,內(nèi)容新穎、及時(shí)、廣泛,專深;、出版周期短,內(nèi)容新穎、及時(shí)、廣泛,專深;C、內(nèi)容不全面系

8、統(tǒng),不成熟,論題窄;、內(nèi)容不全面系統(tǒng),不成熟,論題窄;D、文獻(xiàn)中數(shù)量最多,使用量最大。、文獻(xiàn)中數(shù)量最多,使用量最大。 核心期刊核心期刊 * 少數(shù)刊載某一學(xué)科大量高質(zhì)量專業(yè)論文的期刊。少數(shù)刊載某一學(xué)科大量高質(zhì)量專業(yè)論文的期刊。 * 特點(diǎn)特點(diǎn) (1)刊載專業(yè)文獻(xiàn)密度高,信息含量高;)刊載專業(yè)文獻(xiàn)密度高,信息含量高; (2)水平較高,代表本學(xué)科的最新發(fā)展水平;)水平較高,代表本學(xué)科的最新發(fā)展水平; (3)出版相對(duì)穩(wěn)定,所載文獻(xiàn)壽命較長(zhǎng);)出版相對(duì)穩(wěn)定,所載文獻(xiàn)壽命較長(zhǎng); (4)利用率和被引率較高。)利用率和被引率較高。 目前,許多單位核心期刊的判定是以目前,許多單位核心期刊的判定是以 中文核心期刊要

9、目總覽中文核心期刊要目總覽為標(biāo)準(zhǔn)為標(biāo)準(zhǔn)形式特征:形式特征:有統(tǒng)一的名稱,定期連續(xù)出有統(tǒng)一的名稱,定期連續(xù)出版,每期匯集許多篇文章、報(bào)道、消息版,每期匯集許多篇文章、報(bào)道、消息等,多為對(duì)開或四開,以單張散頁(yè)形式等,多為對(duì)開或四開,以單張散頁(yè)形式出版。出版。 報(bào) 紙內(nèi)容特征:內(nèi)容特征:時(shí)間性強(qiáng),能以最快的速度報(bào)道國(guó)內(nèi)外時(shí)間性強(qiáng),能以最快的速度報(bào)道國(guó)內(nèi)外發(fā)生的最新事件和科學(xué)技術(shù)的最新研究成果,內(nèi)容發(fā)生的最新事件和科學(xué)技術(shù)的最新研究成果,內(nèi)容廣泛。廣泛。類型:類型:按出版周期分,有日?qǐng)?bào)、雙日?qǐng)?bào)、周報(bào)、旬按出版周期分,有日?qǐng)?bào)、雙日?qǐng)?bào)、周報(bào)、旬報(bào)等;按范圍劃分,有全國(guó)性報(bào)紙、地方性報(bào)紙、報(bào)等;按范圍劃分,

10、有全國(guó)性報(bào)紙、地方性報(bào)紙、系統(tǒng)性報(bào)紙等;按內(nèi)容劃分,有綜合性報(bào)紙、專業(yè)系統(tǒng)性報(bào)紙等;按內(nèi)容劃分,有綜合性報(bào)紙、專業(yè)性報(bào)紙。性報(bào)紙。 報(bào) 紙 研究報(bào)告研究報(bào)告 研究報(bào)告是單位和研究報(bào)告是單位和個(gè)人向上級(jí)或委托單位個(gè)人向上級(jí)或委托單位撰寫的關(guān)于某個(gè)課題研撰寫的關(guān)于某個(gè)課題研究成果的正式報(bào)告。究成果的正式報(bào)告。 科技報(bào)告的特點(diǎn)科技報(bào)告的特點(diǎn) (1)內(nèi)容新穎,選題尖端實(shí)用;)內(nèi)容新穎,選題尖端實(shí)用; (2)不公開發(fā)行或少量發(fā)行;)不公開發(fā)行或少量發(fā)行; (3)質(zhì)量參差不齊;)質(zhì)量參差不齊; (4)保密性強(qiáng);)保密性強(qiáng); (5)每份報(bào)告獨(dú)立成冊(cè),有連續(xù)編號(hào)。)每份報(bào)告獨(dú)立成冊(cè),有連續(xù)編號(hào)。會(huì)議文獻(xiàn)會(huì)議文

11、獻(xiàn)會(huì)議文獻(xiàn)是指在各會(huì)議文獻(xiàn)是指在各種會(huì)議上宣讀、交流的種會(huì)議上宣讀、交流的論文、報(bào)告、會(huì)議錄等論文、報(bào)告、會(huì)議錄等文獻(xiàn)。定期召開的會(huì)議文獻(xiàn)。定期召開的會(huì)議錄或論文集其實(shí)相當(dāng)于錄或論文集其實(shí)相當(dāng)于連續(xù)出版物。連續(xù)出版物。專利文獻(xiàn)專利文獻(xiàn)科技報(bào)告的特點(diǎn)科技報(bào)告的特點(diǎn)1、包括發(fā)明專利、實(shí)用新型專利和外觀設(shè)計(jì)專利三種。2、內(nèi)容比較具體,有的還有附圖,通過它可以了解該項(xiàng)專利的主要技術(shù)內(nèi)容。 3、新穎性、創(chuàng)造性和實(shí)用性 ,有重大參考價(jià)值。4、經(jīng)審核可向全世界發(fā)行,獲取容易。專利文獻(xiàn)主要由專利說明書構(gòu)成。專利文獻(xiàn)主要由專利說明書構(gòu)成。所謂專利說明書是指專利申請(qǐng)人所謂專利說明書是指專利申請(qǐng)人向?qū)@诌f交的有關(guān)

12、發(fā)明目的、向?qū)@诌f交的有關(guān)發(fā)明目的、構(gòu)成和效果的技術(shù)文件構(gòu)成和效果的技術(shù)文件。 標(biāo)準(zhǔn)文獻(xiàn)標(biāo)準(zhǔn)文獻(xiàn)標(biāo)準(zhǔn)具有一定的法律約束標(biāo)準(zhǔn)具有一定的法律約束力,對(duì)技術(shù)的規(guī)定詳盡、完整、力,對(duì)技術(shù)的規(guī)定詳盡、完整、可靠,更新頻繁可靠,更新頻繁。檢索時(shí)必須。檢索時(shí)必須注意是否最新標(biāo)準(zhǔn)。注意是否最新標(biāo)準(zhǔn)。標(biāo)準(zhǔn)標(biāo)準(zhǔn)是按規(guī)定程序制訂,是按規(guī)定程序制訂,經(jīng)權(quán)威機(jī)構(gòu)公認(rèn)或主管部門批經(jīng)權(quán)威機(jī)構(gòu)公認(rèn)或主管部門批準(zhǔn)的在特定范圍內(nèi)執(zhí)行的規(guī)格、準(zhǔn)的在特定范圍內(nèi)執(zhí)行的規(guī)格、規(guī)則、技術(shù)要求等規(guī)范性文件。規(guī)則、技術(shù)要求等規(guī)范性文件。學(xué)位論文學(xué)位論文學(xué)位論文學(xué)位論文是指高等院校和科研單位中的本是指高等院校和科研單位中的本科生、研究生為獲得

13、學(xué)位,在導(dǎo)師指導(dǎo)下完成科生、研究生為獲得學(xué)位,在導(dǎo)師指導(dǎo)下完成的科學(xué)研究、科學(xué)試驗(yàn)成果的書面報(bào)告。的科學(xué)研究、科學(xué)試驗(yàn)成果的書面報(bào)告。 *學(xué)位論文一般不對(duì)外發(fā)行,印數(shù)少,不學(xué)位論文一般不對(duì)外發(fā)行,印數(shù)少,不容易獲得。容易獲得。 *質(zhì)量參差不齊,其中碩士、博士論文較質(zhì)量參差不齊,其中碩士、博士論文較為專深,對(duì)研究工作有較大參考價(jià)值。為專深,對(duì)研究工作有較大參考價(jià)值。按文獻(xiàn)按文獻(xiàn)的級(jí)別的級(jí)別一次文獻(xiàn)一次文獻(xiàn)二次文獻(xiàn)二次文獻(xiàn)三次文獻(xiàn)三次文獻(xiàn)零次文獻(xiàn)零次文獻(xiàn)(三)、文獻(xiàn)的類型:按文獻(xiàn)級(jí)別劃分(三)、文獻(xiàn)的類型:按文獻(xiàn)級(jí)別劃分 1、一次文獻(xiàn)一次文獻(xiàn)* *作者以自己的研究成果為基礎(chǔ)創(chuàng)作或撰寫的文獻(xiàn);作者以

14、自己的研究成果為基礎(chǔ)創(chuàng)作或撰寫的文獻(xiàn);* *對(duì)知識(shí)的第一次加工;具有創(chuàng)造性;對(duì)知識(shí)的第一次加工;具有創(chuàng)造性;* *大多數(shù)期刊論文、科技報(bào)告、學(xué)術(shù)論文大多數(shù)期刊論文、科技報(bào)告、學(xué)術(shù)論文 * *對(duì)一次文獻(xiàn)進(jìn)行加工整理而成的具有報(bào)道和檢索對(duì)一次文獻(xiàn)進(jìn)行加工整理而成的具有報(bào)道和檢索 作用的文獻(xiàn);作用的文獻(xiàn); * *對(duì)知識(shí)的第二次加工;有序化;提供一次文獻(xiàn)線索;對(duì)知識(shí)的第二次加工;有序化;提供一次文獻(xiàn)線索; * *目錄、題錄、文摘等檢索工具。目錄、題錄、文摘等檢索工具。2 2、二次文獻(xiàn)、二次文獻(xiàn) * * 利用二次文獻(xiàn)系統(tǒng)地檢索出一批有關(guān)的文獻(xiàn),對(duì)利用二次文獻(xiàn)系統(tǒng)地檢索出一批有關(guān)的文獻(xiàn),對(duì) 其內(nèi)容進(jìn)行比較

15、分析,綜合述評(píng)而編撰的文獻(xiàn)。其內(nèi)容進(jìn)行比較分析,綜合述評(píng)而編撰的文獻(xiàn)。 * * 對(duì)知識(shí)的再加工;提供文獻(xiàn)檢索;對(duì)知識(shí)的再加工;提供文獻(xiàn)檢索; * * 綜述、專著綜述、專著; ;字詞典、百科全書字詞典、百科全書3 3、三次文獻(xiàn)、三次文獻(xiàn) * * 還未形成一次文獻(xiàn)的非出版物;還未形成一次文獻(xiàn)的非出版物; * * 論文草稿、談話記錄、實(shí)驗(yàn)記錄、書論文草稿、談話記錄、實(shí)驗(yàn)記錄、書信信4 4、零次文獻(xiàn)、零次文獻(xiàn) 一次文獻(xiàn)是檢索的對(duì)象(目標(biāo))一次文獻(xiàn)是檢索的對(duì)象(目標(biāo)) 二次文獻(xiàn)是檢索的工具(手段)二次文獻(xiàn)是檢索的工具(手段) 三次文獻(xiàn)是情報(bào)研究的成果(檢索目標(biāo)三次文獻(xiàn)是情報(bào)研究的成果(檢索目標(biāo)+ +檢索

16、手段)檢索手段)從檢索的角度來看:從檢索的角度來看: 一次文獻(xiàn)是對(duì)知識(shí)的第一次加工一次文獻(xiàn)是對(duì)知識(shí)的第一次加工( (創(chuàng)造性創(chuàng)造性) ) 二次文獻(xiàn)是對(duì)知識(shí)的第二次加工二次文獻(xiàn)是對(duì)知識(shí)的第二次加工( (有序化有序化) ) 三次文獻(xiàn)是對(duì)知識(shí)的再加工三次文獻(xiàn)是對(duì)知識(shí)的再加工( (有序化有序化+ +創(chuàng)造性創(chuàng)造性) )從知識(shí)加工角度來看從知識(shí)加工角度來看: :(四)現(xiàn)代文獻(xiàn)的整體特點(diǎn)(四)現(xiàn)代文獻(xiàn)的整體特點(diǎn)1 1、數(shù)量激增數(shù)量激增2 2、類型復(fù)雜、類型復(fù)雜3 3、文種多樣、文種多樣4 4、內(nèi)容交叉重復(fù)、內(nèi)容交叉重復(fù)5 5、文獻(xiàn)聚散有序、文獻(xiàn)聚散有序6 6、新陳代謝頻繁、新陳代謝頻繁(一)概念文獻(xiàn)信息檢索:

17、廣義:將文獻(xiàn)信息按一定方式組廣義:將文獻(xiàn)信息按一定方式組織和存儲(chǔ)起來,并針對(duì)信息用戶的特點(diǎn)需求查找出織和存儲(chǔ)起來,并針對(duì)信息用戶的特點(diǎn)需求查找出所需信息內(nèi)容的過程。狹義(所需信息內(nèi)容的過程。狹義(P9P9)。職能:存儲(chǔ)、檢索存儲(chǔ)、檢索第三節(jié)文獻(xiàn)信息檢索系統(tǒng)第三節(jié)文獻(xiàn)信息檢索系統(tǒng)(二)檢索工具(二)檢索工具 文獻(xiàn)信息檢索工具文獻(xiàn)信息檢索工具手工檢索工具手工檢索工具機(jī)械檢索工具機(jī)械檢索工具參考工具書:字典、詞典、百科全書、手冊(cè)、指南、名錄、年表、數(shù)據(jù)、統(tǒng)計(jì)資料 檢索工具書:書目、索引文摘 計(jì)算機(jī)檢索 (三)信息檢索的類型(三)信息檢索的類型文獻(xiàn)檢索文獻(xiàn)檢索數(shù)據(jù)檢索數(shù)據(jù)檢索 事實(shí)檢索事實(shí)檢索概念檢索

18、概念檢索信息檢索的主要形式,通過二次文獻(xiàn),包括手工檢索工具和計(jì)算機(jī)檢索系統(tǒng),找出所需的一次文獻(xiàn)或三次文獻(xiàn)。以數(shù)據(jù)為對(duì)象的檢索,如查找數(shù)學(xué)公式、數(shù)據(jù)圖表、某一材料的成分、性能等,是一種確定性檢索。是以特定的事實(shí)為檢索對(duì)象。事實(shí)內(nèi)容包括大量的科學(xué)事件和社會(huì)事件。 就是查找特定概念的含義、作用、原理或使用范圍等解釋性內(nèi)容或說明。(三)信息檢索的類型(三)信息檢索的類型全文檢索全文檢索圖像檢索圖像檢索 多媒體檢索多媒體檢索檢索系統(tǒng)存儲(chǔ)的是整篇文章或整本圖書。還有另一層意義:即從文獻(xiàn)的全文中進(jìn)行某項(xiàng)檢索。即以圖形、圖像或圖文信息為檢索內(nèi)容的信息檢索。是以文字、圖像、聲音等多媒體信息為檢索內(nèi)容的信息檢索。

19、(四)檢索效果評(píng)介(四)檢索效果評(píng)介查全率(查全率(R R):檢出的符合要求的相關(guān)文獻(xiàn)占全部相關(guān)文獻(xiàn)的比例。R=b/a*100 (a為符合要求的全部文獻(xiàn),b為檢出的符合要求的相關(guān)文獻(xiàn))漏檢率(漏檢率(O O):):未被檢出的符合要求的相關(guān)文獻(xiàn)占全部相關(guān)文獻(xiàn)的比例。O=(1-R)*100%查準(zhǔn)率查準(zhǔn)率(P)(P):檢出的符合條件的相關(guān)文獻(xiàn)占檢出的全部文獻(xiàn)的比例。P=b/c *100%(c為檢出的全部文獻(xiàn))誤檢率(誤檢率(N N):):檢出的未符合條件的文獻(xiàn)占檢出的全部文獻(xiàn)的比例。N=(1-P)*100%以上四個(gè)檢索評(píng)介參數(shù)只適用于內(nèi)涵清楚的機(jī)檢系統(tǒng)。習(xí)題1、文獻(xiàn)及文獻(xiàn)的構(gòu)成要素2、按文獻(xiàn)級(jí)別區(qū)分

20、,文獻(xiàn)可分為幾種?3、在一個(gè)具有1000篇文獻(xiàn)的試驗(yàn)性機(jī)檢系統(tǒng)中檢索某課題,用一特定檢索策略查該課題時(shí)輸出文獻(xiàn)60篇。經(jīng)分析評(píng)估,發(fā)現(xiàn)該系統(tǒng)中共有該課題相關(guān)文獻(xiàn)50篇,檢出的文獻(xiàn)中實(shí)際相關(guān)文獻(xiàn)只有30篇,求查全率、查準(zhǔn)率、誤檢率和漏檢率。第二章文獻(xiàn)信息檢索基礎(chǔ)第二章文獻(xiàn)信息檢索基礎(chǔ)第一節(jié)檢索技術(shù)及其實(shí)現(xiàn)第二節(jié)檢索途徑和語(yǔ)言第三節(jié)檢索步驟第一節(jié)信息檢索技術(shù)及實(shí)現(xiàn)一、檢索方式1、命令式檢索:用邏輯運(yùn)算符、位置算符及其他檢索符號(hào),把不同的檢索詞連接起來進(jìn)行檢索的一個(gè)種方式。適用于專業(yè)人員。如:經(jīng)濟(jì) *( WTO + 世界貿(mào)易組織) * 企業(yè) * 發(fā)展2、菜單式檢索:一種通過窗口菜單進(jìn)行檢索的簡(jiǎn)單、易

21、操作的檢索方式。適用于一般讀者檢索。如圖:第一節(jié)信息檢索技術(shù)及實(shí)現(xiàn)一、邏輯提問式(布爾邏輯組配):計(jì)算機(jī)檢索的基本技術(shù),主要通過邏輯運(yùn)算符(布爾算符)“與(and,*)”、“或(or,+)”、 “非(not,-)”等將檢索詞連接的提問式。注意:優(yōu)生級(jí)為not,and,or,用括號(hào)保證優(yōu)先權(quán);運(yùn)算符兩側(cè)必須各有一個(gè)空格(半角)對(duì)、兩詞而言其AND、OR、NOT的邏輯含義如下: A and B A * B 表示提問要求命中文獻(xiàn)同時(shí)包含表示提問要求命中文獻(xiàn)同時(shí)包含A、B兩個(gè)特征。兩個(gè)特征。 例:圖書館信息資源建設(shè) 提問式:圖書館 *信息資源 * 建設(shè)A or B : 表示提問要求命中文獻(xiàn)包含表示提問

22、要求命中文獻(xiàn)包含A、B兩個(gè)特征中的任何一個(gè)即可。兩個(gè)特征中的任何一個(gè)即可。 A + B 例:數(shù)據(jù)挖掘在信息檢索與信息分析中的應(yīng)用 提問式:數(shù)據(jù)挖掘 * (信息檢索 + 信息分析)A not B:表示提問要求命中文獻(xiàn)包含特征表示提問要求命中文獻(xiàn)包含特征A,但不能包含特征,但不能包含特征B。 A - B 例:自由分配方面的文獻(xiàn)(排除海南大學(xué)師生的著作) 提問式::(關(guān)鍵詞=自由分配) not (單位=海南大學(xué)) 命令式檢索的組配菜單式檢索的組配檢索結(jié)果:在檢索詞之間使用,規(guī)定算符兩邊的檢索詞出現(xiàn)在記錄中的的位置,以提高檢準(zhǔn)率。常見的位置算符如下:位置算符表示方法說明with(W)或()兩個(gè)詞在命中

23、結(jié)果中相鄰(可有空格、標(biāo)點(diǎn)和連字符),詞序不得顛倒。(nW)兩個(gè)詞之間最多可夾入n個(gè)詞,詞序不得顛倒。near(N)兩個(gè)詞在命中結(jié)果中相鄰,詞序可顛倒。(nN)兩個(gè)詞之間最多可夾入n個(gè)詞,詞序可顛倒。field(F)兩個(gè)詞在同一字段出現(xiàn),位置不固定。subfield(S)兩個(gè)詞在同一子字段出現(xiàn),位置不固定。link(L)兩個(gè)詞在同一規(guī)范詞單元內(nèi)出現(xiàn),位置不固定。第二章第一節(jié)二、位置算符第二章第一節(jié)二、位置算符第二章第一節(jié)三、通配符(截詞檢索)截詞檢索是利用檢索詞的詞干或不完整的詞形進(jìn)行檢索。其方法是在詞干后可能變化的字符處加上通配符,可減少檢索詞的輸入量,簡(jiǎn)化檢索步驟,提高查全率。1、無限截詞

24、,、無限截詞,檢索詞的詞干后(前)加一個(gè)“?”(有的系統(tǒng)為加*),表示詞干后(前)可以有任意個(gè)字符。當(dāng)通配符在詞干后方時(shí),我們稱為前方一致或右截?cái)嗲胺揭恢禄蛴医財(cái)?,如“apple?”可代替(apple + apples + apple-pie + applesauce);通配符在詞干前方時(shí),我們稱為后方一致或左截?cái)嗪蠓揭恢禄蜃蠼財(cái)?。?economics可代替(economics + micro economics + macro economics)。同時(shí)采用以上兩種方式為復(fù)合截?cái)鄰?fù)合截?cái)?,如?count?”來代替(count + account +counter + accounting

25、) 。也可截去中間部分,使詞的兩邊一致,稱為兩邊兩邊一致一致。如wom?n代替(woman + women + womyn)2、有限截詞:有限截詞:檢索詞的詞干后加一個(gè)或一個(gè)以上(最多4個(gè))的“?”,空格后再加一個(gè)“?”,則空格前的” ?”個(gè)數(shù)表示詞干后允許有的最多字符數(shù)。如“apple? ?”只能代替apple,apples,applet,而不能代替applejack。注意:不同的系統(tǒng)有不同的通配符,以上是DIALOG的截詞方法,在EBSCO中,無限截詞符號(hào)為“*”,有限截詞符號(hào)為“?”;另外,截詞的部位要適當(dāng),截得太短(輸入的字符不得少于3個(gè)),會(huì)增加誤檢,截得太長(zhǎng),會(huì)出現(xiàn)漏檢。注意:由于

26、文字結(jié)構(gòu)方面的原因,中文檢索系統(tǒng)極少注意:由于文字結(jié)構(gòu)方面的原因,中文檢索系統(tǒng)極少使用截詞檢索和位置算符檢索。使用截詞檢索和位置算符檢索。四、禁用詞:禁用詞:在絕大多數(shù)的檢索系統(tǒng)中,介詞、代詞、等單獨(dú)使用無實(shí)際意義的詞以及使用頻率很高的詞不能作為檢索詞,被稱為禁用詞,如an,and,by,for,from,of,the,to,with等等。第二章第一節(jié)五、限制檢索在命令式檢索中,通常要用字段代碼來限定檢索的字段,不同的數(shù)據(jù)庫(kù)使用的字段代碼略有不同。“全國(guó)報(bào)刊索引”的字段標(biāo)識(shí)為:A=分類 ,B=題名, C=著者 ,D=單位, E=刊名, F=年份, G=主題, H=文摘 ,I=全字段 例:B=圖

27、書館 * D=海南大學(xué) “DIALOG”的基本索引字段標(biāo)識(shí)為:AB(文摘),DE(敘詞),ID(自由詞),SH(分類標(biāo)題),TI(題目), CO(公司),檢索形式為“檢索詞/字段代碼”。輔助索引有:AU(著作),JN(期刊),PY(年代),檢索形式為“字段標(biāo)識(shí)符=檢索詞”。例:(personal (w) computer/de or network/ti) and la = english and py = 2002或( personal (w) computer/de, ti, id or network/ti, ab) and la = english and py = 2002CNKI直

28、接用字段名稱標(biāo)識(shí),如:題名 = “計(jì)算機(jī)” and “機(jī)構(gòu)”海南大學(xué)”除字段限制外,有些檢索系統(tǒng)還提供一類限制檢索,如EBSCO檢索中可限制時(shí)間、全文、出版物類型、文章類型、同行評(píng)介、封面文章、圖像等。第二章第二節(jié)檢索途徑和語(yǔ)言一、檢索途徑:檢索途徑又稱為檢索點(diǎn)、檢索入口或檢索標(biāo)識(shí),指用戶進(jìn)行信息檢索的出發(fā)點(diǎn)和依據(jù),它是由信息的內(nèi)部特征和外部特征構(gòu)成的。不同的檢索途徑,需要采用不同的檢索語(yǔ)言進(jìn)行檢索。文獻(xiàn)信息檢索途徑文獻(xiàn)信息檢索途徑外部特征外部特征內(nèi)部特征內(nèi)部特征題名:書名、刊名、篇名、引文等責(zé)任者:著者.譯者.出版者.專利權(quán)人等號(hào)碼:ISBN、專利號(hào)、報(bào)告號(hào)、標(biāo)準(zhǔn)號(hào)等分類主題:包括敘詞、主題

29、詞、關(guān)鍵詞等第二章第二節(jié)檢索途徑和語(yǔ)言二、檢索語(yǔ)言:用來描述檢索提問主題、學(xué)科分類等內(nèi)容的語(yǔ)言,它和檢索途徑是相對(duì)應(yīng)的。常見的檢索語(yǔ)言有主題語(yǔ)言和分類語(yǔ)言。檢索語(yǔ)言的類型檢索語(yǔ)言的類型表述文獻(xiàn)外表表述文獻(xiàn)外表特征的語(yǔ)言特征的語(yǔ)言表述文獻(xiàn)內(nèi)容表述文獻(xiàn)內(nèi)容特征的語(yǔ)言特征的語(yǔ)言題名題名責(zé)任者責(zé)任者號(hào)碼號(hào)碼引文引文分類法分類法主題法主題法1、主題詞語(yǔ)言標(biāo)題詞語(yǔ)言: 是從文獻(xiàn)的題目和內(nèi)容中抽出來,經(jīng)過規(guī)范化處理的主題語(yǔ)言。是一種先組式的自然語(yǔ)言。敘詞語(yǔ)言:又稱主題詞,是以表達(dá)文獻(xiàn)主題內(nèi)容的概念單元為基礎(chǔ),經(jīng)過規(guī)范化處理,可以進(jìn)行邏輯組配的一種主語(yǔ)語(yǔ)言。是一種后組式的人工語(yǔ)言。以上兩種語(yǔ)言都是規(guī)范化的檢索

30、語(yǔ)言,其檢索詞從相關(guān)詞表中得出。標(biāo)題語(yǔ)言和敘詞語(yǔ)言界限日益模糊,逐步向敘詞語(yǔ)言轉(zhuǎn)化,因此,敘詞語(yǔ)言是規(guī)范化詞語(yǔ)檢索的基本方法。圖:EBSCO的主題詞表中國(guó)主題詞表天象 天象圖 (考古) Z 耆那教教派光行差Y石刻天文圖 C白衣派 臨邊黃昏天象儀天應(yīng)穴 臨邊增亮 Z 天文儀器Y阿是穴 天衣派 D祼衣派關(guān)鍵詞語(yǔ)言:從文獻(xiàn)的題名、摘要和正文中抽出的具有實(shí)際意義的非規(guī)范化自然語(yǔ)言。其優(yōu)點(diǎn)是:1、簡(jiǎn)捷,降低對(duì)檢索人員的要求;2、易用,易于計(jì)算機(jī)編制和檢索;3、及時(shí),能及時(shí)更新詞匯。缺點(diǎn):1、不規(guī)范,有大量的同義詞、近義詞,影響查全率和查準(zhǔn)率。如“高速公路”有”autobahn”,“autoroute”,

31、“freeway”,“speedway”,“thruway”等,“圖形圖像”和“圖形圖象”同義,檢索時(shí)如果不能全部記住,會(huì)出現(xiàn)漏檢;而“cell”既指細(xì)胞又指電池,檢索時(shí)會(huì)出現(xiàn)誤檢。2、詞匯量大,給存取帶來困難。由于關(guān)鍵詞是未經(jīng)人工干預(yù)的自然語(yǔ)言,符合大眾的檢索習(xí)慣,大多數(shù)檢索系統(tǒng)都有關(guān)鍵詞檢索。2、分類語(yǔ)言:是一種按學(xué)科范疇和體系來劃分事物的檢索語(yǔ)言,是一種按學(xué)科范疇和體系來劃分事物的檢索語(yǔ)言,以分類表的形式體現(xiàn)。它展示了學(xué)科的系統(tǒng)性,反映了事物的從以分類表的形式體現(xiàn)。它展示了學(xué)科的系統(tǒng)性,反映了事物的從屬、派生關(guān)系,從上至下,從總體到局部層層劃分展開,是一種屬、派生關(guān)系,從上至下,從總體到

32、局部層層劃分展開,是一種等級(jí)體系。由類目和相對(duì)應(yīng)的類號(hào)來表達(dá)各種概念,構(gòu)成一個(gè)完等級(jí)體系。由類目和相對(duì)應(yīng)的類號(hào)來表達(dá)各種概念,構(gòu)成一個(gè)完整的分類類目表。整的分類類目表。 如如:中國(guó)圖書館分類法中國(guó)圖書館分類法。 I2 中國(guó)文字I24 小說I247 當(dāng)代作品(1949)I247.5 新體長(zhǎng)篇、中篇小說 .58 武俠小說 如果我們要查找“天龍八部”,分類號(hào)為:I247.58。使用分類法進(jìn)行檢索,能準(zhǔn)確全面查找某一學(xué)科的文獻(xiàn)信息,但會(huì)漏檢同一主題的文獻(xiàn)信息。分類語(yǔ)言是一種人工語(yǔ)言,多數(shù)檢索系統(tǒng)都是用分類號(hào)檢索的,普通用戶難以掌握,一些數(shù)據(jù)庫(kù)分類過粗,一個(gè)類目下面匯集大量文獻(xiàn)。而且分類法一般是數(shù)年才修

33、訂一次,不能反映最新的科學(xué)成果。第二節(jié)檢索步驟檢索步驟:根據(jù)既定課題要求,利用檢索工具查找有關(guān)文獻(xiàn)資料的具體過程,實(shí)際是信息檢索的具體化。為實(shí)現(xiàn)檢索而制定的計(jì)劃或方案稱之為檢索策略。主要有以下步驟:(1)進(jìn)行課題分析,明確課題需求。 檢索文獻(xiàn)信息前對(duì)課題內(nèi)容進(jìn)行分析,明確文獻(xiàn)檢索的目的。課題需求可以分為三種類型:a、普查型:需要全面收集有關(guān)某一主題的文獻(xiàn)資料,如以課題開題、教材編寫等。具有普查、回溯的特點(diǎn),要求盡可能高的查全率。b、攻關(guān)型:需要收集有關(guān)某一主題某一特定方面的文獻(xiàn),其目的在于解決科研、生產(chǎn)中的關(guān)鍵問題,這類需求不強(qiáng)調(diào)查詢的文獻(xiàn)數(shù)量,但需要查得的文獻(xiàn)具有較強(qiáng)的專指性。c、學(xué)習(xí)型:需

34、要了解掌握某一領(lǐng)域的研究動(dòng)向、研究成果或相關(guān)知識(shí),要求查到的文獻(xiàn)具有新穎及時(shí)的特點(diǎn),而對(duì)查全率和查準(zhǔn)率不一定有很高的要求。2、選擇檢索系統(tǒng):選擇檢索工具時(shí)要考慮是否與文獻(xiàn)需求緊密結(jié)合、學(xué)科專業(yè)對(duì)口、覆蓋信息面廣、報(bào)道及時(shí)、揭示信息內(nèi)容準(zhǔn)確、有一定深度的工具以及檢索系統(tǒng)的檢索功能是否完善等,主要有幾個(gè)方面:全面性,即是否與課題相關(guān)的內(nèi)容都要檢索,包括的工具有一次文獻(xiàn)和二次文獻(xiàn)數(shù)據(jù)庫(kù),以及網(wǎng)上相關(guān)資源等。針對(duì)性,保證選擇的檢索工具與檢索課題的學(xué)科一致;專業(yè)性,即選擇與學(xué)科專業(yè)相關(guān)的工具,特別注意跨學(xué)科領(lǐng)域內(nèi)容;權(quán)威性,盡量選用該學(xué)科的權(quán)威性檢索工具;了解檢索工具收錄的范圍,包括時(shí)間跨度、地理范圍、文獻(xiàn)語(yǔ)種、類型等;檢索工具的檢索方法和系統(tǒng)功能是否全面有效。3、檢索詞的選擇:檢索詞是表達(dá)信息

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論