版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、 第二章信息檢索概述2.1信息檢索的涵義信息檢索的概念有狹義和廣義之分。 狹義的信息檢索(Information Retrieval)是指依據(jù)一定的方法,從已經(jīng)組織好的大量有關(guān)文獻(xiàn)集合中,查找并獲取特定的相關(guān)文獻(xiàn)的過程。這里的文獻(xiàn)集合,不是通常所指的文獻(xiàn)本身,而是關(guān)于文獻(xiàn)的信息或文獻(xiàn)的線索。如果真正要獲取文獻(xiàn)中所記錄的信息,那么還要依據(jù)檢索所取得的文獻(xiàn)線索索取原文。 廣義: 它包括信息的存儲和檢索兩個過程(Storage and Retrieval)。信息存儲包括三個步驟: 第一步:信息的選擇與收集。 第二步:信息的標(biāo)引。 第三步:形成大量有序可檢的信息集合。信息的檢索過程則是信息存貯的逆過程
2、。 22、為什么要進(jìn)行信息檢索 2.2.1信息“檢索”與“查找” 網(wǎng)上的免費(fèi)信息資源 圖書館的數(shù)據(jù)庫資源 2.2.2信息檢索的意義 避免重復(fù)研究 節(jié)省時(shí)間 加快科學(xué)研究的進(jìn)程 幫助打開人類知識寶庫,促進(jìn)個人學(xué)習(xí)2.3信息檢索類型根據(jù)檢索對象的不同可以劃分為:文獻(xiàn)檢索、事實(shí)檢索、數(shù)據(jù)檢索。根據(jù)信息檢索結(jié)果的內(nèi)容可以劃分為:書目檢索、數(shù)據(jù)檢索、全文檢索、事實(shí)檢索、聲像檢索。按照信息檢索技術(shù)的發(fā)展可劃分為:全文文本檢索、多媒體檢索、超文本檢索、網(wǎng)絡(luò)信息檢索資源檢索。(一)文獻(xiàn)檢索 (Document Retrieval) 文獻(xiàn)檢索是以查找文獻(xiàn)線索為對象的檢索。從文獻(xiàn)中查出關(guān)于某一主題、某一著者、某一
3、機(jī)構(gòu)、某一地域、某一時(shí)代的有關(guān)信息以及查找某篇論文出處以及某一出版物的收藏處等均屬文獻(xiàn)檢索范疇。 館藏文獻(xiàn)信息資源的組織和分類1.文獻(xiàn)的組織TG659/64 索書號TG659 分類號加工中心培訓(xùn)教程王榮興主編北京:2006.5, 機(jī)械工業(yè)出版社,5000冊,16K,48元索書號是索取文獻(xiàn)的號碼。包括分類號(TG659)和種次號(64) 2.文獻(xiàn)資源的分類 文獻(xiàn)的分類是指按照文獻(xiàn)所反映內(nèi)容的學(xué)科性質(zhì)和其它特征的異同分門別類地整理和組織文獻(xiàn)的過程。 為了對文獻(xiàn)進(jìn)行分類而制定的各種分類標(biāo)準(zhǔn)稱為文獻(xiàn)分類法。 (1)中圖法中國圖書館分類法中圖法簡表的網(wǎng)址 本校圖書館主頁可查中圖分類號TM 電工技術(shù)TM0
4、 一般性問題TM1 電工基礎(chǔ)理論TM2 電工材料TM3 電機(jī)TM4 變壓器、變流器及電抗器TM5 電器TM6 發(fā)電、發(fā)電廠TM7 輸配電工程、電力網(wǎng)及電力系統(tǒng)TM8 高電壓技術(shù)TM91 獨(dú)立電源技術(shù)(直接發(fā)電)TM92 電氣化、電能應(yīng)用TM93 電氣測量技術(shù)及儀器進(jìn)行分類的工具書22個基本大類22個英文字母為類號ABCDE.TUVXZTG 金屬學(xué)與金屬工藝TH 機(jī)械、儀表工業(yè)TJ 武器工業(yè)TK 能源與動力工業(yè)TL 原子能技術(shù)TM 電工技術(shù)TH11 機(jī)械學(xué) TH12 機(jī)械設(shè)計(jì)、計(jì)算與制圖TH13 機(jī)械零件及傳動裝置TH14 機(jī)械制造用材料TH121標(biāo)準(zhǔn)、規(guī)格TH122機(jī)械設(shè)計(jì)TH123機(jī)械計(jì)算T
5、H126機(jī)械制圖TH128機(jī)械模型(2)科圖法(3)人大法(4)DDC(Dewey Decimal Classification)杜威十進(jìn)分類法(5) UDC(Universal Decimal Classification)國際十進(jìn)分類法(二)事實(shí)檢索是信息檢索中最復(fù)雜的一種。(三)數(shù)據(jù)檢索包括數(shù)值、參數(shù)、常數(shù)、公式、化合物分子式、化學(xué)結(jié)構(gòu)、產(chǎn)品名稱、規(guī)格、市場行情、圖表、各種統(tǒng)計(jì)數(shù)據(jù)(四) 書目檢索 書目檢索指查出某一主題的文獻(xiàn)條目的檢索,按檢索結(jié)果可分為題錄檢索、文摘檢索、圖書與期刊等目錄檢索。(五)聲像檢索 聲像檢索主要是指對聲音、圖像和其他圖文信息的檢索。(六)全文檢索 全文檢索是指
6、利用原始文獻(xiàn)庫進(jìn)行的檢索,檢索的結(jié)果可以是原始文獻(xiàn)的全文,也可以是其部分內(nèi)容。(七)全文文本檢索 全文文本檢索也叫全文數(shù)據(jù)庫檢索。 (八)超文本檢索 超文本檢索是一種具有聯(lián)想式思維功能的新型檢索技術(shù)。(九)多媒體檢索 能支持兩種以上媒體的數(shù)據(jù)庫檢索就稱之為多媒體檢索。(十) 網(wǎng)絡(luò)信息檢索資源檢索按檢索方式分:手工檢索、計(jì)算機(jī)檢索手工檢索計(jì)算機(jī)檢索2.4信息檢索系統(tǒng) 信息檢索系統(tǒng)(檢索工具)是根據(jù)一定的社會信息需要,為了達(dá)到一定的信息交流目的而建立起來的一整套文獻(xiàn)信息的收集、加工、存儲、檢索和使用的完整的有序化的資源集合。包括存儲子系統(tǒng)與檢索子系統(tǒng)檢索工具通常以書本、卡片、表冊、數(shù)據(jù)庫的形式出現(xiàn)
7、,檢索工具一般應(yīng)具備下列條件: 對所收錄的文獻(xiàn)的各種特征(外部特征和內(nèi)容特征)要有詳細(xì)的描述; 每條描述記錄要標(biāo)明可供檢索用的標(biāo)識,文獻(xiàn)要有標(biāo)識才能對其進(jìn)行檢索; 全部描述記錄科學(xué)地組織成一個有機(jī)的整體; 具有多種必要的檢索手段。信息檢索系統(tǒng)分為手工檢索系統(tǒng)(工具)和計(jì)算機(jī)檢索系統(tǒng),均由以下四個部分組成: 檢索文檔 技術(shù)設(shè)備 作用于系統(tǒng)的人 系統(tǒng)構(gòu)成準(zhǔn)則2.5信息檢索基本原理 就是檢索提問標(biāo)識與存儲在檢索工具或數(shù)據(jù)庫中的標(biāo)引標(biāo)識(存儲標(biāo)識)進(jìn)行比較,兩者一致或信息標(biāo)引標(biāo)識包含檢索提問標(biāo)識,就可“匹配”,則具有該標(biāo)識的信息就被輸出,就可得到“命中信息”。2.6信息檢索語言1.信息檢索語言的概念檢
8、索語言是根據(jù)信息檢索的需要,專門用于各種手工和計(jì)算機(jī)化的文獻(xiàn)信息檢索與存貯系統(tǒng)描述文獻(xiàn)信息中信息的內(nèi)容特征和外部特征的表達(dá)檢索提問的人工語言。它是標(biāo)引與檢索提問之間約定的語言,是人與檢索系統(tǒng)對話的基礎(chǔ)。2.檢索語言的作用 檢索語言在信息檢索中起著極其重要的作用,它是溝通信息存儲與信息檢索兩個過程的橋梁。3.檢索語言的種類 檢索語言一般來說由語詞和詞表兩部分構(gòu)成。語詞也稱檢索標(biāo)識,是表達(dá)主題概念的名詞術(shù)語或邏輯分類的分類號及代碼。 (1) 分類語言 分類語言是指以數(shù)字、字母或字母與數(shù)字結(jié)合作為基本字符,采用字符直接連接并以圓點(diǎn)(或其他符號)作為分隔符的書寫法,以基本類目作為基本詞匯,以類目的從屬
9、關(guān)系來表達(dá)復(fù)雜概念的一類檢索語言。以知識屬性來描述和表達(dá)信息內(nèi)容的信息處理方法稱為分類法。國際專利分類表、中國圖書館分類法等。 目前,我國各大文獻(xiàn)數(shù)據(jù)庫中國科學(xué)引文數(shù)據(jù)庫、中國學(xué)術(shù)期刊綜合評價(jià)數(shù)據(jù)庫以及數(shù)字化圖書館、中國期刊網(wǎng)等都要求學(xué)術(shù)論文按中圖法標(biāo)注中圖分類號。(2) 主題語言 主題語言是指以自然語言的字符為字符,以名詞術(shù)語為基本詞匯,用一組名詞術(shù)語作為檢索標(biāo)識的一類檢索語言。主題語言表達(dá)的概念比較準(zhǔn)確,具有較好的直觀性、靈活性和專指性,滿足用戶從主題概念角度檢索新興專業(yè)學(xué)科、交叉學(xué)科文獻(xiàn)信息的要求。主題語言規(guī)范性主題語言非規(guī)范性主題語言單元詞語言敘詞語言標(biāo)題詞語言關(guān)鍵詞語言純自然語言 關(guān)
10、鍵詞語言和純自然語言屬于非規(guī)范性主題語言,也稱自然語言,是目前使用最頻繁、最廣泛的一種檢索語言。它具有不編制詞表、選詞靈活多變、標(biāo)引和檢索速度快、及時(shí)反映事物發(fā)展變化、準(zhǔn)確表達(dá)新概念等優(yōu)點(diǎn),但其缺陷也是十分明顯的誤檢率非常高。(3)分類語言與主題語言的比較:提取對象不同標(biāo)識符號不同適用的索引方式不同用途不同編制策略不同檢索性能不同2.7信息檢索工具一、概述1、檢索工具的含義、構(gòu)成要素 檢索工具是指根據(jù)檢索語言,將無序列文獻(xiàn)按一定方式系統(tǒng)組織起來,用以報(bào)道、存儲和檢索文獻(xiàn)的工具。如:專業(yè)文摘、圖書目錄、論文題錄、文獻(xiàn)數(shù)據(jù)庫等。文獻(xiàn)、檢索語言、文獻(xiàn)條目是構(gòu)成檢索工具的三個基本要素。2、檢索工具的特
11、征 (1)必須詳細(xì)描述文獻(xiàn)的內(nèi)容特征和外表特征。(2)描述文獻(xiàn)的記錄(或稱款目)。(3)全部文獻(xiàn)條目按一定順序,科學(xué)地組成一個有機(jī)的整體。(4)能夠提供多種檢索途徑。3、檢索工具的職能(1) 報(bào)道職能 (2) 存貯職能 (3) 檢索職能 二、檢索工具的類型 (一)目錄 (二) 題錄 (三) 文摘 (四) 索引 (五)參考工具書 (六) 搜索引擎 三、檢索工具的結(jié)構(gòu) 檢索工具雖然多種多樣,但根據(jù)文獻(xiàn)工作有關(guān)的規(guī)定,一個完整的書目檢索系統(tǒng),不管是手工檢索還是計(jì)算機(jī)檢索系統(tǒng),都有內(nèi)容相當(dāng)?shù)幕窘M成部分,如下表所示: 檢索工具的結(jié)構(gòu)(一) 手工檢索工具的結(jié)構(gòu) 從上表可以得知,手工檢索工具一般由使用說明
12、、目次表、正文、輔助索引、附錄等五個部分組成。如:現(xiàn)代漢語詞典 1、使用說明 2、目次表或分類表和主題詞表 3、正文部分 4、輔助索引 5、附錄或資料來源索引 (二) 計(jì)算機(jī)檢索工具的結(jié)構(gòu) 計(jì)算機(jī)檢索工具通常由檢索軟件與數(shù)據(jù)庫構(gòu)成。檢索軟件確定了該檢索工具的檢索的方式,規(guī)定了檢索系統(tǒng)的檢索算符,不同的計(jì)算機(jī)檢索工具采用了不同的檢索軟件,但同一個數(shù)據(jù)開發(fā)商往往采用統(tǒng)一的檢索軟件。數(shù)據(jù)庫主要由字段、記錄、文檔、幫助文件等組成。2.8信息檢索的一般方法、途徑與程序一、文獻(xiàn)信息檢索方法(一) 常用法(1) 順查法(2) 倒查法(3) 抽查法(二) 追溯法(三) 綜合法二、文獻(xiàn)檢索途徑 信息用戶在檢索時(shí),把所需信息的某種特征標(biāo)識轉(zhuǎn)換為文獻(xiàn)標(biāo)識,以此為入口進(jìn)行檢索。這個檢索入口就叫做檢索途徑。多種多樣的索引就可以提供多種多樣的檢索途徑。如下表所示:常用的、重要的檢索途徑主要是以下幾種(一) 題名檢索途徑(二) 著者檢索途徑(三) 分類檢索途徑(四) 主題檢索途徑 三、文獻(xiàn)信息檢索步驟和方法 (一) 分析研究課題,明確檢索要求、時(shí)間、范圍 (二) 確定檢索策略 1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年空調(diào)銷售渠道拓展與品牌建設(shè)服務(wù)合同3篇
- 二零二五版合租房屋租賃合同-含裝修保證金條款3篇
- 二零二五版建筑設(shè)備租賃合同書范例2篇
- 二零二五版法院判決指導(dǎo)下的債務(wù)償還與再融資合同3篇
- 二零二五版第5章第5節(jié)合同擔(dān)保及供應(yīng)鏈金融合作協(xié)議3篇
- 二零二五版合同部合同合規(guī)性審查與風(fēng)險(xiǎn)預(yù)警合同3篇
- 二零二五年度酒店物業(yè)服務(wù)質(zhì)量持續(xù)改進(jìn)合同3篇
- 二零二五年青少年體育賽事服裝贊助合同3篇
- 二零二五版安防監(jiān)控設(shè)備研發(fā)與生產(chǎn)合同3篇
- 二零二五年度物流行業(yè)集體合同協(xié)議范本3篇
- 2024年08月云南省農(nóng)村信用社秋季校園招考750名工作人員筆試歷年參考題庫附帶答案詳解
- 防詐騙安全知識培訓(xùn)課件
- 心肺復(fù)蘇課件2024
- 2024年股東股權(quán)繼承轉(zhuǎn)讓協(xié)議3篇
- 2024-2025學(xué)年江蘇省南京市高二上冊期末數(shù)學(xué)檢測試卷(含解析)
- 四川省名校2025屆高三第二次模擬考試英語試卷含解析
- 2024年認(rèn)證行業(yè)法律法規(guī)及認(rèn)證基礎(chǔ)知識
- 江蘇省建筑與裝飾工程計(jì)價(jià)定額(2014)電子表格版
- 分紅保險(xiǎn)精算規(guī)定
- Proud-of-you中英文歌詞
- 基因的表達(dá)與調(diào)控.ppt
評論
0/150
提交評論