第一章信息檢索緒論_第1頁
第一章信息檢索緒論_第2頁
第一章信息檢索緒論_第3頁
第一章信息檢索緒論_第4頁
第一章信息檢索緒論_第5頁
已閱讀5頁,還剩67頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、信息存儲與檢索信息存儲與檢索 Information Storage and Retrieval 信息管理系徐曉芳 副教授2013.2課程主要內(nèi)容 第一章第一章 緒論緒論 第一節(jié)第一節(jié) 信息與信息檢索簡介信息與信息檢索簡介 主要介紹信息、信息檢索、信息檢索語言、主要介紹信息、信息檢索、信息檢索語言、檢索工具及檢索系統(tǒng)的定義;簡單介紹信檢索工具及檢索系統(tǒng)的定義;簡單介紹信息檢索的發(fā)展息檢索的發(fā)展 第二節(jié)第二節(jié) 信息資源信息資源 第三節(jié)第三節(jié) 信息檢索的類型信息檢索的類型 第二章第二章 信息檢索的理論與基本方法信息檢索的理論與基本方法 第一節(jié)第一節(jié) 信息檢索語言與檢索途徑信息檢索語言與檢索途徑 (

2、1 1)分類語言)分類語言 (2 2)主題語言)主題語言 (3 3)分類主題一體化語言)分類主題一體化語言 (4 4)代碼語言)代碼語言 (5 5)引文語言)引文語言1 1、內(nèi)容特征檢索途徑、內(nèi)容特征檢索途徑(1 1)分類途徑)分類途徑(2 2)主題途徑)主題途徑(3 3)分類主題途徑)分類主題途徑2 2、外部特征檢索途徑、外部特征檢索途徑(1 1)責(zé)任者途徑)責(zé)任者途徑(2 2)題名途徑)題名途徑(3 3)序號途徑)序號途徑(4 4)引文途徑)引文途徑 第二節(jié)第二節(jié) 事實數(shù)據(jù)信息的檢索工具事實數(shù)據(jù)信息的檢索工具 一、字典、詞典(辭典)一、字典、詞典(辭典) 二、百科全書二、百科全書 三、手冊

3、三、手冊 四、年鑒四、年鑒 五、名錄五、名錄 第三節(jié)第三節(jié) 文獻(xiàn)檢索工具簡介文獻(xiàn)檢索工具簡介 一、目錄型檢索工具一、目錄型檢索工具 二、題錄型檢索工具二、題錄型檢索工具 三、文摘型檢索工具三、文摘型檢索工具 第四節(jié)第四節(jié) 索引介紹索引介紹 著者索引、著者索引、 主題索引(關(guān)鍵詞索引)、主題索引(關(guān)鍵詞索引)、 分類索分類索引、引、 題名索引、其他索引題名索引、其他索引 第五節(jié)第五節(jié) 計算機(jī)信息檢索基礎(chǔ)計算機(jī)信息檢索基礎(chǔ) 第三章第三章 中文文獻(xiàn)信息檢索中文文獻(xiàn)信息檢索 中國學(xué)術(shù)期刊數(shù)據(jù)庫中國學(xué)術(shù)期刊數(shù)據(jù)庫 ( (中知庫)中知庫) 維普科技期刊數(shù)據(jù)庫維普科技期刊數(shù)據(jù)庫 萬方資源數(shù)據(jù)庫萬方資源數(shù)據(jù)庫

4、 中國資訊行中國資訊行 人大復(fù)印資料人大復(fù)印資料 第四章第四章 外文文獻(xiàn)信息檢索外文文獻(xiàn)信息檢索 一、一、 Ei Village Ei Village數(shù)據(jù)庫數(shù)據(jù)庫 Ei Compendex Web(EI Ei Compendex Web(EI 網(wǎng)絡(luò)版)網(wǎng)絡(luò)版) INSPECINSPEC是是科學(xué)文摘科學(xué)文摘(Science Abstracts(Science Abstracts,簡,簡稱稱SA)SA)的電子版,的電子版, 專利專利 (Patents)(Patents): USPTO Patents USPTO Patents 為美國專利為美國專利和商標(biāo)局的全文專利數(shù)據(jù)庫。和商標(biāo)局的全文專利數(shù)據(jù)庫

5、。 TechstreetTechstreet標(biāo)準(zhǔn)標(biāo)準(zhǔn) (Techstreet Standards)(Techstreet Standards)世界世界上最大的工業(yè)標(biāo)準(zhǔn)集之一上最大的工業(yè)標(biāo)準(zhǔn)集之一 ScirusScirus是迄今為止因特網(wǎng)上最全面的科技專用搜是迄今為止因特網(wǎng)上最全面的科技專用搜索引擎索引擎二、二、ISI Web of Knowledge平臺信息資源組成信息資源組成Web of Science(WOS)INSPECMEDLINEDerwent Innovations IndexCurrent Contents ConnectISI eSearchISTP(Index to Scie

6、ntific & Technical ProceedingsISSHP(Index to Social Science & Humanities ProceedingsScience Citation Index ExpandedSocial Science Citation IndexArts & Humanities Citation IndexIndex Chemicus(IC)Current Chemical Reactions(CCR)3個引文個引文數(shù)據(jù)庫數(shù)據(jù)庫2 個會議個會議論文引文論文引文數(shù)據(jù)庫數(shù)據(jù)庫2個化學(xué)數(shù)個化學(xué)數(shù)據(jù)庫據(jù)庫ISI Chemistry 第

7、五章第五章 Internet信息檢索信息檢索 第一節(jié)第一節(jié) Internet概述概述 第二節(jié)第二節(jié) Internet 搜索引擎搜索引擎 搜索引擎搜索技術(shù)、網(wǎng)絡(luò)信息檢索技巧、搜索引擎搜索技術(shù)、網(wǎng)絡(luò)信息檢索技巧、 國內(nèi)外綜合型檢索工具國內(nèi)外綜合型檢索工具 第三節(jié)第三節(jié) 主要搜索引擎主要搜索引擎 實驗安排 中國學(xué)術(shù)期刊數(shù)據(jù)庫中國學(xué)術(shù)期刊數(shù)據(jù)庫 ( (中知庫)中知庫) 維普科技期刊數(shù)據(jù)庫維普科技期刊數(shù)據(jù)庫 萬方資源數(shù)據(jù)庫萬方資源數(shù)據(jù)庫 中國資訊行中國資訊行 人大復(fù)印資料人大復(fù)印資料 Ei Village Ei Village數(shù)據(jù)庫數(shù)據(jù)庫 Web of Science Internet 搜索引擎搜索引擎

8、教學(xué)目的與要求 掌握文獻(xiàn)信息、數(shù)字信息檢索的基本掌握文獻(xiàn)信息、數(shù)字信息檢索的基本原理和方法,了解國內(nèi)外重要的文獻(xiàn)檢索原理和方法,了解國內(nèi)外重要的文獻(xiàn)檢索工具和檢索系統(tǒng)的特點、編排體例以及使工具和檢索系統(tǒng)的特點、編排體例以及使用方法,較熟練地掌握幾種工具和系統(tǒng)的用方法,較熟練地掌握幾種工具和系統(tǒng)的檢索方法和技巧,最終使學(xué)生能夠達(dá)到利檢索方法和技巧,最終使學(xué)生能夠達(dá)到利用檢索工具查閱所需資料的水平,為以后用檢索工具查閱所需資料的水平,為以后從事相關(guān)工作打下基礎(chǔ)。從事相關(guān)工作打下基礎(chǔ)。教材及參考書1、馬景娣實用信息檢索教程, 浙江教育出版社, 2004年2、葉繼元信息檢索導(dǎo)論(第2版,電子工業(yè)出版社

9、, 2009年3、王立清信息檢索教程(第2版, 中國人民大學(xué)出版社, 2008年本課程的實踐環(huán)節(jié)本課程的實踐環(huán)節(jié) 16 學(xué)時,以上機(jī)實驗為主。學(xué)時,以上機(jī)實驗為主。關(guān)于課程的考試關(guān)于課程的考試 本課程的學(xué)生成績由以下三部分組成:本課程的學(xué)生成績由以下三部分組成: 平時的上機(jī)實驗成績及平時作業(yè)成績平時的上機(jī)實驗成績及平時作業(yè)成績30% 期中考試成績期中考試成績 30%(理論考試)(理論考試) 上機(jī)考核上機(jī)考核 40% (實踐考試)(實踐考試) 根據(jù)平時上課的考勤情況酌情加減分根據(jù)平時上課的考勤情況酌情加減分第一章 緒論 第一節(jié)第一節(jié) 信息存儲與檢索簡介信息存儲與檢索簡介一、什么是信息一、什么是信

10、息(Information)? 漢語中的漢語中的“信息信息”一詞中,一詞中,“信信”與與“息息”的意的意思相近,前者側(cè)重于消息、征兆,后者強(qiáng)調(diào)情況、音思相近,前者側(cè)重于消息、征兆,后者強(qiáng)調(diào)情況、音訊。兩字連成一詞使用,最早見于訊。兩字連成一詞使用,最早見于三國志三國志中的中的“正數(shù)(天意、天數(shù))欲來,信息甚大。正數(shù)(天意、天數(shù))欲來,信息甚大。” 在西方英文中在西方英文中 information一詞有情報、資料、一詞有情報、資料、消息、報道之意,我國大陸曾譯為情報或信息,后經(jīng)消息、報道之意,我國大陸曾譯為情報或信息,后經(jīng)國家有關(guān)部門核準(zhǔn),統(tǒng)一譯成國家有關(guān)部門核準(zhǔn),統(tǒng)一譯成“信息信息”。在我國臺

11、灣、。在我國臺灣、香港地區(qū),該詞被譯為香港地區(qū),該詞被譯為“資訊資訊”。 信息化的創(chuàng)始人香農(nóng)(申農(nóng)信息化的創(chuàng)始人香農(nóng)(申農(nóng))(美國數(shù)學(xué)家、信)(美國數(shù)學(xué)家、信息論的創(chuàng)始人息論的創(chuàng)始人 )19481948年在年在通信的數(shù)學(xué)理論通信的數(shù)學(xué)理論中中將信息定義為將信息定義為“兩次否定性之差兩次否定性之差”。他指出:。他指出:“凡是在一種情況下能減少不確定性的任何事物凡是在一種情況下能減少不確定性的任何事物都叫做信息。都叫做信息?!边@一定義是從通信科學(xué)的角度來這一定義是從通信科學(xué)的角度來探討信息概念的,也就是說,通訊的意義就在于探討信息概念的,也就是說,通訊的意義就在于減少或消除通訊者的某種不定性,那么

12、收信者被減少或消除通訊者的某種不定性,那么收信者被消除的不定性的大小就表示其所收到的信息量。消除的不定性的大小就表示其所收到的信息量。 這種定義沒有從信息的語義因素給出定義,這種定義沒有從信息的語義因素給出定義,也沒有考慮信息的含義價值,因此不能直接用于也沒有考慮信息的含義價值,因此不能直接用于研究人類的信息傳播。但這一定義指出了信息的研究人類的信息傳播。但這一定義指出了信息的一個價值一個價值減少不確定性,這是信息的認(rèn)知知減少不確定性,這是信息的認(rèn)知知識功能,即當(dāng)一個信息為人們所感知和確認(rèn)后,識功能,即當(dāng)一個信息為人們所感知和確認(rèn)后,這一信息就成為一定意義上的知識,形成后的知這一信息就成為一定

13、意義上的知識,形成后的知識又可以作為信息來傳遞;而尚未被認(rèn)識的原始識又可以作為信息來傳遞;而尚未被認(rèn)識的原始信息,則成為人們努力探討的對象,在尚未認(rèn)識信息,則成為人們努力探討的對象,在尚未認(rèn)識它們之前還不是知識(未知信息)。它們之前還不是知識(未知信息)。 美國數(shù)學(xué)家、美國數(shù)學(xué)家、控制論的創(chuàng)始者維納控制論的創(chuàng)始者維納 Wiener將信息引將信息引入控制論,認(rèn)為信息就是組織程度,它能使系統(tǒng)的有入控制論,認(rèn)為信息就是組織程度,它能使系統(tǒng)的有序性增強(qiáng),減少破壞、混亂、噪聲。序性增強(qiáng),減少破壞、混亂、噪聲。 鐘義信(北京郵電大學(xué)原副校長鐘義信(北京郵電大學(xué)原副校長 ):信息是事物存:信息是事物存在的方

14、式或運動的狀態(tài),以及這種方式或狀態(tài)直接或在的方式或運動的狀態(tài),以及這種方式或狀態(tài)直接或間接的表達(dá)。間接的表達(dá)。 辭海辭海:“信息是指對消息接收者來說預(yù)先不很有信息是指對消息接收者來說預(yù)先不很有知道的報道。知道的報道?!?美國圖書館學(xué)會的信息專家:美國圖書館學(xué)會的信息專家:“信息是一切思想、事信息是一切思想、事實和富有想像力的作品,它們以各種方式進(jìn)行了記錄實和富有想像力的作品,它們以各種方式進(jìn)行了記錄和傳播。和傳播。”教材定義:(P4) 信息是被反映物的屬性再現(xiàn),信息的信息是被反映物的屬性再現(xiàn),信息的屬性在于表現(xiàn)它物。也就是說,信息不是屬性在于表現(xiàn)它物。也就是說,信息不是事物的本身,而是由事物發(fā)

15、出的消息、情事物的本身,而是由事物發(fā)出的消息、情報、指令、數(shù)據(jù)、信號中所包含的內(nèi)容,報、指令、數(shù)據(jù)、信號中所包含的內(nèi)容,是對客觀世界中各種事物發(fā)出的特征、變是對客觀世界中各種事物發(fā)出的特征、變化及其相互聯(lián)系的最新反映。一切事物包化及其相互聯(lián)系的最新反映。一切事物包括自然界和人類社會都會產(chǎn)生信息。一個括自然界和人類社會都會產(chǎn)生信息。一個完整的信息過程,包括信息的傳遞、接收、完整的信息過程,包括信息的傳遞、接收、貯存、加工和利用。貯存、加工和利用。信息、知識與情報的邏輯關(guān)系信息、知識與情報的邏輯關(guān)系信息信息知識知識情報情報信息具有以下特征:(1)普遍性)普遍性(2)時效性:信息在一定的時間內(nèi)是有效

16、的信息,在此時)時效性:信息在一定的時間內(nèi)是有效的信息,在此時間之外就是無效信息。而且任何信息從信源傳播到信宿都間之外就是無效信息。而且任何信息從信源傳播到信宿都需要經(jīng)過一定的時間,都有其時滯性。需要經(jīng)過一定的時間,都有其時滯性。(3)傳遞性)傳遞性(4)可轉(zhuǎn)換性:信息是可以由一種形態(tài)轉(zhuǎn)換成另一種形態(tài)。)可轉(zhuǎn)換性:信息是可以由一種形態(tài)轉(zhuǎn)換成另一種形態(tài)。信息一般有信息一般有4種形態(tài):數(shù)據(jù)、文本、聲音、圖像。這種形態(tài):數(shù)據(jù)、文本、聲音、圖像。這4種形種形態(tài)可以相互轉(zhuǎn)化,例如,照片被傳送到計算機(jī),就把圖像態(tài)可以相互轉(zhuǎn)化,例如,照片被傳送到計算機(jī),就把圖像轉(zhuǎn)化成了數(shù)字。轉(zhuǎn)化成了數(shù)字。(5)可再生性)可

17、再生性(6)共享性:同一信源可以供給多個信宿,因此信息是可)共享性:同一信源可以供給多個信宿,因此信息是可以共享的以共享的 ,且不因共享而減少,且不因共享而減少(7)可識別性)可識別性 :信息是可以識別的,識別又可分為直接認(rèn):信息是可以識別的,識別又可分為直接認(rèn)別和間接識別,直接認(rèn)別是指通過感官的識別,間接識別別和間接識別,直接認(rèn)別是指通過感官的識別,間接識別是指通過各種測試手段的識別。不同的信息源有不同的識是指通過各種測試手段的識別。不同的信息源有不同的識別方法。別方法。 (8)可存儲性:信息是可以通過各種方法存儲的。)可存儲性:信息是可以通過各種方法存儲的。 二、信息檢索二、信息檢索 1、

18、定義、定義 (1)從通信的角度認(rèn)識信息檢索:強(qiáng)調(diào)信息發(fā)布者和接受者之)從通信的角度認(rèn)識信息檢索:強(qiáng)調(diào)信息發(fā)布者和接受者之間的通信,是兩者關(guān)系的變化和延伸。間的通信,是兩者關(guān)系的變化和延伸。 1950年年,美國學(xué)者莫爾斯美國學(xué)者莫爾斯Calvin N.Mooers在在把信息檢索把信息檢索看做是時間性的通信看做是時間性的通信一文中首創(chuàng)了一文中首創(chuàng)了“信息檢索信息檢索”這一術(shù)語。并這一術(shù)語。并認(rèn)為信息檢索是一種時間性通信形式,此種通信是在時間上從一認(rèn)為信息檢索是一種時間性通信形式,此種通信是在時間上從一個時刻通往較晚的時刻,而在空間上可能還在同一地點。也就是個時刻通往較晚的時刻,而在空間上可能還在同

19、一地點。也就是說,通過信息檢索得到了一些文獻(xiàn),從而使得信息發(fā)布者與信息說,通過信息檢索得到了一些文獻(xiàn),從而使得信息發(fā)布者與信息用戶之間建立了一種通信。這個觀點在于說明,信息傳遞是種特用戶之間建立了一種通信。這個觀點在于說明,信息傳遞是種特殊的通信形式,正是這種通信促使了人類思想、文化、科學(xué)上的殊的通信形式,正是這種通信促使了人類思想、文化、科學(xué)上的交流。莫爾斯強(qiáng)調(diào)在通信雙方中,信息發(fā)送者盡可能發(fā)送一切信交流。莫爾斯強(qiáng)調(diào)在通信雙方中,信息發(fā)送者盡可能發(fā)送一切信息,是時間性通信的被動一方,而信息接收者是主動活躍的一方,息,是時間性通信的被動一方,而信息接收者是主動活躍的一方,正是接收者才決定什么時

20、候接收以及接收什么信息。因此,信息正是接收者才決定什么時候接收以及接收什么信息。因此,信息檢索的問題就在于,如何把一個可能的用戶指引向所存儲的信息。檢索的問題就在于,如何把一個可能的用戶指引向所存儲的信息。(2)從信息檢索過程的角度認(rèn)識信息檢索)從信息檢索過程的角度認(rèn)識信息檢索 這種觀點認(rèn)為,信息檢索就是查找出含有用戶這種觀點認(rèn)為,信息檢索就是查找出含有用戶所需信息的文獻(xiàn)的過程。這是一種傳統(tǒng)的主流觀所需信息的文獻(xiàn)的過程。這是一種傳統(tǒng)的主流觀點。美國信息檢索專家蘭卡斯特說:信息檢索系點。美國信息檢索專家蘭卡斯特說:信息檢索系統(tǒng)并不是檢索信息。那是檢索什么呢?他認(rèn)為是統(tǒng)并不是檢索信息。那是檢索什么

21、呢?他認(rèn)為是檢索文獻(xiàn)。因為信息是無形的,必須依附于文獻(xiàn)檢索文獻(xiàn)。因為信息是無形的,必須依附于文獻(xiàn)而存在。雖然信息檢索的最終結(jié)果是滿足用戶的而存在。雖然信息檢索的最終結(jié)果是滿足用戶的信息需求,但檢索的直接對象還是文獻(xiàn),當(dāng)用戶信息需求,但檢索的直接對象還是文獻(xiàn),當(dāng)用戶閱讀文獻(xiàn)并理解其內(nèi)容時,用戶的信息需求才被閱讀文獻(xiàn)并理解其內(nèi)容時,用戶的信息需求才被滿足。滿足。(3)從信息處理的角度認(rèn)識信息檢索)從信息處理的角度認(rèn)識信息檢索 從信息處理的角度來看,信息檢索的基本問題,是從信息處理的角度來看,信息檢索的基本問題,是如何處理信息和信息的結(jié)構(gòu)。這種認(rèn)識偏重于信息管理如何處理信息和信息的結(jié)構(gòu)。這種認(rèn)識偏重

22、于信息管理領(lǐng)域,認(rèn)為信息檢索不僅限于傳統(tǒng)文獻(xiàn)的范圍,圖像、領(lǐng)域,認(rèn)為信息檢索不僅限于傳統(tǒng)文獻(xiàn)的范圍,圖像、聲音、數(shù)據(jù)等也都能反映信息,并把信息檢索視為計算聲音、數(shù)據(jù)等也都能反映信息,并把信息檢索視為計算機(jī)科學(xué)技術(shù)的一個分支。機(jī)科學(xué)技術(shù)的一個分支。 如何看待現(xiàn)代信息和信息的結(jié)構(gòu)問題:如何看待現(xiàn)代信息和信息的結(jié)構(gòu)問題: 信息的內(nèi)容發(fā)生很大的變化。由于學(xué)術(shù)團(tuán)體、政府信息的內(nèi)容發(fā)生很大的變化。由于學(xué)術(shù)團(tuán)體、政府機(jī)關(guān)、商業(yè)部門、個人、民間組織等任何組織或個人都機(jī)關(guān)、商業(yè)部門、個人、民間組織等任何組織或個人都可以以多種形式發(fā)布信息,對信息缺乏控制和管理??梢砸远喾N形式發(fā)布信息,對信息缺乏控制和管理。 信息

23、的形式從印刷型向多種形式并存的方向發(fā)展,信息的形式從印刷型向多種形式并存的方向發(fā)展,不僅僅是視覺和靜態(tài)形式,而且是動態(tài)的多媒體的。不僅僅是視覺和靜態(tài)形式,而且是動態(tài)的多媒體的。 信息資源的種類不僅僅是正式出版物,電子期刊、信息資源的種類不僅僅是正式出版物,電子期刊、圖書、非正式出版物、灰色文獻(xiàn)、數(shù)據(jù)庫、軟件、新聞圖書、非正式出版物、灰色文獻(xiàn)、數(shù)據(jù)庫、軟件、新聞組、組、BBS等。等。 (4)從信息獲取方式來認(rèn)識信息檢索分為:)從信息獲取方式來認(rèn)識信息檢索分為: 直接檢索:直接從信息源中獲取信息,獲直接檢索:直接從信息源中獲取信息,獲取方式直接,但很難廣、快、精、準(zhǔn)地查取方式直接,但很難廣、快、精

24、、準(zhǔn)地查到所需的全部信息到所需的全部信息 間接檢索:通過信息檢索工具或檢查系統(tǒng)間接檢索:通過信息檢索工具或檢查系統(tǒng)獲取所需的信息。(本課程主要學(xué)習(xí))克獲取所需的信息。(本課程主要學(xué)習(xí))克服了直接檢索的缺點,在掌握一定檢索技服了直接檢索的缺點,在掌握一定檢索技巧前提下可以較全面、準(zhǔn)確、快速地檢索巧前提下可以較全面、準(zhǔn)確、快速地檢索到相關(guān)信息。到相關(guān)信息。(5)從實際檢索工作的角度出發(fā),對信息檢索這)從實際檢索工作的角度出發(fā),對信息檢索這樣表達(dá):樣表達(dá): 廣義:將信息按一定的方式組織和存儲起來,并廣義:將信息按一定的方式組織和存儲起來,并根據(jù)用戶需要找出相關(guān)文獻(xiàn)的過程。其中包括存根據(jù)用戶需要找出相

25、關(guān)文獻(xiàn)的過程。其中包括存與取兩個環(huán)節(jié),存即信息存儲,是對信息進(jìn)行收與取兩個環(huán)節(jié),存即信息存儲,是對信息進(jìn)行收集、標(biāo)引、描述、及組織,并對其特征化表達(dá)集集、標(biāo)引、描述、及組織,并對其特征化表達(dá)集加以整序,形成信息檢索工具或檢索系統(tǒng)的過程。加以整序,形成信息檢索工具或檢索系統(tǒng)的過程。取即信息查找,是通過某種查詢機(jī)制從檢索工具取即信息查找,是通過某種查詢機(jī)制從檢索工具或檢索系統(tǒng)中查找出用戶所需的特定信息或獲取或檢索系統(tǒng)中查找出用戶所需的特定信息或獲取其線索的過程。其線索的過程。 狹義:僅僅指信息查找的過程。即取的環(huán)節(jié)。狹義:僅僅指信息查找的過程。即取的環(huán)節(jié)。信息源信息源選擇信息選擇信息構(gòu)造檢索式構(gòu)造

26、檢索式相關(guān)性判斷與反饋相關(guān)性判斷與反饋初步檢索結(jié)果集初步檢索結(jié)果集詞匯替換詞匯替換檢索詞與標(biāo)引詞匹配運檢索詞與標(biāo)引詞匹配運算算信息數(shù)據(jù)庫信息數(shù)據(jù)庫概念分析概念分析信息需求信息需求詞匯替換詞匯替換概念分析概念分析獲取所需信息獲取所需信息系統(tǒng)檢索語言系統(tǒng)檢索語言信息存儲信息存儲信息檢索信息檢索信息用戶信息用戶檢索提問檢索提問信息存儲與信息存儲與檢索流程圖檢索流程圖 本課程將側(cè)重信息檢索部分: 信息檢索( information retrieval):信息用戶為處理解決各種問題,運用檢索工具或數(shù)據(jù)庫等情況集合,從中查找、識別、獲取相關(guān)的事實、數(shù)據(jù)、知識的活動及過程。2、檢索語言(retrieval

27、language) 又稱為情報語言、情報存儲和檢索語言、又稱為情報語言、情報存儲和檢索語言、信息組織語言,是信息存儲與檢索過程中信息組織語言,是信息存儲與檢索過程中用于描述信息特征和表達(dá)用戶信息提問的用于描述信息特征和表達(dá)用戶信息提問的一種人工語言,是實現(xiàn)人與檢索系統(tǒng)對話一種人工語言,是實現(xiàn)人與檢索系統(tǒng)對話的交流語言。的交流語言。 檢索語言可劃分為:分類語言、主題語檢索語言可劃分為:分類語言、主題語言、分類主題語言、代碼語言、引文語言言、分類主題語言、代碼語言、引文語言等。(下章詳細(xì)介紹)等。(下章詳細(xì)介紹)3、檢索工具檢索工具 是用來報道、存和查找信息的工具,通常是是用來報道、存和查找信息的

28、工具,通常是指以書本或卡片形式呈現(xiàn)、采用手工方式進(jìn)行的指以書本或卡片形式呈現(xiàn)、采用手工方式進(jìn)行的設(shè)施,如檢索期刊、書目索引和卡片目錄等。設(shè)施,如檢索期刊、書目索引和卡片目錄等。 檢索工具必須具備的條件:檢索工具必須具備的條件:(1)對所收錄的信息資料的各種特征(包括外部)對所收錄的信息資料的各種特征(包括外部特征和內(nèi)容特征)要有詳細(xì)的描述。特征和內(nèi)容特征)要有詳細(xì)的描述。(2)每條描述記錄都要標(biāo)明可供檢索用和標(biāo)識,)每條描述記錄都要標(biāo)明可供檢索用和標(biāo)識,以便按某種方式將這些描述記錄組織起來,為編以便按某種方式將這些描述記錄組織起來,為編織各種索引做準(zhǔn)備??椄鞣N索引做準(zhǔn)備。(3)全部描述記錄要科

29、學(xué)地組織成一個有機(jī)的整)全部描述記錄要科學(xué)地組織成一個有機(jī)的整體,使這些記錄存放有序,方便存取。體,使這些記錄存放有序,方便存取。(4)具有多種必要的檢索手段以滿足用戶從多種)具有多種必要的檢索手段以滿足用戶從多種角度查找信息的要求。角度查找信息的要求。4、檢索系統(tǒng)檢索系統(tǒng): 由一定的檢索設(shè)備(如探針、選卡機(jī)、電子計算由一定的檢索設(shè)備(如探針、選卡機(jī)、電子計算機(jī)等)和加工整理并存儲在相應(yīng)的載體(如穿孔機(jī)等)和加工整理并存儲在相應(yīng)的載體(如穿孔卡片、磁帶、磁盤等)上面的文檔或數(shù)據(jù)庫及其卡片、磁帶、磁盤等)上面的文檔或數(shù)據(jù)庫及其他必要設(shè)備共同構(gòu)成的,具有存儲和檢索功能的他必要設(shè)備共同構(gòu)成的,具有存

30、儲和檢索功能的信息服務(wù)設(shè)施。它往往由多個子系統(tǒng)或模塊構(gòu)成,信息服務(wù)設(shè)施。它往往由多個子系統(tǒng)或模塊構(gòu)成,需借助專門設(shè)備進(jìn)行檢索。需借助專門設(shè)備進(jìn)行檢索。 穿孔卡片檢索系統(tǒng)、縮微品檢索系統(tǒng)、光盤檢穿孔卡片檢索系統(tǒng)、縮微品檢索系統(tǒng)、光盤檢索系統(tǒng)、計算機(jī)檢索系統(tǒng)、網(wǎng)絡(luò)信息檢索系統(tǒng)索系統(tǒng)、計算機(jī)檢索系統(tǒng)、網(wǎng)絡(luò)信息檢索系統(tǒng) 檢索工具和檢索系統(tǒng)的基本作用相同,都檢索工具和檢索系統(tǒng)的基本作用相同,都服務(wù)于信息檢索,都是傳播信息的重要媒服務(wù)于信息檢索,都是傳播信息的重要媒介和實現(xiàn)情報檢索的主要手段。檢索工具介和實現(xiàn)情報檢索的主要手段。檢索工具屬于傳統(tǒng)的檢索設(shè)施,今天仍發(fā)揮著重要屬于傳統(tǒng)的檢索設(shè)施,今天仍發(fā)揮著重

31、要的作用,檢索系統(tǒng)是在手工檢索工具的基的作用,檢索系統(tǒng)是在手工檢索工具的基礎(chǔ)上發(fā)展起來的,是信息檢索礎(chǔ)上發(fā)展起來的,是信息檢索 機(jī)械化和自機(jī)械化和自動化的必然產(chǎn)物,目前在信息檢索中已起動化的必然產(chǎn)物,目前在信息檢索中已起到主導(dǎo)作用。它們的區(qū)別主要表現(xiàn)在內(nèi)部到主導(dǎo)作用。它們的區(qū)別主要表現(xiàn)在內(nèi)部結(jié)構(gòu)、信息表示方式和匹配機(jī)制等方面。結(jié)構(gòu)、信息表示方式和匹配機(jī)制等方面。 (1)內(nèi)部結(jié)構(gòu):檢索工具的結(jié)構(gòu)較為簡單,以紙內(nèi)部結(jié)構(gòu):檢索工具的結(jié)構(gòu)較為簡單,以紙介質(zhì)為記錄材料和存貯設(shè)備;檢索系統(tǒng)一般以非介質(zhì)為記錄材料和存貯設(shè)備;檢索系統(tǒng)一般以非紙介質(zhì)為記錄和存貯設(shè)備,檢索系統(tǒng)的構(gòu)造通常紙介質(zhì)為記錄和存貯設(shè)備,檢

32、索系統(tǒng)的構(gòu)造通常較復(fù)雜,包含有多個功能子系統(tǒng)(如文獻(xiàn)采集子較復(fù)雜,包含有多個功能子系統(tǒng)(如文獻(xiàn)采集子系統(tǒng)、標(biāo)引子系統(tǒng)、建庫子系統(tǒng)、提問處理子系系統(tǒng)、標(biāo)引子系統(tǒng)、建庫子系統(tǒng)、提問處理子系統(tǒng)、系統(tǒng)用統(tǒng)、系統(tǒng)用/戶接口、詞表管理子系統(tǒng)等)和多種戶接口、詞表管理子系統(tǒng)等)和多種設(shè)施(如輸入、輸出設(shè)備、數(shù)據(jù)庫,中央處理機(jī)設(shè)施(如輸入、輸出設(shè)備、數(shù)據(jù)庫,中央處理機(jī)和通訊設(shè)施等)。和通訊設(shè)施等)。 (2)信息表示方式:檢索工具用自然語言或準(zhǔn))信息表示方式:檢索工具用自然語言或準(zhǔn)自然語言描述信息特征;檢索系統(tǒng)用機(jī)器語言或自然語言描述信息特征;檢索系統(tǒng)用機(jī)器語言或機(jī)器可讀語言表示信息。機(jī)器可讀語言表示信息。 (

33、3)匹配機(jī)制:檢索工具依靠人的智力和知識)匹配機(jī)制:檢索工具依靠人的智力和知識來進(jìn)行信息比較選擇,功能也相對較弱;檢索系來進(jìn)行信息比較選擇,功能也相對較弱;檢索系統(tǒng)依靠某種匹配機(jī)制來篩選相關(guān)信息,其功能強(qiáng)統(tǒng)依靠某種匹配機(jī)制來篩選相關(guān)信息,其功能強(qiáng)弱與構(gòu)造和設(shè)備的先進(jìn)性密切相關(guān)。弱與構(gòu)造和設(shè)備的先進(jìn)性密切相關(guān)。三、信息檢索的發(fā)展信息檢索的發(fā)展 1、第一階段:完全手工檢索階段、第一階段:完全手工檢索階段 2、第二階段:半機(jī)械檢索系統(tǒng)、第二階段:半機(jī)械檢索系統(tǒng)-機(jī)電、光機(jī)電、光電檢索系統(tǒng)的發(fā)展階段電檢索系統(tǒng)的發(fā)展階段 3、第三階段:計算機(jī)檢索系統(tǒng)的發(fā)展階段、第三階段:計算機(jī)檢索系統(tǒng)的發(fā)展階段 4、第

34、四階段:基于、第四階段:基于Internet 的網(wǎng)絡(luò)化檢索的網(wǎng)絡(luò)化檢索系統(tǒng)階段系統(tǒng)階段 第二節(jié)第二節(jié) 信息資源信息資源 一、信息資源的概念一、信息資源的概念 信息資源是人們獲取信息的來源。信息資源是人們獲取信息的來源。 1、定義、定義 美國信息資源管理專家霍頓:單數(shù)概念的信息資源美國信息資源管理專家霍頓:單數(shù)概念的信息資源是指某種內(nèi)容的來源,即包含在文件和公文中的信是指某種內(nèi)容的來源,即包含在文件和公文中的信息內(nèi)容息內(nèi)容;復(fù)數(shù)概念的信息資源是指支持工具,包括供復(fù)數(shù)概念的信息資源是指支持工具,包括供給、設(shè)備、環(huán)境、人員、資金等。給、設(shè)備、環(huán)境、人員、資金等。 中國烏家培教授:狹義的是指信息內(nèi)容本

35、身;廣義中國烏家培教授:狹義的是指信息內(nèi)容本身;廣義的是指除信息內(nèi)容外,還包括與其緊密相關(guān)的信息的是指除信息內(nèi)容外,還包括與其緊密相關(guān)的信息設(shè)備、信息人員、信息系統(tǒng)、信息網(wǎng)絡(luò)等。設(shè)備、信息人員、信息系統(tǒng)、信息網(wǎng)絡(luò)等。 中科院霍國慶:信息資源是可利用的信息的集合,中科院霍國慶:信息資源是可利用的信息的集合,是經(jīng)過人類開發(fā)與組織的信息集合。是經(jīng)過人類開發(fā)與組織的信息集合。 聯(lián)合國教科文組織出版的聯(lián)合國教科文組織出版的文獻(xiàn)術(shù)語文獻(xiàn)術(shù)語中把信息資中把信息資源定義為:源定義為:“個人為滿足其信息需要而獲得信息的個人為滿足其信息需要而獲得信息的來源。來源?!?具體講,凡能產(chǎn)生、生產(chǎn)、載有、儲具體講,凡能產(chǎn)

36、生、生產(chǎn)、載有、儲存、加工、傳遞信息的社會活動場所、存、加工、傳遞信息的社會活動場所、機(jī)構(gòu)、人物、產(chǎn)品和自然物質(zhì)都是信機(jī)構(gòu)、人物、產(chǎn)品和自然物質(zhì)都是信息資源。息資源。 2、特性、特性 (1)普遍性:為人們獲取信息提供了廣泛)普遍性:為人們獲取信息提供了廣泛的來源的來源 (2)潛在性:指一些具有使用價值的信息)潛在性:指一些具有使用價值的信息往往潛伏在信息資源中,人們欲獲得價值往往潛伏在信息資源中,人們欲獲得價值的信息,必須對信息資源的特點、變化規(guī)的信息,必須對信息資源的特點、變化規(guī)律進(jìn)行認(rèn)真分析,尋求獲取信息的途徑和律進(jìn)行認(rèn)真分析,尋求獲取信息的途徑和方法。方法。 (3)運動性:一切信息資源都

37、處于運動和)運動性:一切信息資源都處于運動和變動中,欲獲得信息資源中的有用信息,變動中,欲獲得信息資源中的有用信息,必須擅于捕捉獲取信息的機(jī)會,以達(dá)到開必須擅于捕捉獲取信息的機(jī)會,以達(dá)到開發(fā)利用有價值信息的目的。發(fā)利用有價值信息的目的。二、 信息資源的分類: 1、信息源可分為自然信息源和社會信息信息源可分為自然信息源和社會信息源。源。 自然信息源廣泛存在于自然界中,是物自然信息源廣泛存在于自然界中,是物質(zhì)運動和生物生存活動的結(jié)果。如山川、土質(zhì)運動和生物生存活動的結(jié)果。如山川、土地、氣候、能源、動物、植物、微生物等,地、氣候、能源、動物、植物、微生物等,它們是人類生存最基本的自然環(huán)境和物質(zhì)條它們

38、是人類生存最基本的自然環(huán)境和物質(zhì)條件,是自然信息的發(fā)生源。社會信息源則存件,是自然信息的發(fā)生源。社會信息源則存在于人類活動中,是社會的直接產(chǎn)物。無論在于人類活動中,是社會的直接產(chǎn)物。無論是自然信息源還是社會信息源,其開發(fā)利用是自然信息源還是社會信息源,其開發(fā)利用均在社會中進(jìn)行,社會信息源是信息源的主均在社會中進(jìn)行,社會信息源是信息源的主體。體。 2、按信息資源所依附的載體劃分、按信息資源所依附的載體劃分 (1)體裁信息資源:以人體為載體并能為他人)體裁信息資源:以人體為載體并能為他人識別的信息資源。按其表述方式又可分為口語信識別的信息資源。按其表述方式又可分為口語信息源和體語信息源??谡Z信息源

39、是人類以口頭方息源和體語信息源。口語信息源是人類以口頭方式表述但未被記錄下來的口語信息,如:談話、式表述但未被記錄下來的口語信息,如:談話、講課、講演、討論、唱歌等。體語信息源是以人講課、講演、討論、唱歌等。體語信息源是以人的體態(tài)為載體表述出來的信息資源,如:表情、的體態(tài)為載體表述出來的信息資源,如:表情、手勢、姿態(tài)等方式表述的體語信息。手勢、姿態(tài)等方式表述的體語信息。 (2)實物信息資源:以實物為載體的信息資源。)實物信息資源:以實物為載體的信息資源。又分為自然實物信息源與人工實物信息源。如:又分為自然實物信息源與人工實物信息源。如:化石、產(chǎn)品、樣品等?;?、產(chǎn)品、樣品等。 (3)文獻(xiàn)信息資

40、源:以文字、圖形、符號、聲)文獻(xiàn)信息資源:以文字、圖形、符號、聲頻、視頻等發(fā)生記錄在各種載體上的知識和信息頻、視頻等發(fā)生記錄在各種載體上的知識和信息資源。資源。 (4)網(wǎng)絡(luò)信息資源:以網(wǎng)絡(luò)為紐帶連接起來的)網(wǎng)絡(luò)信息資源:以網(wǎng)絡(luò)為紐帶連接起來的信息資源和以網(wǎng)絡(luò)為主要交流、傳遞、存儲的手信息資源和以網(wǎng)絡(luò)為主要交流、傳遞、存儲的手段與形式的信息資源。段與形式的信息資源。 3、按信息資源傳遞的范圍劃分:、按信息資源傳遞的范圍劃分: (1)公開信息資源:又稱共享信息資源或白色信息)公開信息資源:又稱共享信息資源或白色信息資源(資源(white information),指公開發(fā)行、流通和),指公開發(fā)行、

41、流通和傳遞的信息資源,其蘊(yùn)涵的信息人人可以使用。一傳遞的信息資源,其蘊(yùn)涵的信息人人可以使用。一般來說,公開信息資源的數(shù)量最大,而且能夠作為般來說,公開信息資源的數(shù)量最大,而且能夠作為信息商品進(jìn)行流通領(lǐng)域。信息商品進(jìn)行流通領(lǐng)域。 (2)半公開信息資源:又稱灰色信息資源()半公開信息資源:又稱灰色信息資源(grey information),指非公開發(fā)行、流通和傳遞,從常),指非公開發(fā)行、流通和傳遞,從常規(guī)途徑難以獲取的信息(內(nèi)部信息)。這類信息出規(guī)途徑難以獲取的信息(內(nèi)部信息)。這類信息出版量小,發(fā)行渠道復(fù)雜,流通傳遞范圍有限,不易版量小,發(fā)行渠道復(fù)雜,流通傳遞范圍有限,不易收集。例如:內(nèi)部的刊

42、物、技術(shù)報告、仁義資料等。收集。例如:內(nèi)部的刊物、技術(shù)報告、仁義資料等。 (3)非公開信息資源:又稱黑色信息資源()非公開信息資源:又稱黑色信息資源(black information),指人們未破譯或未被識別的,也指),指人們未破譯或未被識別的,也指處于保密狀態(tài)的信息。例如:考古發(fā)現(xiàn)的古老文字、處于保密狀態(tài)的信息。例如:考古發(fā)現(xiàn)的古老文字、未解密的政府文件、內(nèi)部檔案、個人日記、私人信未解密的政府文件、內(nèi)部檔案、個人日記、私人信件等。件等。 4、信息可分為可檢信息和不可檢信息。、信息可分為可檢信息和不可檢信息。 問:哪些信息源是可檢索的或不可檢索的?問:哪些信息源是可檢索的或不可檢索的? 自然

43、信息均屬于不可檢信息。社會信息中,人自然信息均屬于不可檢信息。社會信息中,人類以口頭方式表述但未被記錄下來的口語信息,類以口頭方式表述但未被記錄下來的口語信息,以及表情、手勢、姿態(tài)等方式表述的體語信息,以及表情、手勢、姿態(tài)等方式表述的體語信息,存儲在人的大腦中的思維過程和各種思想都屬于存儲在人的大腦中的思維過程和各種思想都屬于不可檢信息,這些信息是在特定時間、地點產(chǎn)生,不可檢信息,這些信息是在特定時間、地點產(chǎn)生,通過直接交流、接觸獲取并進(jìn)行傳播的??蓹z信通過直接交流、接觸獲取并進(jìn)行傳播的。可檢信息是指人類用文字、圖像、聲頻、視頻等方式加息是指人類用文字、圖像、聲頻、視頻等方式加工記錄在一定載體

44、上的信息,通過學(xué)習(xí)一定的手工記錄在一定載體上的信息,通過學(xué)習(xí)一定的手段和方法可以檢索,我們也稱為文獻(xiàn)??蓹z信息段和方法可以檢索,我們也稱為文獻(xiàn)??蓹z信息可以跨時空進(jìn)行傳播并被人類利用,信息檢索實可以跨時空進(jìn)行傳播并被人類利用,信息檢索實際是就是對這些信息的檢索。際是就是對這些信息的檢索。三、文獻(xiàn)信息資源1、按信息資源所依附的載體的物質(zhì)形態(tài)劃分、按信息資源所依附的載體的物質(zhì)形態(tài)劃分 (1)刻寫型:)刻寫型:包括手稿、日記、信件、原始檔案、包括手稿、日記、信件、原始檔案、碑刻等。碑刻等。 (2)印刷型)印刷型:主要是指以紙張為載體,以印刷、手:主要是指以紙張為載體,以印刷、手寫為記錄手段,把信息內(nèi)

45、容固化在紙張上的形式。其寫為記錄手段,把信息內(nèi)容固化在紙張上的形式。其優(yōu)點是便于直接閱讀、使用方便,其缺點是較笨重、優(yōu)點是便于直接閱讀、使用方便,其缺點是較笨重、存儲密度低、收藏占用空間大、加工保存等花費人力存儲密度低、收藏占用空間大、加工保存等花費人力物力大、識別和提取難以實現(xiàn)機(jī)械化和自動化。物力大、識別和提取難以實現(xiàn)機(jī)械化和自動化。 (3)縮微型)縮微型:以感光材料為載體,以縮微照相為記錄:以感光材料為載體,以縮微照相為記錄手段而產(chǎn)生的一種載體形式,如縮微膠卷、縮微膠片手段而產(chǎn)生的一種載體形式,如縮微膠卷、縮微膠片等。其優(yōu)點是存儲密度較大、體積小、便于收藏保存等。其優(yōu)點是存儲密度較大、體積

46、小、便于收藏保存和遠(yuǎn)距離傳遞。缺點是不能直接閱讀、需借助縮微閱和遠(yuǎn)距離傳遞。缺點是不能直接閱讀、需借助縮微閱讀機(jī)或閱讀復(fù)印機(jī)才能使用。讀機(jī)或閱讀復(fù)印機(jī)才能使用。 縮微型一般針對于數(shù)量大、利用率低但又有較大縮微型一般針對于數(shù)量大、利用率低但又有較大保存和利用價值的信息資源。保存和利用價值的信息資源。(4)聲像型)聲像型:以磁性和感光材料為載體,借:以磁性和感光材料為載體,借助特殊的機(jī)械裝置(如復(fù)錄機(jī)、攝像機(jī)、助特殊的機(jī)械裝置(如復(fù)錄機(jī)、攝像機(jī)、錄像機(jī)等)直接記錄聲音、圖像信號的信錄像機(jī)等)直接記錄聲音、圖像信號的信息載體,又稱視聽資料,如唱片、錄音帶、息載體,又稱視聽資料,如唱片、錄音帶、錄像帶

47、、幻燈片、電影片、多媒體資料等。錄像帶、幻燈片、電影片、多媒體資料等。 其優(yōu)點是可以聞其聲、觀其形,直觀而其優(yōu)點是可以聞其聲、觀其形,直觀而真切,給人以生動鮮明的印象。其缺點是真切,給人以生動鮮明的印象。其缺點是制造成本較高,且需要借助于一定的設(shè)備制造成本較高,且需要借助于一定的設(shè)備才能使用。才能使用。(5)電子型)電子型:電子文獻(xiàn)是指經(jīng)過數(shù)字化技術(shù)處理:電子文獻(xiàn)是指經(jīng)過數(shù)字化技術(shù)處理后以電子形式存在,利用計算機(jī)及現(xiàn)代通訊方式后以電子形式存在,利用計算機(jī)及現(xiàn)代通訊方式提供信息的一種新興載體。提供信息的一種新興載體。 其優(yōu)點是存儲密度高,讀取速度快,更新及時,其優(yōu)點是存儲密度高,讀取速度快,更新

48、及時,并利用電子手段隨時對內(nèi)容進(jìn)行增、刪、改,可并利用電子手段隨時對內(nèi)容進(jìn)行增、刪、改,可以高速度、遠(yuǎn)距離傳遞信息,具有交互性,便于以高速度、遠(yuǎn)距離傳遞信息,具有交互性,便于信息交流和共享。信息交流和共享。 電子文獻(xiàn)種類很多,按出版類型劃分有電子教科電子文獻(xiàn)種類很多,按出版類型劃分有電子教科書、電子專著、電子工具書、電子雜志、電子報書、電子專著、電子工具書、電子雜志、電子報紙、電子版書目數(shù)據(jù)、計算機(jī)軟件等。紙、電子版書目數(shù)據(jù)、計算機(jī)軟件等。 按電子文獻(xiàn)載體形式劃分其類型有磁性型文獻(xiàn)、按電子文獻(xiàn)載體形式劃分其類型有磁性型文獻(xiàn)、光盤型文獻(xiàn)和網(wǎng)絡(luò)型文獻(xiàn)。光盤型文獻(xiàn)和網(wǎng)絡(luò)型文獻(xiàn)。 按信息結(jié)構(gòu)組織形式劃

49、分有文本型、多媒體型、按信息結(jié)構(gòu)組織形式劃分有文本型、多媒體型、超文本型及超媒體型。超文本型及超媒體型。 文本型文本型:指的只包含純文字的文件。指的只包含純文字的文件。 多媒體型多媒體型:指的是能傳播文字、聲音、圖形、圖象、指的是能傳播文字、聲音、圖形、圖象、動畫和電視等多種類型信息的手段、方式或載體。動畫和電視等多種類型信息的手段、方式或載體。 超文本型超文本型(Hypertext):是用超鏈結(jié)的方法,將各是用超鏈結(jié)的方法,將各種不同空間的文字信息組織在一起的網(wǎng)狀文本。種不同空間的文字信息組織在一起的網(wǎng)狀文本。 超媒體型超媒體型 (hyper media ):如果超文本節(jié)點中的信如果超文本節(jié)

50、點中的信息除文本塊以外息除文本塊以外 ,還有圖形、圖像、聲音、視頻還有圖形、圖像、聲音、視頻等多媒體信息等多媒體信息 ,則稱為超媒體則稱為超媒體 (hyper media )。2、按信息資源的加工深度和結(jié)構(gòu)等級劃分、按信息資源的加工深度和結(jié)構(gòu)等級劃分 (1)零次文獻(xiàn):)零次文獻(xiàn):指未經(jīng)過任何加工的原始文獻(xiàn)。如:指未經(jīng)過任何加工的原始文獻(xiàn)。如:實驗記錄、手稿、原始錄音、原始錄像、談話記錄。實驗記錄、手稿、原始錄音、原始錄像、談話記錄。 (2)一次文獻(xiàn):)一次文獻(xiàn):未經(jīng)加工或粗略加工的原始信息資未經(jīng)加工或粗略加工的原始信息資源,以本人的研究成果為基本素材而創(chuàng)作的文獻(xiàn),源,以本人的研究成果為基本素材

51、而創(chuàng)作的文獻(xiàn),具體、詳盡和系統(tǒng)化。如期刊論文、專利文獻(xiàn)、科具體、詳盡和系統(tǒng)化。如期刊論文、專利文獻(xiàn)、科技報告、會議錄、學(xué)位論文等等。技報告、會議錄、學(xué)位論文等等。 (3)二次文獻(xiàn):)二次文獻(xiàn):它是將大量分散、零亂、無序的一它是將大量分散、零亂、無序的一次文獻(xiàn)進(jìn)行進(jìn)行加工、整理、標(biāo)引、著錄、濃縮,次文獻(xiàn)進(jìn)行進(jìn)行加工、整理、標(biāo)引、著錄、濃縮,并按照一定的邏輯順序和科學(xué)體系加以編排存儲,并按照一定的邏輯順序和科學(xué)體系加以編排存儲,使之系統(tǒng)化,以便于檢索利用。如:目錄、題錄、使之系統(tǒng)化,以便于檢索利用。如:目錄、題錄、索引、文摘。具有報道和檢索功能。索引、文摘。具有報道和檢索功能。 (4)三次文獻(xiàn):)

52、三次文獻(xiàn):通過二次信息資源提供的線索,對通過二次信息資源提供的線索,對某一范圍內(nèi)的一次信息資源進(jìn)行分析、研究、加工某一范圍內(nèi)的一次信息資源進(jìn)行分析、研究、加工而成的信息資源,它包括綜述、述評、專題情報研而成的信息資源,它包括綜述、述評、專題情報研究報告、百科全書、年鑒、指南、手冊、詞典等。究報告、百科全書、年鑒、指南、手冊、詞典等。 一次文獻(xiàn)是二次文獻(xiàn)和三次文獻(xiàn)的基礎(chǔ),是文獻(xiàn)一次文獻(xiàn)是二次文獻(xiàn)和三次文獻(xiàn)的基礎(chǔ),是文獻(xiàn)檢索的主要對象;二次文獻(xiàn)具有濃縮性,是一次檢索的主要對象;二次文獻(xiàn)具有濃縮性,是一次文獻(xiàn)的簡略及有序化,是文獻(xiàn)檢索的工具;三次文獻(xiàn)的簡略及有序化,是文獻(xiàn)檢索的工具;三次文獻(xiàn)具有綜合

53、性,既是檢索對象,又可提供一定文獻(xiàn)具有綜合性,既是檢索對象,又可提供一定的檢索途徑與檢索手段。的檢索途徑與檢索手段。 總之,文獻(xiàn)經(jīng)過加工、壓縮,從零次信息到三次總之,文獻(xiàn)經(jīng)過加工、壓縮,從零次信息到三次信息,使科技信息由分散到集中,由無序到有序,信息,使科技信息由分散到集中,由無序到有序,由無組織到系統(tǒng)化,由博而精的對知識信息進(jìn)行由無組織到系統(tǒng)化,由博而精的對知識信息進(jìn)行不同層次的加工的過程。不同層次的加工的過程。3、信息的不同出版類型劃分、信息的不同出版類型劃分(1)圖書)圖書:包括專著、教科書、各種科普讀物及專業(yè):包括專著、教科書、各種科普讀物及專業(yè)參考工具書等,特點是:內(nèi)容系統(tǒng)、成熟、定

54、型、參考工具書等,特點是:內(nèi)容系統(tǒng)、成熟、定型、信息經(jīng)篩選,可靠性強(qiáng),出版周期長,更新速度慢,信息經(jīng)篩選,可靠性強(qiáng),出版周期長,更新速度慢,從檢索角度,圖書一般不作為主要檢索對象。從檢索角度,圖書一般不作為主要檢索對象。(2)期刊)期刊:定期或不定期刊行的連續(xù)出版物,如雜志、:定期或不定期刊行的連續(xù)出版物,如雜志、年度報告、年鑒、叢書、學(xué)會的會議錄、學(xué)報和紀(jì)年度報告、年鑒、叢書、學(xué)會的會議錄、學(xué)報和紀(jì)要等,特點是:數(shù)量大、品種多,內(nèi)容豐富多樣、要等,特點是:數(shù)量大、品種多,內(nèi)容豐富多樣、出版周期短、報道速度較快、發(fā)行、流通面很廣泛,出版周期短、報道速度較快、發(fā)行、流通面很廣泛,連續(xù)性強(qiáng),伴隨著

55、相應(yīng)的學(xué)科領(lǐng)域發(fā)展前進(jìn)。職能:連續(xù)性強(qiáng),伴隨著相應(yīng)的學(xué)科領(lǐng)域發(fā)展前進(jìn)。職能:記錄正式的公開的科學(xué)技術(shù)活動,傳播科技信息的記錄正式的公開的科學(xué)技術(shù)活動,傳播科技信息的主要工具。主要工具。(3)科技報告)科技報告 scientific and technical report :報道(記:報道(記錄)研究工作和開發(fā)調(diào)查工作的成果或進(jìn)展情況的一種文獻(xiàn)錄)研究工作和開發(fā)調(diào)查工作的成果或進(jìn)展情況的一種文獻(xiàn)類型。又稱研究報告、報告文獻(xiàn)。出現(xiàn)于類型。又稱研究報告、報告文獻(xiàn)。出現(xiàn)于20世紀(jì)初,第二次世紀(jì)初,第二次世界大戰(zhàn)后迅速發(fā)展,成為科技文獻(xiàn)中的一大門類。大多與世界大戰(zhàn)后迅速發(fā)展,成為科技文獻(xiàn)中的一大門類。

56、大多與政府的研究活動、國防及尖端科技領(lǐng)域有關(guān),發(fā)表及時,課政府的研究活動、國防及尖端科技領(lǐng)域有關(guān),發(fā)表及時,課題專深,內(nèi)容新穎、成熟,數(shù)據(jù)完整,且注重報道進(jìn)行中的題專深,內(nèi)容新穎、成熟,數(shù)據(jù)完整,且注重報道進(jìn)行中的科研工作,是一種重要的信息源。查尋科技報告有專門的檢科研工作,是一種重要的信息源。查尋科技報告有專門的檢索工具。索工具。特點:特點: 反映新的科研成果迅速。以科技報告形式反映科研成反映新的科研成果迅速。以科技報告形式反映科研成果比這些成果在期刊上發(fā)表,一般要早一年左右,有的則不果比這些成果在期刊上發(fā)表,一般要早一年左右,有的則不在期刊上發(fā)表。在期刊上發(fā)表。內(nèi)容多樣化。它幾乎涉及整個科

57、學(xué)、技術(shù)內(nèi)容多樣化。它幾乎涉及整個科學(xué)、技術(shù)領(lǐng)域和社會科學(xué)、行為科學(xué)以及部分人文科學(xué)領(lǐng)域。領(lǐng)域和社會科學(xué)、行為科學(xué)以及部分人文科學(xué)領(lǐng)域。保密保密性。大量科技報告都與政府的研究活動、高新技術(shù)有關(guān),使性。大量科技報告都與政府的研究活動、高新技術(shù)有關(guān),使用范圍控制較嚴(yán)。用范圍控制較嚴(yán)。報告質(zhì)量參差不齊。大部分科技報告是報告質(zhì)量參差不齊。大部分科技報告是合同研究計劃的產(chǎn)物,由工程技術(shù)人員編寫,由于撰寫受時合同研究計劃的產(chǎn)物,由工程技術(shù)人員編寫,由于撰寫受時間限制、因保密需要以工作文件形式出現(xiàn)等因素影響,使報間限制、因保密需要以工作文件形式出現(xiàn)等因素影響,使報告的質(zhì)量相差很大。告的質(zhì)量相差很大。每份報告

58、自成一冊,裝訂簡單,一般每份報告自成一冊,裝訂簡單,一般都有連續(xù)編號,出版發(fā)行不規(guī)則。通常載有主持單位、報告都有連續(xù)編號,出版發(fā)行不規(guī)則。通常載有主持單位、報告撰寫者、密級、報告號、研究項目號和合同號等。撰寫者、密級、報告號、研究項目號和合同號等。附:美國四大科技報告(附:美國四大科技報告(AD,PB, NASA , DOE ) 1、AD報告報告 1951年開始出版。現(xiàn)由美國國防技年開始出版。現(xiàn)由美國國防技術(shù)情報中心負(fù)責(zé)收集整理和出版。報告內(nèi)容以國防部術(shù)情報中心負(fù)責(zé)收集整理和出版。報告內(nèi)容以國防部各個合同戶的研究報告為主,其報告號冠以各個合同戶的研究報告為主,其報告號冠以AD,A原先為原先為A

59、rmed、D則為則為Document之意,現(xiàn)在則可理之意,現(xiàn)在則可理解為入藏報告(解為入藏報告(Accession Document)。)。 ADA000001 A表示公開報告,占表示公開報告,占45ADB000001 B表示非密限制報告,表示非密限制報告, 占占39ADC000001 C表示秘密報告,表示秘密報告, 占占16ADD000001 D表示美軍專利文獻(xiàn)表示美軍專利文獻(xiàn)2、PB報告產(chǎn)生于二戰(zhàn)結(jié)束之后,當(dāng)時美國政府為報告產(chǎn)生于二戰(zhàn)結(jié)束之后,當(dāng)時美國政府為了整理和利用從戰(zhàn)敗國獲得的數(shù)以千噸計的秘密了整理和利用從戰(zhàn)敗國獲得的數(shù)以千噸計的秘密科技資料,于科技資料,于1945年年6月成立了一個

60、專門的出版月成立了一個專門的出版局,即美國商務(wù)部出版局(局,即美國商務(wù)部出版局(Publication Board),),負(fù)責(zé)收集、整理、報導(dǎo)利用這些資料負(fù)責(zé)收集、整理、報導(dǎo)利用這些資料3、NASA報告是美國國家航空航天局報告是美國國家航空航天局NASA科技情科技情報處編輯、出版的專業(yè)性檢索刊物,它是檢索航報處編輯、出版的專業(yè)性檢索刊物,它是檢索航空航天科技報告的重要工具??蘸教炜萍紙蟾娴闹匾ぞ?。4、 DOE 報告,是美國能源部報告,是美國能源部DOE技術(shù)情報中心編技術(shù)情報中心編輯出版的半月刊。收錄能源部部屬科研機(jī)構(gòu)和各輯出版的半月刊。收錄能源部部屬科研機(jī)構(gòu)和各大學(xué)等一切與能源有關(guān)的科技文獻(xiàn),以科技報告大學(xué)等一切

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論