第一章-文獻(xiàn)信息檢索_第1頁
第一章-文獻(xiàn)信息檢索_第2頁
第一章-文獻(xiàn)信息檢索_第3頁
第一章-文獻(xiàn)信息檢索_第4頁
第一章-文獻(xiàn)信息檢索_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第一章文獻(xiàn)檢索概論本章主要內(nèi)容一:基本概念信息、知識、文獻(xiàn)二:文獻(xiàn)檢索概念、原理、文獻(xiàn)源類型、檢索工具、檢索語言、檢索途徑一:基本概念1、信息信息是指應(yīng)用文字、數(shù)據(jù)或信號等形式通過一定的傳遞和處理,來表現(xiàn)各種相互聯(lián)系的客觀事物在運(yùn)動變化中所具有特征性的內(nèi)容的總稱。2、知識知識是人們通過實(shí)踐對客觀事物及其運(yùn)動過程和規(guī)律的認(rèn)識。3、文獻(xiàn)一般定義為文獻(xiàn)是記錄有知識的一切載體。文獻(xiàn)的基本構(gòu)成要素第一,知識內(nèi)容第二,記錄載體第三,記錄符號第四,記錄手段記錄載體

隨著生產(chǎn)力的發(fā)展,存貯和表達(dá)人們思想的物質(zhì)載體不同了,從金石、竹簡、羊皮、絲帛、紙張發(fā)展到用感光介質(zhì)和磁性介質(zhì)。從非人工材質(zhì)的泥版、巖石、石板、獸骨、木板、竹片、獸皮、樹葉、樺樹皮等到各種人工材質(zhì),如無機(jī)材質(zhì)(陶、磚瓦、瓷,玻璃等)、金屬材質(zhì)(青銅、

鐵、鋁、金銀等)、高分子材質(zhì)(帛、紙、膠片、醋酸纖維等)、復(fù)合材質(zhì)(磁帶、光盤等)。紙

質(zhì)文獻(xiàn)已經(jīng)多得不便于快速傳輸信息、高效查閱

和高密度存貯了,于是其他介質(zhì)的文獻(xiàn)應(yīng)運(yùn)而生,這些文獻(xiàn)主要包括:紙質(zhì)文獻(xiàn)具有價格低廉、質(zhì)

地柔軟、易于書寫、攜帶和收藏等其它一些載體

所無法比擬的性能而成為文獻(xiàn)家族的主干。記錄符號

文字已不再是表達(dá)思想的唯一手段,圖形、聲頻、視頻等同樣成為表達(dá)思想、傳遞感

情的重要手段。總的說來,文獻(xiàn)中的符號

系統(tǒng)指圖畫、文字、公式、圖表、編碼、

聲像和電磁信息等。記錄手段

按記錄方法分可有手工記錄、機(jī)械記錄、光記錄、電記錄、聲記錄和磁記錄。其中最常見的是印刷。隨著科技的發(fā)展,文字記錄可以轉(zhuǎn)變?yōu)閿?shù)據(jù)記錄,并用電子方法存貯到磁介質(zhì)上去。此外,還有光

學(xué)字符識別(OpticalCharacterRecognition,簡稱OCR)技術(shù)就代表了這種嶄新的技術(shù),它通過光學(xué)方法對字符、標(biāo)記表示的書面數(shù)據(jù)進(jìn)行自動識別,轉(zhuǎn)換成機(jī)器可以處理的信息,這樣就實(shí)現(xiàn)了紙質(zhì)文獻(xiàn)信息向電子信息的轉(zhuǎn)換,而且可以通過不同接口裝置向不同設(shè)備輸入數(shù)據(jù),這些設(shè)備進(jìn)而與通信網(wǎng)絡(luò)相連,實(shí)現(xiàn)遠(yuǎn)距離數(shù)據(jù)傳送。4、三者間的聯(lián)系知識來源于信息,是理性化、優(yōu)化和系統(tǒng)化了的信息;文獻(xiàn)是知識的載體。產(chǎn)生人腦有序化事物運(yùn)動識信息知記錄在載體上文獻(xiàn)知識與文獻(xiàn)的關(guān)系:客觀知識=文獻(xiàn)(除去載體)信息與知識的關(guān)系信息知識二:文獻(xiàn)檢索1、概念文獻(xiàn)檢索——是從文獻(xiàn)集合中,迅速、準(zhǔn)確地查找出所需文獻(xiàn)或文獻(xiàn)中包含的信息內(nèi)容的過程。2、文獻(xiàn)檢索的原理文獻(xiàn)檢索原理是:將檢索提問標(biāo)識與存貯在檢索工具中的標(biāo)引標(biāo)識相比較,兩者一致或信息標(biāo)識包含著檢索提問標(biāo)識,則含有該標(biāo)識的信息就從檢索工具中輸出;對信息的著錄是按一定規(guī)則對信息的外表特征和內(nèi)容特征加以簡單明確的表述,信息的標(biāo)引是對其內(nèi)容按一定的分類表或主題詞表給出分類號或主題詞;檢索過程則是按同樣的主題詞表或分類表

及組配原則分析課題,形成檢索提問標(biāo)識,根據(jù)檢索工具所提供的檢索途徑,從信息

集合中查找與檢索提問標(biāo)識相符的信息特

征標(biāo)識的過程。(如下圖)檢索工具文獻(xiàn)擇與收集文獻(xiàn)源用戶特征標(biāo)識語言數(shù)據(jù)庫信息需求檢索提問檢索提問式檢索結(jié)果的選分析文獻(xiàn)分析標(biāo)識標(biāo)識匹配輸出反饋3、文獻(xiàn)源類型按文獻(xiàn)載體分:有紙介型文獻(xiàn)、縮微型文獻(xiàn)、機(jī)讀型文獻(xiàn)、聲像型文獻(xiàn)

紙介型文獻(xiàn):是以紙張為載體。它又可分為手抄型和印刷型兩種。

其優(yōu)點(diǎn)是傳遞知識方便靈活、廣泛,保存時間相對較長;缺點(diǎn)是存儲密度小,體積龐大。

縮微型文獻(xiàn):以感光材料為載體,通過光學(xué)攝影方式將文獻(xiàn)的影像固化在感光材料上形成的一類文獻(xiàn)。如縮微膠卷、縮微平片等。

這類文獻(xiàn)特點(diǎn)是體積小、信息密度高、輕便,易于傳遞,保存容易。但使用必須借助于放大設(shè)備。

聲像型文獻(xiàn):,也稱視聽型文獻(xiàn),是指通過特定設(shè)備,使用聲、光、磁、電等技術(shù)將信息轉(zhuǎn)換為聲音、圖像、影視和動畫等形式,給人以直觀、形象感受的知識載體。

如唱片、錄音(像)帶、影視片等,還有近年推出的高密度存儲的唱盤和視盤。

聲像型提供的形象、聲音逼真,宜于記載難以用文字表達(dá)和描繪的形象資料和聲頻資料,如用以記載科技研究過程和科技會議發(fā)言等。通過這類資料的播放,可收到如見其形、如聞其聲的真切效果。

電子型文獻(xiàn),原稱機(jī)讀型文獻(xiàn):它通過計(jì)算機(jī)對電子格式的信息進(jìn)行存取和處理。即采用高技術(shù)手段,將信息存儲在磁盤、磁帶或光盤等一些媒體中,形成多種類型的電子出版物。

它具有信息存儲密度高,存取速度快的特點(diǎn),并且具有電子加工、出版和傳遞功能。如光盤(CD

ROM)的信息存儲量可達(dá)IG以上。電子出版物包括電子圖書、電子期刊、電子新聞、光盤數(shù)據(jù)庫產(chǎn)品或軟盤、磁帶等產(chǎn)品,以及電傳

視訊、電傳文本和電子郵件等。按文獻(xiàn)加工程度分:有一次文獻(xiàn)、二次文獻(xiàn)、三次文獻(xiàn)。一次文獻(xiàn):以作者本人取得的成果為基本素材面創(chuàng)作的論文、報告等,經(jīng)公開發(fā)表或出版的各種文獻(xiàn)。習(xí)慣上稱為原始文獻(xiàn)。??

如期刊論文、科技報告、會議論文、專利說明書、學(xué)位論文、技術(shù)標(biāo)準(zhǔn)等。特點(diǎn):具有新穎性、創(chuàng)造性(是人類創(chuàng)造性勞動成果)和先進(jìn)性(內(nèi)容上是新成果,新發(fā)明);缺點(diǎn):數(shù)量大,分布散,難以查找。

二次文獻(xiàn):報道和查找一次文獻(xiàn)的檢索工具書、書刊。?

它是按照一定的目的對一定范圍或?qū)W科領(lǐng)域的一次文獻(xiàn)進(jìn)行鑒別、篩選、分析、歸納、加工整理重組,使之有序化后出版的文獻(xiàn)。如各種索引、題錄、文摘。形式上有卡片式,期刊式,書本式。特點(diǎn):匯集性、工具性、系統(tǒng)性

三次文獻(xiàn):根據(jù)二次文獻(xiàn)提供的線索,選用大量一次文獻(xiàn),根據(jù)一定的需要和目的進(jìn)行篩選、分析、綜合和濃縮而再出版的文獻(xiàn)。

如詞典、手冊、指南、年鑒、百科全書、大全、綜述、工具書目錄、書目之書目、專題述評、進(jìn)展報告等。特點(diǎn):綜合性、

價值性、

針對性

按文獻(xiàn)的出版形式分:有圖書、期刊論文、會議文獻(xiàn)、科技報告、專利文獻(xiàn)、學(xué)位論

文、標(biāo)準(zhǔn)文獻(xiàn)、政府出版物、產(chǎn)品樣本、

科技檔案等。/ch-gongbao4、文獻(xiàn)檢索工具是以存貯和檢索文獻(xiàn)線索或報道、積累和查找文獻(xiàn)線索的工具。是通過手工檢索和計(jì)算機(jī)檢索來運(yùn)用的。

手工檢索:主要有目錄、題錄、文摘、索引等工具書。

計(jì)算機(jī)檢索:一般通過搜索引擎,數(shù)據(jù)庫或直接深入到上述各種工具中?!鰴C(jī)項(xiàng)檢目與手■檢的手異檢同機(jī)檢征總體特

手翻、眼看、大腦判斷

策略、查尋、機(jī)器匹配

標(biāo)引及

檢索點(diǎn)較少索引特點(diǎn)檢索點(diǎn)較多間檢索時

較慢較快求檢索要

專業(yè)知識、外語知識、檢索工具知識

專業(yè)知識、外語知識、機(jī)檢系統(tǒng)知識

查全查

查準(zhǔn)率較高準(zhǔn)率查全率較高率綜合效

較低較高5、文獻(xiàn)檢索語言是為溝通文獻(xiàn)信息用戶和文獻(xiàn)信息之間的語言,理論上講,是用于文獻(xiàn)標(biāo)引和檢索提問的約定語言。按照表達(dá)文獻(xiàn)主題概念的語詞形式,有分類語言和主題語言,其中主題語言又分為敘詞(如主題詞)和關(guān)鍵詞。按照規(guī)范化程度,有自然語言和規(guī)范人工語言。6、文獻(xiàn)檢索途徑`文獻(xiàn)具有內(nèi)容特征和外表特征。從而也構(gòu)成了文獻(xiàn)信息檢索的兩大基本途徑,內(nèi)容途徑和外表特征檢索。內(nèi)容特征檢索,又分為主題途徑和分類途徑。主題途徑:是根據(jù)文獻(xiàn)所論述的主題,利用主題語言編制的主題索引而進(jìn)行的信息檢索。主題索引大多按字母排列方式,因此,檢索也要用相應(yīng)的方式。分類途徑:是根據(jù)文獻(xiàn)所論述的主題內(nèi)容,利用分類語言的學(xué)科專業(yè)體系進(jìn)行的檢索。大多數(shù)檢索工具都采用分類語言作為正文

編排體系的依據(jù),分類目次通常是按照學(xué)

科專業(yè)角度的層層邏輯劃分建立分類類目

體系。檢索時要選擇合適的分類類目。

外表特征檢索,分為著者、書名、序號等途徑。

著者途徑:檢索中,著者是一個廣義的概念,是對文獻(xiàn)內(nèi)容負(fù)有責(zé)任的作者、編者、譯者等,可以是個人、團(tuán)體、機(jī)構(gòu)、組織,甚至還包括著者的單位。通過著者途徑進(jìn)

行檢索,主要可利用著者索引。所有著者

索引都采用字順排列方式。

題名途徑:篇名索引、書名索引、刊名索引等。題名索引

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論