第一章 文獻信息檢索基礎知識_第1頁
第一章 文獻信息檢索基礎知識_第2頁
第一章 文獻信息檢索基礎知識_第3頁
第一章 文獻信息檢索基礎知識_第4頁
第一章 文獻信息檢索基礎知識_第5頁
已閱讀5頁,還剩52頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

第一章文獻信息檢索

基礎知識第1節(jié)文獻信息檢索的基本概念一.文獻、信息、信息源

1.定義文獻:用文字、圖形、符號、聲頻、視頻等技術(shù)手段記錄人類知識的一種載體,或理解為固化在一定物質(zhì)載體上的知識。

信息:廣義地說,信息就是消息。

指對接收者來說預先不知道的報道。(辭海)是用來通信的事實,在觀察中得到的數(shù)據(jù)、新聞和知識。(韋氏字典)

是一切思想、事實和富有想象力的作品,它們以各種方式進行記錄和傳播。(信息專家)第1節(jié)文獻信息檢索的基本概念

信息源:是指人們?yōu)樾枨蠖枰垣@得信息的一切來源。凡是能產(chǎn)生、存儲、加工、傳遞信息的社會活動場所、機構(gòu)、人物、產(chǎn)品和自然物質(zhì)都是信息源。信息源可分為非文獻信息源和文獻信息源。

2.文獻信息源的類型文獻信息源:是指用一定的記錄手段將系統(tǒng)化的信息內(nèi)容儲存在紙張、膠片、磁帶和光盤等物質(zhì)載體上而形成的一類信息源。第1節(jié)文獻信息檢索的基本概念按文獻的載體介質(zhì)劃分為印刷型Printedform:以手寫和印刷技術(shù)為手段,以紙張記錄信息的載體形式存在。縮微型Microform:以感光材料記錄文字及其相關(guān)信息的載體。聲像型(視聽型)Audio-Visualform:記錄聲音、圖像信號的信息載體。機讀型(電子型)MachineReadableform:以電子版本形式存在。電子版本包括:floppy,Magnetictape,CD-ROM,online,network

多媒體multi-media:計算機對數(shù)字化視聽信息交互存取。第1節(jié)文獻信息檢索的基本概念

按文獻的出版類型劃分圖書(閱讀類、工具類)期刊(一次文獻、二次文獻)特種文獻(專利、科技報告、會議錄、政府出版物、學位論文、標準、技術(shù)檔案、產(chǎn)品目錄等)第1節(jié)文獻信息檢索的基本概念

可具體分為科技圖書Sci-Techbook,Monograph,Anthology,Textbook,Referencebook

科技期刊Sci-TechJournal(magazine*,serial,periodical…)

科技報告Sci-TechReport

專利文獻PatentDocument,Patentspecification/bulletin

會議文獻Conferencepaper,Proceedings,compilation,collectedpaper,records,meeting,seminar,colloquium,symposium,conference

學位論文Dissertation,Thesis

標準文獻,產(chǎn)品資料,技術(shù)檔案,政府文獻第1節(jié)文獻信息檢索的基本概念科技圖書(Book):對已有的研究成果或生產(chǎn)經(jīng)驗所作的概括論述。特點:帶有總結(jié)性、成熟定型;出版周期長,信息傳遞慢;傳授知識,而不是報道最新情報。圖書一般分為兩類:閱讀型:教科書、專著等工具型:字典、百科全書、年鑒、手冊科技期刊(journal,periodic)特點:名稱固定、有連續(xù)的卷、年月順序號、出版周期短,報道速度快、數(shù)量大,內(nèi)容豐富。據(jù)估計,從期刊獲取的科技情報占整個情報來源的60%-70%第1節(jié)文獻信息檢索的基本概念

會議文獻(conferencepaper):是指在各種學術(shù)會議上發(fā)表的論文。特點:傳遞信息及時、針對性強、內(nèi)容新穎。一部分科研成果就是通過學術(shù)會議首次發(fā)表。表示會議的相關(guān)詞:Proceedings,compilation,collectedpaper,records,Meeting,seminar,colloquium,symposium,conference第1節(jié)文獻信息檢索的基本概念

科技報告(technicalreport):指學術(shù)團體、科研機構(gòu)、大學研究所的研究報告及研究過程的記錄。目的:向上級主管部門匯報特點:每份單獨成冊,有專門的編號;內(nèi)容具體,有科研項目的研究方案,實驗記錄,實驗數(shù)據(jù),圖表等;理論性強,是了解某一領域科研進展狀況、發(fā)展動態(tài)的重要信息源;報道比期刊早;保密或控制發(fā)行。第1節(jié)文獻信息檢索的基本概念

世界上著名的科技報告有美國四大報告:

PB——美國商業(yè)部

AD——美國軍事國防部

NASA——美國宇航局

DOE——美國能源部這四大報告每年公開和解密部分約6萬件??萍既藛T對科技報告的需要量約占其全部文獻量的10%-20%,特別在是發(fā)展迅速、競爭激烈的高科技領域。第1節(jié)文獻信息檢索的基本概念

專利文獻(patentdocument)專利文獻是一切與專利制度有關(guān)的專利文件的統(tǒng)稱,如專利申請書和專利說明書、專利公報。專利說明書是公開的文獻,但只能由各國專利局發(fā)行,它反映了當前最新的技術(shù)成果。學位論文(dissertation,thesis)是作者為獲得某種學位而撰寫的科學論文。博士論文具有較高的參考價值:一般偏重于理論,附有大量的參考文獻,借此可以看出有關(guān)專題的發(fā)展過程和方向。學位論文一般不出版發(fā)行,而是保存在授予學位單位的圖書館里。第1節(jié)文獻信息檢索的基本概念

標準文獻(standard)

主要指技術(shù)規(guī)范、技術(shù)標準、操作規(guī)程、建議、準則、術(shù)語、專門名詞等在內(nèi)的各種技術(shù)文件。技術(shù)標準是得到管理機構(gòu)認可,適用于一定專業(yè)領域的技術(shù)規(guī)范,具有法定性;技術(shù)標準主要包括尺寸標準、材料標準、性能標準、方法標準、操作規(guī)程、術(shù)語和圖形符號標準、文獻標準等。政府出版物(governmentdocument)是各國政府部門及其所屬機構(gòu)頒布和出版的文件資料,內(nèi)容主要分為:行政性文件(如法令、統(tǒng)計等)、科技文件兩大類。對了解一個國家的科技和經(jīng)濟政策及其演變情況有一定的參考價值。第1節(jié)文獻信息檢索的基本概念產(chǎn)品資料

提供產(chǎn)品技術(shù)規(guī)格的文獻。是產(chǎn)品制造商為推銷產(chǎn)品而印發(fā)的介紹產(chǎn)品情況的各種商業(yè)宣傳品,如公司介紹、產(chǎn)品目錄、產(chǎn)品樣本、產(chǎn)品說明書等。介紹的一般是已投產(chǎn)和行銷的產(chǎn)品。具有技術(shù)成熟可靠、產(chǎn)品和技術(shù)信息較完整、及時性、圖文并茂等特點。

技術(shù)檔案指在科技生產(chǎn)活動中形成的一系列以工程技術(shù)圖紙、任務書、協(xié)議、合同、設計方案以及與此有關(guān)的調(diào)查統(tǒng)計數(shù)據(jù)等材料組成的文件。技術(shù)檔案具有技術(shù)性、適用性、保密性等特征。第1節(jié)文獻信息檢索的基本概念

特種文獻收藏館專利文獻:專利局文獻館科技報告:中國科技信息研究所(中信所)、北京文獻服務處(國防科技信息中心)。

會議文獻:國家圖書館、大學/研究型圖書館、中科院圖書館、郵電大學圖書館(IEEE)學位論文:國圖、中信所、授予機構(gòu)/院校第1節(jié)文獻信息檢索的基本概念

文獻的級別一次文獻/信息primaryLiterature/info

二次文獻/信息secondaryliterature/info

三次文獻/信息Tertiaryliterature/info

(1)一次文獻/信息primaryLiterature/info

概念:第一次書寫的、第一次報道的或第一次出版的文獻;以作者自己的研究成果、工作經(jīng)驗和實踐體會為原始依據(jù),信息內(nèi)容具體、豐富。特點:新潁性、創(chuàng)造性、系統(tǒng)性如:Journalliterature(期刊論文)、Sci-Techreport(科技報告)、Proceedings(會議錄)、Paper(會議論文)、Thesis、Dissertation(學位論文)

第1節(jié)文獻信息檢索的基本概念

(2)二次文獻/信息secondaryliterature/info

概念:對一次文獻的加工、提煉和濃縮特點:濃縮性、匯集性、有序性文摘Abstract

索引Index

目錄Catalog

題錄Bibliography

(3)三次文獻/信息Tertiaryliterature/info

概念:對一次文獻和二次文獻進行匯集、綜合、分析、詳述等深度加工而形成的產(chǎn)物。Referencebook

如:詞典、百科全書、年鑒、名錄、綜述、述評、二次書目、指南第1節(jié)文獻信息檢索的基本概念

一、二、三次文獻的區(qū)別

對象不同:二次文獻以“篇”或“本”為單位進行加工;三次文獻則歸納了較多的一次文獻內(nèi)容。

用途不同:二次文獻為檢索一次文獻的工具;三次文獻能直接提供檢索答案。

學習文獻檢索課的目的:如何通過二次文獻去檢索一次文獻

第1節(jié)文獻信息檢索的基本概念

文獻信息檢索基本概念

檢索的手段手檢:書本型工具(刊)

機檢:數(shù)據(jù)庫系統(tǒng)

檢索點(途徑)(AccessPoint):用文獻各種內(nèi)外特征,作為檢索出發(fā)點,從不同角度來檢索文獻信息。分類(Classified):所屬學科性質(zhì),類別,分類體系現(xiàn)期檢索主題(Subject):所屬主題內(nèi)容,主題詞,回溯檢索著者(Author);團體著者(CorporateAuthor/Authors’Affiliation)名稱(Title)代碼(Code/Coden)第1節(jié)文獻信息檢索的基本概念

檢索的類型

事實型:事實、數(shù)據(jù)(直接,確定)、參考工具書、NumericDatabase、PropertyDatabase、Textual-numericDatabase

全文型:Full-textDatabase

目錄型:館藏目錄、聯(lián)合目錄(UnionCatalog)

OPAC:OnlinePublicAccessCatalog

OCLC:OnlineComputerLibraryCenter

第1節(jié)文獻信息檢索的基本概念

中國圖書分類法

1.中國圖書分類法(中圖法)用字母數(shù)字混合制標記,一個或兩個英文字母和一串阿拉伯數(shù)字來代表一個具體的類目。

2.《中國科學院圖書館圖書分類法》(科圖法)中科院圖書館編制,主要用戶為中科院系統(tǒng),用戶數(shù)居全國第二,類號標記采用純數(shù)字。

3.《中國人民大學圖書館圖書分類法》(人大法)中國人民大學圖書館編制,適合人大圖書館所藏書目,類號采用純數(shù)字。第1節(jié)文獻信息檢索的基本概念

國外圖書分類法

1.《DeweyDecimalClassificationSystem》杜威十進分類法

2.《LibraryofCongressClassification》美國國會圖書館圖書分類法

3.《UniversalDecimalClassification》國際十進分類法

索書號——排架號構(gòu)成:分類號+文獻次序號、分類號+著者號第1節(jié)文獻信息檢索的基本概念館際互借(InterlibraryLoan)簡稱:ILL

對于本館沒有的文獻,在本館讀者需要時,根據(jù)館際互借制度、協(xié)議、辦法和收費標準,向外館借入;反之,在外館向本館提出館際互借請求時,借出本館所擁有的文獻。適用于返還式文獻。

文獻傳遞(DocumentDelivery)簡稱:DD

將用戶所需的文獻復制品以有效的方式和合理的費用,直接或間接傳遞給用戶的一種非返還式的文獻提供服務,它具有快速、高效、簡便的特點。傳遞方式有Mail,Fax,E-mail等。

第2節(jié)數(shù)據(jù)庫及檢索方法

一、基本概念

1.數(shù)據(jù)庫

至少由一種文檔組成,并能滿足某一特定目的或某一特定數(shù)據(jù)處理系統(tǒng)需要的一種數(shù)據(jù)集合。或者說:數(shù)據(jù)庫是在計算機存儲設備上按一定方式存儲的相互關(guān)聯(lián)的數(shù)據(jù)集合。

2.數(shù)據(jù)庫分類

數(shù)據(jù)庫分為:文獻型數(shù)據(jù)庫、非文獻型數(shù)據(jù)庫文獻型數(shù)據(jù)庫分為目錄型數(shù)據(jù)庫、題錄文摘型數(shù)據(jù)庫、全文數(shù)據(jù)庫。第2節(jié)數(shù)據(jù)庫及檢索方法

目錄型數(shù)據(jù)庫:主要是指各圖書館的館藏圖書、期刊目錄亦稱聯(lián)機目錄。這種數(shù)據(jù)庫的信息以圖書或者期刊為單位,其數(shù)據(jù)庫內(nèi)容詳細,除描述標題、作者、出版項等書目信息外,還可以提供相關(guān)的分類號、索取號、館藏等信息。

題錄文摘型數(shù)據(jù)庫:收錄的內(nèi)容與題錄文摘型工具書基本一致,是以文獻為基本單元。數(shù)據(jù)庫的著錄項目包括了文獻號、文獻題目、作者以及工作單位、文獻來源(如期刊名稱、出版年、卷、期、頁碼等)、文摘、主題詞、文中所附圖表數(shù)和參考文獻數(shù)。特點是收藏文獻種類數(shù)量多、檢索速度快。第2節(jié)數(shù)據(jù)庫及檢索方法全文數(shù)據(jù)庫:是指存儲全文信息或主要部分的數(shù)據(jù)庫,數(shù)據(jù)庫的存儲內(nèi)容還可以細分為期刊全文數(shù)據(jù)庫、專利全文數(shù)據(jù)庫、百科全書全文數(shù)據(jù)庫等類型。非文獻型數(shù)據(jù)庫包括數(shù)據(jù)型數(shù)據(jù)庫:如實驗數(shù)據(jù)、化學分子式、價格事實型數(shù)據(jù)庫:百科全書、人名錄、公司名錄概念型數(shù)據(jù)庫:各種名詞術(shù)語或語言資料,來源于詞典。圖像數(shù)據(jù)庫:衛(wèi)星圖片、云圖、工程設計圖第2節(jié)數(shù)據(jù)庫及檢索方法3.數(shù)據(jù)庫結(jié)構(gòu)特點(1)字段:是數(shù)據(jù)庫中最基本的單元,是文獻的著錄項目??煞譃?種基本字段:檢索系統(tǒng)的存取號字段、基本索引字段、輔助索引字段。(2)記錄:幾個不同字段的集合構(gòu)成記錄,記錄是數(shù)據(jù)庫的基本數(shù)據(jù)單位。每條記錄相當于題錄文摘型檢索刊物的一條著錄款目。在同一個數(shù)據(jù)庫中的記錄往往含有相同的字段。(3)文檔:文檔是按照一定結(jié)構(gòu)組織的相關(guān)記錄的集合。文檔是文獻型數(shù)據(jù)庫組織的基本形式。文檔的組織方式與檢索系統(tǒng)的硬件和軟件功能密切相關(guān)。第2節(jié)數(shù)據(jù)庫及檢索方法基本索引字段:又稱主題字段,用來表達文獻內(nèi)容特征的字段,如:篇名字段(TitleField/TI)文摘字段(AbstractField/AB)敘詞字段(DescriptorField/DE)

輔助索引字段(AdditionalIndexFields):用來表達文獻外部特征的字段,如

著者字段(AuthorField/AU)

出版年字段(PublicationYearField/PY)

刊名字段(JournalField/SO或JN)

語種字段(LanguageField/LA)

文獻類型字段(DocumentTypeField/DT)輔助字段種類很多,且隨數(shù)據(jù)庫的不同而各有差異。第2節(jié)數(shù)據(jù)庫及檢索方法檢索詞

檢索詞是用戶或檢索人員給出的字、詞、字符或短語,用于查找含有它(它們)的記錄。

檢索詞分類及其特點受控詞:受控詞是事先規(guī)范化的檢索語言,取自主題詞表、敘詞表、分類表等。如果數(shù)據(jù)庫對數(shù)據(jù)采用了受控標引,并有機讀式或印刷版主題詞表時,應優(yōu)先選用其中的受控詞。敘詞:指來自文獻和用戶并經(jīng)過嚴格的多方面控制、用以表達文獻主題或信息需求的單義詞或代碼。

主題詞:以規(guī)范化的詞匯來表達文獻內(nèi)容的主題。第2節(jié)數(shù)據(jù)庫及檢索方法受控詞特點兩類檢索詞中,受控詞的檢索效率高,一旦選定適當?shù)母拍?,系統(tǒng)就能檢出這一概念的全部內(nèi)容,而且,由于標引人員已事先解決了自然語言中的同義、近義關(guān)系,使檢索相對容易。但由于其先組性質(zhì),受控詞不能及時反映新事物的發(fā)展,而且概念數(shù)量有限、結(jié)構(gòu)復雜,不能適應數(shù)量眾多、要求各異的信息用戶,也不易為非專業(yè)人員掌握。

第2節(jié)數(shù)據(jù)庫及檢索方法非受控詞

非受控詞是指非規(guī)范化的自然語言詞匯,又稱自由詞。特點:非受控詞可以在一定程度上彌補受控詞的不足,非受控詞可以是任意選詞,其專指性強,而且不需要熟悉詞表,新產(chǎn)生的名詞術(shù)語可以及時檢索與新概念有關(guān)的文獻。但非受控詞一般不能提供概念的等級結(jié)構(gòu),不能檢索寬泛概念,不能解決同義詞、近義詞、相關(guān)詞的結(jié)合或連接問題。受控詞和非受控詞的作用是互補的,數(shù)據(jù)庫的詞表與要查詢的主題概念并非存在一一對應的關(guān)系,很多概念得不到反映,所以,當檢索結(jié)果不滿意時,要分析檢索詞,根據(jù)具體情況決定增減或替換檢索詞。第2節(jié)數(shù)據(jù)庫及檢索方法4.檢索語言(retrievallanguage)

檢索語言是信息檢索系統(tǒng)和檢索時所使用的共同語言。即在文獻存儲時文獻的內(nèi)容特征(如分類、主題)和外表特征(如書名、刊名、著者等)按照一定的語言來描述,檢索文獻時的提問也按照一定的語言來表達。檢索語言分為:自然語言和受控語言

自然語言(非規(guī)范):是采用直接來自于文獻或用戶提問的檢索語言,自然語言用的檢索詞一般是從文獻篇名、正文或文摘中抽取有實際檢索意義的詞語,亦稱關(guān)鍵詞或自由詞。關(guān)鍵詞或自由詞均屬于非受控詞或非規(guī)范詞,特點是不受專業(yè)詞控制。第2節(jié)數(shù)據(jù)庫及檢索方法受控語言(規(guī)范):是指受到信息檢索系統(tǒng)控制的一類索引語言的總稱(又稱“人工語言”或“規(guī)范化語言”)。在一個檢索系統(tǒng)中,所有規(guī)范詞集合在一起構(gòu)成了詞表包括:主題詞表、敘詞表、標題詞表。構(gòu)成了標題詞語言、單元詞語言、敘詞語言、分類語言。在文獻存儲時,文獻的內(nèi)容特征(如分類、主題)和外表特征(如書名、刊名、著者等)按照一定的語言來描述,檢索文獻時的提問也按照一定的語言來加以表達。第2節(jié)數(shù)據(jù)庫及檢索方法二、網(wǎng)絡相關(guān)概念

1.IP地址:為了保證因特網(wǎng)上的計算機(主機)在通信時能相互識別,就要使網(wǎng)上的每一臺計算機都有一個獨一無二的地址,這個地址就是IP地址。IP地址由4組數(shù)字組成,每組數(shù)字中間用點間隔,如是中國農(nóng)業(yè)大學圖書館的主機在Internet上的IP地址。

2.域名系統(tǒng):入網(wǎng)的每一臺主機都具有這樣的域名:主機名.機構(gòu)名.網(wǎng)絡名.頂級域名。中國農(nóng)業(yè)大學圖書館的域名為:Lib為主機名、cau為機構(gòu)名、edu為網(wǎng)絡名、cn為頂級域名。

3.萬維網(wǎng)(WorldWideWeb,WWW):是一種基于超文本方式的信息查詢工具。第2節(jié)數(shù)據(jù)庫及檢索方法

域名的規(guī)定全球互聯(lián)網(wǎng)絡信息中心(InterNIC)和Internet國際特別委員會規(guī)定了三類頂級域名,通用的頂級域名有:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論