信息檢索與利用1信息檢索基礎(chǔ)_第1頁
信息檢索與利用1信息檢索基礎(chǔ)_第2頁
信息檢索與利用1信息檢索基礎(chǔ)_第3頁
信息檢索與利用1信息檢索基礎(chǔ)_第4頁
信息檢索與利用1信息檢索基礎(chǔ)_第5頁
已閱讀5頁,還剩40頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

信息檢索與利用目

錄第1章

信息檢索基礎(chǔ)第2章

常用中文檢索系統(tǒng)第3章

常用外文檢索系統(tǒng)第4章

電子圖書及其檢索第5章

特種文獻(xiàn)及其檢索第6章

多媒體學(xué)習(xí)資源庫第7章

網(wǎng)絡(luò)信息檢索第8章

學(xué)術(shù)資源發(fā)現(xiàn)系統(tǒng)第9章

文獻(xiàn)信息綜合利用1.1

信息檢索的基本概念1.1.1信息1.信息的定義

我國國家標(biāo)準(zhǔn)《情報與文獻(xiàn)工作詞匯基本術(shù)語》中,對信息的概念定義為:信息是物質(zhì)存在的一種方式、形態(tài)或運(yùn)動狀態(tài),是事物的一種普遍屬性,一般指數(shù)據(jù)、消息中所包含的意義,可以使消息中所描述的事件的不確定性減少。第1章

信息檢索基礎(chǔ)第1章

信息檢索基礎(chǔ)2.信息的屬性(1)客觀性??陀^、真實(shí)是信息最重要的本質(zhì)特征。(2)普遍性。(3)時效性。(4)中介性。(5)擴(kuò)充性。(6)擴(kuò)散性。(7)可貯性。(8)可知性。(9)共享性。第1章

信息檢索基礎(chǔ)1.1.2數(shù)字信息1.數(shù)字信息的定義

數(shù)字信息是一種處理信息的“物理符號系統(tǒng)”,它以馮·諾伊曼模型為基礎(chǔ),在信息的存儲、通訊、計算和邏輯操作、控制、輸入/輸出上是以0和1兩個數(shù)字的編碼組合來實(shí)現(xiàn)。一切以馮·諾伊曼模型為基礎(chǔ)而產(chǎn)生、制作的數(shù)字形式都是數(shù)字信息。而所謂數(shù)字形式,簡單地講就是指能被電子計算機(jī)識別的、不同序列的“0”和“1”代碼構(gòu)成形式。由于可以使用數(shù)字代碼形式來再現(xiàn)、存儲和傳輸一切知識、數(shù)據(jù)、事實(shí)和文獻(xiàn),包括文字、圖片、聲音、動態(tài)圖象等數(shù)字信息,這徹底改變了人類的信息傳播方式,為實(shí)現(xiàn)數(shù)字信息的廣泛共享創(chuàng)造了條件。第1章

信息檢索基礎(chǔ)2.數(shù)字信息的特點(diǎn) 數(shù)字信息不同于傳統(tǒng)的印刷型文獻(xiàn)和各類模擬視聽資料,與之相比,其特點(diǎn)主要有:(1)存儲介質(zhì)和傳輸形式發(fā)生變化(2)資源以多媒體作為內(nèi)容特征且類型多種多樣(3)信息更新、服務(wù)更加方便和快捷(4)信息傳播不受時間、地域限制第1章

信息檢索基礎(chǔ)1.1.3信息檢索1.信息檢索 信息檢索是指將信息按一定的方式組織和存儲起來,并根據(jù)信息用戶的需要找出有關(guān)的信息的過程。所以,它的全稱又叫信息存儲與檢索(Information

Storage

andRetrieval),這是廣義的信息檢索。 廣義的信息檢索包括兩個過程,一是信息的存儲,即信息的標(biāo)引、加工和存儲過程;二是信息的檢索,即用戶查找信息的過程。狹義的信息檢索,是根據(jù)課題的需要,主要借助于檢索工具或通過檢索平臺,從信息集合中找出所需信息的過程。第1章

信息檢索基礎(chǔ)2.數(shù)字信息檢索 數(shù)字信息檢索是指以計算機(jī)技術(shù)為手段,通過光盤、聯(lián)機(jī)和互聯(lián)網(wǎng)等現(xiàn)代檢索方式進(jìn)行數(shù)字信息檢索的方法。3.信息檢索類型(1)按信息檢索的對象劃分①文獻(xiàn)檢索;②數(shù)據(jù)檢索;③事實(shí)檢索。(2)按信息的組織方式劃分①全文檢索;②超文本檢索;③超媒體檢索。第1章

信息檢索基礎(chǔ)4.信息檢索基本原理

信息檢索是由信息的存貯與檢索兩個不可分割的過程所組成。(如圖1-1所示)第1章

信息檢索基礎(chǔ)圖1-1信息檢索原理圖1.2

文獻(xiàn)信息源的類型1.2.1文獻(xiàn)信息源的概念

信息源,即信息的來源。因?yàn)樾畔⒌暮x十分寬泛,信息源的定義也因?qū)W科領(lǐng)域的不同而有不同的解釋。聯(lián)合國科教文組織出版的《文獻(xiàn)術(shù)語》把其定義為:個人為滿足其信息需要而獲得信息的來源,稱為“信息源”。一切產(chǎn)生、生產(chǎn)、存貯、加工、傳播信息的源泉都可以看做是信息源。

存在于文獻(xiàn)中的信息就是文獻(xiàn)信息源,人們通過閱讀、視聽學(xué)習(xí)等方式交流傳播。第1章

信息檢索基礎(chǔ)1.2.2文獻(xiàn)信息源的分類1.按文獻(xiàn)載體的形式劃分(1)印刷型文獻(xiàn) 印刷型文獻(xiàn)是以紙張為載體,以印刷(包括鉛印、油印、膠印和復(fù)?。橛涗浭侄味纬傻奈墨I(xiàn)。這是一種傳統(tǒng)的文獻(xiàn)形式。包括圖書、期刊、報紙等。 這種文獻(xiàn)的優(yōu)點(diǎn)是傳遞知識方便靈活,便于攜帶、傳播和閱讀,保存時間相對較長。缺點(diǎn)是存儲密度小,占據(jù)空間大、保存費(fèi)用高。第1章

信息檢索基礎(chǔ)(2)縮微型文獻(xiàn)

縮微型文獻(xiàn)是以感光材料為載體,通過光學(xué)攝影方式將文獻(xiàn)的影像固化在感光材料上形成的一類文獻(xiàn)。如:縮微膠片、縮微膠卷等。

其優(yōu)點(diǎn)是體積小、信息密度高、輕便,易于傳遞,價格便宜,記錄速度快。缺點(diǎn)是膠片日久會變色,保存條件要求較高,閱讀時需借助于閱讀設(shè)備。(3)視聽型文獻(xiàn)

視聽型文獻(xiàn)是以磁性材料或感光材料為載體,以磁記錄或光學(xué)技術(shù)為記錄手段而產(chǎn)生的一種文獻(xiàn)。如:錄音帶、錄像帶、唱片、幻燈片等。

其優(yōu)點(diǎn)是有聲有色,圖文并茂。缺點(diǎn)是成本高,不易檢索和更新,使用不方便。第1章

信息檢索基礎(chǔ)(4)機(jī)讀型文獻(xiàn) 機(jī)讀型文獻(xiàn)是通過計算機(jī)對電子格式的信息進(jìn)行存取和處理,形成磁盤、磁帶或光盤等多種類型的電子出版物。 其優(yōu)點(diǎn)是信息存儲密度高,存取速度快,并且具有電子加工、出版和傳遞功能,易于處理,易于實(shí)現(xiàn)資源共享。缺點(diǎn)是使用時必須借助于計算機(jī)等設(shè)備,保存條件較高。第1章

信息檢索基礎(chǔ)2.按文獻(xiàn)的出版類型劃分(1)圖書

根據(jù)國際文獻(xiàn)標(biāo)準(zhǔn)草案ISO/DIS5217/Ⅱ的定義“凡篇幅達(dá)48頁以上并構(gòu)成一個書目單元的文獻(xiàn)稱為圖書”。圖書的類型主要有兩大類:一是閱讀類圖書,二是參考類圖書,也稱參考工具書。公開出版發(fā)行的圖書,一般標(biāo)注有國際標(biāo)準(zhǔn)書號(ISBN)。

圖書文獻(xiàn)的特點(diǎn):內(nèi)容成熟、定型、論述系統(tǒng)、全面、可靠,但出版周期較長,知識的新穎性不如期刊等類型的文獻(xiàn)。第1章

信息檢索基礎(chǔ)(2)連續(xù)出版物

①期刊。期刊又稱雜志,是一種定期或不定期連續(xù)出版、有統(tǒng)一的名稱和固定的出版形式、開本和篇幅頁碼、有連續(xù)的卷期或年月序號、匯集若干作者撰寫的多篇文章和資料,并由專門的機(jī)構(gòu)編輯出版的連續(xù)性出版物。期刊可分為學(xué)術(shù)性期刊、通訊性期刊、消息性期刊、資料性期刊和檢索性期刊等。公開出版發(fā)行的期刊,一般標(biāo)注有國際標(biāo)準(zhǔn)刊號(ISSN)。

期刊文獻(xiàn)的特點(diǎn)是:出版周期短、反映新成果及時、內(nèi)容廣泛新穎、信息量大、學(xué)術(shù)性強(qiáng)、發(fā)行及影響面廣。

②報紙。報紙是指每期版式基本相同的一種出版物。它的出版周期更短,信息傳遞更及時,因此,報紙也是十分重要的信息源。第1章

信息檢索基礎(chǔ)(3)科技報告 科技報告是科技人員圍繞某一專題從事研究取得成果以后撰寫的正式報告,或者是科學(xué)研究工作中課題進(jìn)展情況的實(shí)際紀(jì)錄,反映其各階段的研究成果和最后的總結(jié),因此也稱研究報告。科技報告的出版特點(diǎn)是各篇單獨(dú)成冊,統(tǒng)一編號,由主管機(jī)構(gòu)連續(xù)出版,有機(jī)構(gòu)名稱和統(tǒng)一編號。(4)會議文獻(xiàn) 會議文獻(xiàn)是在各種學(xué)術(shù)會議、專題研討會上發(fā)表的論文和報告,它是最新研究成果公布于世的一種主要方式。會議文獻(xiàn)是了解各國科技水平、動態(tài)及發(fā)展趨勢的重要信息來源。第1章

信息檢索基礎(chǔ)(5)專利文獻(xiàn)

專利文獻(xiàn)(Patents)主要是指專利說明書,即發(fā)明人向政府專利主管機(jī)構(gòu)申請保護(hù)某項發(fā)明時所呈交的一份詳細(xì)的技術(shù)說明書,經(jīng)專利局審查,公開出版或授權(quán)后所形成的文獻(xiàn)。

專利文獻(xiàn)特點(diǎn):學(xué)科領(lǐng)域廣,報道速度快,內(nèi)容新穎具體詳盡,實(shí)用性強(qiáng)。(6)技術(shù)標(biāo)準(zhǔn)

技術(shù)標(biāo)準(zhǔn)(Technical

Standards)是由某一機(jī)構(gòu)頒發(fā)的對工農(nóng)業(yè)技術(shù)產(chǎn)品、工程建設(shè)質(zhì)量、規(guī)格及其檢驗(yàn)方法等所做的技術(shù)規(guī)

定的文件,是從事生產(chǎn)、建設(shè)的共同技術(shù)依據(jù)。

標(biāo)準(zhǔn)文獻(xiàn)的特點(diǎn):具有一定的法律約束力。它是一個國家技術(shù)發(fā)展水平的具體反映。隨著科技的進(jìn)步,標(biāo)準(zhǔn)文獻(xiàn)要不斷修訂和更新。第1章

信息檢索基礎(chǔ)(7)政府出版物

各國政府及其所屬機(jī)構(gòu)所發(fā)表的文件統(tǒng)稱為政府出版物。其內(nèi)容可分行政性和科技性兩大類。行政性文件包括:政府報考、會議紀(jì)錄、法令、條約、決議、規(guī)章制度等;科技文件包括:科技政策、科普資料、技術(shù)法規(guī)等。

政府出版物的特點(diǎn):具有正式性和權(quán)威性;根據(jù)其性質(zhì)分為公開資料、內(nèi)部資料、機(jī)密資料(秘密、機(jī)密、絕密三個密級)等三種。(8)學(xué)位論文

學(xué)位論文是指高等學(xué)校、科研機(jī)構(gòu)的學(xué)生為獲得某種學(xué)位所撰寫的論文。根據(jù)不同的學(xué)位,一般分為學(xué)士論文、碩士論文和博士論文。

學(xué)位論文的特點(diǎn):理論性系統(tǒng)性強(qiáng),內(nèi)容專一,闡述詳細(xì),具有一定的獨(dú)創(chuàng)性。第1章

信息檢索基礎(chǔ)(9)產(chǎn)品樣本

產(chǎn)品樣本是對定型產(chǎn)品的性能、構(gòu)造原理、用途、使用方法和操作規(guī)程、產(chǎn)品規(guī)格等所作的具體說明,包括單項產(chǎn)品樣本(即說明書)、企業(yè)產(chǎn)品一覽、企業(yè)介紹、單項產(chǎn)品樣品匯編等。

產(chǎn)品樣本的特點(diǎn):由于產(chǎn)品樣本記錄和反映已投產(chǎn)的產(chǎn)品,其技術(shù)成熟、數(shù)據(jù)可靠、圖文并茂、直觀性強(qiáng)。(10)技術(shù)檔案

技術(shù)檔案是記述和反映一個單位或部門在基本建設(shè)、生產(chǎn)技術(shù)和自然科學(xué)研究等活動中具有保存價值,并且按照歸檔制度作為真實(shí)歷史記錄集中保管起來的技術(shù)文件資料。技術(shù)檔案的特點(diǎn):內(nèi)容保密、不公開、內(nèi)部使用。第1章

信息檢索基礎(chǔ)3.按文獻(xiàn)加工程度分(1)零次文獻(xiàn) 是指未經(jīng)出版發(fā)行或公開交流的最原始的文獻(xiàn)。如私人筆記、底稿、手稿、個人通信、工程圖紙、考察記錄、實(shí)驗(yàn)記錄、調(diào)查稿、原始統(tǒng)計數(shù)據(jù)等。零次文獻(xiàn)在原始文獻(xiàn)的保存、原始數(shù)據(jù)的核對、原始構(gòu)思的核定(權(quán)利人)等方面有著重要的作用。此類文獻(xiàn)與一次文獻(xiàn)的主要區(qū)別在于其記載的方式、內(nèi)容的價值以及加工深度有所不同。其主要特點(diǎn)是內(nèi)容新穎,但不成熟,不公開交流,難以獲得。第1章

信息檢索基礎(chǔ)(2)一次文獻(xiàn) 一次文獻(xiàn)也稱原始文獻(xiàn)或一級文獻(xiàn)。這是著作者在科學(xué)研究、教學(xué)和生產(chǎn)實(shí)踐中以自己的成果為依據(jù)而創(chuàng)作撰寫的文獻(xiàn)。諸如專著、報刊論文、研究報告、會議文獻(xiàn)、學(xué)位論文、專利說明書等,多屬于一次文獻(xiàn)。只要是原始的著述,都為一次文獻(xiàn)。 一次文獻(xiàn)是人們學(xué)習(xí)參考的最基本的文獻(xiàn)類型,也是最主要的文獻(xiàn)信息源,是產(chǎn)生二、三次文獻(xiàn)的基礎(chǔ),是文獻(xiàn)檢索和利用的主要對象。其主要特點(diǎn)是內(nèi)容新穎豐富,敘述具體詳盡,參考價值大,但數(shù)量龐大、分散。第1章

信息檢索基礎(chǔ)(3)二次文獻(xiàn)

二次文獻(xiàn)也稱二級文獻(xiàn),它是文獻(xiàn)信息人員將大量分散的、無序的一次文獻(xiàn)進(jìn)行篩選、整理、報道和組織所形成的文獻(xiàn)。他們具有按文獻(xiàn)的內(nèi)容特征(如主題、分類),或文獻(xiàn)外表特征(如著者、篇名等)來報道揭示和檢索一次文獻(xiàn)的功能,能系統(tǒng)地反應(yīng)一次文獻(xiàn)信息,為讀者提供檢索所需文獻(xiàn)的線索,是查找一次文獻(xiàn)的工具。如目錄、題錄、索引、文摘等,均屬于二次文獻(xiàn)。

二次文獻(xiàn)以不同的深度揭示一次文獻(xiàn),其主要特點(diǎn)是匯集性和檢索性,幫助人們在較短時間內(nèi)獲得一次文獻(xiàn)信息。第1章

信息檢索基礎(chǔ)(4)三次文獻(xiàn)

三次文獻(xiàn)也稱三級文獻(xiàn),它是指在利用二次文獻(xiàn)的基礎(chǔ)上,對一次文獻(xiàn)進(jìn)行篩選,再將所選用的有關(guān)內(nèi)容進(jìn)行綜合、分析、研究和評述而編寫出來的文獻(xiàn)。它又可分為綜述研究類和參考工具類兩種類型。前者如動態(tài)綜述、學(xué)科總結(jié)、專題述評等;后者如年鑒、手冊、大全等。三次文獻(xiàn)不僅具有綜合性的特點(diǎn),而且還具有價值性和針對性的特點(diǎn),三次文獻(xiàn)源于一次文獻(xiàn),又高于一次文獻(xiàn),是一種再創(chuàng)性文獻(xiàn)。

一般來說,一次文獻(xiàn)是基礎(chǔ),是檢索利用的對象;二次文獻(xiàn)是檢索一次文獻(xiàn)的工具,故又稱之為檢索工具;三次文獻(xiàn)是一次文獻(xiàn)內(nèi)容的高度濃縮,也是我們利用的一種重要信息源。第1章

信息檢索基礎(chǔ)1.3

信息檢索語言1.3.1檢索語言1.檢索語言的定義

檢索語言是信息存儲與檢索過程中用于描述信息特征和表達(dá)用戶信息提問的一種專門語言。亦稱標(biāo)引語言、索引語言及系統(tǒng)語言等。2.檢索語言的功能(1)標(biāo)引特征;(2)相關(guān)性;(3)有序化檢索;(4)一致性;(5)提高查全率和查準(zhǔn)率。第1章

信息檢索基礎(chǔ)3.檢索語言的類型(1)描述文獻(xiàn)內(nèi)容特征的檢索語言 文獻(xiàn)內(nèi)容特征指文獻(xiàn)所涉及的學(xué)科范圍和主題內(nèi)容。描述文獻(xiàn)內(nèi)容特征的檢索語言有:①分類語言(Classification

Language)。②主題語言(Subject

Language)。(2)描述文獻(xiàn)外表特征的檢索語言 文獻(xiàn)外表特征指文獻(xiàn)的篇名、著者、出處(文獻(xiàn)的出版單位、出版時間)等不涉及文獻(xiàn)的實(shí)質(zhì)內(nèi)容的特征。描述文獻(xiàn)外表特征的檢索語言有:題名、著者、文獻(xiàn)編號、引文等索引。第1章

信息檢索基礎(chǔ)4.檢索語言的結(jié)構(gòu)原理及特點(diǎn)(1)體系分類語言

體系分類語言是一種用分類號直接表達(dá)知識分類的等級概念的標(biāo)識系統(tǒng),是將文獻(xiàn)內(nèi)容的概念按學(xué)科性質(zhì)進(jìn)行分類和系統(tǒng)排列具有等級制結(jié)構(gòu)特點(diǎn)的語言。體系分類表是根據(jù)體系分類語言來編制的。

《中圖法》將全部知識分為5個基本部類,即“馬克思主

義、列寧主義、毛澤東思想”、“哲學(xué)”、“社會科學(xué)”、“自然科學(xué)”、“綜合性圖書”。在五個基本部類基礎(chǔ)上又形成22個大類。22個大類類號(一級類目)采用單字母,工業(yè)技術(shù)的16個2級類號采用雙字母,其余類號都是字母與阿拉數(shù)字混合編號。第1章

信息檢索基礎(chǔ)(2)標(biāo)題詞語言

標(biāo)題詞語言采用規(guī)范化了的自然語言,即經(jīng)過標(biāo)準(zhǔn)化處理的名詞術(shù)語作為標(biāo)識,來表達(dá)文獻(xiàn)所論述或涉及的事物主題,并將全部標(biāo)識按字順排列。標(biāo)題詞語言的構(gòu)成原理可歸納為:按文獻(xiàn)主題集中文獻(xiàn);用經(jīng)過規(guī)范化的語詞(標(biāo)題詞)直接標(biāo)引文獻(xiàn)主題。用參照系統(tǒng)間接顯示主題之間的相關(guān)關(guān)系。按字順序列直接提供主題檢索途徑。

標(biāo)題詞分為主標(biāo)題詞和副標(biāo)題詞,主標(biāo)題詞和副標(biāo)題詞是固定組配的,不允許檢索者將有關(guān)標(biāo)題詞進(jìn)行自由組配來表達(dá)檢索提問。主標(biāo)題詞是用來稱呼主題的,是表示事物主體或方式、過程的名詞。副標(biāo)題詞是對主標(biāo)題進(jìn)行修飾、限定和細(xì)分的名詞,表明主標(biāo)題的某一方面,起著主題分類的作用。

標(biāo)題詞語言的特點(diǎn)是:規(guī)范化處理的名詞術(shù)語,先主定組型檢索語言。第1章

信息檢索基礎(chǔ)(3)關(guān)鍵詞語言

關(guān)鍵詞語言是直接選用文獻(xiàn)中的自然語言做基本詞匯,并將那些能夠揭示文獻(xiàn)題名或主要意旨的關(guān)鍵性自然詞語作為關(guān)鍵詞進(jìn)行標(biāo)引的一種檢索語言。沒有詞表來對選詞進(jìn)行控制,所以是一種非受控的、不規(guī)范的自然語言。

關(guān)鍵詞語言的缺點(diǎn)是:未經(jīng)規(guī)范化,漏檢率和誤檢率較高,質(zhì)量較差。其優(yōu)點(diǎn)是標(biāo)引速度快,編制檢索工具簡便。(4)敘詞語言

它是從文獻(xiàn)題目、正文或摘要中抽出來用以表達(dá)文獻(xiàn)內(nèi)容,采用表示單元概念的規(guī)范化名詞的組配來對文獻(xiàn)內(nèi)容進(jìn)行描述的檢索語言。

敘詞語言不僅具備一般主題語言所具有的基本要素、性能和特點(diǎn),同時比其它類型的主題語言更為全面科學(xué)和完善。它最大的優(yōu)點(diǎn)是,可以自由組配檢索概念,非常適用于計算機(jī)檢索。第1章

信息檢索基礎(chǔ)1.4

計算機(jī)信息檢索技術(shù)1.4.1計算機(jī)信息檢索概述

計算機(jī)信息檢索就是指人們利用計算機(jī)設(shè)備和通訊網(wǎng)絡(luò),與計算機(jī)信息檢索系統(tǒng)相連接,使用系統(tǒng)特定的檢索指令、檢索詞和檢索策略,從計算機(jī)檢索系統(tǒng)的數(shù)據(jù)庫中檢索出所需信息的過程。

計算機(jī)信息檢索從最初的單臺計算機(jī)的簡單文件檢索發(fā)展到現(xiàn)在已是網(wǎng)絡(luò)環(huán)境下海量數(shù)據(jù)的信息檢索。海量信息存儲使信息的時間跨度越來越寬,網(wǎng)絡(luò)環(huán)境又使信息傳輸?shù)目臻g越來越廣,信息更新速度變得更快。第1章

信息檢索基礎(chǔ)1.計算機(jī)信息檢索系統(tǒng)構(gòu)成(1)硬件部分 它是系統(tǒng)采用的各種硬設(shè)備的總稱,主要包括具有一定性能的主計算機(jī)、外圍設(shè)備(包括外部存儲器、輸入輸出設(shè)備等)以及與數(shù)據(jù)處理或數(shù)據(jù)傳遞有關(guān)的其他設(shè)備。(2)軟件部分 它是計算機(jī)檢索系統(tǒng)中有關(guān)程序和各種文件資料的總稱,包括系統(tǒng)軟件和應(yīng)用軟件。(3)數(shù)據(jù)庫 按數(shù)據(jù)庫包括的信息內(nèi)容可分為參考數(shù)據(jù)庫、源數(shù)據(jù)庫和混合數(shù)據(jù)庫。第1章

信息檢索基礎(chǔ)2.計算機(jī)信息檢索類型(1)聯(lián)機(jī)檢索

國際聯(lián)機(jī)檢索就是用戶使用終端設(shè)備,通過通信線路,運(yùn)用一些特定的檢索指令和檢索策略從存儲了大量信息的國際聯(lián)機(jī)檢索中心迅速而準(zhǔn)確地獲取數(shù)字文獻(xiàn)信息資源,并將檢索過程與結(jié)果下載、顯示和打印出來的過程。(2)光盤檢索

光盤是一種用激光記錄和讀取信息的盤片,具有容量大、保存時間長、成本低等優(yōu)點(diǎn)。光盤檢索系統(tǒng)中目前使用最為成熟的是只讀光盤(CD—ROM),檢索軟件及數(shù)據(jù)存儲在盤片上,利用計算機(jī)和光盤驅(qū)動器進(jìn)行檢索。(3)網(wǎng)絡(luò)檢索Intenet是網(wǎng)絡(luò)通過互聯(lián)而形成的全球網(wǎng)。第1章

信息檢索基礎(chǔ)1.4.2計算機(jī)檢索技術(shù)1.布爾邏輯檢索

布爾邏輯檢索是通過布爾邏輯算符,把一些具有簡單概念的檢索詞或檢索項組配成為一個具有復(fù)雜概念的檢索式,用以表達(dá)用戶的信息檢索要求。布爾邏輯算符①邏輯與;②邏輯或;③邏輯非。第1章

信息檢索基礎(chǔ)圖1-4邏輯與圖1-5邏輯或圖1-6邏輯非2.截詞檢索

截詞檢索,就是指在檢索詞的適當(dāng)位置截斷,用截斷的詞的一個局部進(jìn)行的檢索,并認(rèn)為凡滿足這個詞局部中的所有字符(串)的文獻(xiàn),都為命中文獻(xiàn)。3.位置檢索

位置檢索是使用位置算符來規(guī)定各個檢索詞在文獻(xiàn)記錄中的相對位置關(guān)系。(1)詞間位置檢索;(2)自然句檢索;(3)同字段檢索。4.字段限制檢索

數(shù)據(jù)庫設(shè)置的可供檢索的字段通常有兩種:表達(dá)文獻(xiàn)主題內(nèi)容特征的基本字段和表達(dá)文獻(xiàn)外部特征的輔助字段。第1章

信息檢索基礎(chǔ)1.5

信息檢索的途徑與方法1.5.1信息檢索途徑

檢索途徑又稱檢索點(diǎn),是通過文獻(xiàn)的特征標(biāo)識檢索所需的文獻(xiàn)的

過程。也就是用什么作為檢索標(biāo)識并通過檢索系統(tǒng)查到所需的信息。1.檢索途徑(1)分類途徑

利用分類途徑查找文獻(xiàn)首先是從分類表中查到所查文獻(xiàn)主題的所屬類目及分類號,再用分類號去查文獻(xiàn),因此,利用分類途徑查找文獻(xiàn)關(guān)鍵要掌握分類法。

分類途徑的優(yōu)點(diǎn):便于族性檢索。缺點(diǎn):對于新興學(xué)科、邊緣學(xué)科的文獻(xiàn)查找不便;主題概念與分類號的轉(zhuǎn)換易出差錯,造成漏檢或誤檢。第1章

信息檢索基礎(chǔ)(2)主題途徑

它是直接利用所查文獻(xiàn)主題概念的主題詞,在主題索引中按主題詞的字母順序查找文獻(xiàn)的一種途徑。

主題途徑的優(yōu)點(diǎn):用主題詞作為檢索入口概念表達(dá)靈活、直接、能把同一內(nèi)容的文獻(xiàn)集中在一起,便于特性檢索。缺點(diǎn):不能進(jìn)行族性檢索,對學(xué)科或?qū)I(yè)無法一覽全貌。(3)著者途徑它是根據(jù)已知著者姓名在著者索引中按姓在前,名在后(個別數(shù)據(jù)庫除外,參見檢索幫助)查找文獻(xiàn)的一種途徑。若把著者途徑與主題途徑分類途徑配合使用,會取得較好的檢索效果。第1章

信息檢索基礎(chǔ)(4)其它途徑

篇名途徑。按照書名、刊名等文章的題目查找文獻(xiàn)的途徑就是篇名途徑。使用的檢索工具有“圖書書名目錄”、“期刊刊名目錄”、“會議資料索引”等目錄或索引。這類檢索工具一般都按圖書、期刊、資料的名稱字順編排,多用于查找館藏圖書和期刊。②序號途徑。這是根據(jù)特定號碼等查找文獻(xiàn)的途徑。

序號途徑包括報告號、標(biāo)準(zhǔn)號、專利號、登記號等途徑。使用的檢索工具有“報告號索引”、“標(biāo)準(zhǔn)號索引”、“專利號索引”、“登記號索引”等。

③分子式途徑。這是以化學(xué)物質(zhì)的分子式作為檢索標(biāo)識來查找文獻(xiàn)的途徑,使用檢索工具中的“分子式索引”。第1章

信息檢索基礎(chǔ)2.選則檢索途徑的原則

第一,根據(jù)待查課題的已知條件選擇,若已知文獻(xiàn)的著者、號碼、分子式和地名等可利用相應(yīng)索引迅速有效地查獲所需文獻(xiàn),同時還可以通過上述途徑間接核準(zhǔn)確切的分類號或主題詞。

第二,根據(jù)檢索系統(tǒng)和數(shù)據(jù)庫的具體情況選擇檢索途徑,即所使用的檢索系統(tǒng)和數(shù)據(jù)庫本身可能提供的途徑有幾種。一般來說,為了進(jìn)行深入全面的檢索,往往是以主題途徑

或者分類途徑作為主要檢索途徑。第三,查找文獻(xiàn)時,可綜合利用各種途徑,以便取長補(bǔ)短。第1章

信息檢索基礎(chǔ)1.5.2信息檢索方法1.檢索方法的種類(具體見教材)2.檢索方法及特點(diǎn)(1)追溯法追溯法分為傳統(tǒng)追溯法和引文追溯法。(2)常用法常用法分順查法、倒查法、抽查法三種。(3)循環(huán)法又稱分段法。第1章

信息檢索基礎(chǔ)3.選用檢索方法的原則(1)檢索條件:檢索條件是指是否有充分的檢索工具可用。

(2)檢索要求:檢索要求是指準(zhǔn)、快、全,這三者之間是互相制約的,難以兼得。若以全、準(zhǔn)為主,應(yīng)采用順查法。若以快、準(zhǔn)為主,宜用倒查法。倒查法也適用于新興的課題研究。

(3)學(xué)科發(fā)展特點(diǎn):選擇檢索方法還必須考慮課題的學(xué)科發(fā)展特點(diǎn)。檢索課題屬于新興年輕學(xué)科,起始年代不太長,可采用順查法,也可采用倒查法;檢索課題屬于較老課題,起始年代較早,或無從考查,則可采用倒查法;如果對某學(xué)科進(jìn)行全面文獻(xiàn)普查,則可采用順查法:有的學(xué)科在一定的年代里處于興旺發(fā)展時期,文獻(xiàn)發(fā)表得特別多,則在該時期內(nèi)采用抽查法檢索效果好。第1章

信息檢索基礎(chǔ)1.6

信息檢索步驟1.分析檢索課題

分析和研究檢索課題是信息檢索的根本出發(fā)點(diǎn),也是信息檢索效率高低和成敗的關(guān)鍵。實(shí)施檢索前,必須對檢索課題進(jìn)行認(rèn)真分析和研究,其目的是確定檢索標(biāo)識、選擇檢索系統(tǒng)和數(shù)據(jù)庫。2.選擇檢索系統(tǒng)和數(shù)據(jù)庫

在全面分析檢索課題的基礎(chǔ)上,根據(jù)課題的主題范圍、信息類型、時間范圍等因素綜合考慮后,選擇檢索系統(tǒng)和數(shù)據(jù)庫。正確選擇數(shù)據(jù)庫,是保證檢索成功的基礎(chǔ)。第1章

信息

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論