信息檢索與利用(第三版)課件 第2章 文獻信息檢索基礎(chǔ)_第1頁
信息檢索與利用(第三版)課件 第2章 文獻信息檢索基礎(chǔ)_第2頁
信息檢索與利用(第三版)課件 第2章 文獻信息檢索基礎(chǔ)_第3頁
信息檢索與利用(第三版)課件 第2章 文獻信息檢索基礎(chǔ)_第4頁
信息檢索與利用(第三版)課件 第2章 文獻信息檢索基礎(chǔ)_第5頁
已閱讀5頁,還剩54頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

2.1文獻信息概述

2.2文獻信息檢索2.1文獻信息概述2.1.1信息、知識、情報、文獻1.信息信息一詞來源于拉丁文informatio,原意是通知、報道或消息。作為一個科學(xué)概念,信息在19世紀(jì)末最早出現(xiàn)在通信領(lǐng)域,是指通信系統(tǒng)傳輸和處理的對象。信息奠基人香農(nóng)認(rèn)為“信息是用來消除不確定性的東西”。控制論創(chuàng)始人維納認(rèn)為“信息是人們在適應(yīng)外部世界,并使這種適應(yīng)反作用于外部世界的過程中,同外部世界進行互相交換的內(nèi)容和名稱”。這兩個定義常被作為經(jīng)典定義加以引用。根據(jù)近年來人們對信息的研究成果,科學(xué)的信息概念可以概括為:信息是對客觀世界中各種事物的運動狀態(tài)和變化的反映,是客觀事物之間相互聯(lián)系和相互作用的表征,表現(xiàn)的是客觀事物運動狀態(tài)和變化的實質(zhì)內(nèi)容。利用文字、符號、聲音、圖形、圖像等形式,通過各種渠道傳播的信號、消息、情報或報道等內(nèi)容,都可以稱之為信息。一般認(rèn)為,信息具有如下特點:(1)普遍性和客觀性。(2)存儲性、傳遞性與依附性。(3)共享性。(4)時效性。(5)價值相對性。2.知識知識是與信息相聯(lián)系又有區(qū)別的概念。信息反映了客觀事物存在及變化的情況,是對客觀事物存在及變化情況的反映、刻畫、描述、標(biāo)識和度量。知識是主體獲得的系統(tǒng)化、組織化了的信息。知識反映了主體對客觀事物存在及變化的內(nèi)在規(guī)定性的認(rèn)識,是主體獲得的與事物存在及變化內(nèi)在規(guī)定性有關(guān)的結(jié)構(gòu)化、系統(tǒng)化的信息,是信息的高級表現(xiàn)形式。3.情報情報是指被傳遞的知識或事實,是知識的激活,是通過一定的載體,越過空間和時間傳遞給特定用戶,解決科研和生產(chǎn)中的具體問題所需要的特定知識和信息。情報既不等同于知識也不等同于信息,它是為實現(xiàn)主體某種特定目的,有意識地對有關(guān)的事實、數(shù)據(jù)、信息、知識等要素進行勞動加工的產(chǎn)物。目的性、傳遞性和效用性是情報最基本的屬性。4.文獻國際標(biāo)準(zhǔn)化組織制定的《文獻情報術(shù)語國際標(biāo)準(zhǔn)》(ISO/DIS5217)中對文獻的定義是:“文獻是在存儲、檢索、利用或傳遞記錄信息的過程中,可作為一個單元處理的,在載體內(nèi)、載體上或依附載體而存儲有信息或數(shù)據(jù)的載體”。中國國家標(biāo)準(zhǔn)《文獻著錄總則》(GB/T3792.1—2009)對文獻的定義是“記錄有知識的一切載體”。文獻由4個要素構(gòu)成:(1)信息內(nèi)容,即文獻所記錄的知識和信息,這是文獻的靈魂。(2)符號系統(tǒng),即記錄知識和信息的符號。(3)物質(zhì)載體,即用于記錄知識和信息的物質(zhì)載體,如紙張、膠卷等,它們是文獻的外在形式。(4)記錄方式,如鑄刻、書寫、印刷、復(fù)制、錄音錄像等,它們是知識、信息與載體的聯(lián)系方式。知識和信息是文獻的內(nèi)容,符號系統(tǒng)是知識和信息的攜帶者,載體是符號賴以依附的“寄主”,而記錄方式則是代表知識和信息的符號進入載體的方法和過程,這四個要素缺乏任何一項都不可能形成文獻。2.1.2文獻分類文獻信息的形式多種多樣,人們?yōu)榱吮阌趯W(xué)習(xí)和利用,根據(jù)不同的標(biāo)準(zhǔn)對文獻進行了歸類和劃分。1.根據(jù)存儲載體和記錄形式劃分1)手寫型

2)印刷型

3)縮微型:是以感光材料為載體,利用光學(xué)技術(shù)將文字、圖形、影像等信息符號按比例縮小的文獻形式,包括縮微膠卷等。縮微型文獻閱讀時需要較復(fù)雜的設(shè)備來支持,它們具有體積小、信息密度高、便于收藏和保存、價格便宜等優(yōu)點。例如,微縮膠片在溫度21℃、濕度50%的條件下,至少可以保存500年。因此,縮微型文獻常用于保存一些珍貴資料。4)聲像型

5)數(shù)字型

2.根據(jù)內(nèi)容性質(zhì)和加工程度劃分1)零次文獻

零次文獻是指未經(jīng)出版發(fā)行的文獻,主要包括手稿、個人通信和原始記錄等。零次文獻內(nèi)容比較客觀,但具有不成熟、零散、不公開交流等缺點。2)一次文獻

一次文獻又稱為原始文獻,是人們對研究或創(chuàng)造性活動成果的直接記錄,一般指公開出版的著作、期刊論文、科技報告、會議文獻、學(xué)位論文、發(fā)明專利等。一次文獻記載的信息零碎、分散、無序,但同時它們也具有新穎性、創(chuàng)造性和系統(tǒng)性等特征,參考和使用的價值較高。3)二次文獻

二次文獻是指通過科學(xué)的方法,將分散無序的一次文獻經(jīng)過篩選、分析、整理,按其內(nèi)容特征和外部特征進行提煉、濃縮,編制而成的有系統(tǒng)的文獻,主要包括目錄、文摘、索引等。二次文獻具有濃縮性、匯集性、有序性等特點,它們的形成是從分散、無序到集中、有序化的書目控制過程。4)三次文獻

三次文獻是通過二次文獻提供的線索,對某一范圍的一次文獻進行分析、綜合研究、歸納、整理等深加工所生成的文獻,如述評、百科全書、專題報告、年鑒、手冊、字典等。三次文獻具有資料性和實用性等特點,是對一次文獻進行濃縮、提煉和重新組織的結(jié)果。

零次文獻是最原始的信息資源,雖未公開交流,但它們是生成一次文獻信息的主要素材;一次文獻是最主要的信息資源,是人們檢索和利用的主要對象;二次文獻是對一次文獻信息的集中提煉和有序化,是檢索一次文獻信息的工具,故又稱檢索工具;三次文獻是按知識門類或?qū)n}將一次文獻信息重新組織、高度濃縮而成的,是人們查考數(shù)據(jù)信息和事實信息的主要信息源。一次、二次、三次文獻的關(guān)系如圖2-1所示。3.根據(jù)出版形式劃分根據(jù)出版形式,文獻通常劃分為圖書、連續(xù)出版物、特種文獻三大類,如圖2-2所示。1)圖書

圖書是對已有研究成果、生產(chǎn)技術(shù)知識、實踐經(jīng)驗的論述和概括。圖書的內(nèi)容相對成熟、系統(tǒng)、全面,有目次表和索引,查閱方便,是傳播知識的重要工具。但是由于圖書的出版周期較長,其知識新穎性不夠。2)連續(xù)出版物

連續(xù)出版物一般是指定期或不定期連續(xù)出版的刊物,包括期刊、報紙、年度出版物(年鑒、指南等)以及成系列的報告、學(xué)會會刊和會議錄等。連續(xù)出版物內(nèi)容新穎,出版周期短、速度快,能及時反映最新知識、最新科研成果和最新時事。3)特種文獻

特種文獻通常指那些出版發(fā)行方式或獲取途徑比較特殊的文獻。特種文獻內(nèi)容新穎廣泛,涉及科學(xué)技術(shù)、生產(chǎn)生活的各個領(lǐng)域。其類型復(fù)雜多樣,主要包括專利文獻、標(biāo)準(zhǔn)文獻、會議文獻、學(xué)位論文、科技報告、政府出版物、產(chǎn)品樣本資料和檔案文獻等。專利文獻蘊含著大量的技術(shù)、法律和經(jīng)濟信息,是記錄有關(guān)發(fā)明創(chuàng)造信息的文獻。專利文獻通常包括專利說明書、專利公告、專利檢索工具以及其他與專利有關(guān)的法律文件等,其中專利說明書是主體。具有及時性、新穎性、詳盡性、系統(tǒng)性、實用性、可靠性等特征。標(biāo)準(zhǔn)文獻是對工農(nóng)業(yè)產(chǎn)品和工程建設(shè)的質(zhì)量、規(guī)格、檢驗方法及其技術(shù)要求等方面做出統(tǒng)一規(guī)定的規(guī)范性文獻。標(biāo)準(zhǔn)文獻須經(jīng)權(quán)威機構(gòu)批準(zhǔn),因而具有一定的法律約束力。對產(chǎn)品和工程設(shè)計人員來說,標(biāo)準(zhǔn)文獻是不可缺少的參考資料。會議文獻是在各種會議上宣讀和交流的論文、報告和其他有關(guān)資料,其特點是傳遞情報比較及時,內(nèi)容新穎,專業(yè)性和針對性強。會議文獻質(zhì)量較高,能及時反映科學(xué)技術(shù)中的新發(fā)現(xiàn)、新成果、新成就以及學(xué)科發(fā)展趨勢。學(xué)位論文是高等院?;蜓芯繖C構(gòu)的學(xué)生為取得學(xué)位,在導(dǎo)師指導(dǎo)下完成的科學(xué)研究、科學(xué)試驗的書面報告。學(xué)位論文所探討的問題比較專門和系統(tǒng),具有一定的獨創(chuàng)性、新穎性、科學(xué)性和較強的專業(yè)性,其質(zhì)量要經(jīng)過學(xué)位或?qū)W術(shù)委員會的考核。此外,學(xué)位論文一般不公開發(fā)行,需要通過專門的渠道才能獲取原文。根據(jù)學(xué)位的不同,學(xué)位論文分為學(xué)士論文、碩士論文、博士論文三種??萍紙蟾媸菍茖W(xué)、技術(shù)研究結(jié)果的報告或研究進展的記錄??萍紙蟾孀⒅卦敿?xì)記錄科研進展的全過程,是科技人員交流其研究活動及成果的重要手段,其種類有技術(shù)報告、札記、論文、備忘錄、通報等。特點是較快反映新技術(shù)、新學(xué)科,大部分屬于保密和控制發(fā)行的文獻。目前全球每年約有10萬種科技報告產(chǎn)生,其中以美國商務(wù)出版局的PB報告、美國軍事國防部的AD報告、美國宇航部門的NASA報告、美國能源部的DOE報告最為著名??萍紙蟾嬖谝欢ǔ潭壬戏从沉艘粋€國家或某一個學(xué)科的科研水平,是不可多得的信息源。政府出版物是由政府部門及其設(shè)立的專門機構(gòu)發(fā)布出版的文獻信息資料,主要包括政府報告、政策法令、規(guī)章制度、會議紀(jì)要、調(diào)查統(tǒng)計資料等。政府出版物的主要特點是正式、權(quán)威、材料充實、數(shù)據(jù)可靠。它們是了解各國政治、經(jīng)濟、科學(xué)技術(shù)的方針政策及其發(fā)展?fàn)顩r的權(quán)威性信息來源。產(chǎn)品樣本資料是對定型產(chǎn)品的性能、構(gòu)造和原理、用途、使用方法及操作規(guī)程、產(chǎn)品規(guī)格等所做的具體說明,是進行技術(shù)革新、設(shè)備改造、試制新產(chǎn)品的重要技術(shù)參考資料。產(chǎn)品樣本一般圖文并茂、形象直觀、可靠性強、出版發(fā)行迅速,更新及時。產(chǎn)品樣本資料的產(chǎn)品和技術(shù)信息比較完整,但多不提供詳細(xì)數(shù)據(jù)和理論依據(jù)。檔案文獻是國家機構(gòu)、社會組織以及個人從事政治、軍事、經(jīng)濟、科學(xué)、技術(shù)、文化、宗教等活動形成的具有保存價值的各種文字、圖表、聲像等不同形式的歷史記錄,是完成傳達、執(zhí)行、使用或記錄現(xiàn)行使命而備留查考的文件材料。按內(nèi)容,檔案可分為文書檔案、人事檔案、會計檔案、科研檔案、產(chǎn)品檔案、工程檔案等;從文獻形式上看,檔案包括了信函、日記、賬簿、報告、照片、地圖、圖樣、協(xié)議書、備忘錄、會議記錄、契約、布告、通知、履歷表等。4.根據(jù)獲得的難易程度劃分1)白色文獻白色文獻指一切正式出版并在社會上公開流通的文獻,包括圖書、報紙、期刊等。白色文獻通過出版社、書店、郵局等正規(guī)渠道公開發(fā)行,向社會所有成員公開。2)灰色文獻灰色文獻指非公開發(fā)行的內(nèi)部文獻和限制流通的文獻,包括社會公開傳播的內(nèi)部刊物、內(nèi)部技術(shù)報告、內(nèi)部教材和會議資料等?;疑墨I出版量小,發(fā)行渠道復(fù)雜,流通范圍有一定限制,不易收集。3)黑色文獻黑色文獻包括兩方面的文獻,一是未破譯和未辨識其中信息的文獻,如考古發(fā)現(xiàn)的未經(jīng)分析厘定的古老文字;二是處于保密狀態(tài)和不宜公布其內(nèi)容的文獻,如未解密的政府文件、內(nèi)部檔案、個人日記、私人信件等。黑色文獻除作者及特定人員外,一般社會成員極難獲得和利用。2.1.3文獻信息服務(wù)系統(tǒng)

文獻信息服務(wù)機構(gòu)是文獻信息資源的最大集散地,它們負(fù)責(zé)搜集、整理、存儲、傳遞各種文獻信息。在互聯(lián)網(wǎng)日益普及的今天,國內(nèi)外文獻信息服務(wù)機構(gòu)通過網(wǎng)絡(luò)提供各類數(shù)據(jù)庫信息服務(wù)和網(wǎng)上虛擬館藏信息服務(wù),促進了信息資源的社會共享。我國的文獻信息服務(wù)機構(gòu)主要有圖書館系統(tǒng)、科技信息服務(wù)系統(tǒng)、專利文獻服務(wù)系統(tǒng)、標(biāo)準(zhǔn)文獻服務(wù)系統(tǒng)和檔案館系統(tǒng)。它們之間有著密切的聯(lián)系,又有各自不同的服務(wù)重點與服務(wù)對象。1.圖書館系統(tǒng)

圖書館是對文獻進行搜集、整理、保管并提供服務(wù)的科學(xué)、教育、文化機構(gòu),其主要任務(wù)是整理和傳遞科學(xué)信息,進行社會教育,搜集和保存人類文化遺產(chǎn)。圖書館入藏的文獻以的圖書和期刊為主,主要服務(wù)方式有文獻外借服務(wù)、文獻閱覽服務(wù)、文獻復(fù)制服務(wù)、信息咨詢與檢索服務(wù)、用戶教育與輔導(dǎo)、信息研究服務(wù)、網(wǎng)上信息服務(wù)等。隨著數(shù)字化信息的應(yīng)用深入到各個領(lǐng)域,數(shù)字圖書館正在成為社會的公共信息中心和樞紐。2.科技信息服務(wù)系統(tǒng)科技信息服務(wù)系統(tǒng)主要負(fù)責(zé)搜集、整理、研究和傳遞各種專業(yè)性學(xué)術(shù)信息,收藏各種類型的專業(yè)性文獻,為各級領(lǐng)導(dǎo)提供調(diào)研及決策信息,為專利申請或科技成果申報進行查新服務(wù),進行科技成果轉(zhuǎn)讓及推廣服務(wù),編譯專題資料等。我國有一個龐大的科技信息服務(wù)系統(tǒng),它們分別隸屬于不同的部門。其中最高級別的是隸屬科技部的中國科技信息研究所,其次是隸屬于各省、市的科技信息研究所,以及隸屬國務(wù)院各部委的專業(yè)性科技信息研究所,如機械工業(yè)信息研究所、中國國防科技信息所、航天部航天信息中心等。3.專利文獻服務(wù)系統(tǒng)專利文獻系統(tǒng)是國家科技信息體系的重要組成部分。專利文獻中心是從事專利文獻的收集、存儲、加工、檢索和服務(wù)的專門機構(gòu)。我國專利文獻服務(wù)工作主要由中國專利文獻服務(wù)中心(國家知識產(chǎn)權(quán)局專利局文獻館)以及各地的專利代理機構(gòu)(通常掛靠在各省科技信息研究所)負(fù)責(zé)。中國專利文獻服務(wù)中心負(fù)責(zé)收集、管理專利文獻,并向用戶提供專利文獻的檢索和復(fù)制服務(wù)等。另外,它還收藏世界各國和國際組織的專利說明書及中國的專利說明書。各地的專利代理機構(gòu)(專利事務(wù)所)主要承辦專利咨詢、專利申請、專利查新、專利文獻檢索、專利技術(shù)轉(zhuǎn)讓等工作。4.標(biāo)準(zhǔn)文獻服務(wù)系統(tǒng)標(biāo)準(zhǔn)文獻服務(wù)系統(tǒng)由中國標(biāo)準(zhǔn)化研究院國家標(biāo)準(zhǔn)館和各省、市標(biāo)準(zhǔn)化研究院(所)下設(shè)的標(biāo)準(zhǔn)館以及國內(nèi)相關(guān)標(biāo)準(zhǔn)文獻收藏機構(gòu)組成。國家標(biāo)準(zhǔn)館隸屬中國標(biāo)準(zhǔn)化研究院,是我國唯一的國家級標(biāo)準(zhǔn)文獻、圖書、情報的館藏、研究和服務(wù)機構(gòu),是國家標(biāo)準(zhǔn)化管理委員會的基礎(chǔ)信息支撐機構(gòu)。國家標(biāo)準(zhǔn)館是國家標(biāo)準(zhǔn)文獻中心,負(fù)責(zé)全面收集、整理、存儲我國的國家標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)和企業(yè)標(biāo)準(zhǔn),收藏國際標(biāo)準(zhǔn)以及有選擇性地收藏世界各國的標(biāo)準(zhǔn)文獻,并提供標(biāo)準(zhǔn)文獻的信息服務(wù)。各省、市的科技情報所、各種專業(yè)圖書館和標(biāo)準(zhǔn)頒布單位一般均收藏有部分標(biāo)準(zhǔn)文獻。5.檔案館系統(tǒng)檔案館是檔案史料的服務(wù)中心,負(fù)責(zé)檔案資料的收集、整理、保管并提供給社會使用。我國檔案館大致可分為國家檔案館、地方檔案館、專門性檔案館和基層單位檔案室等。通常情況下,各種類型文獻的主要收藏機構(gòu)如表2-1所示。隨著我國科學(xué)技術(shù)的發(fā)展,傳統(tǒng)的文獻信息收藏與服務(wù)體系已難以滿足社會需求,一批商業(yè)化的科技信息服務(wù)提供商應(yīng)運而生,將大量商品化的科技文獻信息數(shù)據(jù)庫推向市場,使用戶足不出戶就可輕松獲取所需的科技信息。2.2文獻信息檢索2.2.1文獻信息檢索的概念廣義的文獻信息檢索,包括信息的組織和查找兩個過程。文獻信息的組織過程包括信息的描述、標(biāo)引、整序等過程。信息描述就是對文獻信息的外部特征進行分析提取,然后對這些特征加以規(guī)范化記錄。信息標(biāo)引就是對信息內(nèi)容進行分析,并將其充分而有效地進行提煉標(biāo)示的過程。信息整序就是把獲得的信息的外部特征和內(nèi)容特征按照一定的規(guī)則有順序地組織起來。文獻信息的查找過程包括:用戶對所需信息內(nèi)容進行特征描述;構(gòu)成檢索式或檢索指令向信息檢索系統(tǒng)進行提問;按照一定的檢索技術(shù)將檢索式與檢索系統(tǒng)信息源單元進行比較匹配;以一定標(biāo)準(zhǔn)將匹配度較高者作為檢索結(jié)果輸出。文獻信息檢索原理如圖2-3所示。

由以上兩個過程可以看出,文獻信息的組織過程就是建立信息檢索系統(tǒng)的過程,而信息的查找過程就是從信息集合中找出所需信息的過程。

組織是檢索的前提,只有經(jīng)過組織的有序的信息集合才能被檢索利用,查找則是組織的反過程。組織與查找是相輔相成、相互依存的辯證關(guān)系。

文獻信息檢索是以文獻信息的存儲與查找所依據(jù)的規(guī)則基本一致為基礎(chǔ)的,為保證文獻檢索的順利進行,必須使文獻信息存儲與查找所依據(jù)的規(guī)則一致。2.2.2文獻信息檢索的語言信息檢索語言又稱情報語言、情報存儲與檢索語言、標(biāo)引語言等,是根據(jù)檢索的需要而創(chuàng)制的人工語言,是用于描述信息系統(tǒng)中信息的內(nèi)部特征和外部特征及表達信息用戶提問需求的一種專門語言。1.檢索語言的作用檢索語言用于信息檢索系統(tǒng)與檢索用戶的溝通。一定程度上規(guī)范用戶的檢索行為,使不同的檢索用戶遵循相同的檢索規(guī)范。有了統(tǒng)一的檢索語言的支持,所建立的信息檢索系統(tǒng)才具有可檢索性,才能理解用戶發(fā)出的檢索指令,并將符合用戶信息需求的那部分信息作為檢索結(jié)果遞交給用戶。檢索語言的作用體現(xiàn)在以下方面:對文獻、信息的特征進行描述及規(guī)范化的標(biāo)引;集中特定信息檢索系統(tǒng)中的具有相關(guān)性的文獻、信息;實現(xiàn)對海量文獻與信息源的有序化處理;將檢索用語與標(biāo)引用語進行相符性比較。2.檢索語言的類型

(1)根據(jù)檢索語詞的規(guī)范化程度,檢索語言可分為人工語言和自然語言。①

人工語言。人工語言又稱規(guī)范化語言,即把檢索語言中各種同義詞、多義詞、同形異義詞做規(guī)范化處理,使每個詞表達一個概念。②

自然語言。自然語言是直接從原始信息中抽取的未經(jīng)規(guī)范化處理的,用以揭示信息主題概念的自由詞。除一般的事物名稱、科學(xué)術(shù)語外,自然語言還包括俗名、商品型號和縮寫等。自由詞具有較大的靈活性,專指性強,能及時反映最新的概念和規(guī)范詞難以表達的特定概念。其不足是缺乏對詞匯的控制能力,也無法指示概念之間的關(guān)系,存在大量同義詞、多義詞現(xiàn)象和含義模糊現(xiàn)象,容易造成誤檢和漏檢。通常主題語言中的關(guān)鍵詞和單元詞屬于自然語言。(2)按組配方式,檢索語言可分為先組式語言和后組式語言。①

先組式語言。先組式語言指在文獻信息檢索之前,表達文獻信息內(nèi)容的標(biāo)識已經(jīng)事先組配好了的信息檢索語言,用戶只能用固定好的檢索詞組形式去完成檢索。先組式語言有較好的直接性和專指性,但靈活度差,如標(biāo)題詞語言。②

后組式語言。后組式語言指表達文獻主題概念的標(biāo)識,在編制檢索語言詞表和標(biāo)引文獻時,不曾預(yù)先規(guī)定組配關(guān)系,而是在進行檢索時,用戶根據(jù)檢索需要,按照組配規(guī)則臨時組配起來的信息檢索語言。(3)按描述文獻的特征,檢索語言可分為描述文獻外部特征的檢索語言和描述文獻內(nèi)容特征的檢索語言,如圖2-4所示。①

描述文獻外部特征的檢索語言。文獻外部特征主要是指文獻的題名、責(zé)任者(個人/團體)、出版者和號碼(如報告號、專利號)等。描述文獻外部特征的檢索語言將文獻的這些不同特征按一定的順序排列,形成文獻的不同檢索途徑,來滿足用戶的檢索需要。②

描述文獻內(nèi)容特征的檢索語言。該類檢索語言指描述文獻論述的主題、觀點、見解和結(jié)論等的檢索語言,如常用的分類語言、主題語言和引文語言都是描述文獻內(nèi)容特征的檢索語言。分類語言是按學(xué)科范疇劃分事物而構(gòu)成的一種檢索語言體系。分類語言集中反映學(xué)科的系統(tǒng)性,反映事物之間的相關(guān)、從屬、派生等關(guān)系,并從總體到局部分層、分面展開,最終形成分類體系。具體而言,分類語言以學(xué)科分類為基礎(chǔ),按照概念劃分的原理,將知識概念從總體到個體,從一般到特殊、從全部到局部逐級劃分,每劃分一次就形成一批并列的知識概念。分類語言以分類法的形式來體現(xiàn),其特點是用分類號來表達各種概念,把各種概念按學(xué)科分類進行系統(tǒng)組織和排列。分類法有利于系統(tǒng)掌握某一學(xué)科或?qū)I(yè)范圍的信息。主題是指文獻具體論述的對象和研究的問題。主題語言是以代表文獻內(nèi)容特征和科學(xué)概念的詞語作為檢索標(biāo)識,并按字順排列組織起來的一種檢索語言。按選詞原則,主題語言又分為標(biāo)題詞語言、單元詞語言、敘詞語言和關(guān)鍵詞語言四種。標(biāo)題詞語言是用經(jīng)過規(guī)范化處理的名詞術(shù)語來表達文獻所論及的事物或主題,并將全部標(biāo)題詞按字順排列起來而形成的一種檢索語言。標(biāo)題詞語言是使用最早的一種主題語言,它的檢索標(biāo)志是在編制主題詞表時已組配好的,這種固定組配的主題語言通常被稱為“先組式”主題語言。單元詞又稱元詞,它是從信息中抽取出來的最基本的、在字面上不能再分的、具有獨立概念的各名詞術(shù)語。單元詞語言是通過若干單元詞的組配來表達復(fù)雜的主題概念的,其組配是靈活進行的,不是預(yù)先規(guī)定好的,屬于后組式檢索語言。敘詞語言是以敘詞(即主題詞)作為文獻內(nèi)容標(biāo)識和檢索依據(jù)的主題語言。敘詞語言是采用表示單元概念的規(guī)范化語詞的組配來對文獻內(nèi)容主題進行描述的檢索語言,也是目前使用最廣泛的主題語言。敘詞語言是多種語言的綜合應(yīng)用,它的基本功能是概念組配,因此敘詞語言屬于后組式檢索語言。關(guān)鍵詞語言是將文獻中原有的、能描述其主題概念的、具有檢索意義的詞匯抽出,并按字順排列起來的檢索語言。由于關(guān)鍵詞不加規(guī)范,所以容易標(biāo)引、快速、客觀,適用于目的性不強的瀏覽性查找。目前大多數(shù)搜索引擎使用的都是關(guān)鍵詞語言,而學(xué)科信息門戶使用的多為規(guī)范主題語言。引文索引法主要利用文獻與文獻之間的相互引證關(guān)系來組織信息,即以一些文獻作為標(biāo)引詞,來標(biāo)引和檢索另一些文獻。引文語言無詞表,標(biāo)引詞為文獻中的主要著錄項目,屬后組式檢索語言。代碼語言是指用某種代碼系統(tǒng)來表示和排列事物的某方面特征,并提供檢索的一種語言。例如,根據(jù)化合物的分子式這種代碼語言,可以構(gòu)成分子式索引系統(tǒng)。用戶可從分子式出發(fā),檢索相應(yīng)的化合物及與其相關(guān)的文獻信息。2.2.3文獻信息檢索的工具1.手工檢索工具手工檢索工具是傳統(tǒng)的檢索工具,主要是各種類型的工具書。根據(jù)體例和功能,工具書可分為檢索類工具書和參考工具書。1)檢索類工具書按著錄內(nèi)容,檢索類工具書可分為目錄、題錄、文摘和索引。目錄通常以文獻的“本”“種”“件”等為單位,是對一批相關(guān)文獻外表特征的揭示和報道,如《全國新書目》《全國總書目》等。題錄是報道和揭示單篇文獻的外表特征,在目錄的基礎(chǔ)上發(fā)展起來的一種檢索工具。它與目錄的主要不同點在于著錄的對象不同,目錄的著錄對象是整部文獻,而題錄的著錄對象是文獻中的論文或部分內(nèi)容,如《化學(xué)題錄》《中文科技期刊題錄數(shù)據(jù)庫》等。文摘是系統(tǒng)著錄、報道、積累與揭示文獻信息外表特征和內(nèi)容特征的檢索工具。它是對文獻中的論文或內(nèi)容進行濃縮,概括地描述其主要論點、數(shù)據(jù)、結(jié)論等要點,并注明其出處,按一定的規(guī)則編排起來的一種檢索工具。文摘又可分為指示性文摘、報道性文摘和評論性文摘三種。索引是將文獻信息中的題名、人名、地名、字句及參考文獻等分別摘錄出來,并注明出處,按一定的規(guī)則編排起來的一種檢索工具,如《經(jīng)濟科學(xué)論文索引》和《社會科學(xué)引文索引》等。2)參考工具書(1)詞語類工具書包括各類字典、詞典,主要提供字詞的形、音、義和使用方法,以及學(xué)科名詞術(shù)語的含義、演變和發(fā)展。(2)資料類工具書能夠為讀者提供各種基本知識或某一課題的具體資料,主要包括百科全書、年鑒、手冊、名錄、類書、政書等。(3)表譜類工具書是以表格或其他較為整齊的形式,記錄史實、時間、地理等資料,并附以簡略的文字說明,以反映史實和時間的一種工具書。它主要包括年表、歷表和專門性歷史表譜三種類型。(4)圖錄類工具書是以圖形、圖像、符號等為主體,附以簡略的文字說明,以反映各種事物、人物的空間特征和形象特征的工具書。它包括地圖、歷史圖錄、文物圖錄、人物圖錄、藝術(shù)圖錄和科技圖像等。(5)邊緣類工具書主要指那些介于工具書與非工具書之間,既具有一般圖書的閱讀功能,又具有工具書的查檢功能的文獻。它主要包括資料匯編、史書、方志等。2.機械檢索工具機械檢索工具是手工檢索工具向計算機檢索系統(tǒng)過渡的中間檢索工具,主要包括機電檢索工具(如打孔機)和光電檢索工具(如縮微機)兩種類型。機械檢索工具利用機械裝置改進了信息資源的存儲和檢索方式,但是它只能對某一固定存儲形式的信息資源進行特定檢索。機械檢索工具過分依賴于設(shè)備,檢索操作復(fù)雜,成本很高,并且檢索質(zhì)量和效率也不理想,所以很快被計算機檢索系統(tǒng)所取代了。3.計算機檢索系統(tǒng)計算機檢索系統(tǒng)是借助計算機技術(shù)、通信技術(shù)、光盤技術(shù)、網(wǎng)絡(luò)技術(shù)等信息技術(shù)建立的存儲和檢索信息的檢索工具。檢索系統(tǒng)由硬件和軟件組成:硬件主要包括計算機主服務(wù)器、檢索終端、數(shù)據(jù)輸出設(shè)備等。軟件主要包括檢索程序和數(shù)據(jù)庫等。檢索軟件負(fù)責(zé)管理數(shù)據(jù)庫和處理檢索提問,決定著系統(tǒng)的檢索能力。數(shù)據(jù)庫是檢索系統(tǒng)的信息源和信息存儲倉庫,是檢索作業(yè)的對象。存儲時,將大量的各種信息以一定的格式加工處理后輸入可供檢索的數(shù)據(jù)庫。檢索時,將符合檢索需求的提問通過檢索終端向檢索系統(tǒng)發(fā)出請求,檢索系統(tǒng)在選定的數(shù)據(jù)庫中執(zhí)行匹配運算,然后將符合要求的檢索結(jié)果按一定的格式輸出。計算機檢索系統(tǒng)一般可分為光盤檢索系統(tǒng)、聯(lián)機檢索系統(tǒng)和網(wǎng)絡(luò)檢索系統(tǒng)等。1)光盤檢索系統(tǒng)光盤檢索系統(tǒng)是指利用計算機、光盤驅(qū)動器和光盤數(shù)據(jù)庫以及檢索軟件建立起來的信息檢索系統(tǒng)。光盤最初是由荷蘭飛利浦公司和日本索尼公司共同研制的密集只讀光盤存儲器,20世紀(jì)80年代中期成功研制出光盤檢索系統(tǒng)。除了單機光盤檢索系統(tǒng),還有由光盤服務(wù)器、計算機局域網(wǎng)、光盤庫或光盤塔、檢索軟件等組成的光盤網(wǎng)絡(luò)檢索系統(tǒng)。根據(jù)光盤刻寫次數(shù),光盤可分為只讀光盤、可寫式光盤和可擦寫磁光盤三大類。與手工檢索相比,光盤檢索的可檢信息量大。光盤檢索功能強大,檢索入口多,檢索速度快,檢索及輸出靈活方便。與聯(lián)機檢索相比,光盤檢索價格低廉,檢索方法簡單容易,規(guī)格統(tǒng)一,容易復(fù)制,便于保存。其缺點是時效性不夠,檢索范圍受光盤數(shù)據(jù)庫的限制,更新不夠及時。2)聯(lián)機檢索系統(tǒng)

聯(lián)機檢索是20世紀(jì)60年代發(fā)展起來的一種提供人機對話的檢索技術(shù),是指用戶利用終端設(shè)備(包括檢索終端、調(diào)制解調(diào)器和打印機),通過國際(衛(wèi)星)通信網(wǎng)絡(luò),與本地計算機檢索系統(tǒng)或遠(yuǎn)程計算機檢索系統(tǒng)的主機連接,從而檢索世界各地存儲在計算機數(shù)據(jù)庫中的信息資料。

聯(lián)機檢索系統(tǒng)是一個典型的由聯(lián)機服務(wù)中心的主計算機、檢索終端、通信網(wǎng)絡(luò)、聯(lián)機數(shù)據(jù)庫、檢索軟件等組成的計算機檢索系統(tǒng),能完成數(shù)據(jù)收集、分析、加工處理、存儲、傳遞通信和檢索信息的全過程。

我國國內(nèi)用戶采用該方法查找國外計算機檢索系統(tǒng)中的信息被稱為國際聯(lián)機檢索。其中著名的國際聯(lián)機檢索系統(tǒng)有Dialog系統(tǒng)、STN系統(tǒng)、ORBIT系統(tǒng)、ESA系統(tǒng)等。聯(lián)機檢索系統(tǒng)主要有回溯檢索、定題檢索、聯(lián)機訂購、電子郵件四種服務(wù)方式。回溯檢索是用戶對檢索系統(tǒng)中積累多年的文獻信息數(shù)據(jù)庫進行檢索,查找一定時間范圍內(nèi)或特定時間以前的文獻信息的一種聯(lián)機檢索方式。通過RS進行專題檢索或情報調(diào)研,可全面系統(tǒng)地了解有關(guān)文獻信息的線索。定題檢索是指在回溯檢索的基礎(chǔ)上,定期從文獻數(shù)據(jù)庫中檢索出回溯檢索之后出現(xiàn)的新的文獻信息的一種聯(lián)機檢索方式。具體地說,它是由檢索人員將用戶的信息需求轉(zhuǎn)換成一定的檢索提問式,存入計算機中,檢索系統(tǒng)定期從新的文獻信息中為用戶檢索,并按用戶指定的格式加以編排和打印的過程。利用SDI服務(wù),用戶可定期獲得所需要的最新信息,及時掌握同類專題的動態(tài)和進展。聯(lián)機檢索的結(jié)果通常是一些文摘或題錄形式的二次文獻。聯(lián)機檢索系統(tǒng)可以為用戶提供原始文獻的聯(lián)機訂購服務(wù),還可為用戶提供E-mail和電子郵件的服務(wù)功能。優(yōu)點是數(shù)據(jù)庫容量大、檢索速度快、途徑多、可共享性好、安全性強。其缺點是檢索系統(tǒng)及文檔(數(shù)據(jù)庫)的收錄、標(biāo)引等規(guī)則較為復(fù)雜,檢索技術(shù)和技巧不易掌握,設(shè)備要求高,檢索費用昂貴等。3)網(wǎng)絡(luò)檢索系統(tǒng)

網(wǎng)絡(luò)檢索主要通過Internet檢索和獲取網(wǎng)上信息。網(wǎng)絡(luò)檢索系統(tǒng)一般由計算機服務(wù)器、用戶終端、通信網(wǎng)絡(luò)、網(wǎng)絡(luò)數(shù)據(jù)庫等組成。

網(wǎng)絡(luò)檢索系統(tǒng)是目前計算機網(wǎng)絡(luò)運行的主流支撐環(huán)境,其特點是方法簡單、靈活、方便、時效性強、費用低。網(wǎng)絡(luò)信息檢索與聯(lián)機檢索系統(tǒng)最根本的不同在于前者是基于客戶機/服務(wù)器的網(wǎng)絡(luò)支撐環(huán)境的。

早期的網(wǎng)絡(luò)檢索工具主要是基于傳輸和下載網(wǎng)上信息的,包括遠(yuǎn)程登錄(Telnet)、文件傳輸服務(wù)(FTP)、電子郵件(E-mail)、電子公告欄(BBS)、新聞組(USENET)等工具。

FTP獲取信息資源的最大問題是查找需要的資料時,必須預(yù)先知道這些資料存放在哪個文件服務(wù)器中,隨著FTP服務(wù)器的增多,這個問題變得越來越嚴(yán)重,于是人們就開發(fā)出Archie、WAIS、Gopher系統(tǒng),以解決尋找FTP資源的困難。

ArchieServer又稱為文檔查詢服務(wù)器,能夠幫助用戶在Internet的FTP服務(wù)器上尋找文件。用戶只要給出所要查找文件的全名或部分名字,ArchieServer就會查找在哪些FTP服務(wù)器上存放著這樣的文件,然后用戶可以使用FTP軟件下載該文件。

WAIS(廣域消息服務(wù))是一種數(shù)據(jù)庫索引查詢服務(wù)。Archie所處理的只是文件名,而WAIS則可以對文件內(nèi)容進行查詢。Gopher是基于菜單驅(qū)動的Internet文本信息檢索工具,提供的信息仍然有限。具有WWW檢索功能的檢索系統(tǒng)是隨著網(wǎng)上海量信息的出現(xiàn)而開發(fā)的,常用的如網(wǎng)絡(luò)數(shù)據(jù)庫檢索系統(tǒng)、搜索引擎、多媒體信息檢索系統(tǒng)等。

4)數(shù)據(jù)庫

數(shù)據(jù)庫(Database,DB)是長期存儲在計算機內(nèi),有組織的、可共享的數(shù)據(jù)集合。數(shù)據(jù)庫中的數(shù)據(jù)按一定的數(shù)據(jù)模型組織、描述和存儲,具有較小的冗余度、較高的數(shù)據(jù)獨立性和易擴展性,并可在一定范圍內(nèi)為各種用戶所共享。

按照不同的標(biāo)準(zhǔn),數(shù)據(jù)庫的劃分有不同的結(jié)果。

按信息處理層次,數(shù)據(jù)庫可分為書目數(shù)據(jù)庫、文摘數(shù)據(jù)庫和全文數(shù)據(jù)庫。

書目數(shù)據(jù)庫用于存儲文獻信息加工后的書目數(shù)據(jù),提供文獻信息的查詢。圖書館聯(lián)機公共檢索目錄(OPAC)是實現(xiàn)圖書館書目信息資源共享的現(xiàn)代化檢索系統(tǒng)。

文摘數(shù)據(jù)庫用于存儲原文濃縮后所得的文摘、索引等信息,主要提供各種文獻信息的題名、責(zé)任者、原文出處、主題詞及文摘,一般不提供全文,如中國科學(xué)引文數(shù)據(jù)庫等。

全文數(shù)據(jù)庫是將文獻全文以機讀版的形式存儲起來,并可與相應(yīng)的軟件配合提供文中檢索和全文輸出的數(shù)據(jù)庫。按收錄的文獻類型,數(shù)據(jù)庫可分為期刊論文數(shù)據(jù)庫、書目及圖書全文數(shù)據(jù)庫、專利數(shù)據(jù)庫、學(xué)位論文數(shù)據(jù)庫和產(chǎn)品數(shù)據(jù)庫等。根據(jù)收錄文獻信息的范圍,數(shù)據(jù)庫可分為綜合性數(shù)據(jù)庫和專業(yè)性數(shù)據(jù)庫。按承載信息的媒體形式,數(shù)據(jù)庫可分為文本數(shù)據(jù)庫、數(shù)值數(shù)據(jù)庫、聲音數(shù)據(jù)庫、圖像數(shù)據(jù)庫、視頻數(shù)據(jù)庫和多媒體數(shù)據(jù)庫。按服務(wù)模式,數(shù)據(jù)庫可分為單機數(shù)據(jù)庫、聯(lián)機數(shù)據(jù)庫和網(wǎng)絡(luò)數(shù)據(jù)庫。2.2.4文獻信息檢索的過程

1.分析檢索課題

目的在于理清檢索的基本思路,明確檢索的目的、要求與檢索范圍,并從檢索需求中發(fā)掘檢索的已知條件。

分析檢索課題是正確選擇檢索工具、制定檢索策略、進行檢索效果評價的基礎(chǔ)。

內(nèi)容包括:檢索課題的學(xué)科與主題屬性,課題所需文獻的類型,課題所需文獻生成的具體時間段,課題檢索的已知條件。2.選擇檢索工具或檢索系統(tǒng)

根據(jù)檢索課題的要求,選擇最能滿足檢索要求的檢索工具書或檢索系統(tǒng)。在選擇工具或檢索系統(tǒng)時,要考慮的主要問題有:

在內(nèi)容上和時間上,考慮檢索工具或檢索系統(tǒng)對課題的覆蓋程度和一致性;

在手段和技術(shù)上,有計算機檢索條件的一般不選擇手工檢索工具,因為計算機檢索無疑有較高的效率;

在價格和可獲取性上,通常會選擇價格低廉、容易獲取的檢索系統(tǒng)和數(shù)據(jù)庫。

3.制定檢索策略

檢索策略的制定包括確定檢索途徑與擬定檢索式。

檢索途徑的選擇是以檢索課題的分析為基礎(chǔ)的。常用的檢索途徑包括分類、主題、題名和作者。此外還有號碼途徑,主要包括一些以號碼為特征的文獻、信息,如專利文獻、技術(shù)標(biāo)準(zhǔn)等。

一般來說,主題途徑是最常用的檢索途徑。選擇主題途徑檢索時,需要分析所涉及的主要概念,并找出能代表這些概念的若干個詞或詞組,進而分析各概念之間的上、下、左、右關(guān)系。

檢索詞選取時應(yīng)注意的幾個問題有:

(1)檢索詞應(yīng)意義明確,具有專指性,涵蓋主要主題概念。

(2)盡可能考慮相關(guān)的同義詞、近義詞作為檢索詞。

(3)避免使用低頻詞或高頻詞。如“分析”“研究”“應(yīng)用”等。

(4)選用國外慣用的技術(shù)術(shù)語。

(5)盡量使用代碼,以提高檢全率。不少數(shù)據(jù)庫有自己的特定代碼,如《世界專利索引》(WPI)文檔的國際專利分類號代碼IC、《世界工業(yè)產(chǎn)品市場與技術(shù)概況》文檔中的產(chǎn)品代碼PC和事項代碼EC、《化學(xué)文摘》(CA)中的化學(xué)物質(zhì)登記號RN等。

在手工檢索時,每次檢索只能從一個檢索點出發(fā),而且只能選擇其中的一個屬性值,檢索范圍比較窄。

機檢系統(tǒng)適應(yīng)多點、多屬性值檢索,對包含的多個概念或多種限定都可以做出相應(yīng)的處理。因此,用計算機進行檢索時需要制訂一個可執(zhí)行的方案,這就是檢索式的構(gòu)造,它是檢索策略的具體表現(xiàn)。檢索式的擬定應(yīng)根據(jù)檢索課題的需要進行。

如檢索課題涉及兩個或兩個以上的檢索條件,應(yīng)考慮使用邏輯組配;檢索需求需要由多個檢索詞進行表達,而在檢索詞出現(xiàn)的位置、相距的遠(yuǎn)近會影響檢準(zhǔn)率的情況下,可以考慮使用位置算符;檢索課題對文獻的類型與生成時間有具體要求時,應(yīng)考慮使用限制檢索。

4.實施檢索操作

確定了具體的檢索式后,就要利用檢索工具在一定的范圍內(nèi)具體查找。手工檢索時可以一邊檢索一邊分析取舍,獲得符合要求的文獻。計算機檢索時,在輸出最終結(jié)果之前,檢索可能要經(jīng)過多次反復(fù)的過程。用戶需要對每次的檢索結(jié)果做出判斷,并對檢索策略(檢索式)做出相應(yīng)的修改和調(diào)整,直到得到比較滿意的結(jié)果。

通常情況下,衡量檢索效果的好壞主要依靠“檢全率”和“檢準(zhǔn)率”兩個指標(biāo)。檢全率是對所需信息被檢出程度的量化,用來表示信息系統(tǒng)能滿足用戶需求的完備程度,可以用檢出文獻中合乎需要的文獻數(shù)量占檢索系統(tǒng)中存在的合乎需要的文獻總量的比率來表示;檢準(zhǔn)率是衡量信息系統(tǒng)拒絕非相關(guān)信息的能力的量度,可以用檢出文獻中合乎需要的文獻數(shù)量占被檢出文獻總量的比率來表示。檢全率的誤差是漏檢率;檢準(zhǔn)率的誤差是誤檢率。

檢全率與檢準(zhǔn)率的計算公式是:

檢全率和檢準(zhǔn)率既可以用來評價檢索系統(tǒng)的質(zhì)量,又可以用來衡量具體課題的檢索效果。

一般來說,檢全率和檢準(zhǔn)率之間存在互逆關(guān)系,而且,由于檢索系統(tǒng)中與檢索課題相關(guān)的文獻信息數(shù)量和檢出文獻的“相關(guān)性”判斷不可能十分準(zhǔn)確,因此,檢全率和檢準(zhǔn)率在很大程度上是一種有意義的理論性指標(biāo),在實際的檢索工作中,檢全率和檢準(zhǔn)率是不可能達到100%的。

對于信息檢索系統(tǒng)來說,系統(tǒng)內(nèi)信息存儲不全面,收錄遺漏嚴(yán)重,詞表結(jié)構(gòu)不完善等,都是影響檢全率和檢準(zhǔn)率的因素。對于信息用戶來說,檢索課題要求不明確,檢索系統(tǒng)選擇不恰當(dāng),檢索途徑和檢索方法單一,檢索詞使用不當(dāng)或者檢索詞缺乏專指性,組配關(guān)系錯誤等也都會影響檢索效果。

從理論上講,提高檢索效果,可以從以下兩方面采取措施:(1)提高檢索系統(tǒng)的質(zhì)量。(2)提高用戶利用檢索系統(tǒng)的能力。

5.獲取原始文獻

文獻檢索的最終目的是獲取相關(guān)的原始文獻。傳統(tǒng)的原文獲取方式是根據(jù)檢索結(jié)果中提供的文獻來源,到圖書館借閱復(fù)印?,F(xiàn)在,隨著網(wǎng)絡(luò)技術(shù)的發(fā)展和全文數(shù)據(jù)庫的興起,獲取原文的方式也越來越多,具體來講主要有以下幾種途徑:(1)通過全文數(shù)據(jù)庫直接獲??;(2)通過網(wǎng)絡(luò)信息檢索獲取;(3)通過館際互借獲?。?4)通過文獻傳遞系統(tǒng)獲?。?5)通過文獻著者獲?。?6)通過聯(lián)機檢索系統(tǒng)訂購原文。2.2.5文獻信息檢索的方法與技術(shù)1.文獻信息檢索的方法1)常用法

常用法又稱工具法,就是直接利用書目、索引、文摘等檢索工具查找文獻信息的一種方法。具體操作又可分為順查法、倒查法和抽查法三種方式。(1)順查法,是一種依照時間順序,按照檢索課題涉及的起始年代,由遠(yuǎn)及近地查找信息的方法。順查法的優(yōu)點是所查得的文獻較為系統(tǒng)全面,適合于檢索范圍較大、時間較長的復(fù)雜課題或?qū)n}文獻的普查工作;其缺點是涉及文獻年代久遠(yuǎn)、檢索工作量大、費時費力、效率不高。順查法適合于檢索理論性或?qū)W術(shù)性的課題。(2)倒查法,是一種依照時間順序由近及遠(yuǎn)地進行查找,直到滿足信息檢索的需要為止的一種查找方法。此法多用于檢索新課題或有新內(nèi)容的老課題,其優(yōu)點在于可以最快地獲得新信息,而新信息中往往又包含著原有研究成果的精華,從而可同時了解檢索課題的發(fā)展?fàn)顩r和最新觀點。(3)抽查法,是針對檢索課題的特點,選擇與該課題有關(guān)的文獻信息最可能出現(xiàn)或最多出現(xiàn)的時間段,進行重點檢索的方法。它是一種花費較少時間獲得較多文獻的檢索方法。2)引文法

引文法是利用文獻之間的引用關(guān)系查找相關(guān)文獻的方法,包括追溯法和引文索引法兩種。(1)追溯法。追溯法是利用現(xiàn)有文獻后附的參考文獻或引用文獻作為線索,由近及遠(yuǎn)地逐一追溯查找相關(guān)文獻的方法。追溯法往往在缺乏檢索工具,同時又擁有豐富的原始文獻的情況下使用。這種方法的缺點是,文獻有限,觀點相同,文獻陳舊,在缺乏檢索工具或系統(tǒng)時,追溯法便成為常用的檢索方法。(2)引文索引法。引文索引法是從被引論文開始查找引用它的全部論文的一種檢索方法。這種方法通過先期文獻被后來文獻的引用情況,來說明文獻之間的相關(guān)性及先前文獻對當(dāng)前文獻的影響力。引文索引法則是向后追蹤進行檢索的方法,查找后獲得的文獻越來越新。3)循環(huán)法

循環(huán)法又稱綜合法、交替法或分段法,是交替使用常用法和追溯法來查找文獻的一種檢索方法。

這種方法的好處是綜合了常用法和追溯法的優(yōu)點,能夠彌補檢索工具不完善或收藏不全的缺陷,最大限度地獲得所需的文獻信息。4)瀏覽法

瀏覽法是通過瀏覽的方式查閱文獻原文而獲取所需文獻信息的方法,比較適合查找新近發(fā)表的還未被各檢索工具收錄的文獻。一般來說,瀏覽法只能瀏覽獲取本館館藏文獻,資料的全面性和系統(tǒng)性受到很大的限制,因而具有很大的局限性,不能作為查閱文獻的主要方法。

以上四種檢索方法各具特色,在實際檢索中,可根據(jù)檢索的要求和所具備的條件靈活選用,以便達到更好的檢索效果。2.計算機文獻信息檢索技術(shù)

在計算機信息檢索系統(tǒng)中,雖然各數(shù)據(jù)庫提供給用戶的檢索功能各不相同,但比較通用的有瀏覽、簡單檢索和高級檢索等功能。1)布爾邏輯檢索

在計算機信息檢索中,單獨的檢索詞一般不能滿足課題的檢索要求。19世紀(jì)由英國數(shù)學(xué)家喬治·布爾提出的布爾邏輯運算符的運用,在一定程度上滿足了用戶的檢索需求。布爾邏輯檢索是運用布爾邏輯運算符對檢索詞進行邏輯組配,以表達兩個檢索詞之間的邏輯關(guān)系。常用的組配符有AND(與)、OR(或)、NOT(非)三種。布爾邏輯檢索是最常用的計算機檢索技術(shù),在一些檢索系統(tǒng)中AND、OR、NOT組配符可分別用﹡、+、-?代替。(1)邏輯“與”(AND,﹡)。邏輯“與”是具有概念交叉和限定關(guān)系的一種組配,用來組配不同的檢索概念,其含義是檢出的記錄必須同時含有所有的檢索詞。應(yīng)把出現(xiàn)頻率低的檢索詞放在“與”的左邊,節(jié)省計算機處理時間,適時中斷檢索。(2)邏輯“或”(OR,+)。邏輯“或”是具有概念并列關(guān)系的一種組配,其含義是檢出的結(jié)果只需滿足檢索項中的任何一個即可。用邏輯“或”組配檢索式時,可將估計出現(xiàn)頻率高的詞放在“或”的左邊,以利于提高檢索速度,使選中的答案盡早出現(xiàn)。(3)邏輯“非”(NOT,-)。邏輯“非”是具有概念刪除關(guān)系的一種組配,可從原檢索范圍中剔除一部分不需要的內(nèi)容,即檢出的記錄中只能含有NOT算符前的檢索詞,不能同時含有其后的檢索詞。邏輯“非”縮小了檢索范圍,提高了檢索的專指度。邏輯“非”的缺點是取消部分往往會把切題的文獻也丟棄,故運用時一定要慎重。

不同的檢索系統(tǒng),布爾邏輯運算的次序可能不同,檢索結(jié)果也會大不一樣。一般檢索系統(tǒng)的“幫助”資料中會有說明。2)截詞檢索

為了減少檢索詞的輸入,提高檢索效率,通常使用“?”“*”等截詞符加在檢索詞的前后或中間,以擴大檢索范圍,提高檢全率。按截斷的字符數(shù)量來分,可分為有限截斷和無限截斷。有限截斷是指說明具體截去字符的數(shù)量,通常用“?”表示;而無限截斷是指不說明具體截去字符的數(shù)量,通常用“*”表示。按截斷的位置來分,可分為后截斷、前截斷和中截斷。(1)后截斷。后截斷是最常用的截詞檢索技術(shù),又稱前方一致的檢索,是將截詞符號放置在一個字符串右方,以表示其右邊的有限或無限個字符將不影響該字符串的檢索。后截斷可以省略輸入各種詞尾有變化的檢索詞的麻煩,有助于提高檢全率。(2)前截斷。前截斷是一種后方一致的檢索,是將截詞符號放置在一個字符串左方,以表示其左方的有限或無限個字符不影響該字符串檢索。前截斷在各種詞頭有變化的復(fù)合詞的檢索中應(yīng)用比較多。(3)中截斷。中截斷是把截斷符號放置在一個檢索詞的中間。一般地,中截斷只允許有限截斷。中截斷主要解決一些英文單詞拼寫不同,單復(fù)數(shù)形式不同的詞的輸入。例如,輸入“m?n”,可以檢索出含有詞man、men等的文獻;輸入“mod?????ation”可以檢索出含有詞moderation、modernization、m

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論