第二章 信息檢索基礎知識_第1頁
第二章 信息檢索基礎知識_第2頁
第二章 信息檢索基礎知識_第3頁
第二章 信息檢索基礎知識_第4頁
第二章 信息檢索基礎知識_第5頁
已閱讀5頁,還剩81頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

秦明玉信息檢索信息檢索第二章信息檢索基礎知識引言科學研究需要“站在巨人的肩膀上”,在前人研究的終點上發(fā)現(xiàn)新的起點,學會高效率地檢索和發(fā)現(xiàn)相關(guān)學術(shù)資源是幫助你站在巨人肩膀上的捷徑。根據(jù)美國科學基金會的統(tǒng)計——科研人員花費在文獻檢索上的時間提高信息檢索的效率勢在必行第二章信息檢索基礎知識

第一節(jié)信息檢索原理第二節(jié)信息檢索分類第三節(jié)信息檢索語言第四節(jié)信息檢索的方法和途徑第五節(jié)信息檢索常用技術(shù)第六節(jié)信息檢索的步驟第一節(jié)信息檢索原理一、信息檢索的概念廣義的信息檢索是指將信息按一定的方式組織和存儲起來,并根據(jù)用戶的需要找出有關(guān)信息的過程,所以它的全稱又叫“信息的存儲與檢索”。狹義的信息檢索則僅指該過程的后半部分,即從信息集合中找出所需要信息的過程,也就是我們常說的信息查詢。(1)信息標引和存儲過程。(2)信息的需求分析和檢索過程

二、信息檢索原理概述

信息標引和存儲

原始信息

信息主題

數(shù)據(jù)庫記錄及信息特征標識

信息需求分析與檢索

信息需求

檢索主題

檢索提問式及提問標識信息檢索工具(系統(tǒng))

檢索結(jié)果

主題概念分析抽出主題詞,分類號,及其他特征著錄標引比較、匹配輸出主題概念分析選定編制檢索標識和檢索策略檢索語言(主題詞表)存儲起來輸入信息檢索原理圖信息檢索的實質(zhì)是將描述用戶所需信息的提問特征與信息存儲的檢索標識進行比較,從中找出與提問特征一致或基本一致的信息。所謂提問特征就是對信息的需求分析后,從中選出能代表信息需求的主題詞、分類號或其它符號。檢索標識是信息存儲時,對信息內(nèi)容進行分析提出能代表信息內(nèi)容實質(zhì)的主題詞、分類號或其它符號。三、信息檢索系統(tǒng)1、信息檢索系統(tǒng)的概念信息檢索系統(tǒng)是指根據(jù)一定的需要,為進行信息傳遞而建立的一種有序化的信息集合體,并能向用戶提供信息服務的多功能開放系統(tǒng)。任何具有信息存貯與檢索功能的系統(tǒng),均可以稱為信息檢索系統(tǒng)。檢索系統(tǒng)應具備下述三個條件:(1)詳細記錄所著錄文獻線索,讀者可根據(jù)這些線索查找所需文獻。(2)根據(jù)檢索標識,如分類號、主題詞、文獻號、代碼等尋找所需文獻。(3)提供檢索的必要手段,如分類索引、主題索引等,便于讀者檢索。2、信息檢索系統(tǒng)的功能:

報道文獻信息、存儲文獻信息、檢索文獻信息3、信息檢索系統(tǒng)的類型(1)按照信息檢索所采用的設備和手段劃分手工信息檢索系統(tǒng):手工檢索系統(tǒng)是以手工方式存貯和檢索信息的系統(tǒng)。檢索時使用各種紙質(zhì)工具,檢索入口少、速度慢、效率較低。手工信息檢索系統(tǒng)又可分為:書本式檢索系統(tǒng)和卡片式檢索系統(tǒng)。計算機信息檢索系統(tǒng):計算機檢索系統(tǒng)是用計算機進行信息存貯和檢索的系統(tǒng)。檢索時使用各種數(shù)據(jù)庫,檢索靈活、檢索入口多、速度快、效率高。計算機信息檢索系統(tǒng)又可分為:光盤檢索系統(tǒng)、聯(lián)機檢索系統(tǒng)和網(wǎng)絡檢索系統(tǒng)。書本式卡片式(2)按揭示信息內(nèi)容的程度劃分按揭示信息內(nèi)容的程度劃分目錄檢索系統(tǒng)文摘索引型檢索系統(tǒng)全文檢索系統(tǒng)目錄文摘、索引全文參考數(shù)據(jù)庫全文數(shù)據(jù)庫參考數(shù)據(jù)庫英文為referencedatabase,指包含各種數(shù)據(jù)、信息或知識的原始來源和屬性的數(shù)據(jù)庫。數(shù)據(jù)庫中的內(nèi)容是通過對數(shù)據(jù)、信息或知識的再加工和過濾——如編目、索引、摘要、分類等——后形成的。目的是指引用戶能夠快速、全面地鑒別和找到相關(guān)信息。主要包括書目數(shù)據(jù)庫、文摘數(shù)據(jù)庫和索引數(shù)據(jù)庫。書目數(shù)據(jù)庫主要是針對圖書進行內(nèi)容的報道與揭示的,如各圖書館的館藏機讀目錄數(shù)據(jù)庫。文摘和索引數(shù)據(jù)庫則相對期刊論文、會議論文、專利文獻、學位論文等進行內(nèi)容和屬性的認識與描述,每一個具體的資源都有相應的描述元數(shù)據(jù)記錄。目錄:目錄是以一件或一種完整的出版物(如一種圖書、一種期刊)為單位,按照一定次序編排的對文獻信息進行描述和報道的工具,也稱書目。目錄對文獻的描述比較簡單,每條記錄的字段主要包括:文獻題名、責任者、出版事項、分類號、主題詞等。一種出版物經(jīng)過如此描述后形成一條記錄,將所有的記錄組織起來就形成了目錄。

目錄是對出版物按其外表特征進行著錄而成,以書或刊作為目錄的基本單位。目錄類型

:①按目錄反映的藏書范圍區(qū)分為:館藏目錄:反映一個圖書館全部館藏的目錄。如中國國家圖書館館藏目錄聯(lián)合目錄:反映一個地區(qū)或一個系統(tǒng)甚至全國或世界范圍的圖書館、信息服務機構(gòu)文獻收藏情況的一種統(tǒng)一目錄。如CALIS聯(lián)合目錄②按目錄的組織方法區(qū)分為字順目錄和分類目錄。字順目錄又分題名目錄、責任者(著者)目錄、主題目錄等。③按目錄的使用對象區(qū)分為讀者目錄和公務目錄。④按目錄反映的文獻類型區(qū)分為圖書目錄、期刊目錄、報紙目錄、地圖目錄、視聽資料目錄等。⑤按目錄的語言文字區(qū)分為中文目錄、西文目錄、俄文目錄、日文目錄等。⑥按目錄的物質(zhì)載體區(qū)分為卡片式目錄、書本式目錄、機讀目錄(MARC)、聯(lián)機公共檢索目錄(OPAC,OnlinePublicAccessCatalog)等。OPAC:是指以計算機編碼形式存貯在計算機系統(tǒng)內(nèi),供讀者通過終端設備進行聯(lián)機檢索的圖書館目錄,即書目數(shù)據(jù)庫的一種形式。文摘(Abstract)是描述文獻各種特征的一條記錄,通常由文獻的分類號、文獻篇名、著者及其單位、文獻來源、主題詞、摘要等項組成。以單篇文獻(如一篇論文、書中的一章)為報道單位。索引(Index)是將某種信息集合(如目錄、文摘)中的一組相關(guān)信息,按照某種順序組織并指引給用戶的一種指南。它具有便于檢索,揭示文獻信息深入、詳細的優(yōu)點。索引條目一般由檢索標識和存貯地址組成。標識是索引條目所指示的文獻信息某方面的特征,如主題詞、著者姓名、分類號等;存貯地址是指明標識所表達的特定信息在信息集合中的地址,它通常是文獻存取號(文摘號)。常見索引種類(1)分類索引:是以分類號或類目名稱作為索引標識,按照分類號排列形成的索引。(2)主題索引:是以主題詞(敘詞或關(guān)鍵詞)作為索引標識,按其字順排列形成的索引。(3)著者索引:是以文獻上署名的著者、譯者、編者等責任者的姓名或機關(guān)團體名稱作為索引標識,按其字順排列形成的索引。(4)專用索引:是以某些領域?qū)S玫拿~術(shù)語或符號作為索引標識編排形成的索引。(5)引文索引:是以引文著者和引文的其余題錄部分作為標識編制成的索引。

參考數(shù)據(jù)庫全文數(shù)據(jù)庫英文為full-textdatabase,即收錄有原始文獻全文的數(shù)據(jù)庫,以期刊論文、會議論文、政府出版物、研究報告、法律條文和案例、商業(yè)信息等為主。全文數(shù)據(jù)庫4、檢索系統(tǒng)的結(jié)構(gòu)A、編輯使用說明:介紹檢索工具的編輯方針、收錄范圍、總體結(jié)構(gòu)、各部分的功能、體例以及使用方法等。它是使用檢索工具的指南。B、正文(主文檔):是文獻條目(也稱記錄)的有序集合,是檢索工具的主體。條目(記錄)通常由文獻的順序號、篇名、著者、來源等著錄項目(也稱字段)組成。常見字段標識符字段名標識符全稱字段名標識符全稱字段名標識符全稱文獻題名TITitle著者AUAuthor著者單位AFAuthoraffiliation摘要ABAbstract出版者PBPublisher出版國CPCountryofpublication敘詞DEDescriptor文獻來源SOSource出版年P(guān)YPublicationyear關(guān)鍵詞IDIdentifier語種LALanguage分類號CCClassificationcode文獻類型DTDocumenttype國際標準刊號ISISSN記錄存貯號ANAccessionnumberC、索引:由各種不同的索引組成,數(shù)據(jù)庫中稱索引文檔或倒排檔。它提供多種檢索途徑(檢索入口),滿足用戶不同的檢索需要,提高檢索的速度與準確性。常見的輔助索引有著者索引、主題索引、文獻號碼索引等。D、附錄:由來源期刊一覽表、縮略語與全稱對照表、不同語種音譯對照表等組成。它是正文的必要補充,有利于用戶進一步理解正文的著錄內(nèi)容,了解文獻來源情況,根據(jù)縮寫查找全稱等。E、詞表:是檢索系統(tǒng)中文獻信息整序的依據(jù),如分類表、主題詞表等。它通常獨立存在,是準確選擇檢索的分類號和主題詞的依據(jù)。第二節(jié)信息檢索分類一、按檢索對象劃分,信息檢索可以分為:1、文獻檢索:從一個文獻集合中查找出專門包含所需信息內(nèi)容的文獻,是以文獻為檢索對象的信息檢索類型。2、數(shù)據(jù)檢索:是從文件、數(shù)據(jù)庫或存儲裝置中查找和選取所需數(shù)據(jù)的操作或過程。3、事實檢索:是獲取以事物的實際情況為基礎而集合生成新的分析結(jié)果的一類信息檢索。廣義的事實檢索既包括數(shù)值數(shù)據(jù)的檢索、算術(shù)運算、比較和數(shù)學推導,也包括非數(shù)值數(shù)據(jù)(如事實、概念、思想、知識等)的檢索、比較、演繹和邏輯推理。它要求檢索系統(tǒng)不僅能夠從數(shù)據(jù)(事實)集合中查出原來存入的數(shù)據(jù)或事實,還能夠從已有的基本數(shù)據(jù)或事實中推導、演繹出新的數(shù)據(jù)或事實。舉例檢索1檢索2請問:以上1、2、3項檢索,哪個是文獻檢索?哪個是數(shù)據(jù)檢索?哪個是事實檢索?檢索3以上三種信息檢索類型的主要區(qū)別在于:數(shù)據(jù)檢索和事實檢索是要檢索出包含在文獻中的信息本身,是一種確定性檢索,而文獻檢索則檢索出包含所需要信息的文獻即可,是一種不確定性檢索。二、按檢索手段劃分:1、手工檢索:是一種傳統(tǒng)的檢索方法,即以手工翻檢的方式,利用工具(包括圖書、期刊、目錄卡片等)來檢索信息的一種檢索手段。2、機械檢索:即利用探針或檢索器件,對代表檢索標識的穿孔卡片進行選取。這種機械的掃描大大提高了檢索效率。3、光電檢索:即把檢索標識變成黑白點矩陣或條形碼,存儲在縮微膠片(卷)上,利用光電效應,通過檢索機械進行查找。4、計算機檢索:即把情報及其檢索標識轉(zhuǎn)換成電子計算機可以閱讀的二進制編碼,存儲在磁性載體上,由計算機根據(jù)程序進行查找與輸出。根據(jù)檢索者同計算機進行的不同通信方式,計算機檢索又可以分為脫機檢索、聯(lián)機檢索及網(wǎng)絡信息檢索等。

第三節(jié)信息檢索語言一、信息檢索語言及其作用1、檢索語言的概念:檢索語言是應文獻信息的加工、存儲和檢索的共同需要而編制的專門語言,是表達一系列概括文獻信息內(nèi)容和檢索課題內(nèi)容的概念及其相互關(guān)系的一種概念標識系統(tǒng)。簡言之,檢索語言是用來描述信息資源特征和進行檢索的語言。2、檢索語言的作用(1)標引文獻信息內(nèi)容及其外部特征,保證不同標引人員標引文獻的一致性。(2)對內(nèi)容相同及相關(guān)的文獻信息加以集中或揭示其相關(guān)性。(3)使文獻信息的存儲集中化、系統(tǒng)化、組織化,便于檢索者按照一定的排列次序進行有序化檢索。(4)便于將標引用語和檢索用語進行相符性比較,保證不同檢索人員表述相同文獻內(nèi)容的一致性,以及檢索人員與標引人員對相同文獻內(nèi)容表述的一致性。(5)保證檢索者按不同需要檢索文獻時都能獲得最高查全率和查準率。二、檢索語言的類型1、人工語言

人工語言是根據(jù)信息檢索的需要由人工創(chuàng)制的,采用規(guī)范詞,用來專指或網(wǎng)羅相應的概念,可以將同義詞、近義詞、相關(guān)詞、多義詞及縮略詞規(guī)范在一起,由人工控制,包括分類檢索語言、主題檢索語言和代碼檢索語言。2、自然語言

自然語言檢索用詞是從信息內(nèi)容本身抽取的,主要依賴于計算機自動抽詞技術(shù)完成,輔以人工自由標引(非根據(jù)詞表的標引方法),是非規(guī)范詞。1、人工語言

(1)分類語言按知識門類的邏輯次序?qū)⑿畔⑾到y(tǒng)地組織和劃分的語言,具體體現(xiàn)為用分類號和類名來表達信息的主題概念。

①分類語言的特點:能較好地體現(xiàn)學科的系統(tǒng)性,反映事物的平行、隸屬和派生關(guān)系,適合人們認識事物的習慣,有利于從學科或?qū)I(yè)的角度進行族性檢索,能達到較高的查全率。采用拉丁字母和阿拉伯數(shù)字做概念標識的分類號,比較簡明,便于組織目錄系統(tǒng)。是《中國圖書館圖書分類法》的簡稱,是我國目前通用的類分圖書的工具。我校圖書館就是采用《中圖法》來類分文獻資料。《中圖法》基本結(jié)構(gòu):

《中圖法》的標記符號采用英文字母與阿拉伯數(shù)字相結(jié)合的混合號碼。即用一個字母表示一個大類,以字母的順序反映大類的序列。字母后用數(shù)字表示大類以下類目的劃分。數(shù)字的編號使用小數(shù)制。②

《中圖法》TB一般工業(yè)技術(shù)TD礦業(yè)工程TE石油、天然氣工程TF冶金工程TG金屬學、金屬工藝TH機械儀表工業(yè)TJ武器工業(yè)TK動力工業(yè)TL原子能技術(shù)TM電工技術(shù)TN無線電電子學、電訊技術(shù)TP自動化技術(shù)、計算技術(shù)TQ化學工業(yè)TS輕工業(yè)、手工業(yè)TU建筑科學TV水利工程3級類目TU建筑基礎科學TU19建筑勘測TU2建筑設計TU3建筑結(jié)構(gòu)TU4工力學、地基基礎工程TU5建筑材料TU6建筑施工機械和設備TU7建筑施工TU8房屋建筑設備TU9地下建筑TU97高層建筑TU98區(qū)域規(guī)劃、城市規(guī)劃TU99市政工程A馬列主義、毛澤東思想、鄧小平理論22大類B

哲學C

社會科學總論D

政治、法律E

軍事F

經(jīng)濟G

文化、科學、教育體育H

語言、文字

I

文學

J藝術(shù)K歷史、地理N自然科學總論O數(shù)理科學和化學P天文學、地球科學Q生物科學R醫(yī)藥、衛(wèi)生S農(nóng)業(yè)科學T工業(yè)技術(shù)U交通運輸V航空、航天X環(huán)境科學Z綜合性圖書馬列主義、毛澤東思想5大部哲學社會科學綜合性圖書自然科學2級類目F經(jīng)濟F0政治經(jīng)濟學F1世界各國經(jīng)濟概況、經(jīng)濟史、經(jīng)濟地理F2經(jīng)濟計劃與管理F3農(nóng)業(yè)經(jīng)濟F4工業(yè)經(jīng)濟F5交通運輸經(jīng)濟F6郵電經(jīng)濟F7貿(mào)易經(jīng)濟F8財政、金融H語言、文字

H0語言學

H1漢語

H2中國少數(shù)民族語言

H3常用外國語

H31英語

H310.1非標準英語

H310.4英語水平考試

H310.41世界

H310.42中國

H310.43/.47各國(依世界地區(qū)表分)

H32/37各種常用外國語(均可仿H31分)H32法語

H33德語

H34西班牙語

H35俄語……分類號的變化體現(xiàn)了各學科體系的從屬關(guān)系,分類號位數(shù)每增加一位,則分類級別便低一級。索書號G252.7/H68、TP311.5/H226

HeadFirst設計模式(中文版)網(wǎng)絡信息檢索與利用TP311.5H226G252.7H68主題語言是由主題詞匯構(gòu)成,即將自然語言中的名詞術(shù)語經(jīng)過規(guī)范化后直接作為信息標識,按字母順序排列標識,通過參照系統(tǒng)揭示主題概念之間的關(guān)系,也稱主題法。包括先組式的標題詞語言、后組式的單元詞語言和敘詞語言。①標題詞語言:是一種先組式的規(guī)范詞語言,在檢索前已經(jīng)將概念之間的關(guān)系組配好。從文獻的題目和內(nèi)容中抽出來,經(jīng)過規(guī)范化處理的主題語言。(2)主題語言②單元詞語言單元詞語言:是一種最基本的、不能再分的單位詞語,亦稱元詞,從文獻內(nèi)容中抽出,再經(jīng)規(guī)范,能表達一個獨立的概念。③敘詞語言敘詞語言是指從文獻內(nèi)容中抽出來,以表達文獻主題內(nèi)容的概念為基礎,經(jīng)過嚴格優(yōu)選和規(guī)范化處理,可以進行邏輯組配的一種主題語言。一般來講,選擇的敘詞具有概念性、描述性、組配性,經(jīng)過規(guī)范化處理后,還具有語義的關(guān)聯(lián)性、動態(tài)性、直觀性。是目前應用較廣的一種語言。CA(化學文摘)、EI(工程索引)等都采用敘詞語言進行編排。(3)代碼語言代碼語言:指對事物某方面的特征,用某種代碼系統(tǒng)來表示事物概念,從而提供檢索的檢索語言。目前主要應用于化學領域,例如,化合物的分子式分子式索引系統(tǒng),環(huán)狀化合物的環(huán)系索引系統(tǒng)等。2、自然語言

(1)關(guān)鍵詞:是從文獻的標題、文摘和正文中直接抽取的,能夠揭示和表達文獻主題內(nèi)容并具有實質(zhì)意義的未經(jīng)規(guī)范化處理的自然語言。

除了禁用詞,如一些冠詞、介詞、副詞或連詞外,凡在概念上有意義的詞都可用作關(guān)鍵詞,它確保檢索用詞與文獻記錄中的詞匯完全一致。漏檢同義詞:發(fā)動機引擎;白果銀杏;西紅柿洋柿子番茄;電腦計算機PC機使用其中一個詞做關(guān)鍵詞進行檢索時,往往會漏掉部分相關(guān)文獻。使用關(guān)鍵詞做檢索入口時需注意:誤檢

多義詞cell電池

細胞用關(guān)鍵詞“cell”查找細胞方面的文獻結(jié)果:電池、細胞兩方面的文獻同時被檢出2、自然語言(2)題名:利用文獻或文章的名稱進行檢索。(3)著者:利用作者或團體作者的姓名進行檢索。(4)全文:從資源的全部內(nèi)容中自動抽取、查找,是目前網(wǎng)上各類搜索引擎使用最多的方法。(5)其他:利用摘要、引文等3、人工語言和自然語言的關(guān)系人工語言和自然語言并不是互相對立的,比較成熟的檢索系統(tǒng),通常是兩種檢索語言并用,互為補充,以保證較高的檢索效率。一、信息檢索的方法1、追溯法(引文法):又稱回溯法,是從已有的文獻后面所附的參考文獻入手,逐一查找全文,再從這些原文后面所列的參考文獻逐一追查,不斷擴大檢索線索,從而獲得一批相關(guān)文獻信息的查找方法。2、常用法(工具法):利用目錄、索引、題錄或文摘等檢索工具來查找文獻的方法。按所查文獻的順序,可分為順查法、倒查法和抽查法三種。第四節(jié)信息檢索的方法和途徑(1)順查法——由遠而近,從問題發(fā)生的年代開始逐年往近查,適用于無綜述性文獻可參考時使用。查的文獻較完整,查全率較高,但工作量大,效率不高。(2)倒查法——由近到遠,重點放在近期的文獻,多用于新課題,或老技術(shù)的新發(fā)展,從新情況開始查到一定的基本資料時為止。(3)抽查法——根據(jù)課題的特點和需要,選查發(fā)展旺盛時期的文獻,可節(jié)約時間,但可能會漏檢。2、常用法(工具法)3、綜合法:結(jié)合追溯法和常用法,先利用檢索工具查出一定時期內(nèi)的一批有用文獻,在利用這些文獻后面的參考文獻,追溯查出前一時期內(nèi)的文獻,如此循環(huán)交替的使用兩種方法直到滿足要求為止。也稱交替法。二、選擇檢索方法的原則

1、如果檢索工具不全或根本沒有,檢索課題涉及面又不大,對查全率不做較高要求,可采用由近及遠的追溯法?;厮莸钠瘘c最好是所附參考文獻較多的論文及論著,還有一些信息研究成果,如“綜述”、“評述”等。2、如果檢索工具齊備,研究課題涉及的范圍大,則應采用常用法或綜合法進行檢索。3、如果檢索課題屬于新興學科或知識更新快的學科,可采用倒查法。4、如果研究課題對查全率做特別要求,如開展查新,一般采用順查法。5、如果已經(jīng)掌握了檢索課題發(fā)展的規(guī)律、特點,一般采用抽查法。1、題名:注意題名關(guān)鍵詞的排序特征2、作者:通常按姓在前名在后方式檢索3、分類:我國高校與公共圖書館的文獻資料,一般采用《中國圖書館圖書分類法》進行分類。4、主題詞:主題是指表征文獻內(nèi)容特征、經(jīng)過規(guī)范化的名詞術(shù)語。檢索者通過檢索這些規(guī)范的詞語來找到所要的文獻和情報。三、信息檢索的常用途徑5、關(guān)鍵詞:直接從文獻的篇名或文摘或全文中抽取出來的非規(guī)范化檢索詞。6、順序號檢索:專利號,標準號,研究報告號。7、引文檢索:利用被引文獻來查找原文獻的檢索方法。如:CNKI中國期刊網(wǎng)被引用字段,維普中文期刊數(shù)據(jù)庫引文檢索途徑。8、其它:超文本檢索,基于概念的自然語言檢索,圖象等。信息檢索的常用途徑1、布爾邏輯檢索2、截詞檢索與詞根檢索3、位置運算檢索4、限定檢索第五節(jié)信息檢索常用技術(shù)1、布爾邏輯檢索布爾邏輯(組配)算符:系統(tǒng)中采用的邏輯組配算符是布爾代數(shù)中的邏輯運算符AND/*(與)、OR/+(或)、NOT/—(非)。布爾邏輯檢索:

即運用布爾邏輯算符對檢索詞進行邏輯組配,表達兩個概念之間的邏輯關(guān)系。(1)AND或*算符實現(xiàn)邏輯“與”組配

也可用“*”表示,用來組配不同的概念的檢索詞。是一種概念相交和限定關(guān)系的組配。例如:“AANDB”或“A*B”

其含義是:檢出的信息中必須同時含有“A”和“B”兩個檢索詞(如圖中陰影部分所示)。其基本作用是對檢索范圍加以限定,逐步縮小檢索范圍,提高檢索結(jié)果的查準率。例如,檢索“計算機在圖書館中的應用”方面的文獻,其提問式可寫成:計算機and圖書館或計算機*圖書館(2)OR或+算符實現(xiàn)邏輯“或”組配

邏輯“或”,是用來組配具有同義或同族概念的檢索詞。如:檢索提問式:“AORB”或“A+B”其含義是數(shù)據(jù)庫記錄中任何一條記錄,只要含有“A”或“B”中任何一個檢索詞即為命中的文獻(如下圖陰影部分)。其基本作用是擴大檢索范圍,增加命中文獻量,提高文獻的查全率。如:“微機+電腦+PC機”、“微機or電腦orPC機”(3)NOT或–算符實現(xiàn)邏輯“非”組配邏輯“非”,“NOT”算符是排除含有某些詞的記錄,其邏輯提問表達式為“ANOTB”或

“A-B”,即檢出的記錄中只能含有“NOT”算符前的檢索詞A,但不能同時含有“NOT”后的檢索詞B(如圖中陰影部分)。

其基本作用是縮小檢索范圍,但并不一定能提高文獻命中的準確性,一般只起到減少文獻輸出量的作用。在聯(lián)機檢索中可降低檢索費用。

例如:“計算機NOT微機”應注意,由于“NOT”算符有排除掉相關(guān)文獻的可能,因此,在實際檢索中應慎重使用。(4)XOR算符實現(xiàn)邏輯“異或”組配邏輯“異或”(XOR):命中信息包含邏輯A,也包含邏輯B,但不包含同時含有A和B的信息。優(yōu)先級運算()>NOT>AND>OR、XOR2、截詞檢索與詞根檢索定義:用截詞符號“?”、“*”或“$”加在檢索詞的前后或中間,以檢索一組概念相關(guān)或同一詞根的詞。這種檢索方式可以擴大檢索范圍,提高查全率,主要用于西文數(shù)據(jù)庫檢索。中文數(shù)據(jù)庫通常不使用這種技術(shù)。截詞檢索類型:截詞方式根據(jù)截詞的位置不同,分為前截斷、后截斷、中截斷;根據(jù)截斷的數(shù)量不同,分為有限截斷和無限截斷。前截斷:截詞符放在被截詞的左邊,可與后截斷一同使用。目前這種檢索技術(shù)應用已經(jīng)極少。后截斷:是前方一致檢索,又稱右截斷,截詞符放在被截詞的右邊,是最常用的截詞檢索技術(shù)。后截斷主要用于下列檢索:詞的單復數(shù)檢索;中截斷:把截詞符放在詞的中間。這種方式查找英美不同拼法的概念最有效。算符含義實例*利用它可以只輸入檢索詞的起始部分,而實現(xiàn)以族詞的檢索也可以替代詞中的任意字符。Alter*

可命中Alter、Alteration、Altercate

、Alternant、Alternate、Alternator等sul*ate可命中sulphate、sulfate?可以替代單個字符wom?n可表示woman、women$自動取詞根運算符$management可命中manage、managed、manager、managers、managing、management截詞舉例符號:*,?,$前截斷:*magneticmagnetic,electro-magnetic,electromagnetic,thermo-magnetic,…后截斷:librar*library,libraries,librarian,…中截斷:organi?ationorganization,organisation無限截斷:不限制被截斷的字符數(shù)量,例如輸入educat*,可以檢索educator,educators,educated,educating,education,educational,等等。有限截斷:限制被截斷的字符數(shù)量,例如輸入educat??,表示被截斷的字符只有兩個,可以檢索educator,educated兩個詞。3、位置算符檢索定義:運用位置算符表示兩個檢索詞間的位置鄰近關(guān)系,又叫鄰接檢索。這種檢索技術(shù)通常只出現(xiàn)在西文數(shù)據(jù)庫中,在全文檢索中應用較多。如果說布爾邏輯算符是表示兩個概念之間的邏輯關(guān)系的話,位置算符表示的是兩個概念在信息中的實際物理位置關(guān)系。常用位置算符算符

功能

表達式

檢索結(jié)果

W,with兩詞相鄰,按輸入時順序排列(也有數(shù)據(jù)庫允許順序顛倒)

Education(W)school,或EducationwithschoolEducationschoolEducationschools(schoolofeducationschoolsofeducation)

nW同上,兩詞中間允許插入n個詞Education(1W)schoolEducationschoolEducationschoolsEducationandmusicschoolSchoolofcontinuededucationPre兩詞相鄰,按輸入順序排列

EducationPreschoolEducationschoolEducationschools常用位置算符N,near兩詞緊密相鄰,中間不能插入其他詞,順序可以顛倒

Education(N)school,或EducationnearschoolEducationschoolEducationschoolsSchoolofeducationnN同上,兩詞中間可以插入n個詞

Education(1N)schoolEducationschoolSchoolofeducationEducationandmusicschoolF兩個詞同在一個標引字段中Education(F)school例如同時出現(xiàn)在題名或文摘字段中Same兩個詞同在一個段落中EducationSameschool同時出現(xiàn)在一個段落中4、限定檢索

為了縮小檢索范圍,可利用字段代碼來限制檢索詞出現(xiàn)的字段,以提高檢索速度和命中率。如:riceinti(表示只在題目字段中查找文獻)

riceinde(只在主題詞中查找)

riceinab(只在文摘中查找)

au=Smith,J.C(查作者為Smith,J.C的文章)py=1998(只查1998年的文章)la=Chinese(只查語種為中文的文獻)第六節(jié)信息檢索的步驟使用數(shù)字資源開展研究的目的(1)尋找針對具體問題的準確答案:解決問題,或作為論據(jù)引證。(2)查找特定文獻:根據(jù)文獻線索查找原文,或查找作者的文章。(3)對某一問題做大致的了解,并就問題的一個方面,撰寫小型論文。(4)查閱某一專題的前沿和最新資料,了解動態(tài)和趨勢。(5)對某一課題做全面的調(diào)查研究,了解該課題的全面資料和整體發(fā)展,撰寫綜述或者研究報告。(6)對某一課題做深入的專題研究,提出創(chuàng)新觀點,撰寫研究報告或?qū)W術(shù)論文。信息檢索的步驟1、課題分析與研究2、選擇檢索資源,確定檢索范圍3、制定檢索策略,選擇檢索方法4、評估檢索結(jié)果,優(yōu)化檢索策略5、搜集、整理、評價和獲取文獻明確檢索目的全面的?最新的?片段的?明確主題或主要內(nèi)容明確課題涉及的學科范圍所需信息的數(shù)量、語種、年代范圍、類型、作者等城市中心區(qū)的空間結(jié)構(gòu)與空間組織步驟一:分析研究課題針對具體問題查找準確答案、特定的文獻或事實……步驟一:分析研究課題查找特定事實開題/選題資料搜集/調(diào)研論文/報告撰寫課題/學術(shù)論文選題、學位論文開題、課堂討論、辯論、小論文……專業(yè)資料調(diào)研、為論文/課題而做的資料搜集、項目立項調(diào)研……了解最新動態(tài)趨勢,學術(shù)論文寫作/調(diào)查報告撰寫/制作發(fā)明實踐……步驟二:選擇檢索資源/工具查找特定事實;開題/選題資料搜集/調(diào)研學術(shù)論文寫作/調(diào)研報告撰寫/制作發(fā)明實踐課題事實/數(shù)值型數(shù)據(jù)庫、搜索引擎、電子參考工具等;數(shù)據(jù)庫(參考和全文型);數(shù)據(jù)庫、電子期刊、學位論文、會議論文、專著和其他文獻如專利、事實數(shù)據(jù)庫等

全文文獻、專著、學術(shù)報告、學位論文和其他文獻工具檢索工具選擇標準和方法保證所選擇的資源與檢索課題的學科一致,盡量使用權(quán)威性的專業(yè)數(shù)據(jù)庫學科屬性了解參考資源收藏的范圍和特色收藏收藏范圍了解參考資源的檢索方法和系統(tǒng)功能系統(tǒng)功能了解并有效利用檢索系統(tǒng)的助檢手段和輔助工具,如檢索幫助、培訓課程等幫助和培訓步驟三:制定檢索策略/方法查找特定事實;開題/選題資料搜集/調(diào)研學術(shù)論文寫作/調(diào)研報告撰寫/制作發(fā)明實踐課題檢索詞檢索技術(shù)檢索策略調(diào)整

檢索經(jīng)驗的積累策略檢索詞使用舉例“專業(yè)”:采用專業(yè)術(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論