計算機信息檢索概述課件_第1頁
計算機信息檢索概述課件_第2頁
計算機信息檢索概述課件_第3頁
計算機信息檢索概述課件_第4頁
計算機信息檢索概述課件_第5頁
已閱讀5頁,還剩95頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

計算機信息檢索概述1計算機信息檢索理論基礎(chǔ)2計算機信息檢索的發(fā)展歷史3計算機檢索技術(shù)與實現(xiàn)4計算機檢索策略與實施技巧計算機信息檢索概述1計算機信息檢索理論基礎(chǔ)11計算機信息檢索理論基礎(chǔ)使用計算機檢索信息,是專業(yè)人員在開展科學(xué)研究中不可或缺的一項基本技能。一個具有這方面能力并善于從電子信息源中獲取所需信息者,將在今后的信息社會中獲取更多的成功機會。1計算機信息檢索理論基礎(chǔ)使用計算機檢索信息,是專業(yè)人員在開21計算機信息檢索理論基礎(chǔ)計算機信息檢索的定義計算機檢索系統(tǒng)的構(gòu)成數(shù)據(jù)庫的概念1計算機信息檢索理論基礎(chǔ)計算機信息檢索的定義3計算機信息檢索的定義所謂計算機信息檢索,就是在計算機和人的共同作用下,按照一定的方法組織和存儲信息,并通過人機對話從計算機存儲的大量數(shù)據(jù)中自動輸出用戶所需的那部分信息的過程。計算機信息檢索的定義所謂計算機信息檢索,就是在計算機和人的共4計算機檢索系統(tǒng)的構(gòu)成硬件軟件數(shù)據(jù)庫計算機檢索系統(tǒng)的構(gòu)成硬件5硬件系統(tǒng)中采用的各種硬件設(shè)備的總稱,包括具有一定性能的計算機主機、外圍設(shè)備以及懷數(shù)據(jù)處理或數(shù)據(jù)傳輸有關(guān)的其他設(shè)備。主機,是計算機檢索系統(tǒng)的中樞。外圍設(shè)備包括外部存儲器,輸入輸出設(shè)備如鍵盤、光筆、鼠標(biāo)、光學(xué)字符識別裝置,顯示終端、打印機等。硬件系統(tǒng)中采用的各種硬件設(shè)備的總稱,包括具有一定性能的計算機6軟件系統(tǒng)中有關(guān)的程序和各種文件資料的總稱,包括系統(tǒng)軟件(如操作系統(tǒng),輸入輸出控制程序)和應(yīng)用軟件。軟件系統(tǒng)中有關(guān)的程序和各種文件資料的總稱,包括系統(tǒng)軟件(如操7數(shù)據(jù)庫“一組文件的集合”,就是以一定的組織方式存貯在一起的相關(guān)數(shù)據(jù)的集合。數(shù)據(jù)庫“一組文件的集合”,就是以一定的組織方式存貯在一起的相8數(shù)據(jù)庫的概念數(shù)據(jù)庫的定義數(shù)據(jù)庫的類型數(shù)據(jù)庫的概念數(shù)據(jù)庫的定義9數(shù)據(jù)庫的定義數(shù)據(jù)庫是至少由一種文檔組成,并能滿足某一特定目的或某一特定數(shù)據(jù)處理系統(tǒng)需要的一種數(shù)據(jù)集合。通俗地說,數(shù)據(jù)庫是在計算機存儲設(shè)備上按一定方式存儲,并提供給確定范圍內(nèi)的各類用戶共享的相互關(guān)聯(lián)的數(shù)據(jù)集合。數(shù)據(jù)庫是計算機技術(shù)與信息檢索技術(shù)相結(jié)合的產(chǎn)物。它既是現(xiàn)代人們從事信息資源管理的工具,同時也是計算機信息檢索的基礎(chǔ)。數(shù)據(jù)庫的定義數(shù)據(jù)庫是至少由一種文檔組成,并能滿足某一特定目的10數(shù)據(jù)庫的類型參考數(shù)據(jù)庫源數(shù)據(jù)庫混合數(shù)據(jù)庫數(shù)據(jù)庫的類型參考數(shù)據(jù)庫11參考數(shù)據(jù)庫指用戶從中獲取信息線索后,還需進一步查找原文或其他資料的一類數(shù)據(jù)庫。它包括書目數(shù)據(jù)庫和指南數(shù)據(jù)庫。(1)書目數(shù)據(jù)庫。它是存儲某個學(xué)科領(lǐng)域的二次文獻的數(shù)據(jù)庫,有時又稱作為二次文獻庫。它依照二次文獻的不同類型又可分為題錄文摘數(shù)據(jù)庫、索引數(shù)據(jù)庫和圖書館書目數(shù)據(jù)庫。(2)指南數(shù)據(jù)庫。它是存儲有關(guān)某些機構(gòu)、人物、出版物、項目、程序、活動等簡要描述性信息的一類數(shù)據(jù)庫,亦稱指示性數(shù)據(jù)庫。例如,機構(gòu)名稱數(shù)據(jù)庫、人物傳記數(shù)據(jù)庫、產(chǎn)品數(shù)據(jù)庫等都屬于這一類數(shù)據(jù)庫。參考數(shù)據(jù)庫指用戶從中獲取信息線索后,還需進一步查找原文或其他12源數(shù)據(jù)庫又稱為數(shù)據(jù)銀行。它是能夠直接為用戶提供原始資料或具體數(shù)據(jù)的一類數(shù)據(jù)庫。源數(shù)據(jù)庫又分為:數(shù)值型數(shù)據(jù)庫文本—數(shù)值型數(shù)據(jù)庫術(shù)語數(shù)據(jù)庫圖像數(shù)據(jù)庫全文數(shù)據(jù)庫超文本數(shù)據(jù)庫源數(shù)據(jù)庫又稱為數(shù)據(jù)銀行。它是能夠直接為用戶提供原始資料或具體13數(shù)值型數(shù)據(jù)庫是指專門提供以數(shù)值方式表示的調(diào)查數(shù)據(jù)和統(tǒng)計數(shù)據(jù)的一類數(shù)據(jù)庫。數(shù)值型數(shù)據(jù)庫是指專門提供以數(shù)值方式表示的調(diào)查數(shù)據(jù)和統(tǒng)計數(shù)據(jù)14文本-數(shù)值型數(shù)據(jù)庫是指能夠同時提供文本信息和數(shù)值數(shù)據(jù)的一類數(shù)據(jù)庫。文本-數(shù)值型數(shù)據(jù)庫是指能夠同時提供文本信息和數(shù)值數(shù)據(jù)的一類15術(shù)語數(shù)據(jù)庫是指專門存儲和檢索名詞術(shù)語、詞語信息等的一種源數(shù)據(jù)庫。術(shù)語數(shù)據(jù)庫是指專門存儲和檢索名詞術(shù)語、詞語信息等的一種源數(shù)16圖像數(shù)據(jù)庫是指用來存儲和檢索各種圖像或圖形信息及有關(guān)文字說明資料的一種源數(shù)據(jù)庫。圖像數(shù)據(jù)庫是指用來存儲和檢索各種圖像或圖形信息及有關(guān)文字說17全文數(shù)據(jù)庫是指存儲和檢索文獻全文或其中主要部分的一種源數(shù)據(jù)庫。全文數(shù)據(jù)庫是指存儲和檢索文獻全文或其中主要部分的一種源數(shù)據(jù)18超文本數(shù)據(jù)庫這種數(shù)據(jù)庫存儲時將存儲內(nèi)容分割為若干獨立利用的結(jié)點,使用鏈路連接結(jié)點等方式進行存取,從而構(gòu)成一個不拘泥于形式邏輯推理,不遵循某種正規(guī)模式的一種網(wǎng)絡(luò)框架結(jié)構(gòu),因而具備了類似于數(shù)據(jù)庫又優(yōu)于一般數(shù)據(jù)庫的特點。超文本數(shù)據(jù)庫這種數(shù)據(jù)庫存儲時將存儲內(nèi)容分割為若干獨立利用的19混合數(shù)據(jù)庫這類數(shù)據(jù)庫兼有源數(shù)據(jù)庫和參考數(shù)據(jù)庫的特點,按載體形式它又可分為以下四種類型:磁媒體數(shù)據(jù)庫光盤數(shù)據(jù)庫多媒體數(shù)據(jù)庫:是一種能夠?qū)ξ淖?、?shù)值、聲音和圖像等不同性質(zhì)的媒體進行一體化處理和管理的新型數(shù)據(jù)庫超媒體數(shù)據(jù)庫。通過外部樹形的鏈接將多種類型的媒體連成一個集合,該集合稱為超媒體數(shù)據(jù)庫?;旌蠑?shù)據(jù)庫這類數(shù)據(jù)庫兼有源數(shù)據(jù)庫和參考數(shù)據(jù)庫的特點,按載體形202計算機信息檢索的發(fā)展歷史脫機批處理檢索聯(lián)機情報檢索國際聯(lián)機檢索光盤檢索網(wǎng)絡(luò)信息檢索2計算機信息檢索的發(fā)展歷史脫機批處理檢索21脫機批處理檢索1954一64。定期由專職檢索人員把許多用戶課題匯總,批量處理提問要求,并把結(jié)果提供給用戶。直接在計算機旁檢索,不需要遠程終端設(shè)備及通信網(wǎng)絡(luò)。用戶在計算機處理成批檢索課題之后才知道檢索結(jié)果,不能直接、及時修改檢索策略,查全率和查準率受到一定限制。脫機批處理檢索1954一64。定期由專職檢索人員把許多用戶課22聯(lián)機情報檢索20世紀70年代投入商業(yè)運營。用戶在計算機檢索系統(tǒng)的終端上,通過通信網(wǎng)絡(luò),使用特定的指令和算符,以人機對話方式,查詢遠程計算機檢索系統(tǒng)核心的數(shù)據(jù)庫,從中獲取所需信息的計算機檢索系統(tǒng)。聯(lián)機情報檢索20世紀70年代投入商業(yè)運營。用戶在計算機檢索系23聯(lián)機系統(tǒng)的誕生,使許多相互獨立的終端實現(xiàn)了“對話”方式的信息檢索。所謂對話方式,就是用戶利用系統(tǒng)提供的、為數(shù)不多且簡單易記的檢索命令,每次輸入一條命令或由命令組成的表達式查看結(jié)果。系統(tǒng)方面則每次顯示出可能的信息,幫助用戶選擇下次該用的命令或表達式,用戶通過與系統(tǒng)雙向?qū)υ?,可不斷改變或完善檢索策略,直至獲得滿意的檢索結(jié)果為止。聯(lián)機系統(tǒng)的誕生,使許多相互獨立的終端實現(xiàn)了“對話”方式的信息24聯(lián)機檢索系統(tǒng)由三個部分組成:主機系統(tǒng)通訊系統(tǒng)終端設(shè)備

聯(lián)機檢索系統(tǒng)由三個部分組成:25主機系統(tǒng)是聯(lián)機檢索系統(tǒng)的核心,它具備處理速度快、多道程序和分時功能,內(nèi)存容量大,多樣化的輸入輸出設(shè)備。

主機系統(tǒng)主機系統(tǒng)是聯(lián)機檢索系統(tǒng)的核心,它具備處理速度快、多道程序和分26通訊系統(tǒng)通訊系統(tǒng)是指終端設(shè)備與主機系統(tǒng)進行通信的設(shè)備。通信線路分為兩種:專用的直達線路;通過撥號選擇對方的交換線路。前者是特定通信線路,后者使用電話網(wǎng)和用戶電報網(wǎng),聯(lián)機系統(tǒng)使用的通信線路就屬于后一種。

通訊系統(tǒng)通訊系統(tǒng)是指終端設(shè)備與主機系統(tǒng)進行通信的設(shè)備。通信線27終端系統(tǒng)終端系統(tǒng)是人與系統(tǒng)的接口設(shè)備。它能將字符、聲音以及人類的信息表現(xiàn)形式轉(zhuǎn)換成系統(tǒng)的機器代碼。反之,將系統(tǒng)的結(jié)果還原成字符、聲音等形式,傳送給終端用戶。終端系統(tǒng)終端系統(tǒng)是人與系統(tǒng)的接口設(shè)備。它能將字符、聲音以及人28國際聯(lián)機檢索70年代中后期。(聯(lián)機檢索基礎(chǔ)上的擴充到國際)國際聯(lián)機檢索70年代中后期。(聯(lián)機檢索基礎(chǔ)上的擴充到國際)29優(yōu)點:這種方式可以邊檢索邊修改檢索策略,而且檢索速度快,多用戶可同時檢索,檢索不受地理位置限制,檢索功能多樣化,打印輸出靈活,檢索結(jié)果可進行多種分析處理,大大方便檢索用戶和提高檢索質(zhì)量。優(yōu)點:這種方式可以邊檢索邊修改檢索策略,而且檢索速度快,多用30缺點:注重系統(tǒng)自身工作效率的提高,如改進算法、改進存儲結(jié)構(gòu)與存取技術(shù)等;讓用戶去適應(yīng)、配合系統(tǒng),很少分析、考慮用戶對使用系統(tǒng)的要求。面向檢索專家或中介機構(gòu)。要求檢索者熟悉系統(tǒng)的一整套檢索指令和檢索技術(shù),用戶的提問必須采用規(guī)范化的檢索語言,從而依賴于專業(yè)檢索人員,用戶自己完成檢索必須受過系統(tǒng)培訓(xùn)。人機交互界面不友好,且費用較高。缺點:31光盤檢索80年代初期,其全稱為高密度光盤(CompactDisk),主要是利用激光、計算機及光電集成等技術(shù)實現(xiàn)信息存儲的數(shù)字化。以光盤為介質(zhì)的光盤數(shù)據(jù)庫檢索系統(tǒng)由于信息存儲量大,簡單易用而取勝。光盤檢索80年代初期,其全稱為高密度光盤(CompactD32優(yōu)點:一次購買,無限制使用,不必考慮檢索時間,遠程通信費用等因素;存貯容量大;檢索途徑多;適用于通信不發(fā)達,聯(lián)網(wǎng)較困難的地區(qū),是聯(lián)機檢索、網(wǎng)絡(luò)檢索的有效補充。優(yōu)點:一次購買,無限制使用,不必考慮檢索時間,遠程通信費用等33局限:數(shù)據(jù)更新有一定的周期,時效性、靈活性比不上聯(lián)機檢索;目前光盤數(shù)據(jù)庫容量有限,一般是按專業(yè)和領(lǐng)域建庫,收錄范圍不夠廣泛;適用對象的局限性,因為一次性購買費用高,對使用頻率不高的單位或個人來說成本較高;設(shè)備和軟件的兼容性較差,各種光盤數(shù)據(jù)庫檢索系統(tǒng)目前還難以實現(xiàn)標(biāo)準化和統(tǒng)一化。局限:數(shù)據(jù)更新有一定的周期,時效性、靈活性比不上聯(lián)機檢索;目34光盤檢索系統(tǒng)的構(gòu)成:計算機、CD-ROM驅(qū)動器、檢索軟件、CD-ROM數(shù)據(jù)盤。光盤檢索系統(tǒng)的構(gòu)成:計算機、CD-ROM驅(qū)動器、檢索軟件、C35網(wǎng)絡(luò)信息檢索是通過標(biāo)準通信方式將世界各地的計算機網(wǎng)絡(luò)連接起來,形成一個基于客戶機-服務(wù)器模式的網(wǎng)絡(luò)分布數(shù)據(jù)庫結(jié)構(gòu)。它在全球范圍內(nèi)把科技信息、商貿(mào)信息、經(jīng)濟信息、時事新聞以及日常生活信息通過互聯(lián)網(wǎng)絡(luò)合在一起,向億萬聯(lián)網(wǎng)用戶提供廣泛的信息檢索與服務(wù)。它是信息化社會應(yīng)用最廣泛、最活躍的領(lǐng)域。網(wǎng)絡(luò)信息檢索是通過標(biāo)準通信方式將世界各地的計算機網(wǎng)絡(luò)連接起來36網(wǎng)絡(luò)信息檢索服務(wù)的特點:信息檢索服務(wù)的開放性超文本的多鏈接性用戶界面友好且操作方便具備良好的導(dǎo)航和編輯功能網(wǎng)絡(luò)信息檢索服務(wù)的特點:信息檢索服務(wù)的開放性37信息檢索服務(wù)的開放性網(wǎng)絡(luò)信息系統(tǒng)中包含信息資源、信息設(shè)備、信息通道、信息檢索軟件及信息終端等子系統(tǒng),各個子系統(tǒng)都是開放的,其信息資源面向所有用戶。信息檢索服務(wù)的開放性網(wǎng)絡(luò)信息系統(tǒng)中包含信息資源、信息設(shè)備、38超文本的多鏈接性以超文本技術(shù)為基礎(chǔ)鏈結(jié)構(gòu)將不同地方的相關(guān)信息有機聯(lián)系起來,使用戶可通過點擊文本或圖表中的超文本鏈接點訪問另一個相關(guān)的文檔。超文本的多鏈接性以超文本技術(shù)為基礎(chǔ)鏈結(jié)構(gòu)將不同地方的相關(guān)信39用戶界面友好且操作方便采用客戶機/服務(wù)器結(jié)構(gòu),通過交互式的圖形界面,為用戶提供友好的信息查詢要求,檢索途徑多,可保留檢索歷史。正是這一特點,使Internet能廣泛深入學(xué)校、家庭、辦公室乃至每一個人。用戶界面友好且操作方便采用客戶機/服務(wù)器結(jié)構(gòu),通過交互式的40具備良好的導(dǎo)航和編輯功能網(wǎng)絡(luò)信息檢索一般都可以引導(dǎo)讀者在復(fù)雜的網(wǎng)絡(luò)信息資源中漫游而不致迷失方向,用戶可以利用導(dǎo)航機制,了解其所在網(wǎng)絡(luò)圖中的位置。網(wǎng)絡(luò)信息檢索具有良好的編輯功能,包括修改、增加、刪除節(jié)點和鏈的能力,此外對節(jié)點內(nèi)的信息也具有良好的編輯能力,可進行多窗口編輯。具備良好的導(dǎo)航和編輯功能網(wǎng)絡(luò)信息檢索一般都可以引導(dǎo)讀者在復(fù)413計算機檢索技術(shù)與實現(xiàn)布爾邏輯檢索位置算符截詞檢索詞組檢索括號檢索字段限制檢索3計算機檢索技術(shù)與實現(xiàn)布爾邏輯檢索42布爾邏輯檢索即運用布爾邏輯算符(Booleanoperators)對檢索詞盡心邏輯組配,表達兩個概念之間的邏輯關(guān)系。布爾邏輯算符主要有:ANDORNOT在中文數(shù)據(jù)庫里,布爾邏輯運算符又是用AND、OR、NOT表示,有時用“*“、”+“及”-“。布爾邏輯檢索即運用布爾邏輯算符(Booleanoperat43邏輯與(邏輯乘)用運算符號:AND或*連接檢索詞例查“有關(guān)計算機在圖書館中的應(yīng)用”的文獻,檢索式=計算機*圖書館

AANDB

A

B邏輯與(邏輯乘)用運算符號:AND或*連接檢索詞44邏輯或用運算符號“OR”或“+”連接兩檢索詞例1查“蘋果或梨”方面的文獻檢索式=蘋果+梨它在同義詞檢索中使用,能提高查全率。例2查“計算機或機器人”方面的文獻檢索式=計算機+機器人

AORB

A

B邏輯或用運算符號“OR”或“+”連接兩檢索詞45邏輯非用運算符號“NOT”或“—”連接兩檢索詞ANOTB例1查“玉米但不是甜玉米”方面的文獻。檢索式=玉米—甜玉米例2查“不是鉻合金”方面的文獻。檢索式=合金—鉻

ANOTB

A

B邏輯非用運算符號“NOT”或“—”連接兩檢索詞ANO46位置算符檢索文獻記錄中詞語的相對次序不同,所表達的意思就可能不同。同樣在檢索式中,檢索詞的相對次序不同,表達的檢索意圖也不一樣,布爾邏輯運算符有時難以表達某些檢索課題的確切提問要求,用詞間位置算符來限定和組配檢索詞,可彌補布爾邏輯算符只是定性規(guī)定檢索詞的范圍,而沒有限定檢索詞位置關(guān)系,易造成誤檢的不足。位置算符檢索文獻記錄中詞語的相對次序不同,所表達的意思就可能47位置算符檢索就是利用一些特定的位置算符來表達檢索詞之間的位置關(guān)系,并且可以不用敘詞表而直接使用自由詞進行檢索的方法。有的書上還把這種檢索稱為原文檢索。這種檢索在利用TI和AB途徑檢索時,對檢索質(zhì)量影響很大。常用的位置算符有:W、W/N、WITH、WITHIN、nW、PRE、N、NEAR、ADJ、nN、F、SAME位置算符檢索就是利用一些特定的位置算符來表達檢索詞之間的位置48W、W/N、WITH、WITHIN功能:兩詞相鄰,按輸入時順序排列(也有數(shù)據(jù)庫允許順序顛倒)表達式:Education(W)school或EducationWITHschool檢索結(jié)果:Educationschool;educationschoolsW、W/N、WITH、WITHIN功能:兩詞相鄰,按輸入時順49nW功能:兩詞相鄰,按輸入時順序排列(也有數(shù)據(jù)庫允許順序顛倒),兩詞之間允許插入0~n個詞。表達式:Education(1W)school檢索結(jié)果:Educationschool;educationschools;Educationandmusicschool;nW功能:兩詞相鄰,按輸入時順序排列(也有數(shù)據(jù)庫允許順序顛倒50PRE功能:兩詞相鄰,按輸入順序排列表達式:EducationPREschool檢索結(jié)果:EducationschoolEducationschoolsPRE功能:兩詞相鄰,按輸入順序排列51N、NEAR、ADJ功能:兩詞相鄰,順序可以顛倒表達式:Education(N)schoolEducationNEARschool檢索結(jié)果:EducationschoolEducationschoolsSchoolofEducationN、NEAR、ADJ功能:兩詞相鄰,順序可以顛倒52nN功能:兩詞相鄰,順序可以顛倒,兩詞中間可以插入0~n個詞表達式:Education(1N)school檢索結(jié)果:EducationschoolschoolofeducationEducationandsicschoolschoolofmusicandeducationnN功能:兩詞相鄰,順序可以顛倒,兩詞中間可以插入0~n個詞53F功能:兩詞必須出現(xiàn)在同一字段中,詞序與詞量不限表達式:Education(F)school/DE檢索結(jié)果:Education和school必須同時出現(xiàn)在敘詞字段內(nèi)即可F功能:兩詞必須出現(xiàn)在同一字段中,詞序與詞量不限54SAME功能:兩詞出現(xiàn)在同一自然句中,其詞序與詞量不受限制表達式:EducationSAMEschool檢索結(jié)果:Education和school兩詞出現(xiàn)在同一句子中即可。SAME功能:兩詞出現(xiàn)在同一自然句中,其詞序與詞量不受限制55截詞檢索截詞運算符號有兩個:“?、*”。其在不同系統(tǒng)中表示的含義不同。原因:在英語詞匯中,一個詞可能有多種形態(tài),如詞的單、復(fù)數(shù)形式的不同,英美拼寫方法不同、詞性不同等。截詞檢索截詞運算符號有兩個:“?、*”。其在不同系統(tǒng)中表示56有限截詞。即在檢索詞后后截幾個有限的字母,如名詞的單復(fù)數(shù),動詞的詞尾變化等。

如輸入computer??表示有0-2個字母變化,可檢出computer和computers.

輸入stud???表示截斷處有0-3個字母變化,可檢出study,studies,studied,studing.

有限截詞。即在檢索詞后后截幾個有限的字母,如名詞的單復(fù)數(shù),動57無限截斷:在檢索詞后加一個“*“,表示該詞后可加任意個字符。使用無限截詞,所截詞根不能太短,否則會輸出許多無關(guān)文獻,造成誤檢。如:computer*可檢出computers,computering,computered,computerization.

無限截斷:在檢索詞后加一個“*“,表示該詞后可加任意個字符。58中間截斷:在檢索詞中間加一個或幾個?號,主要解決一些英美拼寫不同,單復(fù)數(shù)形式的不同的詞的輸入,可簡化輸入。

如:輸入wom?n可檢出woman,women中間截斷:在檢索詞中間加一個或幾個?號,主要解決一些英美拼寫59截詞檢索在中文數(shù)據(jù)庫中截的是詞意,例:西北?分別檢出了:西北農(nóng)林科技大學(xué)學(xué)報、西北園藝、西北紡織學(xué)院學(xué)報等。截詞檢索在中文數(shù)據(jù)庫中截的是詞意,60在外文數(shù)據(jù)庫中截的是詞的后綴,截斷派生出的詞匯和原來的詞義基本一致。例“金屬”metal*metal、metals、metaled、metalist等。在外文數(shù)據(jù)庫中截的是詞的后綴,截斷61利用截詞檢索時,注意截詞的部位,一定不能截的太深,否則誤檢率會很大。利用截詞檢索時,注意截詞的部位,一定不能截的太深,否則誤檢率62詞組檢索將一個詞組或短語用雙引號“”””括起作為一個獨立運算單元,進行嚴格匹配,以提高檢索準確度。如:“GlobalPositioningSystem”,只檢索出規(guī)定字段中包含完整詞組的記錄。詞組檢索將一個詞組或短語用雙引號“”””括起作為一個獨立運63括號檢索用于改變運算的先后次序,括號內(nèi)的做優(yōu)先運算。

用“()”可以表示優(yōu)先級。

如比較(GPSORGIS)ANDChina

GPSORGISANDChina括號檢索用于改變運算的先后次序,括號內(nèi)的做優(yōu)先運算。

用“(64字段限制檢索將檢索詞限定在某一字段中,檢索時,計算機只對限定字段進行運算,以提高檢索效果。常用的檢索符號有:in、=、<、>、≤、≥例:Englishinla字段限制檢索將檢索詞限定在某一字段中,檢索時,計算機只對限定65總結(jié):在一個復(fù)雜的檢索式中,不僅可以有多個運算符,也可以使用括號來指定運算的優(yōu)先順序、以及體現(xiàn)概念的完整性??偨Y(jié):在一個復(fù)雜的檢索式中,不僅可以有多個運算符,也可以使用664計算機檢索策略與事實技巧分析檢索課題,明確檢索目的和要求選擇數(shù)據(jù)庫編制檢索提問式、選擇檢索入口上機檢索及反饋調(diào)節(jié)4計算機檢索策略與事實技巧分析檢索課題,明確檢索目的和要求67分析檢索課題,明確檢索目的和要求明確檢索的要求和目的,是制定檢索策略的前提。由于各類用戶的檢索要求和目的受其社會因素和個人因素的制約,是各不相同的。因此,在著手信息檢索之前,必須全面地了解清楚用戶的信息需求和檢索目的、檢索的學(xué)科內(nèi)容、主題范疇。根據(jù)社科信息用戶的文獻需求特點,其需求不外乎以下四種類型:分析檢索課題,明確檢索目的和要求明確檢索的要求和目的,是制定68了解學(xué)科發(fā)展動態(tài)的要求了解某一研究主題的片斷性信息了解某一研究主題的全面性信息檢索特定的文獻信息了解學(xué)科發(fā)展動態(tài)的要求69了解學(xué)科發(fā)展動態(tài)的要求這類信息需求的特點是一個“新”字,即用戶要求及時獲得學(xué)科前沿研究的最新動態(tài)、最新進展和研究成果。針對用戶的這類檢索要求,在選擇數(shù)據(jù)庫時,除了必須考慮選擇在學(xué)科內(nèi)容方面與檢索要求相吻合的基本要求外,還應(yīng)注意考慮到信息內(nèi)容更新周期短的因素。了解學(xué)科發(fā)展動態(tài)的要求這類信息需求的特點是一個“新”字,即用70了解某一研究主題的片斷性信息這類信息旨在借鑒他人研究成果,用以解決研究中碰到的具體問題。這類信息需求的量最大,其特點是一個“準”字。即檢出的信息應(yīng)有針對性,能幫助解決具體問題。因此,在數(shù)據(jù)庫選擇方面,除了注意內(nèi)容主題的匹配外,還應(yīng)注意原始文獻的易獲取性,最好選擇全文數(shù)據(jù)庫。了解某一研究主題的片斷性信息這類信息旨在借鑒他人研究成果,71了解某一研究主題的全面性信息出于基礎(chǔ)理論研究、編寫教材及申請課題的需要,用戶往往需要全面系統(tǒng)地收集某一個主題范圍內(nèi)的文獻資料,這類檢索具有橫向普查、縱向追溯的特點,并對查全率有較高的要求。因此,針對這類檢索類型在選擇數(shù)據(jù)庫時,要注意選擇存儲容量大,覆蓋年限長,具有較強隨機存取能力的數(shù)據(jù)庫。了解某一研究主題的全面性信息出于基礎(chǔ)理論研究、編寫教材及申72檢索特定的文獻信息用戶已經(jīng)知道文獻的題名、作者,而只是要求獲取原文。對這類用戶需求只需要選擇與學(xué)科主題相吻合的數(shù)據(jù)庫。檢索特定的文獻信息用戶已經(jīng)知道文獻的題名、作者,而只是要求73除了需要了解清楚用戶信息檢索的要求和目的外,了解清楚待查找文獻的年限、文獻類型、語種和檢索費用的支付能力等情況,對制定正確的檢索策略也很重要。不同類型的信息需求,對查全率和查準率的要求不盡相同,對選擇數(shù)據(jù)庫的要求也存有差異。因此,在后續(xù)制定檢索策略時,也應(yīng)區(qū)別對待。除了需要了解清楚用戶信息檢索的要求和目的外,了解清楚待查找74選擇數(shù)據(jù)庫數(shù)據(jù)庫檢索的正確與否將直接影響到檢索結(jié)果的好壞。數(shù)據(jù)庫選擇不當(dāng),就會得出完全不符合要求的結(jié)果。選庫時要遵循以下原則:選擇數(shù)據(jù)庫數(shù)據(jù)庫檢索的正確與否將直接影響到檢索結(jié)果的好壞。數(shù)75要根據(jù)用戶信息檢索的學(xué)科內(nèi)容和目的選擇數(shù)據(jù)庫。如果檢索課題涉及的內(nèi)容全面而廣泛,為了避免漏檢,應(yīng)同時選擇幾個不同的庫,如需檢索的課題內(nèi)容專業(yè)性很強,則可以選擇專業(yè)文檔進行檢索。要根據(jù)用戶信息檢索的學(xué)科內(nèi)容和目的選擇數(shù)據(jù)庫。如果檢索課題涉76在同時有幾個數(shù)據(jù)庫可供檢索的情況下,應(yīng)首先選擇比較熟悉的數(shù)據(jù)庫。這樣能既快速又準確地查找到真正需要的文獻信息。在同時有幾個數(shù)據(jù)庫可供檢索的情況下,應(yīng)首先選擇比較熟悉的數(shù)據(jù)77當(dāng)幾個數(shù)據(jù)庫的內(nèi)容交叉重復(fù)率比較高時,應(yīng)選擇檢索費用比較低廉的數(shù)據(jù)庫。當(dāng)用戶要求檢索的文獻量比較大時,可首先用瀏覽的方式,按主題或?qū)W科專業(yè)的方式查找。當(dāng)幾個數(shù)據(jù)庫的內(nèi)容交叉重復(fù)率比較高時,應(yīng)選擇檢索費用比較低廉78編制檢索式,選擇檢索入口利用各種算符構(gòu)造檢索式,然后選擇檢索入口即字段,如:題名、著者、主題詞、文摘、全文等。用主題詞在主題范圍(或字段)、文摘范圍、題名范圍、全文范圍檢索稱主題途徑用著者姓名在著者范圍檢索稱著者途徑用分類號進行分類檢索稱分類途徑用專利號、分子式檢索稱其它途徑編制檢索式,選擇檢索入口利用各種算符構(gòu)造檢索式,然后選擇檢索79分類途徑是按照學(xué)科分類體系查找文獻的途徑,采用的是“分類目錄”和“分類索引”。按分類進行查找,用分類途徑能夠把同一學(xué)科的文獻信息集中在一起檢索出來。其缺點是分類表是事先編制好的,一些新學(xué)術(shù)論文增補不及時,依此途徑檢索,所得文獻容易落后于學(xué)科發(fā)展;又由于每篇文獻是按學(xué)科規(guī)類的,查出的結(jié)果涉及面寬,針對性不強,因而還需要進一步篩選。分類途徑要確定的檢索點是分類號,根據(jù)分類號編制檢索式。分類途徑是按照學(xué)科分類體系查找文獻的途徑,采用的是“分類目錄80主題途徑根據(jù)文獻的主題特征,利用各類主題目錄和索引進行檢索的途徑,即利用從文獻中抽象出來的或經(jīng)過人工規(guī)范化的,能夠代表文獻內(nèi)容的詞來檢索。主題目錄和主題索引就是將文獻按表征其內(nèi)容特征的主題詞組織起來的索引系統(tǒng)。利用主題途徑檢索時,只要根據(jù)所選用主題詞的字順(字母順序、音序、筆畫順序等)找到所查主題詞,就可查得相關(guān)文獻。主題途徑具有直觀、專指、方便等特點,打破了按學(xué)科分類的方法,時分散在各個學(xué)科領(lǐng)域里的有關(guān)課題的文獻集中于同一主題。主題途徑要確定的檢索點是檢索詞,根據(jù)檢索詞確定檢索式。檢索詞的確定要進一步分析課題得出。主題途徑根據(jù)文獻的主題特征,利用各類主題目錄和索引進行檢索的81分析檢索課題,確定檢索詞檢索詞是表達用戶信息需求和檢索課題內(nèi)容的基本元素,也是計算機檢索系統(tǒng)進行匹配的基本單元。正確的主題分析是制定檢索策略的保證,它決定了檢索策略的質(zhì)量和檢索效果的好壞。因此,務(wù)必要在分析課題的主題概念中掌握課題的內(nèi)容實質(zhì),概括出能最恰當(dāng)?shù)卮碇黝}概念的檢索詞。分析檢索課題,確定檢索詞檢索詞是表達用戶信息需求和檢索課題內(nèi)82使用標(biāo)準化的術(shù)語分析出課題內(nèi)容實質(zhì)從相應(yīng)的規(guī)范詞表中選定所需的檢索詞注意同義詞、近義詞其它使用標(biāo)準化的術(shù)語83使用標(biāo)準化的術(shù)語盡管在不少數(shù)據(jù)庫中都允許使用關(guān)鍵詞檢索。但是,在選用關(guān)鍵詞的過程中切忌使用國際上不通行的術(shù)語,避免使用冷僻詞和自選詞。如“第三世界”、“下崗”這樣的詞不能達到預(yù)期的效果。使用標(biāo)準化的術(shù)語盡管在不少數(shù)據(jù)庫中都允許使用關(guān)鍵詞檢索。但84分析出課題內(nèi)容實質(zhì)尋找出隱性的主題概念。使用最吻合于檢索要求的檢索詞。分析課題的內(nèi)容實質(zhì)不僅要從課題名稱中找出能滿足檢索課題要求的檢索詞,而且要從學(xué)科專業(yè)和檢索目的的角度,根據(jù)出能夠反映課題實質(zhì)內(nèi)容的主題詞。例如,社會保險包含“養(yǎng)老保險”、“失業(yè)保險”、“醫(yī)療保險”和“社會救濟”等下位概念,要根據(jù)需要選取主題詞。

分析出課題內(nèi)容實質(zhì)尋找出隱性的主題概念。使用最吻合于檢索要85從相應(yīng)的規(guī)范詞表中選定檢索詞由于主題詞是文獻標(biāo)引和檢索中必須共同遵循使用的語言,而且很多數(shù)據(jù)庫都有自己的主題詞表,所以在有數(shù)據(jù)庫專用詞表的情況下,應(yīng)優(yōu)先選用詞表中的規(guī)范詞,以便能使檢索獲得最佳的效果。從相應(yīng)的規(guī)范詞表中選定檢索詞由于主題詞是文獻標(biāo)引和檢索中必86注意同義詞、近義詞在確定檢索詞時,除了要考慮反映主題概念的同義詞、近義詞等相關(guān)詞以外,還要注意到被選用詞的縮寫詞及不同拼法的詞,以便在編制檢索式時考慮到這些因素,避免漏檢有關(guān)的文獻。注意同義詞、近義詞在確定檢索詞時,除了要考慮反映主題概念的同87從詞表規(guī)定的專業(yè)范圍出發(fā),選用各學(xué)科內(nèi)具有檢索意義的基本名詞術(shù)語避免使用頻率低的詞多選用基本詞匯進行組配一般不選動詞和形容詞等從詞表規(guī)定的專業(yè)范圍出發(fā),選用各學(xué)科內(nèi)具有檢索意義的基本名詞88檢索詞的分析方法內(nèi)取法:從課題字面上分解出檢索詞外概法:從題意中概括出檢索詞檢索詞的分析方法89著者途徑利用著者(個人或單位著者)目錄和著者索引進行檢索的途徑。國外對著者途徑非常重視,許多檢索工具都把著者索引作為最基本的輔助索引。著者途徑的特點是:科研人員一般是各有所長,尤其是有些領(lǐng)域的知名學(xué)者、專家,他們的文章一般都代表了一定的水平和動向,通過著者線索,可以系統(tǒng)地發(fā)現(xiàn)和掌握他們研究的進展和他們的最新論著。一定程度上可以引導(dǎo)查找到同類或相關(guān)文獻。這種途徑的檢索既快速又方便,但查得的文獻缺乏系統(tǒng)性和完整性。

著者途徑利用著者(個人或單位著者)目錄和著者索引進行檢索的途90其它途徑根據(jù)文獻的序號特征,利用其序號索引進行檢索的途徑。許多文獻具有唯一的序號,如ISBN、ISSN、專利號等。根據(jù)這些序號可真誠不同的序號索引。在已知序號的前提下,利用序號途徑能方便地查找所需文獻。其它途徑根據(jù)文獻的序號特征,利用其序號索引進行檢索的途徑。許91常用檢索途徑的檢索效率分類途徑:利用分類名和分類號進行檢索。其結(jié)果是該類目所有的文獻,檢索結(jié)果較全。題名(篇名)途徑:利用篇名中的字詞或篇名的一部分進行檢索。其結(jié)果是所有在篇名中出現(xiàn)該字、該詞或該部分的文章,檢索結(jié)果較準。主題詞/關(guān)鍵詞途徑:利用文章篇首標(biāo)明的與該篇文獻主題相關(guān)的詞進行檢索。其結(jié)果是包含該主題詞或關(guān)鍵詞的所有文獻,結(jié)果較準。著者途徑:利用文獻作者

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論