第二章文獻(xiàn)檢索_第1頁
第二章文獻(xiàn)檢索_第2頁
第二章文獻(xiàn)檢索_第3頁
第二章文獻(xiàn)檢索_第4頁
第二章文獻(xiàn)檢索_第5頁
已閱讀5頁,還剩55頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第二章

計(jì)算機(jī)檢索基礎(chǔ)知識(shí)第一節(jié)電子信息資源概述

一、電子信息資源的概念

二、電子信息資源的類型三、電子信息資源的特點(diǎn)一、電子信息資源的概念

電子資源就是電子化了的信息資源。

是機(jī)讀型信息資源。是一種通過編碼和程序設(shè)計(jì),把文字、圖形、聲音、動(dòng)畫等多種形式的信息轉(zhuǎn)換成數(shù)字語言和機(jī)器語言,以磁性材料為介質(zhì),以電信號(hào)、光信號(hào)的形式傳輸,并通過網(wǎng)絡(luò)通信、計(jì)算機(jī)或終端等方式再現(xiàn)出來的一種信息資源。二、電子信息資源的類型

1、按信息表現(xiàn)形式分:(1)文本信息資源:是按知識(shí)單元的線性順序排列組織的資源。(2)超文本信息資源:

它是一種非線性方式建立和表示離散信息關(guān)系的技術(shù)。邏輯連接任意連接(3)多媒體信息資源:

包括文本、圖像和聲音等各種信息表達(dá)的總稱

(4)超媒體信息資源:

源于超文本,又是它的擴(kuò)充。是超文本和多媒體技術(shù)的結(jié)合,具有超文本和多媒體兩種信息資源的特點(diǎn).包括了文本、靜態(tài)圖形、動(dòng)畫、動(dòng)態(tài)圖像和聲音等多種信息。2、按信息存儲(chǔ)載體分:

光盤信息資源網(wǎng)絡(luò)信息資源(即在第一章光盤檢索系統(tǒng)、網(wǎng)絡(luò)化信息檢索系統(tǒng)中的信息資源)3、按信息交流方式分

(1)非正式出版信息:

包括電子郵件、網(wǎng)絡(luò)論壇、電子會(huì)議和電子布告版新聞等

(2)半正式出版信息:

受到一定知識(shí)產(chǎn)權(quán)保護(hù),但沒有納入正式出版信息系統(tǒng)的描述性網(wǎng)絡(luò)信息。包括內(nèi)部電子期刊、會(huì)議文集和各類報(bào)告、機(jī)構(gòu)情況及產(chǎn)品介紹等。

(3)正式出版信息:

受到知識(shí)產(chǎn)權(quán)保護(hù),信息質(zhì)量可靠,利用率較高的知識(shí)性、分析性網(wǎng)絡(luò)信息。

一次出版信息:電子圖書、電子期刊、電子報(bào)紙等;二次出版信息:搜索引擎、檢索數(shù)據(jù)庫、網(wǎng)絡(luò)導(dǎo)航等;三次出版信息:網(wǎng)絡(luò)述評(píng)、參考數(shù)據(jù)庫、網(wǎng)站推薦等。

三、電子信息資源的特點(diǎn)(1)信息組織形式發(fā)生變化:

由傳統(tǒng)的文本形式發(fā)展為超文本、超多媒體等多種形式。(2)數(shù)字化:

信息資源由紙張的文字變成磁性介質(zhì)上的電磁信號(hào),存儲(chǔ)的信息資源密度高,容量大,可無損耗反復(fù)的使用。

(3)內(nèi)容豐富多彩

(4)數(shù)據(jù)結(jié)構(gòu)具有通用性、開放性、動(dòng)態(tài)性(5)信息資源體積小,數(shù)量巨大(6)傳播方式的無限性(7)交互性第二節(jié)數(shù)據(jù)庫

一、數(shù)據(jù)庫的概念二、數(shù)據(jù)庫的類型三、數(shù)據(jù)庫結(jié)構(gòu)

一、數(shù)據(jù)庫的概念

在計(jì)算機(jī)存貯設(shè)備上按一定方式存貯的相互關(guān)聯(lián)的數(shù)據(jù)集合,就是數(shù)據(jù)庫。

數(shù)據(jù)庫則是計(jì)算機(jī)與信息檢索技術(shù)相結(jié)合的產(chǎn)物。是計(jì)算機(jī)檢索的基礎(chǔ)。要建立計(jì)算機(jī)檢索系統(tǒng),必須對(duì)所收集到的大量文獻(xiàn)資料按一定的體系和規(guī)則加以處理,使之成為機(jī)讀形式的數(shù)據(jù)。

二、數(shù)據(jù)庫的類型

1、參考數(shù)據(jù)庫(referencedatabases)

(1)書目數(shù)據(jù)庫(bibliographicdatabases):用于存儲(chǔ)二次文獻(xiàn)(目錄、題錄、文摘等書目數(shù)據(jù))的一類數(shù)據(jù)庫(2)指南數(shù)據(jù)庫(referencedatabases):是指存儲(chǔ)有關(guān)機(jī)構(gòu)、人物、出版物、項(xiàng)目、產(chǎn)品、活動(dòng)等對(duì)象的簡(jiǎn)要描述。2、源數(shù)據(jù)庫(sourcedatabases):

能直接提供原始信息或具體數(shù)據(jù)的一類數(shù)據(jù)庫。用戶不必再查閱其他信息源即可獲得原始信息。

全文數(shù)據(jù)庫(full-textdatabases)數(shù)值數(shù)據(jù)庫(numericdatabases)文本-數(shù)值數(shù)據(jù)庫(textual-numericdatabases)、

術(shù)語數(shù)據(jù)庫(terminologicalbank)圖像數(shù)據(jù)庫(graphicsdatabases)事實(shí)數(shù)據(jù)庫(factdatabases)。

3、混合數(shù)據(jù)庫(mixeddatabases):

是指能同時(shí)存儲(chǔ)多種不同類型數(shù)據(jù)的一種源數(shù)據(jù)庫。

三、數(shù)據(jù)庫結(jié)構(gòu):

若干字段→若干記錄→若干文檔→數(shù)據(jù)庫1、字段

也稱數(shù)據(jù)項(xiàng)、檢索項(xiàng),是計(jì)算機(jī)檢索的最基本單位。每條文獻(xiàn)的每個(gè)著錄項(xiàng),在計(jì)算機(jī)檢索中稱為字段。

字段是檢索信息的入口,信息在存儲(chǔ)到數(shù)據(jù)庫中時(shí),將能反映其特征的項(xiàng)目進(jìn)行分解,并按字段的形式存儲(chǔ),以供在需要時(shí)可以從不同的角度進(jìn)行檢索。(1)存取號(hào)字段

AN=AccessNumber(2)基本字段:描述文獻(xiàn)主題性質(zhì)或內(nèi)容的字段

文獻(xiàn)標(biāo)題(TI)title

文摘(AB)abstract

主題詞(DE)descriptor

關(guān)鍵詞(KW)keyword

(3)輔助字段:描述與主題內(nèi)容無關(guān)的字段

Au=Author

著者字段

SO=Source

文獻(xiàn)出處字段

PY=PublicationYear

出版年字段

LA=Language

語種字段

CS=CorporateSource

團(tuán)體著者字段

JN=JournalName

期刊名稱字段

DT=DocumentType

文獻(xiàn)類型字段

PN=PatentNumber

專利號(hào)字段

ProductName

產(chǎn)品名稱字段

IC=IPC

國際專利分類號(hào)字段

CT=ConferenceTitle

會(huì)議名稱字段

CY=ConferenceYear

會(huì)議召開年字段2、記錄作為一個(gè)單位來處理的一組相關(guān)的數(shù)據(jù),它是字段的集合體,也是信息的完整體現(xiàn)。文檔中的一個(gè)記錄就是一篇文獻(xiàn)的題錄或文摘。3、文檔經(jīng)過組織加工后存儲(chǔ)在計(jì)算機(jī)中的一組文獻(xiàn)稱為文檔。信息數(shù)據(jù)庫是由文檔組成的,一個(gè)計(jì)算機(jī)檢索系統(tǒng)中的數(shù)據(jù)庫可能是由一個(gè)文檔組成,也可是由多個(gè)文檔組成。同樣內(nèi)容的文件,稱為一個(gè)文檔。第三節(jié)

計(jì)算機(jī)檢索的技術(shù)和步驟

一、計(jì)算機(jī)檢索的技術(shù)二、計(jì)算機(jī)檢索步驟

一、計(jì)算機(jī)檢索的技術(shù)

1、布爾邏輯檢索計(jì)算機(jī)檢索的基本技術(shù)就是在制定檢索策略時(shí)利用布爾邏輯算符進(jìn)行檢索項(xiàng)的邏輯組配,即進(jìn)行概念組配。就是要考慮單一概念、復(fù)雜概念、并列概念如何組配,以構(gòu)成檢索提問式。目的是為了擴(kuò)大檢索或縮小檢索范圍,提高查準(zhǔn)率、查全率,提高檢索速度。(1)邏輯與:

用“and”或“*”表示。概念交叉和限定關(guān)系的一種組配。

例如:生物學(xué)中計(jì)算機(jī)圖象處理生物學(xué)*計(jì)算機(jī)*圖象處理

(2)邏輯或,用“or”或用“+”表示。是具有概念并列關(guān)系的一種組配。

例如:檢索三廢處理方面文獻(xiàn)

廢氣+廢水+

廢物廢氣廢水廢物(3)邏輯非,用“not”或用“-”表示。是具有概念刪除關(guān)系的一種組配,從原概念中刪除一部分不需要的內(nèi)容。

例如:要檢出中國科學(xué)技術(shù)大學(xué)化工方面的文獻(xiàn),除錢逸泰的文獻(xiàn)中國科學(xué)技術(shù)大學(xué)化工方面錢逸泰布爾邏輯算符,其優(yōu)先級(jí)為not、and、or,有括號(hào)先運(yùn)行括號(hào)里的。

例子:蒸餾中的溫度、壓力、流動(dòng)影響方面的文獻(xiàn):蒸餾*(溫度+壓力+流動(dòng))

2、截詞檢索和范圍檢索:

截詞符“?”:

用來截去檢索詞中某些字符,來表示檢索詞單、復(fù)數(shù)形式或英美不同拼法或同一詞詞尾的多種變化等(1)無限截詞:用一個(gè)“?”表示例如:comput?

表示含有

computercomputerscomputingcomputation

都符合要求(2)有限截詞:

用二個(gè)“??”,中間空一格,表示截1位。第一個(gè)“?”表示截1位,第二個(gè)“?”表示終止。

例如:dye?

?

(染料,染色

)表示含有dye、dyed、dyes都符合要求。

“?

?”表示截二位,即詞尾最多2個(gè)字母。例如:univers??

表示含有universe(宇宙,萬物,世界)、universal(adj.普遍的,通用的

)都符合要求。

“???”,表示截三位,即詞尾最多3個(gè)字母。

例如:cand???

表示含有candy(糖果)、candiescandied(adj.糖果的,甜蜜的)

都符合要求。(3)中間截詞:

例如:wom?n表示含有women、woman都符合要求。又如:

fib??board表示含有fibreboard(纖維板)、fiberboard都符合要求。

范圍符

“:”用范圍符來限定檢索的類目、時(shí)間、存取號(hào)等的范圍。例如:檢索90年到97年的文獻(xiàn)

PY=1990:PY=1997

3、位置檢索:

用來限定檢索詞相互間的鄰近關(guān)系,在記錄中出

現(xiàn)的順序、位置。

位置算符表示方法說明with(W)或()兩個(gè)詞在命中結(jié)果中相鄰(可有空格、標(biāo)點(diǎn)和連字符),詞序不得顛倒。(nW)兩個(gè)詞之間最多可夾入n個(gè)詞,詞序不得顛倒。near(N)兩個(gè)詞在命中結(jié)果中相鄰,詞序可顛倒。(nN)兩個(gè)詞之間最多可夾入n個(gè)詞,詞序可顛倒。field(F)兩個(gè)詞在同一字段出現(xiàn),位置不固定。subfield(S)兩個(gè)詞在同一子字段出現(xiàn),位置不固定。(1)(W)或()和(nW):

(W)或():表示在算符兩側(cè)的檢索詞必須按詞序排列,不能顛倒,兩詞之間不允許有其他詞或字母,但允許有空格和“-”符。

例如:computer()aided()design計(jì)算機(jī)輔助設(shè)計(jì)(nW):表示在算符兩側(cè)的檢索詞之間最多允許插入n個(gè)詞,包括實(shí)詞和虛詞,兩個(gè)檢索詞不能顛倒。

例如:輸入communication(2w)satellite

檢索出:

communicationsatellite

communicationthroughsatellite

communicationonthesatellite

(2)(N)和(nN)

(N):

(Near)表示算符兩側(cè)的檢索詞必須緊密相連,但詞序可以顛倒,不得插入其它詞。(nN):表示在算符兩側(cè)的檢索詞之間最多允許插入n

個(gè)詞包括實(shí)詞和虛詞,兩個(gè)檢索詞詞序可顛倒。

例如:輸入cotton(2n)processing檢索出:cottonprocessing、

cottonofprocessing、

processingofEgyptiancotton

(3)

(F)(Field)

表示在算符兩側(cè)的檢索詞必須同時(shí)出現(xiàn)在文獻(xiàn)記錄的同一字段,兩詞詞序不限,中間插入詞的數(shù)量不限。例如:輸入pollution(F)control

污染控制表示在同一字段中檢索出含有:pollution

control的文獻(xiàn)。

在題名字段中,題名為controlandmanagementofindustrialpollution

符合要求。

(3)

(S)(Subfield

或Sentence的縮寫)

表示在算符兩側(cè)的檢索詞必須同時(shí)出現(xiàn)在文獻(xiàn)的同一子字段中,即同一句子或短語中,檢索范圍比(F)小,檢索結(jié)果準(zhǔn)確。

4、限制檢索:

是指檢索系統(tǒng)中提供的縮小或約束檢索結(jié)果的檢索方法。

(1)字段檢索:用于限制檢索詞出現(xiàn)的字段。每一個(gè)字段都有特定的代碼?;緳z索字段:

文摘(AB)

篇名(TI)

敘詞或主題詞(DE)關(guān)鍵詞(KW)

分類號(hào)(CC)

全文(full-text)

DE:Descriptor

CC:ClassificationCode例如:

television/TI

在篇名字段中找出電視的文獻(xiàn)

television/AB在文摘字段中找出電視的文獻(xiàn)

Au=Smith,J.C

在著者字段中找出Smith,J.C

發(fā)表的文獻(xiàn)

JN=EnvironmentManagement在期刊名稱字段中檢索刊名為EnvironmentManagement的刊物

DT=Patent在文獻(xiàn)類型字段里檢索專利文獻(xiàn)(2)二次檢索:

檢索結(jié)果中再檢索。有二種表示方式:在結(jié)果中再查、在結(jié)果中去除課后練習(xí)1.常用的布爾邏輯算符有哪些?它們的優(yōu)先級(jí)是什么?2.數(shù)據(jù)庫的類型有哪三種?3.范圍符的形式和含義?4.截詞符的含義?5.常用的位置算符及含義?二、計(jì)算機(jī)檢索步驟

1、分析研究課題

(1)課題的主題內(nèi)容(2)課題所涉及的學(xué)科的范圍(3)課題所需的信息的內(nèi)容

(4)確定課題所需信息的類型

(5)明確課題對(duì)檢索深度的要求2、選擇檢索系統(tǒng):

根據(jù)所具備的條件選擇手工檢索工具還是計(jì)算機(jī)檢索系統(tǒng),計(jì)算機(jī)檢索是選光盤檢索還是網(wǎng)絡(luò)數(shù)據(jù)庫檢索。也可采取二者結(jié)合的方式。3、選擇數(shù)據(jù)庫或檢索工具

(1)數(shù)據(jù)庫或檢索工具收錄的文獻(xiàn)學(xué)科范圍(2)數(shù)據(jù)庫或檢索工具收錄的文獻(xiàn)年度(3)數(shù)據(jù)庫或檢索工具收錄的文獻(xiàn)類型(4)索引系統(tǒng)是否完備,能否提供多種檢索途徑(5)要了解數(shù)據(jù)庫的使用介紹,弄清標(biāo)引特征

4、確定檢索途徑

手工檢索,就是利用檢索工具的各種索引;計(jì)算機(jī)檢索,就是確定檢索字段。

根據(jù)課題的要求及已經(jīng)掌握的信息。要充分利用文獻(xiàn)外部特征的字段,查起來非常方便,查準(zhǔn)率高。如已知篇名、作者、各種號(hào)碼等。主要檢索途徑:題名途徑:根據(jù)已知的書名或篇名等檢索著者途徑:根據(jù)已知的著者姓名檢索分類途徑:按照文獻(xiàn)主題內(nèi)容所屬學(xué)科體系和事物性質(zhì)進(jìn)行分類所形成的檢索途徑序號(hào)途徑:按文獻(xiàn)資料特有的序號(hào)檢索主題途徑:是根據(jù)文獻(xiàn)主題內(nèi)容編制主題索引,通過主題索引來檢索文獻(xiàn)的途徑

分類途徑和主題途徑是最常用的途徑。分類途徑適合于族性檢索,主題途徑適合于特性檢索。如兩種途徑互相配合則會(huì)取得較好的檢索效果。其他幾種途徑都是輔助性的檢索途徑。檢索途徑在手工檢索中,是通過索引來實(shí)現(xiàn)。在計(jì)算機(jī)檢索中,是通過字段檢索來實(shí)現(xiàn)的。5、確定檢索詞:

使用不同的索引、或者選擇不同的字段來確定使用不同的檢索詞。關(guān)鍵詞或主題詞的確定,要在全面分析、了解檢索課題的相關(guān)問題,提煉出核心概念和隱含概念,排除次要概念。

要注意幾個(gè)方面:

(1)關(guān)于隱含概念的分析(詞意延伸)

舉例:如“工藝”、“分析”、“應(yīng)用”、以及“有機(jī)物”、“無機(jī)物”、“重金屬”、“金屬”、“納米”等外延十分寬的概念,一般都應(yīng)換成具體的方法、材料或化合物來表示。(2)注意選用常用的專業(yè)術(shù)語

例如在查找“泡沫塑料”、“泡沫橡膠”時(shí)不能使用俗名“海綿”

(3)選用同一或相關(guān)概念的同義詞或近義詞

例如:廢水就有污水、工業(yè)用水、重金屬水等(4)選用檢索系統(tǒng)規(guī)定的代碼6、制定檢索策略(構(gòu)成檢索表達(dá)式)

在分析課題檢索需求的基礎(chǔ)上,確定檢索途徑與檢索詞,并明確各檢索詞之間的邏輯關(guān)系,編寫出檢索式。檢索式是檢索策略的邏輯表達(dá)式,是用來表達(dá)用戶檢索提問的,檢索式的制定是否合理,將直接影響檢索結(jié)果。7、實(shí)施檢索:

在手工檢索中,用選擇的檢索詞到檢索工具中進(jìn)行檢索。在計(jì)算機(jī)檢索中,將制定的檢索式輸入檢索系統(tǒng)進(jìn)行檢索。

檢索策略的調(diào)整:輸出的文獻(xiàn)過多:原因:主題詞存在一詞多義或者是外文檢索中截詞過短等解決:縮小檢索范圍:A增加限制B選用合適的字段C使用適當(dāng)?shù)奈恢梅敵龅奈墨I(xiàn)過少:原因:A使用的主題詞不規(guī)范或使用了產(chǎn)品的俗稱、商品名

B同義詞未用全(apparatus

equipment

devicefacility)

C上位類概念或下位類概念沒有完整運(yùn)用解決:A減少“與”的邏輯組配B增加同義詞運(yùn)用C多用“或”的邏輯組配D調(diào)整字段、位置算符限制8、檢索結(jié)果的獲取:

在手工檢索中對(duì)獲取的文獻(xiàn)線索進(jìn)行研究和篩選,如確定所得線索有參考價(jià)值,可通過文摘或題錄提供的文獻(xiàn)出處向收藏單位索取原文。

在計(jì)算機(jī)檢索中,根據(jù)檢索系統(tǒng)提供檢索結(jié)果輸出格式,選擇需求的檢索記錄及相應(yīng)的格式,將結(jié)果顯示在顯示屏幕上、存儲(chǔ)到磁盤上或直接打印輸出,完成整個(gè)檢索過程。文獻(xiàn)檢索的方法:⑴常用法:(工具法)順查法倒查法抽查法

⑵追溯法:

利用已有的文獻(xiàn)后的參考文獻(xiàn)進(jìn)行查找文獻(xiàn)的方法

⑶循環(huán)法(交替法):常用法與追溯法交替使用的方法美國的《科學(xué)引文索引》

ScienceCitationIndex,簡(jiǎn)稱SCI美國的尤金·加菲爾德(EugeneGarfield)創(chuàng)辦,

現(xiàn)由美國費(fèi)城科學(xué)信息所

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論