版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第二章
計算機(jī)檢索基礎(chǔ)知識第一節(jié)電子信息資源概述
一、電子信息資源的概念
二、電子信息資源的類型三、電子信息資源的特點一、電子信息資源的概念
電子資源就是電子化了的信息資源。
是機(jī)讀型信息資源。是一種通過編碼和程序設(shè)計,把文字、圖形、聲音、動畫等多種形式的信息轉(zhuǎn)換成數(shù)字語言和機(jī)器語言,以磁性材料為介質(zhì),以電信號、光信號的形式傳輸,并通過網(wǎng)絡(luò)通信、計算機(jī)或終端等方式再現(xiàn)出來的一種信息資源。二、電子信息資源的類型
1、按信息表現(xiàn)形式分:(1)文本信息資源:是按知識單元的線性順序排列組織的資源。(2)超文本信息資源:
它是一種非線性方式建立和表示離散信息關(guān)系的技術(shù)。邏輯連接任意連接(3)多媒體信息資源:
包括文本、圖像和聲音等各種信息表達(dá)的總稱
(4)超媒體信息資源:
源于超文本,又是它的擴(kuò)充。是超文本和多媒體技術(shù)的結(jié)合,具有超文本和多媒體兩種信息資源的特點.包括了文本、靜態(tài)圖形、動畫、動態(tài)圖像和聲音等多種信息。2、按信息存儲載體分:
光盤信息資源網(wǎng)絡(luò)信息資源(即在第一章光盤檢索系統(tǒng)、網(wǎng)絡(luò)化信息檢索系統(tǒng)中的信息資源)3、按信息交流方式分
(1)非正式出版信息:
包括電子郵件、網(wǎng)絡(luò)論壇、電子會議和電子布告版新聞等
(2)半正式出版信息:
受到一定知識產(chǎn)權(quán)保護(hù),但沒有納入正式出版信息系統(tǒng)的描述性網(wǎng)絡(luò)信息。包括內(nèi)部電子期刊、會議文集和各類報告、機(jī)構(gòu)情況及產(chǎn)品介紹等。
(3)正式出版信息:
受到知識產(chǎn)權(quán)保護(hù),信息質(zhì)量可靠,利用率較高的知識性、分析性網(wǎng)絡(luò)信息。
一次出版信息:電子圖書、電子期刊、電子報紙等;二次出版信息:搜索引擎、檢索數(shù)據(jù)庫、網(wǎng)絡(luò)導(dǎo)航等;三次出版信息:網(wǎng)絡(luò)述評、參考數(shù)據(jù)庫、網(wǎng)站推薦等。
三、電子信息資源的特點(1)信息組織形式發(fā)生變化:
由傳統(tǒng)的文本形式發(fā)展為超文本、超多媒體等多種形式。(2)數(shù)字化:
信息資源由紙張的文字變成磁性介質(zhì)上的電磁信號,存儲的信息資源密度高,容量大,可無損耗反復(fù)的使用。
(3)內(nèi)容豐富多彩
(4)數(shù)據(jù)結(jié)構(gòu)具有通用性、開放性、動態(tài)性(5)信息資源體積小,數(shù)量巨大(6)傳播方式的無限性(7)交互性第二節(jié)數(shù)據(jù)庫
一、數(shù)據(jù)庫的概念二、數(shù)據(jù)庫的類型三、數(shù)據(jù)庫結(jié)構(gòu)
一、數(shù)據(jù)庫的概念
在計算機(jī)存貯設(shè)備上按一定方式存貯的相互關(guān)聯(lián)的數(shù)據(jù)集合,就是數(shù)據(jù)庫。
數(shù)據(jù)庫則是計算機(jī)與信息檢索技術(shù)相結(jié)合的產(chǎn)物。是計算機(jī)檢索的基礎(chǔ)。要建立計算機(jī)檢索系統(tǒng),必須對所收集到的大量文獻(xiàn)資料按一定的體系和規(guī)則加以處理,使之成為機(jī)讀形式的數(shù)據(jù)。
二、數(shù)據(jù)庫的類型
1、參考數(shù)據(jù)庫(referencedatabases)
(1)書目數(shù)據(jù)庫(bibliographicdatabases):用于存儲二次文獻(xiàn)(目錄、題錄、文摘等書目數(shù)據(jù))的一類數(shù)據(jù)庫(2)指南數(shù)據(jù)庫(referencedatabases):是指存儲有關(guān)機(jī)構(gòu)、人物、出版物、項目、產(chǎn)品、活動等對象的簡要描述。2、源數(shù)據(jù)庫(sourcedatabases):
能直接提供原始信息或具體數(shù)據(jù)的一類數(shù)據(jù)庫。用戶不必再查閱其他信息源即可獲得原始信息。
全文數(shù)據(jù)庫(full-textdatabases)數(shù)值數(shù)據(jù)庫(numericdatabases)文本-數(shù)值數(shù)據(jù)庫(textual-numericdatabases)、
術(shù)語數(shù)據(jù)庫(terminologicalbank)圖像數(shù)據(jù)庫(graphicsdatabases)事實數(shù)據(jù)庫(factdatabases)。
3、混合數(shù)據(jù)庫(mixeddatabases):
是指能同時存儲多種不同類型數(shù)據(jù)的一種源數(shù)據(jù)庫。
三、數(shù)據(jù)庫結(jié)構(gòu):
若干字段→若干記錄→若干文檔→數(shù)據(jù)庫1、字段
也稱數(shù)據(jù)項、檢索項,是計算機(jī)檢索的最基本單位。每條文獻(xiàn)的每個著錄項,在計算機(jī)檢索中稱為字段。
字段是檢索信息的入口,信息在存儲到數(shù)據(jù)庫中時,將能反映其特征的項目進(jìn)行分解,并按字段的形式存儲,以供在需要時可以從不同的角度進(jìn)行檢索。(1)存取號字段
AN=AccessNumber(2)基本字段:描述文獻(xiàn)主題性質(zhì)或內(nèi)容的字段
文獻(xiàn)標(biāo)題(TI)title
文摘(AB)abstract
主題詞(DE)descriptor
關(guān)鍵詞(KW)keyword
(3)輔助字段:描述與主題內(nèi)容無關(guān)的字段
Au=Author
著者字段
SO=Source
文獻(xiàn)出處字段
PY=PublicationYear
出版年字段
LA=Language
語種字段
CS=CorporateSource
團(tuán)體著者字段
JN=JournalName
期刊名稱字段
DT=DocumentType
文獻(xiàn)類型字段
PN=PatentNumber
專利號字段
ProductName
產(chǎn)品名稱字段
IC=IPC
國際專利分類號字段
CT=ConferenceTitle
會議名稱字段
CY=ConferenceYear
會議召開年字段2、記錄作為一個單位來處理的一組相關(guān)的數(shù)據(jù),它是字段的集合體,也是信息的完整體現(xiàn)。文檔中的一個記錄就是一篇文獻(xiàn)的題錄或文摘。3、文檔經(jīng)過組織加工后存儲在計算機(jī)中的一組文獻(xiàn)稱為文檔。信息數(shù)據(jù)庫是由文檔組成的,一個計算機(jī)檢索系統(tǒng)中的數(shù)據(jù)庫可能是由一個文檔組成,也可是由多個文檔組成。同樣內(nèi)容的文件,稱為一個文檔。第三節(jié)
計算機(jī)檢索的技術(shù)和步驟
一、計算機(jī)檢索的技術(shù)二、計算機(jī)檢索步驟
一、計算機(jī)檢索的技術(shù)
1、布爾邏輯檢索計算機(jī)檢索的基本技術(shù)就是在制定檢索策略時利用布爾邏輯算符進(jìn)行檢索項的邏輯組配,即進(jìn)行概念組配。就是要考慮單一概念、復(fù)雜概念、并列概念如何組配,以構(gòu)成檢索提問式。目的是為了擴(kuò)大檢索或縮小檢索范圍,提高查準(zhǔn)率、查全率,提高檢索速度。(1)邏輯與:
用“and”或“*”表示。概念交叉和限定關(guān)系的一種組配。
例如:生物學(xué)中計算機(jī)圖象處理生物學(xué)*計算機(jī)*圖象處理
(2)邏輯或,用“or”或用“+”表示。是具有概念并列關(guān)系的一種組配。
例如:檢索三廢處理方面文獻(xiàn)
廢氣+廢水+
廢物廢氣廢水廢物(3)邏輯非,用“not”或用“-”表示。是具有概念刪除關(guān)系的一種組配,從原概念中刪除一部分不需要的內(nèi)容。
例如:要檢出中國科學(xué)技術(shù)大學(xué)化工方面的文獻(xiàn),除錢逸泰的文獻(xiàn)中國科學(xué)技術(shù)大學(xué)化工方面錢逸泰布爾邏輯算符,其優(yōu)先級為not、and、or,有括號先運行括號里的。
例子:蒸餾中的溫度、壓力、流動影響方面的文獻(xiàn):蒸餾*(溫度+壓力+流動)
2、截詞檢索和范圍檢索:
截詞符“?”:
用來截去檢索詞中某些字符,來表示檢索詞單、復(fù)數(shù)形式或英美不同拼法或同一詞詞尾的多種變化等(1)無限截詞:用一個“?”表示例如:comput?
表示含有
computercomputerscomputingcomputation
都符合要求(2)有限截詞:
用二個“??”,中間空一格,表示截1位。第一個“?”表示截1位,第二個“?”表示終止。
例如:dye?
?
(染料,染色
)表示含有dye、dyed、dyes都符合要求。
“?
?”表示截二位,即詞尾最多2個字母。例如:univers??
表示含有universe(宇宙,萬物,世界)、universal(adj.普遍的,通用的
)都符合要求。
“???”,表示截三位,即詞尾最多3個字母。
例如:cand???
表示含有candy(糖果)、candiescandied(adj.糖果的,甜蜜的)
都符合要求。(3)中間截詞:
例如:wom?n表示含有women、woman都符合要求。又如:
fib??board表示含有fibreboard(纖維板)、fiberboard都符合要求。
范圍符
“:”用范圍符來限定檢索的類目、時間、存取號等的范圍。例如:檢索90年到97年的文獻(xiàn)
PY=1990:PY=1997
3、位置檢索:
用來限定檢索詞相互間的鄰近關(guān)系,在記錄中出
現(xiàn)的順序、位置。
位置算符表示方法說明with(W)或()兩個詞在命中結(jié)果中相鄰(可有空格、標(biāo)點和連字符),詞序不得顛倒。(nW)兩個詞之間最多可夾入n個詞,詞序不得顛倒。near(N)兩個詞在命中結(jié)果中相鄰,詞序可顛倒。(nN)兩個詞之間最多可夾入n個詞,詞序可顛倒。field(F)兩個詞在同一字段出現(xiàn),位置不固定。subfield(S)兩個詞在同一子字段出現(xiàn),位置不固定。(1)(W)或()和(nW):
(W)或():表示在算符兩側(cè)的檢索詞必須按詞序排列,不能顛倒,兩詞之間不允許有其他詞或字母,但允許有空格和“-”符。
例如:computer()aided()design計算機(jī)輔助設(shè)計(nW):表示在算符兩側(cè)的檢索詞之間最多允許插入n個詞,包括實詞和虛詞,兩個檢索詞不能顛倒。
例如:輸入communication(2w)satellite
檢索出:
communicationsatellite
communicationthroughsatellite
communicationonthesatellite
(2)(N)和(nN)
(N):
(Near)表示算符兩側(cè)的檢索詞必須緊密相連,但詞序可以顛倒,不得插入其它詞。(nN):表示在算符兩側(cè)的檢索詞之間最多允許插入n
個詞包括實詞和虛詞,兩個檢索詞詞序可顛倒。
例如:輸入cotton(2n)processing檢索出:cottonprocessing、
cottonofprocessing、
processingofEgyptiancotton
(3)
(F)(Field)
表示在算符兩側(cè)的檢索詞必須同時出現(xiàn)在文獻(xiàn)記錄的同一字段,兩詞詞序不限,中間插入詞的數(shù)量不限。例如:輸入pollution(F)control
污染控制表示在同一字段中檢索出含有:pollution
control的文獻(xiàn)。
在題名字段中,題名為controlandmanagementofindustrialpollution
符合要求。
(3)
(S)(Subfield
或Sentence的縮寫)
表示在算符兩側(cè)的檢索詞必須同時出現(xiàn)在文獻(xiàn)的同一子字段中,即同一句子或短語中,檢索范圍比(F)小,檢索結(jié)果準(zhǔn)確。
4、限制檢索:
是指檢索系統(tǒng)中提供的縮小或約束檢索結(jié)果的檢索方法。
(1)字段檢索:用于限制檢索詞出現(xiàn)的字段。每一個字段都有特定的代碼。基本檢索字段:
文摘(AB)
篇名(TI)
敘詞或主題詞(DE)關(guān)鍵詞(KW)
分類號(CC)
全文(full-text)
DE:Descriptor
CC:ClassificationCode例如:
television/TI
在篇名字段中找出電視的文獻(xiàn)
television/AB在文摘字段中找出電視的文獻(xiàn)
Au=Smith,J.C
在著者字段中找出Smith,J.C
發(fā)表的文獻(xiàn)
JN=EnvironmentManagement在期刊名稱字段中檢索刊名為EnvironmentManagement的刊物
DT=Patent在文獻(xiàn)類型字段里檢索專利文獻(xiàn)(2)二次檢索:
檢索結(jié)果中再檢索。有二種表示方式:在結(jié)果中再查、在結(jié)果中去除課后練習(xí)1.常用的布爾邏輯算符有哪些?它們的優(yōu)先級是什么?2.數(shù)據(jù)庫的類型有哪三種?3.范圍符的形式和含義?4.截詞符的含義?5.常用的位置算符及含義?二、計算機(jī)檢索步驟
1、分析研究課題
(1)課題的主題內(nèi)容(2)課題所涉及的學(xué)科的范圍(3)課題所需的信息的內(nèi)容
(4)確定課題所需信息的類型
(5)明確課題對檢索深度的要求2、選擇檢索系統(tǒng):
根據(jù)所具備的條件選擇手工檢索工具還是計算機(jī)檢索系統(tǒng),計算機(jī)檢索是選光盤檢索還是網(wǎng)絡(luò)數(shù)據(jù)庫檢索。也可采取二者結(jié)合的方式。3、選擇數(shù)據(jù)庫或檢索工具
(1)數(shù)據(jù)庫或檢索工具收錄的文獻(xiàn)學(xué)科范圍(2)數(shù)據(jù)庫或檢索工具收錄的文獻(xiàn)年度(3)數(shù)據(jù)庫或檢索工具收錄的文獻(xiàn)類型(4)索引系統(tǒng)是否完備,能否提供多種檢索途徑(5)要了解數(shù)據(jù)庫的使用介紹,弄清標(biāo)引特征
4、確定檢索途徑
手工檢索,就是利用檢索工具的各種索引;計算機(jī)檢索,就是確定檢索字段。
根據(jù)課題的要求及已經(jīng)掌握的信息。要充分利用文獻(xiàn)外部特征的字段,查起來非常方便,查準(zhǔn)率高。如已知篇名、作者、各種號碼等。主要檢索途徑:題名途徑:根據(jù)已知的書名或篇名等檢索著者途徑:根據(jù)已知的著者姓名檢索分類途徑:按照文獻(xiàn)主題內(nèi)容所屬學(xué)科體系和事物性質(zhì)進(jìn)行分類所形成的檢索途徑序號途徑:按文獻(xiàn)資料特有的序號檢索主題途徑:是根據(jù)文獻(xiàn)主題內(nèi)容編制主題索引,通過主題索引來檢索文獻(xiàn)的途徑
分類途徑和主題途徑是最常用的途徑。分類途徑適合于族性檢索,主題途徑適合于特性檢索。如兩種途徑互相配合則會取得較好的檢索效果。其他幾種途徑都是輔助性的檢索途徑。檢索途徑在手工檢索中,是通過索引來實現(xiàn)。在計算機(jī)檢索中,是通過字段檢索來實現(xiàn)的。5、確定檢索詞:
使用不同的索引、或者選擇不同的字段來確定使用不同的檢索詞。關(guān)鍵詞或主題詞的確定,要在全面分析、了解檢索課題的相關(guān)問題,提煉出核心概念和隱含概念,排除次要概念。
要注意幾個方面:
(1)關(guān)于隱含概念的分析(詞意延伸)
舉例:如“工藝”、“分析”、“應(yīng)用”、以及“有機(jī)物”、“無機(jī)物”、“重金屬”、“金屬”、“納米”等外延十分寬的概念,一般都應(yīng)換成具體的方法、材料或化合物來表示。(2)注意選用常用的專業(yè)術(shù)語
例如在查找“泡沫塑料”、“泡沫橡膠”時不能使用俗名“海綿”
(3)選用同一或相關(guān)概念的同義詞或近義詞
例如:廢水就有污水、工業(yè)用水、重金屬水等(4)選用檢索系統(tǒng)規(guī)定的代碼6、制定檢索策略(構(gòu)成檢索表達(dá)式)
在分析課題檢索需求的基礎(chǔ)上,確定檢索途徑與檢索詞,并明確各檢索詞之間的邏輯關(guān)系,編寫出檢索式。檢索式是檢索策略的邏輯表達(dá)式,是用來表達(dá)用戶檢索提問的,檢索式的制定是否合理,將直接影響檢索結(jié)果。7、實施檢索:
在手工檢索中,用選擇的檢索詞到檢索工具中進(jìn)行檢索。在計算機(jī)檢索中,將制定的檢索式輸入檢索系統(tǒng)進(jìn)行檢索。
檢索策略的調(diào)整:輸出的文獻(xiàn)過多:原因:主題詞存在一詞多義或者是外文檢索中截詞過短等解決:縮小檢索范圍:A增加限制B選用合適的字段C使用適當(dāng)?shù)奈恢梅敵龅奈墨I(xiàn)過少:原因:A使用的主題詞不規(guī)范或使用了產(chǎn)品的俗稱、商品名
B同義詞未用全(apparatus
equipment
devicefacility)
C上位類概念或下位類概念沒有完整運用解決:A減少“與”的邏輯組配B增加同義詞運用C多用“或”的邏輯組配D調(diào)整字段、位置算符限制8、檢索結(jié)果的獲取:
在手工檢索中對獲取的文獻(xiàn)線索進(jìn)行研究和篩選,如確定所得線索有參考價值,可通過文摘或題錄提供的文獻(xiàn)出處向收藏單位索取原文。
在計算機(jī)檢索中,根據(jù)檢索系統(tǒng)提供檢索結(jié)果輸出格式,選擇需求的檢索記錄及相應(yīng)的格式,將結(jié)果顯示在顯示屏幕上、存儲到磁盤上或直接打印輸出,完成整個檢索過程。文獻(xiàn)檢索的方法:⑴常用法:(工具法)順查法倒查法抽查法
⑵追溯法:
利用已有的文獻(xiàn)后的參考文獻(xiàn)進(jìn)行查找文獻(xiàn)的方法
⑶循環(huán)法(交替法):常用法與追溯法交替使用的方法美國的《科學(xué)引文索引》
ScienceCitationIndex,簡稱SCI美國的尤金·加菲爾德(EugeneGarfield)創(chuàng)辦,
現(xiàn)由美國費城科學(xué)信息所
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025中國電信山東煙臺分公司校園招聘高頻重點提升(共500題)附帶答案詳解
- 2025中國安全生產(chǎn)科學(xué)研究院第一批公開招聘補(bǔ)充高頻重點提升(共500題)附帶答案詳解
- 2025中國農(nóng)業(yè)科學(xué)院蜜蜂研究所資源昆蟲保護(hù)團(tuán)隊招聘科研助理高頻重點提升(共500題)附帶答案詳解
- 2025東方航空公司江西分公司招聘地面服務(wù)部特種車輛司機(jī)1名高頻重點提升(共500題)附帶答案詳解
- 2025下半年福建南平浦城縣事業(yè)單位招聘56人歷年高頻重點提升(共500題)附帶答案詳解
- 2025下半年浙江省杭州市部分市屬事業(yè)單位招聘71人歷年高頻重點提升(共500題)附帶答案詳解
- 2025下半年安徽肥西縣部分單位招聘人員擬聘人員歷年高頻重點提升(共500題)附帶答案詳解
- 2025上半年江蘇事業(yè)單位判斷模塊突破歷年高頻重點提升(共500題)附帶答案詳解
- 古馬隆樹脂行業(yè)相關(guān)投資計劃提議
- 音樂節(jié)特邀舞蹈演員聘用協(xié)議
- 廚房里的小竅門
- 材料科學(xué)基礎(chǔ)期末試卷題集
- 制藥企業(yè)-質(zhì)量風(fēng)險評估表
- 病歷書寫規(guī)范2023年版(2023年3月)
- 《慢性肺源性心臟病》
- GB/T 23050-2022信息化和工業(yè)化融合管理體系供應(yīng)鏈數(shù)字化管理指南
- GB/T 5585.1-2005電工用銅、鋁及其合金母線第1部分:銅和銅合金母線
- GB/T 19960.1-2005風(fēng)力發(fā)電機(jī)組第1部分:通用技術(shù)條件
- 2023譯林版新教材高一英語必修二全冊單詞表(僅英語)
- 2022年伊犁哈薩克自治州林業(yè)系統(tǒng)事業(yè)單位招聘筆試試題及答案解析
- 讓財務(wù)助推業(yè)務(wù)-業(yè)財融合課件
評論
0/150
提交評論