![第二講數(shù)據(jù)庫及檢索方法_第1頁](http://file4.renrendoc.com/view/533ac9c46fd86a4b9e1047a04acaf2a3/533ac9c46fd86a4b9e1047a04acaf2a31.gif)
![第二講數(shù)據(jù)庫及檢索方法_第2頁](http://file4.renrendoc.com/view/533ac9c46fd86a4b9e1047a04acaf2a3/533ac9c46fd86a4b9e1047a04acaf2a32.gif)
![第二講數(shù)據(jù)庫及檢索方法_第3頁](http://file4.renrendoc.com/view/533ac9c46fd86a4b9e1047a04acaf2a3/533ac9c46fd86a4b9e1047a04acaf2a33.gif)
![第二講數(shù)據(jù)庫及檢索方法_第4頁](http://file4.renrendoc.com/view/533ac9c46fd86a4b9e1047a04acaf2a3/533ac9c46fd86a4b9e1047a04acaf2a34.gif)
![第二講數(shù)據(jù)庫及檢索方法_第5頁](http://file4.renrendoc.com/view/533ac9c46fd86a4b9e1047a04acaf2a3/533ac9c46fd86a4b9e1047a04acaf2a35.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第二講數(shù)據(jù)庫及檢索方法第1頁,共87頁,2023年,2月20日,星期一教務(wù)處網(wǎng)上教學(xué)用戶名:學(xué)號
密碼:密碼為六個1第2頁,共87頁,2023年,2月20日,星期一主要內(nèi)容數(shù)據(jù)庫檢索概述檢索詞及其應(yīng)用計算機檢索策略與流程第3頁,共87頁,2023年,2月20日,星期一(一)數(shù)據(jù)庫檢索概述第4頁,共87頁,2023年,2月20日,星期一
數(shù)據(jù)庫是計算機檢索系統(tǒng)中存儲的信息源,按一定的方式組織并儲存,借助于檢索系統(tǒng)隨時為用戶提供服務(wù)的信息集合。數(shù)據(jù)庫三要素:相關(guān)數(shù)據(jù)、共同存取方式和一定的組織方式、共享。通俗地說,數(shù)據(jù)庫是以某一特定方式組織和存放的數(shù)據(jù)倉庫。1.1數(shù)據(jù)庫概念第5頁,共87頁,2023年,2月20日,星期一從記錄形式(內(nèi)容性質(zhì))的角度將數(shù)據(jù)庫分為兩大類:文獻(xiàn)型數(shù)據(jù)庫非文獻(xiàn)型數(shù)據(jù)庫
1.2數(shù)據(jù)庫分類第6頁,共87頁,2023年,2月20日,星期一是一種能直接提供文獻(xiàn)線索和文獻(xiàn)原文的數(shù)據(jù)庫收集的記錄是根據(jù)書刊、技術(shù)報告、學(xué)位論文、會議報告、專利、報刊新聞等加過工的一次或二次文獻(xiàn)。1.2數(shù)據(jù)庫分類
——文獻(xiàn)型數(shù)據(jù)庫第7頁,共87頁,2023年,2月20日,星期一全文型數(shù)據(jù)庫(一次文獻(xiàn))
:存貯文獻(xiàn)全文或部分內(nèi)容的數(shù)據(jù)庫目錄型數(shù)據(jù)庫(二次文獻(xiàn)):存儲書刊目錄、論文題錄、文摘等書目線索的數(shù)據(jù)庫題錄/文摘數(shù)據(jù)庫
:存儲和檢索期刊論文外部特征及文獻(xiàn)摘要信息的數(shù)據(jù)庫書目數(shù)據(jù)庫:存儲和檢索書目信息的數(shù)據(jù)庫1.2數(shù)據(jù)庫分類
——文獻(xiàn)型數(shù)據(jù)庫第8頁,共87頁,2023年,2月20日,星期一收集指南或詞典形式的數(shù)據(jù)記錄,能直接提供具體的術(shù)語、事實、數(shù)值和圖像等信息的數(shù)據(jù)庫。
1.2數(shù)據(jù)庫分類
——非文獻(xiàn)型數(shù)據(jù)庫第9頁,共87頁,2023年,2月20日,星期一數(shù)據(jù)型數(shù)據(jù)庫:是一種以自然數(shù)值形式表示、計算機可讀的數(shù)據(jù)集合。如實驗數(shù)據(jù)、化學(xué)分子式、價格等統(tǒng)計數(shù)據(jù)、科學(xué)實驗數(shù)據(jù)、測量數(shù)據(jù)等。如:中國科學(xué)計量指標(biāo)數(shù)據(jù)庫。圖像型數(shù)據(jù)庫:存貯有某些圖象信息,如圖片,云圖,工程設(shè)計圖等.
第10頁,共87頁,2023年,2月20日,星期一事實型數(shù)據(jù)庫:也稱指南型數(shù)據(jù)庫,是一種存貯簡單而獨立存在的非文獻(xiàn)信息,如機構(gòu)、人物、產(chǎn)品、地理位置、事件等,每個條目都是對一個事實確切、完整的描述。按內(nèi)容劃分有人物數(shù)據(jù)庫、機構(gòu)名錄數(shù)據(jù)庫、產(chǎn)品或商品信息數(shù)據(jù)庫、以及投資指南庫、基金指南庫等。1.2數(shù)據(jù)庫分類
——非文獻(xiàn)型數(shù)據(jù)庫第11頁,共87頁,2023年,2月20日,星期一術(shù)語型數(shù)據(jù)庫:也稱詞語型數(shù)據(jù)庫。專門存儲揭示各類名詞、術(shù)語、詞語的形、音、義與使用方法、以及詞義演變、發(fā)展等信息的檢索工具。
目前多數(shù)術(shù)語型數(shù)據(jù)庫大多是辭書、詞典、百科全書等數(shù)字化版本。第12頁,共87頁,2023年,2月20日,星期一數(shù)據(jù)庫文獻(xiàn)型數(shù)據(jù)庫非文獻(xiàn)型數(shù)據(jù)庫全文數(shù)據(jù)庫題錄/文摘數(shù)據(jù)庫書目數(shù)據(jù)庫數(shù)據(jù)型圖像型事實型術(shù)語型目錄數(shù)據(jù)庫第13頁,共87頁,2023年,2月20日,星期一不同類型數(shù)據(jù)庫的結(jié)構(gòu)不完全相同。文獻(xiàn)型數(shù)據(jù)庫的結(jié)構(gòu)層次:字段記錄文檔
1.3數(shù)據(jù)庫的結(jié)構(gòu)第14頁,共87頁,2023年,2月20日,星期一數(shù)據(jù)庫中最基本的信息單元,其實體是文獻(xiàn)的著錄項目。記錄中的字段標(biāo)識符一般由兩個字母組成,如TI,AB,AU,PY,LA等.每個字段都是一條檢索該記錄的途徑.
三種基本字段:檢索系統(tǒng)的存取號(AccessionNumber)基本索引字段(BasicIndexFields)輔助索引字段(AdditionalIndexFields)字段第15頁,共87頁,2023年,2月20日,星期一存取號:計算機信息檢索系統(tǒng)為該數(shù)據(jù)庫的每一條記錄規(guī)定的能被計算機識別的特定號碼。在同一數(shù)據(jù)庫中,每篇文獻(xiàn)記錄只有一個存取號。一般來講,存取號由6—9位數(shù)字組成,出現(xiàn)在每條聯(lián)機記錄的左上角位置。
字段第16頁,共87頁,2023年,2月20日,星期一基本索引字段:又稱主題字段,是數(shù)據(jù)庫提供的字段檢索默認(rèn)值.用來表達(dá)文獻(xiàn)內(nèi)容特征的字段,如:篇名字段(TitleField/TI)文摘字段(AbstractField/AB)敘詞字段(DescriptorField/DE)字段第17頁,共87頁,2023年,2月20日,星期一
輔助索引字段(AdditionalIndexFields):用來表達(dá)文獻(xiàn)外部特征的字段,如:著者字段(AuthorField/AU)出版年字段(PublicationYearField/PY)刊名字段(JournalField/SO或JN)語種字段(LanguageField/LA)文獻(xiàn)類型字段(DocumentTypeField/DT)輔助字段種類很多,且隨數(shù)據(jù)庫的不同而各有差異。字段第18頁,共87頁,2023年,2月20日,星期一
幾個不同字段的集合構(gòu)成記錄,一個數(shù)據(jù)庫內(nèi)的記錄往往含有相同的字段。每條記錄相當(dāng)于文摘型或題錄型檢索刊物的一條著錄款目。
一條記錄即一篇文獻(xiàn)。記錄第19頁,共87頁,2023年,2月20日,星期一一條記錄的格式:第20頁,共87頁,2023年,2月20日,星期一由若干相同類型或不同類型的記錄組成。一個數(shù)據(jù)庫由若干個文檔組成。一個文檔由大量的記錄組成,而每個記錄中又包含有若干字段,這就是文獻(xiàn)數(shù)據(jù)庫中的層次結(jié)構(gòu)。
文檔第21頁,共87頁,2023年,2月20日,星期一(二)
檢索理論基礎(chǔ)
第22頁,共87頁,2023年,2月20日,星期一
檢索詞是用戶或檢索人員給出的字、詞、字符或短語,用于查找含有它(它們)的記錄。
檢索詞分為兩類:受控詞和非受控詞。
2.1檢索詞——概念及分類第23頁,共87頁,2023年,2月20日,星期一檢索詞受控詞非受控詞主題詞表敘詞表分類詞表自然語言索引關(guān)鍵詞索引2.1檢索詞——概念及分類第24頁,共87頁,2023年,2月20日,星期一受控詞:是事先規(guī)范化的檢索語言,取自主題詞表、敘詞表、分類表等。如果數(shù)據(jù)庫對數(shù)據(jù)采用了受控標(biāo)引,并有機讀式或印刷版主題詞表時,應(yīng)優(yōu)先選用其中的受控詞。特點:受控詞的檢索效率高,一旦選定適當(dāng)?shù)母拍?,系統(tǒng)就能檢出這一概念的全部內(nèi)容,而且,由于標(biāo)引人員已事先解決了自然語言中的同義、近義關(guān)系,使檢索相對容易。
但受控詞不能及時反映新事物的發(fā)展,而且概念數(shù)量有限、結(jié)構(gòu)復(fù)雜,不易為非專業(yè)人員掌握。2.1檢索詞——概念及分類第25頁,共87頁,2023年,2月20日,星期一非受控詞:非受控詞是指非規(guī)范化的自然語言詞匯,又稱自由詞。特點:非受控詞可以在一定程度上彌補受控詞的不足,非受控詞可以是任意選詞,其專指性強,而且不需要熟悉詞表,新產(chǎn)生的名詞術(shù)語可以及時檢索與新概念有關(guān)的文獻(xiàn)。但非受控詞一般不能提供概念的等級結(jié)構(gòu),不能解決同義詞、近義詞、相關(guān)詞的結(jié)合或連接問題。
2.1檢索詞——概念及分類第26頁,共87頁,2023年,2月20日,星期一2.2檢索技術(shù)布爾邏輯算符截詞檢索(外文)限制檢索(外文)第27頁,共87頁,2023年,2月20日,星期一
利用布爾邏輯算符將檢索詞或代碼進(jìn)行邏輯組配以表達(dá)檢索需求的檢索方法布爾邏輯算符有三種:邏輯與(邏輯乘)邏輯或(邏輯和)邏輯非(邏輯差)2.2檢索技術(shù)——布爾邏輯算符第28頁,共87頁,2023年,2月20日,星期一2.2檢索技術(shù)——布爾邏輯算符-----邏輯與(邏輯乘)邏輯與(邏輯乘)是用“and”或“*”連接檢索概念,AandB(或A*B)表示兩個概念的交叉,即記錄中必須同時含有A和B,用“邏輯與”來檢索是對檢索需求增加限定因素,可以縮小檢索范圍。用邏輯與組構(gòu)的檢索詞越多,檢索范圍越小,專指度越強,有助于提高查準(zhǔn)率。第29頁,共87頁,2023年,2月20日,星期一2.2檢索技術(shù)——布爾邏輯算符SearchtermsResultsapple78,344breeding2,962plantovertyANDcrime5,677appleANDbreedingANDplant76邏輯與(邏輯乘)Wienn圖第30頁,共87頁,2023年,2月20日,星期一2.2檢索技術(shù)——布爾邏輯算符----邏輯或(邏輯和)邏輯或(邏輯和)是用“or”或“+”連接檢索概念,AorB(或A+B)表示兩個概念的并列,即記錄中凡單獨含有檢索項A或檢索項B,或者同時含有A、B兩者均為命中記錄。用邏輯或來檢索可擴大檢索范圍,提高查全率。第31頁,共87頁,2023年,2月20日,星期一2.2檢索技術(shù)——布爾邏輯算符SearchtermsResultscollege770university33,685,205collegeORuniversity33,702,660collegeORuniversityORcampus33,703,820邏輯或(邏輯和)Wienn圖第32頁,共87頁,2023年,2月20日,星期一2.2檢索技術(shù)——布爾邏輯算符----邏輯非(邏輯差)邏輯非(邏輯差)是用“not”或“-”連接檢索概念,AnotB(或A-B)表示兩個概念的排除,即凡含有檢索項A并且不含檢索項B的記錄為命中記錄。用邏輯非來檢索,可以縮小檢索范圍,提高檢索的專指度。但這種檢索也有缺點,即取消部分,往往會把切題的文獻(xiàn)丟掉,因此運用邏輯非運算時要慎重。第33頁,共87頁,2023年,2月20日,星期一2.2檢索技術(shù)——布爾邏輯算符SearchtermsResultscats3,651,252dogs4,556,515catsNOTdogs81,497NOT邏輯非(邏輯差)Wienn圖第34頁,共87頁,2023年,2月20日,星期一
在外文檢索中,常會遇到一些詞干相同、詞義相近的檢索詞或有英、美不同拼寫的詞,為了減少檢索詞的頻繁輸入,擴大檢索范圍,可使用截詞符(通配符),以提高檢索效率。
所謂截詞,是指在檢索詞的某個局部截斷,利用某些檢索詞的詞干或不完整詞形加上截詞符進(jìn)行檢索,其目的是查找某一詞干的不同變化形式,做到一“詞”多用,防止漏檢,從而達(dá)到較高的查全率。
2.2檢索技術(shù)——截詞檢索第35頁,共87頁,2023年,2月20日,星期一2.2檢索技術(shù)——截詞檢索截詞方式有前截斷、后截斷、前后截斷和中間截斷4種。一般用?和*表示截詞符,不同系統(tǒng),含義不同.第36頁,共87頁,2023年,2月20日,星期一2.2檢索技術(shù)——截詞檢索----前截詞:將截詞符放在詞根的前面,后方一致,表示在詞根的前方有無限個或有限個字符變化。例如,computer(計算機),在該詞根前加“?”,即“?Computer”,可檢出:Microcomputer、Minicomputer等。第37頁,共87頁,2023年,2月20日,星期一2.2檢索技術(shù)——截詞檢索----后截詞:將截詞符放在詞根后面,前方一致。computer(計算機),在該詞根后加“?”,即為“Computer?”,可檢出computers、computerised、computerization等。
第38頁,共87頁,2023年,2月20日,星期一2.2檢索技術(shù)——截詞檢索----前后截詞:將截詞符放在詞根的前面和后面,中間一致。例如,computer(計算機),在詞根前后都加“?”,即為“?computer?”,可檢出microcomputer、minicomputer、computer、computers、computerised、computerization等。第39頁,共87頁,2023年,2月20日,星期一2.2檢索技術(shù)——截詞檢索----中間截詞:中間截詞又稱為“通常字符檢索法”,它是將截詞符置于檢索詞的中間,而詞的前后方一致,通常用于英、美英語拼寫不同的詞的檢索。例如,colo?r可檢出colour(英音)、color(美音)。
第40頁,共87頁,2023年,2月20日,星期一2.2檢索技術(shù)——截詞檢索根據(jù)截詞的多少,可把截詞符分成有限截詞符和無限截詞符兩種。
有限截詞:
所謂有限截詞,是在檢索詞后截去有限的字母,例如輸入computer?
,截詞符“?”表示可以有0-1個字母變化,系統(tǒng)即檢出帶有computer和computers的文獻(xiàn);輸入stud???,表示截三個字母,可檢索出帶有study,studies,studied和studing等的文獻(xiàn)。第41頁,共87頁,2023年,2月20日,星期一2.2檢索技術(shù)——截詞檢索無限截詞:無限截詞是在檢索詞根后加一個“?”或“*”,表示該詞后帶任意字母的詞都可檢出,如輸入comput?則可檢出含有computers,computing,computered等文獻(xiàn)。第42頁,共87頁,2023年,2月20日,星期一2.2檢索技術(shù)——限制檢索運用布爾邏輯算符檢索時,只對檢索詞進(jìn)行邏輯組配,未限定檢索詞之間的位置關(guān)系及檢索詞在記錄中的位置。在有些情況下,若不限制檢索詞之間的位置關(guān)系會影響查準(zhǔn)率。因此,在檢索系統(tǒng)中設(shè)置了位置限定運算符。不同的檢索系統(tǒng)有不同的符號。限制檢索的方式有多種,例如進(jìn)行字段檢索、使用限制符、采用限制檢索命令等。
第43頁,共87頁,2023年,2月20日,星期一2.2檢索技術(shù)——詞位限制檢索A字段限定檢索:把檢索詞限定在某個/些字段中,如果記錄的相應(yīng)字段中含有輸入的檢索詞則為命中記錄,否則檢不中。
例如查找微型機或個人計算機方面的文章。要求"微型機"一詞出現(xiàn)在標(biāo)題或文摘字段中,"個人計算機"一詞出現(xiàn)在標(biāo)題或文摘字段中,檢索式可寫為:
第44頁,共87頁,2023年,2月20日,星期一
microcomputer?/ti,abORpersonalcomputer/ti,ab
如查找wangwei寫的文章,可以輸入檢索式:au=wangwei第45頁,共87頁,2023年,2月20日,星期一2.2檢索技術(shù)——詞位限制檢索B使用限制符:用表示語種、文獻(xiàn)類型、出版國家、出版年代等的字段標(biāo)識符來限制檢索范圍。如要查找1989-1999年出版的英文或法文的微型機或個人計算機方面的期刊,并要求“微型機和個人計算機"出現(xiàn)在標(biāo)題或文摘字段中,則檢索式為:第46頁,共87頁,2023年,2月20日,星期一
(microcomputer?/ti,abORpersonalcomputer/ti,ab)AND
PY=(1989:1999)AND(LA=ENORFR)AND
DT=Serial
第47頁,共87頁,2023年,2月20日,星期一2.2檢索技術(shù)——詞位限制檢索
C詞位限制:可以是相鄰若干詞、在同一句中等.
以DIALOG系統(tǒng)所用位置算符為例:
A(nW)B
A、B兩詞相隔n詞,且前后次序不變;n=1時即A()BA(nN)B
A、B兩詞相隔n詞,且前后次序不限;n=1時即A(N)BA(s)B
A、B兩詞只要在同一字段第48頁,共87頁,2023年,2月20日,星期一2.2——詞表助檢有些數(shù)據(jù)庫有自已的主題詞表,詞表不僅用于標(biāo)引文獻(xiàn),也可用于助檢。檢索者在選用檢索詞時,可查閱詞表。有些聯(lián)機檢索系統(tǒng),將詞表存入計算機,幫助用戶進(jìn)行檢索。它能將用戶輸入的非標(biāo)準(zhǔn)檢索詞,自動地轉(zhuǎn)換為規(guī)范詞,還可以自動擴檢索,如使用同義詞檢索。第49頁,共87頁,2023年,2月20日,星期一(三)計算機檢索策略和檢索效果第50頁,共87頁,2023年,2月20日,星期一什么是檢索策略?所謂檢索策略廣義上是指為實現(xiàn)檢索目的而制訂的全盤計劃和方案;狹義講是指檢索式。
檢索式是用來表達(dá)用戶提問的邏輯表達(dá)式,是檢索策略的綜合體現(xiàn),通常由檢索詞和各種邏輯算符、位置算符及檢索系統(tǒng)中規(guī)定的其他連接符號構(gòu)成。第51頁,共87頁,2023年,2月20日,星期一在計算機檢索中,檢索策略直接關(guān)系到檢索結(jié)果的成敗,要想構(gòu)造高水平的檢索策略,不僅要求用戶對檢索系統(tǒng)十分了解,還需要對檢索課題進(jìn)行深入的分析并能靈活運用各種檢索方法和技巧。
第52頁,共87頁,2023年,2月20日,星期一3.1檢索式表達(dá)檢索式也稱檢索提問表達(dá)式,是要求系統(tǒng)執(zhí)行的檢索語句。簡單的檢索式由一個檢索詞和一個字段名構(gòu)成,復(fù)雜的檢索式則由多個檢索詞和字段名通過關(guān)系算符(包括邏輯算符與位置算符等)連接而成。簡單檢索式:apple/ti復(fù)雜檢索式:
((cornormaize)andharvest*)/ti第53頁,共87頁,2023年,2月20日,星期一(algae+algal+microalgal)*growth()factor??實檢后調(diào)整(考慮提高檢準(zhǔn)率)、優(yōu)化(低頻詞和關(guān)鍵詞前置)為:(microalgal+algae+algal)(s)growth()factor??(microalgal+algae+algal)(3N)growth()factor??“微藻生長因子”第54頁,共87頁,2023年,2月20日,星期一“圖象理解專家系統(tǒng)”Image()understand???*(expert()system??+artificial()intelligen??)第55頁,共87頁,2023年,2月20日,星期一3.2檢索效果參數(shù)
包括:查全率(recallfactor)、查準(zhǔn)率(也稱適中率,Pertinencyfactor??)、漏檢率(omissionfactor)、誤檢率(也叫檢索噪音,noisefactor)以及新穎率、檢索速度等。
第56頁,共87頁,2023年,2月20日,星期一假設(shè):n為檢索系統(tǒng)中文獻(xiàn)總量,a為n中與檢索課題有關(guān)的文獻(xiàn)量,m為檢索輸出的文獻(xiàn)量,b為m中與檢索課題有關(guān)的文獻(xiàn)量(檢準(zhǔn)文獻(xiàn)量),則n、m、a、b之間的關(guān)系如圖所示。第57頁,共87頁,2023年,2月20日,星期一n系統(tǒng)文獻(xiàn)總量m檢出文獻(xiàn)量b為m中相關(guān)文獻(xiàn)漏檢誤檢a為n中相關(guān)文獻(xiàn)第58頁,共87頁,2023年,2月20日,星期一令:
R表示查全率、
P表示查準(zhǔn)率、
M表示漏檢率、
N表示誤檢率,則R、P、M、N定義如下:
R=b/a*100%
P=b/m*100%
M=(1-b/a)*100%=100%-R
N=(1-b/m)*100%=100%-P
第59頁,共87頁,2023年,2月20日,星期一最理想的檢索效果R、P均為100%,但實際上這是不可能的。實驗表明:R和P之間存在相反的相互依賴關(guān)系,即提高R會降低P,反之亦然,如下圖檢索特性曲線所示。第60頁,共87頁,2023年,2月20日,星期一檢索特性曲線第61頁,共87頁,2023年,2月20日,星期一對于檢索來說,漏檢是影響檢索質(zhì)量的最主要因素,故必須將M降低到最低限度;誤檢會降低檢索的效率,也會影響檢索質(zhì)量。因此,任何檢索工具和檢索系統(tǒng)必須力爭克服漏檢(必要條件),同時盡量避免誤檢(充分條件)。第62頁,共87頁,2023年,2月20日,星期一(四)計算機檢索流程第63頁,共87頁,2023年,2月20日,星期一文獻(xiàn)檢索課程目的:讓你以最有效的方法收集及篩選所需數(shù)據(jù)以提高科學(xué)研究能力第64頁,共87頁,2023年,2月20日,星期一檢索流程(構(gòu)建檢索策略的步驟)分析課題內(nèi)容選擇信息資源構(gòu)造檢索式選擇檢索點進(jìn)行檢索分析檢索結(jié)果,調(diào)整檢索策略跟進(jìn)檢索第65頁,共87頁,2023年,2月20日,星期一4.1分析課題的內(nèi)容1).明確檢索目的需要關(guān)于某一課題的系統(tǒng)詳盡的信息需要關(guān)于某一課題的最新信息了解一些片斷信息,解決一些具體問題第66頁,共87頁,2023年,2月20日,星期一2).
明確課題的主題或主要內(nèi)容
要形成若干個既代表信息需求又有檢索意義的主題概念,包括所涉及的主題概念有幾個,概念的專指度是否適合,哪些是主要的,哪些是次要的,概念之間關(guān)系如何等。第67頁,共87頁,2023年,2月20日,星期一3).課題涉及的學(xué)科范圍:搞清楚課題所涉及的學(xué)科領(lǐng)域、是否跨學(xué)科研究。4).所需信息的數(shù)量、語種、年代范圍、類型等具體化指標(biāo)第68頁,共87頁,2023年,2月20日,星期一例:檢索課題--不銹鋼焊接檢索目的查找范圍了解最新的技術(shù)動態(tài)利用期刊、會議錄類的數(shù)據(jù)庫查找了解焊縫強度的測試方法和有關(guān)規(guī)格利用技術(shù)標(biāo)準(zhǔn)類的數(shù)據(jù)庫查找申請專利利用專利類數(shù)據(jù)庫查找第69頁,共87頁,2023年,2月20日,星期一4.2選擇信息資源是否與檢索課題相關(guān)的資源都要檢索選擇哪些學(xué)科的信息資源選擇哪些語種的信息資源信息資源覆蓋的年限是否符合需求信息資源的特點及針對性第70頁,共87頁,2023年,2月20日,星期一4.3構(gòu)造檢索式選擇檢索點檢索式
是表達(dá)用戶檢索提問的邏輯表達(dá)式,由基于檢索概念產(chǎn)生的檢索詞和各種組配算符構(gòu)成。檢索點
即檢索途徑或檢索入口、檢索字段。檢索點正確與否,決定著檢索結(jié)果的數(shù)量與質(zhì)量。第71頁,共87頁,2023年,2月20日,星期一
一個檢索課題往往涉及多個概念,選擇檢索詞時首先要將檢索課題涉及的所有概念分離出來,并針對每一個概念選擇盡可能多的檢索詞。
分析概念可從課題名稱入手,出現(xiàn)在課題名稱中的詞并不一定都是概念詞。第72頁,共87頁,2023年,2月20日,星期一如:“吸煙與心臟病的關(guān)系”可以表達(dá)為:connectionbetweensomkingandheartdisease
通過分析發(fā)現(xiàn),其中,只有
somking和heartdisease兩個概念詞,而“connectionbetween”則不屬于概念詞。
概念1:somking
概念2:heartdisease第73頁,共87頁,2023年,2月20日,星期一
有些課題的實質(zhì)性內(nèi)容往往很難從課題名稱上反映出來,需要從中提取隱含概念,另外有些檢索詞已含有的概念,在選詞時應(yīng)予以排除。例:聚乙烯的合成
聚乙烯合成
垃圾的處理
垃圾處理回收再生
玻璃纖維增強石膏制品
玻璃纖維石膏第74頁,共87頁,2023年,2月20日,星期一針對每一個概念,選擇與之相關(guān)的同義詞或相關(guān)詞與somking相關(guān)的詞有:smoker,smokers,tobacco等;heartdisease的同義詞有:cardiopathy,hearttrouble,heartattack.將這些相關(guān)詞記錄下來,用于構(gòu)造檢索式:
概念1:somking,smokers,tobacco
概念2:cardiopathy,heartdisease,hearttrouble,heartattack
第75頁,共87頁,2023年,2月20日,星期一選定檢索詞的方法
利用上下位詞或特有名詞及同義詞、近義詞、相關(guān)詞,查閱工具如專業(yè)詞表詞典,字典,分類表等:根據(jù)詞表或數(shù)據(jù)庫中的索引選詞從專業(yè)詞典、百科全書等參考工具中選詞
利用中文全文數(shù)據(jù)庫選擇英文檢索詞第76頁,共87頁,2023年,2月20日,星期一編制檢索式
使用邏輯算符(AND,OR,NOT)、截詞、位置算符,限制檢索條件至作者,刊物或年代
。調(diào)整其他設(shè)定
選定檢索結(jié)果的顯示方式–日期,相關(guān)度等排序。
第77頁,共87頁,2023年,2月20日,星期一例:“吸煙與心臟病的關(guān)系”
(smok*ORtobacco)
AND
(cardiopath*ORheart
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中國蜜瓜種子項目投資可行性研究報告
- 2024-2025年中國矢量網(wǎng)絡(luò)分析儀行業(yè)發(fā)展?jié)摿Ψ治黾巴顿Y戰(zhàn)略咨詢報告
- 疾病的早期發(fā)現(xiàn)與健康教育
- 水資源在商業(yè)活動中的價值挖掘
- 幾種植物提取物對5α-還原酶的抑制作用及其對小鼠毛發(fā)生長的影響
- 季節(jié)性水位波動對鄱陽湖食物網(wǎng)結(jié)構(gòu)的影響研究
- 2025年精鋁餐具項目可行性研究報告
- 中國醫(yī)用敷料產(chǎn)品行業(yè)市場深度分析及發(fā)展前景預(yù)測報告
- 基于目標(biāo)約束的汾渭平原冬季PM2.5減排情景優(yōu)化分析
- 人教版六年級美術(shù)下冊全冊課件【完整版】
- 施工組織設(shè)計模板
- 含碘對比劑靜脈外滲護理管理實踐指南
- 萃取技術(shù) 多級逆流萃取
- 部編版小學(xué)五年級語文教材培訓(xùn)課件【部編】
- 盆景造型經(jīng)驗
- 能力不足方面存在的問題及整改措施【9篇】
- 悟真篇-薛道光注
- 重大危險源公示牌(完整)-2
- 物理學(xué)史中國古代物理學(xué)
- 初一英語英語閱讀理解專項訓(xùn)練15篇
評論
0/150
提交評論