版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第二講數(shù)據(jù)庫(kù)及檢索方法演示文稿目前一頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)優(yōu)選第二講數(shù)據(jù)庫(kù)及檢索方法目前二頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)主要內(nèi)容數(shù)據(jù)庫(kù)檢索概述檢索詞及其應(yīng)用計(jì)算機(jī)檢索策略與流程目前三頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)(一)數(shù)據(jù)庫(kù)檢索概述目前四頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)
數(shù)據(jù)庫(kù)是計(jì)算機(jī)檢索系統(tǒng)中存儲(chǔ)的信息源,按一定的方式組織并儲(chǔ)存,借助于檢索系統(tǒng)隨時(shí)為用戶提供服務(wù)的信息集合。數(shù)據(jù)庫(kù)三要素:相關(guān)數(shù)據(jù)、共同存取方式和一定的組織方式、共享。通俗地說(shuō),數(shù)據(jù)庫(kù)是以某一特定方式組織和存放的數(shù)據(jù)倉(cāng)庫(kù)。1.1數(shù)據(jù)庫(kù)概念目前五頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)從記錄形式(內(nèi)容性質(zhì))的角度將數(shù)據(jù)庫(kù)分為兩大類:文獻(xiàn)型數(shù)據(jù)庫(kù)非文獻(xiàn)型數(shù)據(jù)庫(kù)
1.2數(shù)據(jù)庫(kù)分類目前六頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)是一種能直接提供文獻(xiàn)線索和文獻(xiàn)原文的數(shù)據(jù)庫(kù)收集的記錄是根據(jù)書刊、技術(shù)報(bào)告、學(xué)位論文、會(huì)議報(bào)告、專利、報(bào)刊新聞等加過(guò)工的一次或二次文獻(xiàn)。1.2數(shù)據(jù)庫(kù)分類
——文獻(xiàn)型數(shù)據(jù)庫(kù)目前七頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)全文型數(shù)據(jù)庫(kù)(一次文獻(xiàn))
:存貯文獻(xiàn)全文或部分內(nèi)容的數(shù)據(jù)庫(kù)目錄型數(shù)據(jù)庫(kù)(二次文獻(xiàn)):存儲(chǔ)書刊目錄、論文題錄、文摘等書目線索的數(shù)據(jù)庫(kù)題錄/文摘數(shù)據(jù)庫(kù)
:存儲(chǔ)和檢索期刊論文外部特征及文獻(xiàn)摘要信息的數(shù)據(jù)庫(kù)書目數(shù)據(jù)庫(kù):存儲(chǔ)和檢索書目信息的數(shù)據(jù)庫(kù)1.2數(shù)據(jù)庫(kù)分類
——文獻(xiàn)型數(shù)據(jù)庫(kù)目前八頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)收集指南或詞典形式的數(shù)據(jù)記錄,能直接提供具體的術(shù)語(yǔ)、事實(shí)、數(shù)值和圖像等信息的數(shù)據(jù)庫(kù)。
1.2數(shù)據(jù)庫(kù)分類
——非文獻(xiàn)型數(shù)據(jù)庫(kù)目前九頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)數(shù)據(jù)型數(shù)據(jù)庫(kù):是一種以自然數(shù)值形式表示、計(jì)算機(jī)可讀的數(shù)據(jù)集合。如實(shí)驗(yàn)數(shù)據(jù)、化學(xué)分子式、價(jià)格等統(tǒng)計(jì)數(shù)據(jù)、科學(xué)實(shí)驗(yàn)數(shù)據(jù)、測(cè)量數(shù)據(jù)等。如:中國(guó)科學(xué)計(jì)量指標(biāo)數(shù)據(jù)庫(kù)。圖像型數(shù)據(jù)庫(kù):存貯有某些圖象信息,如圖片,云圖,工程設(shè)計(jì)圖等.
目前十頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)事實(shí)型數(shù)據(jù)庫(kù):也稱指南型數(shù)據(jù)庫(kù),是一種存貯簡(jiǎn)單而獨(dú)立存在的非文獻(xiàn)信息,如機(jī)構(gòu)、人物、產(chǎn)品、地理位置、事件等,每個(gè)條目都是對(duì)一個(gè)事實(shí)確切、完整的描述。按內(nèi)容劃分有人物數(shù)據(jù)庫(kù)、機(jī)構(gòu)名錄數(shù)據(jù)庫(kù)、產(chǎn)品或商品信息數(shù)據(jù)庫(kù)、以及投資指南庫(kù)、基金指南庫(kù)等。1.2數(shù)據(jù)庫(kù)分類
——非文獻(xiàn)型數(shù)據(jù)庫(kù)目前十一頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)術(shù)語(yǔ)型數(shù)據(jù)庫(kù):也稱詞語(yǔ)型數(shù)據(jù)庫(kù)。專門存儲(chǔ)揭示各類名詞、術(shù)語(yǔ)、詞語(yǔ)的形、音、義與使用方法、以及詞義演變、發(fā)展等信息的檢索工具。
目前多數(shù)術(shù)語(yǔ)型數(shù)據(jù)庫(kù)大多是辭書、詞典、百科全書等數(shù)字化版本。目前十二頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)數(shù)據(jù)庫(kù)文獻(xiàn)型數(shù)據(jù)庫(kù)非文獻(xiàn)型數(shù)據(jù)庫(kù)全文數(shù)據(jù)庫(kù)題錄/文摘數(shù)據(jù)庫(kù)書目數(shù)據(jù)庫(kù)數(shù)據(jù)型圖像型事實(shí)型術(shù)語(yǔ)型目錄數(shù)據(jù)庫(kù)目前十三頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)不同類型數(shù)據(jù)庫(kù)的結(jié)構(gòu)不完全相同。文獻(xiàn)型數(shù)據(jù)庫(kù)的結(jié)構(gòu)層次:字段記錄文檔
1.3數(shù)據(jù)庫(kù)的結(jié)構(gòu)目前十四頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)數(shù)據(jù)庫(kù)中最基本的信息單元,其實(shí)體是文獻(xiàn)的著錄項(xiàng)目。記錄中的字段標(biāo)識(shí)符一般由兩個(gè)字母組成,如TI,AB,AU,PY,LA等.每個(gè)字段都是一條檢索該記錄的途徑.
三種基本字段:檢索系統(tǒng)的存取號(hào)(AccessionNumber)基本索引字段(BasicIndexFields)輔助索引字段(AdditionalIndexFields)字段目前十五頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)存取號(hào):計(jì)算機(jī)信息檢索系統(tǒng)為該數(shù)據(jù)庫(kù)的每一條記錄規(guī)定的能被計(jì)算機(jī)識(shí)別的特定號(hào)碼。在同一數(shù)據(jù)庫(kù)中,每篇文獻(xiàn)記錄只有一個(gè)存取號(hào)。一般來(lái)講,存取號(hào)由6—9位數(shù)字組成,出現(xiàn)在每條聯(lián)機(jī)記錄的左上角位置。
字段目前十六頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)基本索引字段:又稱主題字段,是數(shù)據(jù)庫(kù)提供的字段檢索默認(rèn)值.用來(lái)表達(dá)文獻(xiàn)內(nèi)容特征的字段,如:篇名字段(TitleField/TI)文摘字段(AbstractField/AB)敘詞字段(DescriptorField/DE)字段目前十七頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)
輔助索引字段(AdditionalIndexFields):用來(lái)表達(dá)文獻(xiàn)外部特征的字段,如:著者字段(AuthorField/AU)出版年字段(PublicationYearField/PY)刊名字段(JournalField/SO或JN)語(yǔ)種字段(LanguageField/LA)文獻(xiàn)類型字段(DocumentTypeField/DT)輔助字段種類很多,且隨數(shù)據(jù)庫(kù)的不同而各有差異。字段目前十八頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)
幾個(gè)不同字段的集合構(gòu)成記錄,一個(gè)數(shù)據(jù)庫(kù)內(nèi)的記錄往往含有相同的字段。每條記錄相當(dāng)于文摘型或題錄型檢索刊物的一條著錄款目。
一條記錄即一篇文獻(xiàn)。記錄目前十九頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)一條記錄的格式:目前二十頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)由若干相同類型或不同類型的記錄組成。一個(gè)數(shù)據(jù)庫(kù)由若干個(gè)文檔組成。一個(gè)文檔由大量的記錄組成,而每個(gè)記錄中又包含有若干字段,這就是文獻(xiàn)數(shù)據(jù)庫(kù)中的層次結(jié)構(gòu)。
文檔目前二十一頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)(二)
檢索理論基礎(chǔ)
目前二十二頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)
檢索詞是用戶或檢索人員給出的字、詞、字符或短語(yǔ),用于查找含有它(它們)的記錄。
檢索詞分為兩類:受控詞和非受控詞。
2.1檢索詞——概念及分類目前二十三頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)檢索詞受控詞非受控詞主題詞表敘詞表分類詞表自然語(yǔ)言索引關(guān)鍵詞索引2.1檢索詞——概念及分類目前二十四頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)受控詞:是事先規(guī)范化的檢索語(yǔ)言,取自主題詞表、敘詞表、分類表等。如果數(shù)據(jù)庫(kù)對(duì)數(shù)據(jù)采用了受控標(biāo)引,并有機(jī)讀式或印刷版主題詞表時(shí),應(yīng)優(yōu)先選用其中的受控詞。特點(diǎn):受控詞的檢索效率高,一旦選定適當(dāng)?shù)母拍睿到y(tǒng)就能檢出這一概念的全部?jī)?nèi)容,而且,由于標(biāo)引人員已事先解決了自然語(yǔ)言中的同義、近義關(guān)系,使檢索相對(duì)容易。
但受控詞不能及時(shí)反映新事物的發(fā)展,而且概念數(shù)量有限、結(jié)構(gòu)復(fù)雜,不易為非專業(yè)人員掌握。2.1檢索詞——概念及分類目前二十五頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)非受控詞:非受控詞是指非規(guī)范化的自然語(yǔ)言詞匯,又稱自由詞。特點(diǎn):非受控詞可以在一定程度上彌補(bǔ)受控詞的不足,非受控詞可以是任意選詞,其專指性強(qiáng),而且不需要熟悉詞表,新產(chǎn)生的名詞術(shù)語(yǔ)可以及時(shí)檢索與新概念有關(guān)的文獻(xiàn)。但非受控詞一般不能提供概念的等級(jí)結(jié)構(gòu),不能解決同義詞、近義詞、相關(guān)詞的結(jié)合或連接問(wèn)題。
2.1檢索詞——概念及分類目前二十六頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)2.2檢索技術(shù)布爾邏輯算符截詞檢索(外文)限制檢索(外文)目前二十七頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)
利用布爾邏輯算符將檢索詞或代碼進(jìn)行邏輯組配以表達(dá)檢索需求的檢索方法布爾邏輯算符有三種:邏輯與(邏輯乘)邏輯或(邏輯和)邏輯非(邏輯差)2.2檢索技術(shù)——布爾邏輯算符目前二十八頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)2.2檢索技術(shù)——布爾邏輯算符-----邏輯與(邏輯乘)邏輯與(邏輯乘)是用“and”或“*”連接檢索概念,AandB(或A*B)表示兩個(gè)概念的交叉,即記錄中必須同時(shí)含有A和B,用“邏輯與”來(lái)檢索是對(duì)檢索需求增加限定因素,可以縮小檢索范圍。用邏輯與組構(gòu)的檢索詞越多,檢索范圍越小,專指度越強(qiáng),有助于提高查準(zhǔn)率。目前二十九頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)2.2檢索技術(shù)——布爾邏輯算符SearchtermsResultsapple78,344breeding2,962plantovertyANDcrime5,677appleANDbreedingANDplant76邏輯與(邏輯乘)Wienn圖目前三十頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)2.2檢索技術(shù)——布爾邏輯算符----邏輯或(邏輯和)邏輯或(邏輯和)是用“or”或“+”連接檢索概念,AorB(或A+B)表示兩個(gè)概念的并列,即記錄中凡單獨(dú)含有檢索項(xiàng)A或檢索項(xiàng)B,或者同時(shí)含有A、B兩者均為命中記錄。用邏輯或來(lái)檢索可擴(kuò)大檢索范圍,提高查全率。目前三十一頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)2.2檢索技術(shù)——布爾邏輯算符SearchtermsResultscollege770university33,685,205collegeORuniversity33,702,660collegeORuniversityORcampus33,703,820邏輯或(邏輯和)Wienn圖目前三十二頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)2.2檢索技術(shù)——布爾邏輯算符----邏輯非(邏輯差)邏輯非(邏輯差)是用“not”或“-”連接檢索概念,AnotB(或A-B)表示兩個(gè)概念的排除,即凡含有檢索項(xiàng)A并且不含檢索項(xiàng)B的記錄為命中記錄。用邏輯非來(lái)檢索,可以縮小檢索范圍,提高檢索的專指度。但這種檢索也有缺點(diǎn),即取消部分,往往會(huì)把切題的文獻(xiàn)丟掉,因此運(yùn)用邏輯非運(yùn)算時(shí)要慎重。目前三十三頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)2.2檢索技術(shù)——布爾邏輯算符SearchtermsResultscats3,651,252dogs4,556,515catsNOTdogs81,497NOT邏輯非(邏輯差)Wienn圖目前三十四頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)
在外文檢索中,常會(huì)遇到一些詞干相同、詞義相近的檢索詞或有英、美不同拼寫的詞,為了減少檢索詞的頻繁輸入,擴(kuò)大檢索范圍,可使用截詞符(通配符),以提高檢索效率。
所謂截詞,是指在檢索詞的某個(gè)局部截?cái)?,利用某些檢索詞的詞干或不完整詞形加上截詞符進(jìn)行檢索,其目的是查找某一詞干的不同變化形式,做到一“詞”多用,防止漏檢,從而達(dá)到較高的查全率。
2.2檢索技術(shù)——截詞檢索目前三十五頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)2.2檢索技術(shù)——截詞檢索截詞方式有前截?cái)?、后截?cái)唷⑶昂蠼財(cái)嗪椭虚g截?cái)?種。一般用?和*表示截詞符,不同系統(tǒng),含義不同.目前三十六頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)2.2檢索技術(shù)——截詞檢索----前截詞:將截詞符放在詞根的前面,后方一致,表示在詞根的前方有無(wú)限個(gè)或有限個(gè)字符變化。例如,computer(計(jì)算機(jī)),在該詞根前加“?”,即“?Computer”,可檢出:Microcomputer、Minicomputer等。目前三十七頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)2.2檢索技術(shù)——截詞檢索----后截詞:將截詞符放在詞根后面,前方一致。computer(計(jì)算機(jī)),在該詞根后加“?”,即為“Computer?”,可檢出computers、computerised、computerization等。
目前三十八頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)2.2檢索技術(shù)——截詞檢索----前后截詞:將截詞符放在詞根的前面和后面,中間一致。例如,computer(計(jì)算機(jī)),在詞根前后都加“?”,即為“?computer?”,可檢出microcomputer、minicomputer、computer、computers、computerised、computerization等。目前三十九頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)2.2檢索技術(shù)——截詞檢索----中間截詞:中間截詞又稱為“通常字符檢索法”,它是將截詞符置于檢索詞的中間,而詞的前后方一致,通常用于英、美英語(yǔ)拼寫不同的詞的檢索。例如,colo?r可檢出colour(英音)、color(美音)。
目前四十頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)2.2檢索技術(shù)——截詞檢索根據(jù)截詞的多少,可把截詞符分成有限截詞符和無(wú)限截詞符兩種。
有限截詞:
所謂有限截詞,是在檢索詞后截去有限的字母,例如輸入computer?
,截詞符“?”表示可以有0-1個(gè)字母變化,系統(tǒng)即檢出帶有computer和computers的文獻(xiàn);輸入stud???,表示截三個(gè)字母,可檢索出帶有study,studies,studied和studing等的文獻(xiàn)。目前四十一頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)2.2檢索技術(shù)——截詞檢索無(wú)限截詞:無(wú)限截詞是在檢索詞根后加一個(gè)“?”或“*”,表示該詞后帶任意字母的詞都可檢出,如輸入comput?則可檢出含有computers,computing,computered等文獻(xiàn)。目前四十二頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)2.2檢索技術(shù)——限制檢索運(yùn)用布爾邏輯算符檢索時(shí),只對(duì)檢索詞進(jìn)行邏輯組配,未限定檢索詞之間的位置關(guān)系及檢索詞在記錄中的位置。在有些情況下,若不限制檢索詞之間的位置關(guān)系會(huì)影響查準(zhǔn)率。因此,在檢索系統(tǒng)中設(shè)置了位置限定運(yùn)算符。不同的檢索系統(tǒng)有不同的符號(hào)。限制檢索的方式有多種,例如進(jìn)行字段檢索、使用限制符、采用限制檢索命令等。
目前四十三頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)2.2檢索技術(shù)——詞位限制檢索A字段限定檢索:把檢索詞限定在某個(gè)/些字段中,如果記錄的相應(yīng)字段中含有輸入的檢索詞則為命中記錄,否則檢不中。
例如查找微型機(jī)或個(gè)人計(jì)算機(jī)方面的文章。要求"微型機(jī)"一詞出現(xiàn)在標(biāo)題或文摘字段中,"個(gè)人計(jì)算機(jī)"一詞出現(xiàn)在標(biāo)題或文摘字段中,檢索式可寫為:
目前四十四頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)
microcomputer?/ti,abORpersonalcomputer/ti,ab
如查找wangwei寫的文章,可以輸入檢索式:au=wangwei目前四十五頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)2.2檢索技術(shù)——詞位限制檢索B使用限制符:用表示語(yǔ)種、文獻(xiàn)類型、出版國(guó)家、出版年代等的字段標(biāo)識(shí)符來(lái)限制檢索范圍。如要查找1989-1999年出版的英文或法文的微型機(jī)或個(gè)人計(jì)算機(jī)方面的期刊,并要求“微型機(jī)和個(gè)人計(jì)算機(jī)"出現(xiàn)在標(biāo)題或文摘字段中,則檢索式為:目前四十六頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)
(microcomputer?/ti,abORpersonalcomputer/ti,ab)AND
PY=(1989:1999)AND(LA=ENORFR)AND
DT=Serial
目前四十七頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)2.2檢索技術(shù)——詞位限制檢索
C詞位限制:可以是相鄰若干詞、在同一句中等.
以DIALOG系統(tǒng)所用位置算符為例:
A(nW)B
A、B兩詞相隔n詞,且前后次序不變;n=1時(shí)即A()BA(nN)B
A、B兩詞相隔n詞,且前后次序不限;n=1時(shí)即A(N)BA(s)B
A、B兩詞只要在同一字段目前四十八頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)2.2——詞表助檢有些數(shù)據(jù)庫(kù)有自已的主題詞表,詞表不僅用于標(biāo)引文獻(xiàn),也可用于助檢。檢索者在選用檢索詞時(shí),可查閱詞表。有些聯(lián)機(jī)檢索系統(tǒng),將詞表存入計(jì)算機(jī),幫助用戶進(jìn)行檢索。它能將用戶輸入的非標(biāo)準(zhǔn)檢索詞,自動(dòng)地轉(zhuǎn)換為規(guī)范詞,還可以自動(dòng)擴(kuò)檢索,如使用同義詞檢索。目前四十九頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)(三)計(jì)算機(jī)檢索策略和檢索效果目前五十頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)什么是檢索策略?所謂檢索策略廣義上是指為實(shí)現(xiàn)檢索目的而制訂的全盤計(jì)劃和方案;狹義講是指檢索式。
檢索式是用來(lái)表達(dá)用戶提問(wèn)的邏輯表達(dá)式,是檢索策略的綜合體現(xiàn),通常由檢索詞和各種邏輯算符、位置算符及檢索系統(tǒng)中規(guī)定的其他連接符號(hào)構(gòu)成。目前五十一頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)在計(jì)算機(jī)檢索中,檢索策略直接關(guān)系到檢索結(jié)果的成敗,要想構(gòu)造高水平的檢索策略,不僅要求用戶對(duì)檢索系統(tǒng)十分了解,還需要對(duì)檢索課題進(jìn)行深入的分析并能靈活運(yùn)用各種檢索方法和技巧。
目前五十二頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)3.1檢索式表達(dá)檢索式也稱檢索提問(wèn)表達(dá)式,是要求系統(tǒng)執(zhí)行的檢索語(yǔ)句。簡(jiǎn)單的檢索式由一個(gè)檢索詞和一個(gè)字段名構(gòu)成,復(fù)雜的檢索式則由多個(gè)檢索詞和字段名通過(guò)關(guān)系算符(包括邏輯算符與位置算符等)連接而成。簡(jiǎn)單檢索式:apple/ti復(fù)雜檢索式:
((cornormaize)andharvest*)/ti目前五十三頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)(algae+algal+microalgal)*growth()factor??實(shí)檢后調(diào)整(考慮提高檢準(zhǔn)率)、優(yōu)化(低頻詞和關(guān)鍵詞前置)為:(microalgal+algae+algal)(s)growth()factor??(microalgal+algae+algal)(3N)growth()factor??“微藻生長(zhǎng)因子”目前五十四頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)“圖象理解專家系統(tǒng)”Image()understand???*(expert()system??+artificial()intelligen??)目前五十五頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)3.2檢索效果參數(shù)
包括:查全率(recallfactor)、查準(zhǔn)率(也稱適中率,Pertinencyfactor??)、漏檢率(omissionfactor)、誤檢率(也叫檢索噪音,noisefactor)以及新穎率、檢索速度等。
目前五十六頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)假設(shè):n為檢索系統(tǒng)中文獻(xiàn)總量,a為n中與檢索課題有關(guān)的文獻(xiàn)量,m為檢索輸出的文獻(xiàn)量,b為m中與檢索課題有關(guān)的文獻(xiàn)量(檢準(zhǔn)文獻(xiàn)量),則n、m、a、b之間的關(guān)系如圖所示。目前五十七頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)n系統(tǒng)文獻(xiàn)總量m檢出文獻(xiàn)量b為m中相關(guān)文獻(xiàn)漏檢誤檢a為n中相關(guān)文獻(xiàn)目前五十八頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)令:
R表示查全率、
P表示查準(zhǔn)率、
M表示漏檢率、
N表示誤檢率,則R、P、M、N定義如下:
R=b/a*100%
P=b/m*100%
M=(1-b/a)*100%=100%-R
N=(1-b/m)*100%=100%-P
目前五十九頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)最理想的檢索效果R、P均為100%,但實(shí)際上這是不可能的。實(shí)驗(yàn)表明:R和P之間存在相反的相互依賴關(guān)系,即提高R會(huì)降低P,反之亦然,如下圖檢索特性曲線所示。目前六十頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)檢索特性曲線目前六十一頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)對(duì)于檢索來(lái)說(shuō),漏檢是影響檢索質(zhì)量的最主要因素,故必須將M降低到最低限度;誤檢會(huì)降低檢索的效率,也會(huì)影響檢索質(zhì)量。因此,任何檢索工具和檢索系統(tǒng)必須力爭(zhēng)克服漏檢(必要條件),同時(shí)盡量避免誤檢(充分條件)。目前六十二頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)(四)計(jì)算機(jī)檢索流程目前六十三頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)文獻(xiàn)檢索課程目的:讓你以最有效的方法收集及篩選所需數(shù)據(jù)以提高科學(xué)研究能力目前六十四頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)檢索流程(構(gòu)建檢索策略的步驟)分析課題內(nèi)容選擇信息資源構(gòu)造檢索式選擇檢索點(diǎn)進(jìn)行檢索分析檢索結(jié)果,調(diào)整檢索策略跟進(jìn)檢索目前六十五頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)4.1分析課題的內(nèi)容1).明確檢索目的需要關(guān)于某一課題的系統(tǒng)詳盡的信息需要關(guān)于某一課題的最新信息了解一些片斷信息,解決一些具體問(wèn)題目前六十六頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)2).
明確課題的主題或主要內(nèi)容
要形成若干個(gè)既代表信息需求又有檢索意義的主題概念,包括所涉及的主題概念有幾個(gè),概念的專指度是否適合,哪些是主要的,哪些是次要的,概念之間關(guān)系如何等。目前六十七頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)3).課題涉及的學(xué)科范圍:搞清楚課題所涉及的學(xué)科領(lǐng)域、是否跨學(xué)科研究。4).所需信息的數(shù)量、語(yǔ)種、年代范圍、類型等具體化指標(biāo)目前六十八頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)例:檢索課題--不銹鋼焊接檢索目的查找范圍了解最新的技術(shù)動(dòng)態(tài)利用期刊、會(huì)議錄類的數(shù)據(jù)庫(kù)查找了解焊縫強(qiáng)度的測(cè)試方法和有關(guān)規(guī)格利用技術(shù)標(biāo)準(zhǔn)類的數(shù)據(jù)庫(kù)查找申請(qǐng)專利利用專利類數(shù)據(jù)庫(kù)查找目前六十九頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)4.2選擇信息資源是否與檢索課題相關(guān)的資源都要檢索選擇哪些學(xué)科的信息資源選擇哪些語(yǔ)種的信息資源信息資源覆蓋的年限是否符合需求信息資源的特點(diǎn)及針對(duì)性目前七十頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)4.3構(gòu)造檢索式選擇檢索點(diǎn)檢索式
是表達(dá)用戶檢索提問(wèn)的邏輯表達(dá)式,由基于檢索概念產(chǎn)生的檢索詞和各種組配算符構(gòu)成。檢索點(diǎn)
即檢索途徑或檢索入口、檢索字段。檢索點(diǎn)正確與否,決定著檢索結(jié)果的數(shù)量與質(zhì)量。目前七十一頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)
一個(gè)檢索課題往往涉及多個(gè)概念,選擇檢索詞時(shí)首先要將檢索課題涉及的所有概念分離出來(lái),并針對(duì)每一個(gè)概念選擇盡可能多的檢索詞。
分析概念可從課題名稱入手,出現(xiàn)在課題名稱中的詞并不一定都是概念詞。目前七十二頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)如:“吸煙與心臟病的關(guān)系”可以表達(dá)為:connectionbetweensomkingandheartdisease
通過(guò)分析發(fā)現(xiàn),其中,只有
somking和heartdisease兩個(gè)概念詞,而“connectionbetween”則不屬于概念詞。
概念1:somking
概念2:heartdisease目前七十三頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)
有些課題的實(shí)質(zhì)性內(nèi)容往往很難從課題名稱上反映出來(lái),需要從中提取隱含概念,另外有些檢索詞已含有的概念,在選詞時(shí)應(yīng)予以排除。例:聚乙烯的合成
聚乙烯合成
垃圾的處理
垃圾處理回收再生
玻璃纖維增強(qiáng)石膏制品
玻璃纖維石膏目前七十四頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)針對(duì)每一個(gè)概念,選擇與之相關(guān)的同義詞或相關(guān)詞與somking相關(guān)的詞有:smoker,smokers,tobacco等;heartdisease的同義詞有:cardiopathy,hearttrouble,heartattack.將這些相關(guān)詞記錄下來(lái),用于構(gòu)造檢索式:
概念1:somking,smokers,tobacco
概念2:cardiopathy,heartdisease,hearttrouble,heartattack
目前七十五頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)選定檢索詞的方法
利用上下位詞或特有名詞及同義詞、近義詞、相關(guān)詞,查閱工具如專業(yè)詞表詞典,字典,分類表等:根據(jù)詞表或數(shù)據(jù)庫(kù)中的索引選詞從專業(yè)詞典、百科全書等參考工具中選詞
利用中文全文數(shù)據(jù)庫(kù)選擇英文檢索詞目前七十六頁(yè)\總數(shù)八十五頁(yè)\編于十七點(diǎn)編制檢索式
使用邏輯算符(AND,OR,NOT)、截詞、位置算符,限制檢索條件至作者,刊物或年
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 如何進(jìn)行生產(chǎn)計(jì)劃的回顧與總結(jié)
- 生物實(shí)驗(yàn)室設(shè)備管理計(jì)劃
- 積極心理學(xué)在幼兒園班級(jí)中的應(yīng)用計(jì)劃
- 深化小班課程改革的思考計(jì)劃
- 內(nèi)科三基試題第三章消化內(nèi)科
- 四川省雅安市2024-2025學(xué)年高三上學(xué)期11月零診試題 數(shù)學(xué) 含答案
- 中小學(xué)科普活動(dòng)方案策劃
- 商場(chǎng)餐飲開業(yè)活動(dòng)策劃方案
- 學(xué)校食堂培訓(xùn)資料
- 礦山設(shè)備安裝安全方案
- 二甲評(píng)審迎檢注意事項(xiàng)及技巧
- 三棵樹涂料股份有限公司股權(quán)激勵(lì)研究
- 攝影與攝像知識(shí)考試復(fù)習(xí)題庫(kù)
- 幼兒園矛盾糾紛排查調(diào)處制度
- 20CJ94-1 隔聲樓面系統(tǒng)-HTK輕質(zhì)隔聲砂漿
- 2024年4月自考00160審計(jì)學(xué)試題及答案含評(píng)分標(biāo)準(zhǔn)
- 慢性胃炎的癥狀及治療方法
- 小型攔沙壩工程 投標(biāo)方案(技術(shù)方案)
- 2024年-重晶石購(gòu)銷合同1本月修正
- 2022年廣州市白云區(qū)總工會(huì)社會(huì)化工會(huì)工作者考試試卷及答案解析
- 國(guó)家開放大學(xué)2024年《知識(shí)產(chǎn)權(quán)法》形考任務(wù)1-4答案
評(píng)論
0/150
提交評(píng)論