第四章計(jì)算機(jī)檢索技術(shù)與數(shù)據(jù)庫(kù)檢索方式_第1頁
第四章計(jì)算機(jī)檢索技術(shù)與數(shù)據(jù)庫(kù)檢索方式_第2頁
第四章計(jì)算機(jī)檢索技術(shù)與數(shù)據(jù)庫(kù)檢索方式_第3頁
第四章計(jì)算機(jī)檢索技術(shù)與數(shù)據(jù)庫(kù)檢索方式_第4頁
第四章計(jì)算機(jī)檢索技術(shù)與數(shù)據(jù)庫(kù)檢索方式_第5頁
已閱讀5頁,還剩67頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第四章計(jì)算機(jī)信息檢索的基本技術(shù)與方法一、計(jì)算機(jī)信息檢索的基本技術(shù):一、計(jì)算機(jī)信息檢索的基本技術(shù): 布爾邏輯、截詞檢索、加權(quán)檢索,位置算符布爾邏輯、截詞檢索、加權(quán)檢索,位置算符等等。在進(jìn)行計(jì)算機(jī)檢索時(shí),有時(shí)有一些比較復(fù)雜在進(jìn)行計(jì)算機(jī)檢索時(shí),有時(shí)有一些比較復(fù)雜的課題,如:的課題,如:“GPSGPS在建筑中的應(yīng)用在建筑中的應(yīng)用”,既涉,既涉及及GPSGPS,又涉及建筑,還有又涉及建筑,還有“應(yīng)用應(yīng)用”,這時(shí)候,這時(shí)候就要編制出滿足要求的計(jì)算機(jī)檢索式,它是機(jī)檢就要編制出滿足要求的計(jì)算機(jī)檢索式,它是機(jī)檢的基礎(chǔ)。的基礎(chǔ)。1 1布爾邏輯檢索布爾邏輯檢索(Boolean Logic Boolean Logic

2、 RetrievalRetrieval) 邏輯檢索的基礎(chǔ)是邏輯運(yùn)算,邏輯運(yùn)算邏輯檢索的基礎(chǔ)是邏輯運(yùn)算,邏輯運(yùn)算中最常用的是布爾邏輯運(yùn)算符(中最常用的是布爾邏輯運(yùn)算符(Boolean Boolean Logic OperatorsLogic Operators), ,即與、或、非三種運(yùn)即與、或、非三種運(yùn)算符號(hào),算符號(hào),用它們可以表示概念之間的邏輯用它們可以表示概念之間的邏輯關(guān)系。關(guān)系。檢 索 要求邏輯檢索 課題 表達(dá)式 檢 索 結(jié)果概念相交、限定 AND與* 計(jì)算機(jī)用于制圖 A BA AND BA * B 縮小檢索范圍提高查準(zhǔn)率 概念平行、并列 OR或+ 土地管理與土地利用 A B A OR B

3、 A+B擴(kuò)大檢索范圍提高查全率 某一主題去掉一部分相關(guān)主題 NOT非- 除光電測(cè)距以外的 A 電磁波測(cè)距 BB NOT AB-A提高查準(zhǔn)率 2 位置算符位置算符(Proximity Operators) 位置算符是表示檢索詞之間位置關(guān)系的一種運(yùn)位置算符是表示檢索詞之間位置關(guān)系的一種運(yùn)算符。由于英文對(duì)一句話有多種表達(dá)方法,寫法可算符。由于英文對(duì)一句話有多種表達(dá)方法,寫法可能不同。如:能不同。如:“GPS在鐵路橋研究中的應(yīng)用在鐵路橋研究中的應(yīng)用”這個(gè)這個(gè)課題,用英文表達(dá)可能是課題,用英文表達(dá)可能是“Using of GPS in Railway Bridge”, 也可能是也可能是“Using of

4、 GPS in Bridge of Railway”,因而可能編制出這樣的檢索因而可能編制出這樣的檢索式,式,GPS AND (Railway (2N)Bridge)我們可以通過位置檢索提高檢索的準(zhǔn)確率(1) (W)算符與算符與(nW)算符算符 W 是是word與與 with的縮寫。的縮寫。 特點(diǎn):特點(diǎn):W詞序不變,中間不可插詞,但兩詞序不變,中間不可插詞,但兩詞間可有一個(gè)標(biāo)點(diǎn),連字符或空格。詞間可有一個(gè)標(biāo)點(diǎn),連字符或空格。 nW詞序不變,中間可插入詞序不變,中間可插入N 個(gè)詞。個(gè)詞。 如:如:potential (w) energy可能檢出可能檢出potential energy and f

5、unction 又如:又如:gone (2w)wind 可能檢出可能檢出gone with the wind (2) (N)與與(nN)算符算符 N是是near的縮寫的縮寫 特點(diǎn):特點(diǎn):N詞序不限,中間不可插詞,但兩詞序不限,中間不可插詞,但兩詞間可有一個(gè)標(biāo)點(diǎn),連字符或空格。詞間可有一個(gè)標(biāo)點(diǎn),連字符或空格。 nN詞序不限,中間可插入詞序不限,中間可插入N 個(gè)詞。個(gè)詞。 如:如:econom? (2N)recovery可能檢出可能檢出economic recovery,recovery of the economy,(3)同字段檢索)同字段檢索A(F)B,F(xiàn)是是field的縮寫。的縮寫。 特點(diǎn):

6、特點(diǎn):A、B兩詞必須出現(xiàn)在同一字段中,兩詞必須出現(xiàn)在同一字段中,詞序與詞量不限。詞序與詞量不限。 如:如:environment (F)impact/DE,表示兩個(gè)表示兩個(gè)詞必須同時(shí)出現(xiàn)在敘詞字段內(nèi)。詞必須同時(shí)出現(xiàn)在敘詞字段內(nèi)。(4) 同句檢索同句檢索A(S)B,S是是sentence的縮寫的縮寫。 特點(diǎn):特點(diǎn):A、B出現(xiàn)在同一自然句中(子字段),出現(xiàn)在同一自然句中(子字段),其詞序與詞量不受限制。其詞序與詞量不受限制。 如:如:electric (S)plant可檢出可檢出electric power plants如:如:EI中的中的NEAR;PQDD中的中的W/n (兩詞間距小兩詞間距小于

7、于n個(gè)單詞,且前后位置任意個(gè)單詞,且前后位置任意),Pre/n (兩詞間距兩詞間距小于小于n個(gè)單詞,且前后位置一定個(gè)單詞,且前后位置一定)3 3截詞算符截詞算符( (Truncating operators)Truncating operators) 在英語詞匯中,一個(gè)詞可能有多種在英語詞匯中,一個(gè)詞可能有多種形態(tài),如詞的單、復(fù)數(shù)形式的不同,英形態(tài),如詞的單、復(fù)數(shù)形式的不同,英美拼寫方法不同、詞性不同等。如果檢美拼寫方法不同、詞性不同等。如果檢索時(shí)將這類詞全部輸入進(jìn)去,會(huì)增加檢索時(shí)將這類詞全部輸入進(jìn)去,會(huì)增加檢索時(shí)間和費(fèi)用,采用截詞法可解決這一索時(shí)間和費(fèi)用,采用截詞法可解決這一問題。問題。 所

8、謂截詞檢索,是指在檢索標(biāo)識(shí)中保留相所謂截詞檢索,是指在檢索標(biāo)識(shí)中保留相同的部分,用相應(yīng)的截詞符代替可變化部同的部分,用相應(yīng)的截詞符代替可變化部分。檢索中計(jì)算機(jī)會(huì)將所有含有相同部分分。檢索中計(jì)算機(jī)會(huì)將所有含有相同部分標(biāo)識(shí)的記錄全部檢索出來。常用標(biāo)識(shí)的記錄全部檢索出來。常用“?”、“*”符號(hào)表示。符號(hào)表示。(1)有限截詞)有限截詞。即在檢索詞后后截幾個(gè)有限。即在檢索詞后后截幾個(gè)有限的字母,如名詞的單復(fù)數(shù),動(dòng)詞的詞尾變化等。的字母,如名詞的單復(fù)數(shù),動(dòng)詞的詞尾變化等。如輸入如輸入computer?表示有表示有0-1個(gè)字母變化,可個(gè)字母變化,可檢出檢出computer和和computers. 輸入輸入s

9、tud?表示截?cái)嗵幱斜硎窘財(cái)嗵幱?-3個(gè)字母變化,個(gè)字母變化,可檢出可檢出study,studies,studied,studing.(2)無限截?cái)啵o限截?cái)啵涸跈z索詞后加一個(gè):在檢索詞后加一個(gè)“?“,表示該詞后可加任意個(gè)字符。使用無限截表示該詞后可加任意個(gè)字符。使用無限截詞,所截詞根不能太短,否則會(huì)輸出許多詞,所截詞根不能太短,否則會(huì)輸出許多無關(guān)文獻(xiàn),造成誤檢。無關(guān)文獻(xiàn),造成誤檢。 如:如:computer?可檢出可檢出computers,computering,computered,computerization. (3)中間截?cái)嘀虚g截?cái)啵涸跈z索詞中間加一個(gè)或:在檢索詞中間加一個(gè)或幾個(gè)?號(hào)

10、,主要解決一些英美拼寫不同,幾個(gè)?號(hào),主要解決一些英美拼寫不同,單復(fù)數(shù)形式的不同的詞的輸入,可簡(jiǎn)化單復(fù)數(shù)形式的不同的詞的輸入,可簡(jiǎn)化輸入。輸入。 如:輸入如:輸入wom?n可檢出可檢出 woman,women各種算符在數(shù)據(jù)庫(kù)中的實(shí)際應(yīng)用各種算符在數(shù)據(jù)庫(kù)中的實(shí)際應(yīng)用位置算符位置算符1)EI NEAR Bridge NEAR Piling*表示這兩個(gè)詞要彼此接近,前后順序不限。W/n Pig*W/2pine*表示兩個(gè)詞的距離不能超過n個(gè)單詞Adj Channel adj tunnel表示含有這兩個(gè)詞,兩個(gè)詞相鄰,位置一定2)ISI Proceedings 用同句算符(SAME):如如Channel

11、 same Channel same tunneltunnel,表示表示channel channel 和和tunnel tunnel 出現(xiàn)在同一句子中才出現(xiàn)在同一句子中才符合檢索條件。符合檢索條件。3)CSA:within X“ 表示兩詞之間不得多于x個(gè)詞,前后位置任意 如“women within 8 movement” (順序不定)4)Elsevier: ADJ表示兩詞相鄰,前后順序固定,與詞檢索的結(jié)果相同;NEAR或NEAR(N),表示兩詞相鄰,中間可插入少于或等于n個(gè)單詞,前后順序可以發(fā)生變化,如果不使用(N),系統(tǒng)默認(rèn)值為10 5)PQDD W/n (兩詞間距小于兩詞間距小于n個(gè)單

12、詞,且前后位置個(gè)單詞,且前后位置任意任意),Pre/n (兩詞間距小于兩詞間距小于n個(gè)單詞,且前個(gè)單詞,且前后位置一定后位置一定)6)ProQuest W/n(表示連接兩個(gè)詞之間可以表示連接兩個(gè)詞之間可以插入插入n個(gè)詞個(gè)詞 ,前后位置可顛倒),前后位置可顛倒) 如:如:Education w/5 intenet 表示表示education和和internet之間可以插入之間可以插入5個(gè)詞個(gè)詞 ,并且前后位置可以顛倒。,并且前后位置可以顛倒。Pre/n(表示前后兩詞之間最多插入表示前后兩詞之間最多插入n個(gè)詞,前后位置一定個(gè)詞,前后位置一定 ) 如:如:U.S pre/n economic pol

13、icy可可檢出檢出U.S aideconomic policy,or U.S wartime economic policy 。截詞符或通配符如:如:CSAISI ProceedingsISI ProceedingsProQuestProQuestCACA用用通配符通配符“?”和截詞符和截詞符“* * ” ” 輸入輸入 “ “patentpatent* *”,可以檢索到可以檢索到 patentpatent、patents、 patentedpatented等,(無限截?cái)啵┑?,(無限截?cái)啵?輸入輸入 womwom?n?n,可以檢索到可以檢索到womanwoman和和womenwomen。 輸入輸

14、入“fib?”fib?”,可檢索到可檢索到fiberfiber和和 fibrefibre。(。(有限有限截?cái)啵┙財(cái)啵?EIEI用用“* * ” ” 和和“$”(“$”(詞根算符詞根算符) ) 如:OpticOptic* *檢索結(jié)果中包括以檢索結(jié)果中包括以optic optic 開頭后面加開頭后面加任意任意多個(gè)字母的詞例如多個(gè)字母的詞例如optic, optics,optical optic, optics,optical 等等 $ $managermanager(強(qiáng)調(diào)語義)檢索出與該詞根具強(qiáng)調(diào)語義)檢索出與該詞根具有同樣語意的詞如有同樣語意的詞如 $ $manage manage 將檢出將檢出

15、managers, managerialmanagers, managerial 和和management management 等詞等詞 通配符不能用在檢索詞的最前面通配符不能用在檢索詞的最前面4 4括號(hào)檢索(括號(hào)檢索(ParenthesesParentheses)用于改變運(yùn)算的先后次序,括號(hào)內(nèi)的內(nèi)容做優(yōu)用于改變運(yùn)算的先后次序,括號(hào)內(nèi)的內(nèi)容做優(yōu)先運(yùn)算。先運(yùn)算。用用“()”可以表示優(yōu)先級(jí)。如比較可以表示優(yōu)先級(jí)。如比較 (GPSORGIS)ANDChina GPSORGIS ANDChinaEI 中的表示方法:中的表示方法:Relevance AND( Aalbersberg within AU

16、)OR (cool within AU)5 5、字段限制檢索字段限制檢索 組成數(shù)據(jù)庫(kù)的最小單位是記錄,一條完整記錄中的組成數(shù)據(jù)庫(kù)的最小單位是記錄,一條完整記錄中的每一個(gè)著錄事項(xiàng)為字段。獻(xiàn)書目型數(shù)據(jù)庫(kù)的記錄基本每一個(gè)著錄事項(xiàng)為字段。獻(xiàn)書目型數(shù)據(jù)庫(kù)的記錄基本包括下列字段:包括下列字段:(1) 存取號(hào)字段(存取號(hào)字段(AN, Access NumberAN, Access Number)這是計(jì)算這是計(jì)算機(jī)檢索系統(tǒng)為每個(gè)數(shù)據(jù)庫(kù)的每篇記錄規(guī)定的能被計(jì)算機(jī)檢索系統(tǒng)為每個(gè)數(shù)據(jù)庫(kù)的每篇記錄規(guī)定的能被計(jì)算機(jī)識(shí)別的特定號(hào)碼。在同一數(shù)據(jù)庫(kù)中,每篇文獻(xiàn)記錄機(jī)識(shí)別的特定號(hào)碼。在同一數(shù)據(jù)庫(kù)中,每篇文獻(xiàn)記錄只有一個(gè)存取號(hào);

17、只有一個(gè)存取號(hào);(2) 篇(題)名字段(篇(題)名字段(Title Field, /TITitle Field, /TI)(3) 文摘字段(文摘字段(Abstract Field, /AB)Abstract Field, /AB)(4) 敘詞字段或受控詞字段(敘詞字段或受控詞字段(DestriptorDestriptor Field, Field, /DE; /DE; 或或 Controlled term Field-SU) Controlled term Field-SU) 這一字段是標(biāo)這一字段是標(biāo)引人員給文獻(xiàn)標(biāo)引的反映其主題概念的詞,這些引人員給文獻(xiàn)標(biāo)引的反映其主題概念的詞,這些詞來自規(guī)范

18、化的詞表。也稱主題詞。詞來自規(guī)范化的詞表。也稱主題詞。 (5)自由詞字段或非受控詞字段(自由詞字段或非受控詞字段(Identified Field, /ID; Keyword Field , /KY ;Uncontrolled term Field) 這一字段也是標(biāo)引人員給文獻(xiàn)標(biāo)引這一字段也是標(biāo)引人員給文獻(xiàn)標(biāo)引反映其主題概念的詞,但這些詞不是規(guī)范化詞表反映其主題概念的詞,但這些詞不是規(guī)范化詞表中的詞。中的詞。(6) 著者機(jī)構(gòu)子段(著者機(jī)構(gòu)子段(corporate source,CS或或AF)(7) 刊名字段(刊名字段(journal,JN或或ST)(8) 出版年子段(出版年子段(publica

19、tion,year,PY)(9) 文獻(xiàn)類型子段(文獻(xiàn)類型子段(ducument type,DT或或TY)(10) 語種子段(語種子段(language,LA)(11) 分類號(hào)子段(分類號(hào)子段(classification,CC)注意事項(xiàng)注意事項(xiàng):作者檢索的縮寫形式作者檢索的縮寫形式:在在SCI中中, 姓姓 (全稱)空格(全稱)空格 名(首字母名(首字母并且連寫)如:并且連寫)如:LI DR;GONG JY在在EI中中, 姓姓 名,全稱名,全稱(中文中文); 姓(全稱)姓(全稱)名(縮寫)名(縮寫)機(jī)構(gòu)檢索中機(jī)構(gòu)檢索中 SCI中有多個(gè)作者單位中有多個(gè)作者單位, 在同一字段中在同一字段中 EI 只

20、收入第一作者的單位只收入第一作者的單位多字段檢索時(shí)要選所有字段多字段檢索時(shí)要選所有字段(all field) 基本索引子段和輔助索引子段基本索引子段和輔助索引子段一篇記錄中主要用來表達(dá)文獻(xiàn)內(nèi)容的一篇記錄中主要用來表達(dá)文獻(xiàn)內(nèi)容的子段稱為基本索引子段(子段稱為基本索引子段(basic index fields),如篇名子段、文摘子如篇名子段、文摘子段、敘詞子段、自由詞子段。段、敘詞子段、自由詞子段。 表達(dá)文獻(xiàn)外部特征的子段稱表達(dá)文獻(xiàn)外部特征的子段稱為輔助索引子段(為輔助索引子段(additional index fields),包括著者子段、著包括著者子段、著者機(jī)構(gòu)子段、文獻(xiàn)類型子段、語者機(jī)構(gòu)子段

21、、文獻(xiàn)類型子段、語種子段等。種子段等。6短語檢索(短語檢索(phrase search)即精確檢索即精確檢索短語用短語用“”“”表示,檢索出與表示,檢索出與“”“”內(nèi)形式完全內(nèi)形式完全相同的的短語,以提高檢索的精確度和準(zhǔn)確相同的的短語,以提高檢索的精確度和準(zhǔn)確度度7自然語言檢索(自然語言檢索(natural language search)直接采用自然語言中的字、詞、句進(jìn)行提問直接采用自然語言中的字、詞、句進(jìn)行提問式檢索,同一般口語一樣。這種基于自然語式檢索,同一般口語一樣。這種基于自然語言的檢索方式又被稱為言的檢索方式又被稱為“智能檢索智能檢索”,適合,適合不太熟悉網(wǎng)絡(luò)信息技術(shù)的人員使用。支

22、持自不太熟悉網(wǎng)絡(luò)信息技術(shù)的人員使用。支持自然語言檢索的有中文的悠游,英文的然語言檢索的有中文的悠游,英文的AltaVista, Excite,Infoseek,HotBot,AskJeeves等等8多種語言檢索多種語言檢索multilingual search)提供多種語言的檢索環(huán)境供用戶選擇,提供多種語言的檢索環(huán)境供用戶選擇,系統(tǒng)按用戶選定的語種進(jìn)行檢索并反系統(tǒng)按用戶選定的語種進(jìn)行檢索并反饋結(jié)果,支持多語種檢索的饋結(jié)果,支持多語種檢索的 如:中文如:中文天網(wǎng),英文天網(wǎng),英文AltaVista,Google等。等。9模糊檢索(模糊檢索(fuzzy search)又稱概念檢索。當(dāng)我們輸入一個(gè)檢索

23、詞時(shí),搜稱概念檢索。當(dāng)我們輸入一個(gè)檢索詞時(shí),搜索引擎不僅反饋包括了該關(guān)鍵詞的網(wǎng)址,同時(shí)索引擎不僅反饋包括了該關(guān)鍵詞的網(wǎng)址,同時(shí)也發(fā)來與關(guān)鍵詞意義相近的內(nèi)容。比如:我們也發(fā)來與關(guān)鍵詞意義相近的內(nèi)容。比如:我們查找查找“查詢查詢”一詞時(shí),模糊檢索會(huì)反饋來包含一詞時(shí),模糊檢索會(huì)反饋來包含了了“查詢查詢”、“查找查找”“”“查一查查一查”、“尋找尋找”、“搜索搜索”等內(nèi)容的網(wǎng)址。反饋網(wǎng)址的排列,一等內(nèi)容的網(wǎng)址。反饋網(wǎng)址的排列,一般是完全符合關(guān)鍵詞的在最前邊,其次是相近般是完全符合關(guān)鍵詞的在最前邊,其次是相近的?,F(xiàn)在大多數(shù)搜索引擎都有這種功能,只是的?,F(xiàn)在大多數(shù)搜索引擎都有這種功能,只是模糊的程度不同。

24、模糊的程度不同。10 字母大小寫檢索字母大小寫檢索如果用戶的檢索式用小寫字母表示,搜索工具如果用戶的檢索式用小寫字母表示,搜索工具既匹配大寫又匹配小寫,如:既匹配大寫又匹配小寫,如:china(瓷器),瓷器),china(中國(guó));如果用大寫字母表示,搜索工中國(guó));如果用大寫字母表示,搜索工具認(rèn)為用戶指定了只要大寫,就只會(huì)查找那些具認(rèn)為用戶指定了只要大寫,就只會(huì)查找那些與用戶鍵入的輸入形式完全相同的結(jié)果,如:與用戶鍵入的輸入形式完全相同的結(jié)果,如:china,只檢索出只檢索出china。Alta Vista等搜索引擎等搜索引擎支持區(qū)分大小寫的檢索支持區(qū)分大小寫的檢索 注意注意自然語言檢索、模糊檢

25、索、多種自然語言檢索、模糊檢索、多種語言檢索和區(qū)分大小寫的檢索是語言檢索和區(qū)分大小寫的檢索是網(wǎng)絡(luò)檢索所特有的網(wǎng)絡(luò)檢索所特有的在在實(shí)際檢索中,往往將多種檢索技術(shù)混合使實(shí)際檢索中,往往將多種檢索技術(shù)混合使用。如:查找標(biāo)題中含有用。如:查找標(biāo)題中含有“網(wǎng)絡(luò)營(yíng)銷網(wǎng)絡(luò)營(yíng)銷”的的資料,它的計(jì)算機(jī)檢索提問式(表達(dá)式)資料,它的計(jì)算機(jī)檢索提問式(表達(dá)式)可以是:可以是:TI(Web OR WWW) AND market*又如:又如:ISTP中的綜合表示方法中的綜合表示方法TS=(nanotub* SAME carbon) NOT AU=Smalley RE二、數(shù)據(jù)庫(kù)的檢索方法二、數(shù)據(jù)庫(kù)的檢索方法 檢索界面瀏覽

26、方式( Browse )檢索方式 ( Search ) 瀏覽方式瀏覽方式 ( Browse ) 一般包括作者、作者單位、出版物名稱一般包括作者、作者單位、出版物名稱及出版社索引或者按學(xué)科劃分的分類索引及出版社索引或者按學(xué)科劃分的分類索引 如:如:EI Elsevier CSA PROQUEST IEEEIEE 重慶維普以及中國(guó)期刊網(wǎng)等等都重慶維普以及中國(guó)期刊網(wǎng)等等都提供了各種不同的瀏覽方式提供了各種不同的瀏覽方式檢索方式檢索方式 ( Search ) 基本檢索基本檢索 (basicquicksimpleeasy) 屬于一般性的檢索,它是根據(jù)自己的檢索需屬于一般性的檢索,它是根據(jù)自己的檢索需要,

27、輸入字、詞或簡(jiǎn)單的檢索式(不能使用要,輸入字、詞或簡(jiǎn)單的檢索式(不能使用位置檢索)來完成檢索的,是一種初級(jí)性的位置檢索)來完成檢索的,是一種初級(jí)性的檢索方式。檢索方式。 高級(jí)檢索高級(jí)檢索 (advanceexpendfullexpert) 屬于專家性的檢索,可以根據(jù)自己屬于專家性的檢索,可以根據(jù)自己的檢索需要,構(gòu)件比較復(fù)雜的檢索式的檢索需要,構(gòu)件比較復(fù)雜的檢索式(可以使用邏輯、括號(hào)、截詞以及位(可以使用邏輯、括號(hào)、截詞以及位置算符)來完成高層次、高質(zhì)量的檢置算符)來完成高層次、高質(zhì)量的檢索,檢索結(jié)果快速、準(zhǔn)確。索,檢索結(jié)果快速、準(zhǔn)確。高級(jí)檢索菜單式檢索和命令式檢索菜單命令三、三、 檢索效果的評(píng)

28、價(jià)檢索效果的評(píng)價(jià)v查全率與查準(zhǔn)率是檢索質(zhì)量的兩個(gè)重要的評(píng)查全率與查準(zhǔn)率是檢索質(zhì)量的兩個(gè)重要的評(píng)價(jià)指標(biāo)。價(jià)指標(biāo)。v查全率查全率(recall ratio)=檢出的相關(guān)文獻(xiàn)量檢出的相關(guān)文獻(xiàn)量/檢索檢索系統(tǒng)中相關(guān)文獻(xiàn)總量系統(tǒng)中相關(guān)文獻(xiàn)總量即檢出文獻(xiàn)中合乎需要的文獻(xiàn)數(shù)量占數(shù)據(jù)庫(kù)即檢出文獻(xiàn)中合乎需要的文獻(xiàn)數(shù)量占數(shù)據(jù)庫(kù)中存在的合乎該需要的所有文獻(xiàn)的比例。查中存在的合乎該需要的所有文獻(xiàn)的比例。查全率高說明有用的東西都被你檢中了,但對(duì)全率高說明有用的東西都被你檢中了,但對(duì)于數(shù)量巨大的數(shù)據(jù)庫(kù)而言,要達(dá)到于數(shù)量巨大的數(shù)據(jù)庫(kù)而言,要達(dá)到100%的查的查全率是不可能的,在網(wǎng)絡(luò)條件下尤其如此。全率是不可能的,在網(wǎng)絡(luò)條件

29、下尤其如此。v查準(zhǔn)率查準(zhǔn)率(precision ratio)=檢出的相關(guān)文獻(xiàn)量檢出的相關(guān)文獻(xiàn)量/檢出的檢出的文獻(xiàn)總量。指檢出文獻(xiàn)中合乎需要的文獻(xiàn)數(shù)量占檢文獻(xiàn)總量。指檢出文獻(xiàn)中合乎需要的文獻(xiàn)數(shù)量占檢出文獻(xiàn)全部數(shù)量的比例。出文獻(xiàn)全部數(shù)量的比例。 準(zhǔn)確率高說明你檢出的東西都是有用的東西。一般準(zhǔn)確率高說明你檢出的東西都是有用的東西。一般地說,很少能達(dá)到地說,很少能達(dá)到100%的查準(zhǔn)率。的查準(zhǔn)率。v在查全與查準(zhǔn)兩個(gè)方面一般難以兩全,為了獲得很在查全與查準(zhǔn)兩個(gè)方面一般難以兩全,為了獲得很多有用的東西(達(dá)到高的查全率),需要較少的限多有用的東西(達(dá)到高的查全率),需要較少的限制檢索條件,但這樣檢出的無用的東

30、西就會(huì)很多制檢索條件,但這樣檢出的無用的東西就會(huì)很多(查準(zhǔn)率不高),反之亦然。(查準(zhǔn)率不高),反之亦然。 四、四、 檢索策略的實(shí)施技巧檢索策略的實(shí)施技巧 檢索策略:為實(shí)現(xiàn)檢索目標(biāo)而實(shí)施的方法。檢索策略:為實(shí)現(xiàn)檢索目標(biāo)而實(shí)施的方法。 檢索策略制定的原則檢索策略制定的原則: 第一第一 快,即從檢索請(qǐng)求的提出到檢索結(jié)果的提快,即從檢索請(qǐng)求的提出到檢索結(jié)果的提交要快速:交要快速: 第二第二 準(zhǔn),即檢索結(jié)果要準(zhǔn)確,避免檢索出過多準(zhǔn),即檢索結(jié)果要準(zhǔn)確,避免檢索出過多無關(guān)內(nèi)容;無關(guān)內(nèi)容; 第三第三 全,檢索結(jié)果全面,滿足用戶的需求;全,檢索結(jié)果全面,滿足用戶的需求; 第四第四 效益原則,即以最低的費(fèi)用獲取所

31、效益原則,即以最低的費(fèi)用獲取所佳佳的信的信息。息。 歸納起來包括:歸納起來包括: (1)認(rèn)真進(jìn)行課題分析,確定正確的主題詞及學(xué)科認(rèn)真進(jìn)行課題分析,確定正確的主題詞及學(xué)科分類情況分類情況(分析主題內(nèi)容、學(xué)科范疇、查找時(shí)間與分析主題內(nèi)容、學(xué)科范疇、查找時(shí)間與方法以及分析現(xiàn)有的資料等)方法以及分析現(xiàn)有的資料等) (2)正確選擇各種算符,如邏輯算符,位置算符,正確選擇各種算符,如邏輯算符,位置算符,截詞符。截詞符。(3)編制合理的計(jì)算機(jī)檢索式。編制合理的計(jì)算機(jī)檢索式。 (4)隨時(shí)調(diào)整檢索策略,減少漏檢和誤檢,提高查隨時(shí)調(diào)整檢索策略,減少漏檢和誤檢,提高查全率和查準(zhǔn)率。全率和查準(zhǔn)率。v首先,擴(kuò)大命中文獻(xiàn)

32、數(shù)量以提高查全率:選首先,擴(kuò)大命中文獻(xiàn)數(shù)量以提高查全率:選用文摘字段檢索;使用上用文摘字段檢索;使用上位位詞或近義詞、同詞或近義詞、同義詞用邏輯或義詞用邏輯或(OR)連接;利用截詞檢索。連接;利用截詞檢索。v其次,縮小檢索范圍以提高查準(zhǔn)率。檢索詞其次,縮小檢索范圍以提高查準(zhǔn)率。檢索詞限定在篇名和敘詞字段;限定在篇名和敘詞字段;使用下位詞,使用下位詞,利用利用邏輯非去掉無關(guān)信息;利用邏輯邏輯非去掉無關(guān)信息;利用邏輯積積限定相關(guān)限定相關(guān)主題。主題。五、五、 計(jì)算機(jī)信息檢索的具體步驟計(jì)算機(jī)信息檢索的具體步驟 1 分析檢索課題分析檢索課題,制定切實(shí)可行的檢索策略,制定切實(shí)可行的檢索策略 ( (這是檢索

33、的出發(fā)點(diǎn),依據(jù)這是檢索的出發(fā)點(diǎn),依據(jù)) )2 2 利用檢索系統(tǒng)特定的指令正確實(shí)施檢索利用檢索系統(tǒng)特定的指令正確實(shí)施檢索3 3 通過人通過人- -機(jī)對(duì)話的方式不斷調(diào)整、修改、機(jī)對(duì)話的方式不斷調(diào)整、修改、檢索策略檢索策略4 4 根據(jù)查找的文獻(xiàn)線索獲取原始文獻(xiàn)根據(jù)查找的文獻(xiàn)線索獲取原始文獻(xiàn)(1)分析檢索課題,明確檢索要求)分析檢索課題,明確檢索要求 分析檢索課題的中心內(nèi)容和所屬學(xué)科分析檢索課題的中心內(nèi)容和所屬學(xué)科范圍,以便準(zhǔn)確選擇反映文獻(xiàn)內(nèi)容特征的范圍,以便準(zhǔn)確選擇反映文獻(xiàn)內(nèi)容特征的主題詞、關(guān)鍵詞,確定出所屬學(xué)科的學(xué)科主題詞、關(guān)鍵詞,確定出所屬學(xué)科的學(xué)科性質(zhì)性質(zhì) 明確檢索需求,即弄清檢索目的及要解明

34、確檢索需求,即弄清檢索目的及要解決的問題。用戶的檢索目的和要求是多種多決的問題。用戶的檢索目的和要求是多種多樣的,是撰寫學(xué)位論文,還是申報(bào)科研課題,樣的,是撰寫學(xué)位論文,還是申報(bào)科研課題,是技術(shù)革新還是成果鑒定,目的不同,檢索是技術(shù)革新還是成果鑒定,目的不同,檢索的策略和范圍也不同。檢索需求主要反映在的策略和范圍也不同。檢索需求主要反映在用戶對(duì)命中文獻(xiàn)的類型、語種及所需文獻(xiàn)的用戶對(duì)命中文獻(xiàn)的類型、語種及所需文獻(xiàn)的年代等不同年代等不同(2 2)確定檢索項(xiàng)與檢索途徑確定檢索項(xiàng)與檢索途徑 檢索項(xiàng)主要指文獻(xiàn)記錄中的文獻(xiàn)特征標(biāo)檢索項(xiàng)主要指文獻(xiàn)記錄中的文獻(xiàn)特征標(biāo)識(shí)。反映文獻(xiàn)內(nèi)容特征的檢索詞如:標(biāo)題識(shí)。反映

35、文獻(xiàn)內(nèi)容特征的檢索詞如:標(biāo)題詞、敘詞、和關(guān)鍵詞;反映文獻(xiàn)外表特征詞、敘詞、和關(guān)鍵詞;反映文獻(xiàn)外表特征的如:作者、語種、文獻(xiàn)類型等。的如:作者、語種、文獻(xiàn)類型等。 檢索途徑指主題檢索、分類檢索、作者檢索途徑指主題檢索、分類檢索、作者檢索途徑(作者單位)和其他檢索途徑。檢索途徑(作者單位)和其他檢索途徑。(3 3)編制計(jì)算機(jī)檢索式編制計(jì)算機(jī)檢索式(舉例)(舉例)第一部分第一部分 課題分析課題分析課題課題GIS技術(shù)的可視化研究技術(shù)的可視化研究v課題分析:課題分析: 二十一世紀(jì)是一個(gè)信息大爆炸的時(shí)代,隨二十一世紀(jì)是一個(gè)信息大爆炸的時(shí)代,隨著著“信息論信息論”,“控制論控制論”及及“認(rèn)知論認(rèn)知論”等理論

36、等理論的產(chǎn)生,作為一門古老的學(xué)科的地圖學(xué)也在這些的產(chǎn)生,作為一門古老的學(xué)科的地圖學(xué)也在這些新興理論的指導(dǎo)下,在這個(gè)信息時(shí)代產(chǎn)生了新的新興理論的指導(dǎo)下,在這個(gè)信息時(shí)代產(chǎn)生了新的發(fā)展點(diǎn),發(fā)展點(diǎn),“數(shù)字地球數(shù)字地球”的提出為地圖科學(xué)提出了的提出為地圖科學(xué)提出了更新更高的要求,更新更高的要求,GIS作為處理地理信息的一種作為處理地理信息的一種技術(shù),應(yīng)運(yùn)而生。技術(shù),應(yīng)運(yùn)而生。 GIS是一種采集,加工,分析,訪問是一種采集,加工,分析,訪問及表達(dá)空間數(shù)據(jù)的信息系統(tǒng)。作為數(shù)據(jù)本及表達(dá)空間數(shù)據(jù)的信息系統(tǒng)。作為數(shù)據(jù)本身是抽象的,不易直觀接受的信息,因此身是抽象的,不易直觀接受的信息,因此研究如何對(duì)數(shù)據(jù)進(jìn)行加工和

37、研究如何對(duì)數(shù)據(jù)進(jìn)行加工和可視化可視化表達(dá),表達(dá),對(duì)于用戶來說是十分必要的。對(duì)于用戶來說是十分必要的。目前的目前的GIS可視化的研究正方興未艾,對(duì)可視化的研究正方興未艾,對(duì)DEM,DTM和和DLG等數(shù)據(jù)模型特別是等數(shù)據(jù)模型特別是DEM的研究進(jìn)展的研究進(jìn)展飛速,而飛速,而三維三維可視化的表達(dá)方式又成為其中最可視化的表達(dá)方式又成為其中最熱門的方向,通過熱門的方向,通過DEM生成的等高線,地貌暈生成的等高線,地貌暈渲土,三維透視景象,三維地形漫游及交互式渲土,三維透視景象,三維地形漫游及交互式三維可視系統(tǒng)在地圖學(xué)界開始發(fā)揮其強(qiáng)大的效三維可視系統(tǒng)在地圖學(xué)界開始發(fā)揮其強(qiáng)大的效用,并將在用,并將在GIS技術(shù)

38、中占有三分天。技術(shù)中占有三分天。 數(shù)字高程模型數(shù)字高程模型(DEM)作為數(shù)字地形模作為數(shù)字地形模擬的重要成果已經(jīng)成為國(guó)家空間數(shù)據(jù)基礎(chǔ)擬的重要成果已經(jīng)成為國(guó)家空間數(shù)據(jù)基礎(chǔ)設(shè)施設(shè)施(NSDI)的基本內(nèi)容之一,其相關(guān)學(xué)科的基本內(nèi)容之一,其相關(guān)學(xué)科有數(shù)據(jù)庫(kù),軟件工程,遙感與航測(cè)等。在有數(shù)據(jù)庫(kù),軟件工程,遙感與航測(cè)等。在不久的將來,隨著不久的將來,隨著虛擬現(xiàn)實(shí)虛擬現(xiàn)實(shí)技術(shù)與技術(shù)與GIS的的融合,必然為地理信息學(xué)科帶來翻天覆地融合,必然為地理信息學(xué)科帶來翻天覆地的變化。的變化。檢索關(guān)鍵詞與表達(dá)式中文主題詞:地理信息系統(tǒng)或GIS(上位)數(shù)字高程模型,可視化,三維,虛擬現(xiàn)實(shí)(下位)基本表達(dá)式:關(guān)鍵詞=(地理信

39、息系統(tǒng)OR GIS)AND (可視化)AND (三維 OR 虛擬現(xiàn)實(shí))英文Topic Words:GIS or Geography Information System3D,DEM,VR,visualizationBoolean Expression:kw= GIS AND visualization AND (3D OR DEM)(4 4)選擇檢索系統(tǒng)和數(shù)據(jù)庫(kù)選擇檢索系統(tǒng)和數(shù)據(jù)庫(kù) 在分析檢索課題,明確檢索要求在分析檢索課題,明確檢索要求的基礎(chǔ)上,必須綜合考慮檢索系統(tǒng)的基礎(chǔ)上,必須綜合考慮檢索系統(tǒng)的特點(diǎn)、收錄的學(xué)科范圍、各數(shù)據(jù)的特點(diǎn)、收錄的學(xué)科范圍、各數(shù)據(jù)庫(kù)的專業(yè)范圍、主題內(nèi)容、數(shù)據(jù)來庫(kù)的專業(yè)

40、范圍、主題內(nèi)容、數(shù)據(jù)來源與文獻(xiàn)類型、技術(shù)含量、數(shù)據(jù)的源與文獻(xiàn)類型、技術(shù)含量、數(shù)據(jù)的存貯年限、更新頻率、檢索費(fèi)用以存貯年限、更新頻率、檢索費(fèi)用以及使用方法。及使用方法。(5 5)選擇檢索方法(常用法、追溯法和循環(huán)選擇檢索方法(常用法、追溯法和循環(huán)法)法) 常用法:順查、倒查和抽查常用法:順查、倒查和抽查 追溯法:參考文獻(xiàn)法和追溯法:參考文獻(xiàn)法和科學(xué)引文法科學(xué)引文法被引用作者查被引用作者查 如:如:ARIKAWA KARIKAWA K 80 NATURE 268 700 80 NATURE 268 700 KATAGIRI N J ELEC MICR 39 363 90 KATAGIRI N J

41、ELEC MICR 39 363 90 87 J COMP PHYSL A 161 1161 87 J COMP PHYSL A 161 1161 STOWE S CELL TIS RE 262 483 90 STOWE S CELL TIS RE 262 483 90 87 NATURWISSENSCHAFTEN 74 297 87 NATURWISSENSCHAFTEN 74 297 SHIMOHIG M CELL TIS RE 263 46 91 SHIMOHIG M CELL TIS RE 263 46 91 循環(huán)法:常用法和追溯法的結(jié)合循環(huán)法:常用法和追溯法的結(jié)合 計(jì)算機(jī)檢索邏輯表達(dá)式舉例計(jì)算機(jī)檢索邏輯表達(dá)式舉例:例例1:GPS在建筑事業(yè)中的應(yīng)用在建筑事業(yè)中的應(yīng)用 主題詞主題詞:A:全球定位系統(tǒng);全球定位系統(tǒng);B:建筑測(cè)量;組配詞:建筑測(cè)量;組配詞: C:應(yīng)用應(yīng)用 表達(dá)式表達(dá)式:A AND B AND C例例2:加拿大遙感活動(dòng)展望:加拿大遙感活動(dòng)展望 主題詞主題詞:A:遙感;遙

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論