計(jì)算機(jī)信息檢索講座課件_第1頁(yè)
計(jì)算機(jī)信息檢索講座課件_第2頁(yè)
計(jì)算機(jī)信息檢索講座課件_第3頁(yè)
計(jì)算機(jī)信息檢索講座課件_第4頁(yè)
計(jì)算機(jī)信息檢索講座課件_第5頁(yè)
已閱讀5頁(yè),還剩42頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、計(jì)算機(jī)信息檢索與利用葉青醫(yī)學(xué)信息檢索與利用教研室2013.11.8主要內(nèi)容一. 計(jì)算機(jī)信息檢索基礎(chǔ) 二. 廣西醫(yī)科大學(xué)圖書(shū)館的數(shù)字資源介紹二. Pubmed簡(jiǎn)介四. 國(guó)際聯(lián)機(jī)檢索系統(tǒng)Dialog簡(jiǎn)介一. 計(jì)算機(jī)信息檢索基礎(chǔ) 計(jì)算機(jī)信息檢索計(jì)算機(jī)信息檢索指利用計(jì)算機(jī)及相關(guān)軟件和通信設(shè)施,對(duì)本地計(jì)算機(jī)、遠(yuǎn)程服務(wù)器及網(wǎng)上信息進(jìn)行檢索的過(guò)程或活動(dòng)。 隨著信息技術(shù)的快速發(fā)展及對(duì)各種文獻(xiàn)信息的數(shù)字化處理,計(jì)算機(jī)文獻(xiàn)信息檢索已經(jīng)成為文獻(xiàn)信息檢索的主要手段。 計(jì)算機(jī)檢索的一般程序 (1)分析檢索課題,明確檢索要求 (2)選擇適當(dāng)檢索系統(tǒng)(數(shù)據(jù)庫(kù)) (3)確定檢索途徑及檢索詞 (4)構(gòu)建檢索提問(wèn)式 (5)上機(jī)檢

2、索并調(diào)整檢索策略 (6)輸出檢索結(jié)果2.1 分析檢索課題,明確檢索要求主題分析主題概念分析是課題檢索的重點(diǎn)和難點(diǎn))明確檢索需求及檢索目標(biāo)(1)檢索信息的學(xué)科范圍(2)檢索信息的類(lèi)型(3)檢索的目的2.2 選擇檢索系統(tǒng)(數(shù)據(jù)庫(kù)等)(1)根據(jù)檢索目的確定所需數(shù)據(jù)庫(kù)的類(lèi)型(2)根據(jù)信息需求的內(nèi)容、專(zhuān)業(yè)范圍選擇數(shù)據(jù)庫(kù)(3)根據(jù)記錄來(lái)源選擇數(shù)據(jù)庫(kù)(4)根據(jù)熟悉程度選擇數(shù)據(jù)庫(kù)2.3 確定檢索途徑、制訂檢索式確定檢索途徑制訂檢索式(確定檢索詞、編制檢索式 ) 應(yīng)首先從相應(yīng)的主題詞表中選擇所需的檢索詞,以便獲得最佳檢索效果 沒(méi)有確切表達(dá)課題內(nèi)容的主題詞時(shí),可采用自由詞檢索。 以課題核心概念為主,排除無(wú)關(guān)概念,

3、把重復(fù)概念進(jìn)行歸并,簡(jiǎn)化檢索式,提高檢索效果。 3計(jì)算機(jī)檢索基本技術(shù) 31 布爾邏輯檢索技術(shù) 布爾檢索技術(shù)是指利用布爾運(yùn)算符連接各個(gè)檢索詞,然后由計(jì)算機(jī)進(jìn)行相應(yīng)邏輯運(yùn)算,以檢索出所需信息的方法。常用算符及含義: AND (*)表示由該符號(hào)連接的檢索式的運(yùn)算結(jié)果為邏輯”與”。 OR (+)表示由該符號(hào)連接的檢索式的運(yùn)算結(jié)果為邏輯”或”。 NOT (-)表示由該符號(hào)連接的檢索式的運(yùn)算結(jié)果為邏輯”非”。布爾邏輯檢索技術(shù)AND (*) 連接不相容的主題概念(或不同字段) 檢索結(jié)果同時(shí)出現(xiàn)連接的詞 限定 縮小范圍 提高準(zhǔn)確率OR (+) 連接同義詞 同族詞 相關(guān)詞 檢索結(jié)果至少含有其中一詞或同時(shí)有 擴(kuò)大

4、檢索范圍 提高查全NOT (-) 縮小檢索范圍,起到減少文獻(xiàn)輸出量布爾邏輯檢索技術(shù) 優(yōu)先處理算符“( )”邏輯算符OR和AND的使用方法,如果歸納成一個(gè)模式,比如有 A、B、C、D四個(gè)檢索詞(其中A和B,C和D分別為同義概念),檢索提問(wèn)式為: (A OR B)AND (C OR D) 即,同一組檢索提問(wèn)既含有OR算符,又含有AND算符,此時(shí)須使用優(yōu)先處理算符 “( )”,將OR算符前后的詞放入括號(hào)中,計(jì)算機(jī)將優(yōu)先運(yùn)算括號(hào)內(nèi)的算符。邏輯運(yùn)算符的應(yīng)用例:為檢索課題”固氮和固炭的生化機(jī)理或基因機(jī)制”編制檢索策略.固氮* 固炭* ( 生化+ 生物化學(xué) + 基因)33位置檢索 位置檢索可要求檢索詞以用戶(hù)

5、所規(guī)定的相對(duì)位置出現(xiàn)。比如:以詞組形式表達(dá)的概念;彼此相鄰的兩個(gè)或兩個(gè)以上的詞;被禁用詞或特殊符號(hào)分隔的詞以及化學(xué)分子式等。位置算符是調(diào)整檢索策略的一種重要手段。 位置算符與AND 常用的位置算符及含義: (W)算符(WITH) 表示兩個(gè)檢索詞緊密相連,詞序不能顛倒, 中間不得插入其他詞、字母或代碼,但允許有空格或標(biāo)點(diǎn)符號(hào),也可用()表示。 例:COMMUNICATION(W)SATELLITE 位置檢索COMMUNICATION AND SATELLITE 結(jié)果:communication satellite ,satellite communication ,communication d

6、evices for satellite ;communication links without satellite (n W)算符(n WORD) 表示兩個(gè)檢索詞中間可插入n個(gè)詞,但它們之間的順序不可顛倒。位置檢索技術(shù) (N)算符(NEAR) 表示兩個(gè)檢索詞必須相連,不得插入其他詞,但詞序可以顛倒。 (n N)算符(n NEAR) 表示兩個(gè)檢索詞中間可以插入n個(gè)詞,且詞序可以顛倒。 位置檢索技術(shù)如:internet(N)accessing命中記錄中出現(xiàn)的匹配詞可能有:internet accessing, accessing internet。如:internet(1N)accessing

7、命中記錄中除上例的外,還會(huì)可能有:accessing internet, accessing the internet, internet /intranet accessing等。位置檢索 (S)算符(SUBFIELD) 表示兩個(gè)檢索詞必須出現(xiàn)在同一個(gè)子句子中,但兩詞的詞序和插入的詞數(shù)不限。句子位置算符 (F)算符(FIELD)表示兩個(gè)檢索詞必須同時(shí)出現(xiàn)在同一個(gè)字段內(nèi),但兩詞的詞序和中間插入的詞數(shù)不限。字段位置算符 例:air(w)pollution (F)control位置檢索 (C)算符(CITATION)表示兩個(gè)檢索詞必須出現(xiàn)在同一記錄中,但兩詞的詞序和所在的字段不限。 (L)算符(L

8、INK)表示兩個(gè)檢索詞之間存在從屬關(guān)系或限制關(guān)系,如果其中一個(gè)為一級(jí)主題詞,另一個(gè)就為二級(jí)主題詞。 3加權(quán)檢索 加權(quán)檢索是在檢索提問(wèn)式中,根據(jù)每個(gè)提問(wèn)詞在檢索要求中的重要程度,分別給予一定的加權(quán)數(shù)值加以區(qū)別,我們稱(chēng)這個(gè)數(shù)值為權(quán)數(shù)。同時(shí)再給出檢索命中的閾值。當(dāng)檢索結(jié)果達(dá)到所設(shè)定的閾值時(shí),系統(tǒng)將顯示為命中記錄。 采用加權(quán)檢索的目的在于提高檢索結(jié)果的準(zhǔn)確程度。 34限制檢索技術(shù) 所謂限制檢索是通過(guò)限制檢索范圍,達(dá)到優(yōu)化檢索結(jié)果的方法。 具體形式主要有: (1)字段限制檢索 (2)使用符號(hào)限制 (3)進(jìn)行范圍限制 (4)采用限制指令 限制檢索技術(shù) 輔助字段限制輔助字段運(yùn)算符的用法是在需要指定字段的檢索

9、詞(有時(shí)檢索詞須放在雙引號(hào)內(nèi))之前加上段碼和前綴運(yùn)算符“=”。例如檢索策略AU=“Robert, S.”的含義是在作者字段中查找含有“Robert, S.”的所有記錄。 下面是其他常用的輔助字段限制及其實(shí)例: 指定著者單位字段 CS=SHANGHAI UNIVERSITY 指定刊物名稱(chēng)字段 JN=APPLIED MATHEMATICS 指定語(yǔ)言字段 LA=ENGLISH 指定文獻(xiàn)類(lèi)型字段 DT=JOURNAL4.檢索式的調(diào)整 檢索表達(dá)式輸入檢索系統(tǒng)后,輸出的檢索結(jié)果有時(shí)不一定能滿(mǎn)足課題的要求,或者檢出的篇數(shù)過(guò)多,而且不相關(guān)文獻(xiàn)所占比例很大,或者檢出的文獻(xiàn)數(shù)量太少,有時(shí)甚至為零,這時(shí)就需要調(diào)整檢

10、索策略。4.1 檢索結(jié)果過(guò)多 調(diào)整檢索策略之前,首先要分析造成結(jié)果不理想的原因。對(duì)于輸出篇數(shù)過(guò)多的情況,應(yīng)分析是否可能是如下原因造成: a .選用了多義性的檢索詞; b .截詞截得過(guò)短; c. 輸入的檢索詞太少; d. 應(yīng)該使用“與(AND)”的使用了“或(OR)”; e.優(yōu)先運(yùn)算符“()”使用錯(cuò)誤。4.2 檢索結(jié)果過(guò)少 對(duì)于輸出篇數(shù)過(guò)少的情況,應(yīng)分析是否方式如下原因造成: a. 檢索詞拼寫(xiě)錯(cuò)誤; b. 遺漏重要的同義詞或隱含概念; c. 檢索詞過(guò)于冷僻具體; d. 沒(méi)有使用截詞算符; e. 位置算符和字段算符使用的過(guò)多; f. 使用過(guò)多的“AND”算符。擴(kuò)大檢索范圍的方法針對(duì)上述原因,如果是

11、屬于需要擴(kuò)大檢索范圍,提高檢索結(jié)果查全率的,調(diào)整策略的方法有: a. 減少“與(AND)”算符,增加同義詞或同族相關(guān)詞用邏輯或(OR)將它們連接起來(lái); b. 在詞干相同的單詞后使用截詞符(?或*); c. 去除已有的字段限制、位置算符限制(或者改用限制程度較小的位置算符)。4.3 檢索策略的選擇推薦的檢索策略 檢索前研究你的主題. 變化你所知道的檢索策略. 除非找到目標(biāo)或?qū)W到新東西,否則不要局限在一種檢索方法中。不推薦的檢索策略瀏覽主題目錄 在大型數(shù)據(jù)庫(kù)中使用簡(jiǎn)單關(guān)鍵字跟隨鏈接去那些大眾口味或商業(yè)利益所推崇的網(wǎng)站4.4檢索式的構(gòu)造方法聚類(lèi)組合法在課題分析,構(gòu)造檢索提問(wèn)式時(shí),可以采用“聚類(lèi)組合法

12、”。實(shí)施如下七項(xiàng)操作:切分:對(duì)課題語(yǔ)句進(jìn)行切分,以詞為單位劃分句子或詞組; 刪除:對(duì)不宜做檢索詞的詞進(jìn)行刪除;替換:用更具體、明確的詞替換掉某些表達(dá)欠佳詞; 聚類(lèi):將彼此“非常相關(guān)的詞”歸于一組補(bǔ)充:對(duì)縮略詞組進(jìn)行還原作為補(bǔ)充; 增加:通過(guò)邏輯“與”或“非”增加限義詞來(lái)避免由于檢索詞一詞多義造成的誤檢問(wèn)題;組合:最后組合成合乎需要的檢索式.刪除 排除檢索意義不大而且比較泛指的概念 如: 展望、發(fā)展趨勢(shì)、現(xiàn)狀、近況、生產(chǎn)工藝、應(yīng)用、利用、作用、方法、影響、制備、結(jié)果刪除過(guò)分具體的限定詞:干洗劑的近況 、生產(chǎn)工藝 配方極其應(yīng)用 刪除存在蘊(yùn)含關(guān)系的可合并詞例:內(nèi)彈道高溫高壓高密度氣體狀態(tài)方程 排除重

13、復(fù)無(wú)關(guān)的概念項(xiàng)目“河豚毒素的液相色譜分析”從項(xiàng)目名稱(chēng)上看,其主要概念為“河豚毒素”、“液相色譜”和“分析”,但由于液相色譜本身就是一種分析方法,它隱含了“分析”這一概念主要概念: 河豚毒素、液相色譜檢索式:河豚毒素 and 液相色譜檢索詞之間存在部分與整體關(guān)系例:檢索“歐洲能源”方面的文獻(xiàn) 按照“歐洲”;同時(shí)包括許多國(guó)家。英國(guó) 法 德意 5.提高查全率的主要方法(1) 準(zhǔn)確把握檢索對(duì)象及目的,選擇合適的數(shù)據(jù)庫(kù)。(2) 降低檢索詞或分類(lèi)號(hào)的專(zhuān)指度。(3) 更多地采用學(xué)科分類(lèi)途徑來(lái)擴(kuò)大檢索范圍。(4) 減少邏輯“與”及邏輯“非”的使用。(5) 增加邏輯“或”及截詞檢索技術(shù)的使用。(6) 采用“全文

14、檢索”。(7) 不限定檢索對(duì)象的文獻(xiàn)類(lèi)型、時(shí)間段、文種等。 6.提高查準(zhǔn)率的主要方法(1) 準(zhǔn)確把握檢索對(duì)象及目的,選擇合適的數(shù)據(jù)庫(kù)。(2) 提高檢索詞或分類(lèi)號(hào)的專(zhuān)指度。(3) 更多地采用專(zhuān)用名詞及特性檢索的途徑。(4) 選擇邏輯“與”及邏輯“非”的使用。(5) 減少或不采用邏輯“或”及截詞檢索技術(shù)的使用。(6) 限定檢索詞出現(xiàn)的字段及在段落、文句中的位置。(7) 不選“全文檢索”.(8) 限定檢索對(duì)象的文獻(xiàn)類(lèi)型、時(shí)間段、文種及其它特征。二.廣西醫(yī)科大學(xué)圖書(shū)館信息資源紙質(zhì)圖書(shū)120多萬(wàn)冊(cè)(圖書(shū)32萬(wàn)余種)電子圖書(shū)近120萬(wàn)冊(cè) 中、外文期刊4000多種(現(xiàn)刊1729種)數(shù)據(jù)庫(kù)29個(gè)圖書(shū)館中文數(shù)據(jù)

15、庫(kù)1.中國(guó)生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫(kù)(CBM)2.維普中文科技期刊數(shù)據(jù)庫(kù) (VIP)3. CNKI數(shù)據(jù)庫(kù)4.萬(wàn)方數(shù)據(jù)庫(kù)圖書(shū)館外文數(shù)據(jù)庫(kù)Web of Science MICROMEDEX數(shù)據(jù)庫(kù)(綜述型事實(shí)數(shù)據(jù)庫(kù)) 循證醫(yī)學(xué)評(píng)價(jià)數(shù)據(jù)庫(kù)(EBMR) PML數(shù)據(jù)庫(kù) Springer Link Ovid EBSCO MD Consult 數(shù)據(jù)庫(kù) Biosos Preview數(shù)據(jù)庫(kù) 康健臨床決策循證數(shù)據(jù)庫(kù) 圖書(shū)館電子圖書(shū)庫(kù)1.書(shū)生之家 2.中國(guó)數(shù)字圖書(shū)館3.匯雅電子圖書(shū) 多媒體資源1.起點(diǎn)考試網(wǎng) 2.外研社外語(yǔ)資源庫(kù) 3.金圖高校英語(yǔ)資源數(shù)據(jù)庫(kù) 4.愛(ài)迪科森網(wǎng)上報(bào)告廳 5.職業(yè)全能培訓(xùn)庫(kù) 6.計(jì)算機(jī)技能自助式網(wǎng)絡(luò)視頻庫(kù)7.新東方英語(yǔ)四六級(jí)網(wǎng)考平臺(tái)三.Pubmed簡(jiǎn)介網(wǎng)址:/pubmed美國(guó)國(guó)立醫(yī)學(xué)圖書(shū)館向因特網(wǎng)用戶(hù)提供免費(fèi)MEDLINE檢索收錄70余個(gè)國(guó)家5000多種生物醫(yī)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論