信息檢索策略_第1頁(yè)
信息檢索策略_第2頁(yè)
信息檢索策略_第3頁(yè)
信息檢索策略_第4頁(yè)
信息檢索策略_第5頁(yè)
已閱讀5頁(yè),還剩42頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、12 信息檢索中需要了解的 幾個(gè)基礎(chǔ)知識(shí)1、信息特點(diǎn)、信息特點(diǎn)2、信息語(yǔ)言3、信息檢索技術(shù)第一節(jié) 信息檢索基本知識(shí)3 1、信息特點(diǎn)、信息特點(diǎn)文獻(xiàn)信息分類特點(diǎn)文獻(xiàn)信息分類特點(diǎn) 方便文獻(xiàn)信息的排架,便于索??; 類目的結(jié)構(gòu)嚴(yán)謹(jǐn),邏輯性強(qiáng); 適合學(xué)術(shù)信息資源的組織。網(wǎng)絡(luò)信息分類特點(diǎn)網(wǎng)絡(luò)信息分類特點(diǎn) 根據(jù)網(wǎng)絡(luò)信息的存在狀況和當(dāng)前上網(wǎng)用戶的特點(diǎn)來(lái)編制的,科學(xué)性、系統(tǒng)性稍差; 適合大眾信息資源的組織。數(shù)據(jù)庫(kù)信息分類特點(diǎn)數(shù)據(jù)庫(kù)信息分類特點(diǎn) 結(jié)合文獻(xiàn)信息分類和網(wǎng)絡(luò)信息分類的優(yōu)點(diǎn) 方便瀏覽和檢索4分類語(yǔ)言分類語(yǔ)言主題語(yǔ)言主題語(yǔ)言以學(xué)科和專業(yè)集中文獻(xiàn)能將學(xué)科的信息集中到一起適宜族性檢索適宜特性檢索不利于新興學(xué)科、交

2、叉學(xué)科和邊緣學(xué)科的檢索不利于新興學(xué)科檢索查全率不高查準(zhǔn)率不高2、信息語(yǔ)言5 3、信息檢索技術(shù) 計(jì)算機(jī)信息檢索技術(shù)是用戶信息需求和文獻(xiàn)信息集合之間的匹配比較技術(shù)。、 幾乎所有的檢索系統(tǒng)都有布爾邏輯檢索、截詞檢索(模糊檢索)和限制檢索,而不同的檢索系統(tǒng)又會(huì)有一些特殊的檢索技術(shù)和功能。6 第二節(jié) 信息檢索策略7一、什么是信息檢索策略? 執(zhí)行一個(gè)課題的檢索是有過(guò)程、分步來(lái)完成的,稱為檢索策略(retrieval strategy),它是為實(shí)現(xiàn)檢索目標(biāo)而制定的全盤(pán)計(jì)劃或方案。特別是在計(jì)算機(jī)檢索中,策略問(wèn)題是明確提出來(lái)的,必須慎重考慮,因?yàn)樗赡芤瓿傻氖且粋€(gè)比較復(fù)雜、精細(xì)的檢索課題,又是在人與機(jī)器的對(duì)話

3、、交互中實(shí)現(xiàn)的。 8二 信息檢索步驟91、分析檢索課題 明確信息需求(注:是課題檢索的重點(diǎn)和難點(diǎn)) 檢索目的(申報(bào)課題、開(kāi)題報(bào)告、學(xué)術(shù)論文、成果查新、課程論文、商業(yè)需求以及其它需求類型等) 文獻(xiàn)類型(期刊論文、會(huì)議論文、科技報(bào)告、圖書(shū)、專利、標(biāo)準(zhǔn)、網(wǎng)站等) 結(jié)果形式(全文、文摘、題錄、數(shù)值、事實(shí)等) 檢索年限(如2000年以來(lái)的文獻(xiàn)) 語(yǔ)種(中文、外文;英文、日文) 檢索結(jié)果數(shù)量(100?50?)101.1 檢索需求類型查找某概念的確切含義 如:什么是“blog” 查找某概念的背景知識(shí) 如:誰(shuí)最先發(fā)現(xiàn)青霉素查找某些事物的數(shù)值及量化指標(biāo) 一般通過(guò)事實(shí)型、數(shù)值型數(shù)據(jù)庫(kù)和搜索引擎獲得。11查找某一學(xué)

4、科的一般知識(shí) 如:關(guān)于分子生物學(xué)有哪些專著查找學(xué)科專業(yè)領(lǐng)域的新進(jìn)展 如:有關(guān)納米技術(shù)的研究綜述查找課題相關(guān)的專業(yè)文獻(xiàn) 最常見(jiàn)的!文獻(xiàn)數(shù)據(jù)庫(kù)121.2 主題概念分析從熟悉的已知文獻(xiàn)信息入手 分析檢索課題的內(nèi)容實(shí)質(zhì) 找出隱性的主題概念并將抽象的主題概念轉(zhuǎn)化為具體的概念 找出核心概念,排除無(wú)關(guān)概念和重復(fù)概念,簡(jiǎn)化邏輯關(guān)系 明確概念間的邏輯關(guān)系13例如: 從鍍鋅殘?jiān)谢厥珍\工藝? 實(shí)際是:從高品位鍍鋅殘?jiān)蟹蛛x鐵 所以課題可以這樣表述:“從鋅塊中分離鐵”14隱性主題具體化如:酸洗費(fèi)液的處理:“回收”、“再生”如:煤灰利用具體利用:?檢索式:(粉煤灰+煤炭)*(利用+磚+水泥+混凝土+路基+)15找出核

5、心概念,簡(jiǎn)化邏輯關(guān)系 并不是概念越多越好! 抓住主題的核心:最能表達(dá)檢索課題內(nèi)容,而且具有實(shí)際檢索意義的關(guān)鍵詞。 如“利用稻米皮糠提取天然食品色素” 稻米、皮糠、提取、天然、食品、色素 稻米、色素16排除檢索意義不大的詞 排除檢索意義不大而且比較泛指的概念 如:展望、發(fā)展趨勢(shì)、現(xiàn)狀、近況、生產(chǎn)工藝、應(yīng)用、利用、作用、方法、影響、制備、結(jié)果 不要望詞生義17明確概念間的邏輯關(guān)系 同義詞、近義詞是或的關(guān)系 上位詞 即擴(kuò)檢,如“教育心理學(xué)” 下位詞 即縮檢,如“智育心理”、“德育心理”、“美育心理”、“教學(xué)心理學(xué)”、“學(xué)習(xí)心理學(xué)”、“教師心理學(xué)”、“學(xué)生心理學(xué)”等。 若多個(gè)下位詞都用來(lái)檢索,相對(duì)于一

6、個(gè)上位詞來(lái)說(shuō),一般是擴(kuò)檢。 一個(gè)下位詞相對(duì)于一個(gè)上位詞來(lái)說(shuō),一般是縮檢。18如何選詞 表示具體事物名稱的名詞術(shù)語(yǔ),如汽車、變壓器、反應(yīng)堆、水稻、坐標(biāo)儀等; 表示事物的狀態(tài)或現(xiàn)象的名詞術(shù)語(yǔ),如強(qiáng)度、失真、土壤熟化、日冕、船舶過(guò)載等; 表示科學(xué)分類的名詞術(shù)語(yǔ),如數(shù)學(xué)、物理學(xué)、中醫(yī)學(xué)、電子學(xué)、建筑工程、水利工程等; 表示研究方法、技術(shù)方法的名詞術(shù)語(yǔ),如分析(化學(xué))、針刺手法、有限元法、結(jié)構(gòu)功能法、力學(xué)性能試驗(yàn)等;本頁(yè)面內(nèi)容參考本頁(yè)面內(nèi)容參考漢語(yǔ)主題詞表漢語(yǔ)主題詞表19 表示工藝方法、加工技術(shù)的名詞術(shù)語(yǔ),如鑄造、鍛造、熱處理、焊接、釀造、取心鉆進(jìn)、爆破成型、激光切割等; 表示化學(xué)元素、化合物、金屬材料

7、與合金的名詞術(shù)語(yǔ),如鈉、氧原子、族元素、鈉化合物、硅化物、硫酸、鈦絡(luò)合物、釘胺、呋喃、吡啶、醇聚四氟乙烯、丁二酸()以及如金屬板耐蝕鋼、耐蝕合金等; 表示國(guó)家名稱、地名、組織機(jī)構(gòu)名稱及人名的專有名詞以及文獻(xiàn)類型、文獻(xiàn)載體的名詞術(shù)語(yǔ), 202.選擇檢索工具 了解檢索系統(tǒng) 與檢索主題相關(guān)的檢索工具有哪些?*(主要看數(shù)據(jù)庫(kù)的學(xué)科覆蓋范圍) 與檢索需求的文獻(xiàn)類型相關(guān)的檢索工具有哪些?(如:哪些數(shù)據(jù)庫(kù)或網(wǎng)站中含有會(huì)議論文) 語(yǔ)種、年限、結(jié)果形式(全文還是文摘)(如檢索19891994年的文獻(xiàn),選擇維普還是cnki)212.1 選擇檢索工具的一般方法 根據(jù)不同的文獻(xiàn)類型和語(yǔ)種需求選擇 根據(jù)利用方便、使用熟

8、練的程度選擇 根據(jù)相應(yīng)速度、獲得支持和幫助的程度選擇 根據(jù)數(shù)據(jù)量、信息年限的需求選擇 根據(jù)經(jīng)驗(yàn)和推薦選擇222.2 選擇的前提:知道有哪些信息源 圖書(shū)館網(wǎng)站的書(shū)目、數(shù)字資源列表 搜索引擎如:谷歌圖書(shū)搜索、百度圖書(shū)搜索、谷歌學(xué)術(shù)搜索、谷歌專利搜索等 網(wǎng)絡(luò)目錄 http:/ 提供公共信息的專門(mén)網(wǎng)站,如標(biāo)準(zhǔn) 開(kāi)放獲取信息資源,如arxiv預(yù)印本文獻(xiàn)庫(kù) 232.3 如何了解一個(gè)數(shù)據(jù)庫(kù) 國(guó)際國(guó)內(nèi)的在學(xué)術(shù)等領(lǐng)域的影響或地位 服務(wù)形式(web、光盤(pán)、聯(lián)機(jī)檢索、單機(jī))校內(nèi)、國(guó)內(nèi)、國(guó)外。鏡像 涵蓋學(xué)科或主題范圍 文獻(xiàn)類型(出版形式、內(nèi)容層次) 收錄年限,收錄對(duì)象 數(shù)據(jù)量(記錄數(shù)) 文種 更新頻率 訪問(wèn)模式(口令

9、,ip控制) 其它信息:幫助信息、出版者、發(fā)行者、在同行中的地位。24如何了解一個(gè)數(shù)據(jù)庫(kù)樣例:書(shū)生數(shù)字圖書(shū)書(shū)生數(shù)字圖書(shū) 國(guó)內(nèi)重要的數(shù)字圖書(shū)之一 服務(wù)形式:web/鏡像 涵蓋學(xué)科或主題范圍:所有學(xué)科 文獻(xiàn)類型(出版形式、內(nèi)容層次等):電子圖書(shū),全文(一次文獻(xiàn)) 收錄年限,收錄對(duì)象:20012003,紙本圖書(shū)的數(shù)字化 數(shù)據(jù)量(記錄數(shù)):11.4萬(wàn) 文種:中文 更新頻率:年 訪問(wèn)模式:ip控制252.4 如何檢索一個(gè)特定的數(shù)據(jù)庫(kù) 宏觀上了解數(shù)據(jù)庫(kù),熟悉界面。 利用數(shù)據(jù)庫(kù)提供的檢索指南(幫助、faq)。 了解檢索與瀏覽模式(一般檢索、高級(jí)檢索、分類檢索、特色檢索等;按主題瀏覽、按出版物字順瀏覽等)。

10、檢索結(jié)果的獲得(多種全文格式、題錄信息保存、提供預(yù)印本) 其它特色功能(檢索策略保存、信息定制) 全文閱讀工具(pdf、專用閱讀器)262.4 如何獲得數(shù)據(jù)庫(kù)的檢索幫助與指南信息 一般數(shù)據(jù)庫(kù)界面上都有“幫助”或者“檢索指南”。 圖書(shū)館等文獻(xiàn)機(jī)構(gòu)發(fā)布數(shù)據(jù)庫(kù)時(shí)提供的使用幫助。 通過(guò)google等搜索引擎搜索。如:filetype:ppt 中國(guó)期刊全文數(shù)據(jù)庫(kù)273. 確定檢索途經(jīng),選定檢索方法 有什么樣的檢索標(biāo)識(shí)或檢索語(yǔ)言,就有什么樣的檢索途經(jīng)(檢索標(biāo)識(shí):題名、主題或關(guān)鍵詞、摘要、全文、作者、機(jī)構(gòu)、分類、出版物名等)28回顧:信息檢索方法293.1 間接檢索法(即檢索方法) 間接檢索法是借助于檢索工

11、具查獲所需文獻(xiàn)的方法,包括順查法、倒查法和抽查法。順查法 是經(jīng)過(guò)分析,確定查找的起始年代,再利用選定的檢索工具由遠(yuǎn)及近地逐年查找文獻(xiàn)的方法。它適用普查一定時(shí)間的全部文獻(xiàn),查全率較高,并能掌握課題的來(lái)龍去脈,了解其研究歷史、研究現(xiàn)狀和發(fā)展趨勢(shì)。 30倒查法 此法與順查法相反,是按照時(shí)間范圍,利用選定的檢索工具由近及遠(yuǎn)地逐年查找,直到查到所需文獻(xiàn)為止。由于這種方法重點(diǎn)是查檢近期文獻(xiàn),所以能獲得較新的文獻(xiàn)信息,節(jié)省檢索時(shí)間。然而不如順查法查全率高,容易產(chǎn)生漏檢的現(xiàn)象。31 是根據(jù)檢索需求,針對(duì)所屬學(xué)科處于發(fā)展興旺時(shí)期的若干年進(jìn)行文獻(xiàn)查找。 用這種方法能獲得一批具有代表性、反映學(xué)科發(fā)展水平的文獻(xiàn),檢索

12、效果和效率較高,但必須熟悉學(xué)科發(fā)展的特點(diǎn)。抽查法32追溯檢索法 也叫擴(kuò)展法、追蹤法。此法不是利用確定的檢索工具,而是利用已知文獻(xiàn)的某種指引,如文獻(xiàn)附的參考文獻(xiàn)、有關(guān)注釋、輔助索引、附錄等,追蹤查找文獻(xiàn)。 根據(jù)已知文獻(xiàn)的指引,查找到一批相關(guān)文獻(xiàn);再根據(jù)相關(guān)文獻(xiàn)的有關(guān)指引,擴(kuò)大并發(fā)現(xiàn)新的線索,去進(jìn)一步查找。如此反復(fù)追蹤擴(kuò)展下去,直到檢索到切題的文獻(xiàn)。 用追溯法檢索文獻(xiàn),最好利用與研究課題相關(guān)的專著與綜述,因?yàn)樗鼈兯降膮⒖假Y料既多且精。 在檢索工具不全、文獻(xiàn)線索很少的情況下,可采用此法。33追溯檢索的更多應(yīng)用 文章參考文獻(xiàn)更多文章 文章作者文章 作者文章 作者團(tuán)體更多作者文章 鏈接網(wǎng)站更多鏈接 期

13、刊論文圖書(shū) 圖書(shū)期刊論文34追溯檢索的作用 用較少的文獻(xiàn)引出較多的文獻(xiàn) 了解科學(xué)研究的前期工作基礎(chǔ)、相關(guān)文獻(xiàn)、經(jīng)典著作、主要作者、重點(diǎn)期刊等。353.2 直接檢索法 是指直接通過(guò)瀏覽、查閱文獻(xiàn)原文而獲取所需文獻(xiàn)信息的方法。這種方法不依靠檢索工具,所以不是嚴(yán)格意義上的檢索方法36 優(yōu)點(diǎn):能夠明確判斷文獻(xiàn)所包含的信息是否需要缺點(diǎn):是難以獲得全面的文獻(xiàn),且費(fèi)時(shí)費(fèi)力,具有一定的盲目性和偶然性。如果檢索課題單一,文獻(xiàn)相對(duì)集中,又熟悉檢索書(shū)刊,可用這種檢索方法。對(duì)于有多個(gè)主題、文獻(xiàn)離散度較大的課題,則不宜用此法由于直接檢索具有準(zhǔn)確性和實(shí)用性優(yōu)勢(shì),能滿足用戶直接獲取文獻(xiàn)的要求,因而是文獻(xiàn)檢索的必要手段。37

14、3.3 文獻(xiàn)信息老化規(guī)律的應(yīng)用 隨著時(shí)間的推移,信息的價(jià)值會(huì)逐漸衰減乃至失效。文獻(xiàn)信息表現(xiàn)出老化規(guī)律。文獻(xiàn)信息老化的情形有:l 所含信息仍有用,但現(xiàn)在已經(jīng)被包含在其它更新的文獻(xiàn)中。l 所含信息仍有用,但現(xiàn)在正處于人們對(duì)其興趣下降的階段。l 所含信息仍有用,但為后來(lái)的文獻(xiàn)所超越。l 所含信息不再有用。38老化規(guī)律應(yīng)用-限定年限的檢索方法 在進(jìn)行文獻(xiàn)信息檢索時(shí),注意文獻(xiàn)出版年的限出版年的限定定。學(xué)術(shù)信息的半衰期一般是35年。許多信息的老化如藝術(shù)品、經(jīng)濟(jì)信息、市場(chǎng)信息等表現(xiàn)出跳躍性。有時(shí)突然失效,有時(shí)永不失效。 查閱文獻(xiàn)信息時(shí)盡量選取較新的文獻(xiàn)。同時(shí)要顧及較早的文獻(xiàn)。一般性研究一般性研究可選擇近5年

15、來(lái)的文獻(xiàn)即可。了解背景資料了解背景資料的則要長(zhǎng)得多。 對(duì)發(fā)達(dá)國(guó)家的文獻(xiàn)發(fā)達(dá)國(guó)家的文獻(xiàn)的利用可以在中文文獻(xiàn)年限的基礎(chǔ)上增加310年。39文獻(xiàn)的半衰期文獻(xiàn)的半衰期:某學(xué)科領(lǐng)域現(xiàn)時(shí)還在利用的全部文獻(xiàn)中的一半是在多長(zhǎng)的時(shí)間內(nèi)發(fā)表的。例如:物理學(xué)文獻(xiàn)的半率期是4.6年,即是說(shuō):現(xiàn)時(shí)仍在利用的物理學(xué)文獻(xiàn)的50,其出版年齡不超過(guò)4.6年。 半衰期與文獻(xiàn)的增長(zhǎng)、學(xué)科差異、學(xué)科發(fā)展的階段和信息環(huán)境與需求有關(guān)。404.實(shí)施檢索策略, 瀏覽初步結(jié)果 在課題檢索需求分析和了解檢索系統(tǒng)的基礎(chǔ)上,應(yīng)用檢索技術(shù)具體去檢索! 注意邏輯組配、限定。 檢索結(jié)果的選擇與判斷注意排序和輸出結(jié)果的設(shè)定 注意下載相關(guān)全文閱讀器41檢索結(jié)

16、果內(nèi)容的判斷 看檢索結(jié)果記錄的標(biāo)題和摘要是否為課題檢索需要 注意根據(jù)信息來(lái)源判斷信息的價(jià)值 看結(jié)果數(shù)量(太多或太少都不合適) 適當(dāng)利用關(guān)聯(lián)檢索和類別檢索功能擴(kuò)展檢索領(lǐng)域和范圍根據(jù)以上對(duì)檢索結(jié)果內(nèi)容的判斷,調(diào)整檢索策略425.調(diào)整檢索策略, 獲取所需信息 根據(jù)初步檢索結(jié)果判斷,調(diào)整檢索策略(檢索需求;檢索途徑;檢索方法;擴(kuò)展檢索、限定檢索等)435.1 擴(kuò)展檢索的方法 上位詞 同義詞 多種寫(xiě)法 用or 檢索系統(tǒng)的關(guān)聯(lián)檢索、相關(guān)關(guān)鍵詞檢索、引文檢索等等445.2 縮檢的方法 下位詞 專指的詞 單元詞合并為詞組,如“互聯(lián)網(wǎng)、使用、狀況”合并為一個(gè)詞組“互聯(lián)網(wǎng)使用狀況”, 精確檢索 用and 和not 各種限度檢索45挑選檢索結(jié)果,獲取所需信息 下載全

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論