


下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、信息檢索考點(diǎn)整理1. 信息檢索的概念廣義的信息檢索是指將信息按一定的方式組織、 存儲(chǔ)起來(lái), 并根據(jù)信息用戶的需要找出有關(guān)信息 的過(guò)程,包括信息的存儲(chǔ)和檢索兩個(gè)過(guò)程;而狹義的信息檢索僅指有序化信息的檢索查找。2. 信息檢索的原理就是將檢索者的檢索提問(wèn)標(biāo)識(shí)與存儲(chǔ)在檢索工具中的信息特征標(biāo)識(shí)進(jìn)行相符性比較, 凡是信息特 征標(biāo)識(shí)與檢索提問(wèn)標(biāo)識(shí)相一致或者信息特征標(biāo)識(shí)包含著檢索提問(wèn)的標(biāo)識(shí), 則具有該特征的信息就 從檢索工具中輸出,輸出的信息就是初步命中檢索所需的信息。3. 為什么說(shuō)信息存儲(chǔ)和檢索是兩個(gè)不可分割的有機(jī)體?檢索的全過(guò)程包括存儲(chǔ)和檢索兩個(gè)過(guò)程,存儲(chǔ)和檢索是相輔相成、不可分割的。 存儲(chǔ)過(guò)程主要是為檢
2、索提供有規(guī)律的檢索途利用檢索語(yǔ)言對(duì)文獻(xiàn)進(jìn)行標(biāo)引, 形成文獻(xiàn)特征標(biāo)識(shí)并輸入檢索工具, 徑;檢索過(guò)程主要是利用檢索語(yǔ)言對(duì)檢索提問(wèn)進(jìn)行標(biāo)引, 形成檢索提問(wèn)標(biāo)識(shí), 再按照存儲(chǔ)所提供的檢索途徑,將檢索提問(wèn)標(biāo)識(shí)與文獻(xiàn)特征標(biāo)識(shí)進(jìn)行比較。檢索過(guò)程是存儲(chǔ)過(guò)程的逆過(guò)程。因此, 檢索者只有在全面了解存儲(chǔ)者是怎樣把文獻(xiàn)存入到檢索工具中去以后, 才知道怎樣從檢索工具中 把所需要的信息檢索出來(lái)。4. 信息檢索的方法(1)順查法(2)倒查法(3)抽查法(4)追溯法(5)循環(huán)法5. 信息檢索的途徑(1)內(nèi)部特征途徑a)分類(lèi)途徑b)主題途徑(2)外部特征途徑a)題名途徑b)著者途徑c)文獻(xiàn)編號(hào)途徑d)目錄檢索途徑e)機(jī)構(gòu)檢索法
3、f)引文檢索途徑6. 布爾模型的優(yōu)缺點(diǎn)優(yōu)點(diǎn):( 1)簡(jiǎn)單,形式簡(jiǎn)潔,易于理解;( 2) 可操作性強(qiáng),應(yīng)用廣泛;( 3) 構(gòu)成的邏輯提問(wèn)式可以表達(dá)與用戶思維習(xí)慣相一致的查詢要求,提供非常精確的語(yǔ) 義概念;( 4) 能處理結(jié)構(gòu)化提問(wèn)。缺點(diǎn):( 1)表達(dá)用戶復(fù)雜需求效果欠佳(2)準(zhǔn)確匹配無(wú)法提供定量比較(3)匹配標(biāo)準(zhǔn)不盡合理(4)檢索結(jié)果不易控制7. 概率排序原則: 如果一個(gè)檢索系統(tǒng)對(duì)用戶的每個(gè)檢索提問(wèn)的反應(yīng)是以文獻(xiàn)集合中的文獻(xiàn)按相關(guān)性遞減的順序排 列的,那么系統(tǒng)的總體效果是最好的。8. 什么是計(jì)算機(jī)信息檢索? 所謂計(jì)算機(jī)信息檢索, 就是在計(jì)算機(jī)和人的共同作用下, 按照一定的方法組織和存儲(chǔ)信息, 并
4、通 過(guò)人機(jī)對(duì)話從計(jì)算機(jī)存儲(chǔ)的大量數(shù)據(jù)中自動(dòng)輸出用戶所需的那部分信息的過(guò)程。 實(shí)質(zhì)上計(jì)算機(jī)信 息系檢索是利用計(jì)算機(jī)信息檢索系統(tǒng)存儲(chǔ)和查找信息的技術(shù), 是計(jì)算機(jī)硬件資源、 系統(tǒng)軟件、 檢 索軟件和數(shù)據(jù)庫(kù)的綜合。9. 計(jì)算機(jī)信息檢索的類(lèi)型:( 1 ) 根據(jù)檢索系統(tǒng)的工作方式,可分為:a) .脫機(jī)信息檢索 脫機(jī)信息檢索是利用單臺(tái)計(jì)算機(jī)的輸入裝置進(jìn)行檢索的系統(tǒng),用磁帶作為存儲(chǔ)介質(zhì),并且為連續(xù)的順序檢索方式,適合大批量的定題信息檢索。b) . 聯(lián)機(jī)信息檢索聯(lián)機(jī)信息檢索是利用計(jì)算機(jī)終端設(shè)備,通過(guò)通信線路或網(wǎng)絡(luò),與世界上的信息檢索系 統(tǒng)相連,從信息檢索系統(tǒng)的數(shù)據(jù)庫(kù)中進(jìn)行檢索并獲取信息的過(guò)程。聯(lián)機(jī)檢索模式是主從
5、式,即為所有的工作都在主機(jī)上進(jìn)行,主機(jī)負(fù)擔(dān)重,一旦主機(jī)癱 瘓,整個(gè)系統(tǒng)都將處于癱瘓狀態(tài),因此對(duì)主機(jī)的性能要求極高。c) . 光盤(pán)信息檢索d) .網(wǎng)絡(luò)信息檢索(2) 根據(jù)信息的服務(wù)方式,可分為:a) .定題檢索 定題檢索是用戶根據(jù)課題的要求,事先編寫(xiě)出邏輯檢索提問(wèn)式,并將存儲(chǔ)在計(jì)算機(jī)的存儲(chǔ)器中,每次系統(tǒng)加入新的信息,系統(tǒng)便會(huì)按檢索要求,找出用戶所需的資料,并把 結(jié)果分給用戶,用戶能及時(shí)得到最新的文獻(xiàn)信息。具有定期性、新穎性和批處理性的特 點(diǎn)。b) .回溯檢索回溯檢索是追溯查找過(guò)去的信息, 讓用戶一次檢索一段時(shí)間內(nèi)與某一課題有關(guān)的信息。 也可以查找最新的信息,可以適應(yīng)多數(shù)用戶的查詢需要。c) .
6、日常檢索10. 計(jì)算機(jī)信息檢索技術(shù)初級(jí)檢索 6 個(gè)1) 布爾邏輯檢索2) 位置限制檢索3) 短語(yǔ)檢索4) 截詞檢索5) 字段限制檢索6) 區(qū)分大小寫(xiě)檢索11. 計(jì)算機(jī)信息檢索技術(shù)高級(jí)檢索 6 個(gè)1) 加權(quán)檢索2) 自然語(yǔ)言檢索3) 相關(guān)信息反饋(相似檢索)4) 概念檢索5) 模糊檢索6) 聚類(lèi)檢索布爾邏輯檢索(1) 邏輯與 用 AND 或*表示 檢索式寫(xiě)作 A AND B 或 A *B(2) 邏輯或用“ OR”或“ + ”表示(3) 邏輯非 用 NOT 或 表示 A NOT B ( A 當(dāng)中除去 B 所剩下的) 字段名稱(chēng)及縮寫(xiě)AB abstractTI title AU author JN j
7、ournal nameLA language PY publication year SP source publication 分類(lèi)和聚類(lèi)的異同 相同點(diǎn):基于“類(lèi)”的思想進(jìn)行檢索。不同點(diǎn):( 1)分類(lèi)基于分類(lèi)法,其類(lèi)目體系主要是先組式,有系統(tǒng)性的。類(lèi)目與文獻(xiàn)之間具有 相對(duì)獨(dú)立性。 而聚類(lèi)則先有文獻(xiàn)后聚類(lèi), 類(lèi)的性質(zhì)及整體類(lèi)目體系完全由系統(tǒng)中的文獻(xiàn)決定。 ( 2) 從類(lèi)目形成過(guò)程看,分類(lèi)是總到分,聚類(lèi)由分到總。會(huì)構(gòu)建檢索式(主要是積木型)12. 計(jì)算機(jī)信息檢索策略含義 狹義的計(jì)算機(jī)信息檢索策略是指檢索提問(wèn)式的構(gòu)建, 即運(yùn)用系統(tǒng)特定的檢索技術(shù), 確定檢索詞之 間的邏輯關(guān)系,形成表達(dá)用戶信息需求的
8、檢索提問(wèn)式。廣義的計(jì)算機(jī)信息檢索策略是指在分析檢索課題的實(shí)質(zhì)內(nèi)容和明確檢索目標(biāo)的基礎(chǔ)上, 選擇檢索 工具,確定檢索途徑與檢索用詞, 以及檢索詞之間邏輯關(guān)系與查找步驟最佳方案的一系列科學(xué)安 排。13. 計(jì)算機(jī)信息檢索策略類(lèi)型(即聯(lián)機(jī)檢索五原則)( 1 ) 最專(zhuān)指面優(yōu)先:從最專(zhuān)指的概念入手( 2 ) 最低登錄量面優(yōu)先( 3 ) 積木型( 重點(diǎn)掌握,會(huì)構(gòu)建此檢索式 )( 4 ) 引文珠型增長(zhǎng)( 5 ) 逐次分餾14. 網(wǎng)絡(luò)信息資源的評(píng)價(jià)方法:( 1 ) 定性評(píng)價(jià)法:是指按照一定的評(píng)價(jià)標(biāo)準(zhǔn)從主觀角度對(duì)網(wǎng)絡(luò)信息資源所做的優(yōu)選和評(píng)估, 主要有指標(biāo)體系法和調(diào)查表法。( 2) 定量評(píng)價(jià)法:國(guó)內(nèi)外比較典型的定量
9、評(píng)價(jià)方法有信息計(jì)量法、層次分析法和對(duì)應(yīng)分析法 等三種。( 3 ) 綜合評(píng)價(jià)法:是定性評(píng)價(jià)和定量評(píng)價(jià)相結(jié)合的一種方法,有包括分析法、模糊綜合評(píng)價(jià) 法等。( 4) 分類(lèi)方法:分為第三方評(píng)價(jià)法、用戶評(píng)價(jià)法和網(wǎng)絡(luò)計(jì)量法。15. 搜索引擎的類(lèi)型:( 1 ) 按檢索機(jī)制劃分:檢索型、目錄型和混合型檢索工具( 2) 按檢索內(nèi)容劃分:綜合型、專(zhuān)題型和特殊型檢索工具( 3 ) 按包含檢索工具數(shù)量劃分:?jiǎn)为?dú)型和集合型檢索工具( 4 ) 按檢索資料類(lèi)型分:萬(wàn)維網(wǎng)檢索工具和非萬(wàn)維網(wǎng)檢索工具16. 元搜索引擎的含義所謂元搜索引擎, 是對(duì)分布于網(wǎng)絡(luò)的多種檢索工具的全局控制機(jī)制, 它通過(guò)一個(gè)統(tǒng)一用戶界面幫 助用戶在多個(gè)搜索
10、引擎中選擇和利用合適的搜索引擎來(lái)實(shí)現(xiàn)檢索操作。17. 元搜索引擎的特點(diǎn):( 1 ) 虛擬索引數(shù)據(jù)庫(kù)( 2) 查全率高(3)用戶界面友好(4)適宜二次加工(5)擴(kuò)展性好搜索耳118.元搜索引擎的工作原理搜索擎搜索引擎3顯示查詢結(jié)果19. 實(shí)現(xiàn)跨語(yǔ)言信息檢索的方法:(1 )提問(wèn)式翻譯方法(2)文獻(xiàn)翻譯方法(唯一結(jié)果是源語(yǔ)言描述)(3)提問(wèn)式一文獻(xiàn)翻譯方法(將查詢語(yǔ)言提問(wèn)式翻譯成目標(biāo)語(yǔ)言提問(wèn)式,與目標(biāo)語(yǔ)言描述的信息庫(kù)進(jìn)行匹配,檢索相關(guān)信息,然后再把檢索結(jié)果的全部或部分內(nèi)容翻譯成查詢語(yǔ)言描述的信 息。檢索結(jié)果一般選擇部分翻譯,這樣工作量較小,容易提高翻譯的效率和質(zhì)量,部分翻譯一般是對(duì)結(jié)果文本的前兩行、
11、文摘或文本中重要的詞進(jìn)行翻譯,在重要詞的翻譯中,如何確定 重要詞是決定這種方法效果的關(guān)鍵。(4)中間語(yǔ)種翻譯方法(5)非翻譯方法20. 語(yǔ)義網(wǎng)的應(yīng)用(1)Web服務(wù)(2)智能信息檢索(3)基于語(yǔ)義的網(wǎng)頁(yè)搜索引擎(4)企業(yè)數(shù)據(jù)管理收錄論文的兩個(gè)層次(1)Compendex數(shù)據(jù)。數(shù)據(jù)的內(nèi)容全面,主要包括:論文標(biāo)題;作者;作者單位;英文文摘; 論文所在期刊名稱(chēng);卷,期;論文頁(yè)碼;分類(lèi)碼;主題詞等等。其中:分類(lèi)碼;主題詞 需要專(zhuān)業(yè)人員單獨(dú)給岀。(2)Page One數(shù)據(jù):數(shù)據(jù)內(nèi)容主要包括:論文標(biāo)題;作者;作者單位;論文所在期刊名稱(chēng); 卷,期;論文頁(yè)碼;少數(shù)數(shù)據(jù)帶有英文文摘。不需要任何專(zhuān)業(yè)人員再做工作。
12、數(shù)據(jù) 和Page One數(shù)據(jù)的主要區(qū)別在于:數(shù)據(jù)中是否有分類(lèi)碼和主題詞;有這兩項(xiàng)內(nèi)容的數(shù)據(jù)是Compendex數(shù)據(jù),反之是Page One數(shù)據(jù)。有沒(méi)有主題詞和分類(lèi)號(hào)是判斷論文是否被Compendex數(shù)據(jù)正式收錄的唯一標(biāo)志。23.主題指南按字母順序列岀與分類(lèi)表中類(lèi)目名稱(chēng)相關(guān)的主題詞,并注明相關(guān)的分類(lèi)號(hào), 實(shí)際上是分類(lèi)表的主題索引,是從分類(lèi)途徑檢索文獻(xiàn)的指南。便于不能確定分類(lèi)號(hào)的讀者實(shí)現(xiàn)從主題查到分類(lèi)號(hào),再由分類(lèi)號(hào)查到文獻(xiàn)所在頁(yè)碼。(科學(xué)引文索引)的編制結(jié)構(gòu)及檢索方法(1)引文索引(2)來(lái)源索引(3)機(jī)構(gòu)索引(4)輪排主題索引25. 如何決定收錄期刊的數(shù)量和種類(lèi)?(1)"加菲爾德文獻(xiàn)集中
13、定律”確定適宜的期刊數(shù)量該定律認(rèn)為:在幾萬(wàn)種科技期刊中,最重要的期刊(即核心期刊)不過(guò)一千種,甚至可能 還不足 500。因而,把收錄期刊的范圍定在3000 種以內(nèi),足以把重要的科技文獻(xiàn)包括在內(nèi)。(2)“費(fèi)用效果原則”用來(lái)選擇每一種期刊,具體方法是“引用頻率統(tǒng)計(jì)法”先計(jì)算一種期刊在一年內(nèi)被引用的總次數(shù),再計(jì)算其中每篇論文的平均引文章,其他因素 對(duì)引文章的影響通過(guò)加某些修正系數(shù)來(lái)解決,引用頻率越高,說(shuō)明該刊質(zhì)量越高。通過(guò)上述兩個(gè)指標(biāo)決定了收錄期刊的數(shù)量和種類(lèi)26. 什么是專(zhuān)利?這種受法律保護(hù)的發(fā)明就稱(chēng)專(zhuān)利。 含義:專(zhuān)利權(quán)法律受專(zhuān)利法保護(hù)的發(fā)明創(chuàng)造專(zhuān)利技術(shù) 專(zhuān)利說(shuō)明書(shū)等專(zhuān)利文獻(xiàn)文獻(xiàn) 這三層含義的核心
14、是受專(zhuān)利法保護(hù)的發(fā)明,而專(zhuān)利權(quán)和專(zhuān)利文獻(xiàn)是專(zhuān)利的具體表現(xiàn)。27. 什么是同族專(zhuān)利?同族專(zhuān)利指同一個(gè)發(fā)明為了在不同國(guó)家得到保護(hù), 而在這些國(guó)家分別申請(qǐng)的一系列內(nèi)容相同或基 本相同的專(zhuān)利。由于同族專(zhuān)利或相同專(zhuān)利都具有相同的優(yōu)先權(quán)項(xiàng),所以通過(guò)優(yōu)先權(quán)項(xiàng)可以方便、 快捷地檢索出有關(guān)同一發(fā)明的全部相同專(zhuān)利或同族專(zhuān)利。28. 專(zhuān)利的類(lèi)型(1)發(fā)明專(zhuān)利( 2 )實(shí)用新型專(zhuān)利( 3)外觀設(shè)計(jì)專(zhuān)利( 4 )植物性專(zhuān)利( 5 )防衛(wèi)性專(zhuān)利知識(shí)產(chǎn)權(quán):工業(yè)產(chǎn)權(quán)和著作產(chǎn)權(quán)29. 學(xué)位論文的文獻(xiàn)價(jià)值:(1) 較高價(jià)值的一次文獻(xiàn):寫(xiě)作不受篇幅限制,論述詳盡:從研究背景、技術(shù)線路、實(shí)驗(yàn)方 法到數(shù)據(jù)獲取、分析結(jié)論論述翔實(shí)。(2) 珍貴的信息資源價(jià)值:能集中反映所在單位的科研領(lǐng)域、學(xué)術(shù)活動(dòng)、研究進(jìn)展和最新成 果,論文的使用者可以跟蹤名校導(dǎo)師的科研進(jìn)程。( 3 ) 綜述性二次文獻(xiàn):對(duì)相應(yīng)研究領(lǐng)域有系統(tǒng)深入的討論和綜述,擁有詳盡的參考文獻(xiàn),可 得到課題研究現(xiàn)狀綜述。(4)寫(xiě)作技巧的啟發(fā)藍(lán)本:通過(guò)對(duì)學(xué)位論文的閱讀,可大致梳理出作者的寫(xiě)作思路和研究方 法,學(xué)習(xí)學(xué)位論文的寫(xiě)作方法。30.信息檢索評(píng)價(jià)方法1)測(cè)試文檔集合法2)人
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 工程師賦能職業(yè)教育的關(guān)鍵能力與創(chuàng)新驅(qū)動(dòng)路徑
- 傳統(tǒng)文化教育與職業(yè)技能培養(yǎng)的協(xié)同效應(yīng)分析
- 浙江省杭州市名校2024年數(shù)學(xué)八上期末聯(lián)考試題含解析
- 遼寧省盤(pán)錦市2024-2025學(xué)年九年級(jí)化學(xué)第一學(xué)期期末經(jīng)典試題含解析
- 浙江省紹興越城區(qū)五校聯(lián)考2025屆物理八上期末檢測(cè)試題含解析
- 黑龍江省哈爾濱南崗區(qū)2024年九上化學(xué)期末監(jiān)測(cè)模擬試題含解析
- 廣東省深圳市桃源中學(xué)2024-2025學(xué)年物理八年級(jí)第一學(xué)期期末聯(lián)考試題含解析
- 河北省秦皇島市名校2024-2025學(xué)年數(shù)學(xué)七年級(jí)第一學(xué)期期末經(jīng)典試題含解析
- 餐飲企業(yè)品牌形象店租賃及宣傳協(xié)議
- 酶法合成技術(shù)革新:法尼龍單體生產(chǎn)的前沿探索
- 高新技術(shù)企業(yè)研發(fā)費(fèi)用管理辦法
- 老年急重癥診療及護(hù)理
- 中小學(xué)家長(zhǎng)會(huì)期中期末家長(zhǎng)會(huì)253
- 驅(qū)動(dòng)電機(jī)與電機(jī)控制器
- 2024年便攜式儲(chǔ)能行業(yè)分析報(bào)告
- 醫(yī)聯(lián)體協(xié)議書(shū)(2024版)
- 2023年全國(guó)職業(yè)院校技能大賽-中藥傳統(tǒng)技能賽項(xiàng)規(guī)程
- 11 《愛(ài)蓮說(shuō)》對(duì)比閱讀-2024-2025中考語(yǔ)文文言文閱讀專(zhuān)項(xiàng)訓(xùn)練(含答案)
- 動(dòng)物園野生動(dòng)物馴養(yǎng)繁殖或馴養(yǎng)觀賞可行性研究報(bào)告
- 煤礦開(kāi)掘技術(shù)操作規(guī)程
- 2023年上海市長(zhǎng)寧區(qū)高三年級(jí)下冊(cè)二模英語(yǔ)試卷含詳解
評(píng)論
0/150
提交評(píng)論