




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、信息檢索考點(diǎn)整理1 .信息檢索的概念廣義的信息檢索是指將信息按一定的方式組織、 存儲(chǔ)起來, 并根據(jù)信息用戶的需要找出有關(guān)信息的過程,包括信息的存儲(chǔ)和檢索兩個(gè)過程;而狹義的信息檢索僅指有序化信息的檢索查找。2 .信息檢索的原理就是將檢索者的檢索提問標(biāo)識與存儲(chǔ)在檢索工具中的信息特征標(biāo)識進(jìn)行相符性比較, 凡是信息特征標(biāo)識與檢索提問標(biāo)識相一致或者信息特征標(biāo)識包含著檢索提問的標(biāo)識, 則具有該特征的信息就從檢索工具中輸出,輸出的信息就是初步命中檢索所需的信息。3 .為什么說信息存儲(chǔ)和檢索是兩個(gè)不可分割的有機(jī)體?檢索的全過程包括存儲(chǔ)和檢索兩個(gè)過程, 存儲(chǔ)和檢索是相輔相成、 不可分割的。 存儲(chǔ)過程主要是利用檢
2、索語言對文獻(xiàn)進(jìn)行標(biāo)引, 形成文獻(xiàn)特征標(biāo)識并輸入檢索工具, 為檢索提供有規(guī)律的檢索途徑; 檢索過程主要是利用檢索語言對檢索提問進(jìn)行標(biāo)引, 形成檢索提問標(biāo)識, 再按照存儲(chǔ)所提供的檢索途徑, 將檢索提問標(biāo)識與文獻(xiàn)特征標(biāo)識進(jìn)行比較。 檢索過程是存儲(chǔ)過程的逆過程。 因此, 檢索者只有在全面了解存儲(chǔ)者是怎樣把文獻(xiàn)存入到檢索工具中去以后, 才知道怎樣從檢索工具中把所需要的信息檢索出來。4 .信息檢索的方法( 1 )順查法( 2 )倒查法( 3 )抽查法( 4 )追溯法( 5 )循環(huán)法5.信息檢索的途徑( 1 )內(nèi)部特征途徑a) 分類途徑b) 主題途徑( 2 )外部特征途徑a) 題名途徑b) 著者途徑c) 文
3、獻(xiàn)編號途徑d) 目錄檢索途徑e) 機(jī)構(gòu)檢索法f) 引文檢索途徑6 .布爾模型的優(yōu)缺點(diǎn)優(yōu)點(diǎn): ( 1 )簡單,形式簡潔,易于理解;( 2 )可操作性強(qiáng),應(yīng)用廣泛;( 3 )構(gòu)成的邏輯提問式可以表達(dá)與用戶思維習(xí)慣相一致的查詢要求,提供非常精確的語義概念;( 4 ) 能處理結(jié)構(gòu)化提問。缺點(diǎn): ( 1 )表達(dá)用戶復(fù)雜需求效果欠佳( 2 )準(zhǔn)確匹配無法提供定量比較( 3 )匹配標(biāo)準(zhǔn)不盡合理( 4 )檢索結(jié)果不易控制7 .概率排序原則:如果一個(gè)檢索系統(tǒng)對用戶的每個(gè)檢索提問的反應(yīng)是以文獻(xiàn)集合中的文獻(xiàn)按相關(guān)性遞減的順序排列的,那么系統(tǒng)的總體效果是最好的。8 .什么是計(jì)算機(jī)信息檢索?所謂計(jì)算機(jī)信息檢索,就是在計(jì)
4、算機(jī)和人的共同作用下,按照一定的方法組織和存儲(chǔ)信息,并通過人機(jī)對話從計(jì)算機(jī)存儲(chǔ)的大量數(shù)據(jù)中自動(dòng)輸出用戶所需的那部分信息的過程。 實(shí)質(zhì)上計(jì)算機(jī)信息系檢索是利用計(jì)算機(jī)信息檢索系統(tǒng)存儲(chǔ)和查找信息的技術(shù),是計(jì)算機(jī)硬件資源、系統(tǒng)軟件、檢索軟件和數(shù)據(jù)庫的綜合。9 .計(jì)算機(jī)信息檢索的類型:( 1 ) 根據(jù)檢索系統(tǒng)的工作方式,可分為:a) .脫機(jī)信息檢索脫機(jī)信息檢索是利用單臺計(jì)算機(jī)的輸入裝置進(jìn)行檢索的系統(tǒng),用磁帶作為存儲(chǔ)介質(zhì),并且為連續(xù)的順序檢索方式,適合大批量的定題信息檢索。b) . 聯(lián)機(jī)信息檢索聯(lián)機(jī)信息檢索是利用計(jì)算機(jī)終端設(shè)備,通過通信線路或網(wǎng)絡(luò),與世界上的信息檢索系統(tǒng)相連,從信息檢索系統(tǒng)的數(shù)據(jù)庫中進(jìn)行檢
5、索并獲取信息的過程。聯(lián)機(jī)檢索模式是主從式,即為所有的工作都在主機(jī)上進(jìn)行,主機(jī)負(fù)擔(dān)重,一旦主機(jī)癱瘓,整個(gè)系統(tǒng)都將處于癱瘓狀態(tài),因此對主機(jī)的性能要求極高。c) .光盤信息檢索d) . 網(wǎng)絡(luò)信息檢索( 2 ) 根據(jù)信息的服務(wù)方式,可分為:a) .定題檢索定題檢索是用戶根據(jù)課題的要求,事先編寫出邏輯檢索提問式,并將存儲(chǔ)在計(jì)算機(jī)的存儲(chǔ)器中,每次系統(tǒng)加入新的信息,系統(tǒng)便會(huì)按檢索要求,找出用戶所需的資料,并把結(jié)果分給用戶,用戶能及時(shí)得到最新的文獻(xiàn)信息。具有定期性、新穎性和批處理性的特點(diǎn)。b) . 回溯檢索回溯檢索是追溯查找過去的信息,讓用戶一次檢索一段時(shí)間內(nèi)與某一課題有關(guān)的信息。也可以查找最新的信息,可以適
6、應(yīng)多數(shù)用戶的查詢需要。c) . 日常檢索10.計(jì)算機(jī)信息檢索技術(shù)初級檢索6個(gè)1) 布爾邏輯檢索2) 位置限制檢索3) 短語檢索4) 截詞檢索5) 字段限制檢索6) 區(qū)分大小寫檢索11.計(jì)算機(jī)信息檢索技術(shù)高級檢索6 個(gè)1) 加權(quán)檢索2) 自然語言檢索3) 相關(guān)信息反饋(相似檢索)4) 概念檢索5) 模糊檢索6) 聚類檢索布爾邏輯檢索(1)邏輯與用 and 或*表示 檢索式寫作a and b 或 a *b(2)邏輯或用“or”或“ +”表示(3)邏輯非用 not 或 表示 a not b (a 當(dāng)中除去 b 所剩下的) 字段名稱及縮寫ab abstractti title au author jn
7、 journal namela languagepy publication year sp source publication分類和聚類的異同相同點(diǎn):基于“類”的思想進(jìn)行檢索。不同點(diǎn): ( 1 )分類基于分類法,其類目體系主要是先組式,有系統(tǒng)性的。類目與文獻(xiàn)之間具有相對獨(dú)立性。 而聚類則先有文獻(xiàn)后聚類, 類的性質(zhì)及整體類目體系完全由系統(tǒng)中的文獻(xiàn)決定。 ( 2 )從類目形成過程看,分類是總到分,聚類由分到總。會(huì)構(gòu)建檢索式(主要是積木型)12 .計(jì)算機(jī)信息檢索策略含義狹義的計(jì)算機(jī)信息檢索策略是指檢索提問式的構(gòu)建, 即運(yùn)用系統(tǒng)特定的檢索技術(shù), 確定檢索詞之間的邏輯關(guān)系,形成表達(dá)用戶信息需求的檢索
8、提問式。廣義的計(jì)算機(jī)信息檢索策略是指在分析檢索課題的實(shí)質(zhì)內(nèi)容和明確檢索目標(biāo)的基礎(chǔ)上, 選擇檢索工具, 確定檢索途徑與檢索用詞, 以及檢索詞之間邏輯關(guān)系與查找步驟最佳方案的一系列科學(xué)安排。13 .計(jì)算機(jī)信息檢索策略類型(即聯(lián)機(jī)檢索五原則)( 1 )最專指面優(yōu)先:從最專指的概念入手( 2 )最低登錄量面優(yōu)先( 3 )積木型( 重點(diǎn)掌握,會(huì)構(gòu)建此檢索式)( 4 )引文珠型增長( 5 )逐次分餾14 .網(wǎng)絡(luò)信息資源的評價(jià)方法:(1) 定性評價(jià)法:是指按照一定的評價(jià)標(biāo)準(zhǔn)從主觀角度對網(wǎng)絡(luò)信息資源所做的優(yōu)選和評 估,主要有指標(biāo)體系法和調(diào)查表法。(2) 定量評價(jià)法:國內(nèi)外比較典型的定量評價(jià)方法有信息計(jì)量法、層
9、次分析法和對應(yīng)分 析法等三種。(3) 綜合評價(jià)法:是定性評價(jià)和定量評價(jià)相結(jié)合的一種方法,有包括分析法、模糊綜合 評價(jià)法等。(4) 分類方法:分為第三方評價(jià)法、用戶評價(jià)法和網(wǎng)絡(luò)計(jì)量法。15 .搜索引擎的類型:(1) 按檢索機(jī)制劃分:檢索型、目錄型和混合型檢索工具(2) 按檢索內(nèi)容劃分:綜合型、專題型和特殊型檢索工具(3) 按包含檢索工具數(shù)量劃分:單獨(dú)型和集合型檢索工具(4) 按檢索資料類型分:萬維網(wǎng)檢索工具和非萬維網(wǎng)檢索工具16 .元搜索引擎的含義所謂元搜索引擎,是對分布于網(wǎng)絡(luò)的多種檢索工具的全局控制機(jī)制,它通過一個(gè)統(tǒng)一用戶界面幫助用戶在多個(gè)搜索引擎中選擇和利用合適的搜索引擎來實(shí)現(xiàn)檢索操作。17
10、 .元搜索引擎的特點(diǎn):(1) 虛擬索引數(shù)據(jù)庫(2) 查全率高(3) 用戶界面友好(4) 適宜二次加工(5) 擴(kuò)展性好18.元搜索引擎的工作原理輸入查 詢條件選擇搜 索引擎顯示查詢結(jié)果(19) 現(xiàn)跨語言信息檢索的方法:(1)提問式翻譯方法(2)文獻(xiàn)翻譯方法(唯一結(jié)果是源語言描述)(3)提問式一文獻(xiàn)翻譯方法(將查詢語言提問式翻譯成目標(biāo)語言提問式,與目標(biāo)語言描述 的信息庫進(jìn)行匹配,檢索相關(guān)信息,然后再把檢索結(jié)果的全部或部分內(nèi)容翻譯成查詢語言 描述的信息。檢索結(jié)果一般選擇部分翻譯,這樣工作量較小,容易提高翻譯的效率和質(zhì)量,部分翻譯一般是對結(jié)果文本的前兩行、文摘或文本中重要的詞進(jìn)行翻譯,在重要詞的 翻譯
11、中,如何確定重要詞是決定這種方法效果的關(guān)鍵。(4)中間語種翻譯方法(5)非翻譯方法20.語義網(wǎng)的應(yīng)用( 1 )web 服務(wù)( 2 )智能信息檢索( 3 )基于語義的網(wǎng)頁搜索引擎( 4 )企業(yè)數(shù)據(jù)管理21.ei 收錄論文的兩個(gè)層次( 1 ) compendex 數(shù)據(jù)。數(shù)據(jù)的內(nèi)容全面,主要包括:論文標(biāo)題;作者;作者單位;英文文摘;論文所在期刊名稱;卷,期;論文頁碼;分類碼;主題詞等等。其中:分類碼;主題詞需要專業(yè)人員單獨(dú)給出。(2)page one數(shù)據(jù):數(shù)據(jù)內(nèi)容主要包括:論文標(biāo)題;作者;作者單位;論文所在期刊名稱;卷,期;論文頁碼;少數(shù)數(shù)據(jù)帶有英文文摘。不需要任何專業(yè)人員再做工作。22 .comp
12、endex 數(shù)據(jù) 和 page one 數(shù)據(jù)的主要區(qū)別在于: 數(shù)據(jù)中是否有分類碼和主題詞;有這兩項(xiàng)內(nèi)容的數(shù)據(jù)是compendex數(shù)據(jù),反之是page one數(shù)據(jù)。有沒有主題詞和分類號是判斷論文是否被compendex 數(shù)據(jù)正式收錄的唯一標(biāo)志。23 .主題指南按字母順序列出與分類表中類目名稱相關(guān)的主題詞, 并注明相關(guān)的分類號, 實(shí)際上是分類表的主題索引, 是從分類途徑檢索文獻(xiàn)的指南。 便于不能確定分類號的讀者實(shí)現(xiàn)從主題查到分類號,再由分類號查到文獻(xiàn)所在頁碼。24 .sci (科學(xué)引文索引)的編制結(jié)構(gòu)及檢索方法( 1 )引文索引( 2 )來源索引( 3 )機(jī)構(gòu)索引( 4 )輪排主題索引25 .如何
13、決定收錄期刊的數(shù)量和種類?(1) “加菲爾德文獻(xiàn)集中定律”確定適宜的期刊數(shù)量該定律認(rèn)為:在幾萬種科技期刊中,最重要的期刊(即核心期刊)不過一千種,甚至可能還不足 500 。因而,把收錄期刊的范圍定在3000 種以內(nèi),足以把重要的科技文獻(xiàn)包括在內(nèi)。( 2 ) “費(fèi)用效果原則”用來選擇每一種期刊,具體方法是“引用頻率統(tǒng)計(jì)法”先計(jì)算一種期刊在一年內(nèi)被引用的總次數(shù),再計(jì)算其中每篇論文的平均引文章,其他因素對引文章的影響通過加某些修正系數(shù)來解決,引用頻率越高,說明該刊質(zhì)量越高。通過上述兩個(gè)指標(biāo)決定了收錄期刊的數(shù)量和種類26 .什么是專利?這種受法律保護(hù)的發(fā)明就稱專利。含義:專利權(quán)法律受專利法保護(hù)的發(fā)明創(chuàng)
14、造專利技術(shù)專利說明書等專利文獻(xiàn)文獻(xiàn) 這三層含義的核心是受專利法保護(hù)的發(fā)明,而專利權(quán)和專利文獻(xiàn)是專利的具體表現(xiàn)。27 .什么是同族專利?同族專利指同一個(gè)發(fā)明為了在不同國家得到保護(hù), 而在這些國家分別申請的一系列內(nèi)容相同或基本相同的專利。 由于同族專利或相同專利都具有相同的優(yōu)先權(quán)項(xiàng), 所以通過優(yōu)先權(quán)項(xiàng)可以方便、快捷地檢索出有關(guān)同一發(fā)明的全部相同專利或同族專利。28 .專利的類型( 1 )發(fā)明專利( 2 )實(shí)用新型專利( 3 )外觀設(shè)計(jì)專利( 4 )植物性專利( 5 )防衛(wèi)性專利知識產(chǎn)權(quán):工業(yè)產(chǎn)權(quán)和著作產(chǎn)權(quán)29 .學(xué)位論文的文獻(xiàn)價(jià)值:( 1 )較高價(jià)值的一次文獻(xiàn):寫作不受篇幅限制,論述詳盡:從研究背景、技術(shù)線路、實(shí)驗(yàn)方法到數(shù)據(jù)獲取、分析結(jié)論論述翔實(shí)。( 2 )珍貴的信息資源價(jià)值:能集中反映所在單位的科研領(lǐng)域、學(xué)術(shù)活動(dòng)、研究進(jìn)展和最新成果,論文的使用者可以跟蹤名校導(dǎo)師的科研進(jìn)程。( 3 )綜述性二次文獻(xiàn):對相應(yīng)研究領(lǐng)域有系統(tǒng)深入的討論和綜述, 擁有詳盡的參考文獻(xiàn),可得到課題研究現(xiàn)狀綜述。( 4 )寫作技巧的啟發(fā)藍(lán)本:通過對學(xué)位論文的閱讀,可大致梳理出作者的寫作思路和研究方法,學(xué)習(xí)學(xué)位論文的寫作方法。30 .信息檢索評價(jià)方法( 1 )測試文檔集合法( 2 )人機(jī)交互( 3
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 公司放歌活動(dòng)策劃方案
- 公司搬家宣傳策劃方案
- 公司禮物年會(huì)策劃方案
- 公司直播周年慶活動(dòng)方案
- 公司秋游文體活動(dòng)方案
- 公司組織掰手腕活動(dòng)方案
- 財(cái)務(wù)管理在未來環(huán)境下的2025年試題及答案
- 拓展知識-滅火器的報(bào)廢要求
- 2025年信息技術(shù)基礎(chǔ)知識摩擦之知考試試卷及答案
- 2025年商業(yè)分析師職業(yè)素養(yǎng)測評試題及答案
- 小學(xué)科學(xué)實(shí)驗(yàn)報(bào)告單空表
- 10kV~500kV輸變電及配電工程質(zhì)量驗(yàn)收與評定標(biāo)準(zhǔn):01輸電線路工程
- 子宮內(nèi)膜癌內(nèi)分泌治療課件
- 稅務(wù)行政處罰文書(標(biāo)準(zhǔn)版)
- 第三章葡萄酒釀造2
- 每天100道語法填空題過高考英語高頻詞匯12
- 配電室巡檢記錄表
- 數(shù)字程控交換機(jī)系統(tǒng)技術(shù)規(guī)范書
- 卓越績效評價(jià)準(zhǔn)則概述(專業(yè)性權(quán)威性實(shí)用性)
- GB 1886.20-2016食品安全國家標(biāo)準(zhǔn)食品添加劑氫氧化鈉
- 國資進(jìn)場交易工作流程講座
評論
0/150
提交評論