信息檢索與應(yīng)用基礎(chǔ)知識(shí)_第1頁(yè)
信息檢索與應(yīng)用基礎(chǔ)知識(shí)_第2頁(yè)
信息檢索與應(yīng)用基礎(chǔ)知識(shí)_第3頁(yè)
信息檢索與應(yīng)用基礎(chǔ)知識(shí)_第4頁(yè)
信息檢索與應(yīng)用基礎(chǔ)知識(shí)_第5頁(yè)
已閱讀5頁(yè),還剩35頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、信息檢索與應(yīng)用基礎(chǔ)知識(shí)內(nèi)容提要 信息和信息檢索的定義 信息檢索語(yǔ)言 信息檢索工具 信息檢索途徑 信息檢索技術(shù)信息的定義 信息信息:是客觀事物存在的方式或運(yùn)動(dòng)狀態(tài),以及關(guān)于客觀 存在方式或運(yùn)動(dòng)狀態(tài)的陳述。 知識(shí)知識(shí):知識(shí)是人們對(duì)客觀事物存在和運(yùn)動(dòng)規(guī)律的認(rèn)識(shí)。 文獻(xiàn)文獻(xiàn):任何人類(lèi)的知識(shí)用文字、圖形、符號(hào)、聲頻、視頻 的手段記錄下來(lái)的東西。統(tǒng)統(tǒng)可稱(chēng)為文獻(xiàn)。 文獻(xiàn)也可稱(chēng)為固化在一定載體上的知識(shí)。信息、文獻(xiàn)、知識(shí)之間的聯(lián)系信息信息文獻(xiàn)文獻(xiàn)知識(shí)知識(shí)文獻(xiàn)信息圖書(shū)期刊會(huì)議文獻(xiàn)學(xué)位論文專(zhuān)利文獻(xiàn)標(biāo)準(zhǔn)文獻(xiàn)研究報(bào)告政府出版物產(chǎn)品樣本技術(shù)檔案信息檢索的定義 信息檢索(信息檢索(Information Retrieval

2、) 廣義:將信息按一定的方式組織和存儲(chǔ)起來(lái),并根據(jù)用戶(hù) 的需要找出有關(guān)信息的過(guò)程和技術(shù)。 全稱(chēng)“信息存儲(chǔ)與檢索” (InformationStorageandRetrieval)。 狹義:從信息集合中找出所需要的信息的過(guò)程。又相當(dāng)于“信息查尋”(InformationSearch)。文獻(xiàn)檢索文獻(xiàn)檢索 是以文獻(xiàn)為檢索對(duì)象,從已存貯的文獻(xiàn)庫(kù)中查找特定文獻(xiàn)的過(guò)程。事實(shí)檢索事實(shí)檢索 是以事實(shí)為檢索對(duì)象,查找某一事物發(fā)生的時(shí)間、地點(diǎn)及過(guò)程。數(shù)據(jù)檢索數(shù)據(jù)檢索 是以數(shù)據(jù)為檢索對(duì)象的一種檢索,包括數(shù)值、公式、圖表等。在這個(gè)大數(shù)據(jù)時(shí)代,數(shù)據(jù)檢索尤為重要。信息級(jí)別一次信息一次信息 又稱(chēng)原始信息,著者本人研究并公開(kāi)

3、發(fā)表或出版的信息。信息檢索最終目的就是查找到最適用的一次信息二次信息二次信息 對(duì)一次信息進(jìn)行整理和濃縮,并按外部特征(題名、著者)或內(nèi)容特征(分類(lèi)號(hào)、主題詞)將其“有序化”,形成新的信息形式。信息檢索主要講述二次信息的編排體系和使用方法三次信息三次信息 利用二次信息,選擇有關(guān)的一次信息加以分析、綜合而編纂出的第三層次的信息形式。三次信息具有系統(tǒng)性、綜合性、知識(shí)性和概括性的特點(diǎn)一次信息一次信息二次信息二次信息三次信息三次信息知知識(shí)識(shí)產(chǎn)產(chǎn)生生記記錄錄檔檔 案案學(xué)位論文學(xué)位論文標(biāo)標(biāo) 準(zhǔn)準(zhǔn)科技報(bào)告科技報(bào)告專(zhuān)利說(shuō)明書(shū)專(zhuān)利說(shuō)明書(shū)會(huì)議論文會(huì)議論文期刊論文期刊論文專(zhuān)專(zhuān) 著著目目 錄錄索索 引引文文 摘摘傳傳播

4、播信信息息利利用用述述 評(píng)評(píng)綜綜 述述詞詞 典典年年 鑒鑒手手 冊(cè)冊(cè)百科全書(shū)百科全書(shū)內(nèi)容提要 信息和信息檢索的定義 信息檢索語(yǔ)言 信息檢索工具 信息檢索途徑 信息檢索技術(shù)信息檢索語(yǔ)言的定義 信息檢索語(yǔ)言信息檢索語(yǔ)言:是應(yīng)文獻(xiàn)信息的加工、存貯和檢索的共同需要而編制的專(zhuān)門(mén)語(yǔ)言,它是表達(dá)一系列概括文獻(xiàn)信息內(nèi)容和檢索課題內(nèi)容的概念及其相互關(guān)系的一種概念標(biāo)識(shí)系統(tǒng)。是一種人工語(yǔ)言。 有分類(lèi)檢索語(yǔ)言分類(lèi)檢索語(yǔ)言和主題檢索語(yǔ)言主題檢索語(yǔ)言?xún)煞N。分類(lèi)檢索語(yǔ)言(以中圖法為例) 中圖法中圖法 五個(gè)部類(lèi): 馬克思主義、列寧思想、毛澤東思想;哲學(xué);社會(huì)科學(xué);自然科學(xué);綜合性圖書(shū)。22個(gè)大類(lèi)(一級(jí)類(lèi)目)采用字母與數(shù)字相結(jié)

5、合的方式編制建議總結(jié)Proposals中圖法中圖法主題檢索語(yǔ)言 主題檢索語(yǔ)言:關(guān)鍵詞檢索語(yǔ)言關(guān)鍵詞檢索語(yǔ)言和標(biāo)題詞檢索語(yǔ)言標(biāo)題詞檢索語(yǔ)言。 關(guān)鍵詞檢索語(yǔ)言:關(guān)鍵詞是指那些出現(xiàn)在文獻(xiàn)的標(biāo)題(篇名、章節(jié)名)以及摘要、正文中,對(duì)表征文獻(xiàn)主題內(nèi)容具有實(shí)質(zhì)檢索意義的詞,亦即對(duì)揭示和描述主題內(nèi)容來(lái)說(shuō)是重要的、帶關(guān)鍵性的可以作為檢索“入口”的那些詞。 標(biāo)題詞檢索語(yǔ)言:標(biāo)題詞是指表征文獻(xiàn)內(nèi)容特征的、經(jīng)過(guò)規(guī)范化了的名詞術(shù)語(yǔ)(包括詞組和短語(yǔ))。標(biāo)題詞語(yǔ)言是先組式檢索語(yǔ)言,組配固定,不易混亂,標(biāo)題詞表是標(biāo)題詞及其使用規(guī)則的匯編,是一部標(biāo)題詞詞典。內(nèi)容提要 信息和信息檢索的定義 信息檢索語(yǔ)言 信息檢索工具 信息檢索途

6、徑 信息檢索技術(shù)信息檢索工具 信息檢索工具信息檢索工具是根據(jù)某種信息需要而按照一定的規(guī)則組織編制的工具或系統(tǒng)。傳統(tǒng)的信息檢索工具如字典、百科全書(shū)、文摘、書(shū)目、索引等,現(xiàn)在流行的檢索工具如數(shù)據(jù)庫(kù)、搜索引擎、專(zhuān)業(yè)性網(wǎng)站等。具備的4個(gè)條件個(gè)條件: 1.對(duì)所收錄信息的各種特征要有詳細(xì)的描述; 2.每條描述記錄都標(biāo)明有可供檢索用的標(biāo)識(shí); 3.全部描述記錄科學(xué)地組織成一個(gè)有機(jī)的整體; 4.具有多種必要的檢索手段。信息檢索工具的分類(lèi)信息檢信息檢索工具索工具目錄目錄題錄題錄索引索引文摘文摘參考工參考工具書(shū)具書(shū)搜索引搜索引擎擎數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)按著錄信息特征分按著錄信息特征分目錄型檢索工具一切可供檢索使用的目錄均可稱(chēng)

7、為目錄型檢索工具。它主要報(bào)道信息的外表特征,著錄具體出版事宜及其收藏信息。常見(jiàn)的目錄按其收錄范圍可以分為國(guó)家目錄、聯(lián)合目錄、館藏目錄;按報(bào)道的范圍分為綜合性目錄和專(zhuān)題性目錄。索引型檢索工具將信息的外部特征或內(nèi)部特征(例如題名、著者、主題、分類(lèi)等)用各種檢索語(yǔ)言進(jìn)行描述,并將它們按照一定的方法組織起來(lái),用戶(hù)根據(jù)查處的線索可以進(jìn)一步查找原始信息內(nèi)容的工具。索引與目錄的區(qū)別在于它不僅能揭示信息的外部特征,還能揭示信息的內(nèi)部特征。常見(jiàn)的索引有主題索引、分類(lèi)索引和關(guān)鍵詞索引。文摘型檢索工具文摘一般由題錄和內(nèi)容摘要兩部分組成,它在描述信息外部特征的基礎(chǔ)上,還增加有揭示內(nèi)容特征的摘要部分,是系統(tǒng)地報(bào)道、積累

8、和檢索信息的主要檢索工具,也是傳統(tǒng)檢索工具的核心。按文摘的目的和用途劃分,它可以分為報(bào)道性文摘、指示性文摘、報(bào)道指示性文摘和評(píng)論性文摘。數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)包括目錄、索引、文摘、搜索引擎等工具的內(nèi)容,但是由于其組織的特殊性,也可以認(rèn)為是一種檢索工具。參考工具書(shū)參考工具書(shū)是分析和著錄大量具體而常用的科學(xué)數(shù)據(jù)庫(kù)與事實(shí)以備查用的各種常用工具書(shū)的總稱(chēng)。其中包括字典、詞典、年鑒、百科全書(shū)、指南、手冊(cè)、名錄等。搜索引擎將網(wǎng)絡(luò)信息分門(mén)別類(lèi)地組織起來(lái),通過(guò)搜索網(wǎng)址的方式來(lái)實(shí)現(xiàn)信息檢索的工具就是搜索引擎。它是一種網(wǎng)絡(luò)檢索工具,檢索到的既可以是一般的信息線索,也可以是原始信息全文,既可以是一般的文本信息,也可以是多媒體信

9、息。信息檢索工具的分類(lèi)信息檢信息檢索工具索工具綜合性檢綜合性檢索工具索工具專(zhuān)業(yè)性檢專(zhuān)業(yè)性檢索工具索工具單一性檢單一性檢索工具索工具按收錄范圍分按收錄范圍分綜合性檢索工具收錄的學(xué)科范圍較廣,涉及的信息種類(lèi)和語(yǔ)種也比較多。例如,美國(guó)的工程索引Ei專(zhuān)業(yè)性檢索工具收錄的學(xué)科范圍比較窄,僅限于報(bào)道某學(xué)科或?qū)I(yè)的信息,但收錄該學(xué)科信息的類(lèi)型比較全。例如,美國(guó)的化學(xué)學(xué)會(huì)電子期刊數(shù)據(jù)庫(kù)ACS單一性檢索工具指收錄的文獻(xiàn)類(lèi)型比較單一,文獻(xiàn)的著錄格式也標(biāo)準(zhǔn)、規(guī)范。例如中國(guó)專(zhuān)利公報(bào),就是典型的單一性檢索工具,它僅僅收錄單一的文獻(xiàn)類(lèi)型專(zhuān)利文獻(xiàn),著錄格式簡(jiǎn)單規(guī)范,易于查找。內(nèi)容提要 信息和信息檢索的定義 信息檢索語(yǔ)言 信

10、息檢索工具 信息檢索途徑 信息檢索技術(shù)信息檢索途徑信息檢索途徑信息檢索途徑內(nèi)部特征途徑內(nèi)部特征途徑分類(lèi)途徑分類(lèi)途徑主題途徑主題途徑外部特征途徑外部特征途徑題名途徑題名途徑著者途徑著者途徑引文途徑引文途徑序號(hào)途徑序號(hào)途徑代碼途徑代碼途徑內(nèi)部特征途徑 分類(lèi)途徑分類(lèi)途徑:按學(xué)科分類(lèi)體系來(lái)檢索文獻(xiàn)。 主題途徑主題途徑:通過(guò)反映文獻(xiàn)資料內(nèi)容的主題詞來(lái)檢索文獻(xiàn)。 外部特征途徑題名途徑題名途徑:題名包括書(shū)名、刊名等。著者途徑著者途徑:從著者、編者、譯者、專(zhuān)利權(quán)人的姓名或機(jī)關(guān)團(tuán)體名稱(chēng)字順進(jìn)行檢索的途徑統(tǒng)稱(chēng)為著者途徑。引文途徑:引文途徑:文獻(xiàn)所附參考文獻(xiàn)或引用文獻(xiàn),是文獻(xiàn)的外表特征之一。利用這種引文而編制的索引

11、系統(tǒng),稱(chēng)為引文索引系統(tǒng),它提供從被引論文去檢索引用論文的一種途徑,稱(chēng)為引文途徑。序號(hào)途徑:序號(hào)途徑:有些文獻(xiàn)有特定的序號(hào),如專(zhuān)利號(hào)、報(bào)告號(hào)、合同號(hào)、標(biāo)準(zhǔn)號(hào)、國(guó)際標(biāo)準(zhǔn)書(shū)號(hào)和刊號(hào)等。文獻(xiàn)序號(hào)對(duì)于識(shí)別一定的文獻(xiàn),具有明確、簡(jiǎn)短、唯一性特點(diǎn)。依此編成的各種序號(hào)索引可以提供按序號(hào)自身順序檢索文獻(xiàn)信息的途徑。代碼途徑:代碼途徑:利用事物的某種代碼編成的索引,如分子式索引、環(huán)系索引等,可以從特定代碼順序進(jìn)行檢索。內(nèi)容提要 信息和信息檢索的定義 信息檢索語(yǔ)言 信息檢索工具 信息檢索途徑 信息檢索技術(shù)信息檢索技術(shù) 布爾邏輯檢索技術(shù)布爾邏輯檢索技術(shù):指利用布爾邏輯運(yùn)算符連接各個(gè)檢索詞,然后由計(jì)算機(jī)進(jìn)行相應(yīng)邏輯運(yùn)算

12、,以找出所需信息的方法。 截詞檢索技術(shù)截詞檢索技術(shù):截詞是指在檢索詞的合適位置進(jìn)行截?cái)?,然后使用截詞符進(jìn)行處理,這樣既可節(jié)省輸入的字符數(shù)目,又可達(dá)到較高的查全率。布爾邏輯檢索技術(shù)邏輯與邏輯與 “AND”和和“ * ” 用AND和 *表示??捎脕?lái)表示其所連接的兩個(gè)檢索項(xiàng)的交叉部分,也即交集部分。 如果用AND連接檢索詞A和檢索詞B,則檢索式為:AANDB(或A*B):表示讓系統(tǒng)檢索同時(shí)包含檢索詞A和檢索詞B的信息集合C。布爾邏輯檢索技術(shù)邏輯或邏輯或 “OR”和和 “+” 用OR或+表示。用于連接并列關(guān)系的檢索詞。用OR連接檢索詞A和檢索詞B,則檢索式為:AORB或(A+B)。表示讓系統(tǒng)查找含有檢

13、索詞A、B之一,或同時(shí)包括檢索詞A和檢索詞B的信息。布爾邏輯檢索技術(shù)邏輯邏輯非非 “NOT”和和“ ” 用NOT或-號(hào)表示。用于連接排除關(guān)系的檢索詞,即排除不需要的和影響檢索結(jié)果的概念。用NOT連接檢索詞A和檢索詞B,檢索式為:ANOTB(或A-B)。表示檢索含有檢索詞A而不含檢索詞B的信息,即將包含檢索詞B的信息集合排除掉。截詞檢索技術(shù)截詞檢截詞檢索技術(shù)索技術(shù)前截?cái)嗲敖財(cái)嘀薪財(cái)嘀薪財(cái)嗪蠼財(cái)嗪蠼財(cái)嘟卦~算符在不同的系統(tǒng)中有不同的表達(dá)形式,需要說(shuō)明的是不同的截詞算符在不同的系統(tǒng)中有不同的表達(dá)形式,需要說(shuō)明的是不同的系統(tǒng)所用的截詞符也不同,常用的有系統(tǒng)所用的截詞符也不同,常用的有?、$、*等。分為等。分為有限有限截詞截詞(即一個(gè)截詞符只代表一個(gè)字符)和無(wú)限截詞(一個(gè)截詞符可代表(即一個(gè)截詞符只代表一個(gè)字符)和無(wú)限截詞(一個(gè)截詞符可代表多個(gè)字符)。多個(gè)字符)。截詞檢索技術(shù)無(wú)限截詞舉例 前截?cái)嗲敖財(cái)啵汉蠓揭恢隆?如:?computer表示minicomputer,microcomputer等

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論