信息檢索之檢索語(yǔ)言_第1頁(yè)
信息檢索之檢索語(yǔ)言_第2頁(yè)
信息檢索之檢索語(yǔ)言_第3頁(yè)
信息檢索之檢索語(yǔ)言_第4頁(yè)
信息檢索之檢索語(yǔ)言_第5頁(yè)
已閱讀5頁(yè),還剩22頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、信息檢索的原理l 4、分類語(yǔ)言的依據(jù)和特征,課題概念分、分類語(yǔ)言的依據(jù)和特征,課題概念分類的方法。類的方法。l 5主題檢索語(yǔ)言和關(guān)鍵詞檢索語(yǔ)言的主要主題檢索語(yǔ)言和關(guān)鍵詞檢索語(yǔ)言的主要區(qū)別是什么區(qū)別是什么?l 6、什么是數(shù)據(jù)庫(kù)?文獻(xiàn)型數(shù)據(jù)庫(kù)的結(jié)構(gòu)、什么是數(shù)據(jù)庫(kù)?文獻(xiàn)型數(shù)據(jù)庫(kù)的結(jié)構(gòu)l 7、布爾邏輯檢索有哪幾種,其功能是什、布爾邏輯檢索有哪幾種,其功能是什么么?分類語(yǔ)言的依據(jù)和特征,課題概念分類的方法。 檢索語(yǔ)言檢索語(yǔ)言分類語(yǔ)言關(guān)鍵詞敘詞主題語(yǔ)言 檢索語(yǔ)言檢索語(yǔ)言是應(yīng)文獻(xiàn)信息的加工、存儲(chǔ)和檢索的共同需要而編制的專門語(yǔ)言,是表達(dá)一系列概括文獻(xiàn)信息內(nèi)容和檢索課題內(nèi)容的概念及其相互關(guān)系的一種概念標(biāo)識(shí)系統(tǒng)。

2、 什么是什么是檢索語(yǔ)言檢索語(yǔ)言?什么是分類語(yǔ)言? 分類語(yǔ)言分類語(yǔ)言也稱分類法。用分類號(hào)和相應(yīng)的分類款目來(lái)表達(dá)各種概念,以學(xué)科體系為基礎(chǔ)將各種概念按學(xué)科性質(zhì)和邏輯層次結(jié)構(gòu)進(jìn)行分類和系統(tǒng)排序,能反映事物的從屬派生關(guān)系,便于按學(xué)科門類進(jìn)行族性檢索。按照分類方式的不同,分類語(yǔ)言又分為體系分類語(yǔ)言、組配分類語(yǔ)言和混合分類語(yǔ)言。 分類語(yǔ)言的依據(jù)l中國(guó)分類法中國(guó)分類法l專利分類法專利分類法l標(biāo)準(zhǔn)分類法標(biāo)準(zhǔn)分類法中國(guó)分類法標(biāo)準(zhǔn)分類法A 綜合0009 標(biāo)準(zhǔn)化管理與一般規(guī)定1019 經(jīng)濟(jì)、文化2039 基礎(chǔ)標(biāo)準(zhǔn)4049 基礎(chǔ)學(xué)科5064 計(jì)量6574 標(biāo)準(zhǔn)物質(zhì)7579 測(cè)繪B 農(nóng)業(yè)林業(yè)0009 農(nóng)業(yè)、林業(yè)綜合10

3、14 土壤與肥料1519 植物保護(hù)2029 糧食與飼料作物3039 經(jīng)濟(jì)作物4049 畜牧5059 水產(chǎn)、漁業(yè)分類語(yǔ)言的特征 1.表達(dá)文獻(xiàn)外部特征的檢索語(yǔ)言2.表達(dá)文獻(xiàn)內(nèi)部特征的檢索語(yǔ)言(一)表達(dá)文獻(xiàn)外部特征的檢索(一)表達(dá)文獻(xiàn)外部特征的檢索語(yǔ)言語(yǔ)言 表達(dá)文獻(xiàn)外部特征的檢索語(yǔ)言主要是指文獻(xiàn)的篇名(題目)、作者姓名、出版者、報(bào)告號(hào)、專利號(hào)等。將不同的文獻(xiàn)按照篇名、作者名稱的字序進(jìn)行排列,或者按照?qǐng)?bào)告號(hào)、專利號(hào)的數(shù)序進(jìn)行排列,所形成的以篇名、作者及號(hào)碼的檢索途徑來(lái)滿足用戶需求的檢索語(yǔ)言。描述文獻(xiàn)外表特征的檢索語(yǔ)言可簡(jiǎn)要概述為:題名、著者、文獻(xiàn)編號(hào)等索引。(二)表達(dá)文獻(xiàn)內(nèi)部特征的檢索語(yǔ)言 1. 分類

4、語(yǔ)言分類語(yǔ)言是指以數(shù)字、字母或字母與數(shù)字結(jié)合作為基本字符,采用字符直接連接并以圓點(diǎn)(或其他符號(hào))作為分隔符的書(shū)寫法,以基本類目作為基本詞匯,以類目的從屬關(guān)系來(lái)表達(dá)復(fù)雜概念的一類檢索語(yǔ)言。以知識(shí)屬性來(lái)描述和表達(dá)信息內(nèi)容的信息處理以知識(shí)屬性來(lái)描述和表達(dá)信息內(nèi)容的信息處理方法稱為分類法方法稱為分類法。課題概念分類l單單概念課題概念課題l多概念課題多概念課題l上位類分類法上位類分類法主題檢索語(yǔ)言和關(guān)鍵詞檢索語(yǔ)言的主要區(qū)別是什么? 主題詞與關(guān)鍵詞最大的主題詞與關(guān)鍵詞最大的區(qū)別區(qū)別就是就是主題詞經(jīng)過(guò)了規(guī)范主題詞經(jīng)過(guò)了規(guī)范化處理化處理。 主題詞主題詞是規(guī)范化的檢索語(yǔ)言,它對(duì)文獻(xiàn)中出現(xiàn)的同義詞、近義詞、多義詞

5、以及同一概念的不同書(shū)寫形式等進(jìn)行嚴(yán)格的控制和規(guī)范,使每個(gè)主題詞都含義明確,以便準(zhǔn)確檢索,防止誤檢、漏檢。如:白介素2、白細(xì)胞介素2、IL2、IL-2等表達(dá)同一概念的不同書(shū)寫形式規(guī)范為“白細(xì)胞介素2”。 。 l 主題詞主題詞表是對(duì)主題詞進(jìn)行規(guī)范化處理的依據(jù),也是對(duì)主題詞進(jìn)行規(guī)范化處理的依據(jù),也是文獻(xiàn)處理者和檢索者共同參照的依據(jù)。文獻(xiàn)處理者和檢索者共同參照的依據(jù)。l 關(guān)鍵詞關(guān)鍵詞是屬于自然語(yǔ)言的范疇,未經(jīng)規(guī)范化處理,屬于自然語(yǔ)言的范疇,未經(jīng)規(guī)范化處理,也不受主題詞表的控制。也不受主題詞表的控制。如:對(duì)于“白細(xì)胞介素2”這一概念可有白介素2、白細(xì)胞介素2、IL2、IL-2等不同形式來(lái)表達(dá)。 因此,為

6、了達(dá)到較高的查準(zhǔn)率和查全率,如果檢索工具提供了主題詞這一檢索途徑的話就應(yīng)該選擇主題詞來(lái)進(jìn)行檢索,而不應(yīng)該選擇關(guān)鍵詞。 例如:利用MEDLINE光盤數(shù)據(jù)庫(kù)檢索有關(guān)“肝腫瘤”方面的文獻(xiàn)。 MEDLINE光盤數(shù)據(jù)庫(kù)既提供了主題詞途徑,也提供了自由詞(關(guān)鍵詞)途徑。如果選擇關(guān)鍵詞途徑來(lái)進(jìn)行檢索,欲達(dá)到較高的查準(zhǔn)率和查全率,就得查找“l(fā)iver cancer”、“l(fā)iver carcinoma”、“l(fā)iver neoplasm”、“l(fā)iver tumor”、“hepatic cancer”、“hepatic carcinoma”、“hepatic neoplasm”、“hepatic tumor”等詞,

7、另外還得考慮像cancer、carcinoma、neoplasm、tumor等詞還有復(fù)數(shù)形式;而如果選擇主題詞途徑進(jìn)行檢索就只需查找“l(fā)iver neoplasms”一詞就行了,這一詞就包括了以上所提及的不同的表達(dá)形式。由此可見(jiàn),選用主題詞途徑檢索,既能滿足較高的查準(zhǔn)率、查全率,又能提高檢索速度,何樂(lè)而不為呢?什么是數(shù)據(jù)庫(kù)?文獻(xiàn)數(shù)據(jù)庫(kù)的結(jié)構(gòu). 數(shù)據(jù)庫(kù)的定義數(shù)據(jù)庫(kù)的定義 數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)是指至少由一種文檔組成,能滿足特定目的的或特定功能數(shù)據(jù)處理系統(tǒng)需要的數(shù)據(jù)集合。在計(jì)算機(jī)情報(bào)檢索系統(tǒng)中,多數(shù)數(shù)據(jù)庫(kù)為關(guān)系型數(shù)據(jù)庫(kù)。 數(shù)據(jù)庫(kù)的類型數(shù)據(jù)庫(kù)的類型 按照數(shù)據(jù)庫(kù)所含信息內(nèi)容的不同,文獻(xiàn)數(shù)據(jù)庫(kù)可分為文字型、數(shù)值型

8、和多媒體型文字型、數(shù)值型和多媒體型 多媒體型數(shù)據(jù)庫(kù)多媒體型數(shù)據(jù)庫(kù)是指含有字符、聲音、圖像信息的數(shù)據(jù)庫(kù)。這種數(shù)據(jù)庫(kù)一般為超文本結(jié)構(gòu)。他們既可以用于查找相文獻(xiàn)信息,也可以用于查找特定的屬性值、聲音和圖像。 文字型數(shù)據(jù)庫(kù)文字型數(shù)據(jù)庫(kù)是指以文字字符為主要記錄內(nèi)容的數(shù)據(jù)庫(kù),包括書(shū)目型、事實(shí)型、百科全書(shū)型、詞庫(kù)型和全文型數(shù)據(jù)庫(kù)。這類數(shù)據(jù)庫(kù)主要用于查找相關(guān)文獻(xiàn)信息。 數(shù)值型數(shù)據(jù)庫(kù)數(shù)值型數(shù)據(jù)庫(kù)包括來(lái)自科學(xué)研究,原始文獻(xiàn)或者調(diào)查研究的各種數(shù)值型或圖表型數(shù)據(jù)庫(kù)。這類數(shù)據(jù)庫(kù)主要用于查找確定對(duì)象的特定數(shù)值信息。數(shù)據(jù)庫(kù)的成數(shù)據(jù)庫(kù)的成 從使用者觀點(diǎn)觀察,數(shù)據(jù)庫(kù)主要由“-記錄-字段-”三個(gè)層次構(gòu)成。 文檔文檔從數(shù)據(jù)庫(kù)的內(nèi)部

9、來(lái)看,文檔的概念是指數(shù)據(jù)庫(kù)內(nèi)容的組織形式。一般地說(shuō),一個(gè)數(shù)據(jù)庫(kù)至少包括一個(gè)順排文檔和一個(gè)倒排文檔 記錄記錄是文檔的基本單元。他是對(duì)某一實(shí)體的全部屬性進(jìn)行描述的結(jié)果。在全文數(shù)據(jù)庫(kù)中,一個(gè)記錄相當(dāng)于一篇完整的文獻(xiàn):在書(shū)目數(shù)據(jù)庫(kù)中,一個(gè)記錄相當(dāng)于一條文摘或題錄。 字段是記錄的基本單元。它是對(duì)實(shí)體的具體屬性進(jìn)行描述的結(jié)果。在書(shū)目數(shù)據(jù)庫(kù)中,記錄含有的題名、作者、出版年、主題詞、文摘等字段。 根據(jù)與文獻(xiàn)內(nèi)容相關(guān)與否,文獻(xiàn)數(shù)據(jù)庫(kù)的字段通常分為基本字段和輔助字段兩類。 基本字段包括題名、文摘、關(guān)鍵詞等,是與文獻(xiàn)內(nèi)容相關(guān)的字段。輔助字段包括作者、著這單位和期刊名稱等,是與文獻(xiàn)內(nèi)容基本相關(guān)的字段。 記錄實(shí)例 作者

10、: 趙少慶 篇名:信息技術(shù)對(duì)公共行政的影響論綱。 文章出處:國(guó)家行政管理學(xué)雜志,2005.12(5) : 345-347 內(nèi)容摘要:社會(huì)信息化是當(dāng)代社會(huì)的一種大趨勢(shì),他正推動(dòng)著公共行政現(xiàn)在化的進(jìn)展。信息技術(shù)發(fā)展對(duì)諸如行政人員、行政決策、行政組織、行政方法、行政公文、行政管理模式等公共行政管理要素和過(guò)程產(chǎn)生著深遠(yuǎn)影響。布爾邏輯檢索有哪幾種,其功能是什么? 常用的布爾邏輯算符有三種三種,分別是:邏輯“與與” ( “AND”、“*”)邏輯“或或”(“OR”、“+”)邏輯“非非”(“NOT”、“-”)1. 布爾邏輯算符:邏輯與 組配方式:AandB或者A*B,表示兩個(gè)概念的交叉和和限定關(guān)系。l作用作用:檢所包含所有關(guān)鍵字的數(shù)據(jù)。縮小檢索l結(jié)果結(jié)果:增加檢索專指,提高差準(zhǔn)率。l實(shí)例:aspartame AND cancer布爾邏輯算符:邏輯或 組配方式:A OR B或者A+b,表示檢索結(jié)果含有A或含有B,或同時(shí)包含A,B兩個(gè)概念的文獻(xiàn)。它主要應(yīng)用于概念之間的并列關(guān)系。 1作用作用:檢索“微量元素銅、鐵、鋅與兒童營(yíng)養(yǎng)不良”的文獻(xiàn)(銅OP鐵OR鋅)AND(嬰兒OR幼兒OR兒童)AND營(yíng)養(yǎng)不良 2 例如例如:aspartame O R saccharine

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論