計(jì)算機(jī)檢索原理_第1頁(yè)
計(jì)算機(jī)檢索原理_第2頁(yè)
計(jì)算機(jī)檢索原理_第3頁(yè)
計(jì)算機(jī)檢索原理_第4頁(yè)
計(jì)算機(jī)檢索原理_第5頁(yè)
已閱讀5頁(yè),還剩9頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、n計(jì)算機(jī)檢索概述1.計(jì)算機(jī)檢索的發(fā)展2.計(jì)算機(jī)檢索的原理3.數(shù)據(jù)庫(kù)簡(jiǎn)介4.計(jì)算機(jī)檢索中常用的運(yùn)算符5.計(jì)算機(jī)檢索策略的制定及調(diào)整1.計(jì)算機(jī)檢索的發(fā)展n分4個(gè)階段n(1)20世紀(jì)50年代,以批量處理、脫機(jī)檢索為特點(diǎn)的第一階段n(2)20世紀(jì)60年代末,以聯(lián)機(jī)檢索為特點(diǎn)的第二階段n(3) 20世紀(jì)70年代,以聯(lián)機(jī)檢索為特點(diǎn)、伴隨光盤檢索異軍突起的第三階段n(4)20世紀(jì)90年代,基于互連網(wǎng)的數(shù)據(jù)庫(kù)檢索和Internet網(wǎng)上信息檢索并重的第四階段 2.計(jì)算機(jī)檢索的原理 計(jì)算機(jī)檢索的原理就是利用計(jì)算機(jī)將用戶所提出的檢索標(biāo)識(shí)與檢索系統(tǒng)中的標(biāo)引標(biāo)識(shí)進(jìn)行比較,并將匹配的文獻(xiàn)提出作為命中。標(biāo)引標(biāo)識(shí)是在信息加工

2、過(guò)程中產(chǎn)生的。標(biāo)引就是將信息中的具有檢索特征的詞語(yǔ)或標(biāo)志抽出并按照一定的規(guī)范制成索引的過(guò)程。檢索標(biāo)識(shí)是檢索者根據(jù)對(duì)課題的分析,制定出的既能反映課題的要求,又符合計(jì)算機(jī)檢索要求的檢索語(yǔ)言,其中包括適當(dāng)?shù)臋z索詞,以及合適的邏輯算符和位置算符。3.文獻(xiàn)數(shù)據(jù)庫(kù)簡(jiǎn)介n數(shù)據(jù)庫(kù)的定義和類型n一.定義:至少由一種文檔組成,并能滿足某一特定的目的或某一特定數(shù)據(jù)處理系統(tǒng)所需要的一種數(shù)據(jù)集合。n二.數(shù)據(jù)庫(kù)類型:1.文獻(xiàn)目錄型數(shù)據(jù)庫(kù)(bibliographic database). 也稱為書目數(shù)據(jù)庫(kù)或者目錄數(shù)據(jù)庫(kù),是二次文獻(xiàn)數(shù)據(jù)庫(kù),包含文摘數(shù)據(jù)庫(kù)、題錄數(shù)據(jù)庫(kù)、索引數(shù)據(jù)庫(kù)、各國(guó)的MARC格式的圖書目錄。2.指南數(shù)據(jù)庫(kù)(

3、reference databases).也稱指示性數(shù)據(jù)庫(kù),其內(nèi)容是關(guān)于某些機(jī)構(gòu)、人物、出版物、項(xiàng)目、程序、活動(dòng)對(duì)象的簡(jiǎn)要描述,是指引用戶從其他有關(guān)的信息原獲取更詳細(xì)的信息的一類數(shù)據(jù)庫(kù)。3.數(shù)值數(shù)據(jù)庫(kù)(numeric database).又稱數(shù)據(jù)型數(shù)據(jù)庫(kù),此類數(shù)據(jù)庫(kù)存儲(chǔ)的均為數(shù)據(jù)信息。4.全文型數(shù)據(jù)庫(kù)(full-text database)。是指儲(chǔ)存文獻(xiàn)全文或者其中主要部分的一種數(shù)據(jù)庫(kù)。n數(shù)據(jù)庫(kù)的構(gòu)成(1)文擋(file),若干個(gè)邏輯記錄構(gòu)成的信息集合成為文擋。(2)記錄(record),記錄是若干個(gè)字段組成的文獻(xiàn)單元。(3)字段(field),是文獻(xiàn)著錄的基本單元,用來(lái)描述文獻(xiàn)主題內(nèi)容相關(guān)的

4、某種屬性。4.計(jì)算機(jī)檢索中常用的運(yùn)算符n一. 邏輯算符n1.邏輯“與”。用“and”或者“ * ”表示,是用以組配不同的概念邏輯符 號(hào),表示“and”連接的兩個(gè)詞在一個(gè)記錄中必須同時(shí)出現(xiàn)。 如:Library and ComputerLibraryComputern2.邏輯“或”。用“or”或“+”表示。是用來(lái)組配相同或相近概念的邏輯算符,表示在記錄中出現(xiàn)其一即可作為命中。如:fiber or fibrefiberfibre3.邏輯“非”。在系統(tǒng)中用“not”或者“”表示,排除某個(gè)概念的邏輯算符, 如:Patent not Japan, 表示檢中的記錄中包含Patent ,不包含Japan。

5、PatentJapan二.優(yōu)先算符 優(yōu)先算符用()表示,在含有多個(gè)運(yùn)算的檢索式中,可以用()將需要優(yōu)先運(yùn)算的部分括上,系統(tǒng)會(huì)優(yōu)先運(yùn)算()中的部分,然后在按照not, and, or的順序進(jìn)行運(yùn)算。如:S (fiber or fibre) and optical三.截詞符和屏蔽符(以以EI數(shù)據(jù)庫(kù)為例數(shù)據(jù)庫(kù)為例,其他數(shù)據(jù)庫(kù)大同小異其他數(shù)據(jù)庫(kù)大同小異) 1.截詞符:用“*”作為截詞符,有二種用法。 Use truncation (*) to search for words that begin with the same letters. ( (無(wú)限截詞無(wú)限截詞) )comput* returns

6、 computer, computers, computerize, computerizationTruncation can also be used to replace any number of characters internally.(.(中間截詞中間截詞) ) sul*ate returns sulphate or sulfate 2.屏蔽符:“?”作為屏蔽符,加在單詞中間,可以代表1個(gè)字符的變化。如:wom?n, 表示women和woman。 Use wildcard (?) to replace a single character.wom?n retrieves wom

7、an or women 四.位置算符(以EI為例,不同的數(shù)據(jù)庫(kù)各不相同)1. 嚴(yán)格詞組 To search for an exact phrase or phrases containing stop To search for an exact phrase or phrases containing stop words (and, or, not, near), enclose terms in braces or words (and, or, not, near), enclose terms in braces or quotation marks. quotation marks

8、. Journal of Microwave Power and Electromagnetic Energy Journal of Microwave Power and Electromagnetic Energy near field scanningnear field scanning 2.位置相鄰Use Use NEARNEAR or or ONEARONEAR to search for terms in proximity. ONEAR to search for terms in proximity. ONEAR specifies the exact order of te

9、rms. NEAR and ONEAR cannot specifies the exact order of terms. NEAR and ONEAR cannot be used with truncation, wildcards, parenthesis, braces or be used with truncation, wildcards, parenthesis, braces or quotation marks. NEAR and ONEAR can be used with stemming. quotation marks. NEAR and ONEAR can be

10、 used with stemming. Avalanche ONEAR/0 diodes (Avalanche ONEAR/0 diodes (位置相鄰位置相鄰, ,單詞的前后順序不可顛倒單詞的前后順序不可顛倒) )Solar NEAR energy (Solar NEAR energy (位置相鄰即可位置相鄰即可, ,順序不限順序不限) ) 5.計(jì)算機(jī)檢索策略的制定及調(diào)整n概念的選取 (1)核心概念的選取:如:“高溫超導(dǎo)故障限流器”可提出兩個(gè)核心概念,高溫超導(dǎo)(High Temperature Superconduct,簡(jiǎn)寫HTS)、故障限流器(fault current limiter)

11、 (2)發(fā)掘隱含概念:隱含概念是指課題中沒(méi)有明確提出,但又與課題密切相關(guān)的概念。如“石質(zhì)文物的保護(hù)”,文物、保護(hù)是一級(jí)概念,石質(zhì)是二級(jí)概念,是對(duì)文物的限制。但是這個(gè)課題僅以“文物and 石質(zhì)and 保護(hù)”作為檢索式,是一個(gè)意義比較寬泛的檢索式??梢詫⒄n題分析的深入一些,實(shí)質(zhì)文物受自然界的影響,會(huì)發(fā)生風(fēng)化、表面剝蝕的現(xiàn)象,一般采用在文物表面途層的辦法,常用的有兩類涂層:有機(jī)涂層、聚酯涂層,所以在選取概念的時(shí)候應(yīng)當(dāng)將涂層、薄膜這樣的隱含概念選出。如果對(duì)保護(hù)材料有特殊的要求,還可以將硅、有機(jī)硅或聚酯作為概念提出。石質(zhì)文物也有不少的下位概念:石樓、石碑、紀(jì)念碑、金字塔等。因此檢索式可根據(jù)具體要求靈活調(diào)整。 概念的選?。?)考慮同義詞:一個(gè)詞在英語(yǔ)中往往有多個(gè)詞與之對(duì)應(yīng):如“保護(hù)”的英文有:conservation, preservation, protection等詞。 (4)使用規(guī)范的用語(yǔ):應(yīng)當(dāng)使用行業(yè)術(shù)語(yǔ)、通用的概念作為檢索詞,盡量不用俗語(yǔ)等非規(guī)范詞。 (5)排除不必要的概念:如:“利用礦業(yè)廢渣中的綠泥石、千枚巖燒結(jié)制磚的工藝”,其中的“燒結(jié)”就是制磚的工藝,是工藝的附加概念,可以不必提出,礦業(yè)廢渣是一個(gè)相對(duì)大的概念,在已知原料為綠泥石、千枚巖這樣具體成分后,礦業(yè)廢渣可

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論