




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、目錄頁(yè) Contents Page第一節(jié)信息檢索原理第二節(jié)第三節(jié)信息檢索語(yǔ)言信息檢索技術(shù)第一節(jié) 信息檢索原理 n 信息檢索原理就是用戶將信息需求轉(zhuǎn)變?yōu)闄z索系統(tǒng)所能識(shí)別的檢索標(biāo)識(shí),與信息檢索系統(tǒng)中存儲(chǔ)的信息特征進(jìn)行逐一比對(duì),兩者完全一致或基本一致時(shí),即為檢索命中信息,可按用戶要求從檢索系統(tǒng)中輸出。n 其檢索結(jié)果既可能是用戶需要的最終信息(一次信息),也可能是用戶需要的信息線索(二次信息),用戶可據(jù)此線索進(jìn)一步進(jìn)行判斷、篩選,以獲取所需要的最終信息?;靖拍钚畔z索原理圖第一節(jié) 信息檢索原理 概念解釋n 文獻(xiàn)信息存儲(chǔ)過(guò)程: 將大量分散的文獻(xiàn)信息搜集起來(lái),根據(jù)其內(nèi)容特征或外表特征進(jìn)行標(biāo)引,形成表征這
2、些 文獻(xiàn)信息的特征標(biāo)識(shí),并存儲(chǔ)在一定的載體上,成為有查詢功能的檢索工具。n 標(biāo)引: 對(duì)文獻(xiàn)內(nèi)容特征和外部特征進(jìn)行分析形成概念標(biāo)識(shí),再依據(jù)一定的標(biāo)準(zhǔn)或規(guī)則 (檢索語(yǔ)言:如分類號(hào)、主題詞、關(guān)鍵詞及著者選用規(guī)則等)將其用相應(yīng)的標(biāo)識(shí)充分、準(zhǔn)確地表達(dá)出來(lái)。n 文獻(xiàn)信息檢索過(guò)程: 用戶根據(jù)自己的信息需求,提出檢索提問(wèn),然后使用有關(guān)的標(biāo)引語(yǔ)言(也稱檢索語(yǔ)言) 將擬定的檢索提問(wèn)規(guī)范成檢索標(biāo)識(shí),用于檢索的過(guò)程。第一節(jié) 信息檢索原理 第二節(jié) 信息檢索語(yǔ)言 n 檢索語(yǔ)言就是信息組織和信息檢索時(shí)所使用的語(yǔ)言(包括自然語(yǔ)言)。n 信息檢索語(yǔ)言是文獻(xiàn)信息標(biāo)引的規(guī)則和標(biāo)準(zhǔn),標(biāo)引人員可用它來(lái)標(biāo)引文獻(xiàn)以便將文獻(xiàn)整理、加工、存儲(chǔ)
3、于檢索系統(tǒng)中,同時(shí),檢索人員可 用它來(lái)表達(dá)檢索課題信息的內(nèi)容,以便把特定文獻(xiàn)從檢索系統(tǒng)中檢索出來(lái)。 n 因此,檢索語(yǔ)言就是一種把文獻(xiàn)的存儲(chǔ)與檢索聯(lián)系起來(lái),把標(biāo)引人員和檢索人員溝通起來(lái)的約定人工語(yǔ)言。概念說(shuō)明n 對(duì)文獻(xiàn)的信息內(nèi)容及其外表特征加以規(guī)范化的標(biāo)引;n 對(duì)內(nèi)容相同及相關(guān)的文獻(xiàn)信息加以集中或揭示其相關(guān)性;n 可使文獻(xiàn)信息的存儲(chǔ)集中化、系統(tǒng)化、組織化,便于檢索者按一定的排列次序進(jìn)行有序化檢索;n 便于將標(biāo)引用語(yǔ)和檢索用語(yǔ)進(jìn)行相符性比較;n 最高全準(zhǔn)率:保證檢索者按不同需要檢索文獻(xiàn)時(shí),都能獲得最高查全率和查準(zhǔn)率。主要功能第二節(jié) 信息檢索語(yǔ)言 檢索語(yǔ)言在檢索中的作用第二節(jié) 信息檢索語(yǔ)言 n 文獻(xiàn)
4、1:A Model of multimedia information retrievaln 文獻(xiàn)2:The Information retrieval in chemistry WWW servern 文獻(xiàn)3:ERIC resources例如:有三篇文獻(xiàn)篇名如下:在對(duì)信息存儲(chǔ)的過(guò)程中,對(duì)這三篇文獻(xiàn)內(nèi)容分別進(jìn)行了分析,并使用檢索語(yǔ)言對(duì)其進(jìn)行標(biāo)引,標(biāo)引結(jié)果為:n 文獻(xiàn)1:篇名(title): A Model of multimedia information retrieval 主題(subject): information retrieval, multimedia computer app
5、licationsn 文獻(xiàn)2:篇名(title): The Information retrieval in chemistry WWW server 主題(subject): chemistry, educational materialsn 文獻(xiàn)3:篇名(title): ERIC resources 主題(subject): educational materials標(biāo)引后這三篇文獻(xiàn)分別被存儲(chǔ)進(jìn)數(shù)據(jù)庫(kù)第二節(jié) 信息檢索語(yǔ)言 n 如果用戶輸入“information retrieval”一詞,并將檢索范圍限定在篇名中,則文獻(xiàn)1與文獻(xiàn)2符合用戶要求,成為檢索結(jié)果。n 如果用戶輸入“informa
6、tion retrieval”一詞,并將檢索范圍限定在主題中,則只有文獻(xiàn)1符合 用戶要求,成為檢索結(jié)果。n 如果用戶輸入“educational materials”一詞,并將檢索范圍限定在主題中,則文獻(xiàn)2和文獻(xiàn)3 符合用戶要求,成為檢索結(jié)果。 在信息檢索過(guò)程中:在上述例子中,“information retrieval”、“educational materials”都是檢索語(yǔ)言,篇名和主題則是檢索語(yǔ)言的標(biāo)識(shí),檢索系統(tǒng)就是通過(guò)他們將用戶需求與信息內(nèi)容進(jìn)行運(yùn)算匹配,最終找到檢索結(jié)果的。由這個(gè)例子可以看出,檢索語(yǔ)言的主要作用就是對(duì)文獻(xiàn)的外部特征和內(nèi)容進(jìn)行多層次描述,提供多種檢索途徑,以方便用戶從
7、不同角度檢索查找。第二節(jié) 信息檢索語(yǔ)言 2.1 分類檢索語(yǔ)言(體系分類法、組配分類法、混合式分類法)n 文獻(xiàn)分類的實(shí)質(zhì)是按照知識(shí)體系分類和概念邏輯的方法,對(duì)文件的信息進(jìn)行區(qū)分和歸類。n 分類語(yǔ)言的詞表即為分類表,它是由眾多類目按照一定的知識(shí)分類和概念邏輯秩序,并考慮 文獻(xiàn)分類的需要而構(gòu)成的體系。n 由于分類語(yǔ)言通常采用字母或數(shù)字符號(hào)來(lái)構(gòu)詞,因而表達(dá)這些概念意義的分類語(yǔ)言詞語(yǔ)就是類目的號(hào)碼,即類號(hào),通過(guò)自然語(yǔ)言的類名,可以直接的理解類目的含義,借助形勢(shì)化符號(hào)的類號(hào),可以系統(tǒng)的揭示與組織文獻(xiàn)信息。n 文獻(xiàn)分類的意義在于,根據(jù)文獻(xiàn)信息的內(nèi)容特征和分類詞表,把相同內(nèi)容的文獻(xiàn)集中起來(lái),同時(shí)又把不同內(nèi)容的
8、文獻(xiàn)信息區(qū)別開(kāi)來(lái),以實(shí)現(xiàn)相關(guān)集中的功能。第二節(jié) 信息檢索語(yǔ)言 2.1 分類檢索語(yǔ)言(體系分類法、組配分類法、混合式分類法)n 分類檢索語(yǔ)言中使用較多的是體系分類法,其主要特點(diǎn)是按學(xué)科、專業(yè)集中文獻(xiàn),并從知識(shí)分類角度揭示各類文獻(xiàn)在內(nèi)容上的區(qū)別和聯(lián)系,提供從學(xué)科分類檢索文獻(xiàn)信息的途徑。體系分類法具有按學(xué)科或?qū)I(yè)集中系統(tǒng)地向人們揭示文獻(xiàn)資料內(nèi)容的功能,這對(duì)于希望系統(tǒng)掌握和利用某一專業(yè)范圍的文獻(xiàn)而言,無(wú)疑是有效的。n 如 中國(guó)圖書館分類法是國(guó)家推薦統(tǒng)一使用的分類法,被許多檢索工具采用或改編,分5大部類22大類,類號(hào)采用漢語(yǔ)拼音字母與阿拉伯?dāng)?shù)字的混合號(hào)碼,用一個(gè)字母代表一個(gè)大類,以字母的順序反映大類的序
9、列,在字母后用數(shù)字表示大類下類目的劃分,數(shù)字的設(shè)置盡可能代表類的級(jí)位,并基本上遵從層累制的原則。 如:第二節(jié) 信息檢索語(yǔ)言 n F經(jīng)濟(jì)(大類)n F2- 經(jīng)濟(jì)計(jì)劃與管理(二級(jí)類)n F25 -物資經(jīng)濟(jì)(三級(jí)類)n F250 -物資經(jīng)濟(jì)理論(四級(jí)類)n F251.1 -物資管理(五級(jí)類). n 按體系分類法檢索的長(zhǎng)處是,能滿足從學(xué)科或?qū)I(yè)角度廣泛地進(jìn)行課題檢索的要求,達(dá)到較高的查全率。n 查準(zhǔn)率的高低與類目的粗細(xì)多少有關(guān),類目越細(xì),專指度越高,查準(zhǔn)率也越高。n 但類表的篇幅是有限的,類目不可能設(shè)計(jì)得很細(xì)。n 因此,分類法只是一種“族性檢索”,而非“特性檢索”。n 概念:是指經(jīng)過(guò)控制的,表達(dá)文獻(xiàn)信
10、息內(nèi)容的語(yǔ)詞。是以自然語(yǔ)言的語(yǔ)詞為字符,以規(guī)范化或未經(jīng)規(guī)范化的名詞術(shù)語(yǔ)為基本詞匯,以概念之間的形式邏輯作為語(yǔ)法和構(gòu)詞法,用語(yǔ)詞字順排列,主題概念以參照系統(tǒng)顯示概念之間關(guān)系的一類檢索語(yǔ)言。 n 主題檢索語(yǔ)言可分為標(biāo)題詞語(yǔ)言(標(biāo)題法)、單元詞語(yǔ)言(元詞法)和敘詞語(yǔ)言(敘詞法)。標(biāo)題詞語(yǔ)言屬于先組式語(yǔ)言,單元詞語(yǔ)言和敘詞語(yǔ)言屬于后組式語(yǔ)言。關(guān)鍵詞語(yǔ)言(鍵詞法)因其性能與上述幾種語(yǔ)言相似,通常也歸入主題檢索語(yǔ)言一類,實(shí)質(zhì)上它是一種在情報(bào)檢索中直接使用自然語(yǔ)言的方法,對(duì)取自文獻(xiàn)本身的語(yǔ)詞只作極少量的規(guī)范化處理,也不顯示文獻(xiàn)主題概念之間的關(guān)系,是一種準(zhǔn)情報(bào)檢索語(yǔ)言。2.2主題檢索語(yǔ)言第二節(jié) 信息檢索語(yǔ)言
11、n 概念:就是將千百年來(lái)存在于人類社會(huì)生活中自然形成的非規(guī)范語(yǔ)言,通過(guò)一定的語(yǔ)言處理技術(shù),使之應(yīng)用于信息檢索系統(tǒng)的信息組織、標(biāo)引與輸出 。 n 特點(diǎn):對(duì)信息檢索領(lǐng)域來(lái)說(shuō),采用自然語(yǔ)言的方式,可以有效解決潛在語(yǔ)義表達(dá)上的不匹配因素,自然語(yǔ)言的語(yǔ)言思維形式,對(duì)信息的表達(dá)對(duì)應(yīng)性較強(qiáng),因而有利于形成在語(yǔ)言無(wú)損耗 意義上的排序輸出問(wèn)題。2.3自然語(yǔ)言第二節(jié) 信息檢索語(yǔ)言 n (1)關(guān)鍵詞(keyword):直接從信息資源名稱、正文或文摘中抽出的代表信息主要內(nèi)容的重要語(yǔ)詞。 這部分有時(shí)由人工自由標(biāo)引進(jìn)行,如期刊論文中的作者關(guān)鍵詞,大部分由計(jì)算機(jī)標(biāo)引系統(tǒng)自動(dòng)完成。n (2)題名:信息資源的名稱,如論文篇名、
12、圖書書名、網(wǎng)站名稱等。n (3)全文:從資源的全部?jī)?nèi)容中自動(dòng)抽取、查找,是目前網(wǎng)上各類搜索引擎使用得最多的方法。n (4)引文:將文獻(xiàn)所引用的參考文獻(xiàn)的作者、篇名、來(lái)源出版物抽取出來(lái)進(jìn)行標(biāo)引。自然語(yǔ)言的標(biāo)識(shí)包括:此外,還有責(zé)任人(作者)、摘要等。由于自然語(yǔ)言檢索系統(tǒng)對(duì)同義詞、近義詞、多義詞等與其相關(guān)的詞語(yǔ)沒(méi)有進(jìn)行規(guī)范和統(tǒng)一,當(dāng)用戶提問(wèn)的檢索概念具有多種表達(dá)形式時(shí),采用單一的關(guān)鍵詞或自然語(yǔ)言索引詞匹配方式勢(shì)必會(huì)影響查全率。自然語(yǔ)言檢索系統(tǒng)的選詞沒(méi)有嚴(yán)格限制,詞量過(guò)多過(guò)雜勢(shì)必會(huì)影響查準(zhǔn)率。第二節(jié) 信息檢索語(yǔ)言 基本概念第三節(jié) 信息檢索技術(shù) n 何謂信息檢索? 信息檢索(Information Re
13、trieval)是指信息按一定的方式組織起來(lái),并根據(jù)信息用戶的需要找出有關(guān)的信息的過(guò)程和技術(shù)。n 何謂信息檢索技術(shù)? 由于信息資源具有高度的組織結(jié)構(gòu)。因此,要想做到快速、準(zhǔn)確地檢索需要一些特殊的技術(shù)。通過(guò)學(xué)習(xí)和掌握這些技術(shù)與技巧,你就能在浩瀚的信息海洋中,輕而易舉的獲取你的“目標(biāo)”,從而讓你的科研或?qū)W習(xí)過(guò)程變得更加便捷與高效。n 信息檢索技術(shù)的構(gòu)成? 檢索算符、檢索功能、檢索策略、檢索評(píng)價(jià) 3.1 檢索算符n 用一個(gè)關(guān)鍵詞檢索可能比較簡(jiǎn)單容易,但通常檢索課題會(huì)用到多個(gè)關(guān)鍵詞。n 如何科學(xué)的將這些檢索詞進(jìn)行有效組合,以求達(dá)到最好的檢索效果,這就要涉及到多個(gè)檢索概念的方法和技巧。第三節(jié) 信息檢索技
14、術(shù) n 布爾邏輯算符是規(guī)定檢索詞之間邏輯關(guān)系的算符,利用布爾邏輯算符進(jìn)行檢索詞或代碼的邏輯組配,是計(jì)算機(jī)信息檢索系統(tǒng)中最常用的一種檢索方法,也稱布爾檢索。3.1.1 布爾邏輯算符布爾邏輯算符通常包括以下三種:(1)邏輯“或”O(jiān)R 或“+”表示(2)邏輯“與”AND 或“*”表示(3)邏輯“非”NOT 或 “-”表示第三節(jié) 信息檢索技術(shù) (1)邏輯“與”(AND或*)邏輯“與與” (AND) 是用來(lái)組配具有相互交叉限定關(guān)系的檢索概念。邏輯“與與”有時(shí)也用“*”代替(各數(shù)據(jù)庫(kù)有時(shí)表達(dá)不同),其含義是檢出的記錄中同時(shí)含有“AND”前后兩個(gè)檢索詞。如:查找有關(guān)“納米”和“材料”方面的文獻(xiàn)時(shí),其檢索式為
15、:Nano AND MaterialsNano * Materials 第三節(jié) 信息檢索技術(shù) (2) 邏輯“或”(“OR”或“+”)在檢索中,你也可以用邏輯邏輯“或或”(OR)連接關(guān)鍵詞。檢索式。OR最好用于針對(duì)一個(gè)概念的同義詞檢索。很顯然,使用OR可以擴(kuò)大檢索范圍。第三節(jié) 信息檢索技術(shù) 使用上面這個(gè)檢索式,使用了網(wǎng)絡(luò)的同義詞。會(huì)找到有關(guān)Internet 或 Web的文獻(xiàn)或Internet 與Web 同時(shí)出現(xiàn)的文獻(xiàn)。也可以在一次搜索中多次使用OR:如:Internet OR Web OR online OR digital OR wired有的中文數(shù)據(jù)庫(kù)在使用 OR 時(shí)需用“+”來(lái)代替:互聯(lián)網(wǎng)
16、 + 網(wǎng)絡(luò) + 在線 OR用于組配具有并列關(guān)系、概念相同或相近的檢索詞,如同義詞、相關(guān)詞等。用OR算符的基本作用是擴(kuò)大檢索范圍,增加命中的文獻(xiàn)量,提高檢索的查全率如:查找“腫瘤”的檢索式為:cancer(癌)or tumor(瘤)or carcinoma(癌)例如例如 Internet OR Web 第三節(jié) 信息檢索技術(shù) 當(dāng)你希望所找的文章中包含兩個(gè)或兩個(gè)以上的檢索概念時(shí),你可以在檢索式中用“AND”將這些關(guān)鍵詞連接起來(lái),表示這些關(guān)鍵詞必須同時(shí)出現(xiàn)在記錄中的某處。使用“AND”將縮小檢索范圍。 如:students AND Internet 輸入上面這個(gè)檢索式,會(huì)找到關(guān)于students和in
17、ternet同時(shí)出現(xiàn)的文章,只包含其中一個(gè)詞的文章是不會(huì)被檢索到的。因此, 在連接不同概念的檢索詞時(shí),AND是非常有用的。在一個(gè)檢索式中,AND可以被使用多次。如: students AND Internet AND assignments有的中文數(shù)據(jù)庫(kù)用*來(lái)代替AND,就象下面的這個(gè)例子。當(dāng)然,不是所有的中文數(shù)據(jù)庫(kù)都支持這種用法,你可以查看幫助文件加以確認(rèn)。如:學(xué)生 * 互聯(lián)網(wǎng) 第三節(jié) 信息檢索技術(shù) 需要注意的是,有的中文數(shù)據(jù)庫(kù)在使用NOT時(shí)需用“-”來(lái)代替,就象下面的例子。當(dāng)然,不是所有的中文數(shù)據(jù)庫(kù)都支持這種用法,你可以查看幫助文件加以確認(rèn).如:計(jì)算機(jī) - 軟件上述檢索式用于查找只出現(xiàn)計(jì)算
18、機(jī)而不出現(xiàn)計(jì)算機(jī)軟件的文獻(xiàn),用于連接排除關(guān)系的檢索詞,即排除不需要的和影響檢索結(jié)果的概念。用NOT連接檢索詞A和檢索詞B,檢索式為:A NOT B (或AB)表示檢索含有檢索詞A而不含檢索詞B的信息,即將包含檢索詞B的信息集合排除掉。 如:要查找除中國(guó)之外的“經(jīng)濟(jì)學(xué)”的文獻(xiàn),其檢索式為:Economics(經(jīng)濟(jì)學(xué)) not China(中國(guó))第三節(jié) 信息檢索技術(shù) 圖(a) 圖(b) 圖(c) 第三節(jié) 信息檢索技術(shù) 3.1.2 截詞算符n 截詞符就是用一個(gè)符號(hào)來(lái)代替單詞的一部分或某個(gè)字母。截詞符一般常用于英文檢索。n 截詞檢索的作用是減少檢索詞的輸入而保證相關(guān)檢索概念的涵蓋,同時(shí)也方便解決語(yǔ)言文
19、字拼寫方面的差異(如美式英語(yǔ)和英式英語(yǔ)),避免漏檢。這樣可以擴(kuò)大檢索范圍,提高查全率,節(jié)省檢索時(shí)間。n 截詞符用于檢索詞(干)進(jìn)行擴(kuò)展。在不同的檢索系統(tǒng)中,截詞符有不同的表示方法,通常許多數(shù)據(jù)庫(kù)用 * 或者 ? 來(lái)表示。n 截詞方式: 按截?cái)嗟奈恢脕?lái)分共有三種:n 后截?cái)唷⒅虚g截?cái)?、前截?cái)嗟谌?jié) 信息檢索技術(shù) 三種截?cái)嗳N截?cái)嘀形臄?shù)據(jù)庫(kù)截詞一般只能用在詞尾,英文數(shù)據(jù)庫(kù)則中文數(shù)據(jù)庫(kù)截詞一般只能用在詞尾,英文數(shù)據(jù)庫(kù)則3種方式都可以種方式都可以(1)后截?cái)嗪蠼財(cái)嗉辞胺揭恢聶z索,是最常用的檢索技術(shù)。將截詞符放在一個(gè)詞干的后邊,以表示其后可有無(wú)限或有限個(gè)字符。A.后截?cái)酂o(wú)限截詞后截?cái)酂o(wú)限截詞不說(shuō)明具體截
20、去字符的數(shù)量。截詞符是在一個(gè)詞尾加一個(gè) ? 號(hào),表示在其后可添加任意多個(gè)字符,這些字符都被作為檢索詞進(jìn)行檢索。無(wú)限截詞通常用 ? 或 * 來(lái)表示把截詞符放在字根的最后。如:behav? 系統(tǒng)將找出 “behave, behaviour,behavioural”等 B.后截?cái)嘤邢藿卦~后截?cái)嘤邢藿卦~說(shuō)明具體截去字符的數(shù)量,截詞符是在一個(gè)詞尾加有限個(gè) ?號(hào),n個(gè) ?號(hào)表示其后可添加的字符數(shù)少于等于n個(gè)。 如:smok? ;系統(tǒng) 將對(duì)smoke , smoky , smoked , smoker , smokes等進(jìn)行檢索(2)中間截?cái)嘀虚g截?cái)嗍前呀卦~符號(hào)放在一個(gè)檢索詞的中間。一般中間截?cái)嘀辉试S有限截
21、斷。中間截詞符也稱通配符,是在一詞中間用若干個(gè)?號(hào),表示可插入若干個(gè)字符。中間截?cái)嘀饕糜谟⑹胶兔朗絾卧~的不同拼寫方式,以及有些詞出現(xiàn)單復(fù)數(shù)不同。如:organi?ation;系統(tǒng)將對(duì) organisation 和 organization 進(jìn)行檢索。如: wom?n ; 系統(tǒng)將找出 woman , women“;(3)前截?cái)嗲敖財(cái)嗑褪前呀卦~符放在字根的左邊。如:*Computer, 系統(tǒng)在檢索時(shí)將找出Microcomputer,mini-computer 等3.1.3 位置算符n 位置算符:表示其連接的兩個(gè)檢索詞之間的位置關(guān)系(A B)n 不同位置算符的比較:n 兩個(gè)詞(A B)由不同的位置
22、算符連接組成不同的檢索式,其檢索結(jié)果顯然不同。第三節(jié) 信息檢索技術(shù) 常用位置算符位置算符常用位置算符的使用簡(jiǎn)介(1) (W)與(nW) 算符(W): 是with的縮寫。(W) 表示其連接的兩個(gè)檢索詞必須按序出現(xiàn),中間不允許插詞,只能有一空格或標(biāo)點(diǎn)、符號(hào)。如:high(W)class 命中的記錄中出現(xiàn)的匹配詞可能有:high class 或high-class。(nW): 與(W)類似, 只是它允許插詞,插詞量小于或等于n個(gè)。如:silicon(2W)sensor;命中的記錄中出現(xiàn)的匹配詞除上例的外,還可能會(huì)有:silicon angular rate sensor , silicon-base
23、d chemical sensor等等(2) (N)與(nN) 算符(N):N是near的縮寫。(N)表示其連接的兩個(gè)檢索詞的詞序可變,但兩詞間不允許插詞(nN): (nN)中的n表示允許插詞量少于或等于n個(gè)。如:internet(1N)accessing命中記錄中除上例的外,還會(huì)可能有: accessing the internet , internet /intranet accessing等第三節(jié) 信息檢索技術(shù) 3.2 檢索功能n 檢索功能是指檢索系統(tǒng)在檢索界面上提供給用戶的基本功能。n 它與系統(tǒng)的檢索技術(shù)是緊密結(jié)合的。n 比較通用的檢索功能有:瀏覽、索引、詞表、簡(jiǎn)單檢索、高級(jí)檢索、專家
24、檢索、二次檢索等。n 上述檢索功能都是技術(shù)上較為成熟,在檢索系統(tǒng)中得到廣泛應(yīng)用的。第三節(jié) 信息檢索技術(shù) 3.2.1 瀏覽檢索:可選擇期刊、圖書、叢書、電子參考書及圖片等進(jìn)行瀏覽檢索利用檢索系統(tǒng)提供的樹(shù)型結(jié)構(gòu),從“樹(shù)根”開(kāi)始,逐層逐級(jí)打開(kāi),直到找到所需文獻(xiàn)第三節(jié) 信息檢索技術(shù) 3.2.2索引檢索(Index)第三節(jié) 信息檢索技術(shù) 索引檢索(Index) 一些數(shù)據(jù)庫(kù)常將其文獻(xiàn)記錄的一個(gè)或幾個(gè)字段中具有實(shí)際檢索意義的詞,按字順排成一個(gè)表單式的索引,供用戶選擇檢索。索引的種類很多;如人名索引、出版物索引、地名索引、主題索引、機(jī)構(gòu)索引等。 如圖所示的(取自EI數(shù)據(jù)庫(kù)):在不清楚作者名稱是全稱還是縮寫的情
25、況下使用可節(jié)省檢索時(shí)間和保障查全率或查準(zhǔn)率。第三節(jié) 信息檢索技術(shù) 3.2.3 簡(jiǎn)單檢索(Easy Search) 簡(jiǎn)單檢索又稱基本檢索。即為用戶提供一個(gè)簡(jiǎn)單的檢索界面,類似于搜索引擎。由于不能構(gòu)造比較復(fù)雜、精細(xì)的檢索式,因此檢索結(jié)果不是很準(zhǔn)確。檢索詞第三節(jié) 信息檢索技術(shù) 3.2.4 詞表檢索詞表檢索是途徑。一些檢索系統(tǒng)把自己的詞表編入檢索系統(tǒng)。用戶在確定檢索用主題詞的同時(shí),可以直接進(jìn)行檢索。第三節(jié) 信息檢索技術(shù) 檢索示例:檢索詞第三節(jié) 信息檢索技術(shù) 第三節(jié) 信息檢索技術(shù) 3.2.5 高級(jí)檢索高級(jí)檢索可利用組配檢索和字段檢索來(lái)構(gòu)造比較細(xì)致的檢索式,幫助用戶進(jìn)行精確檢索。使檢索更為靈活,檢索結(jié)果更
26、加準(zhǔn)確。:布爾邏輯組配:library and information;位置算符組配:library (3w) information;第三節(jié) 信息檢索技術(shù) EBSCO數(shù)據(jù)庫(kù)的高級(jí)檢索界面數(shù)據(jù)庫(kù)的高級(jí)檢索界面第三節(jié) 信息檢索技術(shù) 專家檢索可為專業(yè)用戶、資深用戶提供比較復(fù)雜的檢索界面。專家檢索多為命令式檢索方式,適合熟悉檢索指令、檢索經(jīng)驗(yàn)豐富的用戶使用。用戶可將編制好的檢索式填到檢索框中,即可進(jìn)行檢索。使用專家檢索可構(gòu)造較復(fù)雜的檢索式,達(dá)到較高的查全率和查準(zhǔn)率,一般查新人員大多采用這種方式。例如:(EI數(shù)據(jù)庫(kù))在文摘中查找“Laser beam cutting” ;可以表示為“Laser bea
27、m cutting” wn AB; 在題名中查找可表示為:(seatbelts OR seat belts) wn TI ,以此類推。專家檢索采用布爾運(yùn)算符(AND, OR, NOT)連接檢索詞。例如:查找深圳大學(xué)牛憨笨的文獻(xiàn),檢索式為:niu hb wn AU AND shenzhen univ wn AF第三節(jié) 信息檢索技術(shù) 3.2.6 專家檢索EI數(shù)據(jù)庫(kù)的專家檢索界面數(shù)據(jù)庫(kù)的專家檢索界面第三節(jié) 信息檢索技術(shù) 二次檢索是指在當(dāng)前這次檢索結(jié)果范圍內(nèi),再次輸入不同的檢索詞,運(yùn)用布爾邏輯檢索、截詞檢索等方式進(jìn)行檢索。經(jīng)過(guò)多次的二次檢索,逐漸縮小文獻(xiàn)范圍,使檢索結(jié)果更符合您的查詢目標(biāo)。例如: 使用
28、EI數(shù)據(jù)庫(kù)檢索納米材料的有關(guān)文獻(xiàn)時(shí),用“所有字段All field ”途徑,第一次輸入關(guān)鍵詞“納米材料Nano materials”,檢索年限:2008-2012檢索出來(lái)的結(jié)果較多,共有87963條記錄。 調(diào)整檢索式:1.檢索詞由“All field (所有字段)”改變?yōu)椤癟itle (題名)”字段;2.檢索文獻(xiàn)類型限制為:Journal article(期刊);3.檢索結(jié)果由87963條記錄縮減至636條。 第三節(jié) 信息檢索技術(shù) 3.2.7 二次檢索3.3 檢索策略(search strategy) n 執(zhí)行一個(gè)課題的檢索是按過(guò)程、分步來(lái)完成的n 檢索步驟的科學(xué)安排稱為檢索策略(search
29、 strategy) n 它是為實(shí)現(xiàn)檢索目標(biāo)而制定的全盤計(jì)劃或方案第三節(jié) 信息檢索技術(shù) 3.3.1 檢索課題分析 檢索課題的分析,即主題分析,明確課題所包含的概念成份及其相互關(guān)系。這是檢索策略制定的根本出發(fā)點(diǎn),也是影響檢索效率高低或成敗的關(guān)鍵。 要明確以下問(wèn)題: 分析課題的主要內(nèi)容及其所涉及的學(xué)科范圍。 所需文獻(xiàn)的類型、語(yǔ)種、年代及文獻(xiàn)量的范圍。 對(duì)查新、查準(zhǔn)、查全的指標(biāo)要求,及其側(cè)重。第三節(jié) 信息檢索技術(shù) 3.3.2 選擇信息資源 大學(xué)本科期間,你需要為平時(shí)的作業(yè)和畢業(yè)論文搜集資料。研究生期間,你需要深入的學(xué)習(xí)和研究,就必須查找相關(guān)的文獻(xiàn)信息。畢業(yè)后,你如果從事技術(shù)和科研工作,必不可少地要查
30、找一些標(biāo)準(zhǔn)或?qū)@墨I(xiàn);如果你在公司從事管理,那就必需了解市場(chǎng)環(huán)境信息和與公司生存、發(fā)展密切相關(guān)的政策與法規(guī)文件,簡(jiǎn)言之,在當(dāng)前這個(gè)時(shí)代,無(wú)論是學(xué)習(xí)、工作、還是生活都離不開(kāi)信息,掌握如何快速、準(zhǔn)確的獲取信息資源的方法是非常重要的,也是現(xiàn)代社會(huì)與現(xiàn)代人必備的基本技能。第三節(jié) 信息檢索技術(shù) 分析檢索要求選擇數(shù)據(jù)庫(kù)確定檢索詞構(gòu)成檢索式提交計(jì)算機(jī)結(jié)果顯示完成滿意滿意修改檢索式不滿意不滿意第三節(jié) 信息檢索技術(shù) 要做到全面、準(zhǔn)確地選擇信息資源,主要從以下幾個(gè)方面進(jìn)行分析1檢索目的(課題申報(bào)、開(kāi)題報(bào)告、學(xué)術(shù)論文、科技查新、課程論文、商業(yè)需求及其它需求類型等)2確定課題學(xué)科、專業(yè)、關(guān)鍵點(diǎn)3確定所需信息的時(shí)間范圍
31、4明確所需信息類型;圖書、期刊、會(huì)議論文還是專利、標(biāo)準(zhǔn)5確定與檢索主題相關(guān)的學(xué)科范圍的信息源6確定目標(biāo)信息源的形式(全文、索引還是文摘)7確定所需信息源的語(yǔ)種(中文或外文)第三節(jié) 信息檢索技術(shù) 3.3.3 選擇檢索字段檢索字段的功能是什么?檢索字段主要用于限定檢索詞在數(shù)據(jù)庫(kù)記錄中出現(xiàn)的區(qū)域。由于檢索詞出現(xiàn)的區(qū)域?qū)z索結(jié)果的相關(guān)性有一定的影響,因此,利用字段檢索可以用來(lái)控制檢索結(jié)果的相關(guān)性,以提高檢索效果。檢索字段又分為以下2種:1.基本檢索字段: 基本檢索字段反映文獻(xiàn)內(nèi)容特征;由篇名、文摘、主題詞等字段中所有有意義的檢索詞構(gòu)成。例如:檢索時(shí)選擇篇名字段進(jìn)行檢索,則意味著檢索詞會(huì)出現(xiàn)在檢索結(jié)果的
32、題名中。一般而言,在一些常用的數(shù)據(jù)庫(kù)中選擇“主題”檢索字段,就表示凡是“題名、關(guān)鍵詞、摘要”中包含有檢索詞的文獻(xiàn)都會(huì)被檢出(具體參見(jiàn)數(shù)據(jù)庫(kù)說(shuō)明)2.輔助檢索字段:輔助檢索字段反映文獻(xiàn)外部特征;由作者、機(jī)構(gòu)、文獻(xiàn)類型、分類號(hào)、語(yǔ)種、出版年等字段構(gòu)成。第三節(jié) 信息檢索技術(shù) 常用檢索字段TI文獻(xiàn)標(biāo)題SU題名、關(guān)鍵詞、摘要AB論文摘要AU作者姓名CS作者單位SO發(fā)表論文的期刊名稱(學(xué)位授予單位、會(huì)議錄名稱)Key word用于表達(dá)主題內(nèi)容的單詞或詞組JN期刊名稱Full Text整篇文獻(xiàn)第三節(jié) 信息檢索技術(shù) 3.3.4 檢索式的制定 是檢索策略的具體體現(xiàn),它用檢索算符將檢索詞組合起來(lái),并正確表達(dá)檢索詞之間的邏輯關(guān)系和位置關(guān)系。檢索式的好壞決定了檢索質(zhì)量??梢允且粋€(gè)單元詞、表達(dá)單一的概念;如:Computer;也可以是一個(gè)或多個(gè)詞組,表達(dá)多個(gè)概念。例如:Co
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 工程中介合同協(xié)議書
- 教育行業(yè)教務(wù)管理操作手冊(cè)
- 機(jī)械設(shè)備融資租賃協(xié)議書6篇
- 危險(xiǎn)貨物運(yùn)輸合同標(biāo)準(zhǔn)
- 《初高中英語(yǔ)語(yǔ)法講解與練習(xí)課教案》
- 2025年湖北怎么考貨運(yùn)從業(yè)資格證
- 2025年臨汾貨運(yùn)從業(yè)資格證考試內(nèi)容
- 2025年商鋪轉(zhuǎn)讓合同8篇
- 雙方付款合同范本
- 廠地合作合同范本
- 2025年湖南水利水電職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫(kù)參考答案
- 廉政從業(yè)培訓(xùn)課件
- 2024年濰坊工程職業(yè)學(xué)院高職單招語(yǔ)文歷年參考題庫(kù)含答案解析
- 殯儀服務(wù)員職業(yè)技能鑒定考試題(附答案)
- 電動(dòng)葫蘆吊裝方案計(jì)劃
- 2025年山東電工電氣集團(tuán)招聘筆試參考題庫(kù)含答案解析
- 《建立特種設(shè)備“日管控、周排查、月調(diào)度”工作機(jī)制》專題培訓(xùn)
- 《自然語(yǔ)言處理》課件
- 壓裂設(shè)備專用件項(xiàng)目評(píng)價(jià)分析報(bào)告
- 2025上半年重慶萬(wàn)州區(qū)事業(yè)單位招聘擬聘用人員歷年管理單位筆試遴選500模擬題附帶答案詳解
- 公路養(yǎng)護(hù)工安全操作規(guī)程模版(2篇)
評(píng)論
0/150
提交評(píng)論