




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第2章信息檢索信息檢索與利用檢索語言信息檢索概述檢索途徑檢索系統(tǒng)檢索技術信息檢索的實施2.1.1信息檢索的概念從廣義的角度看,信息檢索是將信息按一定的方式組織和存儲起來,并根據(jù)用戶的需要找出有關信息的過程。從狹義的角度看,信息檢索就是根據(jù)用戶的要求,按照一定的途徑和方法,借助一定的檢索工具對信息進行查找和調取的過程,是查找信息的方法和手段。廣義的信息檢索這一過程分為兩個部分,即“存”和“取”。1.存儲的發(fā)展和技術演進“存”即信息標引和存儲的過程,在這個過程中,首先需要將大量雜亂無序的信息集中起來,然后按照其外部特征和內容特征進行著錄、標引和組織,使其有序化、系統(tǒng)化。2.1.1信息檢索的概念信息著錄信息著錄是在編制文獻目錄時,按照一定規(guī)則,對文獻的外部特征和內容特征進行分析、選擇和記錄的過程,也就是對信息的題名、著者、出處等外部特征和內容特征進行描述。不同的信息資源類型及不同檢索系統(tǒng)的描述項目不完全相同。圖書著錄示例(部分)期刊著錄示例(部分)信息整序信息整序即把著錄信息按照信息特征的標記進行排列,也就是對信息進行標引,給出信息標識,并編制各種類型的索引。信息整序是根據(jù)著者姓名、題名、序號等信息外在屬性標識和分類號、主題詞等信息內在屬性標識來排列信息的。2.1.1信息檢索的概念2.“取”“取”即信息分析和檢索的過程。在編制好的數(shù)據(jù)庫或檢索系統(tǒng)中,利用檢索工具或相關方法找到滿足用戶特定需求的信息,實現(xiàn)信息的檢索和利用。也就是用戶借助檢索工具或檢索系統(tǒng),采用一定的檢索策略、方法,從信息資源集合中查找所需信息的過程。2.1.2信息檢索的目的和意義學生通過信息檢索打開知識的寶庫,科學研究者通過信息檢索站在前人的肩膀上,創(chuàng)造出更多新的發(fā)明和成果。因此,信息檢索在當代具有十分重要的意義。②提高學習能力知識處于不斷更新和完善之中,通過信息檢索,人們可以不斷學習新的知識,更新舊的知識,不斷提升自己的自學能力、研究能力、思維能力、組織能力等,實現(xiàn)終身學習。①養(yǎng)成創(chuàng)造性思維如今的信息資源是一代一代人共同積累和創(chuàng)造的,其中蘊含大量的知識、方法、技巧、思想等,廣泛檢索并利用這些知識,有利于人們從中獲取靈感,開發(fā)智慧、開拓創(chuàng)新,創(chuàng)造新的成就。④提高自身競爭力當前時代是一個信息化的時代,信息的開發(fā)與利用是反映一個國家綜合國力的重要標志,無論是對個人、企業(yè),還是國家而言,充分掌握各種信息、善于利用各種信息,都可以提升其決策能力和決策正確性,從而獲得更強大的競爭力。③提高學習和工作效率無論是學習知識,還是科技研發(fā)等,都可以通過信息檢索學習他人的優(yōu)秀方法,了解他人新取得的成果,總結失敗的經(jīng)驗教訓,從而改進自己學習、研究的方向和內容,縮短學習和研究周期,提高學習和工作效率。2.1.3信息檢索的發(fā)展歷程手動檢索階段A聯(lián)機檢索階段C網(wǎng)絡化檢索階段EBD脫機檢索階段光盤檢索階段如今,信息檢索繼續(xù)向著數(shù)字化、便捷化的方向發(fā)展,特別是隨著計算機集成技術的成熟和數(shù)字技術的發(fā)展應用,信息的采集、加工、標引、著錄、校對、審核、入庫、存儲,以及檢索與利用,都實現(xiàn)了簡單、快捷的數(shù)字化,將信息檢索擴展到了更為廣闊的領域。2.1.4信息檢索的原理信息檢索的本質是將用戶信息需求和文獻信息集合進行匹配的過程。從系統(tǒng)的角度看,系統(tǒng)需要將用戶需求特征與信息資源系統(tǒng)中的檢索語言進行匹配,并顯示匹配成功的結果;從用戶的角度看,用戶需要基于特定的信息需求,采用一定的方法、技術和手段,根據(jù)一定的線索與規(guī)則,從系統(tǒng)中找到相關信息。信息檢索原理與過程2.1.5信息檢索的類型1.按檢索內容劃分事實檢索事實檢索主要以特定的事件或事實作為檢索對象,如字、詞、詩、時間、地點、人名、事件、法規(guī)、制度、圖像、參數(shù)、公式等內容的查找都屬于事實檢索。數(shù)據(jù)檢索數(shù)據(jù)檢索主要以數(shù)據(jù)、圖表等作為檢索對象。數(shù)據(jù)檢索數(shù)據(jù)庫中往往存儲了大量數(shù)據(jù),如統(tǒng)計數(shù)據(jù)、觀測數(shù)據(jù)、各種參數(shù),以及圖表、圖譜等。文獻信息檢索文獻信息檢索主要以文獻為檢索對象,是從一個文獻集合中檢索特定文獻的活動、方法和程序,其檢索內容包括文獻的題目、著者、來源或出處、文摘、全文等。0102032.1.5信息檢索的類型2.按信息組織方式劃分ACB全文檢索是很常用且便捷的一種檢索方式,用戶可以根據(jù)需要獲取檢索系統(tǒng)中的整本書、整篇文章或任意內容。超文本檢索是采用計算機技術、通信技術和人工智能知識表示技術,將文字、圖像、聲音、動畫等多種形式的信息按它們相互之間的關聯(lián)和可能出現(xiàn)的連續(xù)性進行非線性編排后構成網(wǎng)絡,并對這個網(wǎng)絡中的信息進行檢索。超媒體檢索是對檢索系統(tǒng)中的多媒體信息進行檢索,包括文本、圖像、聲音、視頻等,同樣可以提供瀏覽式查詢和跨庫檢索。全文檢索超文本檢索超媒體檢索2.1.5信息檢索的類型3.按檢索方式劃分綜合檢索即手動檢索和計算機檢索綜合進行。預設標題計算機檢索是利用計算機和網(wǎng)絡來查找信息的檢索方法,即利用數(shù)據(jù)庫、計算機軟件技術、計算機網(wǎng)絡及通信系統(tǒng)進行的信息檢索。計算機檢索手動檢索就是利用各種印刷型檢索工具來查找信息的檢索方法,是比較傳統(tǒng)的檢索方式。手動檢索檢索語言信息檢索概述檢索途徑檢索系統(tǒng)檢索技術信息檢索的實施2.2.1檢索語言的概念檢索語言是信息存儲與檢索過程中用于描述信息特征和用戶提問的人工語言,是為了滿足文獻信息加工、存儲和檢索時的共同需要而編制的專門語言,其實質是檢索和標引之間的約定語言和統(tǒng)一標識。檢索語言主要用于描述文獻特征,不管是文章、圖書,還是報告,往往都具有兩個比較明顯的特征,即外部特征和內容特征。2.2.2分類檢索語言1.體系分類法體系分類法是以學科分類為基礎,依據(jù)概念的劃分與概括原理,把概括文獻內容與事物的各種類目組成一個層層隸屬、詳細列舉的等級結構體系的一種文獻分類法,也稱為等級體系分類法。該分類法可以體現(xiàn)學科知識的系統(tǒng)性,便于人們從學科分類的角度檢索文獻。體系分類法是我國圖書情報機構常用的分類法,是圖書館組織和檢索藏書的主要依據(jù)?!吨袌D法》是國內使用最為廣泛的分類法,無論是大型圖書館圖書資料分類,還是網(wǎng)上的各類數(shù)據(jù)庫,都大量應用了該分類法。分類檢索語言是很常用的一種檢索語言,是將表示各種知識領域的類目按知識分類原理進行系統(tǒng)排列,并以代表類目的數(shù)字或字母符號作為文獻主題標識的一類檢索語言?!吨袌D法》大部類和基本大類2.2.2分類檢索語言2.組配分類法組配分類法是在分類表中分別列出不同范疇的單獨概念,再用組配方式來表達具體類目的文獻分類法。組配分類法的基本特征是“分面”,即依據(jù)某種分類標準劃分一個主題所產(chǎn)生的一組類目,可以分為分面組配分類法、組配—體系分類法和體系—組配分類法等類型?!秶H十進分類法》分類體系3.混合分類法混合分類法介于體系分類法和組配分類法之間,是在等級分類體系的基礎上采用分面組配分類的方法,可以細分主題,新浪、網(wǎng)易等網(wǎng)站大多采用這種分類方法。2.2.3主題檢索語言1.關鍵詞檢索語言主題檢索語言是直接以表達主題內容的詞語為檢索標識,以字順為主要排列方式,并通過參照系統(tǒng)等方法,揭示詞間關系的標引和檢索信息資源的方法。萬方數(shù)據(jù)知識服務平臺中的關鍵詞檢索語關鍵詞檢索語言是指從文獻的標題、摘要、正文等抽取的能表達、揭示和描述文獻主題內容的重要性語詞。關鍵詞檢索語言以關鍵詞為標識,關鍵詞屬于自然語言,未對拼寫形式和詞語含義等進行規(guī)范化處理,不受詞表控制,因而可以自由組合使用。2.2.3主題檢索語言2.單元詞檢索語言單元詞是經(jīng)過規(guī)范化處理的、具有獨立概念的基本詞匯單位,且從字面上不能再分解,否則將不能表達完整的概念或含義發(fā)生改變。單元詞檢索語言就是以單元詞為文獻內容的標識和檢索依據(jù)的主題語言,通過從文獻標題、摘要、正文中抽取單元詞來實現(xiàn)信息檢索。3.標題詞檢索語言標題詞檢索語言是規(guī)范化的自然語言,即以經(jīng)過標準化處理的名詞術語為標識來直接表達文獻主題的文獻標引與檢索方法。標題詞由主標題詞和副標題詞組成,它們在標題詞表中按固定的方式組合排列,比較直觀明確,但缺乏靈活性,難以滿足多途徑、多因素的信息檢索。2.2.3主題檢索語言4.敘詞檢索語言敘詞檢索語言又稱主題詞檢索語言,是以自然語言詞匯為基礎、以規(guī)范化的敘詞(主題詞)為檢索標識的文獻標引與檢索方法。敘詞是以基本概念為基礎的表達文獻內容的詞語,是從自然語言中優(yōu)選出來并經(jīng)過規(guī)范化處理的名詞術語,也稱為主題詞。敘詞檢索語言是目前廣泛使用的主題檢索語言,適用于計算機檢索系統(tǒng)和手動檢索系統(tǒng)。用敘詞語言編制的敘詞表是概括某一學科或若干學科領域,并由語義相關、族性相關的名詞術語組成的規(guī)范化的動態(tài)詞匯表。敘詞表是提供現(xiàn)行的、與事物概念唯一對應的、標準的標引和檢索用詞的權威性詞表,便于文獻標引人員和情報檢索人員查找所需敘詞。美國的《工程與科學主題詞表》就是一種綜合性敘詞表,而《美國國家航空航天局敘詞表》《國際核信息系統(tǒng)主題詞表》則屬于專業(yè)性敘詞表。我國的綜合性敘詞表有《漢語主題詞表》,專業(yè)性敘詞表有《航空科技資料主題表》《電子技術漢語主題詞表》《化學工業(yè)主題詞表》等。2.2.4代碼檢索語言代碼檢索語言是將文獻中的一些特殊字符組織排列以表達文獻主題概念的一種人工語言,通常以數(shù)字、字母、數(shù)字與字母的組合或分段的方式來表示各部分含義。例如,科技報告有報告號、合同號等,專利文獻有專利號、入藏號、公司代碼等。SciFinder(在線版數(shù)據(jù)庫學術版)中的分子式檢索就屬于代碼檢索語言,是利用文獻涉及的化合物分子式或環(huán)狀化合物的環(huán)分析數(shù)據(jù)組成的索引,用戶可以從分子式出發(fā),檢索相應的化合物及其相關的文獻信息。檢索語言信息檢索概述檢索途徑檢索系統(tǒng)檢索技術信息檢索的實施2.3.1外部特征檢索途徑文獻的外部特征和內容特征不同,其檢索途徑也不同。外部特征檢索途徑以題名、著者、代碼、引文等為主,當檢索人員已知文獻的外部特征時,便可使用該方式進行檢索。外部特征檢索途徑2.3.2內容特征檢索途徑如果在未知文獻信息的情況下進行檢索,則可以使用內容特征檢索途徑,基于文獻潛在的特征(如分類、主題等)完成信息的檢索。內容特征檢索途徑檢索語言信息檢索概述檢索途徑檢索系統(tǒng)檢索技術信息檢索的實施2.4.1檢索系統(tǒng)的內容組成檢索系統(tǒng)是對結構化和非結構化的數(shù)據(jù)資源進行存儲、索引、查詢和管理的系統(tǒng)或體系,是與檢索相關的工具、設備和人的總稱,其目的是滿足人們的信息存儲和檢索需要。按照檢索工具和方式的不同,檢索系統(tǒng)可以分為計算機檢索系統(tǒng)和手動檢索系統(tǒng)。手動檢索系統(tǒng)又稱印刷型檢索工具,主要由正文、輔助索引、分類目錄、編輯說明及樣例、資料來源索引等部分構成;而計算機檢索系統(tǒng)則由硬件、軟件、網(wǎng)絡通信和數(shù)據(jù)庫等部分構成。2.4.2檢索系統(tǒng)的類型1.目錄型檢索系統(tǒng)目錄型檢索系統(tǒng)以目錄檢索工具為主,主要檢索文獻目錄線索,通常以一個出版單位或收藏單位為基本著錄單位,其著錄大多為書(刊)名、著者、出版年月、出版地及收藏情況等。目錄按揭示信息內容范圍的不同,可分為館藏目錄、聯(lián)合目錄、出版發(fā)行目錄等類型。2.題錄型檢索系統(tǒng)題錄型檢索系統(tǒng)是將圖書、期刊、專利等文獻中的題名按一定的排檢方式編排而成的檢索系統(tǒng),以單篇文獻為基本著錄單位來描述文獻外部特征,從而快速提供文獻線索,其著錄內容大多為篇名、著者、著者單位、出版年,以及卷、期、頁等。2.4.2檢索系統(tǒng)的類型3.文摘型檢索系統(tǒng)文摘型檢索系統(tǒng)是揭示信息外部特征和內容特征的檢索系統(tǒng),其著錄項是在題錄的基礎上加上文摘內容。使用文摘型檢索系統(tǒng)的用戶可以通過輸入關鍵詞、著者、標題、主題等檢索條件來查找特定的文獻,從而快速了解文獻的核心內容、研究方法、結果和結論等關鍵信息。4.全文型檢索系統(tǒng)全文型檢索系統(tǒng)是一種用于檢索并提供文本全文內容的檢索系統(tǒng),以一次文獻為存儲對象,其著錄項包括文摘和全文。當用戶輸入檢索條件后,系統(tǒng)會根據(jù)索引快速定位并查詢相關的文檔,然后將完整的原始資料或具體數(shù)據(jù)返回給用戶。2.4.3常用的檢索方法檢索系統(tǒng)是用于存儲、查找各類信息的工具,各種印刷版工具書、計算機數(shù)據(jù)庫,以及網(wǎng)絡搜索常用的搜索引擎等都可以歸納為檢索系統(tǒng)。從學術檢索的角度來看,要想在使用檢索系。順查法順查法是按照時間順序,由遠及近地利用檢索系統(tǒng)進行信息查找的方法。倒查法倒查法和順查法類似,不同之處是倒查法按照時間順序由近及遠地查找,先查找最近的、最新的信息,且重點查找最新的信息,如果有需要,再查找時間較遠的信息。抽查法抽查法是指針對檢索需求,抽取學科或領域發(fā)展迅速、信息全面的一段時間進行逐年檢索,這一段時間往往是該學科或領域信息產(chǎn)生的高峰期,信息較多,因而檢索起來比較便捷、高效。追溯法追溯法是指利用文獻后面的參考文獻來檢索信息的方法,這些參考文獻與檢索文獻往往具有較大的相關性,一定程度上可以為檢索人員提供關鍵信息。循環(huán)法循環(huán)法即綜合利用以上方法來檢索信息,如先使用順查法、倒查法、抽查法等方法檢索相關文獻,再根據(jù)文獻后面的參考文獻繼續(xù)檢索,擴大檢索范圍。檢索語言信息檢索概述檢索途徑檢索系統(tǒng)檢索技術信息檢索的實施2.5.1布爾邏輯檢索檢索系統(tǒng)是用于存儲、查找各類信息的工具,各種印刷版工具書、計算機數(shù)據(jù)庫,以及網(wǎng)絡搜索常用的搜索引擎等都可以歸納為檢索系統(tǒng)。從學術檢索的角度來看,要想在使用檢索系。邏輯“與”邏輯“或”邏輯“非”2.5.1布爾邏輯檢索在中國知網(wǎng)中運用邏輯“與”、邏輯“或”、邏輯“非”檢索檢索式是指將各個檢索單元之間的邏輯關系、位置關系等用檢索系統(tǒng)規(guī)定的各種運算符連接起來,計算機通過識別和執(zhí)行檢索式完成檢索。檢索式控制著檢索的過程和結果,因此其合理性直接關系到檢索的有效性。不同檢索式的不同檢索結果2.5.2截詞檢索截詞檢索是指在檢索詞的合適位置進行截斷,然后使用截詞符進行處理,即利用檢索詞的詞干或局部進行檢索,只要含有檢索詞局部的所有字符,對應的信息都可以被檢索出來。前截斷也稱左截斷,是指將截詞符置于字符串的前面。后截斷也稱右截斷,是指將截詞符置于字符串后面。中間截斷是指將截詞符置于字符串的中間,表示任意字符。前后截斷是指截去某個詞語的前部和后部,保持中間一致。12342.5.3字段檢索通過外部特征和內容特征進行檢索的方法,即通過刊名、作者、關鍵詞等信息進行檢索,這些信息在數(shù)據(jù)庫中也稱為檢索字段,即指定檢索詞出現(xiàn)的字段。中國知網(wǎng)與萬方數(shù)據(jù)知識服務平臺的檢索字段萬方數(shù)據(jù)知識服務平臺中期刊和科技報告的檢索字段2.5.4位置檢索位置檢索即在檢索詞之間使用位置算符限制兩邊的檢索詞出現(xiàn)在檢索結果中的位置。由于文獻中詞語的位置和相對次序不同,所表達的意思也不同,因而通過限制詞語的位置來表達檢索詞之間的鄰近關系,可以更清晰地表達檢索意圖,提高檢索的查全率和查準率。(F)算符(S)算符(N)算符(W)算符W是with的縮寫,(W)算符兩側的檢索詞必須保持前后位置不變,且其中不可插入其他詞,只能插入一個空格或一個標點符號。S是subfield的縮寫,(S)算符兩側的檢索詞必須出現(xiàn)在同一子字段或自然句中,即一個句子或一個短句中,且檢索詞的次序可以顛倒,檢索詞之間可以添加任意詞。N是near的縮寫,(N)算符兩側的檢索詞位置可以顛倒,但兩詞之間不可插入其他詞;擴展為(nN),表示可以在兩個檢索詞中插入n個詞。F是field的縮寫,(F)算符兩側的檢索詞必須同時出現(xiàn)在同一字段中,如出現(xiàn)在題名字段、文摘字段中,檢索詞的次序可以顛倒,檢索詞之間可以添加任意詞。2.5.5加權檢索加權檢索是一種利用不同權值對檢索詞進行排序的方法,使用加權檢索需要根據(jù)檢索詞對檢索課題的重要程度指定不同的權值,其檢索重點不僅是檢索信息及其關系,還要在此基礎上判定檢索詞對文獻命中與否的影響程度。中國知網(wǎng)中的加權檢索檢索語言信息檢索概述檢索途徑檢索系統(tǒng)檢索技術信息檢索的實施2.6.1信息檢索策略與檢索步驟1.分析檢索課題在檢索開始之前,一定要先明確檢索課題的研究目的、課題類型、主要內容、背景知識、概念術語、學科范圍、文獻類型、檢索范圍等需求。2.選擇檢索詞檢索詞是能表達檢索課題主要內容的提問標識,是在檢索時使用的表示提問主題的詞、詞組、數(shù)值或符號,包括題名、著者等外部特征標識和主題詞、分類號等內容特征標識。(1)檢索詞的選取方法主題分析法AC借鑒法B切分法2.6.1信息檢索策略與檢索步驟(2)檢索詞的選取技巧為了盡量提高檢索的查準率與查全率,在檢索時,要靈活使用近義詞、同義詞,且善用上位詞、下位詞??偟膩碚f,要基于規(guī)范詞進行查詢,兼顧自由詞、全稱、簡稱和縮寫字母,如果是外來詞,還要注意譯寫變化,某些時候也可嘗試以英文作為檢索詞。構建檢索式即合理利用選取的檢索詞,基于各個檢索系統(tǒng)的檢索技術構建完整的檢索式。3.構建檢索式檢索人員最好根據(jù)學科特點和檢索課題,選擇與之相符的權威檢索系統(tǒng),尤其是在課題鑒定、論文開題、科技查新、申請專利等方面,必須選擇專業(yè)、權威的檢索系統(tǒng)。4.選擇檢索系統(tǒng)2.6.2信息檢索效果評估與策略調整1.檢索效果評價所謂檢索效果,即利用
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 幼兒園幼小銜接教學計劃
- 多元化班級評價體系建設計劃
- 輪訓模式下的藝術教師發(fā)展計劃
- 共享服務模式下的會計管理計劃
- 高效會議管理的總結與方法計劃
- 打造水務行業(yè)的智能未來計劃
- 彩鈴呼叫流程
- 《長方體正方體的認識》(教學設計)-2023-2024學年五年級上冊數(shù)學西師大版
- 殘疾人托養(yǎng)服務投標方案(技術方案)
- 《猴子的煩惱》教學設計-2024-2025學年三年級下冊數(shù)學北師大版
- 萬達廣場室內步行街裝設計任務書
- 人音版五年級下冊音樂《巴塘連北京》課件
- GB/T 775.1-2006絕緣子試驗方法第1部分:一般試驗方法
- GB/T 39965-2021節(jié)能量前評估計算方法
- 最新《工會基礎知識》試題庫及答案1000題【完美打印版】
- 化學核心素養(yǎng)的課堂教學-基于核心素養(yǎng)的高中化學教學 課件
- 體育競賽的組織與編排
- 動靜脈內瘺的圍手術期護理-課件
- 辦公家具項目實施方案、供貨方案
- 初中數(shù)學人教八年級下冊第十九章一次函數(shù)-一次函數(shù)的圖象與性質
評論
0/150
提交評論