2021年計算機(jī)的現(xiàn)代信息檢索技術(shù)進(jìn)展綜述論文_第1頁
2021年計算機(jī)的現(xiàn)代信息檢索技術(shù)進(jìn)展綜述論文_第2頁
2021年計算機(jī)的現(xiàn)代信息檢索技術(shù)進(jìn)展綜述論文_第3頁
2021年計算機(jī)的現(xiàn)代信息檢索技術(shù)進(jìn)展綜述論文_第4頁
2021年計算機(jī)的現(xiàn)代信息檢索技術(shù)進(jìn)展綜述論文_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、計算機(jī)的現(xiàn)代信息檢索技術(shù)進(jìn)展綜述論文 隨著計算機(jī)技術(shù)的 _和信息 _時代的到來,我們每個人都在面對大量的信息選擇問題。如何對有用信息進(jìn)行檢索、評價和利用,這是需要研究的問題。主要對計算機(jī)信息檢索技術(shù)的發(fā)展及相關(guān)問題進(jìn)行了研究。 計算機(jī);信息檢索;智能化;信息資源 在現(xiàn)代社會中,在世界的許多地方都有信息化的影子。當(dāng)計算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)被大量應(yīng)用于信息領(lǐng)域的時候,電子化和數(shù)字化文獻(xiàn)信息的數(shù)量劇增,隨之而來的是信息管理方面的問題。信息檢索技術(shù)在多個領(lǐng)域均有應(yīng)用,尤其是在教育領(lǐng)域,其應(yīng)用非常廣泛。 通過對計算機(jī)信息檢索系統(tǒng)發(fā)展歷程進(jìn)行分析,發(fā)現(xiàn)其發(fā)展過程可分為3個時期: 1971年之前的信息檢索系統(tǒng)。

2、 在這個時期,信息檢索主要采用的是一些傳統(tǒng)的批處理檢索方式,這種方式數(shù)據(jù)存儲和數(shù)據(jù)通信能力不高。 這個時期的標(biāo)志性 _是1971年之后的聯(lián)機(jī)情報檢索系統(tǒng)。這個時期,信息檢索的主要特征是可以通過聯(lián)機(jī)對數(shù)據(jù)庫進(jìn)行管理。 雖然數(shù)據(jù)庫聯(lián)機(jī)檢索功能比較完善,但是其數(shù)據(jù)通信能力很一般。 這一時期的標(biāo)志是IT的出現(xiàn)。在IT出現(xiàn)之后,系統(tǒng)一般使用的是分布式的網(wǎng)絡(luò)化管理。信息資源不僅具有數(shù)字表達(dá)的形式,還有多媒體的形式,規(guī)范化和結(jié)構(gòu)化難度較大,內(nèi)容特征抽取比較煩瑣,并且其對用戶界面要求比較高。 計算機(jī)信息檢索技術(shù)的這些特點,使信息處理的模式出現(xiàn)了巨大的變革。 信息結(jié)構(gòu)從結(jié)構(gòu)化到非結(jié)構(gòu)化,系統(tǒng)功能從單純信息檢索到

3、綜合信息管理和服務(wù)等,這些變革促進(jìn)了信息檢索技術(shù)的進(jìn)一步發(fā)展,且能夠滿足更多用戶對信息利用的需要。就目前情況來看,計算機(jī)信息檢索技術(shù)主要發(fā)展方向有2個: 傳統(tǒng)信息檢索向全文文本、多媒體、多載體、多原理等新型信息檢索的發(fā)展;信息資源的網(wǎng)絡(luò)化和分布化。在第一個發(fā)展方向中,信息檢索的方式新型化突出,能夠?qū)崿F(xiàn)自動抽詞、自動檢索和數(shù)據(jù)挖掘等大量的新功能,能夠使管理和 _信息的能力得到提升;在第二個發(fā)展方向中,信息資源主要是集中于“廣度”上發(fā)展,使資源的檢索范圍更加廣闊。 信息檢索,英文譯為“Infor _tionRetrieval”。通過信息檢索,能夠?qū)崿F(xiàn)信息的存儲和 _、存取。信息檢索的關(guān)鍵是文本信息

4、的索引和檢索。在信息檢索的發(fā)展歷程中,我們了解到其經(jīng)歷了多個發(fā)展階段,發(fā)展的趨勢是越來越智能化。在科學(xué)技術(shù)飛速發(fā)展的今天,信息檢索的對象也越來越多,不僅包括文獻(xiàn)和數(shù)據(jù)等文本信息,還包括圖形圖像、聲音和視頻等媒體信息,這些都是信息檢索研究的范疇。現(xiàn)在,信息檢索實現(xiàn)了從網(wǎng)絡(luò)化到智能化的發(fā)展,信息檢索的對象從以前的封閉到現(xiàn)在的開放,從以前的穩(wěn)定、一致到現(xiàn)在的動態(tài)和分布廣泛,都是一大進(jìn)步。當(dāng)互聯(lián)網(wǎng)越來越普及時,我們需要面對的信息資源的數(shù)量越來越多,如果想要在最短的時間內(nèi)獲得自己所需的信息,就會給計算機(jī)信息檢索帶來巨大的困難。但隨著技術(shù)的發(fā)展,這絕對是可以實現(xiàn)的。圖1所示為智能信息檢索形式的框架圖。 2

5、.1 檢索中存在的問題 2.1.1 語言的問題 目前,在很多計算機(jī)的信息檢索過程中,由于使用的是自然語言標(biāo)引和檢索,會出現(xiàn)查詢不準(zhǔn)確的現(xiàn)象。尤其是在互聯(lián)網(wǎng)信息時代,檢索需求逐漸難以滿足人們?nèi)找嬖鲩L的信息檢索需求。 2.1.2內(nèi)容的問題 當(dāng)前,網(wǎng)絡(luò)信息資源變得越來越豐富,檢索的內(nèi)容是否準(zhǔn)確,能不能展現(xiàn)查詢的網(wǎng)絡(luò)信息資源,這是一個問題。我們在對信息檢索的時候,檢索內(nèi)容不符合自己要求的情況很普遍。所以,為了增加檢索量,同時保證查詢方式的單一性,就需要做很多工作。 2.1.3對象的問題 在信息檢索的過程中,不同人的信息檢索需求是有差異的。怎么對這些信息檢索需求進(jìn)行分類,從而使用戶的使用個性化凸顯,并且

6、還能夠確保準(zhǔn)確性,這些都是需要改進(jìn)的對象。 2.2檢索中存在問題的相應(yīng)對策 2.2.1語言智能化 所謂的“語言智能化”,也就是當(dāng)我們通過自然語言向信息檢索系統(tǒng)輸入關(guān)鍵詞之后,可檢索處理和歧義分析,在知識層面或者說概念層面上輔助查詢,通過系統(tǒng)給我們的一些智能化提示,幫助我們獲得效果最好的檢索結(jié)果。 2.2.2內(nèi)容具體化 在信息檢索系統(tǒng)中,需要使內(nèi)容分析的能力得到提升。 在這個過程中,應(yīng)當(dāng)對與檢索內(nèi)容沒有關(guān)系的信息進(jìn)行篩除,這樣不僅可以使標(biāo)題和全文成為檢索點,還可以通過聲音、圖像等進(jìn)行檢索。 2.2.3技術(shù)智能化 現(xiàn)在,我國已經(jīng)出現(xiàn)了一些智能化的檢索技術(shù),不僅包括自動標(biāo)引、自動文摘技術(shù),還包括自動跟蹤、自動漫游等智能化技術(shù)。這些檢索技術(shù)正在逐漸得以改善和優(yōu)化。近年來,“智能瀏覽器”和“知識共享智能體”等概念已被提了出來。 3結(jié)束語 目前,信息檢索技術(shù)的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論