




已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
淺談信息檢索技術(shù)的發(fā)展 作者: 日期:淺談信息檢索技術(shù)的發(fā)展(建筑X2012250015賴永邁)摘要:信息檢索就是給定用戶需求返回滿足該需求信息的一門學(xué)科,通常涉及信息的獲取、存儲、組織和訪問,是信息用戶為處理解決各種問題而查找、識別、獲取相關(guān)的事實、數(shù)據(jù)、知識的活動及過程。本文闡述了信息檢索理論及技術(shù)的發(fā)展歷史,對信息檢索的發(fā)展趨勢進行了簡要分析。關(guān)鍵詞:網(wǎng)絡(luò) 信息檢索 發(fā)展 歷史21世紀(jì)是信息化社會,互聯(lián)網(wǎng)的信息量太大、噪音太多,尋找所需要的信息非常不容易,信息素質(zhì)成為評價人才的重要因素,利用現(xiàn)代信息技術(shù)獲取信息能力,已成為一種基本生存手段和必要的技能。信息檢索是給定用戶需求返回滿足該需求信息的一門學(xué)科。通常涉及信息的獲取、存儲、組織和訪問及從大規(guī)模非結(jié)構(gòu)化數(shù)據(jù)(通常是文本)的集合(通常保存在計算機上)中找出滿足用戶信息需求的資料(通常是文檔)的過程。信息檢索技術(shù)是內(nèi)容應(yīng)用特別是互聯(lián)網(wǎng)內(nèi)容應(yīng)用的核心技術(shù),可以說在這些應(yīng)用中無處不在,信息檢索將會成為一門計算機專業(yè)的基礎(chǔ)學(xué)科。那么,在現(xiàn)實生活中,信息檢索可以用于哪些應(yīng)用呢?從國家層面的需求來說,信息檢索可廣泛地用于情報處理、國家安全等,從企業(yè)層面的需求來看,信息檢索可廣泛地用于搜索、推薦、挖掘類應(yīng)用,可謂無處不在,無孔不入,在很大程度上方便了國家和人民的生活,是推進社會文明的強大力量,其中堅力量不容小覷。了解信息檢索背后的基本原理和技術(shù)發(fā)展史,能夠進行深層的研究或開發(fā)相關(guān)的應(yīng)用。信息的查找萌芽于圖書館的參考工作?!靶畔z索”一詞出現(xiàn)于20世紀(jì)50年代 。信息檢索包括3個主要環(huán)節(jié) :信息內(nèi)容分析與編碼,產(chǎn)生信息記錄及檢索標(biāo)識。組織存貯,將全部記錄按文件、數(shù)據(jù)庫等形式組成有序的信息集合。用戶提問處理和檢索輸出。關(guān)鍵部分是信息提問與信息集合的匹配和選擇,即對給定提問與集合中的記錄進行相似性比較,根據(jù)一定的匹配標(biāo)準(zhǔn)選出有關(guān)信息。它按對象分為文獻檢索、數(shù)據(jù)檢索和事實檢索;按設(shè)備分為手工檢索、機械檢索和計算機檢索。由一定的設(shè)備和信息集合構(gòu)成的服務(wù)設(shè)施稱為信息檢索系統(tǒng),如穿孔卡片系統(tǒng)、聯(lián)機檢索系統(tǒng)、光盤檢索系統(tǒng)、多媒體檢索系統(tǒng)等。信息檢索最初應(yīng)用于圖書館和科技信息機構(gòu),后來逐漸擴大到其他領(lǐng)域,并與各種管理信息系統(tǒng)結(jié)合在一起。與信息檢索有關(guān)的理論、技術(shù)和服務(wù)構(gòu)成了一個相對獨立的知識領(lǐng)域,是信息學(xué)的一個重要分支,并與計算機應(yīng)用技術(shù)相互交叉。一、計算機信息檢索的發(fā)展階段 計算機信息檢索的發(fā)展過程是與計算機技術(shù)及其它現(xiàn)代科學(xué)技術(shù)的發(fā)展過程緊密相關(guān)的。計算機用于信息檢索始于50年代初,在40多年的發(fā)展歷史中,計算機信息檢索大體經(jīng)歷了三個發(fā)展階段。 (一)脫機檢索階段 此階段是從50年代中期到60年代中期。自1946年2月世界上第一臺電子計算機問世以來,人們一直設(shè)想利用計算機查找文獻。進入50年代后,在計算機應(yīng)用領(lǐng)域“穿孔卡片”和“穿孔紙帶”數(shù)據(jù)錄入技術(shù)及設(shè)備相繼出現(xiàn),以它們作為存貯文摘、檢索詞和查詢提問式的媒介,使得計算機開始在文獻檢索領(lǐng)域中得到了應(yīng)用。 1954年,美國海軍兵器中心首先采用IBM-701型計算機建立了世界上第一個科技文獻檢索系統(tǒng),實現(xiàn)了單元詞組配檢索,檢索邏輯只采用“邏輯與”,檢索結(jié)果只是文獻號,1958年,美國通用電器公司將其加以改進,輸出結(jié)果增加了題名、作者和文獻摘要等項目。1964年,美國化學(xué)文摘服務(wù)社建立了文獻處理自動化系統(tǒng),使編制文摘的大部分工作實現(xiàn)了計算機化,以后又實現(xiàn)了計算機檢索。同年,美國國立醫(yī)學(xué)圖書館建立了計算機數(shù)據(jù)庫,即醫(yī)學(xué)文獻分析與檢索系統(tǒng),不僅可以進行邏輯“或”、“與”、“非”等種運算,而且還可以從多種途徑檢索文獻。 這一階段主要以脫機檢索的方式開展檢索服務(wù),其特點是不對一個檢索提問立即作出回答,而是集中大批提問后進行處理,且進行處理的時間較長,人機不能對話,因此,檢索效率往往不夠理想。但是,脫機檢索中的定題服務(wù)對于科技人員卻非常有用,定題服務(wù)能根據(jù)用戶的要求,先把用戶的提問登記入檔,存入計算機中形成一個提問檔,每當(dāng)新的數(shù)據(jù)進入數(shù)據(jù)庫時,就對這批數(shù)據(jù)進行處理,將符合用戶提問的最新文獻提交給用戶,可使用戶隨時了解課題的進展情況。 (二)聯(lián)機檢索階段 此階段是從60年代中期到70年代初。由于計算機分時技術(shù)的發(fā)展,通信技術(shù)的改進,以及計算機網(wǎng)絡(luò)的初步形成和檢索軟件包的建立,用戶可以通過檢索終端設(shè)備與檢索系統(tǒng)中心計算機進行人機對話,從而實現(xiàn)對遠距離之外的數(shù)據(jù)庫進行檢索的目的,即實現(xiàn)了聯(lián)機信息檢索。 這個時期,由于計算機處理功能的加強,數(shù)據(jù)存貯容量的擴大和磁盤機的應(yīng)用,為建立大型的文獻數(shù)據(jù)庫創(chuàng)造了條件。例如美國的DIALOG系統(tǒng)(DIALOG對話系統(tǒng))、ORBIT系統(tǒng)(書目情報分析聯(lián)機檢索系統(tǒng))、BRS系統(tǒng)(存貯和信息檢索系統(tǒng))、歐洲的ESA-IRS系統(tǒng)(歐洲航天局信息檢索系統(tǒng))等都是在此時期開始研制并逐步發(fā)展起來的,并且均在國內(nèi)或組織范圍內(nèi)得到實際應(yīng)用。 可以說,聯(lián)機檢索是科技信息工作、計算機、通訊技術(shù)三結(jié)合的產(chǎn)物,它標(biāo)志著70年代計算機檢索的水平。 (三)網(wǎng)絡(luò)化聯(lián)機檢索階段 此階段是從70年代初到現(xiàn)在。由于電話網(wǎng)、電傳網(wǎng)、公共數(shù)據(jù)通信網(wǎng)都可為情報檢索傳輸數(shù)據(jù)。特別是衛(wèi)星通信技術(shù)的應(yīng)用,使通信網(wǎng)絡(luò)更加現(xiàn)代化,也使信息檢索系統(tǒng)更加國際化,信息用戶可借助國際通訊網(wǎng)絡(luò)直接與檢索系統(tǒng)聯(lián)機,從而實現(xiàn)不受地域限制的國際聯(lián)機信息檢索。尤其是世界各大檢索系統(tǒng)紛紛進入各種通信網(wǎng)絡(luò),每個系統(tǒng)的計算機成為網(wǎng)絡(luò)上的節(jié)點,每個節(jié)點聯(lián)接多個檢索終端,各節(jié)點之間以通信線路彼此相連,網(wǎng)絡(luò)上的任何一個終端都可聯(lián)機檢索所有數(shù)據(jù)庫的數(shù)據(jù)。這種聯(lián)機信息系統(tǒng)網(wǎng)絡(luò)的實現(xiàn),使人們可以在很短的時間內(nèi)查遍世界各國的信息資料,使信息資源共享成為可能。 可以說,聯(lián)機網(wǎng)絡(luò)和檢索終端幾乎遍及世界所有國家和地區(qū),使得國際聯(lián)機信息檢索的發(fā)展達到了相當(dāng)高的水平,開展商業(yè)性國際聯(lián)機檢索服務(wù)的大機構(gòu)已達200余家,像美國的DIALOG信息公司已成為全世界最為著名的聯(lián)機檢索服務(wù)機構(gòu)。在未來的信息檢索發(fā)展中,信息檢索將朝著智能化,可視化,簡單化,多樣化,個性化,商業(yè)化方向發(fā)展。 一、智能化智能化是網(wǎng)絡(luò)信息檢索未來主要的發(fā)展方向。智能檢索是基于自然語言的檢索形式,機器根據(jù)用戶所提供的以自然語言表述的檢索要求進行分析,而后形成檢索策略進行搜索。用戶所需要做的僅僅是告訴計算機想做什么,至于怎樣實現(xiàn)則無須人工干預(yù),這意味著用戶將徹底從繁瑣的規(guī)則中解脫出來。二、可視化可視化(visualization)的歷史可以追溯到2400多年前。哲學(xué)家柏拉圖指出,我們通過看來識別物體。據(jù)統(tǒng)計,人獲取信息有70一80靠視覺,20靠聽覺,10靠觸覺。三、簡單化操作系統(tǒng)的用戶友好性將不斷增強,如微軟和蘋果公司都在致力于操作系統(tǒng)網(wǎng)絡(luò)化研究,以便使其中的任一應(yīng)用程序都能“連接”進行“網(wǎng)絡(luò)檢索”,并與網(wǎng)絡(luò)“交互”;各搜索引擎檢索界面更加“傻瓜化”。使用戶學(xué)習(xí)和進行網(wǎng)絡(luò)信息檢索更加容易;網(wǎng)上自動標(biāo)引、自動文摘、自動跟蹤、自動漫游、機器翻譯、多媒體技術(shù)、動態(tài)鏈技術(shù)、數(shù)據(jù)挖掘和信息推拉等技術(shù)逐步發(fā)展、完善,會越來越方便用戶及時準(zhǔn)確地檢索信息。四、多樣化多樣化首先表現(xiàn)在可以檢索的信息形態(tài)多樣化,如文本、聲音、圖像、動畫。目前網(wǎng)絡(luò)信息檢索的主體是文本信息,基于內(nèi)容的檢索技術(shù)和語音識別技術(shù)的發(fā)展,將使多媒體信息的檢索變得逐漸普遍。五、個性化個性化指各網(wǎng)站注重內(nèi)容的特色化和注重個性化的服務(wù)。網(wǎng)絡(luò)資源的指數(shù)級膨脹,使得用戶在獲得自己需要的信息資源時要花費大量的時間和精力。隨著互聯(lián)網(wǎng)的飛速發(fā)展,每個人的不同信息需求將凸現(xiàn)于標(biāo)準(zhǔn)化、單一的“大眾需求”之上,并成為各個搜朋夠或網(wǎng)站努力追求的對象。不同的打有消費者個人烙印的產(chǎn)品將成為某個消費者區(qū)別他人、感覺自我存在及獨特的外在標(biāo)志,個性化服務(wù)成功的實質(zhì)在于提供了真正適應(yīng)用戶需要的產(chǎn)品,貫徹了以用戶為中心的理念。六、商業(yè)化網(wǎng)絡(luò)檢索系統(tǒng)擁有全世界數(shù)量眾多的用戶,吸引了大量的廣告,為電子信息的增值服務(wù)提供了廣闊的空間。網(wǎng)絡(luò)檢索系統(tǒng)已成為新
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 低糖健康果茶品牌企業(yè)制定與實施新質(zhì)生產(chǎn)力項目商業(yè)計劃書
- 鄉(xiāng)村美食文化節(jié)企業(yè)制定與實施新質(zhì)生產(chǎn)力項目商業(yè)計劃書
- 電子油水分離材料行業(yè)深度調(diào)研及發(fā)展項目商業(yè)計劃書
- 知識產(chǎn)權(quán)信托AI應(yīng)用行業(yè)深度調(diào)研及發(fā)展項目商業(yè)計劃書
- 高清視頻會議系統(tǒng)解決方案企業(yè)制定與實施新質(zhì)生產(chǎn)力項目商業(yè)計劃書
- 危化品運輸車輛監(jiān)控系統(tǒng)企業(yè)制定與實施新質(zhì)生產(chǎn)力項目商業(yè)計劃書
- 大數(shù)據(jù)風(fēng)控模型企業(yè)制定與實施新質(zhì)生產(chǎn)力項目商業(yè)計劃書
- 生物甲烷提純技術(shù)行業(yè)深度調(diào)研及發(fā)展項目商業(yè)計劃書
- 互聯(lián)網(wǎng)保險代理人平臺行業(yè)深度調(diào)研及發(fā)展項目商業(yè)計劃書
- 長春版語文五年級上冊期中考試練習(xí)卷
- 色彩心理學(xué)課件
- 【跨國并購風(fēng)險問題分析文獻綜述2700字】
- 偏癱科普宣教
- 酒駕延緩處罰申請書
- 2023年國家開放大學(xué)《財務(wù)報表分析》形成性考核(1-4)試題答案解析
- 2022年1月福建化學(xué)會考試卷
- 2023年貴州省遵義市中考地理試卷真題(含答案)
- 物料提升機基礎(chǔ)專項施工方案正文
- 工程機械管理制度
- 廣東省勞動合同電子版(六篇)
- 對話大國工匠-致敬勞動模范期末考試答案
評論
0/150
提交評論