警告本文檔只供參考不得使用以免影響學業(yè)_第1頁
警告本文檔只供參考不得使用以免影響學業(yè)_第2頁
警告本文檔只供參考不得使用以免影響學業(yè)_第3頁
警告本文檔只供參考不得使用以免影響學業(yè)_第4頁
免費預覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、無憂畢設網(wǎng): 聯(lián)系QQ:375279829警告:本文檔只供參考不得使用以免影響學業(yè)附件4:本科生畢業(yè)論文(設計)文獻綜述論文題目: Web中圖像的檢索技術(shù)研究 . 學生姓名: 童宏梁 年級(學號): 9906528 .二級學院: 信息工程學院 專業(yè): 電子信息工程 .指導教師: 張 量 職稱: 副教授 . 填表日期: 2004 年 2 月 25 日杭 州 師 范 學 院 教 務 處 制一、查閱中外文獻資料目錄,所查閱的中外文獻資料不得少于5篇(含作者、書名或論文題目、出版社或刊名、出版年月或期號及頁碼等,未經(jīng)本人查閱的文獻資料目錄不得列上)(1) 張量,詹國華,袁貞明, 基于Web的圖像搜索,

2、計算機工程,2002.5(2) 朱學芳, 多媒體信息處理與檢索技術(shù)M,電子工業(yè)出版社,2003(3) 陳瀅 ,徐宏炳 ,王能斌,協(xié)作式Web資源發(fā)現(xiàn)系統(tǒng)模型,計算機學報,1998.4 (4) 陽小華, 周龍驤,World Wide Web 的索引與查詢技術(shù),計算機科學 ,1997 (5) 吳立德等,大規(guī)模中文文本處理,復旦大學出版社,1997(6) 李唐, 解讀網(wǎng)絡圖像搜索引擎,Internet網(wǎng)絡,2001(7) 陳立娜,Internet上的圖像檢索技術(shù),天極yesky,2001.5(8) 黃博士,網(wǎng)絡環(huán)境下的圖像檢索技術(shù),中國計算機用戶,2003.12.30(9) Dunlop M.D.

3、(1991). Multimedia Information Retrieval,Ph.D. Thesis. Computing Science Department, University of Glasgow, Report 199l/R21.(10) Ellen M. Voorhees and Yuan-Wang Hou, "Vector Expansion in a Large Collection”, First Text REtrieval Conference (TREC-1), 1993.(11) Frisse M.E, (1988). Searching for i

4、nformation in a hypertext medical handbook. Communications of the ACM, 3 I(7), pp.880-886.(12) R.Price, T.S Chua, and S.Al-Hawamdeh, Applying relevance feedback on a photo archival system. Journal of Information Science, 18:203-215, 1992(13) W.Niblack, R.Barber, and W.Equitz. the qbib project:queryi

5、ng images by content using color, texture, and shape. Technical report, IBM RJ 9203(81511), Feb, 1993(14) Shih-Fu Chang, William Chen, and Hari Sundaram,Semantic Visual Template - Linking Visual Fetures to Semantics. IEEE Intern Conference on Image Processing, Chicago IL, Oct 1998(15) A.E. Cawkell,

6、Imaging systems and picture collection management: a review. Information Service & Use, 12:301-325, 1992(16) T.S. Chua and W.C. Low, and Ch.X. Chu, relevance feedback techniques for color-based image retrieval. In Proceeding of Multimedia Modelling98, IEEE Computer Society, Oct, 1998.二、文獻綜述(含本選題

7、國內(nèi)外研究現(xiàn)狀、研究主要成果、發(fā)展趨勢、存在問題等內(nèi)容,字數(shù)不少于3000字,力求內(nèi)容切題,具綜合歸納性)研究現(xiàn)狀:隨著網(wǎng)絡傳送速度與計算機信息處理速度的提高,網(wǎng)頁中對多媒體信息的使用變得十分普及,特別是圖像信息,己經(jīng)成為表示網(wǎng)頁內(nèi)容不可缺少的組成部分。因此人們對多媒體信息的檢索需求也就隨之隨之變得特別迫切。但由于圖像檢索系統(tǒng)涉及了多學科的知識,實現(xiàn)和應用的難度相當高,所以已有的圖像檢索系統(tǒng)都有這樣或那樣的缺陷。 而傳統(tǒng)的信息檢索主要集中于文字的檢索,在多媒體方面的研究并不是很多?;ヂ?lián)網(wǎng)上的多媒體以圖像為主,因此圖像的檢索就成為了目前研究的熱點。 圖像檢索經(jīng)歷了兩個階段:第一階段是以文本為基礎(chǔ)

8、的檢索。第二階段是以圖像自身的內(nèi)容為基礎(chǔ)的檢索。上個世紀70年代開始,有關(guān)圖像檢索的研究就已開始,當時主要是基于文本的圖像檢索技術(shù)利用文本描述的方式描述圖像的特征。到90年代以后,出現(xiàn)了對圖像的內(nèi)容語義,如圖像的顏色、紋理、布局等進行分析和檢索的圖像檢索技術(shù),即基于內(nèi)容的圖像檢索技術(shù)。而無論是什么引擎,它首先都必須遵循以下幾個要點:(1)索引文檔的容量:現(xiàn)在最大的搜索引擎可能包含了超過100,000,000個鏈接,但這也只是整個Web網(wǎng)上的一小部分。因為收集資料的Robot,只能從“已知”的鏈接開始收集網(wǎng)頁資料,而只有一小部分Web網(wǎng)頁和這些“已知”的網(wǎng)頁有連接;現(xiàn)在還沒有一個搜索引擎能夠隨網(wǎng)

9、頁內(nèi)容的更新比較及時地更新索引;(2)覆蓋面:地理覆蓋面和主題覆蓋面;(3)索引更新頻率:不同的搜索引擎,索引更新頻率相差很大,有的是幾周,有的是一年。索引更新頻率有兩種定義,一種比較少用的定義是新的網(wǎng)頁能被收錄進索引數(shù)據(jù)庫中,另一種是同一頁多少時間才被檢查一次,有必要時更新索引。有的搜索引擎會對經(jīng)常更新的網(wǎng)頁和多人訪問的網(wǎng)頁進行更頻繁的重建索引工作;(4)采集過程:采集過程有寬度優(yōu)先、深度優(yōu)先兩種算法;一般認為寬度優(yōu)先對擴大內(nèi)容的覆蓋面有利,深度優(yōu)先算法有助于提供更多的細節(jié)資料;(5)索引算法:有的搜索引擎只處理元標記和一小部分文檔內(nèi)容,而有一些搜索引擎則是對全文進行索引;(6)結(jié)果顯示:有

10、的搜索引擎只顯示網(wǎng)頁的標題,有些則有更詳細的一些信息,比如網(wǎng)頁的內(nèi)容,更新日期等;(7)查詢算法:一個優(yōu)秀的查詢算法是很重要的,最基本的布爾查詢,短語查詢,有的搜索引擎還提供指定屬性的查詢,比如可以指定對網(wǎng)頁的作者、主題進行查詢。另外有的搜索引擎還采用了相關(guān)度反饋、概念查詢等算法;(8)用戶界面:很多搜索引擎都提供了簡單查詢和高級查詢兩個界面。并且提供了必要的幫助和范例。在檢索原理上,無論是基于文本的圖像檢索還是基于內(nèi)容的圖像檢索,主要包括三方面:一方面對用戶需求的分析和轉(zhuǎn)化,形成可以檢索索引數(shù)據(jù)庫的提問;另一方面,收集和加工圖像資源,提取特征,分析并進行標引,建立圖像的索引數(shù)據(jù)庫;最后一方面

11、是根據(jù)相似度算法,計算用戶提問與索引數(shù)據(jù)庫中記錄的相似度大小,提取出滿足閾值的記錄作為結(jié)果,按照相似度降序的方式輸出。為了進一步提高檢索的準確性,許多系統(tǒng)結(jié)合相關(guān)反饋技術(shù)來收集用戶對檢索結(jié)果的反饋信息,這在CBIR中顯得更為突出,因為CBIR實現(xiàn)的是逐步求精的圖像檢索過程,在同一次檢索過程中需要不斷地與用戶進行交互?;谖谋竞突趦?nèi)容是圖像檢索發(fā)展的兩個分支,不過從目前圖像檢索研究的趨勢而言,尤其結(jié)合網(wǎng)絡環(huán)境下圖像的特征嵌入在具有文本內(nèi)容的Web文檔中,出現(xiàn)了三個不同的研究著眼點。立足于文本,對圖像進行檢索。試圖將傳統(tǒng)的文本檢索技術(shù)移植于對多媒體信息的檢索上,因為基于文本的檢索技術(shù)發(fā)展已經(jīng)成熟

12、。如Page-Rank方法、概率方法、位置方法、摘要方法、分類或聚類方法、詞性標注法等,不僅技術(shù)發(fā)展較為成熟,同時分析和實現(xiàn)的難度略小。但是因為受控詞匯本身的局限,易歧義,更新慢,所以不太容易應對網(wǎng)絡上日新月異的各類圖像。立足于圖像內(nèi)容,對圖像進行分析和檢索。相比而言,盡管圖像檢索已經(jīng)出現(xiàn)了諸如直方圖、顏色矩、顏色集等多種表征圖像特征的方法,但是要突破對低層次特征的分析,實現(xiàn)更高語義上的檢索,實現(xiàn)難度大,進展慢。不過,基于內(nèi)容的圖像檢索建立在多媒體信息的內(nèi)容語義上,能夠更為客觀地反映媒體本質(zhì)的特征。結(jié)合文本和內(nèi)容,進行融合性研究。發(fā)揮各自的優(yōu)勢促進圖像的高效、簡單檢索方式的實現(xiàn),尤其是網(wǎng)絡環(huán)境

13、下,結(jié)合圖像所在Web文檔的特征分析,推斷圖像的特征,同時結(jié)合對圖像的內(nèi)容分析,共同標引達到對圖像的分析和檢索??梢哉f,三個方向都是相互影響和促進的,任何一個方向的進展都會促進圖像檢索技術(shù)向前更進一步。發(fā)展趨勢:由于傳統(tǒng)的搜索引擎在設計方面存在局限性(集中式的體系機構(gòu),通過網(wǎng)絡爬行器收集信息),因此他們無法提供高準確度、搜索實時更新的數(shù)據(jù)庫的服務。因此,開發(fā)一個新的搜索框架,支持“點對點”,按照層次進行分布式搜索成為今后搜索引擎發(fā)展的趨勢。這種新的搜索框架包含了對個人文檔、局域網(wǎng)以及互聯(lián)網(wǎng)三個層次的搜索。當搜索局域網(wǎng)或者是互聯(lián)網(wǎng)的時候,搜索將以分布方式執(zhí)行。同時,系統(tǒng)將能夠自動地把用戶的查詢分

14、發(fā)給相似的用戶或者是互聯(lián)網(wǎng)上最為合適的搜索引擎,以獲得更好的結(jié)果。 基于內(nèi)容編碼技術(shù)的研究,目前,國際上還沒有通用的基于內(nèi)容的編碼標準。20世紀90年代初,國際上就開始了對基于內(nèi)容的圖像信息檢索方面的研究。從基本的顏色檢索,到綜合利用多種圖像特征進行檢索,大量原型系統(tǒng)已經(jīng)推出,其中,部分已投入到實際應用中以檢驗其有效性。同時,MPEG-7標準作為基于內(nèi)容的多媒體編碼標準也正在制定當中,即將成為國際標準中的一員。因此,應盡快對MPEG-7標準進行研究,分析其編碼的實質(zhì),在此基礎(chǔ)上進一步研究基于內(nèi)容檢索的系統(tǒng),使我國基于內(nèi)容的圖像檢索盡快走向?qū)嶋H應用階段。對用戶查詢接口的研究,這涉及到用戶對圖像內(nèi)

15、容的感知表達、交互方式的設計、用戶如何形成并提交查詢等方面?,F(xiàn)代多媒體信息系統(tǒng)的一個重要特征就是信息獲取過程的可交互性,人在系統(tǒng)中是主動的。除了提供示例和描繪查詢基本接口之外,用戶的查詢接口應提供豐富的交互能力,使用戶在主動的交互過程中表達對圖像語義的感知,調(diào)整查詢參數(shù)及其組合,最終獲得滿意的查詢結(jié)果。用戶的查詢接口應該是直觀易用的,底層的特征選擇對用戶是透明的。這里涉及到如何把用戶的查詢表達轉(zhuǎn)換為可以執(zhí)行檢索的特征矢量,如何從交互過程中獲取用戶的內(nèi)容感知,以便選擇合適的檢索特征等問題。一個優(yōu)秀的搜索引擎必須處理以下幾個問題:(1)網(wǎng)頁的分類(2)自然語言的處理(3)搜索策略的調(diào)度和協(xié)作 (4)面向特定用戶的搜索。因此,現(xiàn)在有很多的網(wǎng)絡檢索工具,也就是說搜索引擎采用了智能的檢索手段來增強它的檢索能力,而圖片檢索正是其中的一大塊內(nèi)容。隨著網(wǎng)上多媒體的廣泛應用,對圖像的檢索需求將會越來越迫切。未來的圖像檢索技術(shù)將是網(wǎng)絡技術(shù)和基于內(nèi)容的圖像庫檢索技術(shù)的結(jié)合。隨著多媒體信息處理技術(shù)的日益發(fā)展和深化,圖像信息的加工、處理和檢索標準的出臺,網(wǎng)上的圖像檢索技術(shù)將會日趨完善,而圖像搜索引擎也將成為Internet上的新寵。網(wǎng)絡檢索新技術(shù)還有:層級式導航瀏覽器、自動輔助編程、信息過濾器、主題檢索、三維世界的進入及其檢索、智能檢索代理等等。存在的問題:由于搜索引擎技術(shù)的開發(fā)牽涉

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論