警告本文檔只供參考不得使用以免影響學(xué)業(yè)_第1頁
警告本文檔只供參考不得使用以免影響學(xué)業(yè)_第2頁
警告本文檔只供參考不得使用以免影響學(xué)業(yè)_第3頁
警告本文檔只供參考不得使用以免影響學(xué)業(yè)_第4頁
免費(fèi)預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、無憂畢設(shè)網(wǎng): 聯(lián)系QQ:375279829警告:本文檔只供參考不得使用以免影響學(xué)業(yè)附件4:本科生畢業(yè)論文(設(shè)計(jì))文獻(xiàn)綜述論文題目: Web中圖像的檢索技術(shù)研究 . 學(xué)生姓名: 童宏梁 年級(學(xué)號): 9906528 .二級學(xué)院: 信息工程學(xué)院 專業(yè): 電子信息工程 .指導(dǎo)教師: 張 量 職稱: 副教授 . 填表日期: 2004 年 2 月 25 日杭 州 師 范 學(xué) 院 教 務(wù) 處 制一、查閱中外文獻(xiàn)資料目錄,所查閱的中外文獻(xiàn)資料不得少于5篇(含作者、書名或論文題目、出版社或刊名、出版年月或期號及頁碼等,未經(jīng)本人查閱的文獻(xiàn)資料目錄不得列上)(1) 張量,詹國華,袁貞明, 基于Web的圖像搜索,

2、計(jì)算機(jī)工程,2002.5(2) 朱學(xué)芳, 多媒體信息處理與檢索技術(shù)M,電子工業(yè)出版社,2003(3) 陳瀅 ,徐宏炳 ,王能斌,協(xié)作式Web資源發(fā)現(xiàn)系統(tǒng)模型,計(jì)算機(jī)學(xué)報(bào),1998.4 (4) 陽小華, 周龍?bào)J,World Wide Web 的索引與查詢技術(shù),計(jì)算機(jī)科學(xué) ,1997 (5) 吳立德等,大規(guī)模中文文本處理,復(fù)旦大學(xué)出版社,1997(6) 李唐, 解讀網(wǎng)絡(luò)圖像搜索引擎,Internet網(wǎng)絡(luò),2001(7) 陳立娜,Internet上的圖像檢索技術(shù),天極yesky,2001.5(8) 黃博士,網(wǎng)絡(luò)環(huán)境下的圖像檢索技術(shù),中國計(jì)算機(jī)用戶,2003.12.30(9) Dunlop M.D.

3、(1991). Multimedia Information Retrieval,Ph.D. Thesis. Computing Science Department, University of Glasgow, Report 199l/R21.(10) Ellen M. Voorhees and Yuan-Wang Hou, "Vector Expansion in a Large Collection”, First Text REtrieval Conference (TREC-1), 1993.(11) Frisse M.E, (1988). Searching for i

4、nformation in a hypertext medical handbook. Communications of the ACM, 3 I(7), pp.880-886.(12) R.Price, T.S Chua, and S.Al-Hawamdeh, Applying relevance feedback on a photo archival system. Journal of Information Science, 18:203-215, 1992(13) W.Niblack, R.Barber, and W.Equitz. the qbib project:queryi

5、ng images by content using color, texture, and shape. Technical report, IBM RJ 9203(81511), Feb, 1993(14) Shih-Fu Chang, William Chen, and Hari Sundaram,Semantic Visual Template - Linking Visual Fetures to Semantics. IEEE Intern Conference on Image Processing, Chicago IL, Oct 1998(15) A.E. Cawkell,

6、Imaging systems and picture collection management: a review. Information Service & Use, 12:301-325, 1992(16) T.S. Chua and W.C. Low, and Ch.X. Chu, relevance feedback techniques for color-based image retrieval. In Proceeding of Multimedia Modelling98, IEEE Computer Society, Oct, 1998.二、文獻(xiàn)綜述(含本選題

7、國內(nèi)外研究現(xiàn)狀、研究主要成果、發(fā)展趨勢、存在問題等內(nèi)容,字?jǐn)?shù)不少于3000字,力求內(nèi)容切題,具綜合歸納性)研究現(xiàn)狀:隨著網(wǎng)絡(luò)傳送速度與計(jì)算機(jī)信息處理速度的提高,網(wǎng)頁中對多媒體信息的使用變得十分普及,特別是圖像信息,己經(jīng)成為表示網(wǎng)頁內(nèi)容不可缺少的組成部分。因此人們對多媒體信息的檢索需求也就隨之隨之變得特別迫切。但由于圖像檢索系統(tǒng)涉及了多學(xué)科的知識,實(shí)現(xiàn)和應(yīng)用的難度相當(dāng)高,所以已有的圖像檢索系統(tǒng)都有這樣或那樣的缺陷。 而傳統(tǒng)的信息檢索主要集中于文字的檢索,在多媒體方面的研究并不是很多。互聯(lián)網(wǎng)上的多媒體以圖像為主,因此圖像的檢索就成為了目前研究的熱點(diǎn)。 圖像檢索經(jīng)歷了兩個階段:第一階段是以文本為基礎(chǔ)

8、的檢索。第二階段是以圖像自身的內(nèi)容為基礎(chǔ)的檢索。上個世紀(jì)70年代開始,有關(guān)圖像檢索的研究就已開始,當(dāng)時主要是基于文本的圖像檢索技術(shù)利用文本描述的方式描述圖像的特征。到90年代以后,出現(xiàn)了對圖像的內(nèi)容語義,如圖像的顏色、紋理、布局等進(jìn)行分析和檢索的圖像檢索技術(shù),即基于內(nèi)容的圖像檢索技術(shù)。而無論是什么引擎,它首先都必須遵循以下幾個要點(diǎn):(1)索引文檔的容量:現(xiàn)在最大的搜索引擎可能包含了超過100,000,000個鏈接,但這也只是整個Web網(wǎng)上的一小部分。因?yàn)槭占Y料的Robot,只能從“已知”的鏈接開始收集網(wǎng)頁資料,而只有一小部分Web網(wǎng)頁和這些“已知”的網(wǎng)頁有連接;現(xiàn)在還沒有一個搜索引擎能夠隨網(wǎng)

9、頁內(nèi)容的更新比較及時地更新索引;(2)覆蓋面:地理覆蓋面和主題覆蓋面;(3)索引更新頻率:不同的搜索引擎,索引更新頻率相差很大,有的是幾周,有的是一年。索引更新頻率有兩種定義,一種比較少用的定義是新的網(wǎng)頁能被收錄進(jìn)索引數(shù)據(jù)庫中,另一種是同一頁多少時間才被檢查一次,有必要時更新索引。有的搜索引擎會對經(jīng)常更新的網(wǎng)頁和多人訪問的網(wǎng)頁進(jìn)行更頻繁的重建索引工作;(4)采集過程:采集過程有寬度優(yōu)先、深度優(yōu)先兩種算法;一般認(rèn)為寬度優(yōu)先對擴(kuò)大內(nèi)容的覆蓋面有利,深度優(yōu)先算法有助于提供更多的細(xì)節(jié)資料;(5)索引算法:有的搜索引擎只處理元標(biāo)記和一小部分文檔內(nèi)容,而有一些搜索引擎則是對全文進(jìn)行索引;(6)結(jié)果顯示:有

10、的搜索引擎只顯示網(wǎng)頁的標(biāo)題,有些則有更詳細(xì)的一些信息,比如網(wǎng)頁的內(nèi)容,更新日期等;(7)查詢算法:一個優(yōu)秀的查詢算法是很重要的,最基本的布爾查詢,短語查詢,有的搜索引擎還提供指定屬性的查詢,比如可以指定對網(wǎng)頁的作者、主題進(jìn)行查詢。另外有的搜索引擎還采用了相關(guān)度反饋、概念查詢等算法;(8)用戶界面:很多搜索引擎都提供了簡單查詢和高級查詢兩個界面。并且提供了必要的幫助和范例。在檢索原理上,無論是基于文本的圖像檢索還是基于內(nèi)容的圖像檢索,主要包括三方面:一方面對用戶需求的分析和轉(zhuǎn)化,形成可以檢索索引數(shù)據(jù)庫的提問;另一方面,收集和加工圖像資源,提取特征,分析并進(jìn)行標(biāo)引,建立圖像的索引數(shù)據(jù)庫;最后一方面

11、是根據(jù)相似度算法,計(jì)算用戶提問與索引數(shù)據(jù)庫中記錄的相似度大小,提取出滿足閾值的記錄作為結(jié)果,按照相似度降序的方式輸出。為了進(jìn)一步提高檢索的準(zhǔn)確性,許多系統(tǒng)結(jié)合相關(guān)反饋技術(shù)來收集用戶對檢索結(jié)果的反饋信息,這在CBIR中顯得更為突出,因?yàn)镃BIR實(shí)現(xiàn)的是逐步求精的圖像檢索過程,在同一次檢索過程中需要不斷地與用戶進(jìn)行交互?;谖谋竞突趦?nèi)容是圖像檢索發(fā)展的兩個分支,不過從目前圖像檢索研究的趨勢而言,尤其結(jié)合網(wǎng)絡(luò)環(huán)境下圖像的特征嵌入在具有文本內(nèi)容的Web文檔中,出現(xiàn)了三個不同的研究著眼點(diǎn)。立足于文本,對圖像進(jìn)行檢索。試圖將傳統(tǒng)的文本檢索技術(shù)移植于對多媒體信息的檢索上,因?yàn)榛谖谋镜臋z索技術(shù)發(fā)展已經(jīng)成熟

12、。如Page-Rank方法、概率方法、位置方法、摘要方法、分類或聚類方法、詞性標(biāo)注法等,不僅技術(shù)發(fā)展較為成熟,同時分析和實(shí)現(xiàn)的難度略小。但是因?yàn)槭芸卦~匯本身的局限,易歧義,更新慢,所以不太容易應(yīng)對網(wǎng)絡(luò)上日新月異的各類圖像。立足于圖像內(nèi)容,對圖像進(jìn)行分析和檢索。相比而言,盡管圖像檢索已經(jīng)出現(xiàn)了諸如直方圖、顏色矩、顏色集等多種表征圖像特征的方法,但是要突破對低層次特征的分析,實(shí)現(xiàn)更高語義上的檢索,實(shí)現(xiàn)難度大,進(jìn)展慢。不過,基于內(nèi)容的圖像檢索建立在多媒體信息的內(nèi)容語義上,能夠更為客觀地反映媒體本質(zhì)的特征。結(jié)合文本和內(nèi)容,進(jìn)行融合性研究。發(fā)揮各自的優(yōu)勢促進(jìn)圖像的高效、簡單檢索方式的實(shí)現(xiàn),尤其是網(wǎng)絡(luò)環(huán)境

13、下,結(jié)合圖像所在Web文檔的特征分析,推斷圖像的特征,同時結(jié)合對圖像的內(nèi)容分析,共同標(biāo)引達(dá)到對圖像的分析和檢索??梢哉f,三個方向都是相互影響和促進(jìn)的,任何一個方向的進(jìn)展都會促進(jìn)圖像檢索技術(shù)向前更進(jìn)一步。發(fā)展趨勢:由于傳統(tǒng)的搜索引擎在設(shè)計(jì)方面存在局限性(集中式的體系機(jī)構(gòu),通過網(wǎng)絡(luò)爬行器收集信息),因此他們無法提供高準(zhǔn)確度、搜索實(shí)時更新的數(shù)據(jù)庫的服務(wù)。因此,開發(fā)一個新的搜索框架,支持“點(diǎn)對點(diǎn)”,按照層次進(jìn)行分布式搜索成為今后搜索引擎發(fā)展的趨勢。這種新的搜索框架包含了對個人文檔、局域網(wǎng)以及互聯(lián)網(wǎng)三個層次的搜索。當(dāng)搜索局域網(wǎng)或者是互聯(lián)網(wǎng)的時候,搜索將以分布方式執(zhí)行。同時,系統(tǒng)將能夠自動地把用戶的查詢分

14、發(fā)給相似的用戶或者是互聯(lián)網(wǎng)上最為合適的搜索引擎,以獲得更好的結(jié)果。 基于內(nèi)容編碼技術(shù)的研究,目前,國際上還沒有通用的基于內(nèi)容的編碼標(biāo)準(zhǔn)。20世紀(jì)90年代初,國際上就開始了對基于內(nèi)容的圖像信息檢索方面的研究。從基本的顏色檢索,到綜合利用多種圖像特征進(jìn)行檢索,大量原型系統(tǒng)已經(jīng)推出,其中,部分已投入到實(shí)際應(yīng)用中以檢驗(yàn)其有效性。同時,MPEG-7標(biāo)準(zhǔn)作為基于內(nèi)容的多媒體編碼標(biāo)準(zhǔn)也正在制定當(dāng)中,即將成為國際標(biāo)準(zhǔn)中的一員。因此,應(yīng)盡快對MPEG-7標(biāo)準(zhǔn)進(jìn)行研究,分析其編碼的實(shí)質(zhì),在此基礎(chǔ)上進(jìn)一步研究基于內(nèi)容檢索的系統(tǒng),使我國基于內(nèi)容的圖像檢索盡快走向?qū)嶋H應(yīng)用階段。對用戶查詢接口的研究,這涉及到用戶對圖像內(nèi)

15、容的感知表達(dá)、交互方式的設(shè)計(jì)、用戶如何形成并提交查詢等方面?,F(xiàn)代多媒體信息系統(tǒng)的一個重要特征就是信息獲取過程的可交互性,人在系統(tǒng)中是主動的。除了提供示例和描繪查詢基本接口之外,用戶的查詢接口應(yīng)提供豐富的交互能力,使用戶在主動的交互過程中表達(dá)對圖像語義的感知,調(diào)整查詢參數(shù)及其組合,最終獲得滿意的查詢結(jié)果。用戶的查詢接口應(yīng)該是直觀易用的,底層的特征選擇對用戶是透明的。這里涉及到如何把用戶的查詢表達(dá)轉(zhuǎn)換為可以執(zhí)行檢索的特征矢量,如何從交互過程中獲取用戶的內(nèi)容感知,以便選擇合適的檢索特征等問題。一個優(yōu)秀的搜索引擎必須處理以下幾個問題:(1)網(wǎng)頁的分類(2)自然語言的處理(3)搜索策略的調(diào)度和協(xié)作 (4)面向特定用戶的搜索。因此,現(xiàn)在有很多的網(wǎng)絡(luò)檢索工具,也就是說搜索引擎采用了智能的檢索手段來增強(qiáng)它的檢索能力,而圖片檢索正是其中的一大塊內(nèi)容。隨著網(wǎng)上多媒體的廣泛應(yīng)用,對圖像的檢索需求將會越來越迫切。未來的圖像檢索技術(shù)將是網(wǎng)絡(luò)技術(shù)和基于內(nèi)容的圖像庫檢索技術(shù)的結(jié)合。隨著多媒體信息處理技術(shù)的日益發(fā)展和深化,圖像信息的加工、處理和檢索標(biāo)準(zhǔn)的出臺,網(wǎng)上的圖像檢索技術(shù)將會日趨完善,而圖像搜索引擎也將成為Internet上的新寵。網(wǎng)絡(luò)檢索新技術(shù)還有:層級式導(dǎo)航瀏覽器、自動輔助編程、信息過濾器、主題檢索、三維世界的進(jìn)入及其檢索、智能檢索代理等等。存在的問題:由于搜索引擎技術(shù)的開發(fā)牽涉

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論