畢業(yè)設(shè)計(jì)(論文)-Web圖像檢索系統(tǒng)的設(shè)計(jì)_第1頁
畢業(yè)設(shè)計(jì)(論文)-Web圖像檢索系統(tǒng)的設(shè)計(jì)_第2頁
畢業(yè)設(shè)計(jì)(論文)-Web圖像檢索系統(tǒng)的設(shè)計(jì)_第3頁
畢業(yè)設(shè)計(jì)(論文)-Web圖像檢索系統(tǒng)的設(shè)計(jì)_第4頁
畢業(yè)設(shè)計(jì)(論文)-Web圖像檢索系統(tǒng)的設(shè)計(jì)_第5頁
已閱讀5頁,還剩44頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、摘要計(jì)算機(jī)處理能力的日益增強(qiáng),因特網(wǎng)技術(shù)的廣泛普及和網(wǎng)絡(luò)帶寬不斷提高,大量的圖像信息不斷產(chǎn)生,如何從這些海量圖像數(shù)據(jù)中搜索人們感興趣并有效利用這些圖像,成為迫切需要解決的問題。本設(shè)計(jì)首先以“Web圖像檢索為背景介紹了在Internet中檢索圖像的根本概念和常用的兩種重要技術(shù):基于文本的圖像檢索和基于內(nèi)容的圖像檢索,并簡要闡述了它們的根本概念、原理,說明了目前這一領(lǐng)域的開展現(xiàn)狀。其次重點(diǎn)介紹了圖像的內(nèi)容特征:顏色特征、紋理特征和形狀特征,和以圖像內(nèi)容特征為根底的Web圖檢索原理,對常用的對應(yīng)圖像檢索算法分別介紹和比照,并分析了其優(yōu)劣性。最后以基于內(nèi)容的圖像檢索為重點(diǎn),利用VC+編程工具對Web圖

2、像檢索系統(tǒng)進(jìn)行了模擬和驗(yàn)證。關(guān)鍵字:Web圖象檢索,特征提取,顏色直方圖,相似度 AbstractThe capacity of computer processing is in increasing , Internet technology is in popular with more and more people and network bandwidth broadens, Besides, a mass of image data information is being produced constantly ,so how to find sone image what p

3、eople are interested in and to use these effectively from the Web,become a urgent problem.Firstly, this project introduced the basic concept of Web image retrieval and two common but important technologys :based on text image retrieval and content-based image retrieval. and briefly describes their b

4、asic concept, principle and the current situation of the development of this field. Secondly ,it introduced the contents characteristic: color image features, the texture featuress and shape features, and theory of Web image retrieval that is based on these content features,meanwhile ,several import

5、ant image retrieval algorithms used are introduced and compared, and analysed their advantages and disadvantages. Finally ,to content-based image retrieval, Design a “Web image retrieval system to simulate and test by using VC+ 6.0 programming tool.Keywords: Web image retrieval, feature extraction,

6、color histogram ,similarity目 錄 TOC o 1-3 h z u HYPERLINK l _Toc262925956 摘要 PAGEREF _Toc262925956 h 1 HYPERLINK l _Toc262925957 Abstract PAGEREF _Toc262925957 h 2 HYPERLINK l _Toc262925958 目 錄 PAGEREF _Toc262925958 h 3 HYPERLINK l _Toc262925959 第一章 前 言 PAGEREF _Toc262925959 h 5 HYPERLINK l _Toc26292

7、5960 1.1 Web圖像檢索概述 PAGEREF _Toc262925960 h 5 HYPERLINK l _Toc262925961 1.2 圖像檢索方法的研究綜述 PAGEREF _Toc262925961 h 5 HYPERLINK l _Toc262925962 基于文本的檢索 PAGEREF _Toc262925962 h 5 HYPERLINK l _Toc262925963 基于內(nèi)容的圖像檢索技術(shù) PAGEREF _Toc262925963 h 6 HYPERLINK l _Toc262925964 圖像檢索技術(shù)研究的三個(gè)方向 PAGEREF _Toc262925964 h

8、 7 HYPERLINK l _Toc262925965 圖像檢索系統(tǒng)的性能指標(biāo)和評價(jià)準(zhǔn)那么 PAGEREF _Toc262925965 h 7 HYPERLINK l _Toc262925966 第二章 Web圖像檢索原理 PAGEREF _Toc262925966 h 9 HYPERLINK l _Toc262925967 2.1 基于文本的圖像檢索 PAGEREF _Toc262925967 h 9 HYPERLINK l _Toc262925968 2.2 基于內(nèi)容的圖像檢索 PAGEREF _Toc262925968 h 10 HYPERLINK l _Toc262925969 2.

9、2.1 體系結(jié)構(gòu) PAGEREF _Toc262925969 h 10 HYPERLINK l _Toc262925970 2.2.2 查詢模塊 PAGEREF _Toc262925970 h 10 HYPERLINK l _Toc262925971 特征提取模塊 PAGEREF _Toc262925971 h 11 HYPERLINK l _Toc262925972 2.2.4 常用的圖像特征 PAGEREF _Toc262925972 h 11 HYPERLINK l _Toc262925973 匹配模塊 PAGEREF _Toc262925973 h 12 HYPERLINK l _To

10、c262925974 相似性度量函數(shù) PAGEREF _Toc262925974 h 13 HYPERLINK l _Toc262925975 第三章 基于內(nèi)容的圖像顏色特征提取 PAGEREF _Toc262925975 h 15 HYPERLINK l _Toc262925976 常用的顏色模型 PAGEREF _Toc262925976 h 15 HYPERLINK l _Toc262925977 3.1.1 RGB模型 PAGEREF _Toc262925977 h 15 HYPERLINK l _Toc262925978 3.1.2 HSV模型 PAGEREF _Toc2629259

11、78 h 16 HYPERLINK l _Toc262925979 3.1.3 L*a*b模型 PAGEREF _Toc262925979 h 16 HYPERLINK l _Toc262925980 模型 PAGEREF _Toc262925980 h 16 HYPERLINK l _Toc262925981 顏色特征的提取 PAGEREF _Toc262925981 h 17 HYPERLINK l _Toc262925982 顏色直方圖 PAGEREF _Toc262925982 h 17 HYPERLINK l _Toc262925983 顏色矩 PAGEREF _Toc2629259

12、83 h 18 HYPERLINK l _Toc262925984 顏色聚合向量 PAGEREF _Toc262925984 h 18 HYPERLINK l _Toc262925985 圖像特征的相似性匹配 PAGEREF _Toc262925985 h 19 HYPERLINK l _Toc262925986 直方圖相交法 PAGEREF _Toc262925986 h 19 HYPERLINK l _Toc262925987 歐氏距離方法 PAGEREF _Toc262925987 h 20 HYPERLINK l _Toc262925988 模糊方法 PAGEREF _Toc26292

13、5988 h 20 HYPERLINK l _Toc262925989 第四章 基于內(nèi)容的圖像紋理特征提取 PAGEREF _Toc262925989 h 22 HYPERLINK l _Toc262925990 灰度共生矩陣 PAGEREF _Toc262925990 h 22 HYPERLINK l _Toc262925991 灰度共生矩陣的簡化計(jì)算 PAGEREF _Toc262925991 h 23 HYPERLINK l _Toc262925992 基于灰度共生矩陣的特征提取 PAGEREF _Toc262925992 h 24 HYPERLINK l _Toc262925993 綜

14、合顏色、紋理特征的檢索 PAGEREF _Toc262925993 h 24 HYPERLINK l _Toc262925994 第五章 圖像檢索系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn) PAGEREF _Toc262925994 h 26 HYPERLINK l _Toc262925995 系統(tǒng)開發(fā)環(huán)境介紹 PAGEREF _Toc262925995 h 26 HYPERLINK l _Toc262925996 系統(tǒng)需求分析 PAGEREF _Toc262925996 h 28 HYPERLINK l _Toc262925997 可行性分析 PAGEREF _Toc262925997 h 28 HYPERLINK l

15、 _Toc262925998 系統(tǒng)總體設(shè)計(jì) PAGEREF _Toc262925998 h 29 HYPERLINK l _Toc262925999 系統(tǒng)功能結(jié)構(gòu)圖 PAGEREF _Toc262925999 h 29 HYPERLINK l _Toc262926000 系統(tǒng)模塊設(shè)計(jì)與開發(fā) PAGEREF _Toc262926000 h 29 HYPERLINK l _Toc262926001 系統(tǒng)測試 PAGEREF _Toc262926001 h 38 HYPERLINK l _Toc262926002 結(jié)果分析 PAGEREF _Toc262926002 h 45 HYPERLINK l

16、 _Toc262926003 總結(jié) PAGEREF _Toc262926003 h 47 HYPERLINK l _Toc262926004 參考文獻(xiàn) PAGEREF _Toc262926004 h 48 HYPERLINK l _Toc262926005 致 謝 PAGEREF _Toc262926005 h 49第一章 前 言 Web圖像檢索概述從20世紀(jì)70年代開始,有關(guān)圖像檢索的研究就已開始,當(dāng)時(shí)主要是基于文本的圖像檢索技術(shù)Text-based Image Retrieval,簡稱TBIR,利用文本描述的方式描述圖像的特征,如繪畫作品的作者、年代、流派、尺寸等。到90年代以后,出現(xiàn)了對

17、圖像的內(nèi)容語義,如圖像的顏色、紋理、布局等進(jìn)行分析和檢索的圖像檢索技術(shù),即基于內(nèi)容的圖像檢索Content-based Image Retrieval,簡稱CBIR技術(shù)。CBIR屬于基于內(nèi)容檢索Content-based Retrieval,簡稱CBR的一種,CBR中還包括對動態(tài)視頻、音頻等其它形式多媒體信息的檢索技術(shù)。 在檢索原理上,無論是基于文本的圖像檢索還是基于內(nèi)容的圖像檢索,主要包括三方面:一方面對用戶需求的分析和轉(zhuǎn)化,形成可以檢索索引數(shù)據(jù)庫的提問;另一方面,收集和加工圖像資源,提取特征,分析并進(jìn)行標(biāo)引,建立圖像的索引數(shù)據(jù)庫;最后一方面是根據(jù)相似度算法,計(jì)算用戶提問與索引數(shù)據(jù)庫中記錄的

18、相似度大小,提取出滿足閾值的記錄作為結(jié)果,按照相似度降序的方式輸出。 為了進(jìn)一步提高檢索的準(zhǔn)確性,許多系統(tǒng)結(jié)合相關(guān)反應(yīng)技術(shù)來收集用戶對檢索結(jié)果的反應(yīng)信息,這在CBIR中顯得更為突出,因?yàn)镃BIR實(shí)現(xiàn)的是逐步求精的圖像檢索過程,在同一次檢索過程中需要不斷地與用戶進(jìn)行交互。1.2 圖像檢索方法的研究綜述目前,檢索的方法根本分為兩大類:基于文本的圖像檢索和基于內(nèi)容的圖像檢索?;谖谋镜臋z索基于文本的圖像檢索沿用了傳統(tǒng)文本檢索技術(shù),回避對圖像可視化元素的分析,而是從圖像名稱、圖像尺寸、壓縮類型、作者、年代等方面標(biāo)引圖像,一般以關(guān)鍵詞形式的提問查詢圖像,或者是根據(jù)等級目錄的形式瀏覽查找特定類目下的圖像,

19、如Getty AAT使用近133,000個(gè)術(shù)語來描述藝術(shù)、藝術(shù)史、建筑以及其它文化方面的對象,并推出30多個(gè)等級目錄,從7方面描述圖像的概念、物理屬性、類型和刊號等。又如Gograph將圖像分為動態(tài)圖像、照片、圖標(biāo)、背景、藝術(shù)剪輯圖、插圖、壁紙、界面、成套圖像8個(gè)一級類,下設(shè)數(shù)量不等的子類。在圖像數(shù)字化之前,檔案管理者、圖書管理員都是采用這種方式組織和管理圖像。 圖像所在頁面的主題、圖像的文件名稱、與圖像密切環(huán)繞的文字內(nèi)容、圖像的鏈接地址等都被用作圖像分析的依據(jù),根據(jù)這些文本分析結(jié)果推斷其中圖像的特征?,F(xiàn)階段,真正進(jìn)入普通意義上的實(shí)用階段的圖像檢索方法,根本上還都是采用了基于文本的檢索方法。這

20、種方法,實(shí)際上就是靠人工為圖像進(jìn)行標(biāo)注,用對圖像的一些描述信息來作為檢索時(shí)的關(guān)鍵字,如作者、標(biāo)題、大致內(nèi)容、創(chuàng)作時(shí)間等。廣泛流行的商用搜索引擎,如G00GLE、百度。這種檢索的策略,實(shí)際上是拋開了圖像信息本身,其實(shí)質(zhì)還是傳統(tǒng)的文本信息檢索。而且,顯而易見的是,由于不同的人對同一幅圖像可能有不同的理解,從而不可防止的造成了二義性。并且由于現(xiàn)實(shí)情況的復(fù)雜性,要建立能夠完整表達(dá)圖像信息的關(guān)鍵字是十分困難的,幾乎不可能辦得到。同時(shí),隨著圖像的不斷增多,人工標(biāo)注的工作量也會急劇攀升。所以,使用這種方法,雖然在一定程度上緩解了人們的迫切需要,但往往不能取得令人滿意的效果,應(yīng)用范圍受到極大的限制。所以說,基

21、于文本的圖像檢索方法,只能是權(quán)宜之策,而不是最終的解決之道?;趦?nèi)容的圖像檢索技術(shù)基于內(nèi)容的圖像檢索Content Based Image Retrieval,CBIR是基于內(nèi)容檢索技術(shù)Content Based Retrieval,CBR)的一種是近些年開展起來的側(cè)重于挖掘圖像本身特征的一種檢索策略。圖像的內(nèi)容即圖像的特征,而基于內(nèi)容的檢索就是通過兩幅圖像的特征匹配,即圖像特征的相似性度量來實(shí)現(xiàn)的。要進(jìn)行圖像特征匹配首先要進(jìn)行特征提取。圖像的特征分為低層物理特征(如顏色、紋理、形狀、輪廓等)和高層語意特征(是人對圖像的概念級的反映,如對圖像的個(gè)人感受等)。高層特征在目前的條件下,一般通過人工

22、注釋的方法來實(shí)現(xiàn),也就是前面說的基于文本的圖像檢索方法,這種方法要實(shí)現(xiàn)自動化有較大的困難,且主觀性太強(qiáng),不利于標(biāo)準(zhǔn)化的實(shí)現(xiàn)。而低層次的顏色、紋理、形狀等特征那么相對較容易提取,也可較客觀地反映圖像之間的差異。基于內(nèi)容的查詢方法和基于文本的查詢方法相比,有這樣幾個(gè)特點(diǎn):(l)采用從圖像中提取出來的顏色、紋理、形狀等真實(shí)特征來作為檢索的依據(jù),而不是人為的文字評價(jià);(2)對這些特征進(jìn)行相似性度量,即采用近似查詢的方法;(3)多采用例如查詢的方法QBE(QuerybyExamPle),即給出例如圖像,再從圖庫中查找與之相似的結(jié)果圖像來。如果將圖像檢索和圖像理解相比的話,兩者在根底技術(shù)上比較相似,但還是

23、存在著許多重要的不同之處的。比方,CBIR并不需要計(jì)算機(jī)識別出具體的目標(biāo)是什么,計(jì)算機(jī)可以在完全不了解具體內(nèi)容的意義的情況,而找出假設(shè)干幅類似的圖像來,另外,圖像檢索是模糊的相似性判斷,檢索結(jié)果應(yīng)盡可能包含圖像庫中的所有相關(guān)圖像,并且允許在結(jié)果中存在不相關(guān)的圖像,而不同于圖像識別那樣必須找出明確的、完全相似的內(nèi)容。采用CBIR方法開發(fā)的第一個(gè)功能較為齊全的系統(tǒng),要屬IBM公司Almadell研究中心開發(fā)的QBIC3(QuerybyImageContent)系統(tǒng),它可以利用顏色、紋理、形狀和草圖等多種方法進(jìn)行檢索,用戶只需給出例如圖像或草圖,就可方便地在圖像庫中找到相似的圖像來。圖像檢索技術(shù)研究

24、的三個(gè)方向基于文本和基于內(nèi)容是圖像檢索開展的兩個(gè)分支,不過從目前圖像檢索研究的趨勢而言,尤其結(jié)合網(wǎng)絡(luò)環(huán)境下列圖像的特征嵌入在具有文本內(nèi)容的Web文檔中,出現(xiàn)了三個(gè)不同的研究著眼點(diǎn)。 (1)立足于文本,對圖像進(jìn)行檢索:試圖將傳統(tǒng)的文本檢索技術(shù)移植于對多媒體信息的檢索上,因?yàn)榛谖谋镜臋z索技術(shù)開展已經(jīng)成熟。但是因?yàn)槭芸卦~匯本身的局限,易歧義,更新慢,所以不太容易應(yīng)對網(wǎng)絡(luò)上日新月異的各類圖像。 (2)立足于圖像內(nèi)容,對圖像進(jìn)行分析和檢索:相比而言,盡管圖像檢索已經(jīng)出現(xiàn)了諸如直方圖、顏色矩、顏色集等多種表征圖像特征的方法,但是要突破對低層次特征的分析,實(shí)現(xiàn)更高語義上的檢索,實(shí)現(xiàn)難度大,進(jìn)展慢。不過,基

25、于內(nèi)容的圖像檢索建立在多媒體信息的內(nèi)容語義上,能夠更為客觀地反映媒體本質(zhì)的特征。 (3)結(jié)合文本和內(nèi)容,進(jìn)行融合性研究:發(fā)揮各自的優(yōu)勢促進(jìn)圖像的高效、簡單檢索方式的實(shí)現(xiàn),尤其是網(wǎng)絡(luò)環(huán)境下,結(jié)合圖像所在Web文檔的特征分析,推斷圖像的特征,同時(shí)結(jié)合對圖像的內(nèi)容分析,共同標(biāo)引到達(dá)對圖像的分析和檢索。 以說,三個(gè)方向都是相互影響和促進(jìn)的,任何一個(gè)方向的進(jìn)展都會促進(jìn)圖像檢索技術(shù)向前更進(jìn)一步。圖像檢索系統(tǒng)的性能指標(biāo)和評價(jià)準(zhǔn)那么圖像檢索有兩種類型:圖像匹配和相似度檢索。設(shè)圖像庫有N福圖像。對于匹配問題,理想情況下是正確圖像是檢索結(jié)果V(X0)中第一個(gè)。通常用下面的式子評價(jià)匹配結(jié)果: 匹配比率=對相似度問題

26、,通常的方法是人工一個(gè)相似圖像子集S,假定S中圖像的相似性比S和非S圖像的相似度高。取XS,Precision-Recall曲線能全面反映檢索效果,下面稱為P-R曲線,其中:recall=, precision=,由于相似圖像集合S是人工選出的,這個(gè)評價(jià)標(biāo)準(zhǔn)不可辟免帶有主觀因素。不同人對相似度感受不同,因此在一定程度上不可取。此外,采用排序方法評價(jià)系統(tǒng)性能也是一種常用的方法。固定返回圖像集合的數(shù)目n,設(shè)R為相關(guān)圖像數(shù)目,p為相關(guān)圖像的排序序號,T為實(shí)際的相關(guān)圖像數(shù)目,評價(jià)參數(shù)為:AVPR=,LAVPR=,MT= , 其中AVPR是相關(guān)圖像的平均排序,LAVPR是理想的相關(guān)圖像的平均排序,MT為

27、喪失的相關(guān)圖像率。一般地,AVPR 和LAVPR越小,檢索算法越好,MT越好,性能越好。第二章 Web圖像檢索原理2.1 基于文本的圖像檢索基于文本的圖像檢索方法誕生于二十世紀(jì)70年代,是圖像檢索方法的常用技術(shù)之一,它利用人工進(jìn)行圖像語義識別,并用相應(yīng)的文本關(guān)鍵詞對圖像語義進(jìn)行注解以實(shí)現(xiàn)圖像的檢索。由于語言文字是人們進(jìn)行語義表達(dá)最直觀和熟知的手段,也是檢索技術(shù)中廣泛采用的檢索方法,故通過其實(shí)現(xiàn)的圖像檢索使得檢索形式較為簡便、且由于采用人工注解圖像語義,有效跨越了。語義鴻溝,從一定意義上說是基于語義的圖像檢索方法。在圖像規(guī)模較小的初期應(yīng)用中,這種方法有效地滿足了圖像的檢索需求,然而,隨著圖像檢索

28、應(yīng)用的不斷深入,利用人工提取圖像語義標(biāo)識以實(shí)現(xiàn)檢索的方法存在著一些明顯的缺陷:1、人工提取圖像語義標(biāo)識需要消耗大量的人力資源,尤其面對呈指數(shù)級增長態(tài)勢的圖像資源,完全依賴人工工作存在著明顯的效率問題;2、人工實(shí)現(xiàn)圖像語義標(biāo)識的提取過程存在著主觀片面性,圖像的語義豐富,充分理解圖像語義依賴于不同的知識結(jié)構(gòu)及理解能力,不同人對其理解存在著主觀差異性。因此,面對不斷增長的圖像資源檢索需求,如何高效、客觀地實(shí)現(xiàn)圖像語義的識別是影響基于文本的圖像檢索方法開展的瓶頸技術(shù)?;谖谋镜膱D像檢索結(jié)構(gòu)如下所示:圖像庫文本檢索人工標(biāo)注圖像關(guān)鍵字圖像文本數(shù)據(jù)結(jié)果輸出圖2.1 基于文本的圖像檢索系統(tǒng)構(gòu)成2.2 基于內(nèi)容

29、的圖像檢索.1 體系結(jié)構(gòu)本設(shè)計(jì)以VC+為開發(fā)環(huán)境實(shí)現(xiàn)了一個(gè)基于內(nèi)容的圖像檢索原型系統(tǒng)如圖2-2所示,主要用于驗(yàn)證各種特征提取算法的可行性和有效性。首先對用戶提交的例如圖像進(jìn)行特征提取,然后與圖像特征庫中的特征值進(jìn)行匹配,最后將檢索結(jié)果返回給用戶。系統(tǒng)的關(guān)鍵模塊包括查詢模塊、特征提取模塊、匹配模塊,實(shí)際應(yīng)用中每個(gè)模塊都有許多具體技術(shù)可以采用,下面主要討論各模塊的功能及相關(guān)實(shí)現(xiàn)技術(shù)。用戶界面圖像輸入模塊特征提取模塊查詢接口模塊圖像顯示模塊檢索匹配模塊圖像特征庫圖2.2 基于內(nèi)容的圖像檢索系統(tǒng)結(jié)構(gòu) 查詢模塊查詢模塊用于提供前端界面的有關(guān)查詢接口,用戶通過查詢界面訪問圖像庫從而找到滿足要求的圖像,檢索

30、結(jié)果也是通過這個(gè)接口返回給用戶。通常提供用戶查詢的方法有:(1)利用例如圖像:即用戶給定一幅與期望圖像類似的圖像作為查詢圖像。(2)利用繪制草圖:即用戶借助繪圖工具繪制出待查詢圖像。(3)利用主色調(diào)的檢索:用戶可以設(shè)置圖像顏色百分比和顏色分布信息,從而找到具有相似顏色及比率的圖像。特征提取模塊基于內(nèi)容的圖像檢索首先要解決的問題就是圖像內(nèi)容的分析和表示。圖像內(nèi)容的分析和表示指的是通過對圖像像素的顏色屬性以及像素間的相住關(guān)系進(jìn)行分析,從而得到一系列數(shù)字或者描述特征,這些特征可以在一定程度卜描述圖像本身的內(nèi)容。然后,利用這此特征可以對圖像建立索引,從而到達(dá)圖像檢索的目的。因此,圖像內(nèi)容的表示問題本質(zhì)

31、上是一個(gè)圖像特征的提取問題。從廣義上來講,圖像的特征包括圖像的底層特征和高層語義特征。底層特征用來描述圖像共有的特征,主要包括顏色、紋理、形狀等;后者那么用來描述圖像自身的內(nèi)容信息,比較抽象。本設(shè)計(jì)主要基于圖像底層特征的特征提取。系統(tǒng)中的特征提取模塊負(fù)責(zé)圖像處理工作,具體實(shí)現(xiàn)CBIR系統(tǒng)中支持的各種特征提取算法,從而能從圖像中提取相應(yīng)的特征信息。本節(jié)簡要地介紹幾種圖像特征。 常用的圖像特征1、顏色特征:顏色信息是在圖像檢索中使用最廣泛的底層特征,它和圖像中的物體和場景有找緊密的聯(lián)系。與其他底層特征相比,顏色特征對于圖像縮放、旋轉(zhuǎn)、遮擋及其他形變有更強(qiáng)的魯棒性。最早采用顏色特征進(jìn)行圖像檢索的是由

32、Swain和Ballard提出的基于顏色直方圖的檢索方法。圖像顏色特征的表達(dá)涉及如下幾個(gè)方面的問題:一是選擇一個(gè)適宜的顏色空間;二是將顏色特征量化為向量形式;三是定義種相似度(距離)標(biāo)準(zhǔn)用來度量不同圖像之間在顏色上的相似性。由于顏色特征和其他特征相比具有一定的穩(wěn)定性,不隨物體的平移、旋轉(zhuǎn)、觀察距離的變化而變化,對于圖像縮放、旋轉(zhuǎn)、遮擋及其他形變有著更強(qiáng)的變化。2、紋理特征:紋理也是圖像的一個(gè)重要屬性。航空、遙感照片、織物設(shè)計(jì)圖案、復(fù)雜的自然風(fēng)景以及動植物都有紋理。紋理特征有兩個(gè)要素構(gòu)成:(1)紋理基元;(2)基元的排列。紋理基元是一種或多種圖像基元的組合,有一定的現(xiàn)狀和大小。紋理由紋理基元排列

33、而成,。基元排列的疏密程度、周期性、方向性的不同,能使圖像的外觀產(chǎn)生極大地改變。紋理可以認(rèn)為是灰度(顏色)在空間以一定的形式變化而產(chǎn)生的圖案,是真實(shí)圖像區(qū)域固有的特征之一。類似于顏色,紋理也常取決于飛人們的感知,一般說來可以認(rèn)為紋理是由許多相似接近的、互相編織的元素構(gòu)成,所以直觀來說紋理描述可提供圖像區(qū)域的平滑、稀疏、規(guī)那么性等特性。3、形狀特征:形狀特征對于人類說是識別物體的主要信息,是一種重要的圖像內(nèi)容表達(dá)手段。按表達(dá)的形式分,可分為基于邊界的和基于區(qū)域的兩種類型。邊界特征包括:線型形狀,多邊形逼近,有限元模型和傅里葉描繪子。區(qū)域特征主要有矩不變量等。形狀特征是比顏色和紋理更高層一些的特征

34、,對形狀的表達(dá)比對顏色或紋理的表達(dá)從本質(zhì)上要復(fù)雜的多,圖像的形狀信息不隨圖像顏色等特征的變化而變化,是物體穩(wěn)定的特征。特別對于圖形,形狀是它唯一重要的特征。形狀特征的各種表示方法中一個(gè)重要標(biāo)準(zhǔn)是它必須具有仿射不變性,即相對于旋轉(zhuǎn)平移和尺度變換具有不變性。通常來說,形狀特征有兩種表示方法,一種是基于邊界輪廓特征(contour-based)的,包括:傅立葉形狀描述戶、小波輪廓描述子、邊界直方圖、鏈編碼、曲率尺度空間等,其中最典型的方法為傅立葉形狀描述子。一種是基于區(qū)域特征(region-based)的,如不變矩。前者只用到物體的外邊界,而后者那么關(guān)系到整個(gè)對象所在的區(qū)域。4、語義特征:圖像的視覺

35、特征在一定程度上能代表圖像包含的信息,但事實(shí)上,人們判斷圖像的相似性并非僅僅建立在視覺特征的相似性上更多的狀況下,用戶主要根據(jù)返回圖像的含義,而不是顏色、紋理、形狀等特征,來判別圖像滿足自己需要的程度這些圖像的含義就是圖像的高層語義特征,它包含了人對圖像內(nèi)容的理解基于語義的圖像檢索的目的,就是要使計(jì)算機(jī)檢索圖像的能力到達(dá)人的理解水平在一般的圖像內(nèi)容層次模型中,語義位于最高層;第2層和第3層之間的差異被許多學(xué)者稱為“語義鴻溝,語義鴻溝的存在是目前CBIR系統(tǒng)還難以被普通用戶接受的原因在某些狹窄的專業(yè)領(lǐng)域。比方指紋識別和醫(yī)學(xué)圖像檢索中,將圖像低層特征和高層語義建立某種聯(lián)系是可能的,但是在廣泛領(lǐng)域內(nèi)

36、,低層視覺特征與高層語義之間并沒有很直接的聯(lián)系。采用顏色、紋理、形狀等底層特征對圖像進(jìn)行的描述往往與人對圖像的描述存在較大的差異,直接利用這些特征作為檢索依據(jù)常得不到令人滿意的結(jié)果。解決這類問題的方法是采用高層的特征即“語義特征進(jìn)行檢索。由于它是從人類視覺理解出發(fā),著眼于提取圖像中符合人類視覺的概念?;谡Z義的檢索技術(shù)難度很大,是圖像檢索領(lǐng)域的研究方向。在語義級圖像檢索技術(shù)中,關(guān)鍵是實(shí)現(xiàn)語義的提取。這就要解決兩個(gè)問題:語義特征具有“模糊性,因此要提取圖像的語義特征就必須解決特征的“模糊化問題;語義特征與人的視覺理解緊密相關(guān),所以在檢索中要融入人的視覺感知,在“理解圖像的根底上檢索圖像。雖然采用

37、語義內(nèi)容進(jìn)行查詢是最符合人的使用要求的方式,也是理想的檢索方式,但是就當(dāng)前的計(jì)算機(jī)和圖像理解的開展水平來看,這種完全智能化的檢索方法前正處于研究階段,與實(shí)際應(yīng)用還有較大的距離。匹配模塊查詢模塊將用戶的查詢請求通過特征提取模塊轉(zhuǎn)換為查詢特征向量,然后調(diào)用匹配模塊計(jì)算特征庫中的侮一個(gè)特征與待查圖像特征的相似度,并按相似程度由大到小排列返回給用戶所需要的圖像。 基于內(nèi)容的圖像檢索系統(tǒng)所使用的匹配不是精確匹配而是一種基一于相似的檢索,它關(guān)心的是排序,選擇適宜的相似性度量函數(shù)很重要。目前研究圖像內(nèi)容的相似性度量是指圖像特征間的相似性,是圖像檢索研究的重要組成局部。相似性度量方法的好壞影響到圖像檢索的性能

38、;而相似性度量的計(jì)算復(fù)雜性影響到圖像檢索的用戶響應(yīng)時(shí)間。一般假設(shè)圖像特征矢量是距離空間中的元素(其中的元素稱為點(diǎn)),通過計(jì)算兩點(diǎn)之間的接近程度來衡量圖像特征之間的相似度。 相似性度量函數(shù) 對于圖像特征向量X, Y,假設(shè)滿足相似性度量中的正定性、對稱性和一三角不等性度量公理,它們之間的相似程度可以采用下面的距離度量或統(tǒng)計(jì)學(xué)方法來進(jìn)行圖像相似性判斷。定義D(I, J)為例如圖像I和圖像數(shù)據(jù)庫中圖像J之問的距離表示圖像I的N維特征向量中第i個(gè)特征向量。(1)Minkowski距離如果圖像特征向量互相獨(dú)立而且同等重要,那么可以采用Minkowski距離L。來度量圖像之間的相似性:D(I,J)=(-fi

39、(J)| p)這里當(dāng)P分別等于1,2,時(shí),D(I,J)稱為L1,L2,L3,L 。(2)歐幾里德距離歐幾里德趾離是一個(gè)應(yīng)用非常普遍的距離度量。它的計(jì)算簡單,并且與參考系統(tǒng)的旋轉(zhuǎn)不變量相關(guān)。它可以看作是當(dāng)p=2時(shí)的Murkowski距離吞,即L2=3)直方圖交距離(Histogram intersection)直方圖交距離(Histogram intersection) G可以認(rèn)為是L,距離的一種特殊形式,Swain等用直方圖交距離來計(jì)算圖像顏色之間的相似性。圖像I和圖像J的直方圖間的交距離定義為:S(I,J)=第三章 基于內(nèi)容的圖像顏色特征提取在圖像的形狀、顏色、紋理等特征中,顏色特征是最顯著

40、、最可靠、最穩(wěn)定的視覺特征,是人識別圖像的主要感知特征。相對幾何特征而言,顏色對圖像中子對象的大小和方向的變化都不敏感,具有相當(dāng)強(qiáng)的魯棒性。同時(shí),在許多情況下,顏色又是描述一幅圖像最簡便而有效的特征。人們對于幅圖像的印象,往往從圖像中顏色的空間分布開始。所有這些都促使顏色成為基一于內(nèi)容的圖像檢索所采取的主要手段,如何準(zhǔn)確充分的提取一幅圖像的顏色信息,井以適當(dāng)?shù)姆绞奖硎?,將改接影響整個(gè)系統(tǒng)的效率和精度。常用的顏色模型所謂顏色模型就是指某個(gè)三維顏色空間的一個(gè)一可見光一子集,它包含某個(gè)顏色域的所有顏色。顏色模型的用途是在某個(gè)顏色域內(nèi)方便地指定顏色,對于每一個(gè)顏色域都是可見光的子集,所以任何一個(gè)顏色模

41、型都無法包含所有可見光。 RGB模型所謂RGB模型,是指采用CIE規(guī)定的、以700nm(紅)、546.1nm(綠)、435.8(藍(lán))三個(gè)光色為三基元,及顏色的三個(gè)屬性所構(gòu)成的模型。該模型將自然界的顏色通過選用這三基色按照不同比例混合而形成的模型,該模型可以用如下立方體來示意:圖3.1 RGB顏色模型示意圖值得注意的是,RGB模型所覆蓋的顏色域取決于顯示設(shè)備熒光點(diǎn)的顏色特性,是與硬件相關(guān)的,與人的視覺感知有一定的距離,人們無法感知給定一個(gè)RGB值其所對應(yīng)的顏色,這時(shí)使用面向視覺感知的顏色模型比較方便。 HSV模型HSV空間是一種符合人類視覺感知特征的顏色空間,特別適合于人類肉眼對顏色的識別,因此

42、被廣泛應(yīng)用于計(jì)算機(jī)視覺領(lǐng)域。它把彩色信號表示為三種屬性:色調(diào)H(Hue)、飽和度S(Saturation)和亮度V(value),其中亮度又稱LightneSS或Intensity,所以HSV空間還有HLS和HIS這兩種叫法。HSV模型的色調(diào)H表示從一個(gè)物體反射過來的或透過物體的光的波長,更一般地說,色調(diào)是由顏色名稱來區(qū)分的,如紅、橙、黃、綠等,它用角度-180180或O360來度量。亮度V是顏色的明暗程度,通常用百分比度量,0%為最暗的黑色,而100%為最亮的白色。飽和度S指顏色的深淺程度,即在純色中包含的白色光的成份。例如同樣是紅色,也會因顏色濃度不同而分為深紅色、粉紅色和淺紅色。飽和度S

43、也用百分比來度量,從濃度最小的0%到濃度完全飽和的100%。色調(diào)H和飽和度S分量合起來定義了顏色的色度(Chromatieity)特性。 3. L*a*b模型L*a*b顏色模型是在1931年國際照明委員會(CIE)制定的顏色度量國際標(biāo)準(zhǔn)的根底上建立的。1976年,這種模型被重新修訂并命名為CIE L*a*b。L*a*b顏色設(shè)計(jì)為與設(shè)備無關(guān),不管使用什么設(shè)備創(chuàng)立或輸出圖像,這種顏色模型產(chǎn)生的顏色都保持一致。L*a*b顏色由亮度或光亮度分量(L)和兩個(gè)色度分量組成:即a分量(從綠到紅)和b分量(從藍(lán)到黃)。CMY模型以紅、綠、藍(lán)的補(bǔ)色青(eyan)、品紅(Magenta)、黃(Yellow)為原色

44、構(gòu)成的CMY顏色模型,常用于從白光中濾去某種顏色,又被稱為減性原色系統(tǒng)。CMY顏色模型對應(yīng)的直角坐標(biāo)系的子空間與RGB顏色模型所對應(yīng)的子空間幾乎完全相同。差異僅在于前者的原點(diǎn)為白,而后者的原點(diǎn)為黑。前者是定義在白色中減去某種顏色來定義一種顏色,而后者是通過從黑色中參加顏色來定義一種顏色。CMY模型以打印在紙張上油墨的光線吸收特性為根底,當(dāng)白光照射到半透明油墨上時(shí),局部光譜被吸收,局部被反射回眼睛。理論上,青(Cyna)、品紅(Magenta)、和黃(Yelolw)色素能夠合成吸收所有的顏色并產(chǎn)生黑色。因?yàn)樗写蛴∮湍紩恍╇s質(zhì),這三種油墨實(shí)際上產(chǎn)生一種土灰色,必須與黑色(K)油墨混合才能

45、產(chǎn)生真正的黑色。將這些油墨混合產(chǎn)生顏色稱為四色印刷。減色(CMY)和加色(RGB)是互補(bǔ)色,每對減色產(chǎn)生一種加色,反之亦然。選取適宜的顏色空間后,將采用有效的算法提取顏色特征,典型的表達(dá)方法有顏色直方圖法(Color Histogram),顏色矩(Color Moments),顏色聚合向量CCV (Color Coherence Vector),顏色相關(guān)圖(Color Correlograms)等。顏色直方圖基于顏色直方圖的特征表示其核心思想是在一定的顏色空間中對圖像中各種顏色出現(xiàn)的頻數(shù)進(jìn)行統(tǒng)計(jì)。彩色圖像的直方圖描述的是不同顏色在整幅圖像中所占的比例,而并不關(guān)心每種顏色所處的空間位置。所以顏色

46、直方圖特別適用于描述那些難以自動分割的圖像和不需要考慮物體空間位置的圖像。由于顏色直方圖具有尺度不變性和旋轉(zhuǎn)不變性,因此被廣泛采用。顏色直方圖是由橫坐標(biāo)為顏色級別,縱坐標(biāo)為顏色出現(xiàn)的頻率所繪成的圖形。它是顏色信息的函數(shù),表示圖像中具有相同顏色級別的像素的個(gè)數(shù)。全局直方圖是一種經(jīng)常被采用的顏色特征,已在很多圖像檢索系統(tǒng)中得到應(yīng)用。設(shè)C(x,y)為RGB空間一幅彩色圖像,其顏色直方圖的定義為:1, if C(x,y)=k0 , 其他Hc(k)=h(C(x,y) k= 0,1,kh(C(x,y)=其中,M、N為圖像C(x,y)垂直和水平方向上的像素?cái)?shù)目,并簡稱為圖像的高和寬;而k為變換空間的顏色數(shù)。

47、除此之外,還有如下幾種直方圖法:1、基于分塊顏色直方圖法,采用的分塊方法是把圖像分成單獨(dú)的NN塊,并且圖像分塊太大那么失去分塊的意義,不能充分包含顏色的分布信息,分塊太小那么會增加檢索過程的計(jì)算量。經(jīng)試驗(yàn)比較分析,對二維空間進(jìn)行33劃分是較有效的劃分方案。2、累加直方圖法:當(dāng)圖像中的特征并不能取遍所有可取值時(shí),統(tǒng)計(jì)直方圖中會出現(xiàn)一些零值。這些零值的出現(xiàn)會對計(jì)算直方圖的相交帶來很大影響,從而使得算出的匹配值并不能正確的反映兩圖間的顏色差異。累加直方圖是以顏色作為橫坐標(biāo),從坐標(biāo)原點(diǎn)到該顏色的所有顏色的像素出現(xiàn)的頻數(shù)為縱坐標(biāo)繪出的圖形。3 、局部累加直方圖:在HSI空間里,H=0根本對應(yīng)紅色,H=p

48、i/3根本對應(yīng)黃色,H=2pi/3根本對應(yīng)綠色。這樣在H軸上黃色與紅色間,黃色與綠色間距相等。但從人的視覺感知來講,黃色與紅色間,黃色與綠色間本無所謂哪兩個(gè)更相似。這說明色度信號的分布從視覺意義上講,并不滿足累加直方圖應(yīng)用的前提。所以,對色彩比較復(fù)雜的自然景物圖像,一般累加直方圖算法在檢索中就會將不同色度的信號混淆起來。另外,一幅圖像的顏色一般非常多,尤其是真彩色圖像,因此直方圖矢量的維數(shù)會非常高。如果能采用局部累加后降維,那么計(jì)算量要少得多。統(tǒng)設(shè)計(jì)中,我們采用Pi/3為區(qū)間的長度,將H軸共分成6個(gè)不重疊的局部區(qū)間60k, 60(k+1),k=0,1,5,通過分別計(jì)算每個(gè)局部區(qū)間的累加直方圖進(jìn)

49、行檢索。上述方法都保存了顏色在圖像中出現(xiàn)的概率信息,但也喪失了很多顏色的空間信息,因此不同的圖像有可能具有相同顏色特征表示。從劃分局部區(qū)域的角度來說可分為:基于固定塊的圖像分割、基于手工的區(qū)域分割、采用交互的半自動的區(qū)域分割以及一些自動的顏色分割方法。局部區(qū)域中的顏色信息可以表示為平均顏色、主顏色、顏色直方圖和二進(jìn)制顏色集等來表示。顏色直方圖還具有以下性質(zhì): 性質(zhì)一:直方圖中的數(shù)值都是統(tǒng)計(jì)而來的,描述了該圖像關(guān)于顏色的數(shù)量特征,可以反映圖像顏色的統(tǒng)計(jì)分布和根本色調(diào)。 性質(zhì)二:直方圖喪失了圖像的空間位置特征。因此,不同的圖像可能有相同的顏色分布,從而就具有相同的直方圖。性質(zhì)三:直方圖具有可疊加性

50、。如果將圖像劃分為假設(shè)干子區(qū)域,所有子區(qū)域的直方圖之和等于全局直方圖。顏色矩Stricker:和Orengo提出了顏色矩的方法33,認(rèn)為顏色分布信息主要集中在圖像顏色的低階矩中,因此僅采用一階(均值),二階(方差)和三階(斜度)等顏色矩可以很有效地表示圖像中的顏色分布。與顏色直方圖相比,該方法的另一個(gè)好處在于無需對特征進(jìn)行向量化。顏色矩己經(jīng)成功地應(yīng)用于許多基于內(nèi)容的圖像檢索系統(tǒng)(如QBIC)中。圖像的顏色矩一共只需九個(gè)分量:三個(gè)顏色分量,每個(gè)分量上三個(gè)低階矩,與它的顏色特征相比是非常簡潔的。但是顏色矩特征的分辨能力較低,一般起到過濾縮小范圍的作用,通常和其它特征結(jié)合使用。顏色聚合向量Pass等

51、提出以圖像的顏色聚合矢量CCV(color coherence vector)作為圖像的顏色特征,它是圖像直方圖的一種演變,其核心思想是當(dāng)圖像中顏色相似的像素所占據(jù)的連續(xù)區(qū)域的面積大于一定的閥值時(shí),該區(qū)域中的像素為聚合像素,否那么為非聚合像素,這樣統(tǒng)計(jì)圖像所包含的每種顏色的聚合像素和非聚合像素的比率稱為該圖像的顏色聚合矢量,在圖像檢索過程中匹配目標(biāo)圖像的聚合矢量和檢索圖像的聚合矢量,聚合矢量中的聚合信息在某種程度上保存了圖像顏色的空間信息。令定義為第i個(gè)聚合像素,為第j個(gè)非聚合像素,那么顏色聚合矢量(CCV)定義為:CCV=(1 ,1), (2, 2),(N , N)可以看出,(1 ,1),

52、(2, 2),(N , N)為圖像的顏色直方圖,由于參加了空間信息,采用顏色聚合向量CCV比采用顏色直方圖檢索的效果要好特別是對于大塊的均勻區(qū)域或者圖像中局部為紋理的圖像檢索效果更好。但是同時(shí)增大了計(jì)算量。3.3圖像特征的相似性匹配在基于文本的檢索方法中采用的是文本的精確匹配,而基于內(nèi)容的圖像檢索那么是通過計(jì)算查詢圖像和圖像庫中候選圖像之間在視覺特征上的相似度匹配進(jìn)行。因此,定義一個(gè)適宜的視覺特征相似度度量方法對檢索的效果有很大的影響。視覺特征大概可以表示成向量的形式,常用的相似度方法也是向量空間模型,即將視覺特征看作是向量空間中的點(diǎn),通過計(jì)算兩個(gè)點(diǎn)直接的接近程度來衡量圖像特征間的相似度。常見

53、的方法有:直方圖相交法、直方圖歐氏距離、直方圖余弦距離、二值集hammimg距離、直方圖二次距離度量、二值集二次距離、直方圖Mahalanobis距離。以下只簡要介紹系統(tǒng)中常用的直方圖的交、直方圖歐氏距離兩種距離度量方法。3直方圖相交法度量直方圖距離的一種經(jīng)典方法就是直方圖相交法。直方圖的相交是指兩個(gè)直方圖在每個(gè)bin維度中共有的像素?cái)?shù)量。具體做法是,根據(jù)顏色索引檢索出查詢圖像的顏色直方圖,將其與圖像庫中的每一圖像的直方圖取交集,根據(jù)交集的值來選出最正確匹配圖像。在直方圖相交法中,令HQ(K)和HR(K)分別為查詢圖像Q和圖像庫R的特征統(tǒng)計(jì)直方圖,那么二者之間的匹配值為:直方圖交集方法能對兩幅

54、圖像進(jìn)行詳細(xì)的比較,然而對于許多合成的圖像,如商標(biāo)等,它們有大量的一致顏色,三維直方圖只有幾個(gè)域的值很高,而其它許多域的顏色信息變化有限。因而,對于這樣的圖像進(jìn)行過細(xì)的比較是不必要的。又由于在掃描圖像時(shí)容易產(chǎn)生一些噪音,所以這種過細(xì)的比較容易產(chǎn)生錯(cuò)誤的結(jié)果。3歐氏距離方法我們可以利用歐基里德距離公式Euclidean Distance來計(jì)算距離。對于兩個(gè) N維直方圖x,y,兩者的歐氏距離可以表示如下: 此距離公式雖然簡單,但是與特定的顏色分布無關(guān),因此我們可以引入相關(guān)權(quán)值A(chǔ),這里A是一個(gè)維矩陣,此時(shí)距離公式可以表述如下: 為了簡化計(jì)算,將直方圖x,y標(biāo)準(zhǔn)化使其滿足: 矩陣,權(quán)表示顏色i與顏色j

55、之間的相似度。假設(shè)取z=x-y,那么有,取定了距離公式后,我們需要確定A的取值,且要保證此矩陣A能夠使,我們用表示顏色i與顏色j在RGB顏色空間的距離。 取。 有 因?yàn)?3模糊方法模糊理論是在美國加州大學(xué)伯克利分校電氣工程系的L.zadeh教授于1965年創(chuàng)立的模糊集合理論的數(shù)學(xué)根底上開展起來的,主要包括模糊集合理論、邏輯、模糊推理和模糊控制等方面的內(nèi)容。他認(rèn)為所有的自然語言均是模糊的,比方紅的和老的等概念沒有明確的內(nèi)涵和外延,因而是不明確的和模糊的??墒?,特定的環(huán)境中,人們用這些概念來描述某個(gè)具體對象時(shí)卻又能心領(lǐng)神會,很少引起誤解和歧義。模糊控制的根本思想:把人類專家對特定的被控對象或過程的

56、控制策略總結(jié)成一系列以IF(條件)THEN(作用)形式表示的控制規(guī)那么,通過模糊推理得到控制作用集,作用于被控對象或過程??刂谱饔眉癁橐唤M條件語句,狀態(tài)語句和控制作用均為一組被量化了的模糊語言集,如正大,負(fù)大,正小,負(fù)小,零等。模糊集理論是對傳統(tǒng)集合理論的一種推廣,在傳統(tǒng)集合理論中,一個(gè)元素或者屬于一個(gè)集合,或者不屬于一個(gè)集合;而對于模糊集來說,每一個(gè)元素都是以一定的程度屬于某個(gè)集合,也可以同時(shí)以不同的程度屬于幾個(gè)集合。對人們現(xiàn)實(shí)生活中大量使用的一些含義確定但又不準(zhǔn)確的語言表達(dá),比方“今天天氣很熱、“車速過高,需要適當(dāng)踩剎車等,用模糊數(shù)學(xué)可以很好的表達(dá)。第四章 基于內(nèi)容的圖像紋理特征提取紋理分

57、析在計(jì)算機(jī)視覺、模式識別以及數(shù)字圖像處理中起著重要的作用。紋理可以用來探測和區(qū)分不同的物體和區(qū)域、推斷物體的外表方向、研究物體的形狀、區(qū)分各種物體所具有的不同的紋理類型。紋理是人眼視覺的重要組成局部,反映了物體的深度和外表信息,表達(dá)了物體外表顏色和灰度的某種變化,而這些變化又與物體本身的屬性有關(guān),是圖像的固有特征之一。紋理基元有兩類特征:一類是紋理基元本身的性質(zhì),如形狀和大??;另一類特征是紋理基元之間的方向結(jié)構(gòu)關(guān)系,如基元的排列方式、疏密、周期性及方向性。這兩類特征的不同,能使圖像的外觀產(chǎn)生極大的改變,同時(shí)這兩類特征之間還具有一定的依存關(guān)系。這里,我們認(rèn)為紋理是像素灰度值在空間區(qū)域的變化模式。

58、這個(gè)定義對于大多數(shù)圖像處理過程來說是適宜的,因?yàn)楹芏鄷r(shí)候我們只關(guān)心圖像的灰度分布。數(shù)字圖像中的紋理是相鄰像素的灰度或顏色的空間相關(guān)性,或是圖像灰度和顏色隨空間位置變化的視覺表現(xiàn),使用數(shù)學(xué)或信息論的方法抽取的紋理度量稱為紋理特征。由于紋理特征可用來對圖像中的空間信息進(jìn)行一定程度的定量描述,因此也是基于內(nèi)容的圖像檢索中一個(gè)重要手段。它不僅反映圖像的灰度統(tǒng)計(jì)信息,而且反映圖像的空間分布信息和結(jié)構(gòu)信息。根據(jù)人類視覺的感知,可用來描述紋理的性質(zhì)有:均勻性(uniformity )、密度(density )、粗細(xì)度(coarseness )、粗糙度(roughness )、規(guī)律性(regularity )

59、 ,線性度(linearity )、定向性(directionality )、方向性(direction )、頻率(frequency )和相位(phase )。上一章討論的顏色特征無疑是圖像視覺的重要感知特征,但是由于把圖像的綜合信息僅壓縮到某一顏色空間,對于圖像特征信息有時(shí)表示能力缺乏,易出現(xiàn)顏色相近而視覺相差甚遠(yuǎn)的情況。兩幅顏色分布相近但紋理不同的圖像,語義信息也不同。假設(shè)僅按照顏色特征進(jìn)行檢索勢必會造成檢索準(zhǔn)確性的降低。如果引入圖像的紋理特征,在進(jìn)行相似性檢索時(shí)會拉大兩幅圖像的相似性距離,使圖像的檢索結(jié)果更精確。統(tǒng)計(jì)分析的方法利用紋理的統(tǒng)計(jì)特性和規(guī)律來描述紋理,它適用于像木紋、砂地、草

60、坪那樣的細(xì)而不規(guī)那么的自然紋理,也同樣適用于人工紋理,是最早應(yīng)用在紋理分析中的方法之一。統(tǒng)計(jì)方法從根據(jù)像素灰度值的統(tǒng)計(jì)分析出發(fā),推導(dǎo)出一些統(tǒng)計(jì)量表達(dá)紋理特征。灰度共生矩陣是描述在方向上,相隔S像元距離的一對像元,分別具有灰度值i和j的出現(xiàn)概率,其元素可記為P(i, j)s,)簡記為,。顯然灰度共生矩陣是一個(gè)對稱矩陣,其階數(shù)由圖像中的灰度級個(gè)數(shù)決定。假設(shè)灰度圖像f(x,y)其灰度級數(shù)為L,那么有?;叶裙采仃嚨母髟刂涤上率角蟮?P(i,j|s,)= ,假設(shè)給定如下的僅具有3個(gè)灰度級的圖像區(qū)域,分別記數(shù)符合上述位置算子的像素空間組合的數(shù)目形成頻度矩陣,再將其歸一化,即除以符合位置關(guān)系的總數(shù)就得到

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論