基于內(nèi)容的圖像檢索_第1頁(yè)
基于內(nèi)容的圖像檢索_第2頁(yè)
基于內(nèi)容的圖像檢索_第3頁(yè)
基于內(nèi)容的圖像檢索_第4頁(yè)
基于內(nèi)容的圖像檢索_第5頁(yè)
已閱讀5頁(yè),還剩23頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、. . . 基于容的圖像檢索方法的研究摘要近年來(lái),隨著多媒體技術(shù)和計(jì)算機(jī)互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,數(shù)字圖像的數(shù)量正以驚人的速度增長(zhǎng)。面對(duì)日益豐富的圖像信息海洋,人們需要有效地從中獲取所期望得到多媒體信息。因此,在大規(guī)模的圖像數(shù)據(jù)庫(kù)中進(jìn)行快速、準(zhǔn)確的檢索成為人們研究的熱點(diǎn)。為了實(shí)現(xiàn)快速而準(zhǔn)確地檢索圖像,利用圖像的視覺(jué)特征,如顏色、紋理、形狀等來(lái)進(jìn)行圖像檢索的技術(shù),也就是基于容的圖像檢索技術(shù)(CBIR)應(yīng)運(yùn)而生。其中,顏色特征作為圖像的一種重要的視覺(jué)特征,已得到廣泛的應(yīng)用。本文主要研究基于圖像顏色特征的檢索。選用基于顏色直方圖的算法,并利用Visual Basic程序設(shè)計(jì)語(yǔ)言和Access數(shù)據(jù)庫(kù)技術(shù)設(shè)

2、計(jì)實(shí)現(xiàn)了基于顏色直方圖算法的圖像檢索系統(tǒng)。主要做法是:采用符合人類視覺(jué)特征的HSV顏色空間來(lái)表示圖像的顏色特征,利用人對(duì)顏色的感知來(lái)對(duì)顏色分量進(jìn)行非等間隔的量化并形成特征矢量,用相似性度量函數(shù)進(jìn)行圖像的相似性匹配,從而實(shí)現(xiàn)圖像的檢索。關(guān)鍵字:圖像數(shù)據(jù)庫(kù);CBIR;顏色直方圖;相似距離The Research of Content-based Image Retrieval MethodABSTRACTWith the rapid development of multimedia and computer network technique, the quantity of digital i

3、mage and video is going up fabulously. Facing the vast ocean of information of image, it has a good sense to obtain the desired multimedia information.Currently, rapid and effective searching for desired image from large-scale image databases becomes an hot research topic. In order to retrieve image

4、 quickly and accurately using image visual features such as color, texture, shape,which named content-based image retrieval (CBIR) came into being. Among them, the color features as an important visual features of the image has been widely used. This paper studies the retrieval based on image color

5、characteristics. Using algorithm based on color histogram, and the Visual Basic programming language and Access Database Design toimplement the image retrieval system based on color histogram algorithm. The main approach is: to represent the image's color characteristics consistent with human vi

6、sual characteristics of the HSV color space, using the perception of color to the color component unequal interval quantization and to form a feature vector, using measure function to match image similarity, in order to achieve image retrieval.Key words: Image database; CBIR; Color histogram; Simila

7、rity distance23 / 28目錄前言11.1課題背景與研究意義11.2基于容的圖像檢索技術(shù)研究的現(xiàn)狀和發(fā)展方向11.3本文主要研究容22基于容的圖像檢索32.1概念32.2特點(diǎn)32.3CBIR過(guò)程的一般框架33圖像特征提取與相似性度量53.1圖像的文件格式53.2顏色模型63.2.1RGB顏色空間63.2.2HSV顏色空間73.2.3RGB 顏色空間到 HSV 顏色空間的轉(zhuǎn)換73.3顏色量化83.4顏色直方圖83.5基于子塊顏色直方圖算法93.6圖像的相似性度量103.6.1圖像的相似度103.6.2相似度計(jì)算公式104基于顏色特征的圖像檢索系統(tǒng)設(shè)計(jì)和實(shí)現(xiàn)124.1系統(tǒng)結(jié)構(gòu)設(shè)計(jì)12

8、4.2圖像特征數(shù)據(jù)庫(kù)設(shè)計(jì)124.3系統(tǒng)開(kāi)發(fā)環(huán)境124.4系統(tǒng)流程134.5系統(tǒng)的實(shí)現(xiàn)134.5.1圖像的獲取134.5.2圖像特征的提取144.5.3圖像的檢索165總結(jié)18參考文獻(xiàn)19致20前言1.1課題背景與研究意義近年來(lái),伴隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)和多媒體數(shù)據(jù)庫(kù)技術(shù)的迅猛發(fā)展,特別是大量圖像數(shù)據(jù)的廣泛應(yīng)用,實(shí)現(xiàn)圖像檢索成為多媒體數(shù)據(jù)庫(kù)中最基本也是最普遍的要求。傳統(tǒng)的圖像檢索是基于文本方式,對(duì)圖像庫(kù)中的每一幅圖像使用關(guān)鍵字進(jìn)行標(biāo)記,然后利用文字屬性的匹配進(jìn)行對(duì)圖像的檢索。這種基于文本的圖像檢索需要人工注解的工作量很大,且文本描述很難準(zhǔn)確的表達(dá)圖像中豐富的信息,常常會(huì)因?yàn)椴煌藢?duì)同一容的描述方式不

9、同而千差萬(wàn)別,造成檢索的準(zhǔn)確程度降低。在信息需求的不斷增加和日益迫切的今天,原始的圖像檢索系統(tǒng)已經(jīng)遠(yuǎn)遠(yuǎn)不能滿足要求。因此,基于容的圖像檢索技術(shù)的研究越來(lái)越成為人們研究的熱點(diǎn)。特別是多媒體容描述接口MPEG-7MPEG的全名為Moving Pictures Experts Group,中文譯名是動(dòng)態(tài)圖像專家組。的制定和完善,更加推動(dòng)了這一技術(shù)的開(kāi)發(fā)和運(yùn)用?;谌莸膱D像檢索技術(shù)對(duì)促進(jìn)圖像技術(shù)的發(fā)展具有重要的作用。首先,在檢索圖像的準(zhǔn)確度上,基于容的圖像檢索技術(shù)把圖像的顏色、形狀、紋理等視覺(jué)特征作為圖像的容來(lái)查找和匹配圖像,通過(guò)算法實(shí)現(xiàn)圖像特征的提取和圖像間的相似性匹配,提高了檢索結(jié)果的準(zhǔn)確性。其次

10、,隨著數(shù)據(jù)庫(kù)技術(shù)研究的深入、計(jì)算機(jī)視覺(jué)以與人工智能的發(fā)展,我們可以對(duì)圖像的這些特征進(jìn)行自動(dòng)的提取和匹配,大大減少了人工的工作量,從而在提高檢索準(zhǔn)確度的同時(shí),降低了圖像檢索所需要的時(shí)間。目前,這項(xiàng)技術(shù)已經(jīng)廣泛應(yīng)用于圖像的網(wǎng)絡(luò)搜索、遙感、數(shù)字圖書(shū)館、計(jì)算機(jī)輔助設(shè)計(jì)、地理信息系統(tǒng)、商標(biāo)管理等諸多領(lǐng)域,具有廣闊的應(yīng)用前景。1.2基于容的圖像檢索技術(shù)研究的現(xiàn)狀和發(fā)展方向目前,對(duì)圖像的檢索在圖像索引與研究中應(yīng)用最為廣泛,基于圖像顏色特征、紋理特征、形狀特征和物體空間方位的檢索方法是比較成熟的幾種。近年來(lái),基于容的圖像檢索引起了多交叉學(xué)科研究人員的注意。在國(guó)外,特別是在美國(guó)等發(fā)達(dá)國(guó)家,這項(xiàng)技術(shù)已成為一個(gè)研究

11、熱點(diǎn)。一些科研部門(mén)、高等院校、商業(yè)公司甚至于政府機(jī)構(gòu)都紛紛投入大量人力和物力進(jìn)行系統(tǒng)的研究和開(kāi)發(fā),以期取得領(lǐng)先地位。目前已經(jīng)推出了一些CBIR系統(tǒng)的產(chǎn)品,如美國(guó)的IBM公司、Virage和Excalibur都已經(jīng)開(kāi)發(fā)出了的基于圖像容的相似性特征的圖像庫(kù)檢索引擎,并在網(wǎng)上提供了演示站點(diǎn)。國(guó)的研究主要集中在基于圖像顏色的查詢,也有一部分基于紋理和形狀的查詢。自20世紀(jì)90年代以來(lái),基于容的圖像檢索成為一個(gè)研究熱點(diǎn)。目前,該技術(shù)已成功應(yīng)用于人臉識(shí)別技術(shù);針對(duì)商標(biāo)與設(shè)計(jì)專利類的圖像進(jìn)行檢索,防止專利糾紛的產(chǎn)生。除此之外,它還可以解譯影像數(shù)據(jù)中的建筑、村莊、耕地等不同種類的地形信息,實(shí)現(xiàn)對(duì)遙感圖像的檢索

12、?;谌莸膱D像檢索技術(shù)研究的發(fā)展方向主要有:(1)兩類圖像檢索技術(shù)的結(jié)合傳統(tǒng)的圖像搜索引擎主要側(cè)重于對(duì)圖像容的文本描述,而圖像庫(kù)檢索技術(shù)則更側(cè)重于通過(guò)算法對(duì)圖像容的特征的提取和匹配,它們雖然側(cè)重不同卻相互補(bǔ)充。如果能將二者結(jié)合起來(lái),取長(zhǎng)補(bǔ)短,則圖像檢索技術(shù)必將會(huì)有新的進(jìn)展。(2)對(duì)基于容的編碼技術(shù)的研究自20世紀(jì)90年代起,國(guó)際上就有了對(duì)基于容的圖像檢索技術(shù)的研究。從基本的顏色檢索,到綜合利用多種圖像特征進(jìn)行檢索,推出了大量原型系統(tǒng)。其中,部分已經(jīng)投入到實(shí)際應(yīng)用中并取得良好效果。在Internet環(huán)境下,MPEG專家組制定了一個(gè)基于容的多媒體描述方案,即MPEG-7標(biāo)準(zhǔn),對(duì)各種不同類型的多媒體

13、信息容的描述方式進(jìn)行了標(biāo)準(zhǔn)化定義,從而實(shí)現(xiàn)CBIR與TBIR(基于圖像文本特征的檢索)的互連。總之,該項(xiàng)技術(shù)在實(shí)際中的應(yīng)用會(huì)越來(lái)越廣泛,而且必將在各個(gè)領(lǐng)域當(dāng)中占據(jù)主導(dǎo)地位,并帶動(dòng)相關(guān)產(chǎn)業(yè)的發(fā)展,促進(jìn)多媒體信息化的交流。1.3本文主要研究容本文在介紹基于顏色特征的圖像檢索技術(shù)的基礎(chǔ)上,將顏色直方圖作為研究重點(diǎn),對(duì)CBIR技術(shù)進(jìn)行了較為全面的研究,以多媒體圖像數(shù)據(jù)庫(kù)為平臺(tái),將CBIR作為一種信息檢索技術(shù),應(yīng)用到圖像數(shù)據(jù)庫(kù)中,作為檢索引擎來(lái)實(shí)現(xiàn)基于顏色特征的圖像檢索功能。(1)詳細(xì)討論了常見(jiàn)的顏色特征表示方法以與從RGB模型到HSV模型的轉(zhuǎn)換和顏色特征的提取方法,采用符合人類視覺(jué)感知特征的HSV模型

14、來(lái)提取顏色特征,并按照人的視覺(jué)分辨能力將顏色量化為36柄的一維特征向量。(2)運(yùn)用相似性度量算法,用戶可以根據(jù)自己的興趣,針對(duì)不同的區(qū)域,靈活地調(diào)整權(quán)重系數(shù),更準(zhǔn)確地實(shí)現(xiàn)圖像顏色特征的匹配。(3)在開(kāi)發(fā)工具上,選用Visual Basic 6.0程序設(shè)計(jì)語(yǔ)言,對(duì)圖像進(jìn)行了定義,完成圖像特征的讀入和提取,用Access數(shù)據(jù)庫(kù)存放圖像的特征索引向量,并通過(guò)顏色匹配算法實(shí)現(xiàn)基于圖像顏色特征的檢索功能。2基于容的圖像檢索2.1概念基于容的圖像檢索(CBIR)是指根據(jù)圖像顏色、紋理、形狀等視覺(jué)特征,從已定的圖像庫(kù)中查找含有特定特征的圖像。與傳統(tǒng)的圖像檢索手段不同,它融合了圖像理解技術(shù),在輸入圖像的同時(shí)將

15、其相應(yīng)的特征向量也存入特征庫(kù)。在進(jìn)行圖像檢索時(shí),對(duì)每一幅給定的關(guān)鍵圖,進(jìn)行圖像分析,并提取圖像的特征向量。將該圖像的特征向量和特征庫(kù)中的特征向量進(jìn)行匹配,根據(jù)相似距離的大小在圖像庫(kù)中進(jìn)行搜索就可以得到所需要的檢索圖了。2.2特點(diǎn)CBIR 方法利用圖像的視覺(jué)特性,實(shí)現(xiàn)了用圖像來(lái)檢索圖像。這比利用傳統(tǒng)的文字標(biāo)注等要有效的多。基于容的圖像檢索是根據(jù)圖像的顏色 、形狀、紋理等特征以與這些特征的組合來(lái)查詢圖像的,這是計(jì)算機(jī)圖像處理和數(shù)據(jù)庫(kù)技術(shù)的很好的結(jié)合。它具有以下幾個(gè)顯著的特點(diǎn)1:(1)用于檢索的是反映圖像容的各種量化特征;(2)使用基于相似性度量的近似查詢;(3)大多采用實(shí)例查詢QBE(Query

16、By Example)方法。對(duì)于基于容的圖像檢索有三個(gè)關(guān)鍵:一是要選取恰當(dāng)?shù)膱D像特征;二是要采取有效的特征提取算法;三是要有準(zhǔn)確的特征匹配算法。2.3CBIR過(guò)程的一般框架CBIR系統(tǒng)可以看作是一個(gè)用戶和圖像數(shù)據(jù)庫(kù)之間的一個(gè)界面或通道2,其過(guò)程的一般框架可以描述為如圖2-1。用戶界面查詢描述匹配驗(yàn)證提取圖像庫(kù)圖2-1基于容的圖像檢索各模塊的作用:(1)查詢模塊:為用戶提供多樣的查詢手段,以支持用戶進(jìn)行多種類型的查詢;(2)描述模塊:將用戶查詢的外部表達(dá)轉(zhuǎn)化成為對(duì)圖像信息容的部表達(dá)和描述;(3)匹配模塊:將查詢描述與庫(kù)中被查詢信息的描述進(jìn)行匹配,確定它們?nèi)莸囊恢滦院拖嗨菩?;?)提取模塊:把滿足

17、既定條件的信息自動(dòng)的從庫(kù)中提取出來(lái);(5)驗(yàn)證模塊:為用戶提供方便的驗(yàn)證手段以評(píng)價(jià)提取的效果。目前,很多基于容的圖像檢索系統(tǒng)中還包含有用戶反饋機(jī)制,其主要功能是收集檢索出的圖像信息,根據(jù)用戶自己的期望,對(duì)搜索到的圖像進(jìn)行粗略的判斷,然后修改查詢信息并提交給查詢模塊。3圖像特征提取與相似性度量基于容的圖像檢索系統(tǒng)在進(jìn)行圖像檢索的過(guò)程中,將關(guān)鍵圖和被檢索的圖像進(jìn)行圖像分析,提取出這些圖像的特征向量,再將關(guān)鍵圖的特征向量和被檢索的圖像的特征向量進(jìn)行相似性匹配,根據(jù)相似距離檢索到期望的圖像。由這個(gè)工作原理可知,該系統(tǒng)的關(guān)鍵點(diǎn)包括:選取恰當(dāng)?shù)膱D像格式,以便提取其有效的顏色特征;選擇準(zhǔn)確的特征匹配算法,從

18、而實(shí)現(xiàn)圖像的相似性匹配。因此,如何恰當(dāng)?shù)奶崛☆伾卣?,以與對(duì)顏色特征如何進(jìn)行有效地抽取和匹配也就成為CBIR研究領(lǐng)域的重點(diǎn)。3.1圖像的文件格式本文采用的圖像格式是BMP格式。BMP文件是常見(jiàn)的圖像文件格式之一,是 Windows 操作系統(tǒng)中的標(biāo)準(zhǔn)文件格式。由于不進(jìn)行圖像壓縮,所以BMP圖像文件能夠表達(dá)豐富的色彩信息。BMP圖像文件的結(jié)構(gòu)可以分為四個(gè)部分:文件頭數(shù)據(jù)結(jié)構(gòu)、文件信息數(shù)據(jù)結(jié)構(gòu)、調(diào)色板以與圖像數(shù)據(jù)。其中,文件頭的長(zhǎng)度為固定值54個(gè)字節(jié);調(diào)色板數(shù)據(jù)對(duì)所有的不超過(guò)256色的圖像模式都需要進(jìn)行設(shè)置,即使是單色圖像模式也不例外;圖像數(shù)據(jù)既可以采用一定的壓縮算法進(jìn)行處理,也可以不必對(duì)圖像處理軟

19、件進(jìn)行壓縮處理,這不僅與圖像文件的大小有關(guān),而且也與對(duì)應(yīng)的圖像處理軟件是否支持經(jīng)過(guò)壓縮處理的BMP圖像文件相關(guān)3。圖像文件的文件頭和文件信息頭的定義形式如下:(1)文件頭(BITMAPFILEHEADER)Public Type bitmapfileheaderbftype As Integerbfsize As Longbfreserved1 As Integerbfreserved2 As Integerbfofbits As LongEnd Type該程序中定義了BMP文件的類型、大小,以與圖像數(shù)據(jù)的偏移量,即從文件頭開(kāi)始多少個(gè)字節(jié)后是圖像數(shù)據(jù)的起始。(2)文件信息頭(BITMAPINF

20、OHEADER)Public Type bitmapinfoheaderbisize As Longbiwidth As Longbiheight As Longbiplanes As Integerbibitcount As Integerbicompress As Longbisizeimage As Longbixpelspermeter As Longbiypelspermeter As Longbicirused As LongBMP文件信息頭基本上包含圖像的所有重要的信息,包括寬度、高度和每像素的位數(shù)。3.2顏色模型所謂顏色模型2是指某個(gè)三維顏色空間中的一個(gè)可見(jiàn)光子集,包括某個(gè)顏色

21、域的所有顏色。常見(jiàn)的顏色模型包括RGB(紅、綠、藍(lán)),HSV(色調(diào)、飽和度、亮度),CMYK(青、洋紅、黃、黑)等。其中,HSV空間是一種符合人類視覺(jué)感知特征的顏色空間,特別適合于人類肉眼對(duì)顏色的識(shí)別,因此被廣泛應(yīng)用于計(jì)算機(jī)視覺(jué)領(lǐng)域。3.2.1RGB顏色空間RGB 顏色空間是一種常用的顏色空間。目前,圖像采集系統(tǒng)以與彩色顯示器等硬件顯示設(shè)備大都采用了 RGB 顏色空間來(lái)表示顏色。數(shù)字圖像一般也都采用這一顏色空間來(lái)表示。如圖 3-1所示,RGB顏色模型是三維直角坐標(biāo)顏色系統(tǒng)的一個(gè)單位正方體。它以紅(R)、綠(G)、藍(lán)(B)作為三基色。在空間坐標(biāo)系的原點(diǎn)上,三基色的亮度均為零,此時(shí)代表黑色;當(dāng)三基

22、色同時(shí)達(dá)到最高亮度時(shí)為白色;由等量的三基色組合而成的顏色是灰色,這些灰色點(diǎn)均落在RGB彩色立方體的對(duì)角線上。白黑品紅藍(lán)青紅黃綠圖3-1RGB顏色空間雖然RGB空間模型在實(shí)際生活中廣泛應(yīng)用,但是它并不具有視覺(jué)一致性,不符合人對(duì)顏色的感知心理,且RGB顏色空間上的距離并不代表人眼視覺(jué)上的差異。因此,需要用另一種符合人的視覺(jué)感知的顏色模型來(lái)表示顏色。3.2.2HSV顏色空間藍(lán)2400品紅H綠1200黃青紅00SVHSV顏色空間具有視覺(jué)一致性,它比RGB顏色空間更符合人的視覺(jué)特性。HSV顏色空間把常見(jiàn)顏色表示為三種屬性:色調(diào) H(Hue)、飽和度S(Saturation)和亮度 V(Value)。HS

23、V模型對(duì)應(yīng)于圓柱體坐標(biāo)系的一個(gè)圓錐子集。圓錐的頂面對(duì)應(yīng)于V=1,色調(diào)H又繞V軸給定,飽和度S取值從0到1,由圓心向圓周過(guò)度。H表示色調(diào)信息,即所處的光譜顏色的位置,通常由顏色名稱來(lái)辨別,如紅、橙、黃、綠等,它用角度-180180或0360來(lái)度量。飽和度S為一比例值,指顏色的深淺程度,圍從0%到濃度完全飽和的100%,它表示所選顏色的純度和該顏色最大的純度之間的比率,即在純色中包含白色光的成分。V表示色彩的明亮程度, 0%為最暗的黑色,而100%為最亮的白色3。HSV顏色模型如圖3-2所示。圖 3-2HSV 顏色空間模型HSV顏色空間直接對(duì)應(yīng)于人眼色彩視覺(jué)特征的三要素,通道之間各自獨(dú)立,因此可以

24、獨(dú)立感知各顏色分量的變化,其中色調(diào)尤其影響著人的視覺(jué)判斷。因此在基于容的圖像檢索中,應(yīng)用這種顏色空間模型會(huì)更適合用戶的視覺(jué)判斷。3.2.3RGB 顏色空間到 HSV 顏色空間的轉(zhuǎn)換一般情況下,人們認(rèn)識(shí)到的圖像都是在RGB顏色空間描述的,但在圖像檢索的應(yīng)用過(guò)程中,HSV空間模型更適合于人的視覺(jué)感知。因此,應(yīng)該將圖像從RGB空間模型轉(zhuǎn)換到HSV空間模型4。設(shè)r,g,b0,1,2,255,由RGB顏色空間模型到HSV顏色空間模型的轉(zhuǎn)化為:設(shè)v=max(r,g,b),定義r,g,b為:r=v'-rv'-min(r,g,b),g=v'-g'v'-min(r,g,b

25、), b=v'-bv'-min(r,g,b),則 v=v/255,v0,1S=v'-minr,g,bv',max(r,g,b)min(r,g,b) 0 , maxr,g,b=min(r,g,b) ,S0,1 (3-1)5+b,若r=max(r,g,b)且g=min(r,g,b)。1-g,若r=max(r,g,b)且gmin(r,g,b)60h= 1+r, 若g=max(r,g,b)且b=min(r,g,b) ,S=0, &S0,0.251, S0.25,1 (3-2)3-b,若g=max(r,g,b)且bmin(r,g,b)3+g,若b=max(r,g,

26、b)且r=min(r,g,b)5-r, 否則 這里r,g,b0,255,h0,3604。3.3顏色量化顏色量化是指確定一組顏色以表示圖像的顏色空間,然后確定從顏色空間到選定顏色集合的映射,即將顏色空間映射到一個(gè)給定大小的子集中,并使其總體誤差最小。因?yàn)?CBIR 中采用的HSV顏色空間具有視覺(jué)一致性的特點(diǎn),而且人眼分辨顏色的能力是有限的5。因此,在量化時(shí)可以考慮按照人的顏色感知對(duì)顏色空間進(jìn)行非等間距的量化,量化結(jié)果為:0,H0,601,H60,120 0, V0,0.3H= 2,H120,180 ,S=0, &S0,0.251, S0.25,1 , V= 1, V0.3,0.8 (3-

27、3)3,H180,240 2, V0.8,14,H240,3005,H300,360量化結(jié)束后,可以將HSV顏色空間劃分為L(zhǎng)HLSLV個(gè)相似色空間,其中量化級(jí)數(shù)LH=6,LS=2,LV=3。故把三個(gè)分量合并成一個(gè)一維的特征矢量就是L=LS×LV×H+LV×S+V=6H+3S+V。這樣H、S、V三個(gè)分量分布在一維矢量上,L的取值圍為0,35,即顏色量化后的圖像可以得到36柄的一維顏色直方圖3。3.4顏色直方圖對(duì)于基于顏色的圖像檢索系統(tǒng),關(guān)鍵問(wèn)題之一是對(duì)顏色特征的提取。目前,大部分基于顏色的檢索系統(tǒng)都是以比例分布作為顏色的基本特征,這也就是圖像的顏色直方圖。顏色的直方

28、圖特征是圖像檢索領(lǐng)域中提出最早、算法最簡(jiǎn)單,而且具有尺度不變性和旋轉(zhuǎn)不變性2,因此成為使用最為廣泛的顏色特征之一。它是在確定顏色空間的基礎(chǔ)上,統(tǒng)計(jì)出圖像中每種顏色分量的像素?cái)?shù)占圖像總像素?cái)?shù)的比值,從而得到圖像各種顏色分量的比例分布直方圖,將其轉(zhuǎn)換成為一維的特征向量,作為這幅圖像的特征。顏色直方圖是顏色信息的函數(shù),它表示圖像中具有同顏色級(jí)別的像素的個(gè)數(shù),其橫坐標(biāo)是顏色級(jí)別,縱坐標(biāo)是顏色出現(xiàn)的頻率,即像素的個(gè)數(shù)。顏色直方圖是一種概率統(tǒng)計(jì)的方法。它將圖像中各顏色像素的個(gè)數(shù)進(jìn)行統(tǒng)計(jì),并用直方圖的形式表達(dá)出來(lái),具體定義為:H(P)=(hc1(L),hc2(L),hc3(L),hci(L))其中,hci(

29、L)=|Lci|N,|Lci|表示圖像中所有顏色為Ci的像素的個(gè)數(shù)。這種顏色直方圖只反映了圖像中所占的百分比,而丟失了圖像顏色的空間分布信息,也就是說(shuō)兩幅顏色空間分布完全不同的圖像(如天空和海洋)仍可以具有一樣的直方圖,這勢(shì)必造成檢索的誤差。這時(shí),可以加進(jìn)顏色的空間分部信息。3.5基于子塊顏色直方圖算法一般顏色直方圖在算法上比較簡(jiǎn)單,但圖像檢索時(shí)卻不夠準(zhǔn)確,因?yàn)轭伾狈綀D相似的圖像可能容差別很大。這時(shí)便可以通過(guò)利用基于子塊顏色直方圖算法來(lái)實(shí)現(xiàn)圖像的檢索。將圖像劃分為幾個(gè)單元,然后分別計(jì)算這些單元顏色直方圖。在計(jì)算圖像的相似距離時(shí),先計(jì)算每圖像中每個(gè)單元之間的距離,然后將這些距離組合起來(lái),便可以

30、得到圖像與圖像的距離?;谧訅K顏色直方圖的圖像檢索方法可以采用一種比較簡(jiǎn)單的固定劃分策略,將圖像分解成為若干個(gè)大小一樣并且互相不重疊的單元區(qū)域。同時(shí),用戶可以對(duì)自己感興趣的子塊增大權(quán)重,提高檢索準(zhǔn)確率。通常情況下,主要容位于圖像的中間區(qū)域,圖像的四周大多是背景畫(huà)面。因此可以采用這樣一種分塊方法3:41325圖3-3分塊策略由此劃分方法可知:圖像的主要區(qū)域位于第5塊,其余的標(biāo)號(hào)為1、2、3、4的屬于背景。在特征的提取過(guò)程中,提取第5塊的主顏色,提取1、2、3、4塊的平均顏色,剩下圖像的四角部分對(duì)圖像特征影響不大,往往可以忽略。提取特征的方法為:(1)計(jì)算各個(gè)分塊的一般顏色直方圖設(shè)二維數(shù)組LI,j

31、中存放的是圖像各像素點(diǎn)量化后的HSV顏色值,其中i,j為各像素點(diǎn)坐標(biāo)。數(shù)組PicCenterk中存放中心區(qū)域的一般直方圖,k為量化后的HSV顏色值。(2)然后計(jì)算第5塊(中心區(qū)域)的主顏色m5主顏色是指圖像中出現(xiàn)次數(shù)最多的那種顏色,即main=取下標(biāo)(maxhc)。將設(shè)定好的顏色區(qū)域窗口沿直方圖從左向右移動(dòng),并記錄窗口顏色的總頻數(shù)。得到總頻數(shù)最大的窗口位置時(shí),此窗口顏色的加權(quán)平均值即為圖像的主顏色,即main=ci×hci/hci。(3)計(jì)算1、2、3、4塊的平均顏色ei,i=1,2,3,4平均顏色是一般直方圖顏色的加權(quán)平均:mean=c=035c×hc/c=035hc。(

32、4)圖像分塊顏色特征向量由第5塊的主顏色和1、2、3、4塊的平均顏色共同組成了分塊顏色特征向量:F=m5,e1,e2,e3,e4。3.6圖像的相似性度量在基于容的圖像檢索中,特征的相似距離的度量也是需要解決的重要問(wèn)題之一。只有在得到了圖像的特征后進(jìn)行特征的相似性度量,才能有效的根據(jù)相似距離進(jìn)行比較,準(zhǔn)確地實(shí)現(xiàn)圖像檢索。3.6.1圖像的相似度為了達(dá)到圖像檢索的目的,需要對(duì)提取的特征進(jìn)行相似度計(jì)算。相似度是以數(shù)值的形式來(lái)表示兩幅圖像之間的相似程度的度量結(jié)果,即相似距離。將圖像的特征看作是坐標(biāo)空間中的點(diǎn),兩個(gè)點(diǎn)的接近程度即相似度通常用他們之間的距離表示,不同類型的特征數(shù)據(jù)所采用的相似性度量函數(shù)是不一

33、樣的,相似度公式的選擇的恰當(dāng)與否對(duì)檢索的精確度有很大的影響。合適的距離算法的選擇,有助于基于容的圖像檢索的性能提高。3.6.2相似度計(jì)算公式圖像顏色特征相似關(guān)系的研究通常使用的是幾何模型。對(duì)于幾何相似距離的數(shù)學(xué)表達(dá)形式可以采用以下幾種表示方法2:(1)歐式距離公式歐式距離是一個(gè)常見(jiàn)的判斷兩個(gè)對(duì)象相似的公式,圖像X和圖像Y之間的距離定義為:Sim(X,Y)=|X-Y|=i=1nxi-yi(xi-yi) (3-4)當(dāng)Sim(X,Y)越大時(shí),兩幅圖像在這一特征上的差異就越大,反之兩幅圖像就越相似。但是由于歐式距離在計(jì)算中沒(méi)有考慮顏色間的相似性,不符合人的視覺(jué)感受,可以采用直方圖二次型距離法克服這一缺

34、陷。(2)直方圖的二次型距離這種計(jì)算距離的公式中加進(jìn)了顏色相似矩陣,其形式為D (Hm,Hk) = (Hm-Hk)T A (Hm-Hk),矩陣An×n=aij,權(quán)aij表示Hm中第i個(gè)元素Hmci,與Hkcj的相似程度,aij=aji且aii=1,其中Hm為目標(biāo)圖像顏色直方圖,Hk為庫(kù)中顏色直方圖。(3)分塊顏色特征向量計(jì)算法對(duì)于分塊顏色特征,可以采用下式計(jì)算相似距離:D(Q,T)=w5mQ-mTmQ-mT+i=1,2,3,4wi(eQ-eT)(eQ-eT) (3-5)wi=0.4, & 當(dāng)i=5時(shí) 0.15, 當(dāng)i=1,2,3,4時(shí)其中wi為加權(quán)系數(shù),以上wi值為系統(tǒng)所設(shè)定

35、的初值,用戶可以根據(jù)圖像實(shí)際情況設(shè)置不同的加權(quán)系數(shù)。4基于顏色特征的圖像檢索系統(tǒng)設(shè)計(jì)和實(shí)現(xiàn)4.1系統(tǒng)結(jié)構(gòu)設(shè)計(jì)在系統(tǒng)的實(shí)現(xiàn)上,將系統(tǒng)結(jié)構(gòu)劃分為圖像入庫(kù)子系統(tǒng)和圖像檢索子系統(tǒng)。圖像處理與分析特征提取圖像處理與分析圖像特征庫(kù)特征提取相似匹配輸入圖像檢索圖像圖4-1圖像檢索系統(tǒng)的組成結(jié)構(gòu)圖圖像入庫(kù)部分的主要功能是圖像獲取、圖像特征的提取和讀入。在圖像獲取過(guò)程中,采用BMP圖像組成圖像數(shù)據(jù)庫(kù),用戶可隨意選擇需要的圖像。提取特征時(shí),將BMP圖像的RGB顏色空間轉(zhuǎn)換為HSV空間并提取圖像的顏色特征作為索引,寫(xiě)入圖像特征數(shù)據(jù)庫(kù)中。圖像檢索部分是完成基于圖像顏色的檢索。運(yùn)用顏色特征匹配算法,通過(guò)相似性距離函數(shù)將

36、待檢索圖像的特征和特征庫(kù)中的對(duì)應(yīng)特征進(jìn)行匹配,實(shí)現(xiàn)圖像的檢索,并最終把檢索結(jié)果顯示出來(lái)。4.2圖像特征數(shù)據(jù)庫(kù)設(shè)計(jì)在CBIR系統(tǒng)的設(shè)計(jì)過(guò)程中,還需要考慮圖像數(shù)據(jù)庫(kù)中圖像存放的形式與圖像數(shù)據(jù)庫(kù)的格式。圖像特征數(shù)據(jù)庫(kù)用于存放圖像庫(kù)中各圖像的顏色特征。在這里,將得到的一維直方圖特征作為圖像的特征向量存放到Access相應(yīng)的特征表中,組成特征數(shù)據(jù)庫(kù)??蓪ccess數(shù)據(jù)表的模式設(shè)計(jì)為(No,t0,t1,t2,t35,文件名稱,相似距離),其中t0t35字段用來(lái)存放每圖像的一維直方圖特征向量。文件名稱字段存放檢索出來(lái)的圖像的名稱。相似距離字段存放的是待檢索圖和圖像庫(kù)中圖像之間的相似距離,用數(shù)字表示出來(lái)。4

37、.3系統(tǒng)開(kāi)發(fā)環(huán)境Visual Basic 6.0是微軟公司推出功能強(qiáng)大的面向?qū)ο蟮目梢暬某绦蛟O(shè)計(jì)語(yǔ)言。它具有強(qiáng)大的圖像處理功能,如Image控件,Picture Box控件等。同時(shí),VB6.0還使用兩種數(shù)據(jù)訪問(wèn)技術(shù):JET數(shù)據(jù)庫(kù)引擎和ODBC技術(shù),這是數(shù)據(jù)訪問(wèn)的核心部分。而且數(shù)據(jù)庫(kù)引擎能夠把數(shù)據(jù)控件和數(shù)據(jù)訪問(wèn)對(duì)象所提出的數(shù)據(jù)庫(kù)操作轉(zhuǎn)變成對(duì)數(shù)據(jù)庫(kù)的物理操作。4.4系統(tǒng)流程根據(jù)對(duì)實(shí)驗(yàn)系統(tǒng)中的圖像數(shù)據(jù)庫(kù)結(jié)構(gòu)與其算法、顏色模型、距離度量函數(shù)等方面的設(shè)計(jì),開(kāi)發(fā)了圖像檢索系統(tǒng)。檢索系統(tǒng)流程圖如圖4-2。開(kāi)始選擇關(guān)鍵圖像特征提取相似度計(jì)算輸出檢索結(jié)果用戶系統(tǒng)圖4-2檢索系統(tǒng)流程圖4.5系統(tǒng)的實(shí)現(xiàn)4.5.1

38、圖像的獲取圖像入庫(kù)的界面如圖4-3所示,用戶可以自由添加圖像,并將該圖像的顏色特征讀入圖像特征數(shù)據(jù)庫(kù)中,形成自定義的特征庫(kù)。除此之外,用戶還可以自主選擇待檢索的關(guān)鍵圖。圖4-3圖像入庫(kù)界面4.5.2圖像特征的提取特征提取是把圖像的顏色特征信息提取出來(lái)存入圖像特征數(shù)據(jù)庫(kù),以此特征來(lái)進(jìn)行對(duì)待檢索圖像的檢索。在這個(gè)過(guò)程中,先將圖像的RGB模型轉(zhuǎn)換成HSV模型,量化后得到36柄的一維直方圖,其算法如下:For i = 0 To 35 t(i) = 0Next iFor j = 0 To YPos - 1For i = 0 To XPos - 1r = PicCol(i, j, 2): g = PicC

39、ol(i, j, L): b = PicCol(i, j, 0)v1 = Max(r, g, b): v = v1 / 255If v1 = Min(r, g, b) Thenr1 = 0: g1 = 0: v1 = 0: s = 0Elser1 = (v1 - r) / (v1 - Min(r, g, b)g1 = (v1 - g) / (v1 - Min(r, g, b)b1 = (v1 - b) / (v1 - Min(r, g, b)s = (v1 - Min(r, g, b) / v1End IfIf r = g And g = b Thenh1 = 5 - r1ElseIf r =

40、 Max(r, g, b) And g = Min(r, g, b) Thenh1 = 5 + b1ElseIf r = Max(r, g, b) And g <> Min(r, g, b) Thenh1 = 1 - g1ElseIf g = Max(r, g, b) And b = Min(r, g, b) Thenh1 = 1 + r1ElseIf g = Max(r, g, b) And b <> Min(r, g, b) Thenh1 = 3 - b1ElseIf b = Max(r, g, b) And r = Min(r, g, b) Thenh1 = 3

41、+ g1Elseh1 = 5 - r1End IfEnd Ifh = h1 * 60Select Case h '量化HSV模型Case 0 To 60hh = 0Case 60 To 120hh = 1Case 120 To 180hh = 2Case 180 To 240hh = 3Case 240 To 300hh = 4Case 300 To 360hh = 5End SelectSelect Case sCase 0 To 0.25ss = 0Case 0.25 To 1ss = 1End SelectSelect Case vCase 0 To 0.3vv = 0Case

42、0.3 To 0.8vv = 1Case 0.8 To 1vv = 2End SelectL_PicCol(i, j) = 6 * hh + 3 * ss + vvt(L_PicCol(i, j) = t(L_PicCol(i, L) + 1Next iNext j這里給出一幅示例圖像,如圖4-4中的“國(guó)旗”圖像,利用上述算法得到的該圖像的36柄一維直方圖,并將其作為特征向量讀入圖像特征數(shù)據(jù)庫(kù),如表4-1所示。圖4-4示例圖像表4-1示例圖像的特征向量Not0t1t2t3t4t5t6t7t81000000000t9t10t11t12t13t14t15t16t17t180007808936193

43、711t19t20t21t22t23t24t25t26t27t28020008600000t29t30t31t32t33t34t35074141087204.5.3圖像的檢索在用戶自主選擇好圖像特征信息庫(kù),將圖像的顏色特征都讀入其中后,便可以選擇一待檢索的圖像,根據(jù)待檢索圖像和圖像特征信息庫(kù)中的圖像之間的相似距離來(lái)檢索出與待檢索圖像顏色特征最為相近的圖像來(lái),并按照相似距離的大小排列顯示。圖像檢索的算法為:Public Sub Search() Dim sumRecord As Integer Dim distance As Long Dim similar(6) As String Set m

44、ycon = New connection mycon.Open "provider=Microsoft.Jet.oledb.4.0;data source=" & App.Path & "圖像特征數(shù)據(jù)庫(kù)圖像特征.mdb;persist security info = false" Set rtezh = New Recordset rtezh.Open "select * from tezheng", mycon, adOpenKeyset, adLockPessimistic sumRecord = rtezh.R

45、ecordCount Do Until rtezh.EOF = True distance = 0 For a = 0 To 35 distance = distance + (rtezh.Fields(a + 1) - t(a) * (rtezh.Fields(a + 1) - t(a) Next a distance = Sqr(distance) rtezh.Fields(38) = distance rtezh.Update rtezh.MoveNext Loop rtezh.Close End Sub這里將另一幅“國(guó)旗”圖像作為待檢索圖像,“開(kāi)始檢索”后,圖像庫(kù)中各圖像與待檢索圖像相

46、似距離由歐式距離算法得到,并按照相似距離由小到大將圖像進(jìn)行排列。如圖4-5所示。圖4-5圖像檢索界面本系統(tǒng)可以自行建立若干幅圖像的圖像庫(kù)與特征數(shù)據(jù)庫(kù),支持一般直方圖的特征檢索方法,對(duì)待檢索圖像和圖像庫(kù)中的圖像之間的有了較好的匹配,并通過(guò)界面顯示出圖像間的相似距離和檢索結(jié)果的路徑。5總結(jié)本文在研究國(guó)外基于容的圖像檢索技術(shù)的歷史發(fā)展和應(yīng)用狀況的基礎(chǔ)上,在圖像的眾多視覺(jué)特征中,選用圖像的顏色特征進(jìn)行提取和檢索。主要進(jìn)行了以下工作:(1)選擇圖像的格式,定義其文件信息。本文選用Windows環(huán)境下的標(biāo)準(zhǔn)圖像格式BMP圖像格式,通過(guò)文件結(jié)構(gòu)的分析,對(duì)其進(jìn)行了文件頭和文件信息的定義,為系統(tǒng)功能的實(shí)現(xiàn)確定了

47、圖像標(biāo)準(zhǔn)。(2)概括常見(jiàn)的幾種顏色空間,對(duì)RGB和HSV顏色空間進(jìn)行了重點(diǎn)闡述,并介紹了這兩種顏色空間的轉(zhuǎn)換以與HSV空間量化方法。(3)在一維顏色直方圖的基礎(chǔ)上,介紹了基于子塊的顏色直方圖的改進(jìn)算法,通過(guò)用戶自主選擇感興趣的區(qū)域,自主調(diào)整權(quán)重系數(shù),使圖像的檢索結(jié)果更加符合用戶視覺(jué)感知。在實(shí)現(xiàn)CBIR系統(tǒng)的兩個(gè)關(guān)鍵問(wèn)題是:圖像容的特征提取和基于容特征的圖像相似性匹配方法。本文對(duì)顏色特征的研究和探索,實(shí)現(xiàn)了設(shè)計(jì)預(yù)期的基本功能,對(duì)于基于容的圖像檢索技術(shù)的發(fā)展具有一定的參考價(jià)值和意義。但是對(duì)于基于容的圖像檢索系統(tǒng),僅僅按照顏色特征得到的檢索結(jié)果圖和人的視覺(jué)觀察還不完全吻合,且本系統(tǒng)的待檢索圖像和被讀

48、入圖像有一定的圖像格式和像素的要求。如果能夠結(jié)合形狀、紋理等視覺(jué)特征,在不同的檢索條件下,采用不同的特征或者幾種特征的組合形式,且打破系統(tǒng)的圖像像素的束縛,就能夠顯著提高系統(tǒng)的性能。參考文獻(xiàn)1周.基于顏色特征的圖像檢索系統(tǒng)的研究與實(shí)現(xiàn)D.:大學(xué),2003:132余芳.基于顏色特征的圖像檢索技術(shù)研究D.:中國(guó)石油大學(xué)計(jì)算機(jī)學(xué)院,2007:9153王冰.基于顏色特征的圖像檢索方法研究D.:大學(xué)控制學(xué)院,2005:23304斌.基于顏色容的圖像檢索J.情報(bào)雜志,2000,19:50515冬梅.基于顏色直方圖的圖像檢索技術(shù)應(yīng)用研究D.:河海大學(xué)計(jì)算機(jī)與信息工程學(xué)院,2004:29306閆樂(lè)林,亓萊濱,

49、蔡平勝.一種基于容的圖像檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)J.計(jì)算機(jī)技術(shù)與發(fā)展,2009, 12:2052087朱從旭.Visual Basic程序設(shè)計(jì)綜合教程M.:清華大學(xué),2009:651138周穎.Visual Basic 6.0實(shí)例精通M.:清華大學(xué),2000:871099史永利.中文版Access2007寶典M.:電子工業(yè),2008:16724310Minakshi Banerjee, Malay K. Kundu, Pradipta Maji et al.Content-based image retrieval using visually significant point features

50、J. Fuzzy sets and Systems, 2009, 160:3323334111Remco C. Veltkamp, Mirela Tanase.Content-Based Image Retrieval Systems: A SurveyJ. Department of Computing Science, Utrecht University, 2000, 34:305112呂學(xué)安.淺析VB中用數(shù)據(jù)庫(kù)存取圖像的方法J.教育學(xué)院學(xué)報(bào),2010,11:183184致在此論文完成之際,我由衷地感大學(xué)四年來(lái)關(guān)心、幫助和支持我的人們。特別感我的指導(dǎo)老師許靜老師,從論文的選題到最終完稿,

51、許靜老師花費(fèi)了大量的時(shí)間和精力,幫助我攻克課題上的一道又一道難題。同時(shí),許靜老師以淵博的專業(yè)知識(shí)、嚴(yán)格的學(xué)術(shù)標(biāo)準(zhǔn)和嚴(yán)謹(jǐn)?shù)慕虒W(xué)態(tài)度影響著我,使我最終能堅(jiān)持完成此論文,并在專業(yè)知識(shí)方面有了進(jìn)一步提升,更加注重學(xué)以致用。感大學(xué)電子信息工程學(xué)院的各位老師以與一起相處、學(xué)習(xí)的同學(xué),與他們的交流學(xué)習(xí)開(kāi)闊了我的視野,促進(jìn)了我的進(jìn)步。最后,對(duì)評(píng)閱此論文的老師們表示感,能夠得到你們的點(diǎn)評(píng),我深感榮幸。附錄1 存取BMP圖像程序:Public PicColor(800, 600, 2) As BytePublic BF As BITMAPFILEHEADERPublic BI As BITMAPINFOHEADERPublic PictureFileName As StringPublic PictureNameSave As StringPublic PicCol(800, 600, 2) As BytePublic M

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論