基于顏色特征的圖像檢索算法的實(shí)現(xiàn)--畢業(yè)設(shè)計_第1頁
基于顏色特征的圖像檢索算法的實(shí)現(xiàn)--畢業(yè)設(shè)計_第2頁
基于顏色特征的圖像檢索算法的實(shí)現(xiàn)--畢業(yè)設(shè)計_第3頁
基于顏色特征的圖像檢索算法的實(shí)現(xiàn)--畢業(yè)設(shè)計_第4頁
基于顏色特征的圖像檢索算法的實(shí)現(xiàn)--畢業(yè)設(shè)計_第5頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、本科生畢業(yè)論文(設(shè)計)題 目: 基于顏色特征的圖像檢索算法的實(shí)現(xiàn) 姓 名: XXXX 學(xué) 院: XXXXXX 專 業(yè): 計算機(jī)科學(xué)與技術(shù) 班 級: XXX級計算機(jī)(X)班 學(xué) 號: XXXXXXXX 指導(dǎo)教師: XXX 職稱: 副教授 201X 年 5 月 18 日XXXXXXXXXX教務(wù)處制目錄摘要.1關(guān)鍵字.11 緒論.11.1 基于內(nèi)容的圖像檢索的概念.11.2 基于內(nèi)容的圖像檢索的發(fā)展歷史.11.3 基于內(nèi)容的圖像檢索的特點(diǎn)和主要應(yīng)用.11.4 基于內(nèi)容的圖像檢索的關(guān)鍵技術(shù).21.5 國內(nèi)外研究現(xiàn)狀.31.5.1 國外研究現(xiàn)狀.31.5.2 國內(nèi)研究現(xiàn)狀.42 基于顏色特征的圖像檢索方

2、法.42.1 顏色度量體系.42.2 顏色空間.52.2.1 RGB顏色空間.52.2.2 HSV顏色空間.52.2.3 CMY顏色空間.63 顏色特征的表達(dá).73.1 顏色直方圖.73.2 累加直方圖.84 圖像特征的相似性匹配.94.1 距離度量方法.94.2直方圖的交集的方法.94.3 歐式距離法.95 圖像檢索算法實(shí)現(xiàn).105.1程序開發(fā)運(yùn)行環(huán)境.105.2 程序檢索邏輯.105.3 算法具體實(shí)現(xiàn).115.4 實(shí)例演示.146 全文總結(jié)與展望.156.1 全文總結(jié).156.2 展望.15致謝.15參考文獻(xiàn).16英文摘要.16 基于顏色特征的圖像檢索算法的實(shí)現(xiàn)計算機(jī)科學(xué)與技術(shù)專業(yè)學(xué)生 X

3、X指導(dǎo)老師 XX摘要:文章介紹了一種基于顏色特征的圖像檢索技術(shù)的算法并給出了程序?qū)崿F(xiàn)。首先介紹了基于內(nèi)容的圖像檢索技術(shù)、發(fā)展歷史及基于內(nèi)容的圖像檢索技術(shù)的特點(diǎn)和主要應(yīng)用,并在此基礎(chǔ)上探討了該領(lǐng)域所用到的一些關(guān)鍵技術(shù)。文章著重探討了圖像的顏色空間、圖像特征提取及圖像相似性度量等內(nèi)容,并利用matlab技術(shù)實(shí)現(xiàn)了一個簡單圖像檢索的程序。文章最后則對當(dāng)前基于內(nèi)容圖像檢索技術(shù)研究熱點(diǎn)和今后的發(fā)展方向進(jìn)行簡單的闡述。關(guān)鍵字:基于內(nèi)容的圖像檢索;顏色特征;顏色直方圖;相似度度量方法1 緒論1.1 基于內(nèi)容的圖像檢索的概念基于內(nèi)容的圖像檢索1(Content Based Image Retrieval, C

4、BIR)是一項(xiàng)從圖像數(shù)據(jù)庫中找出與檢索式內(nèi)容相似的圖像的檢索技術(shù)。它利用從圖像中自動抽取出來的底層特征,如顏色、紋理、輪廓和形狀等特征,進(jìn)行計算和比較,檢索出符合用戶需求的結(jié)果圖像集。目前圖像檢索系統(tǒng)技術(shù)實(shí)現(xiàn)的基礎(chǔ)是對底層特征信息的計算和比較,也即是“視覺相似”。1.2 基于內(nèi)容的圖像檢索的發(fā)展歷史圖像檢索技術(shù)的發(fā)展2可以分為兩個階段,第一階段始于70年代,當(dāng)時的圖像檢索是通過人工的標(biāo)注來實(shí)現(xiàn)的,隨著計算機(jī)技術(shù)和通信網(wǎng)技術(shù)的發(fā)展,特別是因特網(wǎng)的快速發(fā)展,圖像數(shù)據(jù)的容量越來越大了,這種“以關(guān)鍵字找圖”的方法越來越不適應(yīng)檢索技術(shù)的發(fā)展了。由于圖像內(nèi)容的豐富內(nèi)涵以及人們對圖像內(nèi)容進(jìn)行抽象時的主觀性不

5、同的人對同一幅圖像有不同的理解,這就引入了主觀多義,不利于檢索。為了克服文本標(biāo)注檢索的弊端,90年代研究者提出了基于內(nèi)容的圖像檢索,其方法是:根據(jù)圖像的顏色特征、紋理特征、形狀特征以及空間關(guān)系等作為索引,計算查詢圖像和目標(biāo)圖像之間的相似距離,然后按相似度匹配進(jìn)行檢索,這種技術(shù)很大程度地利用了人們的視覺客觀特性,避免不同人對圖像主觀理解的不同而達(dá)不到理想的搜索效果。從研究方向的層面來看,基于內(nèi)容的圖像檢索可分為三層:第一層是根據(jù)圖像的底層特性來進(jìn)行檢索,如顏色、紋理,形狀等等,涉及圖像信息處理、圖像分析和相似性匹配技術(shù);第二層是基于圖像對象語義,如圖像中實(shí)體及實(shí)體之間的拓?fù)潢P(guān)系的檢索,對象級檢索

6、技術(shù)建立在下層特征基礎(chǔ)上,并引入了對象模型庫、對象識別和人工智能等圖像理解技術(shù);第三層是基于圖像的抽象屬性如行為語義,情感語義和場景語義的推理學(xué)習(xí)來進(jìn)行檢索。需要用到知識庫和更加有效的人工智能和神經(jīng)網(wǎng)絡(luò)技術(shù)。這三個層次由低到高,與人的認(rèn)知接近,下一個層次通常包含了比上一個層次更高級的語義,更高層的語義往往通過較低層的語義推理獲得。盡管經(jīng)過了多年的研究,較為成熟的基于內(nèi)容的圖像檢索技術(shù)目前仍處于底層水平,由于底層研究是上層研究的基礎(chǔ),為了給上層建立準(zhǔn)確、有效的圖像特征提取方法,底層的研究仍在不斷的發(fā)展。1.3 基于內(nèi)容的圖像檢索的特點(diǎn)和主要應(yīng)用基于內(nèi)容的圖像檢索技術(shù)有以下特點(diǎn)3:一是它突破了傳統(tǒng)

7、的基于表達(dá)式檢索的局限,從媒體內(nèi)容中提取信息線索。利用圖像內(nèi)容特征建立索引進(jìn)行檢索,使得檢索更加有效,適應(yīng)性更強(qiáng)。二是基于內(nèi)容的圖像檢索是一種近似匹配,即按照某種相似性度量,比較圖像特征間的差異度。相似度較低的圖像將作為檢索結(jié)果返回給用戶。三是它是大型數(shù)據(jù)庫的快速檢索。在實(shí)際的多媒體數(shù)據(jù)庫中,數(shù)據(jù)量巨大,而且種類和數(shù)量巨大,因此要求CBIR技術(shù)快速地實(shí)現(xiàn)對多媒體信息的檢索。四是以相關(guān)反饋為有效手段。為了提高檢索的準(zhǔn)確性,整個過程是個逐步逼近和相關(guān)反饋的過程。用戶的交互性增強(qiáng)了表達(dá)查詢、評價查詢結(jié)果和基于評價結(jié)果進(jìn)行進(jìn)一步檢索的能力。CBIR己經(jīng)成功地應(yīng)用于一些專門領(lǐng)域。典型應(yīng)用領(lǐng)域4包括:(1

8、)搜索引擎:隨著各種電子商務(wù)網(wǎng)站的發(fā)展,圖像搜索引擎將成為這些網(wǎng)站的重要工具。(2)家庭用圖像檢索:數(shù)碼科技使得普通家庭也會產(chǎn)生成千上萬的圖像,家庭圖像檢索系統(tǒng)將是家庭PC的一個基本工具。(3)數(shù)字圖書館:數(shù)字圖書館實(shí)際上是一個數(shù)字信息資源庫,其中有字符數(shù)值庫、文本庫、聲音庫、圖像庫等。因此,如何快速、高效地從數(shù)字圖書館中找出用戶所需的信息就成為現(xiàn)代圖書館研究的熱點(diǎn)和關(guān)鍵技術(shù)之一。(4)商標(biāo)檢索系統(tǒng):可在收錄了己注冊商標(biāo)的數(shù)據(jù)庫中查找是否有與注冊商標(biāo)類似的,防止商標(biāo)權(quán)受侵害。(5)法律及公安:它是圖像數(shù)據(jù)庫技術(shù)的一個重要應(yīng)用領(lǐng)域。典型的例子有:面部數(shù)據(jù)庫、指紋數(shù)據(jù)庫、犯罪紀(jì)錄數(shù)據(jù)庫以及建筑物保

9、安數(shù)據(jù)庫等。我國在“人臉”及“指紋”數(shù)據(jù)庫建立方面已做了不少工作,并有一批實(shí)用性的成果投入應(yīng)用。(6)郵票資料庫:主要用于郵票資料的管理與查詢,也可以提供郵票鑒定等更高級的應(yīng)用服務(wù)。(7)教育與培訓(xùn):在教育與培訓(xùn)領(lǐng)域,例如遠(yuǎn)程教學(xué)、交互式培訓(xùn)、自學(xué)教育及雇員再教育等有著廣闊的應(yīng)用前景。國外在培訓(xùn)系統(tǒng)領(lǐng)域已投入了大量的經(jīng)費(fèi),開展了相關(guān)課題的研究工作。我國多媒體教學(xué)研究工作也已經(jīng)開展,網(wǎng)上教學(xué)與輔導(dǎo)已進(jìn)入實(shí)用階段,這些都為圖像數(shù)據(jù)庫應(yīng)用于教育培訓(xùn)領(lǐng)域提供了廣闊的前景。(8)工業(yè)與商業(yè):工業(yè)應(yīng)用包括企業(yè)多媒體信息系統(tǒng)、CAD/CAM等商業(yè)應(yīng)用有電子商務(wù)、在線廣告、在線購物、股票等。(9)保健及醫(yī)療:

10、圖像數(shù)據(jù)庫在該領(lǐng)域中應(yīng)用范圍很廣,除了專用的圖像管理與檢索系統(tǒng)外,還包括建立多媒體醫(yī)療信息管理系統(tǒng),將龐雜的醫(yī)療數(shù)據(jù)管理起來.這些數(shù)據(jù)包括病歷、病人的圖像信息(如X光片、CT掃描及MRI照片等)以及描述手術(shù)過程的視頻信息等。它為現(xiàn)有的醫(yī)學(xué)系統(tǒng)帶來了一場革命,其中最有前景的應(yīng)用是遠(yuǎn)程醫(yī)療(Telemedicine)、遠(yuǎn)程外科手術(shù)(Tele-surgery)及遠(yuǎn)程診斷(Tele-diagnoses)等。1.4 基于內(nèi)容的圖像檢索的關(guān)鍵技術(shù)5目前,對于通用的靜止圖像檢索,用于檢索的特征主要有顏色(Color)、紋理(Texture)、形狀(Shape)等,其中顏色、紋理、形狀應(yīng)用尤為普遍;活動視頻檢

11、索脫胎于序列圖像分析中的技術(shù)。本文主要研究對靜止圖像檢索,其中數(shù)據(jù)庫是專用的圖像庫。對于目標(biāo)圖像和檢索圖像進(jìn)行顏色空間轉(zhuǎn)換、亮度圖像的邊緣提取和二值分割、提取目標(biāo)區(qū)域的顏色特征。顏色內(nèi)容包含兩個一般的概念,一個對應(yīng)于全局顏色分布,一個對應(yīng)于局部顏色信息。按照全局顏色分布來索引圖像可以通過計算每種顏色的像素的個數(shù)并構(gòu)造顏色灰度直方圖來實(shí)現(xiàn),這對檢索具有相似的總體顏色內(nèi)容的圖像是一個很好的途徑。局部顏色信息是指局部相似的顏色區(qū)域,它考慮了顏色的分類與一些初級的幾何特征。比如Smith等提出了顏色集合(color set)方法來抽取空間局部顏色信息并提供顏色區(qū)域的有效索引。運(yùn)用顏色直方圖進(jìn)行檢索有如

12、下三種方式:(1)指明顏色組成-該法需要用戶對圖像中的顏色非常敏感,而且使用起來也不方便,檢索的查準(zhǔn)率和查全率并不高,因此暫時不做進(jìn)一步開發(fā)。(2)指明一幅示例圖像-通過與用戶確定的圖像的顏色直方圖的相似性匹配得到查詢結(jié)果,這是該課題研究方法的根本。(3)指明圖像中一個子圖-分割圖像為各個小塊,然后利用選擇小塊來確定圖像中感興趣的對象的輪廓,通過建立更復(fù)雜的顏色關(guān)系(如顏色對方法)來查詢圖像,該方法是進(jìn)一步優(yōu)化檢索的一個設(shè)想。在顏色空間選取方面,最常用的顏色空間是RGB顏色空間。通常,人們采用歐氏距離來刻畫兩種顏色之間的差異,RGB空間存在的一個嚴(yán)重問題是其中所計算出來的兩種顏色之間的距離無法

13、正確表征人們實(shí)際所感知到的這兩種顏色之間的真實(shí)差異。HSV空間比較直觀并且符合人的視覺特性。HSV顏色模型有兩個重要的特點(diǎn)作為基礎(chǔ)。首先,V分量與彩色信息無關(guān),其次H和S分量與人感受彩色的方式緊密相連,其中H分量尤其影響人類的視覺判斷。這些特點(diǎn)使得HSV模型非常適合基于人視覺系統(tǒng)對彩色感知特性的圖像處理。得到圖像特征的統(tǒng)計直方圖后,不同圖像間的特征匹配可借助計算直方圖間的距離來進(jìn)行。一般意義上直方圖匹配方法有直方圖相交法,直方圖匹配法,歐氏距離法,中心矩法,累積直方圖匹配法共6種。本文重點(diǎn)討論歐氏距離法,并將其作為系統(tǒng)編程實(shí)現(xiàn)的主要方法。所以,顏色特征的圖像檢索關(guān)鍵技術(shù)路徑如圖1:相似度量特征

14、提取顏色空間圖1 顏色特征的圖像檢索關(guān)鍵技術(shù)路徑1.5 國內(nèi)外研究現(xiàn)狀61.5.1 國外研究現(xiàn)狀基于內(nèi)容的圖像檢索技術(shù)是當(dāng)前研究的熱點(diǎn),許多著名雜志如IEEE Trans.On PAMI 、IEEE Trans.On Image processing 等紛紛設(shè)??榻B該領(lǐng)域研究的最新成果,著名的國際會議如:IEEE conference of CVPR 、 ACM conference on multimedia等紛紛設(shè)立專題交流最新的研究成果。各大研究機(jī)構(gòu)和公司都推出了他們的系統(tǒng):(1)IBM的QBIC系統(tǒng) IBM的QBIC是第一個商業(yè)化的基于內(nèi)容的圖像檢索系統(tǒng),它的系統(tǒng)結(jié)構(gòu)包括圖像入庫、特

15、征計算、查詢階段三部分,允許使用例子圖像、用戶構(gòu)建的草圖和圖畫、選擇的顏色和紋理模式、鏡頭和目標(biāo)運(yùn)動和其他圖形信息等,對大型圖像和視頻數(shù)據(jù)庫進(jìn)行查詢。 它的系統(tǒng)框架和結(jié)構(gòu)對后來圖像檢索系統(tǒng)具有深遠(yuǎn)的影響。(2)新加坡大學(xué)和MIT媒體實(shí)驗(yàn)室的Photobook系統(tǒng) 該系統(tǒng)是用于交互式瀏覽和搜索圖像庫的工具。圖像在裝入時按形狀、紋理和人臉的面部外形三種特征自動分類,同時還能結(jié)合文本關(guān)鍵字進(jìn)行查詢,圖像根據(jù)類別通過顯著語義特征壓縮編碼。 (3)Virage公司的Virage系統(tǒng)該系統(tǒng)是基于內(nèi)容的圖像搜索引擎,比QBIC更進(jìn)一步,支持基于顏色、顏色布局、紋理和結(jié)構(gòu)(對象邊界信息)及這四個原子查詢的任意

16、組合。VirageVirageEngine主要有3方面的功能:圖像分析、圖像比較和圖像管理,技術(shù)的核心是VirageEngine以及在圖像對象層上的操作。(4)美國哥倫比亞大學(xué)的VisualSEEK系統(tǒng) VISualSEEK圖像查詢系統(tǒng)是一個可視化的圖像特征搜索引擎,實(shí)現(xiàn)了互聯(lián)網(wǎng)上的"基于內(nèi)容"的圖像/視頻檢索系統(tǒng),它由四部分組成:圖形用戶界面、服務(wù)器應(yīng)用、圖像檢索服務(wù)器、圖像歸檔。在VisualSEEK中,整幅圖的顏色分布使用全局顏色直方圖,區(qū)域顏色的索引采用二進(jìn)制顏色集的表達(dá)方法。它采用基于小波變換的方法來表示圖像的紋理特征。1.5.2 國內(nèi)研究現(xiàn)狀相對國外而言,國內(nèi)在

17、這方面的研究起步相對較晚:I.浙江大學(xué)從95年開始進(jìn)行多媒體圖像檢索的研究,完成了基于顏色和基于形狀的圖像原型系統(tǒng),總體設(shè)計思想是允許用戶找到包含特定顏色、紋理和形狀的圖像。II.中科院計算技術(shù)研究所開發(fā)了一個圖像檢索原型系統(tǒng)“ImageSeek",作為“中國數(shù)字圖書館示范工程”課題的一個關(guān)鍵技術(shù)。該系統(tǒng)實(shí)現(xiàn)了基于文本、顏色、紋理特征的圖像檢索。III.杭州貝爾研發(fā)的具有自主知識產(chǎn)權(quán)的智能圖像檢索系統(tǒng),通過提取圖像的顏色、紋理和形狀等特征,實(shí)現(xiàn)了基于圖像內(nèi)容的快速智能檢索,被列入2001年信息產(chǎn)業(yè)部重點(diǎn)科研計劃。2 基于顏色特征的圖像檢索方法2.1 顏色度量體系顏色度量體系7(col

18、or system),也叫做顏色制或者叫做顏色體制,實(shí)際上就是人們組織和表示顏色的方法。組織和表示顏色的方法主要有兩種:一種是顏色模型,一種是編目系統(tǒng)。顏色模型是用簡單的數(shù)值方法描述所有顏色的一套規(guī)則和定義,可使人們方便地描述任何一種顏色,顏色模型通常用顏色空間描述,如RGB、CMY和CMYK,從這個意義上說,顏色模型和顏色空間互為同義詞。任何一種顏色都可用三種基本顏色按不同的比例混合得到,顯示彩色圖像用RGB相加混色模型:顏色=R(Red 百分比)+G(Green 百分比)+B(Blue 百分比)顏色空間是表示顏色的一種數(shù)學(xué)方法,人們用它來指定和產(chǎn)生顏色,使顏色形象化。顏色空間通常用三維模型

19、表示,空間中的顏色能夠看到或者使用顏色模型產(chǎn)生。顏色空間中的顏色通常使用代表三個參數(shù)的三維坐標(biāo)來指定,這些參數(shù)描述的是顏色在顏色空間中的位置,其顏色要取決于使用的坐標(biāo)。對于顏色空間的構(gòu)造需要滿足三個要求:完備性(Completeness),顏色空間應(yīng)能描述人能感知的所有顏色;一致性(Uniformity ),顏色在空間度量的差異和感知的差異相吻合;唯一性(Uniqueness),顏色空間中顏色在感知上彼此不同。2.2 顏色空間82.2.1 RGB顏色空間面向硬設(shè)備的最常用顏色模型是RGB模型。在RGB模型中,所有顏色都可看作是3個基本顏色,即紅(R,red),綠(G,green)和藍(lán)(B,bl

20、ue)的不同組合。將這三種顏色成分分別人為地分成0到255共256個等級,0表示沒有刺激量,255表示刺激量達(dá)到最大值。R、G、B均為255時表示白光,均為0時表示黑色。這樣,我們就能表示出256×256×256(約1600萬)種顏色。如圖2所示,采用三維直角坐標(biāo)系,紅、綠、藍(lán)為原色,各個原色混合在一起產(chǎn)生復(fù)合色。絕大部分的可見光譜可以用紅、綠、藍(lán)R(、G、B)三色光按不同比例和強(qiáng)度的混合來表示。在顏色重疊的位置,產(chǎn)生青色、洋紅和黃色。因?yàn)镽GB顏色合成產(chǎn)生白色,它們也稱為加色。將所有顏色加在一起產(chǎn)生白色,也就是說,所有光被反射回眼睛。加色用于光照、視頻和顯示器。RGB顏色

21、模型通常采用單位立方體來表示,在正方體的主對角線上,各原色的強(qiáng)度相等,產(chǎn)生由暗到明的白色,也就是不同的灰度值。(0,0,0)為黑色,(l,1,1)為白色。正方體的其它六個角點(diǎn)分別為紅、黃、綠、青、藍(lán)和品紅,需要注意的一點(diǎn)是,RGB顏色模型所覆蓋的顏色域取決于顯示設(shè)備熒光點(diǎn)的顏色特征,是與硬件相關(guān)的。在顯示屏上顯示顏色定義時,往往采用這種模式。圖像如用于電視、幻燈片、網(wǎng)絡(luò)、多媒體,一般使用RGB模式。雖然RGB彩色模型被廣泛應(yīng)用于CRT設(shè)備顯示彩色圖像,但它并不是一個均勻視覺的顏色空間,不符合人對顏色的感知心理,而且,RGB顏色空間上的距離并不代表人眼視覺上的顏色知覺差異。但在對彩色圖像進(jìn)行特征

22、提取時,需要用數(shù)量來描述顏色的差別,因此需要用另一種符合人的視覺心理的視覺彩色模型來表示顏色。圖2 RGB顏色模型2.2.2 HSV顏色空間HSV空間是一種符合人類視覺感知特征的顏色空間,特別適合于人類肉眼對顏色的識別,因此被廣泛應(yīng)用于計算機(jī)視覺領(lǐng)域。它把彩色信號表示為三種屬性:色調(diào)H(Hue)、飽和度S(Saturation)和亮度V(value),其中亮度又稱LightneSS或Intensity,所以HSV空間還有HLS和HIS這兩種叫法。 HSV模型的色調(diào)H表示從一個物體反射過來的或透過物體的光的波長,更一般地說,色調(diào)是由顏色名稱來辨別的,如紅、橙、黃、綠等,它用角度-180180或O

23、360來度量。亮度V是顏色的明暗程度,通常用百分比度量,O%為最暗的黑色,而100%為最亮的白色。飽和度S指顏色的深淺程度,即在純色中包含的白色光的成份。例如同樣是紅色,也會因顏色濃度不同而分為深紅色、粉紅色和淺紅色。飽和度S也用百分比來度量,從濃度最小的O%到濃度完全飽和的100%。色調(diào)H和飽和度S分量合起來定義了顏色的色度(Chromatieity)特性。HSV顏色模型用Munsell三維空間坐標(biāo)系統(tǒng)表示,其示意圖如圖3所示。圖3 HSV顏色模型 Munsen顏色空間具有以下己經(jīng)被人的眼睛所證實(shí)的特點(diǎn): (1)坐標(biāo)之間的心理感知獨(dú)立性(PereeptualIndependenee),即人可

24、以獨(dú)立感知各顏色分量的變化。(2)線性伸縮性(LinearSealability),人眼可感知的顏色差異與HSV顏色分量的相應(yīng)值上的歐幾里德距離(EuelideanDIStanee)是成比例的。因?yàn)镠SV顏色空間根據(jù)色調(diào)H的值來區(qū)分不同的顏色,因此在HSV的三個分量中,H分量是尤為重要的,它可以很好地模擬人類對顏色的識別和記憶過程。2.2.3 CMY顏色空間以紅、綠、藍(lán)的補(bǔ)色青(Cyan)、品紅(Magenta)、黃(Yellow)為原色構(gòu)成的CMY顏色模型,常用于從白光中濾去某種顏色,又被稱為減性原色系統(tǒng)。CMY顏色模型對應(yīng)的直角坐標(biāo)系的子空間與RGB顏色模型所對應(yīng)的子空間幾乎完全相同。差別

25、僅在于前者的原點(diǎn)為白,而后者的原點(diǎn)為黑。前者是定義在白色中減去某種顏色來定義的一種顏色,而后者通過從黑色中加入顏色來定義一種顏色。CMY模型以打印在紙張上油墨的光線吸收特性為基礎(chǔ),當(dāng)白光照射到半透明油墨上時,部分光譜被吸收,部分被反射回眼睛。理論上,青(Cyan)、品紅(Magenta)和黃(Yellow)色素能夠合成吸收所有的顏色并產(chǎn)生黑色。因?yàn)樗写蛴∮湍紩恍╇s志,這三種油墨實(shí)際上產(chǎn)生一種土灰色,必須與黑色油墨混合才能產(chǎn)生真正的黑色。將這些油墨混合產(chǎn)生顏色稱為四色印刷。減色(CMY)和加色(RGB)是互補(bǔ)色,每對減色產(chǎn)生一種加色,反之亦然。如圖4所示。圖4 CMY顏色模型認(rèn)知科學(xué)及

26、視覺心理學(xué)證明,人類不能像計算機(jī)顯示器那樣只使用RGB成分感知顏色,因此,選擇一個適合于人類視覺特征的顏色空間可以改善檢索效果。由于在進(jìn)行基于內(nèi)容的圖像檢索時,查詢要求往往是按照用戶的主觀視覺感受而發(fā)出的,因此在進(jìn)行圖像之間顏色差異的比較時,CBIR系統(tǒng)一般采用具有視覺一致性的顏色空間。所謂視覺一致性,是指對兩種不同的顏色,它們在顏色空間中坐標(biāo)的距離與它們在觀察者的顏色感知空間中的距離是大致相同的。HSV空間具有這樣的特性9。因此本系統(tǒng)選用HSV顏色模型。3 顏色特征的表達(dá)3.1 顏色直方圖 (1)顏色直方圖的定義顏色直方圖9是顏色信息的函數(shù),其核心思想是在一定的顏色空間中對圖像各種顏色出現(xiàn)的

27、頻數(shù)進(jìn)行統(tǒng)計,顏色直方圖描述的是不同色彩在整幅圖像中所占的比例,而并不關(guān)心每種色彩所處的空間位置,即圖像的對象或物體。它的優(yōu)點(diǎn)就在于它能簡單描述一幅圖像中顏色的全局分布,即不同色彩在整幅圖像中所占的比例,特別適用于描述那些難以自動分割的圖像和不需要考慮物體空間位置的圖像。顏色直方圖可以基于不同的顏色空間和坐標(biāo)系,最常用的是RGB顏色空間,因?yàn)榇蟛糠值臄?shù)字圖像都是用RGB顏色空間表達(dá)的?;赗GB顏色空間表示時,彩色圖像的直方圖可以用R、G、B三個單色的直方圖或聯(lián)合分布直方圖來表示。用三個單色直方圖表示時,各個直方圖表示的是圖像在這種顏色分量的統(tǒng)計分布,總共有三個不同的概率分布。而彩色圖像用一個

28、RGB顏色直方圖表示時,其統(tǒng)計的是不同顏色出現(xiàn)的頻數(shù),以色彩作為橫坐標(biāo),縱坐標(biāo)為色彩出現(xiàn)的頻數(shù)。在RGB顏色空間中,顏色直方圖可以看成是一個離散函數(shù),即 ()其中,k表示圖像的特征取值,L表示特征可取值的個數(shù),凡表示圖像中具體征值為k的像素個數(shù),n表示圖像像素的總個數(shù)。(2)顏色直方圖的特性 旋轉(zhuǎn)不變性和縮放不變性:顏色直方圖是表示圖像中顏色分布的一種方法,它的橫軸表示顏色等級,縱軸表示在某一個顏色等級上具有該顏色的像素在整幅圖像中所占的比例,直方圖顏色空間中的每一個刻度表示了顏色空間中的一種顏色,因此,顏色直方圖具有與身俱來的旋轉(zhuǎn)不變性和縮放不變性,如圖5所示。位置無關(guān)性:直方圖描述了每個灰

29、度級的像素的個數(shù),但不能為這些像素在圖像中的位置提供任何線索。當(dāng)一幅圖像被壓縮為直方圖后,所有的空間信息將全部丟失,因此,任一特定的圖像具有唯一的直方圖,但并非一一對應(yīng),而是一對多,不同的圖像有可能具有相同的直方圖特征。疊加性:如果一幅圖像由兩個不連接的區(qū)域組成,并且每個區(qū)域的直方圖己知,則整幅圖像的直方圖是該兩個區(qū)域的直方圖之和。該結(jié)論可推廣到任何數(shù)目的不連接區(qū)域的情形。直方圖是總體灰度概念,從直方圖中可以看出圖像整體的性質(zhì):如圖像的明暗程度、圖像的亮度等。再如圖像的灰度動態(tài)范圍太小會使許多細(xì)節(jié)分辨不清楚,而灰度級分布均勻,則會給人以清晰、明快的感覺。 圖5 顏色直方圖的旋轉(zhuǎn)不變性和縮放不變

30、性3.2 累加直方圖10當(dāng)圖像中的特征并不能取遍所有可取值時,統(tǒng)計直方圖中會出現(xiàn)一些零值。這些零值的出現(xiàn)會對計算直方圖的相交帶來很大影響,從而使得算出的匹配值并不能正確的反映兩圖間的顏色差別。累加直方圖是以顏色作為橫坐標(biāo),從坐標(biāo)原點(diǎn)到該顏色的所有顏色的像素出現(xiàn)的頻數(shù)為縱坐標(biāo)繪出的圖形。這樣圖像的累加直方圖向量H可以定義為:表示C1Ck種顏色的像素的累加頻數(shù):我們已經(jīng)計算出圖像的一般直方圖,可以方便地計算圖像累加直方圖。這樣,最后得到的累加直方圖特征向量為:4 圖像特征的相似性匹配4.1 相似度匹配方法11圖像檢索的效果很大程度上取決于匹配算法的優(yōu)劣?;谖谋镜臋z索方法中使用的是文本的精確匹配,

31、而基于內(nèi)容的圖像檢索則通過計算查詢和候選圖像之間的視覺特征的相似度來完成。以一定的計量或測量方法來判斷圖像內(nèi)容是否相關(guān)。圖像特征提取大多數(shù)可以表示為向量形式,因此常用的圖像比較方法都是基于向量空間模型,即將圖像特征看作向量空間中的兩個點(diǎn),通過比較兩個點(diǎn)之間的距離來衡量其相似度。按照距離公理,在定義距離測度時要滿足距離公理的四個條件:自相似性、最小性、對稱性、及三角不等性。設(shè) D 為距離函數(shù),x、y、z 為三個特征向量,則所有的距離函數(shù)都滿足的條件表示為:(1)D ( x,y ) = D ( y,x ) = 0(自相似性)(2)D ( x,y )D ( x,x )0(最小性)(3)D ( x,y

32、 ) = D ( y,x)(對稱性)(4)D ( x,y ) + D ( y,z )D ( x,z )(三角不等性)圖像的相似度度量,既是圖像檢索技術(shù)中的一個關(guān)鍵問題,也是其中的一個難點(diǎn)。常見的方法有:直方圖相交法、直方圖歐氏距離、直方圖余弦距離、二值集hammimg距離、直方圖二次距離度量、二值集二次距離、直方圖Mahalanobis距離。以下只簡要介紹系統(tǒng)中常用的直方圖的交、直方圖歐氏距離兩種距離度量方法。4.2直方圖的交集的方法直方圖的交集算法,根據(jù)顏色索引檢索出查詢圖像的顏色直方圖,將其與圖像庫中的每一圖像的直方圖取交集,根據(jù)交集的值來選出最佳匹配圖像。直方圖交集的公式如下:D(Ha,

33、Hb)= 其中Ha為查詢圖像直方圖,Hb為圖像庫中的任一圖像直方圖,為兩圖像的匹配值。,它的值越接近1,則兩圖像越相似。直方圖交集方法能對兩幅圖像進(jìn)行詳細(xì)的比較,然而對于許多合成的圖像,如商標(biāo)等,它們有大量的一致顏色,三維直方圖只有幾個域的值很高,而其它許多域的顏色信息變化有限。因而,對于這樣的圖像進(jìn)行過細(xì)的比較是不必要的。又由于在掃描圖像時容易產(chǎn)生一些噪音,所以這種過細(xì)的比較容易產(chǎn)生錯誤的結(jié)果。4.3 歐式距離法我們可以利用歐基里德距離公式(Euclidean Distance)來計算距離。對于兩個 N維直方圖x,y,兩者的歐氏距離可以表示如下: 此距離公式雖然簡單,但是與特定的顏色分布無關(guān)

34、,有一種方法可以引入相關(guān)權(quán)值A(chǔ),這里A是一個維矩陣,此時距離公式可以表述如下: 為了簡化計算,將直方圖x,y規(guī)范化使其滿足: 矩陣,權(quán)表示顏色i與顏色j之間的相似度。若取z=x-y,則有,取定了距離公式后,我們需要確定A的取值,且要保證此矩陣A能夠使,我們用表示顏色i與顏色j在RGB顏色空間的距離。 取。 有 因?yàn)?5 圖像檢索算法實(shí)現(xiàn)5.1 程序開發(fā)運(yùn)行環(huán)境Matlab是集數(shù)值計算、符號運(yùn)算及圖形處理等強(qiáng)大功能于一體的科學(xué)計算語言作為強(qiáng)大的科學(xué)計算平臺,它幾乎能夠滿足所有的計算需求,它具有如下的優(yōu)勢與特點(diǎn): 友好的工作平臺和編程環(huán)境;簡單易用的程序語言;強(qiáng)大的科學(xué)計算及數(shù)據(jù)處理能力;出色的圖

35、形處理功能。5.2 程序檢索邏輯特征提取待匹配圖像按相似度排列的檢索結(jié)果集計算相似度圖像庫特征提取圖6程序檢索邏輯圖我們可以從圖6中抽象出三個層次或者功能模塊:(1) 顏色空間內(nèi)特征提取對圖像數(shù)據(jù)進(jìn)行特征提取,可以選擇任何一種能夠達(dá)到檢索要求的顏色空間和特征表達(dá)方式。(2) 圖像匹配(相似度計算)在選取了特征之后,需要選擇或?qū)ふ疫m當(dāng)?shù)呐袆e準(zhǔn)則,從而判斷出待識別的圖像的特征與數(shù)據(jù)庫中的哪些圖像的特征最接近。(3) 結(jié)果輸出將滿足一定相似性條件的一組候選結(jié)果按相似度大小排列后返回給用戶。5.3 算法具體實(shí)現(xiàn)(1)顏色空間的選擇及顏色的矢量量化通常, 人們采用歐氏距離表示兩種顏色之間的差異, 最常用

36、的RGB顏色空間存在一個嚴(yán)重問題是其中所計算出來的兩種顏色之間的距離無法正確表征人們實(shí)際所感知到的這兩種顏色之間的真實(shí)差異。例如:距離為50的(0,0,0)與(50,0,0)兩種顏色認(rèn)為是同一黑色,而距離為50的(200,200,0)和(150,200,0)則認(rèn)為是兩種差異很大的顏色(黃色和綠色)。本文在處理顏色特征時采用了HSV顏色空間, 該模型較好符合人眼的感知特征。從RGB空間轉(zhuǎn)換到HSV空間的具體過程可參考相關(guān)文獻(xiàn)。在理論上, 抽取圖像的顏色特征時使用真彩色將產(chǎn)生最小的誤差。但是, 特征抽取和特征匹配的計算量以及特征的存儲都將隨實(shí)際顏色數(shù)目增多而非線性膨脹, 因此, 使用真彩色在實(shí)際檢

37、索過程中是不現(xiàn)實(shí)的。實(shí)驗(yàn)表明, 增加顏色直方圖的維數(shù)可以有效提高檢索的精度, 但當(dāng)維數(shù)增加到一定程度時, 檢索的精度提高很小而且可能下降. 因此在保持一定精度的前提下, 通過減少顏色的維數(shù)來達(dá)到節(jié)省特征存儲空間的目的。在系統(tǒng)實(shí)現(xiàn)時, 我們根據(jù)H S V空間的特征, 在降低直方圖的維數(shù)并保留足夠的顏色信息前提下, 對 HSV空間進(jìn)行非均勻量化, 得到77種代表顏色。首先將圖像中每一像素的r ,g,b值轉(zhuǎn)換為h,s,v值(h0,360,s0,1,v0,1),然后按照圖7的顏色量化和編碼方法計算:圖7按照上面的方法將顏色空間共劃分為 77種顏色, 這 77種代表色的量化方法有效地壓縮了顏色特征并且較

38、好的符合人眼對顏色的感知。代碼實(shí)現(xiàn)如下:M,N,O = size(Image);h,s,v = rgb2hsv(Image);H = h; S = s; V = v;h = h*360;%將hsv空間非等間隔量化:% h量化成8級;% s量化成3級;% v量化成3級;for i = 1:M for j = 1:N if h(i,j)<=20|h(i,j)>315 H(i,j) = 0; end if h(i,j)<=40&&h(i,j)>20 H(i,j) = 1; end if h(i,j)<=75&&h(i,j)>40 H

39、(i,j) = 2; end if h(i,j)<=155&&h(i,j)>75 H(i,j) = 3; end if h(i,j)<=190&&h(i,j)>155 H(i,j) = 4; end if h(i,j)<=270&&h(i,j)>190 H(i,j) = 5; end if h(i,j)<=295&&h(i,j)>270 H(i,j) = 6; end if h(i,j)<=315&&h(i,j)>295 H(i,j) = 7; end e

40、ndendfor i = 1:M for j = 1:N if s(i,j)<=0.2&&s(i,j)>0 S(i,j) = 0; end if s(i,j)<=0.7&&s(i,j)>0.2 S(i,j) = 1; end if s(i,j)<=1&&s(i,j)>0.7 S(i,j) = 2; end endendfor i = 1:M for j = 1:N if v(i,j)<=0.2&&v(i,j)>0 V(i,j) = 0; end if v(i,j)<=0.7&a

41、mp;&v(i,j)>0.2 V(i,j) = 1; end if v(i,j)<=1&&v(i,j)>0.7 V(i,j) = 2; end endend(2)將三個顏色分量合成為一維特征向量:L = H*Qs*Qv+S*Qv+v;Qs,Qv分別是S和V的量化級數(shù), L取值范圍0,71,取Qs = 3; Qv = 3,并計算L的直方圖,代碼實(shí)現(xiàn)如下:for i = 1:M for j = 1:N L(i,j) = H(i,j)*9+S(i,j)*3+V(i,j); endendfor i = 0:71 Hist(i+1) = size(find(L=

42、i),1);endT=Hist;(3)計算圖像庫中每一幅圖像與查詢例子圖像的歐式距離,代碼實(shí)現(xiàn)如下:diff = (T0-T).2; EulerDistance = sqrt( sum( diff(:) ) ); w(k)=EulerDistance;end(4)按顏色的相似性大小顯示查詢結(jié)果圖片,代碼實(shí)現(xiàn)如下:B,IX=sort(w,2);A=dir('D:graduate designtest_pictures*.jpg');for n=1:10 subplot(3,4,n); I=imread(strcat('D:graduatedesigntest_pictur

43、es',A(IX(n).name); imshow(I);end5.4 實(shí)例演示第一步,運(yùn)行程序彈出對話框,選擇待匹配圖像,如圖8所示;圖8第二步,程序繼續(xù)執(zhí)行,最后在彈出窗口上按與待匹配圖像相似度從大到小的順序顯示圖像,如圖9所示。圖96 全文總結(jié)與展望6.1 全文總結(jié)隨著多媒體技術(shù)的發(fā)展,包括圖像、音頻、視頻等信息的多媒體數(shù)據(jù)大量涌現(xiàn),如何從大量的信息中快速、有效地檢索到所需的內(nèi)容,已經(jīng)成為多媒體技術(shù)研究中的熱點(diǎn)問題。本文對基于內(nèi)容的圖像檢索技術(shù)作了較全面的研究和介紹,重點(diǎn)研究了基于顏色特征的圖像檢索方法,并對其中涉及到的顏色模型,顏色直方圖,顏色量化,相似性度量等進(jìn)行了較深入研究

44、。在對基于顏色特征的圖像檢索方法的研究基礎(chǔ)上,作者用matlab語言編寫了一個簡單的圖像檢索演示程序,實(shí)驗(yàn)證明,該程序?qū)崿F(xiàn)了圖像檢索的基本功能,但基于顏色特征的圖像檢索僅是從圖像的低層特性出發(fā),這些方法具有計算簡單、對平移和旋轉(zhuǎn)不敏感等優(yōu)點(diǎn)。但是直方圖不能反映空間位置的變化,兩幅景色相似但是空間位置完全不同的圖像,得出的直方圖是一模一樣的。另外是顏色量化誤差的影響較大,以致差別細(xì)微的顏色可能會得出無差別或差別很大的兩種決然不同的顏色直方圖。因此,如何有效地綜合顏色、紋理、形狀、空間位置關(guān)系以及語義特征來對圖像進(jìn)行查詢勢必會成為一個熱門研究方向。6.2 展望人們對顏色索引和檢索方法的研究己經(jīng)相當(dāng)

45、多,它們都分別從不同的方面對基于顏色的圖像檢索問題進(jìn)行了研究。目前主要存在的問題:(1)人對顏色特征的視覺感知方面考慮的仍然不夠,雖然目前大多數(shù)基于顏色特征的圖像檢索采用了和人對顏色感知相一致的HSB顏色空間,但關(guān)于兩種顏色之間的相似度的定義和視覺上人對相似顏色的判定仍有一定的差距。(2) 從顏色特征的表示來看,各種形式的顏色直方圖是最常采用的表示方法,一般指定相同的顏色集,采用幾十到上百維的高維直方圖。實(shí)際上人對兩幅圖像畫面的顏色的相似性判定主要考慮少數(shù)幾種主要的顏色。不同的圖像有不同的顏色集,對于包含不同顏色集的兩幅圖像之間的相似性判定仍需進(jìn)一步研究。(3)為進(jìn)一步提高顏色特征的檢索效果,

46、要從顏色物理、視覺、心理幾方面進(jìn)行綜合深入研究。CBIR系統(tǒng)在技術(shù)上可分為圖像處理技術(shù)和數(shù)據(jù)庫技術(shù)兩大方面。在圖像處理技術(shù)方面,更加準(zhǔn)確有效地描述圖像內(nèi)容的數(shù)據(jù)模型是今后長期需要解決的重要方面。然而目前,通過建立合理的用戶查詢界面,利用相關(guān)性反饋,是實(shí)現(xiàn)趨向基于語義查詢的切實(shí)可行的有效方法;在數(shù)據(jù)庫技術(shù)方面,CBIR系統(tǒng)正產(chǎn)生深刻變化,如DBMS中對物理磁盤的管理技術(shù)、索引技術(shù)等底層技術(shù)都向著支持多媒體數(shù)據(jù)和更開放的方向發(fā)展。基于內(nèi)容對圖像信息的查詢、檢索在國內(nèi)外仍處于研究探索階段,隨著應(yīng)用的需求其研究將會不斷深入,滿足不同應(yīng)用的實(shí)用系統(tǒng)也將陸續(xù)出現(xiàn),將其應(yīng)用于各個領(lǐng)域必將帶來極大的益處。致謝

47、本文是在XX老師的悉心指導(dǎo)下完成的,衷心感謝他在論文的寫作期間給與我的熱情幫助和指導(dǎo)。XX老師淵博的知識,認(rèn)真負(fù)責(zé)的工作作風(fēng),平易近人的態(tài)度讓我獲益匪淺。在此,向XX老師表示最衷心的感謝和最誠摯的敬意。 還要感謝我的同學(xué)XX,他在我的論文寫作過程中提出了很多建設(shè)性的意見,并給了我很多啟發(fā)。 感謝XXXXXXXXXXX計算機(jī)系的全體領(lǐng)導(dǎo)和老師,你們深厚的學(xué)術(shù)功底和誨人不倦的高尚師德將讓我受用一生。 感謝計算機(jī)科學(xué)與技術(shù)專業(yè)XXXX級X班全班同學(xué)給予我的關(guān)心、友誼和幫助,是你們給了我美好而難忘的學(xué)習(xí)生活。 最后,我要衷心感謝我的父母,是你們一直默默地給與我理解與支持,給與我勇敢面對困難的勇氣和力量

48、,讓我能夠順利地完成學(xué)業(yè)。參考文獻(xiàn)1洪安祥.基于內(nèi)容的圖像檢索若干論題研究D.浙江:浙江大學(xué),2007:1-36.2M Flickner,HSawhney,WNiblack.Query by image and video content:the QBIC systemJ.IEEE Computer,2007,28(9):23-32.3顧燕.基于內(nèi)容的圖像檢索方法及其實(shí)驗(yàn)系統(tǒng)設(shè)計D.江蘇:河海大學(xué),2009:3-10.4劉士林.基于內(nèi)容的圖像檢索J.佳木斯大學(xué)學(xué)報.2008,19(3):259.5徐杰,施鵬飛.基于內(nèi)容的圖像檢索技術(shù)J.中國圖像圖形學(xué)報.2008,8(9):978.6王冰.基于

49、顏色特征的圖像檢索方法研究D.山東:山東大學(xué),2007:2-11.7高升.基于顏色特征的圖像檢索方法及系統(tǒng)實(shí)現(xiàn)D.北京:北京郵電大學(xué),2006:4-5.8張潔.基于顏色特征的圖像檢索系統(tǒng)設(shè)計與實(shí)現(xiàn)D.吉林:吉林大學(xué),2006:10.9劉德龍.基于顏色特征的圖像檢索系統(tǒng)設(shè)計與實(shí)現(xiàn)D.武漢:華中師范大學(xué),2007:12.10孫君頂編著.圖像低層特征提取與檢索技術(shù)M.北京:電子工業(yè)出版社,2009:5-40.11周明全,耿國華,韋娜著.基于內(nèi)容圖像檢索技術(shù)M.北京:清華大學(xué)出版社,2007:4-35.英文摘要Color-based Image Retrieval TechnologyComputer science and technology XXXXXXTutor XXXXXXXAbstract: This paper describes the image retrieval algorithm based on color features and gives procedures to achieve. First introduced the content-based image retrieval technology, the history

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論