版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、本科生畢業(yè)論文(設計)題 目: 基于顏色特征的圖像檢索算法的實現(xiàn) 姓 名: XXXX 學 院: XXXXXX 專 業(yè): 計算機科學與技術 班 級: XXX級計算機(X)班 學 號: XXXXXXXX 指導教師: XXX 職稱: 副教授 201X 年 5 月 18 日XXXXXXXXXX教務處制目錄摘要.1關鍵字.11 緒論.11.1 基于內(nèi)容的圖像檢索的概念.11.2 基于內(nèi)容的圖像檢索的發(fā)展歷史.11.3 基于內(nèi)容的圖像檢索的特點和主要應用.11.4 基于內(nèi)容的圖像檢索的關鍵技術.21.5 國內(nèi)外研究現(xiàn)狀.31.5.1 國外研究現(xiàn)狀.31.5.2 國內(nèi)研究現(xiàn)狀.42 基于顏色特征的圖像檢索方
2、法.42.1 顏色度量體系.42.2 顏色空間.52.2.1 RGB顏色空間.52.2.2 HSV顏色空間.52.2.3 CMY顏色空間.63 顏色特征的表達.73.1 顏色直方圖.73.2 累加直方圖.84 圖像特征的相似性匹配.94.1 距離度量方法.94.2直方圖的交集的方法.94.3 歐式距離法.95 圖像檢索算法實現(xiàn).105.1程序開發(fā)運行環(huán)境.105.2 程序檢索邏輯.105.3 算法具體實現(xiàn).115.4 實例演示.146 全文總結與展望.156.1 全文總結.156.2 展望.15致謝.15參考文獻.16英文摘要.16 基于顏色特征的圖像檢索算法的實現(xiàn)計算機科學與技術專業(yè)學生 X
3、X指導老師 XX摘要:文章介紹了一種基于顏色特征的圖像檢索技術的算法并給出了程序實現(xiàn)。首先介紹了基于內(nèi)容的圖像檢索技術、發(fā)展歷史及基于內(nèi)容的圖像檢索技術的特點和主要應用,并在此基礎上探討了該領域所用到的一些關鍵技術。文章著重探討了圖像的顏色空間、圖像特征提取及圖像相似性度量等內(nèi)容,并利用matlab技術實現(xiàn)了一個簡單圖像檢索的程序。文章最后則對當前基于內(nèi)容圖像檢索技術研究熱點和今后的發(fā)展方向進行簡單的闡述。關鍵字:基于內(nèi)容的圖像檢索;顏色特征;顏色直方圖;相似度度量方法1 緒論1.1 基于內(nèi)容的圖像檢索的概念基于內(nèi)容的圖像檢索1(Content Based Image Retrieval, C
4、BIR)是一項從圖像數(shù)據(jù)庫中找出與檢索式內(nèi)容相似的圖像的檢索技術。它利用從圖像中自動抽取出來的底層特征,如顏色、紋理、輪廓和形狀等特征,進行計算和比較,檢索出符合用戶需求的結果圖像集。目前圖像檢索系統(tǒng)技術實現(xiàn)的基礎是對底層特征信息的計算和比較,也即是“視覺相似”。1.2 基于內(nèi)容的圖像檢索的發(fā)展歷史圖像檢索技術的發(fā)展2可以分為兩個階段,第一階段始于70年代,當時的圖像檢索是通過人工的標注來實現(xiàn)的,隨著計算機技術和通信網(wǎng)技術的發(fā)展,特別是因特網(wǎng)的快速發(fā)展,圖像數(shù)據(jù)的容量越來越大了,這種“以關鍵字找圖”的方法越來越不適應檢索技術的發(fā)展了。由于圖像內(nèi)容的豐富內(nèi)涵以及人們對圖像內(nèi)容進行抽象時的主觀性不
5、同的人對同一幅圖像有不同的理解,這就引入了主觀多義,不利于檢索。為了克服文本標注檢索的弊端,90年代研究者提出了基于內(nèi)容的圖像檢索,其方法是:根據(jù)圖像的顏色特征、紋理特征、形狀特征以及空間關系等作為索引,計算查詢圖像和目標圖像之間的相似距離,然后按相似度匹配進行檢索,這種技術很大程度地利用了人們的視覺客觀特性,避免不同人對圖像主觀理解的不同而達不到理想的搜索效果。從研究方向的層面來看,基于內(nèi)容的圖像檢索可分為三層:第一層是根據(jù)圖像的底層特性來進行檢索,如顏色、紋理,形狀等等,涉及圖像信息處理、圖像分析和相似性匹配技術;第二層是基于圖像對象語義,如圖像中實體及實體之間的拓撲關系的檢索,對象級檢索
6、技術建立在下層特征基礎上,并引入了對象模型庫、對象識別和人工智能等圖像理解技術;第三層是基于圖像的抽象屬性如行為語義,情感語義和場景語義的推理學習來進行檢索。需要用到知識庫和更加有效的人工智能和神經(jīng)網(wǎng)絡技術。這三個層次由低到高,與人的認知接近,下一個層次通常包含了比上一個層次更高級的語義,更高層的語義往往通過較低層的語義推理獲得。盡管經(jīng)過了多年的研究,較為成熟的基于內(nèi)容的圖像檢索技術目前仍處于底層水平,由于底層研究是上層研究的基礎,為了給上層建立準確、有效的圖像特征提取方法,底層的研究仍在不斷的發(fā)展。1.3 基于內(nèi)容的圖像檢索的特點和主要應用基于內(nèi)容的圖像檢索技術有以下特點3:一是它突破了傳統(tǒng)
7、的基于表達式檢索的局限,從媒體內(nèi)容中提取信息線索。利用圖像內(nèi)容特征建立索引進行檢索,使得檢索更加有效,適應性更強。二是基于內(nèi)容的圖像檢索是一種近似匹配,即按照某種相似性度量,比較圖像特征間的差異度。相似度較低的圖像將作為檢索結果返回給用戶。三是它是大型數(shù)據(jù)庫的快速檢索。在實際的多媒體數(shù)據(jù)庫中,數(shù)據(jù)量巨大,而且種類和數(shù)量巨大,因此要求CBIR技術快速地實現(xiàn)對多媒體信息的檢索。四是以相關反饋為有效手段。為了提高檢索的準確性,整個過程是個逐步逼近和相關反饋的過程。用戶的交互性增強了表達查詢、評價查詢結果和基于評價結果進行進一步檢索的能力。CBIR己經(jīng)成功地應用于一些專門領域。典型應用領域4包括:(1
8、)搜索引擎:隨著各種電子商務網(wǎng)站的發(fā)展,圖像搜索引擎將成為這些網(wǎng)站的重要工具。(2)家庭用圖像檢索:數(shù)碼科技使得普通家庭也會產(chǎn)生成千上萬的圖像,家庭圖像檢索系統(tǒng)將是家庭PC的一個基本工具。(3)數(shù)字圖書館:數(shù)字圖書館實際上是一個數(shù)字信息資源庫,其中有字符數(shù)值庫、文本庫、聲音庫、圖像庫等。因此,如何快速、高效地從數(shù)字圖書館中找出用戶所需的信息就成為現(xiàn)代圖書館研究的熱點和關鍵技術之一。(4)商標檢索系統(tǒng):可在收錄了己注冊商標的數(shù)據(jù)庫中查找是否有與注冊商標類似的,防止商標權受侵害。(5)法律及公安:它是圖像數(shù)據(jù)庫技術的一個重要應用領域。典型的例子有:面部數(shù)據(jù)庫、指紋數(shù)據(jù)庫、犯罪紀錄數(shù)據(jù)庫以及建筑物保
9、安數(shù)據(jù)庫等。我國在“人臉”及“指紋”數(shù)據(jù)庫建立方面已做了不少工作,并有一批實用性的成果投入應用。(6)郵票資料庫:主要用于郵票資料的管理與查詢,也可以提供郵票鑒定等更高級的應用服務。(7)教育與培訓:在教育與培訓領域,例如遠程教學、交互式培訓、自學教育及雇員再教育等有著廣闊的應用前景。國外在培訓系統(tǒng)領域已投入了大量的經(jīng)費,開展了相關課題的研究工作。我國多媒體教學研究工作也已經(jīng)開展,網(wǎng)上教學與輔導已進入實用階段,這些都為圖像數(shù)據(jù)庫應用于教育培訓領域提供了廣闊的前景。(8)工業(yè)與商業(yè):工業(yè)應用包括企業(yè)多媒體信息系統(tǒng)、CAD/CAM等商業(yè)應用有電子商務、在線廣告、在線購物、股票等。(9)保健及醫(yī)療:
10、圖像數(shù)據(jù)庫在該領域中應用范圍很廣,除了專用的圖像管理與檢索系統(tǒng)外,還包括建立多媒體醫(yī)療信息管理系統(tǒng),將龐雜的醫(yī)療數(shù)據(jù)管理起來.這些數(shù)據(jù)包括病歷、病人的圖像信息(如X光片、CT掃描及MRI照片等)以及描述手術過程的視頻信息等。它為現(xiàn)有的醫(yī)學系統(tǒng)帶來了一場革命,其中最有前景的應用是遠程醫(yī)療(Telemedicine)、遠程外科手術(Tele-surgery)及遠程診斷(Tele-diagnoses)等。1.4 基于內(nèi)容的圖像檢索的關鍵技術5目前,對于通用的靜止圖像檢索,用于檢索的特征主要有顏色(Color)、紋理(Texture)、形狀(Shape)等,其中顏色、紋理、形狀應用尤為普遍;活動視頻檢
11、索脫胎于序列圖像分析中的技術。本文主要研究對靜止圖像檢索,其中數(shù)據(jù)庫是專用的圖像庫。對于目標圖像和檢索圖像進行顏色空間轉換、亮度圖像的邊緣提取和二值分割、提取目標區(qū)域的顏色特征。顏色內(nèi)容包含兩個一般的概念,一個對應于全局顏色分布,一個對應于局部顏色信息。按照全局顏色分布來索引圖像可以通過計算每種顏色的像素的個數(shù)并構造顏色灰度直方圖來實現(xiàn),這對檢索具有相似的總體顏色內(nèi)容的圖像是一個很好的途徑。局部顏色信息是指局部相似的顏色區(qū)域,它考慮了顏色的分類與一些初級的幾何特征。比如Smith等提出了顏色集合(color set)方法來抽取空間局部顏色信息并提供顏色區(qū)域的有效索引。運用顏色直方圖進行檢索有如
12、下三種方式:(1)指明顏色組成-該法需要用戶對圖像中的顏色非常敏感,而且使用起來也不方便,檢索的查準率和查全率并不高,因此暫時不做進一步開發(fā)。(2)指明一幅示例圖像-通過與用戶確定的圖像的顏色直方圖的相似性匹配得到查詢結果,這是該課題研究方法的根本。(3)指明圖像中一個子圖-分割圖像為各個小塊,然后利用選擇小塊來確定圖像中感興趣的對象的輪廓,通過建立更復雜的顏色關系(如顏色對方法)來查詢圖像,該方法是進一步優(yōu)化檢索的一個設想。在顏色空間選取方面,最常用的顏色空間是RGB顏色空間。通常,人們采用歐氏距離來刻畫兩種顏色之間的差異,RGB空間存在的一個嚴重問題是其中所計算出來的兩種顏色之間的距離無法
13、正確表征人們實際所感知到的這兩種顏色之間的真實差異。HSV空間比較直觀并且符合人的視覺特性。HSV顏色模型有兩個重要的特點作為基礎。首先,V分量與彩色信息無關,其次H和S分量與人感受彩色的方式緊密相連,其中H分量尤其影響人類的視覺判斷。這些特點使得HSV模型非常適合基于人視覺系統(tǒng)對彩色感知特性的圖像處理。得到圖像特征的統(tǒng)計直方圖后,不同圖像間的特征匹配可借助計算直方圖間的距離來進行。一般意義上直方圖匹配方法有直方圖相交法,直方圖匹配法,歐氏距離法,中心矩法,累積直方圖匹配法共6種。本文重點討論歐氏距離法,并將其作為系統(tǒng)編程實現(xiàn)的主要方法。所以,顏色特征的圖像檢索關鍵技術路徑如圖1:相似度量特征
14、提取顏色空間圖1 顏色特征的圖像檢索關鍵技術路徑1.5 國內(nèi)外研究現(xiàn)狀61.5.1 國外研究現(xiàn)狀基于內(nèi)容的圖像檢索技術是當前研究的熱點,許多著名雜志如IEEE Trans.On PAMI 、IEEE Trans.On Image processing 等紛紛設??榻B該領域研究的最新成果,著名的國際會議如:IEEE conference of CVPR 、 ACM conference on multimedia等紛紛設立專題交流最新的研究成果。各大研究機構和公司都推出了他們的系統(tǒng):(1)IBM的QBIC系統(tǒng) IBM的QBIC是第一個商業(yè)化的基于內(nèi)容的圖像檢索系統(tǒng),它的系統(tǒng)結構包括圖像入庫、特
15、征計算、查詢階段三部分,允許使用例子圖像、用戶構建的草圖和圖畫、選擇的顏色和紋理模式、鏡頭和目標運動和其他圖形信息等,對大型圖像和視頻數(shù)據(jù)庫進行查詢。 它的系統(tǒng)框架和結構對后來圖像檢索系統(tǒng)具有深遠的影響。(2)新加坡大學和MIT媒體實驗室的Photobook系統(tǒng) 該系統(tǒng)是用于交互式瀏覽和搜索圖像庫的工具。圖像在裝入時按形狀、紋理和人臉的面部外形三種特征自動分類,同時還能結合文本關鍵字進行查詢,圖像根據(jù)類別通過顯著語義特征壓縮編碼。 (3)Virage公司的Virage系統(tǒng)該系統(tǒng)是基于內(nèi)容的圖像搜索引擎,比QBIC更進一步,支持基于顏色、顏色布局、紋理和結構(對象邊界信息)及這四個原子查詢的任意
16、組合。VirageVirageEngine主要有3方面的功能:圖像分析、圖像比較和圖像管理,技術的核心是VirageEngine以及在圖像對象層上的操作。(4)美國哥倫比亞大學的VisualSEEK系統(tǒng) VISualSEEK圖像查詢系統(tǒng)是一個可視化的圖像特征搜索引擎,實現(xiàn)了互聯(lián)網(wǎng)上的基于內(nèi)容的圖像/視頻檢索系統(tǒng),它由四部分組成:圖形用戶界面、服務器應用、圖像檢索服務器、圖像歸檔。在VisualSEEK中,整幅圖的顏色分布使用全局顏色直方圖,區(qū)域顏色的索引采用二進制顏色集的表達方法。它采用基于小波變換的方法來表示圖像的紋理特征。1.5.2 國內(nèi)研究現(xiàn)狀相對國外而言,國內(nèi)在這方面的研究起步相對較晚
17、:I.浙江大學從95年開始進行多媒體圖像檢索的研究,完成了基于顏色和基于形狀的圖像原型系統(tǒng),總體設計思想是允許用戶找到包含特定顏色、紋理和形狀的圖像。II.中科院計算技術研究所開發(fā)了一個圖像檢索原型系統(tǒng)“ImageSeek,作為“中國數(shù)字圖書館示范工程”課題的一個關鍵技術。該系統(tǒng)實現(xiàn)了基于文本、顏色、紋理特征的圖像檢索。III.杭州貝爾研發(fā)的具有自主知識產(chǎn)權的智能圖像檢索系統(tǒng),通過提取圖像的顏色、紋理和形狀等特征,實現(xiàn)了基于圖像內(nèi)容的快速智能檢索,被列入2001年信息產(chǎn)業(yè)部重點科研計劃。2 基于顏色特征的圖像檢索方法2.1 顏色度量體系顏色度量體系7(color system),也叫做顏色制或
18、者叫做顏色體制,實際上就是人們組織和表示顏色的方法。組織和表示顏色的方法主要有兩種:一種是顏色模型,一種是編目系統(tǒng)。顏色模型是用簡單的數(shù)值方法描述所有顏色的一套規(guī)則和定義,可使人們方便地描述任何一種顏色,顏色模型通常用顏色空間描述,如RGB、CMY和CMYK,從這個意義上說,顏色模型和顏色空間互為同義詞。任何一種顏色都可用三種基本顏色按不同的比例混合得到,顯示彩色圖像用RGB相加混色模型:顏色=R(Red 百分比)+G(Green 百分比)+B(Blue 百分比)顏色空間是表示顏色的一種數(shù)學方法,人們用它來指定和產(chǎn)生顏色,使顏色形象化。顏色空間通常用三維模型表示,空間中的顏色能夠看到或者使用顏
19、色模型產(chǎn)生。顏色空間中的顏色通常使用代表三個參數(shù)的三維坐標來指定,這些參數(shù)描述的是顏色在顏色空間中的位置,其顏色要取決于使用的坐標。對于顏色空間的構造需要滿足三個要求:完備性(Completeness),顏色空間應能描述人能感知的所有顏色;一致性(Uniformity ),顏色在空間度量的差異和感知的差異相吻合;唯一性(Uniqueness),顏色空間中顏色在感知上彼此不同。2.2 顏色空間82.2.1 RGB顏色空間面向硬設備的最常用顏色模型是RGB模型。在RGB模型中,所有顏色都可看作是3個基本顏色,即紅(R,red),綠(G,green)和藍(B,blue)的不同組合。將這三種顏色成分分
20、別人為地分成0到255共256個等級,0表示沒有刺激量,255表示刺激量達到最大值。R、G、B均為255時表示白光,均為0時表示黑色。這樣,我們就能表示出256256256(約1600萬)種顏色。如圖2所示,采用三維直角坐標系,紅、綠、藍為原色,各個原色混合在一起產(chǎn)生復合色。絕大部分的可見光譜可以用紅、綠、藍R(、G、B)三色光按不同比例和強度的混合來表示。在顏色重疊的位置,產(chǎn)生青色、洋紅和黃色。因為RGB顏色合成產(chǎn)生白色,它們也稱為加色。將所有顏色加在一起產(chǎn)生白色,也就是說,所有光被反射回眼睛。加色用于光照、視頻和顯示器。RGB顏色模型通常采用單位立方體來表示,在正方體的主對角線上,各原色的
21、強度相等,產(chǎn)生由暗到明的白色,也就是不同的灰度值。(0,0,0)為黑色,(l,1,1)為白色。正方體的其它六個角點分別為紅、黃、綠、青、藍和品紅,需要注意的一點是,RGB顏色模型所覆蓋的顏色域取決于顯示設備熒光點的顏色特征,是與硬件相關的。在顯示屏上顯示顏色定義時,往往采用這種模式。圖像如用于電視、幻燈片、網(wǎng)絡、多媒體,一般使用RGB模式。雖然RGB彩色模型被廣泛應用于CRT設備顯示彩色圖像,但它并不是一個均勻視覺的顏色空間,不符合人對顏色的感知心理,而且,RGB顏色空間上的距離并不代表人眼視覺上的顏色知覺差異。但在對彩色圖像進行特征提取時,需要用數(shù)量來描述顏色的差別,因此需要用另一種符合人的
22、視覺心理的視覺彩色模型來表示顏色。圖2 RGB顏色模型2.2.2 HSV顏色空間HSV空間是一種符合人類視覺感知特征的顏色空間,特別適合于人類肉眼對顏色的識別,因此被廣泛應用于計算機視覺領域。它把彩色信號表示為三種屬性:色調H(Hue)、飽和度S(Saturation)和亮度V(value),其中亮度又稱LightneSS或Intensity,所以HSV空間還有HLS和HIS這兩種叫法。 HSV模型的色調H表示從一個物體反射過來的或透過物體的光的波長,更一般地說,色調是由顏色名稱來辨別的,如紅、橙、黃、綠等,它用角度-180180或O360來度量。亮度V是顏色的明暗程度,通常用百分比度量,O%
23、為最暗的黑色,而100%為最亮的白色。飽和度S指顏色的深淺程度,即在純色中包含的白色光的成份。例如同樣是紅色,也會因顏色濃度不同而分為深紅色、粉紅色和淺紅色。飽和度S也用百分比來度量,從濃度最小的O%到濃度完全飽和的100%。色調H和飽和度S分量合起來定義了顏色的色度(Chromatieity)特性。HSV顏色模型用Munsell三維空間坐標系統(tǒng)表示,其示意圖如圖3所示。圖3 HSV顏色模型 Munsen顏色空間具有以下己經(jīng)被人的眼睛所證實的特點: (1)坐標之間的心理感知獨立性(PereeptualIndependenee),即人可以獨立感知各顏色分量的變化。(2)線性伸縮性(LinearS
24、ealability),人眼可感知的顏色差異與HSV顏色分量的相應值上的歐幾里德距離(EuelideanDIStanee)是成比例的。因為HSV顏色空間根據(jù)色調H的值來區(qū)分不同的顏色,因此在HSV的三個分量中,H分量是尤為重要的,它可以很好地模擬人類對顏色的識別和記憶過程。2.2.3 CMY顏色空間以紅、綠、藍的補色青(Cyan)、品紅(Magenta)、黃(Yellow)為原色構成的CMY顏色模型,常用于從白光中濾去某種顏色,又被稱為減性原色系統(tǒng)。CMY顏色模型對應的直角坐標系的子空間與RGB顏色模型所對應的子空間幾乎完全相同。差別僅在于前者的原點為白,而后者的原點為黑。前者是定義在白色中減
25、去某種顏色來定義的一種顏色,而后者通過從黑色中加入顏色來定義一種顏色。CMY模型以打印在紙張上油墨的光線吸收特性為基礎,當白光照射到半透明油墨上時,部分光譜被吸收,部分被反射回眼睛。理論上,青(Cyan)、品紅(Magenta)和黃(Yellow)色素能夠合成吸收所有的顏色并產(chǎn)生黑色。因為所有打印油墨都會包含一些雜志,這三種油墨實際上產(chǎn)生一種土灰色,必須與黑色油墨混合才能產(chǎn)生真正的黑色。將這些油墨混合產(chǎn)生顏色稱為四色印刷。減色(CMY)和加色(RGB)是互補色,每對減色產(chǎn)生一種加色,反之亦然。如圖4所示。圖4 CMY顏色模型認知科學及視覺心理學證明,人類不能像計算機顯示器那樣只使用RGB成分感
26、知顏色,因此,選擇一個適合于人類視覺特征的顏色空間可以改善檢索效果。由于在進行基于內(nèi)容的圖像檢索時,查詢要求往往是按照用戶的主觀視覺感受而發(fā)出的,因此在進行圖像之間顏色差異的比較時,CBIR系統(tǒng)一般采用具有視覺一致性的顏色空間。所謂視覺一致性,是指對兩種不同的顏色,它們在顏色空間中坐標的距離與它們在觀察者的顏色感知空間中的距離是大致相同的。HSV空間具有這樣的特性9。因此本系統(tǒng)選用HSV顏色模型。3 顏色特征的表達3.1 顏色直方圖 (1)顏色直方圖的定義顏色直方圖9是顏色信息的函數(shù),其核心思想是在一定的顏色空間中對圖像各種顏色出現(xiàn)的頻數(shù)進行統(tǒng)計,顏色直方圖描述的是不同色彩在整幅圖像中所占的比
27、例,而并不關心每種色彩所處的空間位置,即圖像的對象或物體。它的優(yōu)點就在于它能簡單描述一幅圖像中顏色的全局分布,即不同色彩在整幅圖像中所占的比例,特別適用于描述那些難以自動分割的圖像和不需要考慮物體空間位置的圖像。顏色直方圖可以基于不同的顏色空間和坐標系,最常用的是RGB顏色空間,因為大部分的數(shù)字圖像都是用RGB顏色空間表達的?;赗GB顏色空間表示時,彩色圖像的直方圖可以用R、G、B三個單色的直方圖或聯(lián)合分布直方圖來表示。用三個單色直方圖表示時,各個直方圖表示的是圖像在這種顏色分量的統(tǒng)計分布,總共有三個不同的概率分布。而彩色圖像用一個RGB顏色直方圖表示時,其統(tǒng)計的是不同顏色出現(xiàn)的頻數(shù),以色彩
28、作為橫坐標,縱坐標為色彩出現(xiàn)的頻數(shù)。在RGB顏色空間中,顏色直方圖可以看成是一個離散函數(shù),即 ()其中,k表示圖像的特征取值,L表示特征可取值的個數(shù),凡表示圖像中具體征值為k的像素個數(shù),n表示圖像像素的總個數(shù)。(2)顏色直方圖的特性 旋轉不變性和縮放不變性:顏色直方圖是表示圖像中顏色分布的一種方法,它的橫軸表示顏色等級,縱軸表示在某一個顏色等級上具有該顏色的像素在整幅圖像中所占的比例,直方圖顏色空間中的每一個刻度表示了顏色空間中的一種顏色,因此,顏色直方圖具有與身俱來的旋轉不變性和縮放不變性,如圖5所示。位置無關性:直方圖描述了每個灰度級的像素的個數(shù),但不能為這些像素在圖像中的位置提供任何線索
29、。當一幅圖像被壓縮為直方圖后,所有的空間信息將全部丟失,因此,任一特定的圖像具有唯一的直方圖,但并非一一對應,而是一對多,不同的圖像有可能具有相同的直方圖特征。疊加性:如果一幅圖像由兩個不連接的區(qū)域組成,并且每個區(qū)域的直方圖己知,則整幅圖像的直方圖是該兩個區(qū)域的直方圖之和。該結論可推廣到任何數(shù)目的不連接區(qū)域的情形。直方圖是總體灰度概念,從直方圖中可以看出圖像整體的性質:如圖像的明暗程度、圖像的亮度等。再如圖像的灰度動態(tài)范圍太小會使許多細節(jié)分辨不清楚,而灰度級分布均勻,則會給人以清晰、明快的感覺。 圖5 顏色直方圖的旋轉不變性和縮放不變性3.2 累加直方圖10當圖像中的特征并不能取遍所有可取值時
30、,統(tǒng)計直方圖中會出現(xiàn)一些零值。這些零值的出現(xiàn)會對計算直方圖的相交帶來很大影響,從而使得算出的匹配值并不能正確的反映兩圖間的顏色差別。累加直方圖是以顏色作為橫坐標,從坐標原點到該顏色的所有顏色的像素出現(xiàn)的頻數(shù)為縱坐標繪出的圖形。這樣圖像的累加直方圖向量H可以定義為:表示C1Ck種顏色的像素的累加頻數(shù):我們已經(jīng)計算出圖像的一般直方圖,可以方便地計算圖像累加直方圖。這樣,最后得到的累加直方圖特征向量為:4 圖像特征的相似性匹配4.1 相似度匹配方法11圖像檢索的效果很大程度上取決于匹配算法的優(yōu)劣。基于文本的檢索方法中使用的是文本的精確匹配,而基于內(nèi)容的圖像檢索則通過計算查詢和候選圖像之間的視覺特征的
31、相似度來完成。以一定的計量或測量方法來判斷圖像內(nèi)容是否相關。圖像特征提取大多數(shù)可以表示為向量形式,因此常用的圖像比較方法都是基于向量空間模型,即將圖像特征看作向量空間中的兩個點,通過比較兩個點之間的距離來衡量其相似度。按照距離公理,在定義距離測度時要滿足距離公理的四個條件:自相似性、最小性、對稱性、及三角不等性。設 D 為距離函數(shù),x、y、z 為三個特征向量,則所有的距離函數(shù)都滿足的條件表示為:(1)D ( x,y ) = D ( y,x ) = 0(自相似性)(2)D ( x,y )D ( x,x )0(最小性)(3)D ( x,y ) = D ( y,x)(對稱性)(4)D ( x,y )
32、 + D ( y,z )D ( x,z )(三角不等性)圖像的相似度度量,既是圖像檢索技術中的一個關鍵問題,也是其中的一個難點。常見的方法有:直方圖相交法、直方圖歐氏距離、直方圖余弦距離、二值集hammimg距離、直方圖二次距離度量、二值集二次距離、直方圖Mahalanobis距離。以下只簡要介紹系統(tǒng)中常用的直方圖的交、直方圖歐氏距離兩種距離度量方法。4.2直方圖的交集的方法直方圖的交集算法,根據(jù)顏色索引檢索出查詢圖像的顏色直方圖,將其與圖像庫中的每一圖像的直方圖取交集,根據(jù)交集的值來選出最佳匹配圖像。直方圖交集的公式如下:D(Ha,Hb)= 其中Ha為查詢圖像直方圖,Hb為圖像庫中的任一圖像
33、直方圖,為兩圖像的匹配值。,它的值越接近1,則兩圖像越相似。直方圖交集方法能對兩幅圖像進行詳細的比較,然而對于許多合成的圖像,如商標等,它們有大量的一致顏色,三維直方圖只有幾個域的值很高,而其它許多域的顏色信息變化有限。因而,對于這樣的圖像進行過細的比較是不必要的。又由于在掃描圖像時容易產(chǎn)生一些噪音,所以這種過細的比較容易產(chǎn)生錯誤的結果。4.3 歐式距離法我們可以利用歐基里德距離公式(Euclidean Distance)來計算距離。對于兩個 N維直方圖x,y,兩者的歐氏距離可以表示如下: 此距離公式雖然簡單,但是與特定的顏色分布無關,有一種方法可以引入相關權值A,這里A是一個維矩陣,此時距離
34、公式可以表述如下: 為了簡化計算,將直方圖x,y規(guī)范化使其滿足: 矩陣,權表示顏色i與顏色j之間的相似度。若取z=x-y,則有,取定了距離公式后,我們需要確定A的取值,且要保證此矩陣A能夠使,我們用表示顏色i與顏色j在RGB顏色空間的距離。 取。 有 因為.5 圖像檢索算法實現(xiàn)5.1 程序開發(fā)運行環(huán)境Matlab是集數(shù)值計算、符號運算及圖形處理等強大功能于一體的科學計算語言作為強大的科學計算平臺,它幾乎能夠滿足所有的計算需求,它具有如下的優(yōu)勢與特點: 友好的工作平臺和編程環(huán)境;簡單易用的程序語言;強大的科學計算及數(shù)據(jù)處理能力;出色的圖形處理功能。5.2 程序檢索邏輯特征提取待匹配圖像按相似度排
35、列的檢索結果集計算相似度圖像庫特征提取圖6程序檢索邏輯圖我們可以從圖6中抽象出三個層次或者功能模塊:(1) 顏色空間內(nèi)特征提取對圖像數(shù)據(jù)進行特征提取,可以選擇任何一種能夠達到檢索要求的顏色空間和特征表達方式。(2) 圖像匹配(相似度計算)在選取了特征之后,需要選擇或尋找適當?shù)呐袆e準則,從而判斷出待識別的圖像的特征與數(shù)據(jù)庫中的哪些圖像的特征最接近。(3) 結果輸出將滿足一定相似性條件的一組候選結果按相似度大小排列后返回給用戶。5.3 算法具體實現(xiàn)(1)顏色空間的選擇及顏色的矢量量化通常, 人們采用歐氏距離表示兩種顏色之間的差異, 最常用的RGB顏色空間存在一個嚴重問題是其中所計算出來的兩種顏色之
36、間的距離無法正確表征人們實際所感知到的這兩種顏色之間的真實差異。例如:距離為50的(0,0,0)與(50,0,0)兩種顏色認為是同一黑色,而距離為50的(200,200,0)和(150,200,0)則認為是兩種差異很大的顏色(黃色和綠色)。本文在處理顏色特征時采用了HSV顏色空間, 該模型較好符合人眼的感知特征。從RGB空間轉換到HSV空間的具體過程可參考相關文獻。在理論上, 抽取圖像的顏色特征時使用真彩色將產(chǎn)生最小的誤差。但是, 特征抽取和特征匹配的計算量以及特征的存儲都將隨實際顏色數(shù)目增多而非線性膨脹, 因此, 使用真彩色在實際檢索過程中是不現(xiàn)實的。實驗表明, 增加顏色直方圖的維數(shù)可以有效
37、提高檢索的精度, 但當維數(shù)增加到一定程度時, 檢索的精度提高很小而且可能下降. 因此在保持一定精度的前提下, 通過減少顏色的維數(shù)來達到節(jié)省特征存儲空間的目的。在系統(tǒng)實現(xiàn)時, 我們根據(jù)H S V空間的特征, 在降低直方圖的維數(shù)并保留足夠的顏色信息前提下, 對 HSV空間進行非均勻量化, 得到77種代表顏色。首先將圖像中每一像素的r ,g,b值轉換為h,s,v值(h0,360,s0,1,v0,1),然后按照圖7的顏色量化和編碼方法計算:圖7按照上面的方法將顏色空間共劃分為 77種顏色, 這 77種代表色的量化方法有效地壓縮了顏色特征并且較好的符合人眼對顏色的感知。代碼實現(xiàn)如下:M,N,O = si
38、ze(Image);h,s,v = rgb2hsv(Image);H = h; S = s; V = v;h = h*360;%將hsv空間非等間隔量化:% h量化成8級;% s量化成3級;% v量化成3級;for i = 1:M for j = 1:N if h(i,j)315 H(i,j) = 0; end if h(i,j)20 H(i,j) = 1; end if h(i,j)40 H(i,j) = 2; end if h(i,j)75 H(i,j) = 3; end if h(i,j)155 H(i,j) = 4; end if h(i,j)190 H(i,j) = 5; end i
39、f h(i,j)270 H(i,j) = 6; end if h(i,j)295 H(i,j) = 7; end endendfor i = 1:M for j = 1:N if s(i,j)0 S(i,j) = 0; end if s(i,j)0.2 S(i,j) = 1; end if s(i,j)0.7 S(i,j) = 2; end endendfor i = 1:M for j = 1:N if v(i,j)0 V(i,j) = 0; end if v(i,j)0.2 V(i,j) = 1; end if v(i,j)0.7 V(i,j) = 2; end endend(2)將三個顏
40、色分量合成為一維特征向量:L = H*Qs*Qv+S*Qv+v;Qs,Qv分別是S和V的量化級數(shù), L取值范圍0,71,取Qs = 3; Qv = 3,并計算L的直方圖,代碼實現(xiàn)如下:for i = 1:M for j = 1:N L(i,j) = H(i,j)*9+S(i,j)*3+V(i,j); endendfor i = 0:71 Hist(i+1) = size(find(L=i),1);endT=Hist;(3)計算圖像庫中每一幅圖像與查詢例子圖像的歐式距離,代碼實現(xiàn)如下:diff = (T0-T).2; EulerDistance = sqrt( sum( diff(:) ) );
41、 w(k)=EulerDistance;end(4)按顏色的相似性大小顯示查詢結果圖片,代碼實現(xiàn)如下:B,IX=sort(w,2);A=dir(D:graduate designtest_pictures*.jpg);for n=1:10 subplot(3,4,n); I=imread(strcat(D:graduatedesigntest_pictures,A(IX(n).name); imshow(I);end5.4 實例演示第一步,運行程序彈出對話框,選擇待匹配圖像,如圖8所示;圖8第二步,程序繼續(xù)執(zhí)行,最后在彈出窗口上按與待匹配圖像相似度從大到小的順序顯示圖像,如圖9所示。圖96 全
42、文總結與展望6.1 全文總結隨著多媒體技術的發(fā)展,包括圖像、音頻、視頻等信息的多媒體數(shù)據(jù)大量涌現(xiàn),如何從大量的信息中快速、有效地檢索到所需的內(nèi)容,已經(jīng)成為多媒體技術研究中的熱點問題。本文對基于內(nèi)容的圖像檢索技術作了較全面的研究和介紹,重點研究了基于顏色特征的圖像檢索方法,并對其中涉及到的顏色模型,顏色直方圖,顏色量化,相似性度量等進行了較深入研究。在對基于顏色特征的圖像檢索方法的研究基礎上,作者用matlab語言編寫了一個簡單的圖像檢索演示程序,實驗證明,該程序實現(xiàn)了圖像檢索的基本功能,但基于顏色特征的圖像檢索僅是從圖像的低層特性出發(fā),這些方法具有計算簡單、對平移和旋轉不敏感等優(yōu)點。但是直方圖
43、不能反映空間位置的變化,兩幅景色相似但是空間位置完全不同的圖像,得出的直方圖是一模一樣的。另外是顏色量化誤差的影響較大,以致差別細微的顏色可能會得出無差別或差別很大的兩種決然不同的顏色直方圖。因此,如何有效地綜合顏色、紋理、形狀、空間位置關系以及語義特征來對圖像進行查詢勢必會成為一個熱門研究方向。6.2 展望人們對顏色索引和檢索方法的研究己經(jīng)相當多,它們都分別從不同的方面對基于顏色的圖像檢索問題進行了研究。目前主要存在的問題:(1)人對顏色特征的視覺感知方面考慮的仍然不夠,雖然目前大多數(shù)基于顏色特征的圖像檢索采用了和人對顏色感知相一致的HSB顏色空間,但關于兩種顏色之間的相似度的定義和視覺上人
44、對相似顏色的判定仍有一定的差距。(2) 從顏色特征的表示來看,各種形式的顏色直方圖是最常采用的表示方法,一般指定相同的顏色集,采用幾十到上百維的高維直方圖。實際上人對兩幅圖像畫面的顏色的相似性判定主要考慮少數(shù)幾種主要的顏色。不同的圖像有不同的顏色集,對于包含不同顏色集的兩幅圖像之間的相似性判定仍需進一步研究。(3)為進一步提高顏色特征的檢索效果,要從顏色物理、視覺、心理幾方面進行綜合深入研究。CBIR系統(tǒng)在技術上可分為圖像處理技術和數(shù)據(jù)庫技術兩大方面。在圖像處理技術方面,更加準確有效地描述圖像內(nèi)容的數(shù)據(jù)模型是今后長期需要解決的重要方面。然而目前,通過建立合理的用戶查詢界面,利用相關性反饋,是實
45、現(xiàn)趨向基于語義查詢的切實可行的有效方法;在數(shù)據(jù)庫技術方面,CBIR系統(tǒng)正產(chǎn)生深刻變化,如DBMS中對物理磁盤的管理技術、索引技術等底層技術都向著支持多媒體數(shù)據(jù)和更開放的方向發(fā)展。基于內(nèi)容對圖像信息的查詢、檢索在國內(nèi)外仍處于研究探索階段,隨著應用的需求其研究將會不斷深入,滿足不同應用的實用系統(tǒng)也將陸續(xù)出現(xiàn),將其應用于各個領域必將帶來極大的益處。致謝本文是在XX老師的悉心指導下完成的,衷心感謝他在論文的寫作期間給與我的熱情幫助和指導。XX老師淵博的知識,認真負責的工作作風,平易近人的態(tài)度讓我獲益匪淺。在此,向XX老師表示最衷心的感謝和最誠摯的敬意。 還要感謝我的同學XX,他在我的論文寫作過程中提出
46、了很多建設性的意見,并給了我很多啟發(fā)。 感謝XXXXXXXXXXX計算機系的全體領導和老師,你們深厚的學術功底和誨人不倦的高尚師德將讓我受用一生。 感謝計算機科學與技術專業(yè)XXXX級X班全班同學給予我的關心、友誼和幫助,是你們給了我美好而難忘的學習生活。 最后,我要衷心感謝我的父母,是你們一直默默地給與我理解與支持,給與我勇敢面對困難的勇氣和力量,讓我能夠順利地完成學業(yè)。參考文獻1洪安祥.基于內(nèi)容的圖像檢索若干論題研究D.浙江:浙江大學,2007:1-36.2M Flickner,HSawhney,WNiblack.Query by image and video content:the QB
47、IC systemJ.IEEE Computer,2007,28(9):23-32.3顧燕.基于內(nèi)容的圖像檢索方法及其實驗系統(tǒng)設計D.江蘇:河海大學,2009:3-10.4劉士林.基于內(nèi)容的圖像檢索J.佳木斯大學學報.2008,19(3):259.5徐杰,施鵬飛.基于內(nèi)容的圖像檢索技術J.中國圖像圖形學報.2008,8(9):978.6王冰.基于顏色特征的圖像檢索方法研究D.山東:山東大學,2007:2-11.7高升.基于顏色特征的圖像檢索方法及系統(tǒng)實現(xiàn)D.北京:北京郵電大學,2006:4-5.8張潔.基于顏色特征的圖像檢索系統(tǒng)設計與實現(xiàn)D.吉林:吉林大學,2006:10.9劉德龍.基于顏色特征的圖像檢索系統(tǒng)設計與實現(xiàn)D.武漢:華中師范大學,2007:12.10孫君頂編著.圖像低層特征提取與檢索技術M.北京:電子工業(yè)出版社,2009:5-40.11周明全,耿國華,韋娜著.基于內(nèi)容圖像檢索技術M.北京:清華大學出版社,2007:4-35.英文摘要Color-based Image Retrieval TechnologyComputer science and technology XXXXXXTutor XXXXXXXAbstract: This paper describes the image retrieval algorithm based on color fe
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 提前解除勞動合同的賠償計算與支付方式
- 聯(lián)合經(jīng)營協(xié)議書范本
- 證人保證書范文2024年
- 買賣定金合同協(xié)議書
- 2024年外墻施工分包合同范本
- 2024中國銀行信托投資公司外匯固定資產(chǎn)貸款合同
- 互聯(lián)網(wǎng)投資合作協(xié)議書怎么寫
- 2024設備保修合同模板
- 土方設備互換協(xié)議
- 2024年二手車轉讓合同模板
- 項目主要施工管理人員情況
- 個人借條電子版模板
- 關于學習“國語普通話”發(fā)聲亮劍【三篇】
- 玻璃廠應急預案
- 嬰幼兒游戲照料(嬰幼兒回應性照護課件)
- 貨車進入車間安全要求
- MAC地址-廠商對應表
- 2022年中國出版業(yè)總體狀況分析
- BIM大賽題庫含答案
- 造紙術學習課件
- (完整版)譯林版四年級上冊Unit7單元測試
評論
0/150
提交評論