




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、本科畢業(yè)論文(科研訓(xùn)練、畢業(yè)設(shè)計)題 目:基于顏色特征的圖像檢索方法研究與實現(xiàn) 姓 名:汝 璐學(xué) 院:信息科學(xué)與技術(shù)系:計算機專 業(yè):計算機年 級:2004學(xué) 號:04120074指導(dǎo)教師(校內(nèi)):李翠華 職稱:教授指導(dǎo)教師(校外):曲延云 職稱:年 月 日基于顏色特征的圖像檢索方法研究與實現(xiàn)【摘要】本文介紹了一個基于改進的加權(quán)顏色直方圖的圖象檢索系統(tǒng)。本系統(tǒng)通過將基于改進的加權(quán)的局域顏色直方圖的圖像檢索方法和全局直方圖的圖像檢索方法相結(jié)合,提高查全率和查準(zhǔn)率。其中,基于分塊局域直方圖的檢索方法利用了圖像中間部分的重要性,將圖像平均劃分成33個子塊,取中間一塊的圖像,計算其與參考位圖相應(yīng)位置的
2、顏色特征距離,再計算原圖的顏色直方圖與參考位圖的顏色特征距離,分別賦予權(quán)值后得出的值就是圖像之間內(nèi)容的相似程度。本文引入歐氏距離的相似性度量方法實現(xiàn)圖像檢索。實驗表明,該方法具有較好的查全率和查準(zhǔn)率?!娟P(guān)鍵字】圖像檢索,顏色特征,顏色直方圖,相似性度量方法content-based image retrieval systemlearn and realizationabstractthis image retrieval system is based on a improved weighted color histogram. with combining the improved im
3、age retrieval algorithem of based on the weighted central-block color histogram and the image retrieval algorithem of overall histogram, the recall rate and the rate of search is improved . using the importance of the image of the middle part, the retrieval method based on the block local histogram
4、divide a picture into an average of 3 3 sub-blocks. choose the middle one , calculate the colour feature distance between the middle block of original image and the middle block of reference image .then calculate the colour feature distance between the original image and reference image. weighted wi
5、th fixed value , we can get the similarity between them. we introduce the euclidean distance measurement methods to achieve similar image retrieval. the experiments show that the method has a better recall rate and the rate of search.keywords: image retrieval, features of color,color histogram, simi
6、lar methods of measurement目錄摘要-iabstract-ii第1章 緒論-1 1.1 課題研究的目的和意義-1 1.2 圖像檢索系統(tǒng)的關(guān)鍵技術(shù)- 1.3 國內(nèi)外研究現(xiàn)狀- 1.4 本文所作的主要工作-第2章 基于顏色特征的圖像檢索- 2.1 顏色模型- 2.1.1 rgb模型 2.1.2 hsv模型 2.1.3 cmy 模型 2.1.4 l*a*b模型 2.2 顏色特征的提取與表達- 2.2.1全局顏色直方圖2.2.2基于分塊顏色直方圖法2.2.3累加直方圖2.2.4局部累加直方圖 2.3 圖像特征的相似性匹配-2.3.1直方圖相交法2.3.2歐式距離方法2.3.3模
7、糊方法第3章 圖像檢索系統(tǒng)的設(shè)計- 3.1 系統(tǒng)設(shè)計3.1.1算法分析 3.2 系統(tǒng)的實現(xiàn) 3.3 一個圖像檢索實例第一章 緒論1.1 課題研究的目的和意義隨著多媒體技術(shù)的快速發(fā)展,計算機硬件技術(shù)的不斷更新,以圖片、圖表、動畫和視頻為形式的信息發(fā)布量日益龐大,隨之出現(xiàn)了大量龐大的不同內(nèi)容的圖像信息庫。數(shù)字圖像的應(yīng)用包括國防軍事、工業(yè)制造、醫(yī)療衛(wèi)生、新聞媒體、大眾娛樂等各方面。人們在工作生活中越來越多地接觸到大量的各種各樣的圖像信息。首先,在科學(xué)計算、可視化、工程制圖及其他眾多的應(yīng)用領(lǐng)域如數(shù)字圖書館、天氣預(yù)報、知識產(chǎn)權(quán)保護、天氣預(yù)報、醫(yī)療圖像管理、犯罪預(yù)防、軍事觀察和地球資源觀察系統(tǒng)、宇宙探測、
8、交通檢測等領(lǐng)域,每天都有數(shù)量非常巨大的圖像信息在不斷產(chǎn)生與使用。其次,隨著internet的發(fā)展,網(wǎng)絡(luò)的應(yīng)用和發(fā)展對社會各個領(lǐng)域產(chǎn)生了巨大影響,特別是web的興起,網(wǎng)絡(luò)上傳輸?shù)男畔⒄灾笖?shù)級增長。作為一種全新的媒體和公共資源,越來越多的圖像信息出現(xiàn)在web站點上,但是它們都是無序、無索引的,在這樣的環(huán)境下尋找感興趣的資料是非常耗時的。因此,人們對信息檢索工具和系統(tǒng)的依賴將會日益增加。面對信息量如此巨大的圖像信息,熱門迫切需要一種有效的檢索方法。傳統(tǒng)的圖像檢索技術(shù)是基于文本索引的圖像檢索,通過用文本描述圖像的語義,然后再這些圖像文本標(biāo)注基礎(chǔ)上應(yīng)用成熟的文本搜索算法,為用戶搜索預(yù)期的圖像。雖然檢索
9、比較準(zhǔn)確而且速度很快,但是隨著圖像數(shù)據(jù)庫規(guī)模的增大(如數(shù)十萬以上),這種檢索消耗的時間大大增加,而且人工標(biāo)注具有主觀性和不確定性。鑒于上述因素,人們提出了一種新的圖像檢索技術(shù)-基于圖像內(nèi)容的檢索cbir(contented-based image retrieval),它不需要用戶的參與,而利用圖像自身的特征,如顏色、紋理、形狀等特征來進行檢索,具有較強的客觀性。基于內(nèi)容的圖像檢索是一種實用性很強的技術(shù),有著廣闊的前景,涉及到社會和生活的方方面面。1.2 圖像檢索系統(tǒng)的關(guān)鍵技術(shù)目前,對于通用的靜止圖像檢索,用于檢索的特征主要有顏色(color)、紋理(texture)、形狀(shape)等,其
10、中顏色、紋理、形狀應(yīng)用尤為普遍;活動視頻檢索脫胎于序列圖像分析中的技術(shù)。本文主要研究對靜止圖像檢索,其中數(shù)據(jù)庫是專用的圖像庫。對于目標(biāo)圖像和檢索圖像進行顏色空間轉(zhuǎn)換、亮度圖像的邊緣提取和二值分割、提取目標(biāo)區(qū)域的顏色特征。顏色內(nèi)容包含兩個一般的概念,一個對應(yīng)于全局顏色分布,一個對應(yīng)于局部顏色信息。按照全局顏色分布來索引圖像可以通過計算每種顏色的像素的個數(shù)并構(gòu)造顏色灰度直方圖來實現(xiàn),這對檢索具有相似的總體顏色內(nèi)容的圖像是一個很好的途徑。局部顏色信息是指局部相似的顏色區(qū)域,它考慮了顏色的分類與一些初級的幾何特征。比如smith等提出了顏色集合(color set)方法來抽取空間局部顏色信息并提供顏色
11、區(qū)域的有效索引。運用顏色直方圖進行檢索有如下三種方式:(1)指明顏色組成-該法需要用戶對圖像中的顏色非常敏感,而且使用起來也不方便,檢索的查準(zhǔn)率和查全率并不高,因此暫時不做進一步開發(fā)。(2)指明一幅示例圖像-通過與用戶確定的圖像的顏色直方圖的相似性匹配得到查詢結(jié)果,這是該課題研究方法的根本。(3)指明圖像中一個子圖-分割圖像為各個小塊,然后利用選擇小塊來確定圖像中感興趣的對象的輪廓,通過建立更復(fù)雜的顏色關(guān)系(如顏色對方法)來查詢圖像,該方法是進一步優(yōu)化檢索的一個設(shè)想。在顏色空間選取方面,最常用的顏色空間是rgb顏色空間。通常,人們采用歐氏距離來刻畫兩種顏色之間的差異,rgb空間存在的一個嚴(yán)重問
12、題是其中所計算出來的兩種顏色之間的距離無法正確表征人們實際所感知到的這兩種顏色之間的真實差異。hsi空間比較直觀并且符合人的視覺特性。hsi顏色模型有兩個重要的特點作為基礎(chǔ)。首先,i分量與彩色信息無關(guān),其次h和s分量與人感受彩色的方式緊密相連,其中h分量尤其影響人類的視覺判斷。這些特點使得hsi模型非常適合基于人視覺系統(tǒng)對彩色感知特性的圖像處理。得到圖像特征的統(tǒng)計直方圖后,不同圖像間的特征匹配可借助計算直方圖間的距離來進行。一般意義上直方圖匹配方法有直方圖相交法,直方圖匹配法,歐氏距離法,中心矩法,累積直方圖匹配法共6種。本文重點討論歐氏距離法,并將其作為系統(tǒng)編程實現(xiàn)的主要方法。所以,顏色特征
13、的圖像檢索關(guān)鍵技術(shù)路徑如圖一:特征表達顏色空間顏色顏色空間顏色空間空間相似度量圖1-1 顏色特征的圖像檢索關(guān)鍵技術(shù)路徑1.3 國內(nèi)外研究現(xiàn)狀 基于內(nèi)容的圖像檢索技術(shù)開始于上世紀(jì)90年代初期,目前已有十幾年歷史,是當(dāng)前研究的熱點,許多著名雜志如ieee trans. on pami 、ieee trans. on image processing 等紛紛設(shè)??榻B該領(lǐng)域研究的最新成果,著名的國際會議如:ieee conference of cvpr 、 acm conference on multimedia等紛紛設(shè)立專題交流最新的研究成果。各大研究機構(gòu)和公司都推出了他們的系統(tǒng),在商用領(lǐng)域,ib
14、m 首先研制出了qbic系統(tǒng);在學(xué)術(shù)研究領(lǐng)域,mit的photobook系統(tǒng),新加坡國立大學(xué)的core系統(tǒng),美國哥倫比亞大學(xué)的visualseek系統(tǒng),加利福尼亞大學(xué)santa barbara分校的netra、伊利諾依大學(xué)的mars、cmu的infomedia以及哥倫比亞大學(xué)的videoq等。下面主要介紹這些系統(tǒng)概況:1qbic系統(tǒng) ibm almaden研究中心研究開發(fā)的,是基于內(nèi)容檢索系統(tǒng)的典型代表。qbic系統(tǒng)允許使用例子圖像、用戶構(gòu)建的草圖和圖畫、選擇的顏色和紋理模式、鏡頭和目標(biāo)運動和其他圖形信息等,對大型圖像和視頻數(shù)據(jù)庫進行查詢。 2photobook系統(tǒng) mit的媒體實驗室在199
15、4年開發(fā)研制的。圖像在裝入時按人臉、形狀或紋理特性自動分類,圖像根據(jù)類別通過顯著語義特征壓縮編碼。 3core系統(tǒng) 新加坡國立大學(xué)開發(fā)的一個基于內(nèi)容的檢索機。其顯著技術(shù)特色包括: 多種特征提取方法、多種基于內(nèi)容檢索方法、使用自組織神經(jīng)網(wǎng)絡(luò)對復(fù)雜特征度量、建立基于內(nèi)容索引的新方法以及對多媒體信息進行模糊檢索的新技術(shù)。 4visualseek系統(tǒng) 美國哥倫比亞大學(xué)圖像和高級電視實驗室開發(fā)的。它實現(xiàn)了互聯(lián)網(wǎng)上的基于內(nèi)容的圖像/視頻檢索系統(tǒng),提供了一套工具供人們在web上搜索和檢索圖像和視頻。1.4 本文所作的主要工作從圖一的技術(shù)路徑分析,結(jié)合設(shè)計要求,我們需要對要素工作具體化,目的是使系統(tǒng)試驗簡單高
16、效而不失代表性。如下:顏色空間選取 面向硬件的rgb空間和面向視覺的hsi 空間;顏色特征的表達 全局直方圖,全局累加直方圖,局部累加直方圖;相似性度量 歐氏距離計算方法。 第2章 基于顏色特征的圖像檢索 圖像是通過顏色表現(xiàn)出來的,顏色是圖像最重要的屬性。所以,對于基于內(nèi)容的圖像檢索來說圖像采取哪種顏色表示方式就顯得尤為重要。本章的主要任務(wù)是分析不同的顏色空間表示方式以及適合于圖像檢索系統(tǒng)的顏色空間。2.1顏色模型圖像是通過顏色表現(xiàn)出來的,顏色是彩色圖像的最顯著的特征,與其它特征相比,顏色特征具有非常穩(wěn)定,對于旋轉(zhuǎn)、平移、尺度變化都不敏感,表現(xiàn)出很強的魯棒性,又由于顏色特征計算簡單,因此基于顏
17、色的查詢成為現(xiàn)有基于內(nèi)容的圖像檢索系統(tǒng)中應(yīng)用最基本的方法。而如何選取合適的顏色特征,以及對顏色特征如何進行有效的抽取將關(guān)系到最終的顏色特征的相似性比較和檢索的效果。顏色模型是指某個三維顏色空間中的一個可見光子集,它包含某個顏色域的所有顏色。顏色模型的用途是在某個顏色域內(nèi)方便的指定顏色。由于每一個顏色域都是可見光的子集,所以任何一個顏色模型都無法包含所有的可見光。常見的顏色模型包括rgb(紅、綠、藍(lán));hsv(色調(diào)、飽和度、亮度);cmyk(青、洋紅、黃、黑);以及cie組織的l*a*b等。2.1.1 rgb模型面向硬設(shè)備的最常用顏色模型是rgb模型。在rgb模型中,所有顏色都可看作是3個基本顏
18、色,即紅(r,red),綠(g,green)和藍(lán)(b,blue)的不同組合。將這三種顏色成分分別人為地分成0到255共256個等級,0表示沒有刺激量,255表示刺激量達到最大值。r、g、b均為255時表示白光,均為0時表示黑色。這樣,我們就能表示出256256256(約1600萬)種顏色。如圖2-1所示,采用三維直角坐標(biāo)系,紅、綠、藍(lán)為原色,各個原色混合在一起產(chǎn)生復(fù)合色。絕大部分的可見光譜可以用紅、綠、藍(lán)r(、g、b)三色光按不同比例和強度的混合來表示。在顏色重疊的位置,產(chǎn)生青色、洋紅和黃色。因為rgb顏色合成產(chǎn)生白色,它們也稱為加色。將所有顏色加在一起產(chǎn)生白色,也就是說,所有光被反射回眼睛。
19、加色用于光照、視頻和顯示器。rgb顏色模型通常采用單位立方體來表示,在正方體的主對角線上,各原色的強度相等,產(chǎn)生由暗到明的白色,也就是不同的灰度值。(0,0,0)為黑色,(l,1,1)為白色。正方體的其它六個角點分別為紅、黃、綠、青、藍(lán)和品紅,需要注意的一點是,rgb顏色模型所覆蓋的顏色域取決于顯示設(shè)備熒光點的顏色特征,是與硬件相關(guān)的。在顯示屏上顯示顏色定義時,往往采用這種模式。圖像如用于電視、幻燈片、網(wǎng)絡(luò)、多媒體,一般使用rgb模式。圖2-1 rgb顏色模型雖然rgb彩色模型被廣泛應(yīng)用于crt設(shè)備顯示彩色圖像,但它并不是一個均勻視覺的顏色空間,不符合人對顏色的感知心理,而且,rgb顏色空間上
20、的距離并不代表人眼視覺上的顏色知覺差異。但在對彩色圖像進行特征提取時,需要用數(shù)量來描述顏色的差別,因此需要用另一種符合人的視覺心理的視覺彩色模型來表示顏色。2.1.2 hsv模型 hsv空間是一種符合人類視覺感知特征的顏色空間,特別適合于人類肉眼對顏色的識別,因此被廣泛應(yīng)用于計算機視覺領(lǐng)域25。它把彩色信號表示為三種屬性:色調(diào)h(hue)、飽和度s(saturation)和亮度v(value),其中亮度又稱lightness或intensity,所以hsv空間還有hls和his這兩種叫法。 hsv模型的色調(diào)h表示從一個物體反射過來的或透過物體的光的波長,更一般地說,色調(diào)是由顏色名稱來辨別的,如
21、紅、橙、黃、綠等,它用角度-180180或o360來度量。亮度v是顏色的明暗程度,通常用百分比度量,o%為最暗的黑色,而100%為最亮的白色。飽和度s指顏色的深淺程度,即在純色中包含的白色光的成份。例如同樣是紅色,也會因顏色濃度不同而分為深紅色、粉紅色和淺紅色。飽和度s也用百分比來度量,從濃度最小的o%到濃度完全飽和的100%。色調(diào)h和飽和度s分量合起來定義了顏色的色度(chromatieity)特性。hsv顏色模型用munsell三維空間坐標(biāo)系統(tǒng)表示,其示意圖如圖2-2所示。2-2 hsv顏色模型 munsen顏色空間具有以下己經(jīng)被人的眼睛所證實的特點: 1.坐標(biāo)之間的心理感知獨立性(per
22、eeptualindependenee),即人可以獨立感知各顏色分量的變化。2.線性伸縮性(linearsealability),人眼可感知的顏色差異與hsv顏色分量的相應(yīng)值上的歐幾里德距離(euelideandistanee)是成比例的。因為hsv顏色空間根據(jù)色調(diào)h的值來區(qū)分不同的顏色,因此在hsv的三個分量中,h分量是尤為重要的,它可以很好地模擬人類對顏色的識別和記憶過程。2.1.3cmy模型以紅、綠、藍(lán)的補色青(eyan)、品紅(magenta)、黃(yellow)為原色構(gòu)成的cmy顏色模型,常用于從白光中濾去某種顏色,又被稱為減性原色系統(tǒng)。cmy顏色模型對應(yīng)的直角坐標(biāo)系的子空間與rgb
23、顏色模型所對應(yīng)的子空間幾乎完全相同。差別僅在于前者的原點為白,而后者的原點為黑。前者是定義在白色中減去某種顏色來定義一種顏色,而后者是通過從黑色中加入顏色來定義一種顏色。cmy模型以打印在紙張上油墨的光線吸收特性為基礎(chǔ),當(dāng)白光照射到半透明油墨上時,部分光譜被吸收,部分被反射回眼睛。理論上,青(cyna)、品紅(magenta)、和黃(yelolw)色素能夠合成吸收所有的顏色并產(chǎn)生黑色。因為所有打印油墨都會包含一些雜質(zhì),這三種油墨實際上產(chǎn)生一種土灰色,必須與黑色(k)油墨混合才能產(chǎn)生真正的黑色。將這些油墨混合產(chǎn)生顏色稱為四色印刷。減色(cmy)和加色(rgb)是互補色,每對減色產(chǎn)生一種加色,反之
24、亦然。如圖2-3所示。2-3 cmy顏色模型2.1.4l*a*b模型l*a*b顏色模型是在1931年國際照明委員會(cie)制定的顏色度量國際標(biāo)準(zhǔn)的基礎(chǔ)上建立的。1976年,這種模型被重新修訂并命名為cie l*a*b。l*a*b顏色設(shè)計為與設(shè)備無關(guān),不管使用什么設(shè)備創(chuàng)建或輸出圖像,這種顏色模型產(chǎn)生的顏色都保持一致。l*a*b顏色由亮度或光亮度分量(l)和兩個色度分量組成:即a分量(從綠到紅)和b分量(從藍(lán)到黃)。2.2顏色特征的提取與表達 1991年swain和ballard首次提出了基于顏色直方圖的特征表示,其核心思想是在一定的顏色空間中對圖像中各種顏色出現(xiàn)的頻數(shù)進行統(tǒng)計。具體做法是,在給
25、定的顏色空間基礎(chǔ)上,統(tǒng)計每種顏色分量的像素數(shù)占圖像總像素數(shù)的比例,從而得到圖像各種顏色分量的比例分布直方圖,最后把直方圖作為圖像的顏色特征進行圖像檢索。由于圖像的顏色直方圖具有尺度不變性和旋轉(zhuǎn)不變性,因此被廣泛采用。顏色直方圖是顏色信息的函數(shù),它表示圖像中具有同顏色級別的像素的個數(shù),其橫坐標(biāo)是顏色級別,縱坐標(biāo)是顏色出現(xiàn)的頻率(像素的個數(shù))。但是,直方圖也存在著缺陷。首先,顏色直方圖只包含了圖像中某一顏色值出現(xiàn)的頻數(shù),而丟失了像素點所在的位置信息。而且,雖然對任意一幅圖像都能唯一的給出與它對應(yīng)的直方圖,但不同的圖像卻有可能具有相同的直方圖特征,也就是直方圖與圖像之間并非一一對應(yīng)的,而是一對多的關(guān)
26、系。這些缺點都會影響直方圖特征檢索的有效性。2.2.1 全局顏色直方圖全局直方圖是一種經(jīng)常被采用的顏色特征,已在很多圖像檢索系統(tǒng)中得到應(yīng)用。設(shè)c(x,y)為rgb空間一幅彩色圖像,其顏色直方圖的定義為:其中,m、n為圖像c(x,y)垂直和水平方向上的像素數(shù)目,并簡稱為圖像的高和寬;而k為變換空間的顏色數(shù)。2.2.2 基于分塊顏色直方圖法 采用的分塊方法是把圖像分成單獨的nn塊,并且圖像分塊太大則失去分塊的意義,不能充分包含顏色的分布信息,分塊太小則會增加檢索過程的計算量。經(jīng)試驗比較分析,對二維空間進行33劃分是較有效的劃分方案。2.2.3累加直方圖當(dāng)圖像中的特征并不能取遍所有可取值時,統(tǒng)計直方
27、圖中會出現(xiàn)一些零值。這些零值的出現(xiàn)會對計算直方圖的相交帶來很大影響,從而使得算出的匹配值并不能正確的反映兩圖間的顏色差別。累加直方圖是以顏色作為橫坐標(biāo),從坐標(biāo)原點到該顏色的所有顏色的像素出現(xiàn)的頻數(shù)為縱坐標(biāo)繪出的圖形。這樣圖像的累加直方圖向量h可以定義為:表示c1ck種顏色的像素的累加頻數(shù):我們已經(jīng)計算出圖像的一般直方圖,可以方便地計算圖像累加直方圖。這樣,最后得到的累加直方圖特征向量為:2.2.4局部累加直方圖在hsi空間里,h=0基本對應(yīng)紅色,h=pi/3基本對應(yīng)黃色,h=2pi/3基本對應(yīng)綠色。這樣在h軸上黃色與紅色間,黃色與綠色間距相等。但從人的視覺感知來講,黃色與紅色間,黃色與綠色間本
28、無所謂哪兩個更相似。這表明色度信號的分布從視覺意義上講,并不滿足累加直方圖應(yīng)用的前提。所以,對色彩比較復(fù)雜的自然景物圖像,一般累加直方圖算法在檢索中就會將不同色度的信號混淆起來。另外,一幅圖像的顏色一般非常多,尤其是真彩色圖像,因此直方圖矢量的維數(shù)會非常高。如果能采用局部累加后降維,則計算量要少得多。系統(tǒng)設(shè)計中,我們采用pi/3為區(qū)間的長度,將h軸共分成6個不重疊的局部區(qū)間60k, 60(k+1),k=0,1,5,通過分別計算每個局部區(qū)間的累加直方圖進行檢索。上述方法都保留了顏色在圖像中出現(xiàn)的概率信息,但也丟失了很多顏色的空間信息,因此不同的圖像有可能具有相同顏色特征表示。許多人提出了顏色索引
29、的改進方法-局部顏色特征索引。從劃分局部區(qū)域的角度來說可分為:基于固定塊的圖像分割、基于手工的區(qū)域分割、采用交互的半自動的區(qū)域分割以及一些自動的顏色分割方法。局部區(qū)域中的顏色信息可以表示為平均顏色、主顏色、顏色直方圖和二進制顏色集等來表示。設(shè)計系統(tǒng)中暫不做討論。2.3圖像特征的相似性匹配在基于文本的檢索方法中采用的是文本的精確匹配,而基于內(nèi)容的圖像檢索則是通過計算查詢圖像和圖像庫中候選圖像之間在視覺特征上的相似度匹配進行。因此,定義一個合適的視覺特征相似度度量方法對檢索的效果有很大的影響。視覺特征大豆可以表示成向量的形式,常用的相似度方法也是向量空間模型,即將視覺特征看作是向量空間中的點,通過
30、計算兩個點直接的接近程度來衡量圖像特征間的相似度。常見的方法有:直方圖相交法、直方圖歐氏距離、直方圖余弦距離、二值集hammimg距離、直方圖二次距離度量、二值集二次距離、直方圖mahalanobis距離。以下只簡要介紹系統(tǒng)中常用的直方圖的交、直方圖歐氏距離兩種距離度量方法。2.3.1直方圖相交法度量直方圖距離的一種經(jīng)典方法就是直方圖相交法。直方圖的相交是指兩個直方圖在每個bin(維度)中共有的像素數(shù)量。具體做法是,根據(jù)顏色索引檢索出查詢圖像的顏色直方圖,將其與圖像庫中的每一圖像的直方圖取交集,根據(jù)交集的值來選出最佳匹配圖像。在直方圖相交法中,令hq(k)和hr(k)分別為查詢圖像q和數(shù)據(jù)庫圖
31、像r的特征統(tǒng)計直方圖,則二者之間的匹配值為:直方圖交集方法能對兩幅圖像進行詳細(xì)的比較,然而對于許多合成的圖像,如商標(biāo)等,它們有大量的一致顏色,三維直方圖只有幾個域的值很高,而其它許多域的顏色信息變化有限。因而,對于這樣的圖像進行過細(xì)的比較是不必要的。又由于在掃描圖像時容易產(chǎn)生一些噪音,所以這種過細(xì)的比較容易產(chǎn)生錯誤的結(jié)果。2.3.2歐氏距離方法我們可以利用歐基里德距離公式(euclidean distance)來計算距離。對于兩個 n維直方圖x,y,兩者的歐氏距離可以表示如下: 此距離公式雖然簡單,但是與特定的顏色分布無關(guān),因此我們可以引入相關(guān)權(quán)值a,這里a是一個維矩陣,此時距離公式可以表述如
32、下: 為了簡化計算,將直方圖x,y規(guī)范化使其滿足: 矩陣,權(quán)表示顏色i與顏色j之間的相似度。若取z=x-y,則有,取定了距離公式后,我們需要確定a的取值,且要保證此矩陣a能夠使,我們用表示顏色i與顏色j在rgb顏色空間的距離。 取。 有 因為.2.3.3模糊方法1965年,zadeh提出了他著名的模糊集理論,從此創(chuàng)建了一個新的學(xué)科模糊數(shù)學(xué)。 模糊集理論是對傳統(tǒng)集合理論的一種推廣,在傳統(tǒng)集合理論中,一個元素或者屬于一個集合,或者不屬于一個集合;而對于模糊集來說,每一個元素都是以一定的程度屬于某個集合,也可以同時以不同的程度屬于幾個集合。對人們現(xiàn)實生活中大量使用的一些含義確定但又不準(zhǔn)確的語言表達,
33、比如“今天天氣很熱”、“車速過高,需要適當(dāng)踩剎車”等,用模糊數(shù)學(xué)可以很好的表達。第三章 圖像檢索系統(tǒng)的設(shè)計3.1系統(tǒng)設(shè)計3.1.1算法分析顏色直方圖存在一定的缺陷,同樣的一個對象在不同的背景中得到的兩幅圖片,它們的顏色直方圖可能有很大的差別,在計算相似度時認(rèn)為不相似(特別是對象在圖像中所占的比例很少時)。一般來說,處于圖像中間的部分對圖像起著重要的作用,而四周僅僅是圖像背景。因此,本文采用的全局顏色直方圖與較簡易的分塊關(guān)鍵直方圖相結(jié)合的方法設(shè)計方法。將圖像平均分成九塊,因此取圖像正中部分以獲取分塊關(guān)鍵直方圖信息,并給這一部分像素分配較大的權(quán)值。如圖3-1。 圖3-1(a) 圖3-1(b)這種基
34、于位置劃分的改進顏色直方圖建立步驟為:(1)根據(jù)上面提出的分塊方法,計算圖像中心區(qū)域的關(guān)鍵顏色直方圖h1(2)計算整幅圖像的顏色直方圖h2,新的顏色直方圖可以表示為: h = 4 h2 /9 + 6 h1 這樣取值的目的是突出了圖像中間位置像素的重要性而弱化了背景區(qū)域像素,這就達到了不同位置的像素根據(jù)重要性分配不同權(quán)值的目的。3.1.2系統(tǒng)結(jié)構(gòu)框圖系統(tǒng)的整個業(yè)務(wù)流程可以用如下框圖表示:圖3-2 基于彩色特征的圖像檢索系統(tǒng)業(yè)務(wù)流程 我們可以從系統(tǒng)框圖中抽象出三個層次或者功能模塊:(1) 顏色空間內(nèi)特征提取對圖像數(shù)據(jù)進行特征提取,提取用戶感興趣的、適合檢索要求的特征。顏色空間實現(xiàn)為rgb。對于圖像全局的特征表達為全局顏色直方圖,對于圖像局部的特征表達為局部累計直方圖。(2) 圖像匹配在選取了特征之后,需要選擇或?qū)ふ疫m當(dāng)?shù)呐?/p>
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 戰(zhàn)略合作方銷售代理合同范本
- 土地使用權(quán)買賣合同樣本
- 臨時雇傭合同標(biāo)準(zhǔn)文本
- 高校畢業(yè)生實習(xí)協(xié)議合同
- 股份合作企業(yè)合同范本
- 婚禮場地租賃合同書
- 度企業(yè)信用反擔(dān)保合同協(xié)議
- 企業(yè)安全生產(chǎn)責(zé)任協(xié)議合同
- 勞動合同樣本:員工長期雇傭
- 海濱度假村物業(yè)銷售合同協(xié)議
- 2024年財政部會計法律法規(guī)答題活動題目及答案一
- 《冠心病》課件(完整版)
- 餐廳服務(wù)員禮儀培訓(xùn)(30張)課件
- 肺結(jié)核共45張課件
- SCI論文寫作031112課件
- (完整)PICC導(dǎo)管堵塞的預(yù)防及處理ppt
- 公司舉辦讀書分享會活動策劃5篇
- 行政法整套ppt課件完整版教學(xué)教程最全電子講義(最新)
- Q∕SY 1802-2015 石油煉制與化工裝置工藝設(shè)計包編制規(guī)范
- 人工挖孔樁防護驗收表(范本模板)
- 麥琴每日讀經(jīng)計劃表
評論
0/150
提交評論