數(shù)字圖像處理復(fù)習(xí)資料_第1頁
數(shù)字圖像處理復(fù)習(xí)資料_第2頁
數(shù)字圖像處理復(fù)習(xí)資料_第3頁
數(shù)字圖像處理復(fù)習(xí)資料_第4頁
數(shù)字圖像處理復(fù)習(xí)資料_第5頁
已閱讀5頁,還剩64頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第一章圖像處理:是對圖像信息進行加工處理,以滿足人的視覺心理和實際應(yīng)用的需求。圖像處理方法:光學(xué)方法、電子學(xué)方法。模擬圖像:連續(xù)的,采用數(shù)字化(離散化)表示和數(shù)字技術(shù)出現(xiàn)之前,圖像是連續(xù)的,這一類圖像稱模擬圖像或連續(xù)圖像。連續(xù)的:指從時間上和從數(shù)值上是不間斷的。數(shù)字圖像:由連續(xù)的模擬圖像采樣和量化而得。組成數(shù)字圖像的基本單位是像素,所以數(shù)字圖像是像素的集合。像素為元素的矩陣,像素的值代表圖像在該位置的亮度,稱為圖像的灰度值。數(shù)字圖像像素具有整數(shù)坐標(biāo)和整數(shù)灰度值。圖像分類:按波段多少,圖像可分為單波段、多波段和超波段圖像。單波段圖像在每個點只有一個亮度值。多光譜圖像上每一個點不只一個特性。從人眼的視覺特點看,圖像分為可見圖像和不可見圖像。(模擬)圖像分類維數(shù):二維圖像、三維圖像顏色:黑白圖像、彩色圖像時間:靜止圖像、活動圖像數(shù)字圖像:數(shù)字圖像可以理解為圖像的數(shù)字表示,是時間和空間的非連續(xù)函數(shù)(信號),是為了便于計算機處理的一種圖像表示形式。它是由一系列離散單元經(jīng)過量化后形成的灰度值的集合,即像素(Pixel)的集合。數(shù)字圖像處理的特點1信息量大:512×512×8bit=256KB256KB×25幀/s=6400KB=6.25MB2占用的頻帶較寬:電視圖像的帶寬5~6MHz,而語言帶寬4KHz,頻帶越寬,技術(shù)實現(xiàn)難度越大3像素相關(guān)性大:壓縮潛力大4評價受人的影響大圖像處理對圖像進行一系列的操作以達到預(yù)期的目的的技術(shù)稱作圖像處理。圖像處理可分為模擬圖像處理和數(shù)字圖像處理兩種方式。特點:主要在像素級進行處理,處理的數(shù)據(jù)量非常大。圖像分析圖像分析主要是對圖像中感興趣的目標(biāo)進行檢測和測量,從而建立對圖像的描述。特點:是一個從圖像到數(shù)據(jù)的過程,可以看作是中層處理。圖像工程的內(nèi)涵可分為圖像處理、圖像分析和圖像理解三個層次數(shù)字圖像的處理方法根據(jù)對圖像作用域的不同,數(shù)字圖像處理方法可分為:空域算法和變換域算法??沼蛱幚矸椒ǎ菏侵冈诳臻g域內(nèi)直接對數(shù)字圖像進行處理空域處理法主要有兩大類:(1)鄰域處理法(2)點處理法變換域處理方法:首先主要是通過傅立葉變換、離散余弦變換、沃爾什變換或是比較新的小波變換等變換算法,將圖像從空域變換到相應(yīng)的變換域,得到變換域系數(shù)陣列,然后在變換域中對圖像進行處理,處理完成后再將圖像從變換域反變換到空間域,得到處理結(jié)果。圖像處理圖像增強:改善圖像質(zhì)量圖像幾何處理:平移、縮放、旋轉(zhuǎn)、扭曲圖像復(fù)原:去噪聲、去模糊圖像重建:重建原始圖像圖像編碼壓縮:減少存儲量和傳輸量圖像分割:圖像區(qū)域分割和理解、目標(biāo)表達和描述圖像變換:提高圖像質(zhì)量圖像變換是圖像處理和圖像分析的一個重要分支,它將圖像從空間域變換到變換域,然后在變換域?qū)D像進行處理和分析。常用的圖像變換有傅立葉變換、DCT變換,小波變換等圖像增強是指根據(jù)一定的要求,突出圖像中感興趣的信息,而減弱或去除不需要的信息,從而使有用信息得到加強的信息處理方法。圖像增強技術(shù)可分為基于空間域的增強方法和基于頻率域的增強方法兩類。圖像增強主要方法有直方圖增強、空域濾波法、頻率域濾波法以及彩色增強法等。圖像編碼就是利用圖像信號的統(tǒng)計特性及人類視覺的生理學(xué)和心理學(xué)特性對圖像信號進行高效編碼,以解決數(shù)據(jù)量大的矛盾。圖像編碼的目的有三個:①盡量減少表示數(shù)字圖像時需要的數(shù)據(jù)量。②降低數(shù)據(jù)率以減少傳輸帶寬;③壓縮信息量,便于特征抽取,為識別作準(zhǔn)備。根據(jù)解壓重建后的圖像和原始圖像之間是否具有誤差,圖像編碼壓縮分為無誤差編碼和有誤差編碼兩大類。根據(jù)編碼方法作用域不同,圖像編碼分為空間域編碼和變換域編碼兩大類。圖像復(fù)原也叫圖像恢復(fù)其目的是找出圖像降質(zhì)的起因,并盡可能消除它,使圖像恢復(fù)本來面目。重建處理則是從數(shù)據(jù)到圖像的處理。也就是說輸入的是某種數(shù)據(jù),而處理結(jié)果得到的是圖像。該處理的典型應(yīng)用就是CT技術(shù)。圖像重建的主要算法有代數(shù)法、迭代法、傅里葉反投影法、卷積反投影法等。應(yīng)用查找ppt第二章2.1圖像的數(shù)字化圖像的數(shù)字化:包括采樣和量化兩個過程。圖像的采樣空間坐標(biāo)(x,y)的數(shù)字化被稱為圖像采樣。確定水平和垂直方向上的像素個數(shù)N、M。圖像的量化取值的數(shù)字化被稱為圖像灰度級量化量化處理:將f映射到Z的處理Z的最大取值,確定像素的灰度級數(shù)G=2m,如256采樣圖像在空間上的離散化稱為采樣。也就是用空間上部分點的灰度值代表圖像,這些點稱為采樣點。對一幅圖像采樣時,若每行(即橫向)像素為M個,每列(即縱向)像素為N個,則圖像大小為M×N個像素。根據(jù)一維采樣定理,若一維信號g(t)的最大頻率為ω,以T≤1/2ω為間隔進行采樣,則能夠根據(jù)采樣結(jié)果g(iT)(i=…,-1,0,1,…)完全恢復(fù)g(t),分辨率:是指映射到圖像平面上的單個像素的景物元素的尺寸。單位:像素/英寸,像素/厘米量化模擬圖像經(jīng)過采樣后,在時間和空間上離散化為像素。但采樣所得的像素值(即灰度值)仍是連續(xù)量。把采樣后所得的各像素的灰度值從模擬量到離散量的轉(zhuǎn)換稱為圖像灰度的量化。若連續(xù)灰度值用z來表示,對于滿足zi≤z≤zi+1的z值,都量化為整數(shù)qi。qi稱為像素的灰度值,z與qi的差稱為量化誤差。一般,像素值量化后用一個字節(jié)8bit來表示。把由黑—灰—白的連續(xù)變化的灰度值,量化為0~255共256級灰度值量化的方法有兩種:一是等間隔量化,一是非等間隔量化。等間隔量化就是簡單地把采樣值的灰度范圍等間隔地分割并進行量化。對于像素灰度值在黑—白范圍較均勻分布的圖像,這種量化方法可以得到較小的量化誤差。該方法也稱為均勻量化或線性量化。多采用等間隔量化方法。非均勻量化是依據(jù)一幅圖像具體的灰度值分布的概率密度函數(shù),按總的量化誤差最小的原則來進行量化。具體做法是對圖像中像素灰度值頻繁出現(xiàn)的灰度值范圍,量化間隔取小一些,而對那些像素灰度值極少出現(xiàn)的范圍,則量化間隔取大一些。采樣與量化參數(shù)的選擇假定圖像取M×N個樣點,每個像素量化后的灰度二進制位數(shù)為Q,一般Q總是取為2的整數(shù)冪,即Q=2k,則存儲一幅數(shù)字圖像所需的二進制位數(shù)b為b=M*N*Q字節(jié)數(shù)為B=M*N*Q采樣點數(shù)越多,圖像質(zhì)量越好;當(dāng)采樣點數(shù)減少時,圖上的塊狀效應(yīng)就逐漸明顯。當(dāng)圖像的采樣點數(shù)一定時,采用不同量化級數(shù)的圖像質(zhì)量也不一樣。如圖所示,量化級數(shù)越多,圖像質(zhì)量越好,當(dāng)量化級數(shù)越少時,圖像質(zhì)量越差,量化級數(shù)最小的極端情況就是二值圖像,圖像出現(xiàn)假輪廓。當(dāng)限定數(shù)字圖像的大小時,為了得到質(zhì)量較好的圖像可采用如下原則:(1)對緩變的圖像,應(yīng)該細量化,粗采樣,以避免假輪廓。(2)對細節(jié)豐富的圖像,應(yīng)細采樣,粗量化,以避免模糊(混疊)。對于彩色圖像,是按照顏色成分——紅(R)、綠(G)、藍(B)分別采樣和量化的。若各種顏色成分均按8bit量化,即每種顏色量級別是256,則可以處理256×256×256=16777216種將模擬圖像數(shù)字化成為數(shù)字圖像,需要某種圖像數(shù)字化設(shè)備。圖像數(shù)字化設(shè)備的性能主要有像素大小、圖像大小、線性度、噪聲等顏色。2.2圖像的表示靜態(tài)圖像可分為矢量圖和位圖,位圖也稱為柵格圖像矢量圖是用一系列繪圖指令來表示一幅圖,這種方法的本質(zhì)是用數(shù)學(xué)(更準(zhǔn)確地說是幾何學(xué))公式描述一幅圖像。位圖是通過許多像素點表示一幅圖像,每個像素具有顏色屬性和位置屬性。位圖又可以分成如下四種:二值圖像:2值圖像的像素值為0、1。灰度圖像:像素灰度級用8bit表示,所以每個像素都是介于黑色和白色之間的256(28=256)種灰度中的一種。是指每個像素的信息由一個量化的灰度級來描述的圖像,沒有彩色信息。索引顏色圖像:索引顏色的圖像最多只能顯示256種顏色真彩色圖像(RGB):由于它所表達的顏色遠遠超出了人眼所能辨別的范圍,故將其稱為“真彩色”。關(guān)于編程方面知識請找ppt.2.3圖像的質(zhì)量圖像的質(zhì)量包括——層次、對比度、清晰度層次灰度級:表示像素明暗程度的整數(shù)量層次:表示灰度級的數(shù)量圖像數(shù)據(jù)的實際層次越多視覺效果就越好對比度是指一幅圖像中灰度反差的大小對比度=最大亮度/最小亮度清晰度相關(guān)的主要因素·亮度·對比度·主題內(nèi)容的大小·細微層次·顏色飽和度2.4圖像的顏色圖像的顏色——RGB、HSI、CMYK、偽彩色、其它表色系HSI模型:HSI模型中,H表示色調(diào)(Hue),S表示飽和度(Saturation),I表示亮度(Intensity,對應(yīng)成像亮度和圖像灰度)。①I分量與圖像的彩色信息無關(guān);②H和S分量與人感受顏色的方式是緊密相聯(lián)的RGB轉(zhuǎn)HSI見ppt51頁偽彩色模型定義:通過顏色映射表描述色彩·實際上是RGB顏色模型的變體用偽彩色描述顏色的方法·建立顏色映射表一般表的長度16-256·像素值用其RGB值在映射表中的位置代替·通過抖動技術(shù)緩解顏色種類不足的問題·如何找出16-256種關(guān)鍵顏色是成敗的關(guān)鍵2.5圖像的像素圖像的像素——鄰域、連通性、距離圖像的像素:鄰域——4-鄰域、8-鄰域、D-鄰域4-鄰域定義:像素p(x,y)的4-鄰域是(x+1,y)(x-1,y)(x,y+1)(x,y-1),用N4(p)表示p的4-鄰域。8-鄰域定義:像素p(x,y)的8-鄰域是4-鄰域的點加上對角上的點(x+1,y+1)(x+1,y-1)(x-1,y+1)(x-1,y-1),用N8(p)表示p的8-鄰域。圖像的連通性:4-連通、8-連通、m-連通連通性是描述區(qū)域和邊界的重要概念兩個像素連通的兩個必要條件是·兩個像素的位置在某種情況下是否相鄰·兩個像素的值是否滿足某種相似性4-連通:對于具有值V的像素p和q,如果q在集合N4(p)中,則稱這兩個像素是4-連通的8-連通:對于具有值V的像素p和q,如果q在集合N8(p)中則稱這兩個像素是8-連通的m-連通的定義:對于具有值V的像素p和q如果:(i)q在集合N4(p)中或(ii)q在集合ND(p)中并且N4(p)與N4(q)的交集不空則稱這兩個像素是m-連通的,即4-連通和D-連通的混合連通臨近的定義如果像素p和q是連通的,則稱p臨近于q我們可以用定義鄰域的方法定義4-臨近、8-臨近和m-臨近路徑的定義定義臨近的方法定義4-路徑8-路徑和m-路徑圖像的距離歐幾里德距離:De(p,q)=[(x-s)2+(y-t)2]1/2D4距離(城市距離):D4(p,q)=|x-s|+|y-t|具有D4=1的像素是(x,y)的4-鄰域D8距離(棋盤距離):D8(p,q)=max(|x-s|,|y-t|);具有D8=1的像素是(x,y)的8-鄰域2.7灰度直方圖將圖像中像素亮度(灰度級別)看成是一個隨機變量,則其分布情況反映了圖像的統(tǒng)計特性,這可用ProbabilityDensityFunction(PDF)來刻畫和描述,表現(xiàn)為灰度直方圖(Histogram)?;叶戎狈綀D是灰度級的函數(shù),表示圖像中具有某種灰度級的像素的個數(shù),反映了圖像中每種灰度出現(xiàn)的頻率?;叶戎狈綀D的橫坐標(biāo)是灰度級,縱坐標(biāo)是該灰度級出現(xiàn)的頻度,它是圖像最基本的統(tǒng)計特征。直方圖的性質(zhì)(1)直方圖只包含了該圖像中某一灰度值的像素出現(xiàn)的概率,丟失了其所在位置的信息。(2)任一幅圖像,都能惟一地確定出一幅與它對應(yīng)的直方圖,但不同的圖像,可能有相同的直方圖。如圖兩幅不同圖像具有相同直方圖。圖像處理的方法基本上可分為空間域法和頻域法兩大類。(1)空間域法在原圖像上直接進行數(shù)據(jù)運算,對像素的灰度值進行處理。它又分為兩類:點運算和局部運算點運算:對圖像作逐點運算局部運算:在與處理像點鄰域有關(guān)的空間域上進行運算(2)頻域法在圖像的變換域上進行處理,增強感興趣的頻率分量,然后進行反變換,得到頻域處理過的圖像??沼驗V波及濾波器的定義使用空域模板進行的圖像處理,被稱為空域濾波(局部運算)。模板本身被稱為空域濾波器。模板操作是數(shù)字圖像處理中常用的一種運算方式,圖像的平滑、銳化、細化、邊緣檢測等都要用到模板操作。例如,有一種常見的平滑算法是將原圖中的一個像素的灰度值和它周圍鄰近8個像素的灰度值相加,然后將求得的平均值作為新圖像中該像素的灰度值??捎萌缦路椒▉肀硎驹搟111;11*1;111}上式有點類似于矩陣,通常稱之為模板(Template),帶星號的數(shù)據(jù)表示該元素為中心元素,即這個元素是將要處理的元素。模板操作實現(xiàn)了一種鄰域運算,即某個像素點的結(jié)果不僅和本像素灰度有關(guān),而且和其鄰域點的值有關(guān)。模板運算的數(shù)學(xué)含義是卷積(或互相關(guān))運算。卷積運算中的卷積核就是模板運算中的模板,卷積就是作加權(quán)求和的過程。卷積核=模板=空域濾波器無法進行模板操作的像素點處理方法解決這個問題采用兩種簡單方法:一種方法是忽略圖像邊界數(shù)據(jù),另一種方法是在圖像四周復(fù)制原圖像邊界像素的值,從而使卷積核懸掛在圖像四周時可以進行正常的計算。2.8空間域圖像的運算加法運算C(x,y)=A(x,y)+B(x,y)主要應(yīng)用舉例去除“疊加性”噪聲,生成圖像疊加效果。減法C(x,y)=A(x,y)-B(x,y)主要應(yīng)用舉例去除不需要的疊加性圖案檢測同一場景兩幅圖像之間的變化計算物體邊界的梯度。乘法C(x,y)=A(x,y)*B(x,y)主要應(yīng)用舉例圖像的局部顯示用二值蒙板圖像與原圖像做乘法空間域圖像運算——邏輯運算在“與”和“或”運算中,亮的表示二進制碼1,黑的代表0。模板處理有時可以作為一種感興趣區(qū)(ROI)處理。求反的定義g(x,y)=255-f(x,y)主要應(yīng)用舉例獲得一個陰圖像獲得一個子圖像的補圖像圖像的變換引言信號處理方法:時域分析法;頻域分析法頻率通常是指某個一維物理量隨時間變化快慢程度的度量。圖像是二維信號,其坐標(biāo)軸是二維空間坐標(biāo)軸,空間域:圖像本身所在的域稱為空間域(SpaceDomain)。圖像灰度值隨空間坐標(biāo)變化的快慢也用頻率來度量,稱為空間頻率(SpatialFrequency)。不同的變換:傅里葉變換余弦變換正弦變換圖像變換哈達瑪變換沃爾什變換K-L變換小波變換。傅里葉變換有兩個好處:1)可以得出信號在各個頻率點上的強度。2)可以將卷積運算化為乘積運算。傅里葉變換的特性,將時間信號正變換到頻率域后進行處理(例如低通、高通或帶通),然后再反變換成時間信號,即可完成對信號的濾波。?低通濾波:在頻率域中抑制高頻信號?高通濾波:在頻率域中抑制低頻信號計算過程見ppt3.1傅立葉變換-離散傅立葉變換在數(shù)字圖像處理中應(yīng)用傅立葉變換,還需要解決兩個問題:一是在數(shù)學(xué)中進行傅立葉變換的f(x)為連續(xù)(模擬)信號,而計算機處理的是數(shù)字信號(圖像數(shù)據(jù));二是數(shù)學(xué)上采用無窮大概念,而計算機只能進行有限次計算。計算機能運算的傅立葉變換稱為離散傅立葉變換可見,離散序列的傅立葉變換仍是一個離散的序列,每一個u對應(yīng)的傅立葉變換結(jié)果是所有輸入序列f(x)的加權(quán)和(每一個f(x)都乘以不同頻率的正弦和余弦值),u決定了每個傅立葉變換結(jié)果的頻率。一個二維傅立葉變換可分解為兩步進行,其中每一步都是一個一維傅立葉變換。先對f(x,y)按行進行傅立葉變換得到F(x,v),再對F(x,v)按列進行傅立葉變換,便可得到f(x,y)的傅立葉變換結(jié)果,顯然對f(x,y)先按列進行離散傅立葉變換,再按行進行離散傅立葉變換也是可行的。時移性質(zhì)見ppt快速傅里葉變換離散傅立葉變換計算量非常大,運算時間長。運算次數(shù)正比于N2,特別是當(dāng)N較大時,其運算時間將迅速增長,以至于無法容忍??焖匐x散傅立葉變換算法(FastFourierTransform,F(xiàn)FT)是離散傅立葉變換的快速算法采用該FFT算法,其運算次數(shù)正比于N+logN,當(dāng)N很大時計算量可以大大減少。FFT使DFT真正走向了工程實用。傅里葉變換作用在圖像處理中是一個最基本的數(shù)學(xué)工具。利用這個工具,可以對圖像的頻譜進行各種各樣的處理,如濾波、降噪、增強等3.2頻域變換的一般表達式可分離變換見ppt3.3離散余弦變換變換核為余弦函數(shù),余弦變換實際上是傅立葉變換的實數(shù)部分。因此,在對語音信號、圖像信號的變換中,DCT變換被認為是一種準(zhǔn)最佳變換。二維離散余弦變換性質(zhì):1.余弦變換是實數(shù)、正交。2.離散余弦變換可由傅里葉變換的實部求得3.對高度相關(guān)數(shù)據(jù),DCT有非常好的能量緊湊性4.對于具有一階馬爾可夫過程的隨機信號,DCT是K-L變換的最好近似5.在圖像的變換編碼中有著非常成功的應(yīng)用離散余弦變換優(yōu)點:傅里葉變換的實數(shù)部分,比傅里葉變換有更強的信息集中能力。對于大多數(shù)自然圖像,離散余弦變換能將大多數(shù)的信息放到較少的系數(shù)上去,提高編碼的效率3.4離散沃爾什哈達瑪變換(WHT)沃爾什-哈達瑪變換的本質(zhì)上是將離散序列f(x)的項值的符號按一定規(guī)律改變后,進行加減運算,因此,它比采用復(fù)數(shù)運算的DFT和采用余弦運算的DCT要簡單得多。圖像的增強4.1直方圖均衡較暗圖像的直方圖較亮圖像的直方圖對比度低圖像的直方圖對比度高圖像的直方圖直方圖均衡化處理是以累積分布函數(shù)變換法為基礎(chǔ)的直方圖修正法。公式見第四章第五頁。用r的累積分布函數(shù)作為變換函數(shù),可產(chǎn)生一幅灰度級分布具有均勻概率密度的圖像。直方圖均衡化是將原圖像的直方圖通過變換函數(shù)修正為均勻的直方圖,然后按均衡直方圖修正原圖像。圖像均衡化處理后,圖像的直方圖是平直的,即各灰度級具有相同的出現(xiàn)頻數(shù)。舉例:設(shè)圖象有64*64=4096個象素,有8個灰度級,灰度分布如表所示。進行直方圖均衡化。直方圖均衡化實質(zhì)上是減少圖象的灰度級以換取對比度的加大。若這些灰度級所構(gòu)成的圖象細節(jié)比較重要,則需采用局部區(qū)域直方圖均衡。直方圖均衡化,力圖使等長區(qū)間內(nèi)出現(xiàn)的像素數(shù)接近相等。4.2灰度變換線性灰度變換當(dāng)圖象成象時曝光不足或過度,或由于成象設(shè)備的非線性和圖象記錄設(shè)備動態(tài)范圍太窄等因素。都會產(chǎn)生對比度不足的弊病,使圖象中的細節(jié)分辨不清。這時可將灰度范圍線性擴展。假定原圖像f(x,y)的灰度范圍為[a,b],希望變換后圖像g(x,y)的灰度范圍擴展至[c,d],則線性變換可表示為灰度變換——分段線性變換為了突出感興趣的目標(biāo)或灰度區(qū)間,相對抑制不感興趣的灰度區(qū)域,可采用分段線性變換。常用的三段線性變換法數(shù)學(xué)表達式如下:灰度變換——非線性變換(1)對數(shù)變換低灰度區(qū)擴展,高灰度區(qū)壓縮。(2)指數(shù)變換高灰度區(qū)擴展,低灰度區(qū)壓縮。4.3空間域濾波增強引言-圖像噪聲的概念噪聲可以理解為“妨礙人們感覺器官對所接收的信源信息理解的因素”。噪聲在理論上可以定義為“不可預(yù)測,只能用概率統(tǒng)計方法來認識的隨機誤差”。通常是用其數(shù)字特征,即均值方差、相關(guān)函數(shù)等進行處理。圖像噪聲按其產(chǎn)生的原因可分為外部噪聲和內(nèi)部噪聲。外部噪聲:指系統(tǒng)外部干擾從電磁波或經(jīng)電源傳進系統(tǒng)內(nèi)部而引起的噪聲,如電氣設(shè)備、天體放電現(xiàn)像等引起的噪聲。主要外部干擾如下:(1)由光和電的基本性質(zhì)所引起的噪聲。(2)電器的機械運動產(chǎn)生的噪聲。如,各種接頭因抖動引起的電流變化所產(chǎn)生的噪聲;磁頭、磁帶抖動引起的抖動噪聲等。(3)元器件材料本身引起的噪聲。如,磁帶、磁盤表面缺陷所產(chǎn)生的噪聲(4)系統(tǒng)內(nèi)部設(shè)備電路所引起的噪聲。如,電源系統(tǒng)引入的交流噪聲,偏轉(zhuǎn)系統(tǒng)和箝位電路引起的噪聲等。圖像噪聲從統(tǒng)計特性可分為平穩(wěn)噪聲和非平穩(wěn)噪聲兩種。統(tǒng)計特性不隨時間變化的噪聲稱為平穩(wěn)噪聲;統(tǒng)計特性隨時間變化的噪聲稱為非平穩(wěn)噪聲。另外,按噪聲和信號之間的關(guān)系可分為加性噪聲和乘性噪聲。圖像噪聲的特點1.噪聲在圖像中的分布和大小不規(guī)則2.噪聲與圖像之間具有不相關(guān)性3.噪聲具有疊加性圖像噪聲的去除(1)圖像增強:不考慮圖像降質(zhì)的原因,只將圖像中感興趣的部分加以處理或突出有用的圖像特征,故改善后的圖像并不一定要去逼近原圖像。主要目的是要提高圖像的可懂度。(2)圖像復(fù)原:針對圖像降質(zhì)的具體原因,設(shè)法補償降質(zhì)因素,使改善后的圖像盡可能地逼近原始圖像。圖像增強處理的方法基本上可分為空間域法和頻域法兩大類。(1)空間域法在原圖像上直接進行數(shù)據(jù)運算,對像素的灰度值進行處理。它又分為兩類:點運算和局部運算點運算:對圖像作逐點運算局部運算:在與處理像點鄰域有關(guān)的空間域上進行運算(2)頻域法在圖像的變換域上進行處理,增強感興趣的頻率分量,然后進行反變換,得到增強了的圖像??沼驗V波器的分類空域濾波器——線性濾波器線性濾波器是線性系統(tǒng)和頻域濾波概念在空域的自然延伸。其特征是結(jié)果像素值的計算由下列公式定義:R=w1z1+w2z2+…+wnzn其中:wii=1,2,…,n是模板的系數(shù)zii=1,2,…,n是被計算像素及其鄰域像素的值就是利用模板(濾波器)進行的卷積運算主要線性空域濾波器低通濾波器主要用途:鈍化圖像、去除噪聲高通濾波器主要用途:邊緣增強、邊緣提取帶通濾波器主要用途:刪除特定頻率空域濾波器——非線性濾波器非線性濾波器的定義使用模板進行結(jié)果像素值的計算,結(jié)果值直接取決于像素鄰域的值,而不使用乘積和的計算主要非線性濾波器中值濾波主要用途:平滑圖像、去除噪聲計算公式:R=mid{zk|k=1,2,…,9}最大值濾波主要用途:尋找最亮點計算公式:R=max{zk|k=1,2,…,9}最小值濾波主要用途:尋找最暗點計算公式:R=min{zk|k=1,2,…,9}空間平滑濾波器包括:平滑線性濾波器、統(tǒng)計排序非線性濾波器(中值濾波)1)線性平滑濾波器·用濾波器模板確定的鄰域內(nèi)像素的平均值代替每個像素點的值?!て交幚淼膽?yīng)用是去噪聲·兩個典型濾波器模板:均值濾波和加權(quán)平均模板尺寸越大,圖像越模糊,圖像細節(jié)丟失越多低通空域濾波的缺點和問題?如果圖像處理的目的是去除噪聲,那么,線性平滑低通濾波在去除噪聲的同時也鈍化了邊和尖銳的細節(jié)。非線性平滑濾波器(中值濾波)統(tǒng)計濾波器是非線性濾波;濾波器模板包圍的圖像區(qū)域中像素排序,統(tǒng)計排序結(jié)果代替中心像素的值;中值濾波器是應(yīng)用最廣泛的統(tǒng)計濾波器;中值濾波對一定類型的隨機噪聲(如椒鹽噪聲)提供了優(yōu)秀的去噪能力,比小尺寸的線性平滑濾波器的模糊程度明顯低。中值濾波的原理用模板區(qū)域內(nèi)像素的中值,作為結(jié)果值R=mid{zk|k=1,2,…,9}強迫突出的亮點(暗點)更象它周圍的值,以消除孤立的亮點(暗點)特點在去除噪聲的同時,可以比較好地保留邊的銳度和圖像的細節(jié)圖像銳化的概念邊緣是圖像中特性(如像素灰度、紋理等)分布的不連續(xù)處,圖像周圍特性有階躍變化或屋脊?fàn)钭兓哪切┫袼丶稀D像邊緣存在于目標(biāo)與背景、目標(biāo)與目標(biāo)、基元與基元的邊界,它標(biāo)示出目標(biāo)物體或基元的實際含量,是圖像識別信息最集中的地方。圖像銳化就是要突出圖像邊緣,抑制圖像中非邊緣信息,使圖像輪廓更加清晰。由于邊緣占據(jù)圖像的高頻成分,所以邊緣增強通常屬于高通濾波圖像銳化的應(yīng)用主要有:印刷中的細微層次強調(diào)。彌補掃描、掛網(wǎng)對圖像的鈍化超聲探測成象,分辨率低,邊緣模糊,通過銳化來改善圖像識別中,分割前的邊緣提取銳化處理恢復(fù)過度鈍化、暴光不足的圖像圖像創(chuàng)藝(只剩下邊界的特殊圖像)尖端武器的目標(biāo)識別、定位圖像銳化及增強的方法(1)基本高通濾波模板(2)高頻補償濾波(3)圖像微分,包括:一階微分——梯度法;二階微分——拉普拉斯算子;基本高通濾波模板圖像銳化是要增強圖像頻譜中的高頻部分,就相當(dāng)于從原圖像中減去它的低頻分量,即原始圖像經(jīng)平滑處理后所得的圖像高通濾波器模板系數(shù)的設(shè)計1)中心系數(shù)為正值,外圍為負值2)系數(shù)之和為0濾波器效果的分析常數(shù)或變化平緩的區(qū)域,結(jié)果為0或很小,圖像很暗,亮度被降低了。在暗的背景上邊緣被增強了。圖像的整體對比度降低了計算時會出現(xiàn)負值,歸0處理為常見基本高通空域濾波的缺點和問題高通濾波在增強了邊的同時,丟失了圖像的層次和亮度高頻補償濾波的原理彌補高通濾波的缺陷,在增強邊和細節(jié)的同時,不丟失原圖像的低頻成分。在上式原圖上乘一個擴大因子A,有高頻補償濾波:高頻補償=A原圖–低通=(A–1)原圖+(原圖–低通)=(A–1)原圖+高通當(dāng)A=1時,高頻補償就是高通濾波,當(dāng)A>1時,原圖像的一部分被加到高通中。濾波器擴大因子及模板系數(shù)設(shè)計對于3x3的模板,設(shè)w=9A–1;(高通時w=8)A的值決定了濾波器的特性當(dāng)A=1.1時,意味著把0.1個原圖像加到基本高通上。高頻補償濾波器效果的分析高頻補償比高通的優(yōu)點是很明顯的,即增強了邊緣,又保留了層次。噪聲對結(jié)果圖像的視覺效果有重要的影響,高頻補償在增強了邊的同時也增強了噪聲。圖像微分——一階微分(梯度法)在圖像處理中應(yīng)用微分最常用的方法是計算梯度考慮一個3x3的圖像區(qū)域,z代表灰度級,上式在點z5的?f值可用數(shù)字方式近似。(?f/?x)用(z5–z6)近似(?f/?y)用(z5–z8)近似,組合為:?f≈[(z5-z6)2+(z5-z8)2]1/2用絕對值替換?f≈|z5-z6|+|z5-z8|另外一種計算方法是使用交叉差:?f≈[(z5-z9)2+(z6-z8)2]1/2?f≈|z5-z9|+|z6-z8|微分濾波器模板常用如下三種Roberts交叉梯度算子梯度計算由兩個模板組成,第一個求得梯度的第一項,第二個求得梯度的第二項,然后求和,得到梯度。兩個模板稱為Roberts交叉梯度算子Prewitt梯度算子Prewitt梯度算子——3x3的梯度模板?f≈|(z7+z8+z9)-(z1+z2+z3)|+|(z3+z6+z9)-(z1+z4+z7)|缺點:采用梯度微分銳化圖像,同時會使噪聲、條紋等得到增強Sobel算子則在一定程度上克服了這個問題。Sobel算子不像普通梯度算子那樣用兩個像素的差值,這就導(dǎo)致了以下兩個優(yōu)點:(1)對圖像中的隨機噪聲有一定的平滑作用(2)邊緣兩側(cè)元素得到了增強,邊緣顯得粗而亮。常用的圖像一階微分梯度算子圖像微分——二階拉普拉斯算子是常用的邊緣增強算子,拉普拉斯運算也是偏導(dǎo)數(shù)運算的線性組合運算,而且是一種各向同性(旋轉(zhuǎn)不變性)的線性運算4.4頻率域平滑與銳化濾波圖像的頻域處理頻率平面與圖像空域特性的關(guān)系圖像變化平緩的部分靠近頻率平面的圓心,這個區(qū)域為低頻區(qū)域;圖像中的邊、噪聲、變化陡峻的部分,以放射方向離開頻率平面的圓心,這個區(qū)域為高頻區(qū)域。圖像頻域的處理方法——通過傅立葉變換方法(1)用(-1)x+y乘以給定的圖像f(x,y),計算出它的傅立葉變換F(u,v)(2)選擇一個變換函數(shù)H(u,v)(頻域濾波器)乘以F(u,v)(3)計算(2)的反DFT:F-1[H(u,v)F(u,v)](4)取(3)的實部(5)用(-1)x+y乘以(4)的結(jié)果頻域增強與空域增強的關(guān)系在實踐中,小的空間模板比傅立葉變換用得多得多,因為它們易于實現(xiàn)。對于很多在空域上難以表述清楚的問題,對頻域概念的理解就顯得十分重要。在圖像壓縮中更體會到頻域濾波器主要有三種1)低通濾波2)高通濾波3)同態(tài)濾波理想低通濾波器的分析整個能量的92%被一個半徑為5的小圓周包含,大部分尖銳的細節(jié)信息都存在于被去掉的8%的能量中小的邊界和其它尖銳細節(jié)信息被包含在頻譜的至多0.5%的能量中被鈍化的圖像被一種非常嚴(yán)重的振鈴效果——理想低通濾波器的一種特性所影響。理想低通濾波器的平滑作用非常明顯,但由于變換有一個陡峭的波形,它的反變換h(x,y)有強烈的振鈴特性,使濾波后圖像產(chǎn)生模糊效果。因此這種理想低通濾波實用中不能采用。Butterworth低通過濾器一階巴特沃思濾波器沒有振鈴;二階振鈴很微小合理的選取D0是應(yīng)用低通濾波器平滑圖像的關(guān)鍵。高通濾波器可由低通濾波器得到考慮三種高通濾波器:理想的、巴特沃思型和高斯型理想高通濾波器濾波結(jié)果。D0=15,30,80。振鈴很明顯巴特沃思高通濾波器(BHPF)濾波結(jié)果。D0=15,30,80。結(jié)果比ILPF平滑的多二階高斯高通濾波器(BHPF)濾波結(jié)果。D0=15,30,80。結(jié)果比前兩個更平滑同態(tài)濾波同態(tài)濾波的目的:消除不均勻照度的影響而又不損失圖象細節(jié)。同態(tài)濾波器依據(jù)圖像的亮度分量的特點是平緩的空域變化,而反射分量則近于陡峭的空域變化這些特性使得將圖像的對數(shù)的傅立葉變換的低頻部分對應(yīng)于亮度分量,而高頻部分對應(yīng)于反射分量盡管這種對應(yīng)關(guān)系只是一個粗略的近似,但它們可以用于優(yōu)化圖像的增強操作一個好的控制可以通過用同態(tài)濾波器對亮度和反射分量分別操作來得到這個控制要求指定一個濾波器函數(shù)H(u,v),它對于傅立葉變換的低頻和高頻部分的影響是不同的圖像的復(fù)原5.1圖像退化的模型圖象復(fù)原和圖象增強一樣,都是為了改善圖象視覺效果,以及便于后續(xù)處理。圖象增強方法更偏向主觀判斷,而圖象復(fù)原則是根據(jù)圖象畸變或退化原因,進行模型化處理。利用已有的知識和經(jīng)驗對模糊或噪聲等退化過程進行數(shù)學(xué)模型的建立及描述,并針對此退化過程的數(shù)學(xué)模型進行圖像復(fù)原。圖像退化過程的先驗知識在圖像復(fù)原技術(shù)中起著重要作用。圖像復(fù)原處理中,往往用線性和空間不變性的系統(tǒng)模型加以近似。這種近似的優(yōu)點是使線性系統(tǒng)理論中的許多理論可直接用于解決圖像復(fù)原問題。圖像復(fù)原處理特別是數(shù)字圖像復(fù)原處理主要采用的是線性的、空間不變的復(fù)原技術(shù)。G(u,v)、F(u,v)、N(u,v)分別是退化圖像g(x,y)、原圖像f(x,y)、噪聲信號n(x,y)的傅立葉變換;H(u,v)是系統(tǒng)的點沖激響應(yīng)函數(shù)h(x,y)的傅立葉變換,稱為系統(tǒng)在頻率域上的傳遞函數(shù)。圖像復(fù)原實際上就是已知G的情況下,從(5-10)式求F的問題。圖像復(fù)原的關(guān)鍵問題是尋找降質(zhì)系統(tǒng)在空間域上的沖激響應(yīng)函數(shù)h(x,y),或者降質(zhì)系統(tǒng)在頻率域上的傳遞函數(shù)H(u,v),即退化函數(shù)的空域或頻域表示。5.2非約束復(fù)原非約束復(fù)原的代數(shù)方法圖像復(fù)原的主要目的是在假設(shè)具備退化圖像g及H和n的某些知識的前提下,估計出原始圖像f的估計值,估計值應(yīng)使準(zhǔn)則為最優(yōu)(常用最小)。如果僅僅要求某種優(yōu)化準(zhǔn)則為最小,不考慮其它任何條件約束,這種復(fù)原方法為非約束復(fù)原方法。代數(shù)復(fù)原方法的中心是尋找一個估計,使事先確定的某種優(yōu)化準(zhǔn)則為最小。如可以選擇最小二乘方作為優(yōu)化準(zhǔn)則的基礎(chǔ)。逆濾波器方法逆濾波復(fù)原法也叫做反向濾波法,其主要過程是首先將要處理的數(shù)字圖像從空間域轉(zhuǎn)換到傅立葉頻率域中,進行反向濾波后再由頻率域轉(zhuǎn)回到空間域,從而得到復(fù)原的圖像信號。逆濾波器方法逆濾波法復(fù)原的基本原理:H(u,v)可以理解為成像系統(tǒng)的“濾波”傳遞函數(shù),在頻域中系統(tǒng)的傳遞函數(shù)與原圖像信號相乘實現(xiàn)“正向濾波”,這里,G(u,v)除以H(u,v)起到了“反向濾波”的作用,這意味著,如果已知退化圖像的傅立葉變換和“濾波”傳遞函數(shù),則可以求得原始圖像的傅立葉變換,經(jīng)反傅立葉變換就可求得原始圖像f(x,y)。實驗證明,當(dāng)退化圖像的噪聲較小,即輕度降質(zhì)時,采用逆濾波復(fù)原的方法可以獲得較好的結(jié)果。通常,H(u,v)在離頻率平面原點較遠的地方數(shù)值較小或為零,因此圖象復(fù)原在原點周圍的有限區(qū)域內(nèi)進行,即將退化圖象的傅立葉譜限制在H(u,v)沒出現(xiàn)零點而且數(shù)值又不是太小的有限范圍內(nèi)。即逆濾波存在病態(tài)性。5.3有約束復(fù)原有約束的最小二乘方圖像復(fù)原有約束圖像復(fù)原技術(shù)是指除了要求了解關(guān)于退化系統(tǒng)的傳遞函數(shù)之外,還需要知道某些噪聲的統(tǒng)計特性或噪聲與圖像的某些相關(guān)情況。根據(jù)所了解的噪聲的先驗知識的不同,采用不同的約束條件,從而得到不同的圖像復(fù)原技術(shù)。最常見的是有約束的最小二乘方圖像復(fù)原技術(shù)。如果選用圖像f和噪聲n的相關(guān)矩陣Rf和Rn表示Q就可以得到維納濾波復(fù)原方法。如選用拉普拉斯算子形式,即使某個函數(shù)的二階導(dǎo)數(shù)最小,就可推導(dǎo)出有約束最小平方恢復(fù)方法。、維納濾波方法維納濾波是假設(shè)圖像信號可近似看成為平穩(wěn)隨機過程的前提下,按照使原圖像和估計圖像之間的均方誤差達到最小的準(zhǔn)則函數(shù)來實現(xiàn)圖像復(fù)原的。維納濾波的最優(yōu)準(zhǔn)則是以圖像和噪聲的相關(guān)矩陣為基礎(chǔ)的,所得到的結(jié)果是對一族圖像在平均的意義上是最佳的,同時要求圖像和噪聲都屬于隨機的,并且它的頻譜密度是已知的。在實際情況下,人們往往沒有這一方面的先驗知識,一般很難得到,除非采取適當(dāng)?shù)墓β首V模型。約束最小平方復(fù)原一種以平滑度為基礎(chǔ)的圖像復(fù)原方法。在用該方法復(fù)原過程中,對每個給定的圖像都是最佳的。它只需要知道有關(guān)噪聲的均值和方差的先驗知識就可對每個給定的圖像得到最優(yōu)結(jié)果。上述介紹的圖像復(fù)原是假設(shè)退化系統(tǒng)是空間不變,信號和噪聲是平穩(wěn)的條件下得到的,對于隨空間改變的模糊、時變模糊,以及非平穩(wěn)信號與噪聲的系統(tǒng)引起的模糊,其精確的圖像復(fù)原方法要復(fù)雜很多。去除由勻速運動引起的模糊在獲取圖像過程中,由于景物和攝像機之間的相對運動,往往造成圖像的模糊。其中由均勻直線運動所造成的模糊圖像的恢復(fù)問題更具有一般性和普遍意義。因為變速的、非直線的運動在某些條件下可以看成是均勻的、直線運動的合成結(jié)果。當(dāng)成象傳感器與被攝景物之間存在足夠快的相對運動時,所攝取的圖象就會出現(xiàn)“運動模糊”,運動模糊是場景能量在傳感器拍攝瞬間(T)內(nèi)在像平面上的非正常積累。其他模糊模型根據(jù)導(dǎo)致模糊的物理過程(先驗知識)大氣湍流造成的傳遞函數(shù);光學(xué)系統(tǒng)散焦傳遞函數(shù);均勻聚焦不準(zhǔn)——模糊;顯著的特點:約束方程和準(zhǔn)則函數(shù)中的表達式都可改寫為矩陣乘法、這些矩陣都是分塊循環(huán)陣,從而可實現(xiàn)對角化。5.4非線性復(fù)原方法5.4.1最大熵復(fù)原由于反向濾波法的病態(tài)性,復(fù)原出的圖像經(jīng)常具有灰度變換較大的不均勻區(qū)域。下面介紹另一種通過最大化某種反映圖像平滑性的準(zhǔn)則函數(shù)來作為約束條件,以解決圖像復(fù)原中的病態(tài)的方法。使用迭代方法在一定的條件下總能得到上述方程組的解,從而獲得復(fù)原后的圖像,這種方法稱為最大熵復(fù)原方法。它還有其他變化形式,例如定義不同形式的熵可獲得不同的復(fù)原方法。最大熵復(fù)原方法隱含了正值約束條件,使復(fù)原后的圖像比較平滑,這種復(fù)原方法的效果比較理想,但缺點是計算量太大。5.4.2投影復(fù)原方法無論線性或非線性變質(zhì)系統(tǒng),都可以用一代數(shù)方程組來描述:其中f(x,y)是原景物圖像;g(x,y)是變質(zhì)圖像;n(x,y)是系統(tǒng)噪聲;D是變質(zhì)算子,表示對景物進行某種運算。圖像復(fù)原的目的是解(5-90)式方程,找出f(x,y)的最好估值。非線性代數(shù)復(fù)原方法中一個有效方法是迭代法,投影復(fù)原方法就是迭代法之一。投影迭代法要求有一個好的初始估值f(0)開始迭代,才能獲得好的結(jié)果。5.5幾種其他圖像復(fù)原技術(shù)5.5.1幾何畸變校正在圖像的獲取或顯示過程中往往會產(chǎn)生幾何失真。這主要是由于攝像管攝像機及陰極射線管顯示器的掃描偏轉(zhuǎn)系統(tǒng)有一定的非線性,因此會造成枕形失真或桶形失真。斜視角度獲得的圖像的透視失真。由于地球表面呈球形,攝取的平面圖像也將會有較大的幾何失真。由成像系統(tǒng)引起的幾何畸變的校正有兩種方法:一種是預(yù)畸變法,采用與畸變相反的非線性掃描偏轉(zhuǎn)法,用來抵消預(yù)計的圖像畸變;另一種是后驗校正方法。用多項式曲線在水平和垂直方向去擬合每一畸變的網(wǎng)線,然后求得反變化的校正函數(shù)。用這個校正函數(shù)即可校正畸變的圖像。幾何畸變校正要對失真的圖像進行精確的幾何校正,通常是先確定一幅圖像為基準(zhǔn),然后去校正另一幅圖像的幾何形狀。幾何畸變校正一般分兩步來做:一是圖像空間坐標(biāo)的變換——空間變換;二是重新確定在校正空間各像素點的取值——灰度級插值??臻g變換:對圖像平面上的像素進行重新排列以恢復(fù)原空間關(guān)系,防止圖像內(nèi)容支離破碎(弄斷直線)。公式化一個解析函數(shù)r(x,y)和s(x,y)的集合是不可能的,這些解析函數(shù)描述了整個圖像平面上的幾何失真過程。最常用的克服這一困難的方法是用“連接點”表達像素的空間重定位,這些點是像素的子集,它們在輸入(失真的)和輸出(校正的)圖像中的位置是精確已知的?;叶炔逯担簩臻g變換后的像素賦予相應(yīng)的灰度值以恢復(fù)原位置的灰度值目標(biāo)圖像會要求到原圖像的非整數(shù)點。圖像經(jīng)幾何位置校正后,在校正空間中各像點的灰度值等于被校正圖像對應(yīng)點的灰度值。一般校正后的圖像某些像素點可能擠壓在一起,或者分散開,不會恰好落在坐標(biāo)點上,因此常采用內(nèi)插法來求得這些像素點的灰度值。經(jīng)常使用的方法有如下兩種。1)最近鄰點法最近鄰點法是取與像素點相鄰的4個點中距離最近的鄰點灰度值作為該點的灰度值。最近鄰點法計算簡單,但精度不高,同時校正后的圖像亮度有明顯的不連續(xù)性。2)雙線性內(nèi)插法該方法用4個最近鄰點。過程如下:因為非整數(shù)坐標(biāo)對(x’,y’)的4個整數(shù)最近鄰點的灰度級都是已知的,定義在這些坐標(biāo)上的灰度級v(x’,y’)用下面的關(guān)系從它的鄰點值被插補。5.5.2盲目圖像復(fù)原多數(shù)的圖像復(fù)原技術(shù)都是以圖像退化的某種先驗知識為基礎(chǔ),也就是假定系統(tǒng)的脈沖響應(yīng)是已知的,即成像系統(tǒng)的點擴散函數(shù)已知。但在許多情況下難以確定退化的點擴散函數(shù)。在這種情況下,必須從觀察圖像中以某種方式抽出退化信息,從而找出圖像復(fù)原方法。這種方法就是所謂的盲目圖像復(fù)原。對具有加性噪聲的模糊圖像作盲目圖像復(fù)原的方法有兩種:直接測量法和間接估計法。直接測量法通常要測量圖像的模糊脈沖響應(yīng)和噪聲功率譜或協(xié)方差函數(shù)。在所觀察的景物中,往往點光源能直接指示出沖激響應(yīng)。另外,圖像邊緣是否陡峭也能用來推測模糊沖激響應(yīng)。在背景亮度相對恒定的區(qū)域內(nèi)測量圖像的協(xié)方差可以估計出觀測圖像的噪聲協(xié)方差函數(shù)。間接估計法盲目圖像復(fù)原類似于多圖像平均法處理。以上利用多幅相同的圖像進行平均以實現(xiàn)對加性噪聲的消除,同理,盲目圖像復(fù)原的間接估計法也可以利用時間上平均的概念去掉圖像中的模糊。第六章圖像壓縮6.1圖像壓縮的基本概念圖像傳輸需要大量的數(shù)據(jù),圖像數(shù)據(jù)是高度相關(guān)的,或者說存在冗余信息,去掉這些冗余信息后可以有效壓縮圖像,同時又不會損害圖像的有效信息。圖像冗余可分為三類:編碼冗余;像素冗余;視覺心理冗余編碼冗余:如果一個圖像的灰度級編碼,使用了多于實際需要的編碼符號,就稱該圖像包含了編碼冗余。像素冗余:由于任何給定的像素值,原理上都可以通過它的鄰居預(yù)測到,單個像素攜帶的信息相對是小的。對于一個圖像,很多單個像素對視覺的貢獻是冗余的。這是建立在對鄰居值預(yù)測的基礎(chǔ)上。原圖像數(shù)據(jù):234,223,231,238,235壓縮后數(shù)據(jù):234,-11,8,7,-3視覺心理冗余:某些視覺信息對于生物視覺系統(tǒng)而言是無法完全接受和區(qū)分的。 1.圖像在色彩,亮度,空間頻率等方面超出了人眼的接收范圍和可區(qū)分程度。 2.圖像中某些目標(biāo)或區(qū)域的信息不太容易引起人眼的注意。圖像冗余的模式1)空域冗余也稱空間冗余或幾何冗余,是與像素間相關(guān)性直接聯(lián)系的數(shù)據(jù)冗余2)時域冗余又稱時間冗余。時間間隔過?。贿\動物體具有運動一致性,使得視頻序列圖像之間有很強的相關(guān)性3)頻域冗余 將空域的圖像變換到頻域中,使得大量的信息能用較少的數(shù)據(jù)來表示,從而達到壓縮的目的4)信息熵冗余 圖像中像素灰度出現(xiàn)的不均勻性,造成圖像信息熵冗余。即用同樣長度比特表示每一個灰度,則必然存在冗余。若將出現(xiàn)概率大的灰度級用長度較短的碼表示,將出現(xiàn)概率小的灰度級用長度較長的碼表示,有可能使編碼總長度下降圖像壓縮的策略應(yīng)用環(huán)境允許圖像有一定程度失真1)接收端圖像設(shè)備分辨率較低,則可降低圖像分辨率2)用戶所關(guān)心的圖像區(qū)域有限,可對其余部分圖像采用空間和灰度上的粗化3)根據(jù)人的視覺特性對不敏感區(qū)進行降分辨率編碼(視覺冗余)保真度標(biāo)準(zhǔn)——評價壓縮算法的標(biāo)準(zhǔn)1.客觀保真度標(biāo)準(zhǔn):用數(shù)學(xué)形式表述圖像壓縮過程對圖像信息的損失。2.主觀保真度評價標(biāo)準(zhǔn): 根據(jù)一組評分者對一幅圖像給出的分數(shù)確定圖像的質(zhì)量圖像壓縮模型流程圖源數(shù)據(jù)源數(shù)據(jù)編碼通道編碼通道通道解碼源數(shù)據(jù)解碼源數(shù)據(jù)編碼:完成源數(shù)據(jù)的壓縮。通道編碼:為了抗干擾,增加一些容錯、校驗位、版權(quán)保護,實際上是增加冗余。通道:如Internet、廣播、通訊、可移動介質(zhì)源數(shù)據(jù)編碼與解碼的模型源數(shù)據(jù)編碼的模型映射器映射器量化器符號編碼器源數(shù)據(jù)解碼的模型符號符號解碼器反向映射器 映射器——減少像素冗余,如使用RLE編碼。或進行圖像變換。 量化器——減少視覺心理冗余,僅用于有損壓縮。 符號編碼器——減少編碼冗余,如使用霍夫曼編碼。圖像編碼方法有許多,但從技術(shù)角度來看,可以分作兩大類:無損壓縮:是一種經(jīng)編、解碼后圖像不會產(chǎn)生失真的編碼方法,可重建 圖像,但壓縮比不大;有損壓縮:解碼時無法完全恢復(fù)原始圖像,壓縮比大但有信息損失。傳統(tǒng)圖像編碼技術(shù)有脈沖編碼調(diào)制、量化算法、空間和時間亞取樣編碼、熵編碼、預(yù)測編碼、變換編碼、矢量量化和子帶編碼等。新型圖像編碼技術(shù)包括第二代圖像編碼方法、分形編碼、基于模型編碼和小波編碼等。信息量的定義:對應(yīng)每個符號的,其中P(xi)指出現(xiàn)xi的概率。信源的定義:信源指能夠產(chǎn)生信息的事物。在數(shù)學(xué)上信源是一概率場,若信源X可能產(chǎn)生的信息是x1,x2,…,xn,這些信息出現(xiàn)的概率分別是P1,P2,…,Pn,則該信源可表示為:由于I(ai)是一個隨機變量,可以定義信源的平均信息量(熵)為:關(guān)于“熵(Entropy)”1)在符號個數(shù)不變的情況下,信源中各符號的出現(xiàn)概率相等時,該信源的熵最大。(最大離散熵定理)2)為保證無損壓縮,平均碼長Iavg>=H(x);即熵是無損編碼的下界。3)如所有的I(xk)均為整數(shù),且設(shè)l(xk)=I(xk),可使Iavg=H(x)。4)對于非等概率分布的信源,采用不等長編碼,其平均碼長小于等長編碼的平均碼長圖像壓縮基本概念——“圖像熵”將信息熵推廣到圖像中,信息源看成是經(jīng)數(shù)字化后的圖像,每一灰度級作為一個符號xk,符合該灰度級的像素所占比例對應(yīng)概率pk。圖像熵:設(shè)圖像象素灰度級集合為(w1,w2,w3,…wM),對應(yīng)的概率為p1,p2,…pM,則圖像熵為:比特/像素表示平均每個象素提供的平均信息量對圖像進行無損編碼時所需的平均位數(shù)不得低于H。即H為對灰度集合進行編碼時所需的碼字平均位數(shù)值的下限。“平均碼字長度”與“編碼效率”設(shè)一幅數(shù)字圖像編碼的碼字為C1,C2,…CM,其碼字位數(shù)分別為β1,β2,…βM,則編碼所需的平均位數(shù)為:比特/像素平均位數(shù)越接近熵H的數(shù)值,則該碼越接近成為最佳碼,反之則遠離。等長碼: 采用位數(shù)相同的碼字對消息或圖像灰度進行編碼。常見的等長碼有:自然二進制碼、ASCII碼、格雷碼和折疊二進制碼。在消息等概率出現(xiàn)時,等長碼是最佳的。等長碼易于壓縮與解壓縮變長碼 變長碼即非等長碼,由不同的碼長的碼字構(gòu)成。在編碼輸入出現(xiàn)非等概率時,變長碼可得到較高的編碼效率,使平均碼長達到或接近編碼的下限。變長最佳編碼定理: 在變長編碼中,對出現(xiàn)概率大的信息符號賦予短碼字,而對于出現(xiàn)概率小的信息符號賦予長碼字。即時性:編碼得到的碼符號串中的每一個碼字不需參照后面的編碼即可進行解碼。換言之,沒有任何一個符號對應(yīng)的碼字是其他符號對應(yīng)碼字的前綴。唯一性:編碼得到的碼符號串只與唯一的一組信源符號相對應(yīng)。6.2PCM編碼低通濾波器的作用: 1.滿足采樣定理的帶限要求(Nyquist定理,fs≥fmax/2) 2.對噪聲有一定的抑制作用。取樣:空間上的離散化。量化:信號在幅度上的離散化。編碼器:把多值的數(shù)字信號變成二進制的數(shù)字信號,以便于后續(xù)處理低通濾波:對量化噪聲有一定的抑制作用。圖像量化值直接采用PCM編碼,這樣得到的圖像數(shù)據(jù)量將十分巨大,采用簡單的PCM編碼技術(shù)用于圖像信息的存儲與傳輸是不經(jīng)濟的,所以要對它進行數(shù)據(jù)壓縮?;究驁D如下6.3無損壓縮“無損”的定義:顧名思義,沒有信息損失的壓縮方式“無損壓縮”的基本策略設(shè)計一種表達方式去除圖像的像素冗余設(shè)計一種編碼方式去除編碼冗余無損編碼的分類無損壓縮——霍夫曼編碼(Huffman)霍夫曼編碼:是依據(jù)變長最佳編碼定理的一種基于統(tǒng)計的無損編碼算法。步驟: 1.將信源符號xi,按照其概率從大到小排列。 2.將兩個最小概率符號進行組合相加,重新排序后,重復(fù)這一步驟,直到只剩下一個信源信號且概率為1.0為止。(組合時總是概率較大的符號放在上部) 3.對每對組合的上部(概率大者)設(shè)為0,下部(概率小者)設(shè)為1。 4.畫出每個信源符號到概率1.0處的路徑,并按從右到左的順序記錄路徑所經(jīng)的1和0,再從左到右讀出即為碼字例題見期末考試題霍夫曼編碼”總結(jié)1.編碼構(gòu)造程序明確,但編碼結(jié)果不唯一2.碼字不等長導(dǎo)致硬件結(jié)構(gòu)復(fù)雜,抗誤碼能力低3.編碼效率與信源符號概率密度直接相關(guān),且需要概率密度的先驗知識4.只能有近似的整數(shù),無法用理想的小數(shù)來表示單個符號,因此壓縮效果無法達到最理想的狀態(tài)。無損壓縮——算術(shù)編碼(Arithmetic)是一種非模塊式(nonblock)的編碼方法,它是對信源的符號串直接進行編碼;而非對信源的每一個符號賦予固定的碼字再根據(jù)符號串進行排列?;舅枷耄焊鶕?jù)一個固定長度的符號串可能出現(xiàn)的概率,將該符號串映射到開區(qū)域[0,1)中的一個子區(qū)域(interval),計算該子區(qū)域的過程采用了條件概率的理念信源符號概率子區(qū)域a10.2[0.0,

0.2)a20.2[0.2,

0.4)a30.4[0.4,

0.8)a40.2[0.8,

1.0)編碼:{a1a2a3a3a4}*[0.06752,0.0688)*0.06752解碼:0.06752*[0,0.2)*[0.04,0.08)*[0.056,0.072)*[0.0624,0.0688)*[0.06752,0.0688)a1a2a3a3a4算術(shù)編碼總結(jié)行程編碼又稱行程長度編碼(RunLengthEncoding)。行程:具有相同灰度值的像素序列編碼思想:去除像素冗余。用行程的灰度和行程的長度代替行程本身其編碼原理相當(dāng)簡單,即將具有相同值的連續(xù)串用其串長和一個代表值來代替,該連續(xù)串就稱為行程,串長稱為行程長度。例如,有一字符串“aabbbcddddd”,則經(jīng)行程長度編碼后,該字符串可以只用“2a3b1c5d”來表示。行程編碼分為定長和不定長編碼兩種。定長編碼是指編碼的行程長度所用的二進制位數(shù)固定,而變長行程編碼是指對不同范圍的行程長度使用不同位數(shù)的二進制位數(shù)進行編碼。使用變長行程編碼需要增加標(biāo)志位來表明所使用的二進制位數(shù)行程編碼”總結(jié)1)行程編碼比較適合于二值圖像的編碼,一般用于量化后出現(xiàn)大量零系數(shù)連續(xù)的場合,用行程來表示連零碼。2)如果圖像是由很多塊顏色或灰度相同的大面積區(qū)域組成的,那么采用行程編碼可以達到很高的壓縮比。3)如果圖像中的數(shù)據(jù)非常分散,則行程編碼不但不能壓縮數(shù)據(jù),反而會增加圖像文件的大小。無損預(yù)測編碼編碼思想:1)去除像素冗余。2)認為相鄰像素的信息有冗余。當(dāng)前像素值可以用以前的像素值來獲得。3)當(dāng)前像素值fn,通過預(yù)測器得到一個預(yù)測值,對當(dāng)前值和預(yù)測值求差,對差編碼,作為壓縮數(shù)據(jù)流中的下一個元素。由于差比原數(shù)據(jù)要小,因而編碼要小,可用變長編碼。6.4有損壓縮有損壓縮是:通過犧牲圖像的準(zhǔn)確率來達到加大壓縮率的目的。如果我們?nèi)萑探鈮嚎s后的結(jié)果中有一定的誤差,那么壓縮率可以顯著提高。有損壓縮方法的壓縮比:在圖像壓縮比大于30:1時,仍然能夠重構(gòu)圖像在圖像壓縮比為10:1到20:1時,重構(gòu)圖像與原圖幾乎沒有差別。無損壓縮的壓縮比很少有能超過3:1的,這兩種壓縮方法的根本差別在于有沒有量化模塊。量化器基本思想:減少數(shù)據(jù)量的最簡單的辦法是將圖像量化成較少的灰度級,通過減少圖像的灰度級來實現(xiàn)圖像的壓縮這種量化是不可逆的,因而解碼時圖像有損失si被稱為量化器的決策級(閾值);ti被稱為量化器的重構(gòu)級(代表級)。L是量化器的級數(shù)。由于習(xí)慣的原因,當(dāng)s在半開區(qū)間(si,si+1],s被認為是映射到ti,有損預(yù)測的基本思想對無損預(yù)測壓縮的誤差進行量化,通過消除視覺心理冗余,達到對圖像進一步壓縮的目的。算法分析1.在所有有損預(yù)測壓縮中都會出現(xiàn)誤差。2.誤差的嚴(yán)重程度取決于使用的量化方法和預(yù)測方法之間的共同作用預(yù)測函數(shù)與量化函數(shù)的定義1.定義預(yù)測函數(shù)時仍然假定沒有量化誤差2.定義量化函數(shù)時僅是盡可能地降低它自身的誤差3.即量化函數(shù)和預(yù)測函數(shù)是分別定義的德爾塔調(diào)制(DeltaModulation)算法分析:1.在n=0到7相對平滑的區(qū)域,太大以至不能表示輸入的最小變化,出現(xiàn)了顆粒噪聲2.在n=14到19變化快的區(qū)域,太小以至不能表示輸入的最大的變化,發(fā)生一個被稱為斜率過載的失真。在大多數(shù)圖像中,這兩種現(xiàn)象導(dǎo)致:1.平滑區(qū)域表面粒狀的失真2.對象邊緣的鈍化最優(yōu)預(yù)測器最優(yōu)預(yù)測器的基本思想和原理在討論最優(yōu)預(yù)測器的問題時,我們通常建立兩個條件:量化誤差為0,即預(yù)測值為前m個點的線性組合。這兩個條件并非必要,但它們大大簡化了分析,同時減小了預(yù)測器的計算復(fù)雜度。這種預(yù)測編碼方法被稱為差分脈碼調(diào)制沖編量化器q的設(shè)計目標(biāo)是: 如何使由于量化所引起的圖像損失達到最小。量化器q的設(shè)計問題是: 對于特定的優(yōu)化標(biāo)準(zhǔn),及輸入概率密度函數(shù)p(s)(直方圖),選擇最好的決策級si和重構(gòu)級ti,或量化函數(shù),使均方誤差E{(s–ti)2}達到最小變換編碼的基本思想用一個可逆的、線性的變換(如傅立葉變換),把圖像映射到變換系數(shù)集合對該系數(shù)集合進行量化和編碼。對于大多數(shù)自然圖像,重要系數(shù)的數(shù)量是比較少的,因而可以用量化(或完全拋棄),且僅以較小的圖像失真為代價。圖像變換編碼中主要解決的問題如下 1.選擇變換方法 2.確定子塊圖像的大小 3.變換系數(shù)的編碼變換方法的要求:可逆,線性變換方法選擇:變換系數(shù)截斷法截斷條件系數(shù)幅度小于某一閾值系數(shù)幅度排名小于某一閾值DCT由于其算法簡單,計算量小以及在封裝能力和塊效應(yīng)方面較好的性能成為壓縮編碼首選的變換方式,已經(jīng)得到國際上的公認。子圖尺寸的選擇有兩個原則:如果尺寸太小,計算簡單,但壓縮能力有限如果尺寸太大,去相關(guān)性好,但圖像壓縮比趨于飽和,計算量大定義:圖像變換系數(shù)的截取,量化和編碼統(tǒng)稱為比特位分配。比特位分配主要解決系數(shù)模板m(u,v)的設(shè)計編碼問題。目前比特位分配中常用于截取和量化的方法有兩種: (1)子帶編碼(區(qū)域編碼)【ZonalCoding】 (2)閾值編碼【ThresholdCoding】截取時應(yīng)根據(jù)壓縮比從子圖系數(shù)矩陣左上角開始選取量化時分配給每個量化器的級數(shù)應(yīng)與成正比閾值編碼的截取模板不固定,是一種根據(jù)變換系數(shù)進行調(diào)整的自適應(yīng)模板,其閾值選取主要有三種方法:對所有子圖像使用一個全局閾值壓縮比因圖而異,取決于超過全局閾值的系數(shù)數(shù)量,全局閾值的合理選擇是一個關(guān)鍵問題。對各子圖像分別用不同的閾值,也稱最大N編碼(N-LargestCoding),壓縮比固定,算法簡單。根據(jù)子圖像中各系數(shù)的位置選取閾值壓縮比不固定,但可以將閾值截取與量化結(jié)合起來小波編碼與普通變換編碼的差別在結(jié)構(gòu)上,去除了子圖像選取模塊在效果上,最大限度的消除了塊效應(yīng)分解等級數(shù)對于編碼的計算量,重構(gòu)誤差和圖像質(zhì)量都有非常重要的影響量化設(shè)計是對小波編碼效果影響最大的因素6.5壓縮標(biāo)準(zhǔn)標(biāo)準(zhǔn)的類型(三類):二值圖像壓縮標(biāo)準(zhǔn):面向傳真而設(shè)計靜止幀黑白、彩色壓縮:面向靜止的單幅圖像(JPEG)連續(xù)幀黑白、彩色壓縮:面向連續(xù)的視頻影像(MPEG)jPEG包括三種不同的編碼系統(tǒng)1)(BaselineSystem)一種有損的基準(zhǔn)編碼系統(tǒng),以DCT為基礎(chǔ),足以應(yīng)付大多數(shù)實際應(yīng)用中的壓縮要求。2)(ExtendedSystem)一種擴展編碼系統(tǒng),能夠處理更大規(guī)模的壓縮,更高的精度以及改進的重構(gòu)系統(tǒng)。3)(LosslessSystem)一種面向可逆壓縮的無損的獨立編碼系統(tǒng),分塊DCT變換塊分解:將圖像分解為8*8的子圖像;灰度平移:將圖像內(nèi)所有像素的灰度級減去2n-1(圖像灰度范圍為0~2n-1,例如對于256級灰度圖像,n=8);FDCT變換:對每塊灰度平移過的子圖像進行正向DCT變換量化: 對于有損壓縮算法,JPEG算法使用均勻量化器進行量化,量化步距是按照系數(shù)所在的位置和每種顏色分量的色調(diào)值來確定。因為人眼對亮度信號比對色差信號更敏感,因此使用了兩種量化表。Z字形排列 量化后的系數(shù)要重新編排,目的是為了增加連續(xù)的“0”系數(shù)的個數(shù),就是“0”的游程長度,方法是按照Z字形的式樣編排。這樣就把一個8×8的矩陣變成一個1×64的矢量,頻率較低的系數(shù)放在矢量的頂部。直流(DirectCurrent,DC)系數(shù)編碼交流(AlternatingCurrent,AC)系數(shù)編碼熵編碼霍夫曼編碼是JPEG壓縮標(biāo)準(zhǔn)中最常用到的熵編碼方法。可根據(jù)計算好的碼表查找AC系數(shù)和DC系數(shù)碼字。DC:類別(取決于DC系數(shù)預(yù)測誤差所在的范圍),具體數(shù)值A(chǔ)C:類別,具體數(shù)值,0行程長度直流和交流系數(shù)的編碼分為前綴碼與尾碼兩部分DC:前綴碼取決于DC預(yù)測誤差的類別(所處范圍)AC:前綴碼取決于AC系數(shù)的類別和該系數(shù)之前的0的行程長度如何處理彩色圖像色彩空間的選擇:分別壓縮圖像的每個彩色分量。通常選擇YCbCr空間,這是因為人眼對色彩的變化不如對亮度的變化敏感,因而對色彩的編碼可以比對亮度的編碼粗糙些,這一點主要體現(xiàn)在亮度量化表和色度量化表的區(qū)別上。采樣方法的選擇:可以采用不同的采樣頻率,這種技術(shù)稱為二次采樣。由于亮度比色彩更重要,因而對Y分量的采樣頻率可高于對Cb、Cr的采樣頻率,這樣有利于節(jié)省存儲空間。常用的采樣方案有YUV422和YUV411。把在采樣頻率最低的分量圖像中一個子圖所對應(yīng)的像區(qū)上采樣得到的各種分量圖像的子圖按照采樣頻率高低組為一個最小編碼單元(MCU)。對灰度圖像而言,只有一個Y分量,MCU就是一個數(shù)據(jù)單元。而對彩色圖像而言,以4:1:1的采樣方案為例,則一個MCU由4個Y分量的子圖、1個Cb分量的子圖和1個Cr分量的子圖組成圖像形態(tài)學(xué)處理概述圖像形態(tài)學(xué)運算的基本代數(shù)運算子膨脹(或擴張)、腐蝕(或侵蝕)、開啟和閉合。圖像形狀和結(jié)構(gòu)的分析及處理,包括圖像分割、特征抽取、邊界檢測、圖像濾波、圖像增強和恢復(fù)等。圖像形態(tài)學(xué)操作的基本方法利用一個稱作結(jié)構(gòu)元素的“探針”收集圖像的信息,當(dāng)探針在圖像中不斷移動時,便可考察圖像各個部分之間的相互關(guān)系,從而了解圖像的結(jié)構(gòu)特征。數(shù)學(xué)形態(tài)學(xué)基于探測的思想,與人的FOA(FocusOfAttention)的視覺特點有類似之處。作為探針的結(jié)構(gòu)元素,可直接攜帶知識(形態(tài)、大小、甚至加入灰度和色度信息)來探測、研究圖像的結(jié)構(gòu)特點A被B膨脹得到的是平移坐標(biāo)z的集合,B稱為結(jié)構(gòu)元素腐蝕操作可用于去除小尺度噪聲點,或去除連通區(qū)域邊緣上的毛刺。腐蝕與膨脹并非互逆造作腐蝕與膨脹是形態(tài)學(xué)變換的基本造作,在其基礎(chǔ)上可以構(gòu)造出形態(tài)學(xué)運算族先腐蝕后膨脹是開操作,先膨脹后腐蝕的是閉操作。開操作變小,閉炒作變大。形態(tài)學(xué)重構(gòu)重構(gòu)操作涉及到兩幅圖像和一個結(jié)構(gòu)元素(B),其中一副為標(biāo)記圖像(Marker,f),另一幅為掩模圖像(Mask,g),重構(gòu)操作即為從標(biāo)記圖像中的點反復(fù)作膨脹操作,直到最大限度的充滿掩模圖像中1對應(yīng)的區(qū)域?;叶葓D像形態(tài)學(xué)處理灰度膨脹:圖片整體變亮,黑色區(qū)域面積變小?;叶雀g:圖片整體變暗,黑色區(qū)域面積變大。開操作有助于消除比結(jié)構(gòu)元素小的亮細節(jié),而閉操作有助于消除閉結(jié)構(gòu)元素小的暗細節(jié)。(不影響圖片整體明暗度)因此在應(yīng)用中,經(jīng)常對灰度圖像進行開運算和閉運算的組合操作實現(xiàn)對圖像的平滑和去噪。帽變換:去除不均勻的暗背景底帽變換:去除不均勻的亮背景由于頂帽與底帽變換有助于去除噪聲和不均勻背景對圖像分割的影響,因此經(jīng)常用于圖像的預(yù)處理灰度圖像的重構(gòu)掩模圖像:一般為原圖像標(biāo)記圖像:理論上在三維空間中應(yīng)為掩模圖像的子集步驟與二值圖像重構(gòu)相同,二值膨脹變?yōu)榛叶扰蛎浀谄哒聢D像分割7.1圖像分割概述圖像分割在數(shù)字圖像處理技術(shù)以及認知系統(tǒng)中的角色。目的:根據(jù)目標(biāo)對象在圖像空間中的分布對圖像進行分解,得到一些對圖像理解更有意義的圖像區(qū)域。定義:令集合R代表整個圖像區(qū)域,對R的圖像分割可以看作是將R分成N個滿足以下條件的非空子集R1,R2,….,RN:圖像分割可以看做是圖像標(biāo)記(Imagelabeling)的一種特例。基于方法論的分類:閾值法;區(qū)域法;邊界法;聚類法;分類法;圖論法;概率模型法。作用分類:醫(yī)學(xué)影像計算機輔助診斷光學(xué)字符識別工件視覺檢測遙感圖像處理自然圖像理解7.2圖像特征概述亮度:空間連續(xù)性,稠密性,直觀,敏感性直方圖:統(tǒng)計特征,抗線性幾何變換變換系數(shù):頻域統(tǒng)計特征,提供一種完全不同的視角邊緣:符合視覺習(xí)慣,是形狀信息的基礎(chǔ)紋理:局部不連續(xù)性和全局相似性的統(tǒng)一關(guān)鍵點:魯棒局部特征,抗變形能力強,適用于匹配.思路將分割問題視為面向每一個像素的分類問題,通常使用簡單的閾值不等式判斷像素的類別。條件待分割區(qū)域與背景區(qū)域在像素級特征上存在明顯的差異,而兩個區(qū)域內(nèi)部像素在統(tǒng)計上各自具有較強的相似性。從特征直方圖上看,具有明顯的雙峰分布的圖像比較適合使用閾值法進行分割3閾值法如何確定閾值T?迭代法;大津法(OTSU);最優(yōu)閾值法;最大熵法;眾數(shù)法;矩不變法迭代閾值法 1)選取一個的初始估計值T; 2)用T分割圖像。這樣便會生成兩組像素集合:G1由所有灰度值大于T的像素組成,而G2由所有灰度值小于或等于T的像素組成。 3)對G1和G2中所有像素計算平均灰度值u1和u2。 4)計算新的閾值:T=1/2(u1+u2)。 重復(fù)步驟(2)到(4),直到T值更新后產(chǎn)生的偏差小于一個事先定義的參數(shù)T0。大津法(OTSU)尋找使類間離散度最大化的閾值T類間離散度的數(shù)學(xué)定義最優(yōu)閾值法將目標(biāo)和背景的像素特征分布看做是兩個相互獨立的隨機變量。當(dāng)給定一個閾值T,假設(shè)前景較亮而背景較暗,根據(jù)概率模型可以估計出背景被錯判為前景的概率Eb(T)和背景被錯判為前景的概率Ef(T)。兩者的概率加權(quán)和即為總的錯誤概率E(T),使得總錯誤概率最小的閾值即為最優(yōu)閾值一般假設(shè)前景和背景都服從高斯分布,則全部未知量共5個,分別是前景和背景各自的均值和方差,以及前景的事件概率Po。以上5個未知量一般根據(jù)最小均方誤差原則進行估計。即令估計得到的概率密度函數(shù)參數(shù)方程與圖像直方圖的均方誤差最小化。全局閾值法設(shè)計與實現(xiàn)的一般性原則根據(jù)圖像灰度分布的統(tǒng)計特性建立一個關(guān)于閾值T的評價函數(shù),通過對該函數(shù)的優(yōu)化獲取全局閾值。評價函數(shù)迭代法:兩類中心的均值與閾值的差(誤差概率的特例);大津法:類間離散度;最優(yōu)閾值法:錯誤概率;眾數(shù)法:灰度極小值;最大熵法:兩類的熵的和;矩不變法:分類后數(shù)據(jù)的前4階矩的變化值。算法特點總結(jié)自適應(yīng)閾值法全局閾值法無法解決目標(biāo)與背景的灰度范圍過度重疊的情況(該情況通常由不均勻的光照所引起)思路將原圖像分割為多塊子圖像。將每一個存在邊緣的子圖像作為一整張圖像使用全局閾值法;將不存在明顯邊緣的子圖像按照其平均灰度,判別為目標(biāo)或背景三個問題 1)如何確定一個子圖像內(nèi)是否存在邊緣 2)如何處理塊狀效應(yīng) 3)對于平坦區(qū)域灰度均值的判別能否保證準(zhǔn)確解決方案 1)圖像預(yù)處理(去噪,去光照) 2)采用具有重疊區(qū)域的圖像分塊策略 3)根據(jù)子圖像的方差、灰度直方圖的雙峰特性、梯度直方圖等統(tǒng)計信息判別其是否包含邊緣區(qū)域。 4)根據(jù)包含邊緣區(qū)域的閾值對平坦區(qū)域的閾值進行插值補足。優(yōu)點算法簡單,速度快,直接形成閉合區(qū)域。缺點:適應(yīng)性差,抗噪能力差,忽略了像素之間的空間聯(lián)系。7.4區(qū)域法思路綜合考慮待分割區(qū)域內(nèi)部像素的特征同質(zhì)性和近鄰性,通過反復(fù)地將相鄰且特征相似的像素或區(qū)域納入同一分割區(qū)域,最終實現(xiàn)分割。兩種區(qū)域分割算法框架區(qū)域生長法區(qū)域分裂與合并基本思想(步驟)1.尋找一組生長點,可以是單個像素,也可以是某個小區(qū)域。可以是人工指定,也可以設(shè)計專門的初始化算法。2.搜索生長點的鄰域,比較鄰域像素與生長點像素的特征相似性,若滿足合并條件,則合并為同一區(qū)域,形成新的生長點。3.重述步驟2直到?jīng)]有新的生長點出現(xiàn)。關(guān)鍵問題1)選擇一組能正確代表所需區(qū)域的生長點像素; 2)選擇有意義的特征,也就是確定在生長過程中將相鄰區(qū)域像素包括進來的; 3)確定相似性準(zhǔn)則,即獲取生長過程停止的準(zhǔn)則。基本概念 1)特征相似性:生長或合并區(qū)域的準(zhǔn)則的依據(jù)與基礎(chǔ),如灰度差; 2)像素相鄰性:生長或合并區(qū)域時所取的鄰域方式; 3)生長準(zhǔn)則:如何利用特征相似性與特征相鄰性進行區(qū)域生長與合并的方式,如單一型,質(zhì)心型混合型等?;镜膮^(qū)域生長法的優(yōu)缺點這種方法簡單,但如果區(qū)域之間的邊緣灰度變化很平緩或邊緣交于一點時,如圖,兩個區(qū)域會合并起來。區(qū)域生長法的改進原則區(qū)域生長的算法核心是生長準(zhǔn)則,所有針對區(qū)域生長法的改進均著眼于如何修改生長準(zhǔn)則幾種基本的改進方法雙閾值法:在生長準(zhǔn)則中加入一個閾值條件,即新生長區(qū)域的灰度與初始種子點的灰度的差應(yīng)小于某一個閾值;質(zhì)心法:對基本方法的閾值進行改變,即新生長區(qū)域的灰度與已經(jīng)生長得到的區(qū)域的平均灰度值的差應(yīng)小于某一個閾值;混合型:對生長過程的順序進行修改,即每次只生長與相鄰像素差值(或與種子點灰度的差值)最小的像素,但需要制定結(jié)束條件區(qū)域分裂與合并思路首先將圖像分割成一系列任意不相交的區(qū)域,然后將他們進行合并或分裂得到各個區(qū)域。四叉樹是該方法中最常用到空間結(jié)構(gòu)優(yōu)點考慮了像素特征的空間相關(guān)性,能夠有效篩除一些背景干擾。提供了人機交互接口和自主分割框架的結(jié)合通道。分割結(jié)果具有比較清晰的邊緣。相對于閾值法具有更自由的參數(shù)調(diào)節(jié)空間。缺點終止準(zhǔn)則的設(shè)計比較困難。區(qū)域生長法過于依賴種子點選擇的合理性。生長和合并過程中的串行順序?qū)ψ罱K結(jié)果有顯著影響。計算時間明顯長于閾值法。7.5聚類法思路將像素投射到特征空間成為樣本點,根據(jù)樣本點在特征空間的分布特性進行聚類。將類別標(biāo)號投射回圖像空間作為像素的標(biāo)號,進而實現(xiàn)分割。哪些視覺元素容易被聚為同一類(1F2S2P4C)Proximity:空間相鄰性Similarity:特征相似性Commonfate:運動同向性Commonregion:區(qū)域歸屬Closure:趨向于閉合Parallelism:平行性Symmetry:對稱性Continuity:連續(xù)性Familiarpattern:組合后的熟悉程度代表性的聚類分割算法合成聚類與分裂聚類每個樣本點作為一個獨立的簇;將所有樣本作為一個簇K-means算法模糊C均值聚類Meanshift算法SLIC超像素K-means的基本思想將圖像中所有的元素視為來源于k個類別,根據(jù)樣本到類別中心的特征距離判斷像素的歸屬,通過迭代更新的方式在逼近類別模型參數(shù)的同時實現(xiàn)像素的分類。K-means的步驟1.為像素選擇特征向量(比如YUV色彩特征),將所有像素映射為特征空間中的樣本點。2.選擇類別數(shù)量k,在特征空間隨機初始化k個類的中心。3.根據(jù)樣本點到類中心的距離,為每一個樣本點選擇距離最近類作為類別標(biāo)號4.根據(jù)新的分類結(jié)果,以同一類樣本點的特征均值更新類中心。5.重復(fù)步驟3-4,直到類中心的位置不再發(fā)生變化。模糊C均值聚類思路將聚類問題中的類定義為模糊集合,用模糊集的隸屬度函數(shù)定量描述樣本點與類之間的從屬關(guān)系,并通過尋找使目標(biāo)函數(shù)最小化的隸屬度函數(shù),實現(xiàn)聚類。算法關(guān)鍵點隸屬度函數(shù)的數(shù)學(xué)定義模糊類中心的更新Meanshift思路將特征空間的聚類問題轉(zhuǎn)化為概率密度函數(shù)估計,認為概率密度局部極大值對應(yīng)某一類的類中心,而能夠通過均值漂移收斂于該局部極大值的樣本點將被分為該類。特征空間中的類=概率密度函數(shù)的局部極大值理

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論