深入淺出各種邊緣檢測(cè)算子及其推導(dǎo)_第1頁
深入淺出各種邊緣檢測(cè)算子及其推導(dǎo)_第2頁
深入淺出各種邊緣檢測(cè)算子及其推導(dǎo)_第3頁
深入淺出各種邊緣檢測(cè)算子及其推導(dǎo)_第4頁
深入淺出各種邊緣檢測(cè)算子及其推導(dǎo)_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

一.前言首先我們先來簡(jiǎn)單了解一下什么是數(shù)字圖像處理(DigitalImageProcessing),先看一下數(shù)字圖像主要的兩個(gè)應(yīng)用領(lǐng)域:1.改善圖示信息以便人們解釋;2.為存儲(chǔ)、傳輸和表示而對(duì)圖像數(shù)據(jù)進(jìn)行處理,以便于機(jī)器自動(dòng)理解。我們可以簡(jiǎn)單理解為就將一幅原始圖像,使用計(jì)算機(jī)處理為更為我們所能理解或所需要的形式,如圖1-1所示,為基于邊緣檢測(cè)的免疫細(xì)胞圖像自動(dòng)分割過程示意圖圖1-1克隆細(xì)胞圖像自動(dòng)分割過程示意圖讓我們?cè)倏匆粋€(gè)例子,如圖1-2,為經(jīng)典的車牌檢測(cè)算法,將原始圖像進(jìn)行灰度圖轉(zhuǎn)換、邊緣檢測(cè)、形態(tài)學(xué)腐蝕膨脹等操作,得到車牌區(qū)域,隨后將車牌區(qū)域進(jìn)行切割(這個(gè)是筆者剛?cè)腴T時(shí)做的小demo,還沒有用到深度學(xué)習(xí)模型,用的是knn,因此識(shí)別結(jié)果很差。圖1

-2車牌檢測(cè)在我們大致了解了數(shù)字圖像處理之后,接下來介紹數(shù)字圖像處理一些基本的算法。二.數(shù)字圖像處理基礎(chǔ)知識(shí)與算法接下來先簡(jiǎn)單介紹一下一些學(xué)習(xí)數(shù)字圖像處理的基礎(chǔ)知識(shí)與算法1).數(shù)字圖像數(shù)字圖像指的是現(xiàn)在的圖像都是以二維數(shù)字表示,每個(gè)像素的灰度值均由一個(gè)數(shù)字表示,范圍為0-255(2^8)。2).二值圖像、灰度圖像、彩色圖像二值圖像(BinaryImage):

圖像中每個(gè)像素的灰度值僅可取0或1,即不是取黑,就是取白,二值圖像可理解為黑白圖像?;叶葓D像(GrayScaleImage):

圖像中每個(gè)像素可以由0-255的灰度值表示,具體表現(xiàn)為從全黑到全白中間有255個(gè)介于中間的灰色值可以取。彩色圖像(ColorImage):

每幅圖像是由三幅灰度圖像組合而成,依次表示紅綠藍(lán)三通道的灰度值,即我們熟知的RGB,此時(shí)彩色圖像要視為三維的[height,width,3]下面用一張圖來感受一下灰度圖與彩色圖像之間的聯(lián)系與差別圖2-1RGB圖像的分解其中還有一個(gè)很重要的公式,即彩色圖像轉(zhuǎn)為灰度圖的計(jì)算公式:

GGray表示灰度圖像,RGB則表示彩色圖像的紅(red)、綠(green)、藍(lán)(blue)三通道灰度值。3).鄰接性、連通性4鄰域:

假設(shè)有一點(diǎn)像素p坐標(biāo)為(x,y),則它的4領(lǐng)域是(x+1,y),(x-1,y),(x,y+1),(x,y-1)D鄰域:

假設(shè)有一點(diǎn)像素p坐標(biāo)為(x,y),則它的D領(lǐng)域是(x+1,y+1),(x+1,y-1),(x-1,y+1)(x-1,y-1)8鄰域:

將4領(lǐng)域與D領(lǐng)域的集合取并集,即表示為8鄰域4連通:

對(duì)于在像素點(diǎn)p的4鄰域內(nèi)的像素均與像素點(diǎn)p形成4連通8連通:

對(duì)于在像素點(diǎn)p的8鄰域內(nèi)的像素均與像素點(diǎn)p形成8連通4).濾波濾波的目的主要兩個(gè):1.通過濾波來提取圖像特征,簡(jiǎn)化圖像所帶的信息作為后續(xù)其它的圖像處理;2.為適應(yīng)圖像處理的需求,通過濾波消除圖像數(shù)字化時(shí)所混入的噪聲。其中第一點(diǎn)就是邊緣檢測(cè)中所使用的基本思想,即簡(jiǎn)化圖像信息,使用邊緣線代表圖像所攜帶信息。濾波可理解為濾波器(通常為3*3、5*5矩陣)在圖像上進(jìn)行從上到下,從左到右的遍歷,計(jì)算濾波器與對(duì)應(yīng)像素的值并根據(jù)濾波目的進(jìn)行數(shù)值計(jì)算返回值到當(dāng)前像素點(diǎn),如圖2-3所示,藍(lán)色塊表示濾波器,對(duì)圖像進(jìn)行點(diǎn)積運(yùn)算并賦值到圖像。具體公式表示為:(其中

表示當(dāng)前像素點(diǎn),

表示當(dāng)前像素與濾波器對(duì)應(yīng)值相乘的值,n為濾波器大小,舉例來說如若此濾波器值全為1,則此公式計(jì)算的是當(dāng)前像素點(diǎn)的8連通像素點(diǎn)的平均值,因此濾波完后的圖像應(yīng)表現(xiàn)為模糊的效果,模糊程度取決于濾波器的大小,濾波器大小(size)越大,模糊效果越明顯)三.邊緣檢測(cè)(Sobel、Prewitt、Roberts、Canny、Marr-Hildreth)1.基本邊緣檢測(cè)算子在介紹完濾波的知識(shí)后,學(xué)習(xí)基本邊緣檢測(cè)算法是一件很輕松的事情,因?yàn)檫吘墮z測(cè)本質(zhì)上就是一種濾波算法,區(qū)別在于濾波器的選擇,濾波的規(guī)則是完全一致的。為了更好理解邊緣檢測(cè)算子,我們引入梯度(gradient)

這一概念,梯度是人工智能(artificialintelligence)

非常重要的一個(gè)概念,遍布機(jī)器學(xué)習(xí)、深度學(xué)習(xí)領(lǐng)域,學(xué)過微積分的同學(xué)應(yīng)該知道一維函數(shù)的一階微分基本定義為:而我們剛才也提到了,圖像的濾波一般是基于灰度圖進(jìn)行的,因此圖像此時(shí)是二維的,因此我們?cè)诳匆幌露S函數(shù)的微分,即偏微分方程:由上面的公式我們可以看到,圖像梯度即當(dāng)前所在像素點(diǎn)對(duì)于X軸、Y軸的偏導(dǎo)數(shù),所以梯度在圖像處理領(lǐng)域我們可以也理解為像素灰度值變化的速度,下面我們舉一個(gè)簡(jiǎn)單的例子:圖3-1圖中我們可以看到,100與90之間相差的灰度值為10,即當(dāng)前像素點(diǎn)在X軸方向上的梯度為10,而其它點(diǎn)均為90,則求導(dǎo)后發(fā)現(xiàn)梯度全為0,因此我們可以發(fā)現(xiàn)在數(shù)字圖像處理,因其像素性質(zhì)的特殊性,微積分在圖像處理表現(xiàn)的形式為計(jì)算當(dāng)前像素點(diǎn)沿偏微分方向的差值,所以實(shí)際的應(yīng)用是不需要用到求導(dǎo)的,只需進(jìn)行簡(jiǎn)單的加減運(yùn)算。而另一個(gè)概念梯度的模則表示f(x,y),在其最大變化率方向上的單位距離所增加的量,即:在了解完梯度的概念之后呢,下面我們先介紹一下幾種基本邊緣檢測(cè)濾波器:Sobel、Prewitt、Roberts算子。我們以Sobel為例,其中

分別表示對(duì)于X軸、Y軸的邊緣檢測(cè)算子,從

算子結(jié)構(gòu)可以很清楚發(fā)現(xiàn),這個(gè)濾波器是計(jì)算當(dāng)前像素點(diǎn)右邊與左邊8連通像素灰度值的差值,我們先通過一維的概念來理解一下:如現(xiàn)在有一個(gè)一維數(shù)組長(zhǎng)度為10,值為:[8,6,2,4,9,1,3,5,10,6]此時(shí)我們的一維邊緣檢測(cè)算子則表現(xiàn)為[-1,0,1],現(xiàn)在我們把邊緣檢測(cè)算子放在數(shù)組上面進(jìn)行點(diǎn)積(即對(duì)應(yīng)點(diǎn)相乘之后的和),得到結(jié)果為:[6,-6,-2,7,-3,-6,4,7,1,-10]可以發(fā)現(xiàn)得到的值出現(xiàn)了負(fù)數(shù),但我們之前的定義則聲明了像素灰度值定義域?yàn)?-255范圍內(nèi),因此這里一般的操作為將負(fù)數(shù)截?cái)嗟?-255以內(nèi)或者直接取絕對(duì)值,因此現(xiàn)在我們得到的是[6,6,2,7,3,6,4,7,1,10]其中數(shù)字的大小則表示了當(dāng)前像素點(diǎn)梯度的模大小,即灰度變化的速度有多大,值越大,我們一定程度上就可以確信當(dāng)前點(diǎn)為我們所要找的邊緣點(diǎn),通過一維的例子我們可以更好理解二維的邊緣檢測(cè)思想,即沿著X軸、Y軸進(jìn)行兩次濾波操作,得到的結(jié)果進(jìn)行平方求和加根號(hào)的操作得出當(dāng)前像素點(diǎn)的圖像梯度,我們來通過一張圖理解一下這個(gè)過程:圖3-4原圖像、沿X軸梯度圖像、沿Y軸梯度圖像、梯度圖像的可視化圖中(a)為原始的灰度圖像,(b)和(c)為使用圖3-3中Sobel算子的

、

兩種形式分別對(duì)原始圖像進(jìn)行的濾波結(jié)果,即表示為分別沿X、Y軸的梯度圖,最后將兩個(gè)圖融合在一起則得到了我們所需的梯度圖像(d),在給大家一張圖來幫助理解Sobel算法?,F(xiàn)在我們已經(jīng)大致了解了邊緣檢測(cè)的基本思想了,看著圖3-4(d)是不是覺得它挺好看的呢,但是好看不一定說明它就是我們所需要的邊緣圖,直接用基本的邊緣算子如Sobel求得的邊緣圖存在很多問題,如噪聲污染沒有被排除、邊緣線太過于粗寬等,因此我們接下來要介紹兩個(gè)先進(jìn)的邊緣檢測(cè)算子:Canny算子和Marr-Hildreth算子。2.較為先進(jìn)的邊緣檢測(cè)算子1).Canny算子Canny算子是澳洲計(jì)算機(jī)科學(xué)家約翰·坎尼(JohnF.Canny)于1986年開發(fā)出來的一個(gè)多級(jí)。邊緣檢測(cè)算法,其目標(biāo)是找到一個(gè)最優(yōu)的邊緣,其最優(yōu)邊緣的定義是:1.好的檢測(cè)

--算法能夠盡可能多地標(biāo)示出圖像中的實(shí)際邊緣2.好的定位

--標(biāo)識(shí)出的邊緣要與實(shí)際圖像中的實(shí)際邊緣盡可能接近3.最小響應(yīng)

--圖像中的邊緣只能標(biāo)識(shí)一次,并且可能存在的圖像噪聲不應(yīng)該標(biāo)識(shí)為邊緣所以接下來我們來介紹一下目前流行的Canny算法的具體步驟(1).高斯(Gaussian)濾波高斯濾波目前是最為流行的去噪濾波算法,高斯與我們學(xué)的概率論中正態(tài)分布中正態(tài)一詞指的是同一個(gè)意思,其原理為根據(jù)待濾波的像素點(diǎn)及其鄰域點(diǎn)的灰度值按照高斯公式生成的參數(shù)規(guī)則進(jìn)行加權(quán)平均,這樣可以有效濾去理想圖像中疊加的高頻噪聲(noise)二維高斯公式為:常見的高斯濾波器有:圖3-5常見的高斯濾波器其實(shí)高斯濾波器很像一個(gè)金字塔結(jié)構(gòu),其濾波器的值大小我們可以理解為權(quán)重(weight),值越大對(duì)應(yīng)的像素點(diǎn)權(quán)重越大,分量也就越大,因此從高斯濾波器我們可以看出對(duì)應(yīng)當(dāng)前像素點(diǎn),距離越遠(yuǎn)權(quán)重越小,對(duì)灰度值的貢獻(xiàn)也就越小。讓我們舉個(gè)例子來理解一下高斯濾波,如圖3-5中左邊的高斯濾波器,其中心點(diǎn)4我們可以把它看成是'主人公',其周圍的點(diǎn)看成是'鄰居',噪聲我們把它看成是'壞人',現(xiàn)在我們假設(shè)這9個(gè)人里面,有一個(gè)人是'壞人',我們也知道壞人是肯定會(huì)說自己是好人的,但要是我們有投票機(jī)制決定一個(gè)人是否為'壞人'呢,其中權(quán)重(weight)則對(duì)應(yīng)每個(gè)人說話的分量,投票機(jī)制就為我們所說的加權(quán)平均策略,現(xiàn)在我們可以很直觀地發(fā)現(xiàn),其實(shí)高斯濾波就是一個(gè)會(huì)考慮其周圍像素點(diǎn)的濾波器,即使當(dāng)前點(diǎn)位為噪聲點(diǎn),高斯濾波器也會(huì)通過周圍點(diǎn)的灰度值來制約噪聲的影響,生成高斯濾波器與濾波的代碼如下:(其中g(shù)aussKernel'表示對(duì)gaussKernel進(jìn)行轉(zhuǎn)置)(2).計(jì)算梯度圖像與角度圖像計(jì)算梯度圖像我們剛才基本也有理解了一下,無非就是用各種邊緣檢測(cè)算子進(jìn)行梯度的檢測(cè),但Canny中使用的梯度檢測(cè)算子有點(diǎn)高級(jí),是使用高斯濾波器進(jìn)行梯度計(jì)算得到的濾波器,得到的結(jié)果也類似于Sobel算子,即距離中心點(diǎn)越近的像素點(diǎn)權(quán)重越大,代碼如下:角度圖像的計(jì)算則較為簡(jiǎn)單,其作用為非極大值抑制的方向提供指導(dǎo),公式如下:(3).對(duì)梯度圖像進(jìn)行非極大值抑制從上一步得到的梯度圖像存在邊緣粗寬、弱邊緣干擾等眾多問題,現(xiàn)在我們可以使用非極大值抑制來尋找像素點(diǎn)局部最大值,將非極大值所對(duì)應(yīng)的灰度值置0,這樣可以剔除一大部分非邊緣的像素點(diǎn)。如圖3-6所示,C表示為當(dāng)前非極大值抑制的點(diǎn),g1-4為它的8連通鄰域點(diǎn),圖中藍(lán)色線段表示上一步計(jì)算得到的角度圖像C點(diǎn)的值,即梯度方向,第一步先判斷C灰度值在8值鄰域內(nèi)是否最大,如是則繼續(xù)檢查圖中梯度方向交點(diǎn)dTmp1,dTmp2值是否大于C,如C點(diǎn)大于dTmp1,dTmp2點(diǎn)的灰度值,則認(rèn)定C點(diǎn)為極大值點(diǎn),置為1,因此最后生成的圖像應(yīng)為一副二值圖像,邊緣理想狀態(tài)下都為單像素邊緣。圖3-6非極大值抑制(其中需要注意的是梯度方向交點(diǎn)并不一定落在8領(lǐng)域所在8個(gè)點(diǎn)的位置,因此dTmp1和dTmp2實(shí)際應(yīng)用中是使用相鄰兩個(gè)點(diǎn)的雙線性插值所形成的灰度值)。最后在上一張圖幫助大家理解,如圖3-7所示,其中梯度方向均為垂直向上,經(jīng)過非極大值抑制后取梯度方向上最大值為邊緣點(diǎn),形成細(xì)且準(zhǔn)確的單像素邊緣。圖3-7(4).使用雙閾值進(jìn)行邊緣連接經(jīng)過以上三步之后得到的邊緣質(zhì)量已經(jīng)很高了,但還是存在很多偽邊緣,因此Canny算法中所采用的算法為雙閾值法,具體思路為選取兩個(gè)閾值,將小于低閾值的點(diǎn)認(rèn)為是假邊緣置0,將大于高閾值的點(diǎn)認(rèn)為是強(qiáng)邊緣置1,介于中間的像素點(diǎn)需進(jìn)行進(jìn)一步的檢查。根據(jù)高閾值圖像中把邊緣鏈接成輪廓,當(dāng)?shù)竭_(dá)輪廓的端點(diǎn)時(shí),該算法會(huì)在斷點(diǎn)的8鄰域點(diǎn)中尋找滿足低閾值的點(diǎn),再根據(jù)此點(diǎn)收集新的邊緣,直到整個(gè)圖像閉合,具體代碼為:但由于尋找弱邊緣點(diǎn)的計(jì)算代價(jià)過大,因?yàn)槭褂玫氖沁f歸思維,且所找尋到的弱邊緣點(diǎn)為數(shù)不多,因此實(shí)際應(yīng)用中常常舍去這一步驟,取而代之的是基于形態(tài)學(xué)的邊緣細(xì)化操作,具體思想我們以后還會(huì)提到,具體代碼為:至此,我們已經(jīng)深度理解了Canny算法的思想與實(shí)現(xiàn)手段,實(shí)際應(yīng)用中Canny一般是邊緣檢測(cè)的首選項(xiàng),其算法思想也非常值得我們學(xué)習(xí),接下來我們?cè)诤?jiǎn)單介紹基于二階導(dǎo)數(shù)法的Marr-Hildreth邊緣檢測(cè)算子。1).Marr-Hildreth算子在學(xué)習(xí)Marr-Hildreth算子之前我們先來理解一下為什么要用二階導(dǎo)數(shù)法。如圖3-8所示,左邊表示的是一副灰度圖像,從左到右從黑色(0)慢慢變?yōu)榘咨?255),現(xiàn)在我們來看它的水平灰度剖面,灰度值從小到大平穩(wěn)上升,其一階導(dǎo)數(shù)表示為在上升區(qū)域?yàn)椴蛔兊闹?,其中得到的信息是圖像灰度值是平穩(wěn)過渡的,即梯度值相等,接下來在將其求二次導(dǎo)數(shù),得到的圖像為在開始過渡的起點(diǎn)為正數(shù),其值為一階導(dǎo)數(shù)在此點(diǎn)的梯度值,結(jié)束點(diǎn)也和起點(diǎn)一樣,現(xiàn)在重點(diǎn)來了,我們將這兩點(diǎn)連起來得到一個(gè)與X軸的交叉點(diǎn),這一點(diǎn)就是我們所認(rèn)為的邊緣點(diǎn),這就是二階導(dǎo)數(shù)應(yīng)用在邊緣檢測(cè)領(lǐng)域的奇妙之處(第一次接觸的時(shí)候覺得巨神奇)。在看一下marr和hildreth的證明結(jié)論:1.灰度變化與圖像尺寸無關(guān),因此他們的檢測(cè)要求使用不同尺寸的算子2.灰度的突然變換會(huì)在一階導(dǎo)數(shù)中引起波峰或波谷,在二階導(dǎo)數(shù)中等效引起零交叉圖3-8零交叉原理學(xué)習(xí)了基于二階導(dǎo)數(shù)的馬爾哈希算法原理之后,我們來看一下它的思路:(1).高斯濾波對(duì)你沒看錯(cuò),還是高斯濾波,基本所有邊緣檢測(cè)算法前面都會(huì)加一個(gè)高斯濾波來去除高頻噪聲,所以這里不在多說了,大家往前回顧一下就好了。(2).計(jì)算拉普拉斯(Laplacian)二階導(dǎo)Marr-Hildreth證明,最滿足圖像處理需求的算子是濾波器拉普拉斯高斯(Log)算子,具體原理我們不在多做闡述,這里我們來看一下它的公式:由其生成的拉普拉斯濾波器也被稱為墨西哥草帽算子,因?yàn)槠渲虚g一般為較大的正數(shù),8鄰域連通點(diǎn)為較小的負(fù)數(shù)值,常用的濾波器如圖3-9所示:圖3-9拉普拉斯濾波器之后就是使用拉普拉斯濾波器進(jìn)行圖像的濾波操作,得到待計(jì)算圖像。(3).計(jì)算零交叉(Zerocrossing)零交叉的實(shí)現(xiàn)較為簡(jiǎn)單,由于零交叉點(diǎn)意味著至少兩個(gè)相鄰的像素點(diǎn)的像素值異號(hào),一共有四種需要檢測(cè)的情況:左右,上下,兩個(gè)對(duì)角,其中如果濾波后的圖像g(x,y)的任意像素p處的四種情況其中一組的差值的絕對(duì)值超過了設(shè)定的閾值,則我們可以稱p為一個(gè)零交叉像素,示例如下:圖3-10此為Marr-Hildreth其中一小部分,檢測(cè)[-+]這一情況是否滿足,其中thresh為提到的閾值。到這里我們就學(xué)習(xí)了兩種最為流行且經(jīng)典的先

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論