基于MATLAB的圖像分割算法研究_第1頁
基于MATLAB的圖像分割算法研究_第2頁
基于MATLAB的圖像分割算法研究_第3頁
基于MATLAB的圖像分割算法研究_第4頁
基于MATLAB的圖像分割算法研究_第5頁
已閱讀5頁,還剩93頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、摘 要本文從原理和應(yīng)用效果上對經(jīng)典的圖像分割方法如邊緣檢測、閾值分割技術(shù)和區(qū)域增長等進(jìn)行了分析。對梯度算法中的Roberts算子、Sobel算子、Prewitt算子、拉普拉斯(Laplacian)算子、LoG(Laplacian-Gauss)算子、坎尼(Canny)算子的分割步驟、分割方式、分割準(zhǔn)則相互比較可以看出根據(jù)坎尼(Canny)邊緣算子的3個準(zhǔn)則得出的邊緣檢測結(jié)果最滿意。而閾值分割技術(shù)的關(guān)鍵在于閾值的確定,只有閾值確定好了才能有效的劃分物體與背景,但這種方法只對于那些灰度分布明顯,背景與物體差別大的圖像的分割效果才明顯。區(qū)域增長的基本思想是將具有相似性質(zhì)的像素集合起來構(gòu)成新區(qū)域。與此同

2、時本文還分析了圖像分割技術(shù)研究的方向。關(guān)鍵詞:圖像處理 圖像分割 AbstractThis article analyses the application effect to the classics image segmentation method like the edge examination, territory value division technology, and the region growth and so on.For comparing the Roberts operator, Sobel operator, Prewitt operator, the op

3、erator of Laplacian and the operator of LoG(Laplacian-Gauss),Canny operator in gradient algorithm,the step, the way and the standard of the image segmentation,we can find out the three standard of Canny edge operator the edge detection result of reaching most satisfy. And the key point of threshold

4、segmentation lie in fixing the threshold value, it is good to have only threshold value to determine it then can be effective to divide object and background,but this kind of method is good to those gray scales,the big difference image effect between the background and obiect. The basic idea of area

5、 is to form the new region from similar nature.And also, this paper analyses the research direction of image segmentation technology at the same time.Key words: image processing image segmentation operator目 錄(一般目錄要求最多是三級目錄,不要出現(xiàn)四級目錄) TOC o 1-4 h z u HYPERLINK l _Toc138682650 第一章 緒論1 HYPERLINK l _Toc1

6、38682652 1.1數(shù)字圖像處理的基本特點1 HYPERLINK l _Toc138682653 1.1.1數(shù)字圖像處理的信息大多是二維信息,處理信息量很大(三級標(biāo)題有問題)1 HYPERLINK l _Toc138682654 1.1.2數(shù)字圖像處理占用的頻帶較寬2 HYPERLINK l _Toc138682655 1.1.3數(shù)字圖像中各個像素是不獨立的,其相關(guān)性大2 HYPERLINK l _Toc138682656 1.1.4作合適的假定或附加新的測量2 HYPERLINK l _Toc138682657 1.1.5數(shù)字圖像處理后的圖像受人的因素影響較大2 HYPERLINK l

7、_Toc138682658 1.2數(shù)字圖像處理的優(yōu)點2 HYPERLINK l _Toc138682659 1.2.1再現(xiàn)性好2 HYPERLINK l _Toc138682660 1.2.2處理精度高3 HYPERLINK l _Toc138682661 1.2.3適用面寬3 HYPERLINK l _Toc138682662 1.2.4靈活性高3 HYPERLINK l _Toc138682663 1.3數(shù)字圖像處理的應(yīng)用4 HYPERLINK l _Toc138682664 1.3.1航天和航空技術(shù)方面的應(yīng)用4 HYPERLINK l _Toc138682665 1.3.2生物醫(yī)學(xué)工程方

8、面的應(yīng)用5 HYPERLINK l _Toc138682666 1.3.3通信工程方面的應(yīng)用5 HYPERLINK l _Toc138682667 1.3.4工業(yè)和工程方面的應(yīng)用5 HYPERLINK l _Toc138682668 1.3.5軍事公安方面的應(yīng)用5 HYPERLINK l _Toc138682669 1.3.6文化藝術(shù)方面的應(yīng)用6 HYPERLINK l _Toc138682670 1.4數(shù)字圖像分割技術(shù)的發(fā)展概況6 HYPERLINK l _Toc138682671 1.4.1 基于分形的圖像分割技術(shù)6 HYPERLINK l _Toc138682672 1.4.2 基于神經(jīng)

9、網(wǎng)絡(luò)的圖像分割技術(shù)7 HYPERLINK l _Toc138682674 1.5本文的主要流程圖8 HYPERLINK l _Toc138682675 第二章 數(shù)字圖像處理的處理方式9 HYPERLINK l _Toc138682676 2.1圖像變換9 HYPERLINK l _Toc138682677 2.2圖像編碼壓縮9 HYPERLINK l _Toc138682678 2.3圖像增強和復(fù)原9 HYPERLINK l _Toc138682679 2.4圖像分割9 HYPERLINK l _Toc138682680 2.5圖像描述10 HYPERLINK l _Toc138682681

10、2.6圖像分類(識別)10 HYPERLINK l _Toc138682682 第三章 MATLAB平臺及其開發(fā)環(huán)境11 HYPERLINK l _Toc138682683 3.1.MATLAB的組成11 HYPERLINK l _Toc138682684 3.1.1MATLAB主要有以下幾個部分11 HYPERLINK l _Toc138682685 a.數(shù)值計算功能12 HYPERLINK l _Toc138682686 b.符號計算功能12 HYPERLINK l _Toc138682687 c.數(shù)據(jù)分析功能12 HYPERLINK l _Toc138682688 d.動態(tài)仿真功能12

11、HYPERLINK l _Toc138682689 e.程序借口功能13 HYPERLINK l _Toc138682690 f.文字處理功能13 HYPERLINK l _Toc138682691 3.2MATLAB的特點13 HYPERLINK l _Toc138682692 3.2.1功能強大,可擴(kuò)展性強13 HYPERLINK l _Toc138682693 3.2.2界面友好,編程效率高14 HYPERLINK l _Toc138682694 3.2.3圖像功能,靈活且方便14 HYPERLINK l _Toc138682695 3.3MATLAB在圖像處理中的應(yīng)用14 HYPERL

12、INK l _Toc138682696 第四章 圖像分割概念及算法研究16 HYPERLINK l _Toc138682697 4.1圖像分割的基本概念16 HYPERLINK l _Toc138682698 4.1.1圖像分割定義16 HYPERLINK l _Toc138682699 4.2邊緣檢測方法(4.1和4.2之間不是并行關(guān)系)17 HYPERLINK l _Toc138682700 4.2.1邊緣檢測概述17 HYPERLINK l _Toc138682701 4.2.2邊緣檢測梯度算法19 HYPERLINK l _Toc138682702 a.梯度邊緣檢測算法基本步驟及流程圖

13、19 HYPERLINK l _Toc138682703 b.Robert算子20 HYPERLINK l _Toc138682704 c.Sobel算子21 HYPERLINK l _Toc138682705 d.Prewitt算子21 HYPERLINK l _Toc138682706 4.2.3拉普拉斯(Laplacian)算子22 HYPERLINK l _Toc138682707 4.2.4LoG(Laplacian-Gauss)算子24 HYPERLINK l _Toc138682708 4.2.5坎尼(Canny)算子25 HYPERLINK l _Toc138682709 4.

14、3灰度閾值分割27 HYPERLINK l _Toc138682710 4.3.1閾值分割介紹28 HYPERLINK l _Toc138682711 a.閾值化分割原則28 HYPERLINK l _Toc138682712 b.閾值分割算法分類29 HYPERLINK l _Toc138682713 4.3.2全局閾值30 HYPERLINK l _Toc138682714 a.極小值點閾值31 HYPERLINK l _Toc138682715 b.最優(yōu)閾值31 HYPERLINK l _Toc138682716 c.迭代閾值分割33 HYPERLINK l _Toc138682717

15、4.3.3動態(tài)閾值34 HYPERLINK l _Toc138682718 a.閾值插值35 HYPERLINK l _Toc138682719 b.水線閾值算法35 HYPERLINK l _Toc138682720 4.4區(qū)域分割37 HYPERLINK l _Toc138682721 4.4.1區(qū)域生長的基本原理、步驟及流程圖37 HYPERLINK l _Toc138682722 4.4.2生長準(zhǔn)則和過程40 HYPERLINK l _Toc138682723 a.灰度差準(zhǔn)則40 HYPERLINK l _Toc138682724 b.灰度分布統(tǒng)計準(zhǔn)則41 HYPERLINK l _T

16、oc138682725 c.區(qū)域形狀準(zhǔn)則42 HYPERLINK l _Toc138682726 4.4.3分裂合并43 HYPERLINK l _Toc138682727 第五章 總結(jié)45 HYPERLINK l _Toc138682728 5.1對于圖像邊緣檢測的分析45 HYPERLINK l _Toc138682729 5.2對于圖像閾值分割的分析45 HYPERLINK l _Toc138682730 5.3對于圖像區(qū)域分割的分析46 HYPERLINK l _Toc138682731 5.4改進(jìn)意見(改進(jìn)可另外做為一章比如說某某算法等的若干改進(jìn)等,不要放入總結(jié)一章中)(總結(jié)是對整篇

17、文章的一個概述,應(yīng)該是寫比如得出些什么結(jié)論,一些算法間比較等相關(guān)問題。)46 HYPERLINK l _Toc138682732 參考文獻(xiàn)48 HYPERLINK l _Toc138682733 致 謝49 HYPERLINK l _Toc138682734 附 錄50第一章 緒論1.1數(shù)字圖像處理的基本特點1.1.1數(shù)字圖像處理的信息大多是二維信息,處理信息量很大如一幅256256低分辨率黑白圖像,要求約64kbit的數(shù)據(jù)量;對高分辨率彩色512512圖像,則要求768kbit數(shù)據(jù)量;如果要處理30幀/秒的電視圖像序列,則每秒要求500kbit22.5Mbit數(shù)據(jù)量。因此對計算機(jī)的計算速度、

18、存儲容量等要求較高。1.1.2數(shù)字圖像處理占用的頻帶較寬與語言信息相比,占用的頻帶要大幾個數(shù)量級。如電視圖像的帶寬約5.6MHz,而語音帶寬僅為4kHz左右。所以在成像、傳輸、存儲、處理、顯示等各個環(huán)節(jié)的實現(xiàn)上,技術(shù)難度較大,成本亦高,這就對頻帶壓縮技術(shù)提出了更高的要求。1.1.3數(shù)字圖像中各個像素是不獨立的,其相關(guān)性大在圖像畫面上,經(jīng)常有很多像素有相同或接近的灰度。就電視畫面而言,同一行中相鄰兩個像素或相鄰兩行間的像素,其相關(guān)系數(shù)可達(dá)0.9以上,而相鄰兩幀之間的相關(guān)性比幀內(nèi)相關(guān)性一般說還要大些。因此,圖像處理中信息壓縮的潛力很大。 1.1.4作合適的假定或附加新的測量由于圖像是三維景物的二維

19、投影,一幅圖像本身不具備復(fù)現(xiàn)三維景物的全部幾何信息的能力,很顯然三維景物背后部分信息在二維圖像畫面上是反映不出來的。因此,要分析和理解三維景物必須作合適的假定或附加新的測量,例如雙目圖像或多視點圖像。在理解三維景物時需要知識導(dǎo)引,這也是人工智能中正在致力解決的知識工程問題。 1.1.5數(shù)字圖像處理后的圖像受人的因素影響較大由于人的視覺系統(tǒng)很復(fù)雜,受環(huán)境條件、視覺性能、人的情緒愛好以及知識狀況影響很大,作為圖像質(zhì)量的評價還有待進(jìn)一步深入的研究。另一方面,計算機(jī)視覺是模仿人的視覺,人的感知機(jī)理必然影響著計算機(jī)視覺的研究。例如,什么是感知的初始基元,基元是如何組成的,局部與全局感知的關(guān)系,優(yōu)先敏感的

20、結(jié)構(gòu)、屬性和時間特征等,這些都是心理學(xué)和神經(jīng)心理學(xué)正在著力研究的課題。1.2數(shù)字圖像處理的優(yōu)點1.2.1再現(xiàn)性好 數(shù)字圖像處理與模擬圖像處理的根本不同在于,它不會因圖像的存儲、傳輸或復(fù)制等一系列變換操作而導(dǎo)致圖像質(zhì)量的退化。只要圖像在數(shù)字化時準(zhǔn)確地表現(xiàn)了原稿,則數(shù)字圖像處理過程始終能保持圖像的再現(xiàn)。 1.2.2處理精度高 按目前的技術(shù),幾乎可將一幅模擬圖像數(shù)字化為任意大小的二維數(shù)組,這主要取決于圖像數(shù)字化設(shè)備的能力?,F(xiàn)代掃描儀可以把每個像素的灰度等級量化為16位甚至更高,這意味著圖像的數(shù)字化精度可以達(dá)到滿足任一應(yīng)用需求。對計算機(jī)而言,不論數(shù)組大小,也不論每個像素的位數(shù)多少,其處理程序幾乎是一樣

21、的。換言之,從原理上講不論圖像的精度有多高,處理總是能實現(xiàn)的,只要在處理時改變程序中的數(shù)組參數(shù)就可以了?;叵胍幌聢D像的模擬處理,為了要把處理精度提高一個數(shù)量級,就要大幅度地改進(jìn)處理裝置,這在經(jīng)濟(jì)上是極不合算的。 1.2.3適用面寬 圖像可以來自多種信息源,它們可以是可見光圖像,也可以是不可見的波譜圖像(例如X射線圖像、 射線圖像、超聲波圖像或紅外圖像等)。從圖像反映的客觀實體尺度看,可以小到電子顯微鏡圖像,大到航空照片、遙感圖像甚至天文望遠(yuǎn)鏡圖像。這些來自不同信息源的圖像只要被變換為數(shù)字編碼形式后,均是用二維數(shù)組表示的灰度圖像(彩色圖像也是由灰度圖像組合成的,例如RGB圖像由紅、綠、藍(lán)三個灰度

22、圖像組合而成)組合而成,因而均可用計算機(jī)來處理。即只要針對不同的圖像信息源,采取相應(yīng)的圖像信息采集措施,圖像的數(shù)字處理方法適用于任何一種圖像。 1.2.4靈活性高 圖像處理大體上可分為圖像的像質(zhì)改善、圖像分析和圖像重建三大部分,每一部分均包含豐富的內(nèi)容。由于圖像的光學(xué)處理從原理上講只能進(jìn)行線性運算,這極大地限制了光學(xué)圖像處理能實現(xiàn)的目標(biāo)。而數(shù)字圖像處理不僅能完成線性運算,而且能實現(xiàn)非線性處理,即凡是可以用數(shù)學(xué)公式或邏輯關(guān)系來表達(dá)的一切運算均可用數(shù)字圖像處理實現(xiàn)。1.3數(shù)字圖像處理的應(yīng)用圖像是人類獲取和交換信息的主要來源,因此,圖像處理的應(yīng)用領(lǐng)域必然涉及到人類生活和工作的方方面面。隨著人類活動范

23、圍的不斷擴(kuò)大,圖像處理的應(yīng)用領(lǐng)域也將隨之不斷擴(kuò)大。 1.3.1航天和航空技術(shù)方面的應(yīng)用 數(shù)字圖像處理技術(shù)在航天和航空技術(shù)方面的應(yīng)用,除了上面介紹的JPL對月球、火星照片的處理之外,另一方面的應(yīng)用是在飛機(jī)遙感和衛(wèi)星遙感技術(shù)中。許多國家每天派出很多偵察飛機(jī)對地球上有興趣的地區(qū)進(jìn)行大量的空中攝影。對由此得來的照片進(jìn)行處理分析,以前需要雇用幾千人,而現(xiàn)在改用配備有高級計算機(jī)的圖像處理系統(tǒng)來判讀分析,既節(jié)省人力,又加快了速度,還可以從照片中提取人工所不能發(fā)現(xiàn)的大量有用情報。從60年代末以來,美國及一些國際組織發(fā)射了資源遙感衛(wèi)星(如LANDSAT系列)和天空實驗室(如SKYLAB),由于成像條件受飛行器位

24、置、姿態(tài)、環(huán)境條件等影響,圖像質(zhì)量總不是很高。因此,以如此昂貴的代價進(jìn)行簡單直觀的判讀來獲取圖像是不合算的,而必須采用數(shù)字圖像處理技術(shù)。如LANDSAT系列陸地衛(wèi)星,采用多波段掃描器(MSS),在900km高空對地球每一個地區(qū)以18天為一周期進(jìn)行掃描成像,其圖像分辨率大致相當(dāng)于地面上十幾米或100米左右(如1983年發(fā)射的LANDSAT-4,分辨率為30m)。這些圖像在空中先處理(數(shù)字化,編碼)成數(shù)字信號存入磁帶中,在衛(wèi)星經(jīng)過地面站上空時,再高速傳送下來,然后由處理中心分析判讀。這些圖像無論是在成像、存儲、傳輸過程中,還是在判讀分析中,都必須采用很多數(shù)字圖像處理方法?,F(xiàn)在世界各國都在利用陸地衛(wèi)

25、星所獲取的圖像進(jìn)行資源調(diào)查(如森林調(diào)查、海洋泥沙和漁業(yè)調(diào)查、水資源調(diào)查等),災(zāi)害檢測(如病蟲害檢測、水火檢測、環(huán)境污染檢測等),資源勘察(如石油勘查、礦產(chǎn)量探測、大型工程地理位置勘探分析等),農(nóng)業(yè)規(guī)劃(如土壤營養(yǎng)、水分和農(nóng)作物生長、產(chǎn)量的估算等),城市規(guī)劃(如地質(zhì)結(jié)構(gòu)、水源及環(huán)境分析等)。我國也陸續(xù)開展了以上諸方面的一些實際應(yīng)用,并獲得了良好的效果。在氣象預(yù)報和對太空其它星球研究方面,數(shù)字圖像處理技術(shù)也發(fā)揮了相當(dāng)大的作用。 1.3.2生物醫(yī)學(xué)工程方面的應(yīng)用 數(shù)字圖像處理在生物醫(yī)學(xué)工程方面的應(yīng)用十分廣泛,而且很有成效。除了上面介紹的CT技術(shù)之外,還有一類是對醫(yī)用顯微圖像的處理分析,如紅細(xì)胞、白細(xì)

26、胞分類,染色體分析,癌細(xì)胞識別等。此外,在X光肺部圖像增析、超聲波圖像處理、心電圖分析、立體定向放射治療等醫(yī)學(xué)診斷方面都廣泛地應(yīng)用圖像處理技術(shù)。 1.3.3通信工程方面的應(yīng)用 當(dāng)前通信的主要發(fā)展方向是聲音、文字、圖像和數(shù)據(jù)結(jié)合的多媒體通信。具體地講是將電話、電視和計算機(jī)以三網(wǎng)合一的方式在數(shù)字通信網(wǎng)上傳輸。其中以圖像通信最為復(fù)雜和困難,因圖像的數(shù)據(jù)量十分巨大,如傳送彩色電視信號的速率達(dá)100Mbit/s以上。要將這樣高速率的數(shù)據(jù)實時傳送出去,必須采用編碼技術(shù)來壓縮信息的比特量。在一定意義上講,編碼壓縮是這些技術(shù)成敗的關(guān)鍵。除了已應(yīng)用較廣泛的熵編碼、DPCM編碼、變換編碼外,目前國內(nèi)外正在大力開發(fā)

27、研究新的編碼方法,如分行編碼、自適應(yīng)網(wǎng)絡(luò)編碼、小波變換圖像壓縮編碼等。 1.3.4工業(yè)和工程方面的應(yīng)用 在工業(yè)和工程領(lǐng)域中圖像處理技術(shù)有著廣泛的應(yīng)用,如自動裝配線中檢測零件的質(zhì)量、并對零件進(jìn)行分類,印刷電路板疵病檢查,彈性力學(xué)照片的應(yīng)力分析,流體力學(xué)圖片的阻力和升力分析,郵政信件的自動分揀,在一些有毒、放射性環(huán)境內(nèi)識別工件及物體的形狀和排列狀態(tài),先進(jìn)的設(shè)計和制造技術(shù)中采用工業(yè)視覺等等。其中值得一提的是研制具備視覺、聽覺和觸覺功能的智能機(jī)器人,將會給工農(nóng)業(yè)生產(chǎn)帶來新的激勵,目前已在工業(yè)生產(chǎn)中的噴漆、焊接、裝配中得到有效的利用。 1.3.5軍事公安方面的應(yīng)用 在軍事方面圖像處理和識別主要用于導(dǎo)彈的

28、精確末制導(dǎo),各種偵察照片的判讀,具有圖像傳輸、存儲和顯示的軍事自動化指揮系統(tǒng),飛機(jī)、坦克和軍艦?zāi)M訓(xùn)練系統(tǒng)等;公安業(yè)務(wù)圖片的判讀分析,指紋識別,人臉鑒別,不完整圖片的復(fù)原,以及交通監(jiān)控、事故分析等。目前已投入運行的高速公路不停車自動收費系統(tǒng)中的車輛和車牌的自動識別都是圖像處理技術(shù)成功應(yīng)用的例子。 1.3.6文化藝術(shù)方面的應(yīng)用 目前這類應(yīng)用有電視畫面的數(shù)字編輯,動畫的制作,電子圖像游戲,紡織工藝品設(shè)計,服裝設(shè)計與制作,發(fā)型設(shè)計,文物資料照片的復(fù)制和修復(fù),運動員動作分析和評分等等,現(xiàn)在已逐漸形成一門新的藝術(shù)計算機(jī)美術(shù)。利用計算機(jī)進(jìn)行圖像處理有兩個目的:一是產(chǎn)生適合人觀察和識別的圖像,二是希望能由計

29、算機(jī)自動識別和理解圖像。無論為了哪種目的,圖像處理中關(guān)鍵的一步就是對包含有大量各式各樣景物信息的圖像進(jìn)行分割。分割的最終結(jié)果是圖像被分解成一些具有某種特征的最小成分,稱為圖像的基元。相對于整幅圖像來說,這種圖像基元更容易被快速處理。圖像特征是指圖像中可用作標(biāo)志的屬性,它可以氛圍圖像的統(tǒng)計特性和圖像的視覺特征兩類。圖像的統(tǒng)計特性是指一些人為定義的特征,通過變換才能得到,如圖像的直方圖、矩、頻譜等;圖像的視覺特征是指人的視覺可直接感受到的自然特征,如區(qū)域的亮度、紋理或輪廓等。利用這兩類特征把圖像分解成一系列有意義的目標(biāo)或區(qū)域的過程稱為圖像的分割。1.4數(shù)字圖像分割技術(shù)的發(fā)展概況1.4.1 基于分形

30、的圖像分割技術(shù)基于特征的圖像分割方法包括兩個重要的部分:特征抽取與模式聚類。特征提取是圖像分割最重要的問題之一,能否抽取出有效的特征值對分割結(jié)果有很大的影響,如果沒有好的特征值,分類方法再好也無法獲得理想的結(jié)果。特征抽取大致可以分為三類,即基于特征、基于模型以及基于結(jié)構(gòu)?;谔卣鞯姆椒ň褪菍ふ揖哂邢嗤匦缘膮^(qū)域或區(qū)域邊界,基于模型的方法就是假設(shè)一個基本的隨機(jī)過程并用過程參數(shù)作為特征。由于模型參數(shù)也可用作紋理特征,基于模型的方法可看成是基于特征方法的一個子集。結(jié)構(gòu)特征基于假設(shè)圖像中有可檢測的基本結(jié)構(gòu)元素并按一定的規(guī)則排列?;谀P偷姆椒ㄗ畹湫偷哪P椭饕袃煞N:分形幾何模型與隨機(jī)模型。分形函數(shù)近年

31、來受到越來越多的重視。分形是B.B.Mandelbrot在總結(jié)了自然界中的非規(guī)整幾何圖形后,于1975年第一次提出了分形的概念。Mandelbrot給分形的定義為:設(shè)的豪斯道夫維數(shù)是D,如果這個維數(shù)恒大于集合A的拓?fù)渚S數(shù)Dt,則稱集合A是分形集,簡稱分形。上述定義沒有其他任何條件要求。1986年,Mandelbrot又給出了分形的第二個定義:組成部分與整體以某種相似的形叫做分形。這個定義突出了相似性的作用,反映了自然界中很廣泛一類物體的基本屬性;局部與局部,局部與整體在形態(tài)、功能、信息、時間與空間等方面具有統(tǒng)計意義上的相似性。簡單地說分形就是一個維數(shù)大于拓?fù)渚S數(shù)的集合。分形維數(shù)的一大特點是尺度

32、變換不變性。分形幾何學(xué)已經(jīng)廣泛應(yīng)用于圖像壓縮和圖像編碼,并且取得了較好的效果。同時也有一些研究者將分形特征用于自然紋理圖像和自然景物的分割與識別中。分形維數(shù)特征對圖像尺度變換不敏感,與人對物體表面粗糙度的判斷有很大的相關(guān)性,由于許多自然紋理都具有線形對數(shù)功率譜,而分形維數(shù)就對應(yīng)于這種線形對數(shù)功率譜斜率的估計值,因而用分形維數(shù)描述自然紋理有一定的合理性。1.4.2 基于神經(jīng)網(wǎng)絡(luò)的圖像分割技術(shù)使用神經(jīng)網(wǎng)絡(luò)模型可以實現(xiàn)圖像分割算法。Blanz and Gish使用一個多層前向神經(jīng)網(wǎng)絡(luò)用于圖像分割,輸入層神經(jīng)元的數(shù)目取決于輸入特征數(shù),而輸出層神經(jīng)元的數(shù)目等同于分類的數(shù)目。由于BP網(wǎng)絡(luò)能完成n維空間(輸

33、入節(jié)點數(shù)為n)到m維空間(輸出節(jié)點數(shù)m)的復(fù)雜非線形映射,因此它具有Laplacian算子的能力,用神經(jīng)網(wǎng)絡(luò)可以獲得良好的結(jié)果,而且用神經(jīng)網(wǎng)絡(luò)處理,一旦訓(xùn)練完畢,各節(jié)點間的互聯(lián)權(quán)就完全確定,在識別時具有很快的速度。Babaguchi等使用多層BP神經(jīng)網(wǎng)絡(luò),用于閾值分割圖像,輸入是統(tǒng)計直方圖,輸出是想要的閾值。使用這種方法,在神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)階段需要大量的已知閾值的樣本圖像,以用于調(diào)節(jié)網(wǎng)絡(luò)參數(shù)產(chǎn)生合適的輸出。但在實際應(yīng)用中,要獲得大量的樣本圖像是十分困難的。M.Liang借助于松弛標(biāo)記技術(shù)與人工神經(jīng)網(wǎng)絡(luò)的有關(guān)理論,提出了一種用Kohonen網(wǎng)絡(luò)作從網(wǎng)絡(luò)粗分的主從神經(jīng)網(wǎng)絡(luò)分割方法,從網(wǎng)絡(luò)的分割結(jié)果用于

34、確定主網(wǎng)絡(luò)中各神經(jīng)元的初始狀態(tài),然后主網(wǎng)絡(luò)從這一初始狀態(tài)出發(fā)進(jìn)行狀態(tài)的動態(tài)演變,直至收斂到主網(wǎng)絡(luò)的某一吸引子,這時主網(wǎng)絡(luò)的狀態(tài)對應(yīng)于分割后的圖像。這種方法能夠分割低信噪比條件下圖像,實驗證明它比最佳鑒別門限準(zhǔn)則門限分割法與矩陣保持門限分割法具有更好的效果,并且可以實現(xiàn)實時處理。類似的用于從高度噪聲破壞的景物中提取對象的方法還可以使用Hopfield類型神經(jīng)網(wǎng)絡(luò)。 1.5本文的主要流程圖 原始圖像邊緣檢測方法灰度閾值分割區(qū)域分割方法比較各種方法的分割效果得出比較理想的分割效果圖1-1 主要流程圖第二章 數(shù)字圖像處理的處理方式2.1圖像變換 由于圖像陣列很大,直接在空間域中進(jìn)行處理,涉及計算量很大

35、。因此,往往采用各種圖像變換的方法,如傅立葉變換、沃爾什變換、離散余弦變換等間接處理技術(shù),將空間域的處理轉(zhuǎn)換為變換域處理,不僅可減少計算量,而且可獲得更有效的處理(如傅立葉變換可在頻域中進(jìn)行數(shù)字濾波處理)。目前新興研究的小波變換在時域和頻域中都具有良好的局部化特性,它在圖像處理中也有著廣泛而有效的應(yīng)用。 2.2圖像編碼壓縮 圖像編碼壓縮技術(shù)可減少描述圖像的數(shù)據(jù)量(即比特數(shù)),以便節(jié)省圖像傳輸、處理時間和減少所占用的存儲器容量。壓縮可以在不失真的前提下獲得,也可以在允許的失真條件下進(jìn)行。編碼是壓縮技術(shù)中最重要的方法,它在圖像處理技術(shù)中是發(fā)展最早且比較成熟的技術(shù)。 2.3圖像增強和復(fù)原 圖像增強和

36、復(fù)原的目的是為了提高圖像的質(zhì)量,如去除噪聲,提高圖像的清晰度等。圖像增強不考慮圖像降質(zhì)的原因,突出圖像中所感興趣的部分。如強化圖像高頻分量,可使圖像中物體輪廓清晰,細(xì)節(jié)明顯;如強化低頻分量可減少圖像中噪聲影響。圖像復(fù)原要求對圖像降質(zhì)的原因有一定的了解,一般講應(yīng)根據(jù)降質(zhì)過程建立“降質(zhì)模型”,再采用某種濾波方法,恢復(fù)或重建原來的圖像。 2.4圖像分割 圖像分割是數(shù)字圖像處理中的關(guān)鍵技術(shù)之一。圖像分割是將圖像中有意義的特征部分提取出來,其有意義的特征有圖像中的邊緣、區(qū)域等,這是進(jìn)一步進(jìn)行圖像識別、分析和理解的基礎(chǔ)。雖然目前已研究出不少邊緣提取、區(qū)域分割的方法,但還沒有一種普遍適用于各種圖像的有效方法

37、。因此,對圖像分割的研究還在不斷深入之中,是目前圖像處理中研究的熱點之一。 2.5圖像描述 圖像描述是圖像識別和理解的必要前提。作為最簡單的二值圖像可采用其幾何特性描述物體的特性,一般圖像的描述方法采用二維形狀描述,它有邊界描述和區(qū)域描述兩類方法。對于特殊的紋理圖像可采用二維紋理特征描述。隨著圖像處理研究的深入發(fā)展,已經(jīng)開始進(jìn)行三維物體描述的研究,提出了體積描述、表面描述、廣義圓柱體描述等方法。 2.6圖像分類(識別) 圖像分類(識別)屬于模式識別的范疇,其主要內(nèi)容是圖像經(jīng)過某些預(yù)處理(增強、復(fù)原、壓縮)后,進(jìn)行圖像分割和特征提取,從而進(jìn)行判決分類。圖像分類常采用經(jīng)典的模式識別方法,有統(tǒng)計模式

38、分類和句法(結(jié)構(gòu))模式分類,近年來新發(fā)展起來的模糊模式識別和人工神經(jīng)網(wǎng)絡(luò)模式分類在圖像識別中也越來越受到重視。第三章 MATLAB平臺及其開發(fā)環(huán)境MATLAB自1984年由美國Mathworks公司推向市場以來,歷經(jīng)十幾年的發(fā)展,現(xiàn)已成為國際公認(rèn)的最優(yōu)秀的科技應(yīng)用軟件。MATLAB既是一種直觀、高效的計算機(jī)語言,同時又是一個科學(xué)計算平臺。MATLAB以矩陣作為基本編程單元,將數(shù)值分析、矩陣計算、科學(xué)數(shù)據(jù)可視化以及非線形動態(tài)系統(tǒng)的建模和仿真等許多強大功能集成在一個易于使用的視窗環(huán)境之中,為科學(xué)研究、工程設(shè)計以及必須進(jìn)行有效數(shù)值計算的眾多學(xué)科領(lǐng)域提供了一個簡捷、高效大編程工具,為數(shù)據(jù)分析和數(shù)據(jù)可視

39、化、算法和應(yīng)用程序開發(fā)提供了最核心的數(shù)學(xué)和高級圖形工具。根據(jù)它提供的500多個數(shù)學(xué)和工程函數(shù),工程技術(shù)人員和科學(xué)工作者可以在它的集成環(huán)境中交互回變成以完成各自的計算。借助于這種編程環(huán)境,任何復(fù)雜的計算問題及其解大描述十分適合人們的邏輯思維方式和數(shù)學(xué)表達(dá)習(xí)慣,并在很大程度上擺脫了傳統(tǒng)非交互式程序設(shè)計語言(如C、Fortran)的編程模式,為自然科學(xué)和工程設(shè)計諸多領(lǐng)域或全面解決復(fù)雜數(shù)值計算問題提供了綜合解決方案。MATLAB語言還提供可與C、Fortran語言的借口,可以很容易與用C、Fortran語言寫的程序混合編譯。3.1.MATLAB的組成3.1.1MATLAB主要有以下幾個部分矩陣語句MA

40、TLAB的核心上控制流語句、函數(shù)、數(shù)據(jù)結(jié)構(gòu)、輸入/輸出及面向?qū)ο缶幊烫卣鞯母呒壘仃?數(shù)組語言。MATLAB不但允許用戶交互地即算的小程序,也允許建立完整和復(fù)雜的龐大應(yīng)用程序。工作環(huán)境MATLAB的工作環(huán)境是隨使用者(作為MATLAB用戶或程序員)一同工作的龐大工具和功能性程序的集合。MATLAB在用戶工作區(qū)中執(zhí)行變量管理和輸入、輸出數(shù)據(jù)的功能。MATLAB也包含一些游泳的工具,并提供了一個集成的開發(fā)環(huán)境。句柄圖形句柄圖形上MATLAB的圖形系統(tǒng)。包括二維、三維數(shù)據(jù)的可視化、圖形、圖像處理、動畫和顯示圖形的高級指令,也包括允許擁護(hù)全面控制圖形外觀以及在用戶MATLAB應(yīng)用程序中建立完整圖形用戶界

41、面(GUI)的底層指令。數(shù)學(xué)函數(shù)庫MATLAB為滿足復(fù)雜高科技計算任務(wù)大需要匯集了大量有價值的科學(xué)和工程計算算法,范圍從初等函數(shù)、復(fù)數(shù)運算直到復(fù)雜函數(shù)如矩陣求逆、矩陣特征值、奇異值、Bessel程序的文件庫。其功能包括從MATLAB中調(diào)用C或Fortran程序、調(diào)用MATLAB作為(C或Fortran)計算引擎以及讀寫MAT文件。MATLAB之所以成為世界頂尖的科學(xué)計算與數(shù)學(xué)應(yīng)用軟件,是因為它隨著版本的升級與不斷完善而具有越來越強大的功能。a.數(shù)值計算功能MATLAB出色的數(shù)值計算功能是使之優(yōu)于其他數(shù)學(xué)應(yīng)用軟件的決定性因素之一,尤其是當(dāng)今流行的MATLAB6.1版本,其數(shù)值計算功能可謂十分完善

42、了。b.符號計算功能科學(xué)計算有數(shù)值計算與符號計算之分,僅有優(yōu)異的數(shù)值計算功能并不能滿足解決科學(xué)計算時的全部需要。在數(shù)學(xué)科學(xué)、應(yīng)用科學(xué)和工程計算領(lǐng)域,常常會遇到符號計算問題。1993年,MathWorks公司從加拿大Waterloo大學(xué)購買了Maple的使用權(quán),并以Malple的“內(nèi)核”作為符號計算功能的引擎,依靠Maple已有的庫函數(shù),開發(fā)出了在MATLAB環(huán)境下實現(xiàn)符號計算功能的系統(tǒng)組件。c.數(shù)據(jù)分析功能MATLAB不但在科學(xué)計算方面具有強大的功能,而且在數(shù)值計算結(jié)果的分析和數(shù)據(jù)可視化方面也有著其他同類軟件難以匹敵的優(yōu)勢。在科學(xué)計算和工程應(yīng)用中,技術(shù)人員經(jīng)常會遇到大量的原始數(shù)據(jù)和數(shù)值計算結(jié)果

43、需要進(jìn)行分析,而對數(shù)據(jù)的分析并非易事。MATLAB能將這些數(shù)據(jù)以圖形的方式顯示出來,不僅使數(shù)據(jù)間的關(guān)系清晰明了,而且對于揭示其內(nèi)在本質(zhì)往往有著非常重要的作用。d.動態(tài)仿真功能MATLAB提供了一個模擬動態(tài)系統(tǒng)的交互式Simulink,允許用戶在屏幕上繪制框圖來模擬一個系統(tǒng),并能動態(tài)地控制該系統(tǒng)。Simulink采用鼠標(biāo)驅(qū)動方式,能處理線形、非線形、連續(xù)、離散等多種系統(tǒng)。e.程序借口功能MATLAB提供了方便的應(yīng)用程序借口(API),用戶可以在MATLAB環(huán)境下直接調(diào)用已經(jīng)編譯過的CFortran子程序,可以在MATLAB和其他應(yīng)用程序之間建立客戶機(jī)/服務(wù)器關(guān)系。同樣,在C和Fortran程序中

44、,也可以調(diào)用MATLAB的函數(shù)命令,使得這些語言可以充分利用MATLAB強大矩陣運算功能和方便的繪圖功能。f.文字處理功能MATLAB Notrbook能成功地將MATLAB與文字處理系統(tǒng)Microsoft word集成一個整體。為用戶進(jìn)行文字處理、科學(xué)計算、工程設(shè)計等營造了一個完美統(tǒng)一的工作環(huán)境。用戶不僅可以利用word強大曲文字編輯處理功能極其方便地創(chuàng)建MATLAB的系統(tǒng)手冊、技術(shù)報告、命令序列、函數(shù)程序、注釋文檔以及與MATLAB有關(guān)的教科書等6種文檔,而且還能從word訪問MATLAB的數(shù)值計算和可視化結(jié)果,直接利用word對由MATLAB所生成的圖形圖像進(jìn)行移動、縮放、剪裁、編輯等加

45、工處理。3.2MATLAB的特點總的來說,MATLAB有三大特點:3.2.1功能強大,可擴(kuò)展性強MATLAB語言不但為用戶提供了科學(xué)計算、數(shù)據(jù)分析與可視化、系統(tǒng)仿真、數(shù)學(xué)和文字同意處理等強大的功能,而且還具有獨樹一幟的可擴(kuò)展性特征。MathWorks公司針對不同領(lǐng)域的應(yīng)用,推出了自動控制、信號處理、圖像處理、模糊邏輯、神經(jīng)網(wǎng)格、小波分析、通信、最優(yōu)化、數(shù)理統(tǒng)計、偏微分方程、財政金融等30多個具有專門功能的MATLAB工具箱。MATLAB支持用戶自由地進(jìn)行二次開發(fā)。用戶的應(yīng)用程序既可以作為新的函數(shù)添加到相應(yīng)的工具箱中,也可以擴(kuò)充為新的工具箱。這些年來,國外許多不同應(yīng)用領(lǐng)域的專家使用MATLAB開

46、發(fā)出了相當(dāng)多的應(yīng)用程序。3.2.2界面友好,編程效率高M(jìn)ATLAB是一種以矩陣為基本變量單元的可視化程度設(shè)計語言,語法結(jié)構(gòu)簡單,數(shù)據(jù)類型單一,指令表達(dá)方式非常接近于常用的數(shù)學(xué)公式。即使對于那些不大熟悉計算機(jī)編程的用戶,只要有一點windows操作的經(jīng)驗,在短時間內(nèi)就能快速掌握MATLAB的主要內(nèi)容和基本操作,甚至能解決大量復(fù)雜的手工難以完成的工作。MATLAB不僅能使用戶免去大量經(jīng)常重復(fù)的基本數(shù)學(xué)運算,收到事半功倍之效,而且其編譯和執(zhí)行速度都遠(yuǎn)遠(yuǎn)超過了采用C和Fortran語言設(shè)計的程序。可以說,MATLAB在科學(xué)計算與工程應(yīng)用方面的編程效率遠(yuǎn)遠(yuǎn)高于其他高級語言。3.2.3圖像功能,靈活且方便

47、MATLAB具有靈活的二維與三維繪圖功能,在程序的運行過程中。可以方便迅速地用圖形、圖像、聲音、動畫等多媒體技術(shù)直接表述數(shù)值計算,可以選擇不同的坐標(biāo)系,設(shè)置顏色、線型、視角等,并且還可以將圖形嵌入到用戶的word文件中。MATLAB的這些特點使它獲得了對應(yīng)用學(xué)科(特別是邊緣學(xué)科和交叉學(xué)科)的極強適應(yīng)力,并很快成為應(yīng)用學(xué)科計算機(jī)輔助分析、設(shè)計、教學(xué),乃至科技文字處理不可缺少的基礎(chǔ)軟件。3.3MATLAB在圖像處理中的應(yīng)用MATLAB的數(shù)字圖像處理功能很強大,其自帶的圖像處理工具箱(image processing toolbox)包括了經(jīng)典圖像處理的許多方面,如圖像的集合操作、鄰域和區(qū)域操作、圖

48、像變換、圖像的恢復(fù)、增強和分割、線性濾波器和濾波器設(shè)計、圖像分析和統(tǒng)計、色彩、集合及形態(tài)操作等方面。它集數(shù)值分析、矩陣運算、信號處理和圖形顯示于一體,其強大的擴(kuò)展功能為各個領(lǐng)域的應(yīng)用提供了基礎(chǔ)。Matlab工具箱中主要包括信號處理(signal processing),控制系統(tǒng)(control system),神經(jīng)網(wǎng)絡(luò)(neural network),圖像處理(image processing),魯棒控制(robust control),非線形系統(tǒng)控制(nonlinear system control design),系統(tǒng)辨識(system identification),小波(wavelet

49、)等工具箱。同時,MATLAB還提供了多種圖像文件格式的讀寫和顯示,這使得在MATLAB的集成環(huán)境中可以輕松實現(xiàn)圖像處理。這些工具箱給各個領(lǐng)域的研究和工程應(yīng)用提供了有力的工具。在圖像集合操作方面,MATLAB的圖像集合操作提供了插值函數(shù),圖像尺寸調(diào)整,以及任意角度的圖像旋轉(zhuǎn),可以對圖像進(jìn)行縮放、旋轉(zhuǎn)和剪切等操作。圖像濾波方面,MATLAB圖像處理工具箱提供了Fourier變換,離散余弦變換,Radon變換以及這些變換的逆變換等,同時也可以利用MATLAB的小波變換工具箱來實現(xiàn)圖像的小波變換。在二值圖像處理方面,MATLAB圖像處理工具箱的二值圖像操作實現(xiàn)了二值圖像的數(shù)學(xué)形態(tài)算法。MATLAB預(yù)

50、定義的形態(tài)學(xué)操作有二值圖像的腐蝕、膨脹,開運算、閉運算等數(shù)學(xué)形態(tài)學(xué)算法和對象標(biāo)識和測量算法。同時還提供了灰度圖像的形態(tài)學(xué)變換,包括Top-hat變換,Watershed等。第四章 圖像分割的概念和算法的研究圖像分割(Image Segmentation)是把圖像分割成若干個特定的、具有獨特性質(zhì)的區(qū)域并提取出感興趣的目標(biāo)的技術(shù)和過程。在對圖像的研究和應(yīng)用中,人們往往僅對圖像的某些部分感興趣(目標(biāo)或背景),他們一般對應(yīng)圖像中的特定的、具有獨特性質(zhì)的區(qū)域。為了分析和識別目標(biāo),需要將他們分割并提取出來。圖像分割是由圖像處理轉(zhuǎn)到圖像分析的關(guān)鍵。一方面,它是目標(biāo)圖像表達(dá)的基礎(chǔ),對特征測量有重要的影響。另一

51、方面,圖像分割和分割的目標(biāo)表達(dá)、特征提取和參數(shù)測量等將原始圖像轉(zhuǎn)化為數(shù)學(xué)表達(dá)形式,使得利用計算機(jī)進(jìn)行圖像分析和理解成為可能。本章主要介紹圖像分割的基本概念和分割所用的主要方法。4.1圖像分割的基本概念4.1.1圖像分割定義有關(guān)圖像分割的解釋和表述很多,借助于集合概念對圖像分割可以給出如下比較正式的定義:令集合R代表整幅圖像的區(qū)域,對R的分割可看成將個滿足以下5個條件的非空子集(子區(qū)域):;對所有的i和j,有ij, ;對i=1,2,N,有P()=True;對ij,P()=False;i=1,2, ,N, 是連通的區(qū)域。其中P()是對所有在集合中元素的邏輯謂詞,代表空集。下面先對上述各個條件分別給

52、予簡略解釋。條件指出對一幅圖像所得的全部子區(qū)域的綜合(并集)應(yīng)能包括圖像中所有像素(就是原圖像),或者說分割應(yīng)將圖像的每個像素都分進(jìn)某個區(qū)域中。條件指出在分割結(jié)果中各個子區(qū)域是互不重疊的,或者說在分割結(jié)果中一個像素不能同時屬于兩個區(qū)域。條件指出在分割結(jié)果中每個子區(qū)域都有獨特的特性,或者說屬于同一個區(qū)域中的像素應(yīng)該具有某些相同特性。條件指出在分割結(jié)果中,不同的子區(qū)域具有不同的特性,沒有公共元素,或者說屬于不同區(qū)域的像素應(yīng)該具有一些不同的特性。條件要求分割結(jié)果中同一個子區(qū)域內(nèi)的像素應(yīng)當(dāng)是連通的,即同一個子區(qū)域的兩個像素在該子區(qū)域內(nèi)互相連通,或者說分割得到的區(qū)域是一個連通組元。另外,上述這些條件不僅

53、定義了分割,也對進(jìn)行分割有指導(dǎo)作用。對圖像的分割總是根據(jù)一些分割準(zhǔn)則進(jìn)行的。條件與條件說明正確的分割準(zhǔn)則應(yīng)可適用于所有區(qū)域和所有像素,而條件和條件說明合理的分割準(zhǔn)則應(yīng)能幫助確定各區(qū)域像素有代表性的特性,條件說明完整的分割準(zhǔn)則應(yīng)直接或間接地對區(qū)域內(nèi)像素的連通性有一定的要求或限定。最后需要指出,實際應(yīng)用中圖像分割不僅要把一幅圖像分成滿足上面5個條件的各具特性的區(qū)域而且需要把其中感興趣的目標(biāo)區(qū)域提取出來。只有這樣才算真正完成了圖像分割的任務(wù)。4.1.2圖像分割算法分類圖像分割算法的研究一直受到人們的高度重視,到目前為止,提出的分割算法已經(jīng)多達(dá)上千種,由于現(xiàn)有的分割算法粉腸多,所以將它們進(jìn)行分類的方法

54、也提出了不少。例如有把分割算法分成3類的:邊緣檢測、閾值分割和區(qū)域生長。但事實上閾值分割算法分割的方法在本質(zhì)上也是一種區(qū)域提取方法,所以實際上包含了。本章從實際應(yīng)用的角度考慮,詳細(xì)介紹了圖像分割的如下算法:分割檢測、閾值分割、區(qū)域生長等。4.2邊緣檢測方法4.2.1邊緣檢測概述邊緣(Edge)是指圖像局部亮度變化最顯著的部分。邊緣主要存在于目標(biāo)、目標(biāo)與背景、區(qū)域與區(qū)域(包括不同色彩)之間,是圖像分割、紋理特征提取和形狀特征提取等圖像分析的重要基礎(chǔ)。圖像分析和理解的第一步常常是邊緣檢測(Edge Detection)。由于邊緣檢測十分重要,因此成為機(jī)器視覺研究領(lǐng)域最活躍的課題之一。本節(jié)主要討論邊

55、緣檢測和定位的基本概念,并通過幾種常用的邊緣檢測器來說明邊緣檢測的基本問題。圖像中的邊緣通常與圖像亮度或圖像亮度的一階導(dǎo)數(shù)的不連續(xù)性有關(guān)。圖像亮度的不連續(xù)可分為:階躍不連續(xù),即圖像亮度在不連續(xù)處的兩邊的像素灰度值有著顯著的差異:線條不連續(xù),即圖像亮度從一個值變化到另一個值,保持一個較小的行程后又返回到原來的值。在實際中,階躍和線條邊緣圖像是很少見的,由于大多數(shù)傳感元件具有低頻特性,使得階躍邊緣變成斜坡型邊緣,線條邊緣變成屋頂形邊緣,其中的亮度變化不是瞬間的,而是跨越一定的距離。對一個邊緣來說,有可能同時具有階躍和線條特性。例如在一個表面上,由一個平面變化到法線方向不同的另一個平面就會產(chǎn)生階躍邊

56、緣;如果這一表面具有鏡面反射特性且兩平面形成的棱角比較圓滑,則當(dāng)棱角圓滑表面的法線經(jīng)過鏡面反射角時,由于鏡面反射分量,在棱角圓滑表面上會產(chǎn)生明亮光條,這樣的邊緣看起來像在階躍邊緣上疊加了一個線條邊緣。由于邊緣可能與場景中物體的重要特性對應(yīng),所以它是很重要的圖像特征。比如,一個物體的輪廓通常產(chǎn)生階躍邊緣,因為物體的圖像亮度不同于背景的圖像亮度。在討論邊緣算子之前,首先給出下列術(shù)語的定義。邊緣點:圖像中亮度顯著變化的點。邊緣段:邊緣點坐標(biāo)i,j及其方向的綜合,邊緣的方向是可以是梯度角。邊緣檢測器:從圖像中抽取邊緣(邊緣點或邊緣段)集合的算法。輪廓:邊緣列表,或是一條邊緣列表的曲線模型。邊緣連接:從

57、無序邊緣表形成有序邊緣表的過程。習(xí)慣上邊緣的表示采用順時針方向來排序。邊緣跟蹤:一個用來確定輪廓圖像(指濾波后的圖像)的搜索過程。邊緣點的坐標(biāo)可以是邊緣位置像素點的行、列整數(shù)標(biāo)號,也可以在子像素分辨率水平上表示。邊緣坐標(biāo)可以在原始圖像坐標(biāo)系上表示,但大多數(shù)情況下是在邊緣檢測濾波器的是輸出圖像的坐標(biāo)系上表示,因為濾波過程可能導(dǎo)致圖像坐標(biāo)平移或者縮放。邊緣段可以用像素點尺寸大小的小線段定義,或用具有方向?qū)傩缘囊粋€點定義。在實際應(yīng)用中,邊緣點和邊緣段都稱為邊緣。由于邊緣檢測器生成的邊緣集分成兩個:真邊緣和假邊緣集。真邊緣集對應(yīng)場景中的邊緣,假邊緣集不是場景中的邊緣。還有一個邊緣集,即場景中的漏邊緣集

58、。假邊緣集稱之為假陽性(False Positive),而漏掉的邊緣集則稱之為假陰性(False Negative)。邊緣連接和邊緣跟蹤之間的區(qū)別在于:邊緣連接是把邊緣檢測器產(chǎn)生的無序邊緣集作為輸出,輸入一個有序邊緣集;邊緣跟蹤則是將一幅圖像作為輸入,輸出一個有序邊緣集。另外,邊緣檢測使用局部信息來決定邊緣,而邊緣跟蹤使用整個圖像信息來決定一個像素點是不是邊緣。4.2.2邊緣檢測梯度算法a.梯度邊緣檢測算法基本步驟及流程圖梯度邊緣檢測算法有如下4個步驟。濾波:邊緣檢測算法主要是基于圖像強度的一階和二階導(dǎo)數(shù),但導(dǎo)數(shù)的計算對噪聲敏感,因此必須使用濾波器來改善與噪聲有關(guān)的邊緣檢測器的功能。需要指出的

59、是,大多數(shù)濾波器在降低噪聲的同時也導(dǎo)致了邊緣強度的損失,因此,增強邊緣和降低噪聲之間需要折中。增強:增強邊緣的基礎(chǔ)是確定圖像各點鄰域強度的變化值。增強算法可以將鄰域(或局部)強度值有顯著變化的點突顯出來。邊緣增強一般是通過計算梯度幅值來完成的。檢測:在圖像中有許多點的梯度幅值比較大,而這些點在特定的應(yīng)用領(lǐng)域中并不都是邊緣,所以應(yīng)該用某些方法來確定哪些點是邊緣帶內(nèi)。最簡單的邊緣檢測判據(jù)是梯度幅值閾值判據(jù)。定位:如果某一應(yīng)用場合要求來確定邊緣位置,則邊緣的位置可在子像素分辨率上來估計,邊緣的方位可以被估計出來。在邊緣檢測算法中,前3個步驟用得十分普遍。這是因為大多數(shù)場合下,僅僅需要邊緣檢測器指出邊

60、緣出現(xiàn)在圖像某一像素點的附近,而沒必要指出邊緣的精確位置或方向。在這本文主要討論常用的幾種邊緣檢測器,并調(diào)用其中的函數(shù)進(jìn)行邊緣檢測得出效果圖。效果圖讀入圖像圖4-1 梯度邊緣檢測流程圖 Prewitt算子檢測LoG算子檢測Canny算子檢測b.Robert算子Robert交叉算子為梯度幅值計算提供了一種簡單的近似方法: (4-1)用卷積模板表示方法,上式變成: (4-2)其中和由下面的模板(4-3)計算:0-110100-1= =在計算梯度時,計算空間同一位置(x,y)的真實偏導(dǎo)數(shù)非常重要。采用上述22鄰域模板計算的梯度近似值和并不位于同一位置,實際上是內(nèi)差點處的近似梯度,實際上是內(nèi)差點出的近

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論