版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、裝 訂 線裝訂裝訂線 本科生畢業(yè)論文(設(shè)計) 題目: 基于MATLAB的圖像分割研究 系 部 物理與電子工程系 專 業(yè) 電子信息工程學(xué) 號 姓 名 指導(dǎo)教師 2011年 5 月 19 日合肥師范學(xué)院2011屆本科生畢業(yè)論文(設(shè)計)裝 訂 線 PAGE III摘 要近年來,由于計算機技術(shù)的迅猛發(fā)展,計算機的速度越來越快,圖像處理系統(tǒng)的價格日益下降,從而使圖像處理得以廣泛應(yīng)用于眾多的科學(xué)與工程領(lǐng)域。自然景物一般由多個目標組成,這些目標反映在圖像中就是眾多的區(qū)域,每個區(qū)域可以理解成具有某種意義的最小單元。圖像分析中圖像分割的任務(wù)就是把圖像分成互不交疊的有意義的區(qū)域,以便進一步的處理、分析、應(yīng)用。本文
2、主要介紹圖像分割技術(shù),并相關(guān)算法實現(xiàn)。圖像分割是由圖像處理過渡到圖像分析的關(guān)鍵步驟,在圖像工程中占據(jù)重要的位置。本文針對當前主流的灰度圖像分割算法進行了分析、分類、歸納和總結(jié),并且應(yīng)用Matlab進行了仿真實驗,指出了各類方法的優(yōu)缺點,為人們在不同的應(yīng)用場合及不同的圖像數(shù)據(jù)條件下選擇不同的分割算法提供了一定的依據(jù)。關(guān)鍵詞:圖像工程 圖像分割 圖像邊緣檢測 計算機仿真ABSTRACTIn recent years, because of the rapid development of computer technology, the speed of computer is faster an
3、d faster, The price of image processing system as been increasingly declined, so image processing were widely used in many fields of science and engineering.The natural scenery is composed by multiple targets generally, these goals reflected in image are a lot of areas, and each area can be interpre
4、ted as the smallest unit of certain significance. The task of image segmentation is to fold each image into meaningful area, in order to further processing, analysis and applications. This paper mainly introduced image segmentation technology, and related algorithm.Image segmentation is the key step
5、s of the process of image processing transition to image analysis, play an important role in the image project. The current mainstream grayscale image segmentation algorithm is analyzed, classification, conclude and summarized in the paper, and the application of matlab simulation experiment, points
6、 out the advantages and disadvantages of various methods, provides certain basis for choosing different segmentation algorithm for people in different applications and different image data condition Key words:Image Engineering Image segmentation Edge Detection Computer Simulation目 錄TOC o 1-3 h u HYP
7、ERLINK l _Toc19425 一 Matlab簡介1 HYPERLINK l _Toc6609 1.1 MATLAB的概況1 HYPERLINK l _Toc439 1.2 MATLAB的語言特點1 HYPERLINK l _Toc7448 二 數(shù)字圖像基礎(chǔ)簡介3 HYPERLINK l _Toc14636 2.1 圖像的基本概念及其特點3 HYPERLINK l _Toc9212 2.2 圖像的格式3 HYPERLINK l _Toc18776 2.2.1 BMP圖像格式4 HYPERLINK l _Toc32528 2.2.2 JPEG圖像格式4 HYPERLINK l _Toc9
8、972 2.2.3 TIFF圖像格式4 HYPERLINK l _Toc25810 2.2.4 GIF圖像格式4 HYPERLINK l _Toc6278 2.2.5 PNG圖像格式5 HYPERLINK l _Toc19371 三 邊緣檢測6 HYPERLINK l _Toc17643 3.1 梯度算子6 HYPERLINK l _Toc26832 3.2 Laplacian算子6 HYPERLINK l _Toc14114 3.3 Log算子8 HYPERLINK l _Toc9053 3.4 Canny算子8 HYPERLINK l _Toc2439 四 圖像分割 PAGEREF _To
9、c2439 10 HYPERLINK l _Toc1317 4.1 圖像分割算法的定義與分類 PAGEREF _Toc1317 10 HYPERLINK l _Toc15334 4.2 基于閾值的分割 PAGEREF _Toc15334 11 HYPERLINK l _Toc16130 4.2.1 邊沿檢測算子 PAGEREF _Toc16130 11 HYPERLINK l _Toc4867 4.2.2 閾值分割 PAGEREF _Toc4867 13 HYPERLINK l _Toc17583 4.2.3 基于MATLAB的圖像分割研究 PAGEREF _Toc17583 14 HYPER
10、LINK l _Toc5520 五 總結(jié)與展望16 HYPERLINK l _Toc25714 結(jié) 束 語17 HYPERLINK l _Toc6568 致 謝18 PAGE 21一 Matlab簡介1.1 MATLAB的概況MATLAB是矩陣實驗室(MatrixLaboratory)之意。除具備卓越的數(shù)值計算能力外,它還提供了專業(yè)水平的符號計算,文字處理,可視化建模仿真和實時控制等功能。MATLAB的基本數(shù)據(jù)單位是矩陣,它的指令表達式與數(shù)學(xué),工程中常用的形式十分相似,故用MATLAB來解算問題要比用C,FORTRAN等語言完相同的事情簡捷得多.當前流行的MATLAB包括擁有數(shù)百個內(nèi)部函數(shù)的主
11、包和三十幾種工具包(Toolbox).工具包又可以分為功能性工具包和學(xué)科工具包.功能工具包用來擴充MATLAB的符號計算,可視化建模仿真,文字處理及實時控制等功能.學(xué)科工具包是專業(yè)性比較強的工具包,控制工具包,信號處理工具包,通信工具包等都屬于此類.開放性使MATLAB廣受用戶歡迎.除內(nèi)部函數(shù)外,所有MATLAB主包文件和各種工具包都是可讀可修改的文件,用戶通過對源程序的修改或加入自己編寫程序構(gòu)造新的專用工具包.1.2 MATLAB的語言特點一種語言之所以能如此迅速地普及,顯示出如此旺盛的生命力,是由于它有著不同于其他語言的特點,正如同F(xiàn)ORTRAN和C等高級語言使人們擺脫了需要直接對計算機硬
12、件資源進行操作一樣,被稱作為第四代計算機語言的MATLAB,利用其豐富的函數(shù)資源,使編程人員從繁瑣的程序代碼中解放出來。MATLAB最突出的特點就是簡潔。MATLAB用更直觀的,符合人們思維習慣的代碼,代替了C和FORTRAN語言的冗長代碼。MATLAB給用戶帶來的是最直觀,最簡潔的程序開發(fā)環(huán)境。以下簡單介紹一下MATLAB的主要特點1。1. 語言簡潔緊湊,使用方便靈活,庫函數(shù)極其豐富。MATLAB程序書寫形式自由,利用起豐富的庫函數(shù)避開繁雜的子程序編程任務(wù),壓縮了一切不必要的編程工作。由于庫函數(shù)都由本領(lǐng)域的專家編寫,用戶不必擔心函數(shù)的可靠性??梢哉f,用MATLAB進行科技開發(fā)是站在專家的肩膀
13、上。更為難能可貴的是,MATLAB甚至具有一定的智能水平,所以用戶根本不用懷疑MATLAB的準確性。2. 運算符豐富。由于MATLAB是用C語言編寫的,MATLAB提供了和C語言幾乎一樣多的運算符,靈活使用MATLAB的運算符將使程序變得極為簡短。 3. MATLAB既具有結(jié)構(gòu)化的控制語句(如for循環(huán),while循環(huán),break語句和if語句),又有面向?qū)ο缶幊痰奶匦浴?4. 程序限制不嚴格,程序設(shè)計自由度大。例如,在MATLAB里,用戶無需對矩陣預(yù)定義就可使用。 5. 程序的可移植性很好,基本上不做修改就可以在各種型號的計算機和操作系統(tǒng)上運行。 6. MATLAB的圖形功能強大。在FORT
14、RAN和C語言里,繪圖都很不容易,但在MATLAB里,數(shù)據(jù)的可視化非常簡單。MATLAB還具有較強的編輯圖形界面的能力。 7. MATLAB的缺點是,它和其他高級程序相比,程序的執(zhí)行速度較慢。由于MATLAB的程序不用編譯等預(yù)處理,也不生成可執(zhí)行文件,程序為解釋執(zhí)行,所以速度較慢。 8. 功能強大的工具箱是MATLAB的另一特色。MATLAB包含兩個部分:核心部分和各種可選的工具箱。核心部分中有數(shù)百個核心內(nèi)部函數(shù)。其工具箱又分為兩類:功能性工具箱和學(xué)科性工具箱。功能性工具箱主要用來擴充其符號計算功能,圖示建模仿真功能,文字處理功能以及與硬件實時交互功能。功能性工具箱用于多種學(xué)科。而學(xué)科性工具箱
15、是專業(yè)性比較強的,如control,toolbox,signl proceessing toolbox,commumnication toolbox等1。這些工具箱都是由該領(lǐng)域內(nèi)學(xué)術(shù)水平很高的專家編寫的,所以用戶無需編寫自己學(xué)科范圍內(nèi)的基礎(chǔ)程序,而直接進行高,精,尖的研究。 9. 源程序的開放性。開放性也許是MATLAB最受人們歡迎的特點。除內(nèi)部函數(shù)以外,所有MATLAB的核心文件和工具箱文件都是可讀可改的源文件,用戶可通過對源文件的修改以及加入自己的文件構(gòu)成新的工具箱。二 數(shù)字圖像基礎(chǔ)簡介圖像處理的首要一步,就是要了解圖像的基本性質(zhì)與特點。只有充分了解和掌握了所要處理得圖像的特點和性質(zhì),才能
16、在接下來的處理中根據(jù)圖像的特點獲取所需的信息,并對其進行相應(yīng)的處理。本章將介紹數(shù)字圖像的基礎(chǔ)知識,以及圖像在計算機處理中的信息表達形式,并對幾種常用的圖像文件格式Bmp, Jpeg以及Png等做簡要的介紹。2.1 圖像的基本概念及其特點 要對圖像進行處理,必須清楚圖像的概念。一般來說,二維或三維景物呈現(xiàn)在人眼中的樣子就是圖像。圖像具有以下三個方面的特點:像帶有大量的信息,一幅圖像頂?shù)蒙锨а匀f語;圖像種類繁多,包括照片、繪圖視頻圖像等;類從外界獲得的大部分信息來自視覺系統(tǒng)。人們看到的任何自然界的圖像都是連續(xù)的模擬圖像。其形狀和形態(tài)表現(xiàn)由圖像各位置的顏色來決定。可以用表示一幅模擬圖像,其中x, y
17、表示空間坐標點的位置,表示圖像在點(x, y)的某種性質(zhì)的數(shù)值,如亮度、顏色等,、x、y可以是任意的實數(shù)。而把連續(xù)空間的圖像在坐標空間(X, Y)和性質(zhì)空間F都離散化,以便于計算機進行加工處理的離散化的圖像則稱為數(shù)字圖像。數(shù)字圖像用來表示,其中:為行,為列,表示空間離散點的坐標,I表示離散化的圖像f。I, r, c都是整數(shù)1。實際中仍習慣用表示數(shù)字圖像。圖像存儲畫面的形式為柵格結(jié)構(gòu):即將圖像劃分為均勻分布的柵格(像素),顯式的記錄每一像素的亮度和顏色;而將像素的坐標值規(guī)則地隱含起來,其位置排列規(guī)則,通常為矩形排列。2.2 圖像的格式組成數(shù)字圖像的基本單位稱為像素(Pixel),把像素按不同的方
18、式進行組織和存儲,就得到不同的圖像格式;把圖像數(shù)據(jù)存為文件就得到圖像文件。圖像文件按其格式的不同一般具有不同的擴展名。常用的圖像文件格式有位圖文件、JPEG文件、GIF文件、PNG文件等。每一種格式都有它的特點和用途,在選擇輸出的圖像文件格式時,應(yīng)考慮圖像的應(yīng)用目的以及圖像文件格式對圖像數(shù)據(jù)類型的要求。下面我們介紹幾種常用的圖像文件格式及其特點。2.2.1 BMP圖像格式這是一種DOS和Windows兼容計算機系統(tǒng)的標準圖像格式。BMP格式支持索引色、灰度等色彩模式。圖像存儲為BMP格式時,每一個像素所占的位數(shù)可以是1位、4位、8位或32位,相對應(yīng)的顏色數(shù)也從黑白一直到真彩色。對于使用Wind
19、ows格式的4位和8位圖像,可以指定采用RLE壓縮。BMP圖像文件含文件頭、調(diào)色板數(shù)據(jù)和圖像數(shù)據(jù)三個層次。這種格式在PC機上應(yīng)用非常普遍。2.2.2 JPEG圖像格式JPEG是由聯(lián)合照片專家組(Joint Photo graphic Experts Group)開發(fā)的一種圖像文件格式。它采用有損壓縮方式去除冗余的圖像和彩色數(shù)據(jù),在獲取極高的壓縮率的同時也能展現(xiàn)十分豐富生動的圖像。也就是說,可以用較少的磁盤空間得到較好的圖像質(zhì)。另外,JPEG還是一種比較靈活的格式,當將圖像保存為JPEG格式時,允許用戶用不同的壓縮比例對文件進行壓縮,就是可以指定圖像的品質(zhì)和壓縮級別。2.2.3 TIFF圖像格式
20、TIFF文件主要由三部份組成,包括文件頭、標識信息區(qū)和圖像數(shù)據(jù)區(qū)。T工FF文件的圖像數(shù)據(jù)區(qū)以行掃描的方式存取圖像,存儲圖像前先將圖像分割成若干部分,壓縮后再存儲。存儲時,單色圖像一個字節(jié)存儲8個點,16色圖像一個字節(jié)2個點,而256色圖像就是一個字節(jié)存儲一個點。TIFF圖像格式是一種應(yīng)用非常廣泛的位圖圖像格式,幾乎被所有繪畫、圖像編輯和頁面排版應(yīng)用程序所支持。TIFF格式常常用于在應(yīng)用程序之間和計算機平臺之間交換文件。2.2.4 GIF圖像格式CIF是Graphics Interchange Format(圖形交換格式)的縮寫,是由ComputerServe公司推出的一種圖像格式。該種圖像格式
21、的特點是壓縮比高,可以極大地節(jié)省存儲空間。最初的GIF只是簡單的用來存儲單幅靜止圖像,后來可以同時存儲若干幅靜止圖像從而形成連續(xù)的動畫;同時,GIF格式支持透明背景,可以較好地與網(wǎng)頁背景融合在一起2。因此,GIF常常用于保存作為網(wǎng)頁數(shù)據(jù)進行傳輸?shù)膱D像文件,成為網(wǎng)絡(luò)和BBS上使用頻率較高的一種圖像文件格式。但是GIF最多只能處理256種色彩,不能用于存儲真彩色的圖像文件。2.2.5 PNG圖像格式這種格式稱為可移植網(wǎng)絡(luò)圖像文件格式(Portable Network Graphics),由Thomas Boutell, Tom Lan。等人提出并設(shè)計。其特點是:支持48位真彩色圖像、16位灰度圖像
22、和顏色索引數(shù)據(jù)圖像;主要面向網(wǎng)絡(luò)圖像傳輸和圖像編輯,其提供的二維交叉存儲機制使用戶在圖像網(wǎng)絡(luò)傳輸過程中能更快的觀察到接近真實的近似圖像;對用戶完全透明且無專利限制,用戶可以從Internet上隨時下載與PNG文件格式配套的圖像數(shù)據(jù)壓縮算法源程序代碼: 具有比GIF高5-20%的壓縮效率; 具有可擴展性。作為目前最不失真的圖像格式,PNG格式圖像吸取了GIF和JPEG二者的優(yōu)點。它可以把文件壓縮到極限以利于網(wǎng)絡(luò)傳輸,但由于采用無損壓縮方式來減少文件大小,PNG格式能保留所有與圖像品質(zhì)有關(guān)的信息。同時,PNG支持圖像背景透明,顯示速度快2。三 邊緣檢測圖像的邊緣信息是重要的圖像特征信息,因此邊緣檢
23、測的方法是圖像分析與識別領(lǐng)域中的一個十分引人關(guān)注的課題。所謂邊緣,是指其周圍像素灰度有變化的那些像素集合。圖像中目標邊緣是由灰度不連續(xù)反映的,邊緣的種類可以粗略的分為兩種:1.階躍性邊緣,它兩邊的像素的灰度值有顯著的不同。2.屋頂狀邊緣,它位于灰度值從增加到減少的變化轉(zhuǎn)折點。3.1 梯度算子 首先我想談?wù)剤鲞@個在物理學(xué)中非?;镜母拍?。我們所說的場是指取決于空間位置的一個量。最可能簡單的一種物理場是標量場,所謂標量場,是指每點僅有一個單獨數(shù)量一個標量所標志的那種場。當然這個數(shù)量還可隨時間而變,不過眼下我們還無需為此操心。我們將只談?wù)撛谀骋惶囟〞r刻,場看來是個什么樣子。作為標量場的一個例子,你可
24、以考慮一塊固體材料,其中某些地方受熱而另一些地方受冷,使得該物體的溫度以一種復(fù)雜方式逐點改變。于是溫度將是從某個迪卡爾坐標系上量得的代表空間每一位置的函數(shù)??梢姕囟仁且粯肆繄?。另一個常見的例子則是勢場。還有一種場叫做矢量場,意義也十分簡單。就是在空間每一點給出一個矢量,這個矢量逐點變化。作為一個例子,可考慮一個旋轉(zhuǎn)物體。在每點上物體中原子的速度便是位置函數(shù)的矢量。作為第二個例子,考慮在一塊材料中的熱流。如果某處的溫度高于另一處的,熱量就會從較熱處流至較冷處。在材料中的不同位置熱量將朝不同的方向流動,這一熱流就是一個矢量場2。當場隨時間變化時,可通過給出場對時間的微商來加以描述。我們希望也按同樣
25、辦法來描述場對空間的變化,因為對于例如或者相鄰兩點之間的溫度或者勢能關(guān)系我們是感興趣的。值得注意的是,對任一標量場,由于有這三種微商,而我們又知道要形成一個矢量需要三個數(shù)量,也許這三個微商就是一個矢量的分量2!3.2 Laplacian算子Laplacian 算子是n維歐幾里德空間中的一個二階微分算子,定義為梯度的散度。因此如果f是二階可微的實函數(shù),則f的拉普拉斯算子定義為:(1) f的拉普拉斯算子也是笛卡兒坐標系xi中的所有非混合二階偏導(dǎo)數(shù):(2) 作為一個二階微分算子,拉普拉斯算子把C函數(shù)映射到C函數(shù),對于。表達式(1)(或(2))定義了一個算子 : C(R) C(R),或更一般地,定義了
26、一個算子 : C() C(),對于任何開集2。對于階躍狀邊緣,魂不附體導(dǎo)數(shù)在邊緣點出現(xiàn)零交叉,即邊緣點兩旁二階導(dǎo)數(shù)取異號。據(jù)此,對數(shù)字圖像的每個像素,取它關(guān)于x軸方向和y軸方向的二階差分之和。函數(shù)的拉普拉斯算子也是該函數(shù)的黑塞矩陣的跡,可以證明,它具有各向同性,即與坐標軸方向無關(guān),坐標軸旋轉(zhuǎn)后梯度結(jié)果不變。如果鄰域系統(tǒng)是4 鄰域,Laplacian 算子的模板為:0101-41010如果鄰域系統(tǒng)是8 鄰域,Laplacian 算子的模板為:1111-81111前面提過,Laplacian 算子對噪聲比較敏感,所以圖像一般先經(jīng)過平滑處理,因為平滑處理也是用模板進行的,所以,通常的分割算法都是把L
27、aplacian 算子和平滑算子結(jié)合起來生成一個新的模板。結(jié)果對比如圖3-1。HYPERLINK /image/7787b9ef4eda652dfcfa3c5aHYPERLINK /image/54baacfb69d495194e4aea5b圖 3-1對比結(jié)果HYPERLINK /image/54baacfb69d495194e4aea5b3.3 Log算子由于噪聲點(灰度與周圍點相差很大的象素點)對邊緣檢測有一定的影響所以效果更好的邊緣檢測器是LOG算子,也就是Laplacian-Gauss算子。它把的Gauss平滑濾波器和Laplacian銳化濾波器結(jié)合了起來,先平滑掉噪聲,再進行邊緣檢測
28、,所以效果會更好。常用的LOG算子是55的模板到中心的距離與位置加權(quán)系數(shù)的關(guān)系曲線象墨西哥草帽的剖面,所以LOG算子也叫墨西哥草帽濾波器。3.4 Canny算子坎尼(Canny)邊緣檢測算子在灰度圖像中得到廣泛應(yīng)用。根據(jù)邊緣檢測的有效性和定位的可靠性,坎尼研究了最優(yōu)邊緣檢測器所需的特性,推導(dǎo)出最優(yōu)邊緣檢測器的數(shù)學(xué)表達式。對于各種類型的邊緣,坎尼邊緣檢測算子的最優(yōu)形式是不同的。坎尼推導(dǎo)的一維邊緣檢測器與一維M-H邊緣檢測器幾乎是一樣的,因為一階導(dǎo)數(shù)算子的最大值和M-H算子的零交叉是一致的3。然而,在二維情況下,坎尼算子的方向性質(zhì)使邊緣檢測和定位性能比M-H算子要好,具有更好的邊緣強度估計,而且能
29、產(chǎn)生邊緣梯度方向和強度兩個信息,為后續(xù)提供了方便??材峤o出了評價邊緣檢測性能優(yōu)劣的三個指標:好的信噪比,即將非邊緣點判為邊緣點的概率要低,將邊緣點判為非邊緣點的概率要低;好的定位性能,即檢測出的邊緣點要盡可能在實際邊緣的中心;對單一邊緣僅有唯一響應(yīng),即單個邊緣產(chǎn)生多個響應(yīng)的概率要低,并且虛假邊緣響應(yīng)應(yīng)得到最大抑制。坎尼首次將上述判據(jù)用數(shù)學(xué)的形式表示出來,然后采用最優(yōu)化數(shù)值方法,得到了對應(yīng)給定邊緣類型的最佳邊緣檢測模板。對于二維圖像,需要使用若干方向的模板分別對圖像進行卷積處理,再取最可能的邊緣方向。坎尼的分析針對的是一維邊緣,對于階躍形的邊緣,坎尼推導(dǎo)出的最優(yōu)邊緣檢測器的形狀與高斯函數(shù)的一階導(dǎo)
30、數(shù)類似,利用二維高斯函數(shù)的圓對稱性和可分解性,我們可以很容易計算高斯函數(shù)在任一方向上的方向?qū)?shù)與圖像的卷積。因此,在實際應(yīng)用中可以選取高斯函數(shù)的一階導(dǎo)數(shù)作為階躍形邊緣的次最優(yōu)檢測算子4。下面推導(dǎo)二維次最優(yōu)階躍邊緣檢測算子的數(shù)學(xué)表達式。設(shè)二維高斯函數(shù)為 (1)在某一方向n上 (2)式中 是方向矢量,是梯度矢量。我們將圖像與作卷積,同時改變的方向,取得最大值時的就間下交于檢測邊緣的方向。Canny所提出的邊緣檢測方法類似于Marr邊緣檢測方法,也是屬于先平滑然后求導(dǎo)數(shù)的方法。Canny方法8由下列步驟實現(xiàn):圖像平滑Canny建議用以下的高斯函數(shù)進行圖像平滑高斯函數(shù): (3)圖像卷積: (4)其中:
31、是一個尺度參數(shù),越小,則函數(shù)越“集中”,即僅在一個很小的局部范圍內(nèi)平滑,越大,則表示圖像在一個較大的范圍內(nèi)進行平滑,I(x,y)為原始圖像5。2邊緣點定位Canny指出用梯度方向的二階導(dǎo)數(shù)的零交叉作為判別邊緣點的準則。若該點滿足下列條件,則該點為邊緣點: (5)其中:為平滑的梯度方向: (6)3邊緣強度若某像素滿足邊緣定位條件,則該像素的邊緣強度為: (7)四 圖像分割4.1 圖像分割算法的定義在圖像的研究和應(yīng)用中,人們往往只對一幅圖像中的某些部分感興趣,這些感興趣的部分一般對應(yīng)圖像中特定的、具有特殊性質(zhì)的區(qū)域(可以對應(yīng)單個區(qū)域,也可以對應(yīng)多個區(qū)域),稱之為目標或前景;而其它部分稱為圖像的背景
32、。為了辨識和分析目標,需要把目標從一幅圖像中孤立出來,這就是圖像分割要研究的問題。所謂圖像分割,從廣義上來講,是根據(jù)圖像的某些特征或特征集合(包括灰度、顏色、紋理等)的相似性準則對圖像象素進行分組聚類,把圖像平面劃分成若干個具有某些一致性的不重疊區(qū)域。這使得同一區(qū)域中的象素特征是類似的,即具有一致性;而不同區(qū)域間象素的特征存在突變,即具有非一致性。從集合的角度出發(fā),圖像分割定義設(shè)整個圖像空間為一集合R 6。根據(jù)選定的一致性準則P ,R 被劃分為互不重疊的非空子集(或子區(qū)域):R1, R2,L, Rn,這些子集必須滿足下述條件(1) R為互不重疊的非空子集(或子區(qū)域)(2) 對于所有的i和j ,
33、當,p=空集(3) P(Ri) = True ,對所有的i(4) 所有;Ri ,Rj相鄰,(5) 對i =1,2,L,n, Ri是連通區(qū)域其中:P(Ri)為作用于Ri 中所有象素的形似性邏輯謂詞,i, j =1,2,L,n。上述條件(1)指出分割后的全部子區(qū)域的總和應(yīng)包含圖像中的所有元素,或者說分割應(yīng)將圖像中每個象素都分進一個子區(qū)域中。(2)指出各個子區(qū)域相互不重疊。(3)指出分割后得到的屬于同一區(qū)域中的元素應(yīng)該具有某種相同特性。(4)指出對于分割后得到的屬于相鄰兩個區(qū)域中的元素具有某種不同的特性。(5)要求同一個子區(qū)域內(nèi)的元素應(yīng)當是連通的。其中分割準則P 適用于所有象素,由它來確定各區(qū)域元素
34、的相同特性。上述數(shù)學(xué)條件說明了圖像分割算法的一些特點,凡不符合以上特點的圖像處理算法則不能稱為圖像分割算法。目前,在己提出的多種類型的分割算法中,大致可以分為基于邊緣檢測的方法和基于區(qū)域的方法。而在實際應(yīng)用中,這些方法主要又可劃分為三種類型: 邊緣檢測型、閾值型和區(qū)域跟蹤型7。本文的討論正是基于閾值型圖像分割方法展開的。4.2 基于閾值的分割4.2.1 邊沿檢測算子經(jīng)典的邊緣提取方法是考察圖像的每個像素在某個鄰域內(nèi)灰度的變化,利用邊緣鄰近一階或二階方向?qū)?shù)變化規(guī)律,用簡單的方法檢測邊緣,這種方法稱為邊緣檢測局部算子法。邊緣檢測的基本思想是通過檢測每個像元和其鄰域的狀態(tài),以決定該像元是否位于一個
35、物體的邊界上。如果每一個像元位于一個物體的邊界上,則其鄰域像元灰度值的變化就比較大。假如可以應(yīng)用某種算法檢測出這種變化并進行量化表示,那么就可以確定物體的邊界6。常用的邊緣檢測算子主要有:索貝爾(Sobel)邊緣算子、羅伯特(Roberts)邊緣算子、Prewitt邊緣算子、拉普拉斯(Laplacian)邊緣算子、高斯-拉普拉斯(Laplacian of Gaussian)邊緣算子和坎尼(Canny)邊緣算子8。1、索貝爾(Sobel)邊緣算子。索貝爾算子是一組方向算子,從不同的方向檢測邊緣。索貝爾算子不是簡單求平均再差分,而是加強了中心像素上下左右四個方向像素的權(quán)重,運算結(jié)果是一幅邊緣圖像。
36、該算子通常有下列計算公式表示: (8) (9) (10)式中、分別表示x方向和y方向的一階微分,為Sobel算子的梯度,是具有整數(shù)像素坐標的輸入圖像。求出梯度后,可設(shè)定一個常數(shù),當時,標出該點為邊界點,其像素值設(shè)定為0,其它的設(shè)定為255,適當調(diào)整常數(shù)的大小來達到最佳效果。索貝爾(Sobel)算子通常對灰度漸變和噪聲較多的圖像處理得較好8。2、Prewitt邊緣算子。Prewitt邊緣算子是一種邊緣樣板算子,利用像素點上下、左右鄰點灰度差,在邊緣處達到極值檢測邊緣,對噪聲具有平滑作用。由于邊緣點像素的灰度值與其鄰域點像素的灰度值有顯著不同,在實際應(yīng)用中通常采用微分算子和模板匹配方法檢測圖像的邊
37、緣7。該算子通常有下列計算公式表示: (11) (12) (13)式中、分別表示x方向和y方向的一階微分,為Prewitt算子的梯度,是具有整數(shù)像素坐標的輸入圖像,。求出梯度后,可設(shè)定一個常數(shù),當時,標出該點為邊界點,其像素值設(shè)定為0,其它的設(shè)定為255,適當調(diào)整常數(shù)的大小來達到最佳效果9。Prewitt算子不僅能檢測邊緣點,而且能抑制噪聲的影響,因此對灰度和噪聲較多的圖像處理得較好。3、坎尼(Canny)邊緣算子??材崴阕邮且活愖顑?yōu)邊緣檢測算子,它在許多圖像處理領(lǐng)域得到了廣泛應(yīng)用。Canny考核邊緣檢測算子的指標是:(1)低誤判率,即盡可能地把邊緣點誤認為是非邊緣點;(2)高定位精度,即準確
38、地把邊緣點定位在灰度變化最大的像素上;(3)抑制虛假邊緣9。Canny從這三項指標出發(fā),推導(dǎo)出了最佳邊緣檢測算子-Canny邊緣算子。該算子的基本思想是:先對處理的圖像選擇一定的Guass濾波器進行平滑濾波,抑制圖像噪聲;然后采用一種稱之為“非極值抑制”(Nonmaxima Suppression)的技術(shù),細化平滑后的圖像梯度幅值矩陣,尋找圖像中的可能邊緣點;最后利用雙門限檢測通過雙閾值遞歸尋找圖像邊緣點,實現(xiàn)邊緣提取。Canny方法也使用拉普拉斯算子,該方法與其它邊緣檢測方法的不同之處在于,它使用2種不同的閾值分別檢測強邊緣和弱邊緣,并且僅當弱邊緣與強邊緣相連時才將弱邊緣包含在輸出圖像中,因
39、此這種方法較其它方法而言不容易被噪聲“填充”,更容易檢查出真正的弱邊緣。4、羅伯特(Roberts)邊緣算子。羅伯特(Roberts)邊緣算子是一種斜向偏差分的梯度計算方法,梯度的大小代表邊緣的強度,梯度的方向與邊緣走向垂直。該算子通常有下列計算公式表示: (14)式中是具有整數(shù)像素坐標的輸入圖像,平方根運算使該處理類似于在人類視覺系統(tǒng)中發(fā)生的過程,羅伯特(Roberts)操作實際上是求旋轉(zhuǎn)45兩個方向上微分值的和。羅伯特(Roberts)邊緣算子定位精度高,在水平和垂直方向效果較好,但對噪聲敏感。4.2.2 閾值分割1、自適應(yīng)閾值。在許多的情況下,背景的灰度值并不是常數(shù)。物體和背景的對比度在
40、圖像中也有變化。這時,一個在圖像中某一區(qū)域效果良好的閾值在其它區(qū)域卻可能效果很差。在這種情況下,把灰度閾值取成一個隨圖像中位置緩慢變化的函數(shù)值是適宜的。2、分水嶺算法。圖4-2說明了這種方法的工作機理。假定圖中的物體灰度值低,而背景的灰度值高。該圖顯示了沿一條掃描線的灰度分布,該線穿過兩個靠得很近的物體。圖 4-1分水嶺算祛圖像最初在一個低灰度值上二值化。該灰度值把圖像分割成正確數(shù)目的物體,但它們的邊界偏向物體內(nèi)部。隨后閾值逐漸增加,每一次增加一個灰度級。物體的邊界將隨著四值增加而擴展。當邊界相互接觸時,這些物體并沒有合并。因此,這些初次接觸的點變成了相鄰物體間的最終邊界。這個過程在閾值達到背
41、景的灰度級之前終止11。也就是說,在被恰當分割的物體的邊界正確地確定時終止。分水嶺算法不是簡單地將圖像在最佳灰度級進行閾值處理,而是從一個偏低但仍然能正確分割各個物體的閾值開始。然后隨著閾值逐漸上升到最佳值,使各個物體不會被合并。這個方法可以解決那些由于物體靠得太近而不能用全局閾值解決的問題。只要也只有所采用最初的閾值進行分割的結(jié)果是正確的,那么,最后的分割也是正確的12。也就是說,圖像中每個實際物體都有相應(yīng)的邊界。最初和最終的閾值灰度級都必須很好地選取。如果初始的閾值太低,那么低對比度的物體開始時會被丟失,然后隨著閾值的增加就會和相鄰的物體合并。如果初始閾值太高,物體一開始便會被合井。最終的
42、閾值決定了最后的邊界與實際物體的吻合程度。這一章中討論的閾值選擇方法在確定這兩個值時很有用13。4.2.3 基于MATLAB的圖像分割研究本文利用MATLAB軟件開了一個GUI平臺,該平臺融合了邊緣檢測和閾值分割的相關(guān)算法。該平臺運行時程序主界面如下所示:最左邊是顯示的是原始的圖像,下方是按鈕,可以選擇引入圖片,以及退出該程序。 圖 4-2GUI主界面當導(dǎo)入圖片之后,可以通過鼠標來選擇相應(yīng)的算法,之后算法開始運行,運行結(jié)束之后可以在對應(yīng)的效果。 圖 4-3GUI運行下的主界面圖像分割與測量是圖像識別工作的基礎(chǔ),圖像分割將圖像分為一些有意義的區(qū)域,如何選取閾值是圖像能否正確分割的關(guān)鍵,本文介紹了
43、閾值選取和邊緣檢測的方法。并對相關(guān)的邊緣檢測和閾值分割算法進行了仿真10。五 總結(jié)與展望5.1 總結(jié)圖像分割是圖像處理的一個極其重要的部分,在實際生活中已得到了廣泛的應(yīng)用,并涉及各種類型的圖像,包括工業(yè),精密儀器等,農(nóng)業(yè),醫(yī)學(xué)醫(yī)療。在這些應(yīng)用中,圖像分割通常是為了進一步對圖像進行分析、識別處理,分割的準確性直接影響后續(xù)任務(wù)的有效性和正確性,因此具有十分重要的意義。圖像分割就是將圖像分為各具特色的區(qū)域并提取出前景的技術(shù)和過程,通常前景的邊界是我們感興趣的對象,如果我們能檢測出這些邊緣,就可以提取出前景。這種基于邊緣的圖像分割,也被稱為邊緣檢測。5.2 展望本文對圖像分割中的一些問題進行了粗淺的討
44、論和嘗試,還有許多需要進一步改進的地方:1 噪聲問題一直是影響圖像分割質(zhì)量一個主要因素,平滑可以消除噪音,但是也會使邊界信息損失,小尺度的濾波器,有可能平滑不完全而留有太多的噪聲,大尺度濾波器在平滑相互鄰近的兩個邊緣時,可能會將它們連在一起,這樣只能檢測出一個邊緣。因此,在不知道物體尺度和位置的情況下,很難準確確定濾波器的尺度。使用多尺度濾波模板并在濾波器的不同尺度上分析邊沿特性的方法仍在研究中,這些方法的基本思想是,通過使用大尺度濾波模板產(chǎn)生精確定位邊緣的特性,來檢測出圖像的最佳邊緣。2 我們不能期望用一種檢測算子就能最佳檢測出發(fā)生在圖像上的所有特性變化。當需要提取不同特性變化的邊緣時,要考
45、慮多種算子的綜合應(yīng)用。3 在正確檢測邊緣的基礎(chǔ)上,要考慮精確定位的問題。由于圖像分割本身的重要性和難度的挑戰(zhàn)性,吸引了很多的學(xué)者和研究人員。圖像本身存在許多不確定性和不精確性,雖然幾乎自數(shù)字圖像處理問世不久就開始了圖像分割的研究,吸引了很多研究人員為之付出了巨大的努力,在不同的領(lǐng)域也取得了相當?shù)倪M展與成就,但是人們至今還一直在努力發(fā)展新的、更有潛力的分割算法,以期實現(xiàn)更通用、更完美的分割結(jié)果。結(jié) 束 語經(jīng)過這一學(xué)期的努力,將我這學(xué)期的成果都總價在了本論文中。在大學(xué)這幾年的學(xué)習中,使我積累了很多知識。為了對我大學(xué)所學(xué)知識有一個更好的了解和鞏固,特此,我選擇該題目作為我的畢業(yè)設(shè)計題目。該題目與我所
46、學(xué)的知識基本相吻合,可以檢測出我所學(xué)的知識是否到位,并且能了解我的掌握和運用情況。同時通過這個題目,自己的實踐動手、動筆能力得到鍛煉,增強了跨入社會去競爭,去創(chuàng)造的自信心。完成該設(shè)計也是從知識轉(zhuǎn)向能力的一個很好的過程,能讓我在其中發(fā)現(xiàn)自己的不足,哪些方面需要補充,哪些方面有待于強化,同時在自己動手制作的時候,能夠培養(yǎng)我嚴謹、認真工作的工作態(tài)度,這對我在社會生活中有著不可多得的幫助。在做這項畢業(yè)設(shè)計時,還使我掌握了文獻檢索、資料查詢的基本方法以及獲取新知識的能力。同時也訓(xùn)練和提高了我對MATLAB的圖像分割的認識。在畢業(yè)設(shè)計的最后所進行的答辯也能很好的培養(yǎng)我口述的能力,從而讓我進入社會需要這項能
47、力的時候,有著很好的自信心。更好的為個人職業(yè)規(guī)劃做好準備。致 謝經(jīng)過母校這些年來的文化熏陶,在校領(lǐng)導(dǎo)關(guān)心,老師的辛勤培育教導(dǎo)下,讓我掌握了知識技能,懂得了人生,使我的理想更遠大視野更開闊。正是在大學(xué)里學(xué)到的知識讓我在工作中給于我很大的幫助,讓我跟更加快速的解決工作中的問題。我要特別感謝指導(dǎo)老師周老師對我的幫助。正是周老師的指導(dǎo),使我能夠及時、順利地完成此次的畢業(yè)設(shè)計。同時,也要感謝我的老師和同學(xué)們及工作企業(yè)在本次畢業(yè)設(shè)計過程中給予我的支持和幫助。參考文獻1.劉剛.MATLAB數(shù)字圖像處理.北京:機械工業(yè)出版社,2010.5:47-49.2.李朝暉.數(shù)字圖像處理及應(yīng)用M.北京:機械工業(yè)出版社,2
48、004:14-15.3.朱秀昌,劉峰,胡棟.數(shù)字圖像處理與圖像通信M.北京:清華大學(xué)出版社,2006:23-24.4.張瑞豐.精通MATLAB 6.5M.北京:中國水利水電出版社,2004:35-36.5.高成,等. MATLAB數(shù)字圖像處理與應(yīng)用M.2版.北京:國防工業(yè)出版社,2007。45-476.王愛民,沈蘭蓀.圖像分割研究綜述J.測控技術(shù),2000,19(5):62-65.7.岳海萍.利用Mat lab進行數(shù)字圖像的邊緣檢測J.遼陽石油化工高等??茖W(xué)校學(xué)報.2002,18(4):3-5.8.趙榮椿,遲耀斌,朱重光.圖像分割技術(shù)進展J.中國體視學(xué)與圖像分析.1998,3(2):13-14
49、.9.XU Zhi-xing,DING Yun-liang. A method based on rough neural networks of rough set theoryJ. Nanjing University of Aeronautics and Astronautics Journal,2001,33(4):355358.10.許志興,丁運亮.一種基于粗糙集理論的粗糙神經(jīng)網(wǎng)絡(luò)構(gòu)造方法J.南京航空航天大學(xué)學(xué)報,2001,33(4):355358.11.LI Nian-you. Rough set theory and its application in image segmen
50、tationJ.Sanming Journal,2005,22(4):382385.12.李年攸.粗集理論在圖像分割中的應(yīng)用J.三明學(xué)院學(xué)報,2005,22(4):382385.13.Jelonek J. Rough set reduction of attri-butes and their domains for neural net-worksJ.Computational Intelligence,1995,11(2):339347.09/20 11:46 102機體齒飛面孔雙臥多軸組合機床及CAD設(shè)計09/08 20:02 3kN微型裝載機設(shè)計09/20 15:09 45T旋挖鉆機變
51、幅機構(gòu)液壓缸設(shè)計08/30 15:32 5噸卷揚機設(shè)計10/30 17:12 C620軸撥桿的工藝規(guī)程及鉆2-16孔的鉆床夾具設(shè)計09/21 13:39 CA6140車床撥叉零件的機械加工工藝規(guī)程及夾具設(shè)計83100308/30 15:37 CPU風扇后蓋的注塑模具設(shè)計09/20 16:19 GDC956160工業(yè)對輥成型機設(shè)計08/30 15:45 LS型螺旋輸送機的設(shè)計10/07 23:43 LS型螺旋輸送機設(shè)計09/20 16:23 P-90B型耙斗式裝載機設(shè)計09/08 20:17 PE10自行車無級變速器設(shè)計10/07 09:23 話機機座下殼模具的設(shè)計與制造09/08 20:20
52、T108噸自卸車拐軸的斷裂原因分析及優(yōu)化設(shè)計09/21 13:39 X-Y型數(shù)控銑床工作臺的設(shè)計09/08 20:25 YD5141SYZ后壓縮式垃圾車的上裝箱體設(shè)計10/07 09:20 ZH1115W柴油機氣缸體三面粗鏜組合機床總體及左主軸箱設(shè)計09/21 15:34 ZXT-06型多臂機凸輪軸加工工藝及工裝設(shè)計10/30 16:04 三孔連桿零件的工藝規(guī)程及鉆35H6孔的夾具設(shè)計08/30 17:57 三層貨運電梯曳引機及傳動系統(tǒng)設(shè)計10/29 14:08 上蓋的工工藝規(guī)程及鉆6-4.5孔的夾具設(shè)計10/04 13:45 五噸單頭液壓放料機的設(shè)計10/04 13:44 五噸單頭液壓放料機設(shè)計09/09 23:40 儀表外殼塑料模設(shè)計09/08 20:57 傳動蓋沖壓工藝制定及沖孔模具設(shè)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年樹木批發(fā)銷售協(xié)議規(guī)范格式
- 2024年度門衛(wèi)保安綜合服務(wù)協(xié)議
- 內(nèi)審工作目標
- 關(guān)于科技讓生活更美好的演講稿
- 2023年湖南省郴州市成考專升本高等數(shù)學(xué)二自考模擬考試(含答案)
- 南京信息工程大學(xué)《中國特色社會主義理論體系概論》2021-2022學(xué)年第一學(xué)期期末試卷
- 公務(wù)保障工作總結(jié)
- 二手房買賣2024詳盡協(xié)議要點
- 保險公司擔保的投資合同
- 儀器儀表制造業(yè)的競爭對手分析與戰(zhàn)略制定考核試卷
- 《設(shè)計制作-家用電器要維護(第1課時)》(說課稿)四年級上冊小學(xué)綜合實踐活動蘇少版
- 畢業(yè)設(shè)計(論文)-長鍵軸加工工藝及銑槽夾具設(shè)計
- 設(shè)備維保施工組織設(shè)計
- 2023年高中學(xué)業(yè)水平測試計算機考試操作練習題
- 醫(yī)院出入口安檢工作記錄表范本
- 婦科VTE防治小組成員及職責
- 《如何實現(xiàn)目標》
- 安徽壹石通化學(xué)科技有限公司年產(chǎn)5萬噸氫氧化鎂、5萬噸堿式碳酸鎂、1萬噸氧化鋯、1000噸硼酸鋅、1000噸五硼酸銨和100噸鈦酸鋇產(chǎn)品項目環(huán)境影響報告書
- 2020阿里云產(chǎn)品圖標
- GB/T 3499-2003原生鎂錠
- GB/T 12361-2016鋼質(zhì)模鍛件通用技術(shù)條件
評論
0/150
提交評論