第2章-數(shù)字圖像處理基礎(chǔ)_第1頁
第2章-數(shù)字圖像處理基礎(chǔ)_第2頁
第2章-數(shù)字圖像處理基礎(chǔ)_第3頁
第2章-數(shù)字圖像處理基礎(chǔ)_第4頁
第2章-數(shù)字圖像處理基礎(chǔ)_第5頁
已閱讀5頁,還剩40頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、數(shù)字圖像處理數(shù)字圖像處理2.1 數(shù)字圖像2.2 數(shù)字圖像處理與識別2.3 數(shù)字圖像處理的預(yù)備知識2.1 2.1 數(shù)字圖像數(shù)字圖像 2.1. 2.1.1 1 什么是數(shù)字圖像什么是數(shù)字圖像 (1 1)圖:是物體反射或者透射電磁波的分布。)圖:是物體反射或者透射電磁波的分布。 (2 2)像:是人的視覺系統(tǒng)對接收的圖信息在大腦中形成)像:是人的視覺系統(tǒng)對接收的圖信息在大腦中形成的印象。的印象。 (3 3)圖像:是)圖像:是“圖圖”和和“像像”的結(jié)合。具體來說,就是的結(jié)合。具體來說,就是用各種觀測系統(tǒng)以不同形式和手段觀測客觀世界而獲得的用各種觀測系統(tǒng)以不同形式和手段觀測客觀世界而獲得的、可以直接或間接作

2、用于人的視覺系統(tǒng)而產(chǎn)生的視知覺實、可以直接或間接作用于人的視覺系統(tǒng)而產(chǎn)生的視知覺實體。體。2.1 2.1 什么是數(shù)字圖像處理?什么是數(shù)字圖像處理? 2.1.2.1.1 1 什么是數(shù)字圖像什么是數(shù)字圖像 n數(shù)字圖像數(shù)字圖像是圖像的數(shù)字表示,像素是是圖像的數(shù)字表示,像素是其最小的單位。其最小的單位。n數(shù)字圖像的描述是指如何用一個數(shù)值數(shù)字圖像的描述是指如何用一個數(shù)值方式來表示一個圖像。方式來表示一個圖像。 2.1.2.1.1 1 什么是數(shù)字圖像什么是數(shù)字圖像 (4)(4)數(shù)字圖像就是能夠在計算機上顯示和處理的圖像。數(shù)字圖像就是能夠在計算機上顯示和處理的圖像。根據(jù)其特性可分為兩大類根據(jù)其特性可分為兩大

3、類位圖位圖和和矢量圖矢量圖。u 位圖通常用數(shù)字陣列位圖通常用數(shù)字陣列【像素像素】來表示,來表示,常見格式有常見格式有.bmp、.jpg、.gif 等等u 矢量圖由矢量數(shù)據(jù)庫矢量圖由矢量數(shù)據(jù)庫【數(shù)學(xué)矢量數(shù)學(xué)矢量】來表示,接觸較多來表示,接觸較多的的.png.png圖形圖形(5) 一幅圖像可定義為一個二維函數(shù)一幅圖像可定義為一個二維函數(shù)( , )f x y(6) MN的數(shù)字圖像由的數(shù)字圖像由 M 行行 N 列的有限元素組成,每個列的有限元素組成,每個元素都有特定的元素都有特定的位置和幅值位置和幅值,代表了其所在行列位置,代表了其所在行列位置上的圖像物理信息,如灰度和色彩等。上的圖像物理信息,如灰度

4、和色彩等。(7) 這些元素稱為圖像元素或像素。這些元素稱為圖像元素或像素。(8) 圖像的兩個本質(zhì)屬性:圖像的兩個本質(zhì)屬性: 幅值幅值 f 、空間坐標(biāo)、空間坐標(biāo) (x , y) 2.1.1 什么是數(shù)字圖像什么是數(shù)字圖像n因為矩陣是二維的,所以可以用矩陣來描述因為矩陣是二維的,所以可以用矩陣來描述數(shù)字圖像。數(shù)字圖像。n描述數(shù)字圖像的矩陣目前采用的是描述數(shù)字圖像的矩陣目前采用的是整數(shù)陣整數(shù)陣,即每個像素的亮暗,用一個整數(shù)來表示。即每個像素的亮暗,用一個整數(shù)來表示。 2.1. 2.1.2 2 數(shù)字圖像的顯示數(shù)字圖像的顯示 2.1. 2.1.2 2 數(shù)字圖像的顯示數(shù)字圖像的顯示數(shù)字圖像數(shù)字圖像(位圖位圖

5、):f, x, y, 非負(fù)非負(fù) 有限有限 離散離散把連續(xù)的感知數(shù)據(jù)轉(zhuǎn)換為數(shù)把連續(xù)的感知數(shù)據(jù)轉(zhuǎn)換為數(shù)字形式字形式 : 對坐標(biāo)值進行數(shù)字化稱為對坐標(biāo)值進行數(shù)字化稱為采采樣樣對幅值數(shù)字化稱為對幅值數(shù)字化稱為量化量化 n1. 二值圖像 0表示黑色 1表示白色n2. 灰度圖像 灰度級 L=2k (k=8 L=256)n3. RGB彩色圖像 通過控制RGB三原色的合成比例可決定該像素最終顯示的顏色 2.1. 2.1.3 3 數(shù)字圖像的分類數(shù)字圖像的分類依據(jù)每個像素代表的信息的不同依據(jù)每個像素代表的信息的不同n灰度圖像是指每個像素的信息由一個量化的灰度級來描述的圖像,沒有彩色信息。1002202501805

6、01202001500I數(shù)字圖像的概念與描述數(shù)字圖像的概念與描述 彩色圖像彩色圖像n彩色圖像是指每個像素的信息由RGB三原色構(gòu)成的圖像,其中RGB是由不同的灰度級來描述的。n彩色圖像不能用一個矩陣來描述了,一般是用三個矩陣同時來描述。 黑色黑色 0 0 0 0 0 0 白色白色 255 255 255 255 255 255 紅色紅色 255 255 0 0 0 0 綠色綠色 0 0 255 255 0 0 藍(lán)色藍(lán)色 0 0 0 0 255 255 青色青色 0 0 255 255 255 255 品紅(紫色)品紅(紫色) 255 255 0 0 255 255 黃色黃色 255 255 25

7、5 255 0 0 灰色灰色 128 128 128 128 128 128 橄欖色橄欖色 128 128 128 128 0 0 深青色深青色 0 0 128 128 128 128 銀色銀色 192 192 192 192 192 192常用顏色的常用顏色的RGBRGB值組合值組合n在RGB圖像中每個像素都是用24位二進制數(shù)表示,故也稱為24位真彩色圖像。00255800255240240255R02550160255255801600G25525525524000160800Bn 4. 索引圖像索引圖像調(diào)色板調(diào)色板顏色查找表顏色查找表n1. 靜態(tài)圖像靜態(tài)圖像f(x,y)和動態(tài)圖像動態(tài)圖像

8、f(x,y,t)n2. 二維矩陣和二維數(shù)組【Matlab IPT】 2.1.4 2.1.4 數(shù)字圖像的實質(zhì)數(shù)字圖像的實質(zhì) 2.1. 2.1.5 5 數(shù)字圖像的表示數(shù)字圖像的表示“ f ”二值圖像的3種不同的表示方式: 離散點集 覆蓋區(qū)域 矩陣表達(dá) 2.1. 2.1.5 5 數(shù)字圖像的表示數(shù)字圖像的表示n矩陣是按照行列的順序來定位數(shù)據(jù)的,但是矩陣是按照行列的順序來定位數(shù)據(jù)的,但是圖像是在平面上定位數(shù)據(jù)的,所以有一個坐圖像是在平面上定位數(shù)據(jù)的,所以有一個坐標(biāo)系定義上的特殊性。標(biāo)系定義上的特殊性。n為了編程方便起見,這里以為了編程方便起見,這里以矩陣矩陣坐標(biāo)系來定坐標(biāo)系來定義義圖像的坐標(biāo)圖像的坐標(biāo)。

9、行(行(i i)列(列(j j)矩陣矩陣 A(A(i i, ,j j) )矩陣坐標(biāo)系矩陣坐標(biāo)系X X軸(軸(i i)Y Y軸(軸(j j)圖像圖像 f(f(i i, ,j j) )直角坐標(biāo)系直角坐標(biāo)系 2.1. 2.1.5 5 數(shù)字圖像的表示數(shù)字圖像的表示 2.1. 2.1.5 5 數(shù)字圖像的表示數(shù)字圖像的表示 “(x,y)”數(shù)字圖像的數(shù)字圖像的坐標(biāo)坐標(biāo)約定約定M M行行N N列列 10241024* *768768f(x,y)f(x,y)空間分辨率空間分辨率 M MN N ) 1, 1() 1 , 1() 0 , 1() 1, 1 () 1 , 1 () 0 , 1 () 1, 0 () 1

10、 , 0 () 0 , 0 (NMfMfMfNfffNfff),(yxf空間分辨率變化對圖像視覺效果的影響空間分辨率變化對圖像視覺效果的影響 2.1. 2.1.6 6 圖像的空間和灰度級分辨率圖像的空間和灰度級分辨率對坐標(biāo)值進行數(shù)字化稱為采樣采樣(a) (b) (c)(d) (e) (f)灰度分辨率變化對圖像視覺效果的影響灰度分辨率變化對圖像視覺效果的影響圖像的大小圖像的大小 比特數(shù)比特數(shù) bitbit b=M b=MN Nk k圖像的灰度級圖像的灰度級 階數(shù)階數(shù) L=2L=2k k 0 L-1 0 L-1 灰度級分辨率灰度級分辨率L=256=2L=256=28 8(a) (b) (c)(d)

11、 (e) (f)灰度分辨率變化對圖像視覺效果的影響示例灰度分辨率變化對圖像視覺效果的影響示例 對幅值數(shù)字化稱為量量化化?;叶确直媛视址Q為色階,是指圖像中可分辨的灰度級數(shù)目,L。n數(shù)字圖像處理是指使用電子計算機對量化的數(shù)字圖像進行處理,具體地說就是通過對圖像進行各種加工來改善圖像的外觀,是對圖像的修改和增強。n圖像處理的輸入是從傳感器或其他來源獲取的原始數(shù)字圖像,輸出是經(jīng)過處理后的輸出圖像。數(shù)字圖像處理數(shù)字圖像處理2.2.2 2 數(shù)字圖像數(shù)字圖像處理處理與識別與識別n數(shù)字圖像分析是指對圖像中感興趣的目標(biāo)進行檢測,以獲得可觀的信息。數(shù)字圖像分析通常是指將一幅圖像轉(zhuǎn)化為另一種圖像的抽象形式,例如圖像

12、中某物體與測量者的距離,目標(biāo)對象的計數(shù)或其尺寸等。n圖像分析的輸入是經(jīng)過處理的數(shù)字圖像,其輸出通常不再是數(shù)字圖像,而是一系列與目標(biāo)相關(guān)的圖像特征(目標(biāo)的描述),如目標(biāo)的長度、顏色、曲率和個數(shù)等。數(shù)字圖像分析數(shù)字圖像分析2.2.2 2 數(shù)字圖像數(shù)字圖像處理處理與識別與識別n數(shù)字圖像識別主要是研究圖像中各目標(biāo)的性質(zhì)和相互關(guān)系,識別出目標(biāo)對象的類別,從而理解圖像的含義。n圖像識別是圖像分析的延伸,它根據(jù)圖像分析中得到的相關(guān)描述(特征)對目標(biāo)進行歸類,輸出我們感興趣的目標(biāo)類別標(biāo)號信息(符號)。數(shù)字圖像識別數(shù)字圖像識別2.2.2 2 數(shù)字圖像數(shù)字圖像處理處理與識別與識別2.2.2.2.1 1 從圖像處理

13、到圖像識別從圖像處理到圖像識別2.2.2 2 數(shù)字圖像數(shù)字圖像處理處理與識別與識別 景物景物 光學(xué)圖像光學(xué)圖像 膠片圖像膠片圖像 數(shù)字圖像數(shù)字圖像 處理結(jié)果輸出處理結(jié)果輸出物物體體計算機計算機系系 統(tǒng)統(tǒng)顯 示 、顯 示 、打 印 、打 印 、記 錄 設(shè)記 錄 設(shè)備 或 機備 或 機械 執(zhí) 行械 執(zhí) 行機構(gòu)機構(gòu)數(shù)數(shù) 字字 攝攝 影影 機機圖像處理軟件圖像處理軟件專用圖像處理專用圖像處理硬件硬件視覺傳感器視覺傳感器機器視覺系統(tǒng)的一般架構(gòu)機器視覺系統(tǒng)的一般架構(gòu)2.2.2.2.2 2 什么是機器視覺什么是機器視覺計算機視覺?計算機視覺?n機器視覺就是用機器代替人眼來做測量和判斷。n機器視覺系統(tǒng)是指通過

14、視覺傳感器(即圖像采集裝置,分 CMOS 和CCD 兩種)將被攝取目標(biāo)轉(zhuǎn)換成圖像信號,傳送給專用的圖像處理系統(tǒng),根據(jù)像素分布和亮度、顏色等信息,轉(zhuǎn)變成數(shù)字化信號;圖像系統(tǒng)對這些信號進行各種運算來抽取目標(biāo)的特征,進而根據(jù)判別的結(jié)果來控制現(xiàn)場的設(shè)備動作。n計算機視覺是指用計算機實現(xiàn)人類的視覺功能,即對客觀世界中三維場景的感知、加工和理解感知、加工和理解。 n視覺研究的原始目的是把握和理解有關(guān)場景的圖像,辨識和定位其中的目標(biāo),確定他們的結(jié)構(gòu),空間排列和分布以及目標(biāo)間的相互關(guān)系等。n計算機視覺的研究目標(biāo)是根據(jù)感知到的圖像對客觀世界中實際的目標(biāo)和場景作出有意義的判斷。2.3.2.3.1 1 鄰接性、連通

15、性、區(qū)域和邊界鄰接性、連通性、區(qū)域和邊界2.2.3 3 數(shù)字圖像數(shù)字圖像處理處理的預(yù)備知識的預(yù)備知識像素鄰域像素鄰域4-4-鄰域鄰域8-8-鄰域鄰域?qū)菍? -鄰域鄰域8-8-鄰域鄰域像素鄰域像素鄰域8-8-鄰域鄰域像素鄰接像素鄰接 “相似性相似性”8-8-鄰接鄰接4-4-鄰接鄰接定義定義V V 是用于決定鄰接性的灰度集合,它是一種相似性的度量,是用于決定鄰接性的灰度集合,它是一種相似性的度量,用于確定所需判斷的像素之間的相似程度用于確定所需判斷的像素之間的相似程度n連通性連通性:令:令S代表圖像中的像素子集。如果在代表圖像中的像素子集。如果在S中全部像素之中全部像素之間存在一個通路,則可以

16、稱間存在一個通路,則可以稱2個像素個像素P和和Q在在S中是連通的。中是連通的。n連通分量:連通分量:對于對于S中的任何像素中的任何像素P,S中連通到該像素的像素中連通到該像素的像素集叫做集叫做S的連通分量。的連通分量。n連通集:連通集:如果如果S中僅有一個連通分量,則集合中僅有一個連通分量,則集合S叫做連通集。叫做連通集。n區(qū)域:區(qū)域:令令R是圖像中的一個像素子集,如果是圖像中的一個像素子集,如果R同時是連通集,同時是連通集,則稱則稱R是一個區(qū)域。是一個區(qū)域。n通路:通路:像素像素P到到Q的通路是一個特定的像素序列,的通路是一個特定的像素序列,(x0,y0)=(xp,yp), (xn,yn)=

17、(xq,yq)。且。且(xi,yi)和和 (xi-1,yi-1) 在滿在滿足足1i n時是鄰接的,時是鄰接的,n為通路長度。為通路長度。n邊界:邊界:一個區(qū)域的邊界是區(qū)域中所有包含一個或多個不在區(qū)一個區(qū)域的邊界是區(qū)域中所有包含一個或多個不在區(qū)域域R中的鄰接像素的像素所組成的集合。通常情況下,區(qū)域指中的鄰接像素的像素所組成的集合。通常情況下,區(qū)域指的是一幅圖像的子集,并包括區(qū)域的邊緣。的是一幅圖像的子集,并包括區(qū)域的邊緣。n邊緣:邊緣:區(qū)域的邊緣由具有某些導(dǎo)數(shù)值的像素組成,是一個像區(qū)域的邊緣由具有某些導(dǎo)數(shù)值的像素組成,是一個像素及其直接鄰域的局部性質(zhì),是個有大小方向?qū)傩缘氖噶?。素及其直接鄰域的?/p>

18、部性質(zhì),是個有大小方向?qū)傩缘氖噶俊?邊界和邊緣是不同的。邊界是和區(qū)域有關(guān)的全局概念,而邊緣邊界和邊緣是不同的。邊界是和區(qū)域有關(guān)的全局概念,而邊緣表示圖像函數(shù)的局部性質(zhì)。表示圖像函數(shù)的局部性質(zhì)。 n相似性度量和變化檢測是圖像技術(shù)的兩相似性度量和變化檢測是圖像技術(shù)的兩個根本途徑。個根本途徑。 1 1、距離度量函數(shù)、距離度量函數(shù) 對于坐標(biāo)分別位于(對于坐標(biāo)分別位于(x,y),(),(u,v)和()和(w,z)處的)處的像素像素p、q和和r,如果:,如果: (1)D(p,q)0(D(p,q)=0,當(dāng)且僅當(dāng),當(dāng)且僅當(dāng)p=q,即,即p和和q是指同一像素);是指同一像素); (2)D(p,q)=D(q, p

19、); (3)D(p,q) D(p,r) +D(q,r)。則則D是距離度量函數(shù)。是距離度量函數(shù)。 2.3.2.3.2 2 距離度量的幾種方法距離度量的幾種方法非負(fù)性;等價性;兩點之間非負(fù)性;等價性;兩點之間“距離距離”最短最短 2 2、歐氏距離、歐氏距離 像素像素p和和q之間的歐氏(之間的歐氏(Euclidean)距離定義為:)距離定義為: De(p,q)=(x-u)2+(y-v)21/2 也即,所有距像素點也即,所有距像素點(x,y)的歐氏距離小于或等于的歐氏距離小于或等于d的的像素都包含在以像素都包含在以(x,y)為中心為中心,以以d為半徑的圓平面中。為半徑的圓平面中。 3 3、街區(qū)距離、街

20、區(qū)距離 像素像素p和和q之間的之間的D4距離,也即街區(qū)(距離,也即街區(qū)(city-block)距離,定義為:距離,定義為: D4(p,q)=|x-u| + |y-v| 也即,所有相距像素點也即,所有相距像素點(x,y)的的D4距離為小于距離為小于d或等或等于于d的像素組成一個中心點在的像素組成一個中心點在(x,y)的菱形。的菱形。 3 3、街區(qū)距離、街區(qū)距離 (續(xù))(續(xù)) 比如,那些與點比如,那些與點(x,y)(x,y)的的D D4 4距離為小于距離為小于2 2或等于或等于2 2的像素組成了如下圖所示的等距離輪廓的像素組成了如下圖所示的等距離輪廓。 2 2 2 1 22 1 2 2 1 0 1 22 1 0 1 2 2 1 22 1 2 2 2 4 4、棋盤距離、棋盤距離 像素像素p p和和q q之間的之間的D D8 8距離,也即棋盤距離,定義為:距離,也即棋盤距離,定義為: D D8 8(p,q)=max(|x-u|(p,q)=max(|x-u|,|y-v|) |y-v|) 也即,所有距像素點也即,所有距像素點(x,y)(x,y)的的D D8 8距離為小于距離為小于d d或等或等于于d d的像素組成一個中心點在的像素組成一個中心點在(x,y)(x,y)的方形。的方形。 4 4、棋盤距離、棋盤距離 比如,距點比如,距點(x,y)(x,y)的的D

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論