數(shù)字圖像處理與Python實現(xiàn)-課件 第3、4章 數(shù)字圖像與python、圖像變換_第1頁
數(shù)字圖像處理與Python實現(xiàn)-課件 第3、4章 數(shù)字圖像與python、圖像變換_第2頁
數(shù)字圖像處理與Python實現(xiàn)-課件 第3、4章 數(shù)字圖像與python、圖像變換_第3頁
數(shù)字圖像處理與Python實現(xiàn)-課件 第3、4章 數(shù)字圖像與python、圖像變換_第4頁
數(shù)字圖像處理與Python實現(xiàn)-課件 第3、4章 數(shù)字圖像與python、圖像變換_第5頁
已閱讀5頁,還剩69頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

數(shù)字圖像處理課程內(nèi)容入門認(rèn)識第7章圖像壓縮第8章圖像分割基本操作應(yīng)用第9章圖像水印第10章指紋識別第11章深度學(xué)習(xí)綜合案例第三章數(shù)字圖像處理基礎(chǔ)3.1圖像的表示方法3.2數(shù)字圖像文件格式3.3Python圖像處理基礎(chǔ)3.1圖像的表示方法M*N的二維矩陣(其中,M為圖像的行數(shù),N為圖像的列數(shù))5種圖像的表示方法:二進(jìn)制圖像、索引圖像、灰度圖像、RGB圖像和多幀圖像3.1.1二進(jìn)制圖像1位表示一個像素,非0即1,通常0表示黑色,1表示白色優(yōu)點:缺點:二值圖像當(dāng)表示人物或風(fēng)景圖像時只能描述輪廓占用空間少二維邏輯矩陣3.1.2灰度圖像8位表示一個像素值,0表示黑色,255表示白色,1~254表示不同的深淺灰色單色圖像數(shù)據(jù)類型:8位無符號整數(shù)、16位無符號整數(shù)或雙精度類型。無符號整型:像素在[0,255]或[0,65535]范圍內(nèi);雙精度類型:像素在[0.0,1.0]范圍內(nèi)。3.1.3RGB圖像3個大小相同的二維數(shù)組表示一個像素,分別代表R、G、B這3個分量真彩色圖像3.1.4索引圖像偽彩色圖像包含:一個數(shù)據(jù)矩陣X和一個顏色映射(調(diào)色板)矩陣map。數(shù)據(jù)矩陣:8位無符號整型、16位無符號整型或雙精度類型。顏色映射矩陣map:m*3的數(shù)據(jù)陣列,

[0,1]之間的雙精度浮點型數(shù)據(jù),

每一行表示紅色、綠色和藍(lán)色分量。3.1.5多幀圖像用于需要對時間或場景上相關(guān)圖像集合進(jìn)行操作的場合。在Python中,支持在同一個數(shù)組中存儲多幅圖像,用一個四維數(shù)組表示,第四維用來指定幀的序號多幀圖像數(shù)組中,每一幀的大小和顏色分量或調(diào)色板必須相同多頁圖像或圖像序列計算下列未經(jīng)壓縮的BMP圖像文件的數(shù)據(jù)量(字節(jié)):大小為256×256的黑白位圖文件()大小為256×256的256色索引位圖文件()大小為256×256的32位真彩色位圖文件()256*256,256*256*8,256*256*4256*256/4,256*256,256*256*32256*256/8,256*256,256*256*4256*256/8,256*256*8,256*256*32ABCD提交單選題1分第三章數(shù)字圖像處理基礎(chǔ)3.1圖像的表示方法3.2數(shù)字圖像文件格式3.3Python圖像處理基礎(chǔ)3.2數(shù)字圖像文件格式頭文件:制作圖像的公司規(guī)定,

一般包括文件類型、制作時間、文件大小、制作人及版本號等信息。常見:BMP、GIF、JPEG和TIFF3.2.1BMP圖像Windows操作系統(tǒng)的標(biāo)準(zhǔn)文件格式,應(yīng)用廣泛。大部分BMP文件是不壓縮的形式,但支持圖像壓縮。BMP文件結(jié)構(gòu)3.2.2GIF圖像CompuServe公司在1987年開發(fā)的圖像文件格式,任何商業(yè)目的使用均須由公司授權(quán)。為數(shù)據(jù)流設(shè)計的一種傳輸格式,不作為文件的存儲格式,它具有順序的結(jié)構(gòu)形式。文件結(jié)構(gòu)文件標(biāo)志塊:識別標(biāo)識符GIF和版本號。邏輯屏幕描述塊:定義圖像顯示區(qū)域的參數(shù),包含背景顏色信息、顯示區(qū)域大小、縱橫尺寸、顏色深淺及是否存在全局彩色表。全局彩色表:其大小由圖像使用的顏色數(shù)決定。圖像數(shù)據(jù)塊:包含圖像的描述塊、局部彩色表、壓縮圖像數(shù)據(jù)、圖像控制擴(kuò)展塊、無格式文本擴(kuò)展塊、注釋擴(kuò)展塊和應(yīng)用程序擴(kuò)展塊,此部分可以默認(rèn)。尾塊:三維16進(jìn)制數(shù),表示數(shù)據(jù)流已經(jīng)結(jié)束,此部分可以默認(rèn)。3.2.2GIF圖像支持背景透明,生成非矩形的圖片。支持動畫,在Flash動畫前唯一的動畫形式。支持圖形漸進(jìn),漸進(jìn)圖片將比非漸進(jìn)圖片更快地出現(xiàn)在屏幕上,讓訪問者更快地知道圖片的概貌。支持無損壓縮,所以它更適合于線條、圖標(biāo)和圖紙。優(yōu)點&缺點缺點:只能顯示256色而應(yīng)用范圍受限,不能用于儲存和傳輸真彩的圖像文件。所以GIF圖像文件格式成了Internet上最流行的圖像格式。3.2.3JPEG圖像由(國際)聯(lián)合圖像專家組(JointPhotographicExpertsGroup)提出靜止圖像壓縮標(biāo)準(zhǔn)文件格式,面向常規(guī)彩色圖像及其它靜止圖像的一種壓縮標(biāo)準(zhǔn)。擴(kuò)展名為jpg或jpeg。圖像JPEG壓縮效果演示第三章數(shù)字圖像處理基礎(chǔ)3.1圖像的表示方法3.2數(shù)字圖像文件格式3.3Python圖像處理基礎(chǔ)3.3Python圖像處理基礎(chǔ)基礎(chǔ)圖像處理任務(wù):

顯示;基本的操作,如裁剪、翻轉(zhuǎn)、旋轉(zhuǎn);

圖像分割,分類和特征提?。?/p>

圖像恢復(fù)、識別等常見的圖像處理庫歷史悠久,功能強大,被認(rèn)為是Python官方圖像處理庫。PIL(PythonImagingLibrary)Pillow是PIL的一個派生分支,發(fā)展成比PIL本身更具活力的圖像處理庫。將其封裝成Python的庫(pip即可安裝),且支持Python2.x和Python3.x。能在所有主要操作系統(tǒng)上運行,提供基本圖像處理功能,比如圖像縮放,裁剪,貼圖,模糊

包括點操作,過濾以及顏色空間轉(zhuǎn)換。很多時候需要配合Numpy庫使用。常見的圖像處理庫NumPy(NumericalPython)Python語言的一個開源擴(kuò)展核心庫,運行速度快,支持?jǐn)?shù)組結(jié)構(gòu),提供大量數(shù)學(xué)函數(shù)庫進(jìn)行高維數(shù)組與矩陣運算。在計算機中圖像表示為點像素的標(biāo)準(zhǔn)NumPy數(shù)組,使用NumPy操作修改圖像像素值。通常與SciPy(ScientificPython)和Matplotlib(繪圖庫)一起使用,用于替代MatLab。。常見的圖像處理庫SciPyPython的另一個核心數(shù)據(jù)科學(xué)模塊(如同NumPy),可用于基本的圖像處理和處理任務(wù)。以NumPy為基礎(chǔ),在子模塊scipy.ndimage中提供在n維NumPy數(shù)組上運行的函數(shù),大大擴(kuò)展了后者的運算能力。常見的圖像處理庫skimage(scikit-imageSciKit)

Python中圖像處理的常用庫之一,由scipy社區(qū)開發(fā)和維護(hù),對scipy.ndimage進(jìn)行擴(kuò)展,提供更多的圖像處理功能,實現(xiàn)用于編寫研究、教育和行業(yè)應(yīng)用的算法和實用程序。skimage對scipy.ndimage進(jìn)行了功能擴(kuò)展,由多個子模塊組成,圖像數(shù)據(jù)由NumPy的多維數(shù)組表示,類似與MATLAB軟件,可提供圖像處理絕大部分功能。常見的圖像處理庫OpenCV-Python計算機視覺領(lǐng)域使用最廣泛的開源庫之一,采用C/C++語言,可運行在Linux/Windows/Mac等系統(tǒng)上,并提供Java、Python、MATLAB等接口;擁有豐富的常用圖像處理函數(shù),使得圖像處理和圖像分析更加便利,廣泛應(yīng)用于學(xué)術(shù)界和產(chǎn)業(yè)界的圖像識別、運動跟蹤、機器視覺等領(lǐng)域。OpenCV-Python是OpenCV的PythonAPI,運行速度快,容易編程和部署,成為執(zhí)行計算密集型計算機視覺任務(wù)的絕佳選擇。SimpleCV也是用于構(gòu)建計算機視覺應(yīng)用程序的開源框架。它可以訪問如OpenCV等高性能計算機視覺庫,學(xué)習(xí)難度遠(yuǎn)遠(yuǎn)小于OpenCV。(開源計算機視覺庫)常見的圖像操作圖像文件顯示常見的圖像操作圖像文件保存常見的圖像操作圖像RGB轉(zhuǎn)灰度方法一:常見的圖像操作圖像RGB轉(zhuǎn)灰度方法二:常見的圖像操作二值圖像的轉(zhuǎn)換常見的圖像操作RGB轉(zhuǎn)二值常見的圖像操作數(shù)值矩陣轉(zhuǎn)圖像數(shù)字圖像處理課程內(nèi)容入門認(rèn)識第7章圖像壓縮第8章圖像分割基本操作應(yīng)用第9章圖像水印第10章指紋識別第11章深度學(xué)習(xí)綜合案例24.1圖像幾何變換獲取圖像變換域的某些性質(zhì),對其進(jìn)行處理;一方面能夠更有效地反映圖像在空間域難以獲取的特征;另一方面也可使能量集中在少量數(shù)據(jù)上,更有利于圖像的存儲、傳輸及處理。圖像的變換域分析常用:傅里葉變換、DCT變換、小波變換廣泛應(yīng)用于圖像分析、濾波、增強、壓縮等應(yīng)用中。第四章圖像變換4.1圖像幾何變換4.2圖像離散傅里葉變換4.3圖像余弦變換平移、鏡像、縮放、轉(zhuǎn)置、旋轉(zhuǎn)、剪切4.1.1圖像的平移P0平移到P1

4.1.1圖像的平移4.1.2圖像的鏡像分為水平鏡像和垂直鏡像水平鏡像:以原圖像垂直中軸線為中心,將圖像分為左右兩部分,進(jìn)行左右對換,特點:每行像素的處理方式相同,行順序不發(fā)生變化,只是每一行的像素信息順序是從左到右進(jìn)行顛倒。

垂直鏡像:以原圖像水平中軸線為中心軸將圖像分為上下兩部分,進(jìn)行上下對換4.1.2圖像的鏡像垂直鏡像:以原圖像水平中軸線為中心軸將圖像分為上下兩部分,進(jìn)行上下對換

4.1.2圖像的鏡像4.1.3圖像的縮放垂直鏡像:將給定的圖像在x軸方向按比例縮放fx倍,在y軸方向按比例縮放fy倍fx=fy,為圖像的全比例縮放。fx≠fy,圖像產(chǎn)生幾何畸變。4.1.3圖像的縮放圖像縮放:將給定的圖像在x軸方向按比例縮放fx倍,在y軸方向按比例縮放fy倍fx=fy,為圖像的全比例縮放。fx≠fy,圖像產(chǎn)生幾何畸變。4.1.3圖像的縮放等尺寸顯示時,請仔細(xì)觀察縮小后的圖像會丟失一部分原圖像信息,會出現(xiàn)模糊化放大后的圖像,增加了原圖像信息,顯示更清晰建議采用原圖像的縱橫比,縮放后能更好地保持圖像信息4.1.4圖像的轉(zhuǎn)置圖像的行列坐標(biāo)互換,圖像的大小會隨之改變,即高度和寬度互換。

4.1.5圖像的旋轉(zhuǎn)以圖像中心為原點,將所有像素都旋轉(zhuǎn)一個相同角度使用cv2.getRotationMatrix2D()函數(shù)生成旋轉(zhuǎn)矩陣,返回旋轉(zhuǎn)矩陣,使用cv2.warpAffine()實現(xiàn)圖像旋轉(zhuǎn)。實現(xiàn)方法:旋轉(zhuǎn)后圖像尺寸與原始相同。縮放比例及旋轉(zhuǎn)程度不同,可能會造成部分信息丟失。避免丟失需要增加計算旋轉(zhuǎn)后圖像的外接矩形框尺寸。4.1.6圖像的剪切只對部分圖像感興趣切片指定坐標(biāo)的順序為[y0:y1,x0:x1]數(shù)組切片方式4.1.7圖像的插值思考:圖像幾何變換本質(zhì)?將像素的坐標(biāo)通過某種函數(shù)映射關(guān)系,映射到其他位置。包括:向前映射、向后映射向前映射:由輸入圖像的坐標(biāo)計算其在輸出圖像中的位置。思考:計算可以得到輸出圖像中非整數(shù)點坐標(biāo)。整數(shù)坐標(biāo)值怎么求?整數(shù)點的像素值周圍會有很多輸入像素點映射過來,將這些像素值疊加,得到輸出圖像整數(shù)點位置的像素值,無法直接得到輸出圖像某一點的像素值。4.1.7圖像的插值向后映射:圖像填充映射直接計算輸出圖像整數(shù)點(x’,y’)變換前在輸入圖像上的位置(x,y)。非整數(shù)點坐標(biāo):

利用其周圍整數(shù)點位置的輸入圖像像素值進(jìn)行插值,得到該點的像素值。逐個考慮輸出圖像中的像素,不會產(chǎn)生計算浪費。4.1.7圖像的插值常見圖像插值:最近鄰插值

雙線性插值最近鄰插值按照四舍五入法找到最相鄰的整數(shù)點坐標(biāo),以其像素值作為插值后的輸出P點在A區(qū),f(i,j),P點在B區(qū),f(i+1,j),P點在C區(qū),f(i,j+1),P點在D區(qū),f(i+1,j+1)。圖像質(zhì)量不高,放大有很嚴(yán)重的馬賽克,縮小有很嚴(yán)重的失真。如果輸出圖像該點的像素值根據(jù)輸入圖像中周圍四個真實的點按照一定規(guī)律計算,能達(dá)到更好的效果4.1.7圖像的插值常見圖像插值:最近鄰插值

雙線性插值雙線性插值輸入圖像中虛擬點四周的四個真實像素值共同決定輸出對應(yīng)點像素值缺點:計算量較大;具有低通濾波器性質(zhì),損失部分高頻分量,圖像輪廓在一定程度上變模糊。優(yōu)點:比最近鄰插值法輸出圖像質(zhì)量高,不會出現(xiàn)像素值不連續(xù)的的情況。第四章圖像變換4.1圖像幾何變換4.2圖像離散傅里葉變換4.3圖像余弦變換平移、鏡像、縮放、轉(zhuǎn)置、旋轉(zhuǎn)、剪切4.2圖像離散傅里葉變換引入傅里葉變換的作用:1、信號的頻域的表示跟時域的表示相比更加簡潔明了2、便于從能量的角度看待信號3、簡化了信號處理中所需要的計算量s(x)是由多個正弦信號疊加構(gòu)成的波型函數(shù)4.2.1連續(xù)傅里葉變換f(x)為實變量x的連續(xù)函數(shù),則傅里葉變換定義為:f(x)必須滿足:只有有限個間斷點、有限個極值和絕對可積的條件實序列傅里葉變換的實部和虛部分別為()偶函數(shù)和奇函數(shù)奇函數(shù)和偶函數(shù)奇函數(shù)和奇函數(shù)偶函數(shù)和偶函數(shù)ABCD提交單選題1分4.2.1連續(xù)傅里葉變換推廣到二維函數(shù)f(x,y),連續(xù)可積的連續(xù)函數(shù),則傅里葉變換定義為:4.2.2離散傅里葉變換(DFT)對f(x)進(jìn)行采樣將其離散化,則其傅里葉變換定義為:對比連續(xù)傅里葉變換離散傅里葉反變換(IDFT):4.2.2離散傅里葉變換(DFT)DFT在圖像變換中的應(yīng)用一般采用快速傅里葉變換(FFT),大大減少計算量4.2.3DFT

的性質(zhì)(1)可分離性二維傅里葉變換可分離成二次一維傅里葉變換先沿f(x,y)的列方向求一維離散傅里葉變換得到F(x,v),再對F(x,v)沿行方向求一維離散傅里葉變換得到F(u,v)。上述過程順序可調(diào),結(jié)果不變。反變換的分離過程類似。4.2.3DFT

的性質(zhì)(2)周期性和共軛對稱性正變換后得到的F(u,v)或反變換后得到的f(x,y)都是周期為N的周期性重復(fù)離散函數(shù)。由此,只需根據(jù)在任意周期內(nèi)的N個值就可以從F(u,v)得到f(x,y)。。共軛對稱性:周期性:說明變換后的幅值是以原點為中心對稱。因此,在求一個周期內(nèi)的值時,只需求出半個周期,另半個周期對稱可得,大大減少計算量。4.2.3DFT

的性質(zhì)(3)平移性將f(x,y)乘以一個指數(shù)項,=

把DFT后的F(u,v)的頻域中心移動到新位置,不影響DFT的幅值。類似地,將F(u,v)乘以一個指數(shù)項,=把IDFT后的f(x,y)的空域中心移動到新的位置。4.2.3DFT

的性質(zhì)(4)旋轉(zhuǎn)不變性如果f(r,θ)在空間域旋轉(zhuǎn)θ0角度,則其DFT在頻域上也旋轉(zhuǎn)同一角度θ0。(5)加法分配律(6)線性和比例性F{af1(x,y)+bf2(x,y)

}=aF1(u,v)+bF2(u,v)4.2.3DFT

的性質(zhì)(7)平均值

(8)離散卷積定理4.2.4DFT

的Python實現(xiàn)第四章圖像變換4.1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論