![教學(xué)課件:《數(shù)字圖像處理》(第三版)何東健_第1頁](http://file4.renrendoc.com/view/604105e57eeb2cb8147618bb82a5cc58/604105e57eeb2cb8147618bb82a5cc581.gif)
![教學(xué)課件:《數(shù)字圖像處理》(第三版)何東健_第2頁](http://file4.renrendoc.com/view/604105e57eeb2cb8147618bb82a5cc58/604105e57eeb2cb8147618bb82a5cc582.gif)
![教學(xué)課件:《數(shù)字圖像處理》(第三版)何東健_第3頁](http://file4.renrendoc.com/view/604105e57eeb2cb8147618bb82a5cc58/604105e57eeb2cb8147618bb82a5cc583.gif)
![教學(xué)課件:《數(shù)字圖像處理》(第三版)何東健_第4頁](http://file4.renrendoc.com/view/604105e57eeb2cb8147618bb82a5cc58/604105e57eeb2cb8147618bb82a5cc584.gif)
![教學(xué)課件:《數(shù)字圖像處理》(第三版)何東健_第5頁](http://file4.renrendoc.com/view/604105e57eeb2cb8147618bb82a5cc58/604105e57eeb2cb8147618bb82a5cc585.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
數(shù)字圖像處理DigitalImageProcessing目錄1.概論2.數(shù)字圖像處理基礎(chǔ)3.圖像增強(qiáng)4.圖像的幾何變換5.頻域處理6.數(shù)學(xué)形態(tài)學(xué)基礎(chǔ)7.圖像分割8.圖像特征與理解第一章概論1.數(shù)字圖像處理及其特點(diǎn)2.圖像處理的主要目的及主要內(nèi)容3.數(shù)字圖像處理的應(yīng)用4.數(shù)字圖像處理的發(fā)展動向5.圖像處理/計(jì)算機(jī)視覺領(lǐng)域會議和期刊(補(bǔ)充)1.1數(shù)字圖像處理及其特點(diǎn)1.計(jì)算機(jī)視覺/機(jī)器視覺:用計(jì)算機(jī)實(shí)現(xiàn)人眼的功能。
2.數(shù)字圖像處理:用于處理數(shù)字圖像的一些方法,例如,圖像增強(qiáng)或圖像分割,是進(jìn)行圖像分析的一個重要前期處理階段。
3.模擬圖像空間坐標(biāo)和顏色范圍都是連續(xù)的,傳統(tǒng)的圖像都是模擬的。數(shù)字圖像膠卷成像255255255255255…25500002552552552552552552552552552552552552552552551.1數(shù)字圖像處理及其特點(diǎn)一幅數(shù)字圖像從真實(shí)世界中獲取數(shù)字圖像有很多方法,比如數(shù)碼相機(jī)、掃描儀、CT或者磁共振成像。無論哪種方法,我們(人類)看到的是圖像,而讓數(shù)字設(shè)備來“看“的時候,則是在記錄圖像中的每一個點(diǎn)的數(shù)值。255255255255255…2550000255255255255255255255255255255255255255255255255255255255255…255255255255255255255255255255255255255255255255255255255255RGB圖像都可以簡化為數(shù)組以及矩陣,數(shù)字圖像處理主要目的就是通過處理和操作這些信息,來獲取更高級的信息。1.1數(shù)字圖像處理及其特點(diǎn)
數(shù)字圖像是指以數(shù)字格式存放的圖像。對于二維灰度圖像,通常用一個二維數(shù)組來描述f(x,y),x和y表示圖像中點(diǎn)的位置,f則代表圖像在該點(diǎn)的值,一般是指亮度或顏色。數(shù)字圖像中的每個元素,稱為像素(pixel)。存儲每個像素所需的二進(jìn)制位數(shù)稱為顏色深度。通?;叶葓D像的顏色深度為8位。數(shù)字圖像(DigitalImage)1.2.1圖像處理的主要目的1.提高圖像的視感質(zhì)量,以達(dá)到賞心悅目的目的。
2.提取圖像中所包含的某些特征或特征信息,用于模式識別或計(jì)算機(jī)視覺的預(yù)處理。
3.對圖像數(shù)據(jù)進(jìn)行變換,編碼和壓縮,以便于圖像的存儲和傳輸。1.2.1圖像處理的主要目的圖像增強(qiáng)(磨皮效果),提高視覺效果Download:http:///Imageshop/p/4679065.html
1.2圖像處理的主要目的前向運(yùn)動去模糊(ICCV13).hk/~leojia/projects/forwarddeblur/index.html1.2圖像處理的主要目的從圖像中提取梯度特征(HistogramofOrientedGradient),廣泛應(yīng)用于行人檢測。1.2.1圖像處理的主要目的BMP格式未壓縮:2240KB壓縮成JPEG格式:189KB壓縮比高達(dá):1-189/2240=92%1.2.2數(shù)字圖像處理的主要內(nèi)容1.圖像獲取、表示和表現(xiàn)2.圖像復(fù)原3.圖像增強(qiáng)
4.圖像分割
5.圖像分析
6.圖像重建
7.圖像壓縮和編碼1.2.2數(shù)字圖像處理的主要內(nèi)容圖像獲取、表示和表現(xiàn)把模擬圖像信號轉(zhuǎn)化為計(jì)算機(jī)所能接受的數(shù)字形式,以及把數(shù)字圖像顯示和表現(xiàn)出來(如打?。?。主要包括攝取圖像、光電轉(zhuǎn)換及數(shù)字化等幾個步驟。1.2.2數(shù)字圖像處理的主要內(nèi)容圖像復(fù)原(ImageRestoration)當(dāng)造成圖像退化(圖像品質(zhì)下降)的原因已知時,用復(fù)原技術(shù)可以對圖像進(jìn)行校正。圖像復(fù)原最關(guān)鍵的是對每種退化均需要有一個合理的模型。1.2.2數(shù)字圖像處理的主要內(nèi)容圖像增強(qiáng)用于改善圖像視感質(zhì)量所采取的一種方法。
圖像分割把圖像分成區(qū)域的過程即圖像分割。圖像中通常包含多個對象。為達(dá)到識別和理解的目的,必須按照一定的規(guī)則將圖像分割成區(qū)域,每個區(qū)域代表被成像的一個物體(或部分)。1.2.2數(shù)字圖像處理的主要內(nèi)容圖像分析圖像處理應(yīng)用的目標(biāo)幾乎均涉及到圖像分析,即對圖像中的不同對象進(jìn)行分割、特征提取和表示,從而有利于計(jì)算機(jī)對圖像進(jìn)行分類、識別和理解。圖像重建圖像重建是從數(shù)據(jù)到圖像的處理。CT是圖像重建處理的典型應(yīng)用實(shí)例。目前,圖像重建與計(jì)算機(jī)圖形學(xué)相結(jié)合,把多個二維圖像合成為三維圖像,并加以光照模型和各種渲染技術(shù),能生成各種具有強(qiáng)烈真實(shí)感的高質(zhì)量圖像。1.2.2數(shù)字圖像處理的主要內(nèi)容圖像壓縮編碼實(shí)際應(yīng)用中,必須進(jìn)行圖像壓縮,以減少圖像數(shù)據(jù)量,便于圖像的存儲和傳輸,并節(jié)約成本。1.3圖像處理的主要應(yīng)用WillardBoyle喬治·史密斯1969年,史密斯和博伊爾共同發(fā)明了CCD圖像傳感器。來自:/view/1262084.htm2009年,他們獲得諾貝爾物理獎。圖像處理發(fā)展歷史1.3.1CCD(ChargeCoupledDevice)WillardBoyle1.3.1CCD(ChargeCoupledDevice)目前智能手機(jī)也配備了高分辨率的攝像頭。圖為MotorolaMT810lx手機(jī)配置雙LED閃光燈和一枚500萬像素的自動對焦攝像頭。1.3.1CCD(ChargeCoupledDevice)1.3.1CCD(ChargeCoupledDevice)攝像單元:CCD圖像(光電)傳感器工作原理是:將光能量轉(zhuǎn)換為電荷,并將轉(zhuǎn)換得到的電荷進(jìn)行存儲。CCD傳感器分為線陣式和陣列式兩種,具有代表性的產(chǎn)品分別有掃描儀和數(shù)碼相機(jī)。1.3.2圖像處理的主要應(yīng)用1.通信:圖像傳輸、電視電話、電視會議
2.宇宙探測3.遙感
4.生物醫(yī)學(xué)領(lǐng)域
5.工農(nóng)業(yè)生產(chǎn)
6.軍事、公安等
7.機(jī)器視覺
8.視頻和多媒體系統(tǒng)9.科學(xué)可視化
10.電子商務(wù)11.社交應(yīng)用
12.嵌入式應(yīng)用1.3.2圖像處理的主要應(yīng)用1.通信:QQ視頻,網(wǎng)絡(luò)直播,體育賽事直播體育賽事直播QQ娛樂直播1.3.2圖像處理的主要應(yīng)用2.宇宙探測1.3.2圖像處理的主要應(yīng)用3.遙感1.3.2圖像處理的主要應(yīng)用4.生物醫(yī)學(xué)領(lǐng)域1.3.2圖像處理的主要應(yīng)用5.工農(nóng)業(yè)生產(chǎn):產(chǎn)品質(zhì)量無損檢測,如食品,水果,印刷品,焊縫質(zhì)量和表面缺陷等。1.3.2圖像處理的主要應(yīng)用6.軍事、公安1.3.2圖像處理的主要應(yīng)用7.機(jī)器視覺藥品封蓋不良檢測智能機(jī)器人1.3.2圖像處理的主要應(yīng)用KaimingHe,JianSunandXiaoouTang,SingleImageHazeRemovalUsingDarkChannelPrior(CVPR2009Bestpaper)
更多應(yīng)用:圖像去霧1.3.2圖像處理的主要應(yīng)用圖像去霧圖像檢索/百度圖像檢索服務(wù)1.3.2圖像處理的主要應(yīng)用1.3.2圖像處理的主要應(yīng)用三維重建目標(biāo)跟蹤1.3.2圖像處理的主要應(yīng)用
嫦娥一號探月衛(wèi)星發(fā)回的照片我國神舟七號飛船的實(shí)時圖像傳輸系統(tǒng)1.3.2圖像處理的主要應(yīng)用M.BrownandD.G.Lowe.RecognisingPanoramas.ICCV20031.3.2圖像處理的主要應(yīng)用圖像拼接1.4數(shù)字圖像處理的發(fā)展動向
需進(jìn)一步研究的問題:
1.提高精度的同時,著重解決處理速度問題
2.加強(qiáng)軟件研究、開發(fā)新的處理方法,借鑒其它學(xué)科的研究成果
3.加強(qiáng)邊緣學(xué)科的研究工作,促進(jìn)圖像處理技術(shù)的發(fā)展。
4.加強(qiáng)理論研究,逐步形成圖像處理科學(xué)自身的理論體系。
5.圖像處理領(lǐng)域的標(biāo)準(zhǔn)化。1.4數(shù)字圖像處理的發(fā)展動向
未來大致發(fā)展:1.圍繞HDTV(高清晰電視)的研制,開展實(shí)時圖像處理的理論及技術(shù)研究。提高精度的同時,著重解決處理速度問題。2.圖像、圖形相結(jié)合,朝著三維成像或多維成像的方向發(fā)展。3.硬件芯片研究。4.新理論與新算法研究。1.4數(shù)字圖像處理的發(fā)展動向
最近的新趨勢:自從深度學(xué)習(xí)(DeepLearning)技術(shù)2012年在物體分類領(lǐng)域的突破性進(jìn)展,極大推動了計(jì)算機(jī)視覺從理論走向應(yīng)用。當(dāng)前,隨著深度學(xué)習(xí)在各個領(lǐng)域取得了突破性的進(jìn)展,許多計(jì)算機(jī)視覺公司紛紛成立,有力的推動科研與應(yīng)用的深度結(jié)合。1.4數(shù)字圖像處理的發(fā)展動向
最近的新趨勢:國內(nèi)有兩個重要的學(xué)術(shù)論壇和一個重要學(xué)術(shù)會議:VALSE(VisionandLearningSEminar)RACV(ResearchandChallengeonComputerVision)PRCV(PatternRecognitionandComputerVision),由CCCV和CCPR合并而成。1.4數(shù)字圖像處理的發(fā)展動向CCCV2017贊助商1.4數(shù)字圖像處理的發(fā)展動向VLASE2017贊助商1.5圖像處理/計(jì)算機(jī)視覺領(lǐng)域會議和期刊計(jì)算機(jī)視覺與圖象處理國際會議:A類ICCV,CVPR,ECCV,B類:ICPR,ICIP,ACCV國際期刊:
InternationalJournalofComputerVision(IJCV),IEEETPatternAnalysisandMachineIntelligence(TPAMI)IEEETImageProcessing(TIP),IEEETCircuitsandSystemsforVideoTechnology(CSVT)PatternRecognition(PR),ComputerVisionandImageUnderstanding(CVIU),ImageandVisionComputing(IVC),PatternRecognitionLetters(PRL),IETComputerVisionNeurocomputingNeuralComputing&Applications(NCA)InternationalJournalofPatternRecognitionandArtificialIntelligence(IJPRAI)本章小結(jié)&思考數(shù)字圖像處理(計(jì)算機(jī)視覺)的基本概念圖像處理的基本應(yīng)用數(shù)字圖像處理DigitalImageProcessing目錄1.概論2.數(shù)字圖像處理基礎(chǔ)3.圖像增強(qiáng)4.圖像的幾何變換5.頻域處理6.數(shù)學(xué)形態(tài)學(xué)基礎(chǔ)7.圖像分割8.圖像特征與理解第二章數(shù)字圖像處理基礎(chǔ)1.圖像數(shù)字化技術(shù)2.色度學(xué)基礎(chǔ)與顏色模型3.數(shù)字圖像類型4.圖像文件格式5.OpenCV編程簡介2.1圖像數(shù)字化技術(shù)圖像的數(shù)字化包括采樣和量化兩部分。自然場景可用連續(xù)函數(shù)f(x,y)表示,其在空間坐標(biāo)(自變量)和顏色值(因變量)都是連續(xù)的。為了在計(jì)算機(jī)上能夠進(jìn)行存儲,須同時將空間坐標(biāo)進(jìn)行和顏色值進(jìn)行離散化,這一過程稱為數(shù)字化。空間坐標(biāo)數(shù)字化的過程稱為采樣。顏色值數(shù)字化的過程稱為量化。2.1圖像數(shù)字化技術(shù)成像系統(tǒng)場景:模擬圖像成像平面數(shù)字化結(jié)果數(shù)字化過程示意圖2.1.1采樣
采樣是將在空間上連續(xù)的圖像轉(zhuǎn)換成離散的采樣點(diǎn)(即像素)集的操作。由于圖像是二維分布的信息,所以采樣是在x軸和y軸兩個方向上進(jìn)行。采樣示意圖2.1.2量化(Sampling,Quantization)
量化:取樣后圖像的每個樣點(diǎn)的取值范圍分成若干區(qū)間,并僅用一個數(shù)值代表每個區(qū)間中的所有取值。量化的結(jié)果是圖像能夠容納的顏色總數(shù),它反映了采樣的質(zhì)量。連續(xù)灰度值量化值(整數(shù)值)
灰度標(biāo)度
灰度量化
(a)量化
(b)量化為8bit
量化示意圖2.1.3采樣與量化參數(shù)的選擇一幅圖像在采樣時,行、列的采樣點(diǎn)與量化時每個像素量化的級數(shù),既影響數(shù)字圖像的質(zhì)量,也影響到數(shù)據(jù)量的大小。
假定圖像取M×N個樣點(diǎn),每個像素量化后的灰度二進(jìn)制位數(shù)為Q,一般Q總是取為2的整數(shù)冪,即Q=2k,則存儲一幅數(shù)字圖像所需的二進(jìn)制位數(shù)b為:b=M×N×Q字節(jié)數(shù)為:B=(M×N×Q)/8(Byte)2.1.3采樣與量化參數(shù)的選擇不同采樣點(diǎn)數(shù)對圖像質(zhì)量的影響2.1.3采樣與量化參數(shù)的選擇不同量化級數(shù)對圖像質(zhì)量的影響2.1.4圖像數(shù)字化設(shè)備將模擬圖像數(shù)字化為數(shù)字圖像,目前主要有數(shù)碼相機(jī)、掃描儀、數(shù)字化儀等設(shè)備。數(shù)碼相機(jī)手機(jī)掃描儀醫(yī)學(xué)成像人造衛(wèi)星無人機(jī)2.1.4圖像數(shù)字化設(shè)備圖像數(shù)字化設(shè)備的組成(1)采樣孔(2)圖像掃描機(jī)構(gòu)(3)光傳感器(4)量化器(5)輸出存儲裝置數(shù)字化設(shè)備性能(1)像素大小(2)量化位數(shù)(3)圖像大小(4)線性度(5)噪聲2.2色度學(xué)基礎(chǔ)與顏色模型顏色是通過眼、腦和生活經(jīng)驗(yàn)所產(chǎn)生的一種對光的視覺效應(yīng),對色彩的辨認(rèn)是肉眼受到電磁波輻射能刺激后所引起的一種視覺神經(jīng)的感覺??梢姽?電磁波譜中波長約在0.39~0.76μm范圍內(nèi)且為肉眼可見的電磁輻射。2.2.1色度學(xué)基礎(chǔ)多光譜圖像f(x,y,λ),計(jì)算機(jī)顯示一幅彩色圖像時,每一個像素的顏色是通過3種基本顏色(即紅、綠、藍(lán))合成的,即最常見的RGB顏色模型。根據(jù)三原色學(xué)說,可見光譜內(nèi)任何顏色都可由紅、綠、藍(lán)三色組成。生理學(xué)試驗(yàn)表明,視網(wǎng)膜上的光感受器可分錐細(xì)胞(conecell)和桿細(xì)胞(rodcell)。桿細(xì)胞錐細(xì)胞2.2.1色度學(xué)基礎(chǔ)人類感光細(xì)胞的敏感曲線Red:700nm,Green:546.1nm,Blue:435.8nm2.2.1色度學(xué)基礎(chǔ)顏色的三個屬性顏色是外界光刺激于人的視覺器官而產(chǎn)生的主觀感覺。顏色可分兩大類:非彩色和彩色。非彩色:黑白色彩色:根據(jù)人的視覺系統(tǒng)感知彩色的方式,顏色有三個基本屬性,分別是色調(diào)、飽和度、亮度。色調(diào):人的感官對不同顏色的感受,如紅色、綠色和藍(lán)色。飽和度:顏色的純度,飽和度越大,顏色看起來就會越鮮艷。強(qiáng)度:對應(yīng)成像亮度和圖像灰度,是顏色的明亮程度。2.2.2顏色模型按用途可分為三類(1)計(jì)算顏色模型用于進(jìn)行顏色的理論研究。常見的RGB模型、CIEXYZ模型、Lab模型等均屬于此類型。(2)視覺顏色模型是指與人眼對顏色感知的視覺模型相似的模型,它主要用于色彩的理解,常見的有HSI模型、HSV模型和HSL模型。(3)工業(yè)顏色模型側(cè)重于實(shí)際應(yīng)用,包括彩色顯示系統(tǒng)、彩色傳輸系統(tǒng)及電視傳輸系統(tǒng)等。如印刷中用的CMYK模型、電視系統(tǒng)用YUV模型、用于彩色圖像壓縮的YCbCr模型等。2.2.2顏色模型
RGB顏色模型按照CIE規(guī)定的三基色構(gòu)成表色系統(tǒng)。自然界的任一種顏色都可通過這三種基色按不同比例混合而成。由于RGB模型將三基色同時加入以產(chǎn)生新的顏色,所以,它是一個加色系統(tǒng)。RGB(Red,Green,Blue)R:200G:50B:1202.2.2顏色模型
RGB顏色模型的優(yōu)點(diǎn)(1)RGB模型與顯示器等設(shè)備有著較好的對應(yīng)關(guān)系。(2)在RGB顯示器中,有三種熒光粉能夠分別發(fā)出紅、綠、藍(lán)三種顏色,三個相鄰的熒光點(diǎn)構(gòu)成了一個像素,這些熒光點(diǎn)受到三束分別為c1,c2,c3的電子束的轟擊,會發(fā)出不同的亮度,通過物理上的疊加或混合,便可顯示出相應(yīng)的顏色。2.2.2顏色模型
Lab顏色模型Lab顏色模型由三個要素組成,一個要素是亮度(L),a和b是兩個顏色通道。a包括的顏色是從深綠色(低亮度值)到灰色(中亮度值)再到亮粉紅色(高亮度值);b是從亮藍(lán)色(低亮度值)到灰色(中亮度值)再到黃色(高亮度值)。因此,這種顏色混合后將產(chǎn)生具有明亮效果的色彩。2.2.2顏色模型
HSI顏色模型色調(diào)H(Hue):與光波的波長有關(guān),它表示人的感官對不同顏色的感受,如紅色、綠色、藍(lán)色等,飽和度(Saturation):表示顏色的純度,純光譜色是完合飽和的,加入白光會稀釋飽和度。飽和度越大,顏色看起來就會鮮艷,反之亦然。強(qiáng)度I(Intensity):對應(yīng)成像亮度和圖像灰度,是顏色的明亮程度。HSI模型建立基于兩個重要的事實(shí):(1)I分量與圖像的彩色信息無關(guān);(2)H和S分量與人感受顏色的方式是緊密相聯(lián)的。這些特點(diǎn)使得HSI模型非常適合彩色特性檢測與分析。2.2.2顏色模型
HSI顏色模型RGB顏色模型轉(zhuǎn)換為HSI顏色模型的公式見教材22頁HSI色立體圓柱HSI模型2.2.2顏色模型
CMY模型和CMYK模型CMY模型是硬拷貝設(shè)備上輸出圖像的顏色模型,常用于彩色打印、印刷行業(yè)。它的三原色是青(Cyan)、品紅(Magenta)、黃(Yellow),分別為紅、綠、藍(lán)的補(bǔ)色,稱為減色基。在CMY中,顏色是從白光中減去一定成分得到的,而不是像素RGB顏色模型那樣,在黑光中增加某種顏色。CMY坐標(biāo)可以從RGB模型中得到:2.2.2顏色模型
CMY模型和CMYK模型由于在印刷時CMY模型不可能產(chǎn)生真正的黑色,因此在印刷業(yè)中實(shí)際上使用的是CMYK顏色模型,K為第四種顏色,表示黑色。用以彌補(bǔ)三個顏色混合不夠黑的問題。2.2.2顏色模型
YCbCr模型YCbCr模型充分考慮人眼視覺特性,以降低彩色數(shù)字圖像存儲量,是一種適合于彩色圖像壓縮的模型。YCbCr模型與YUV模型一樣,由亮度Y、色差Cb、色差Cr構(gòu)成。與YUV模型的不同是,在構(gòu)造色差信號時,充分考慮了RGB3個分量在視覺感受中的不同重要性。2.2.3顏色變換對彩色圖像進(jìn)行顏色變換,可實(shí)現(xiàn)對彩色圖像的增強(qiáng)處理,改善其視覺效果,為進(jìn)一步處理奠定基礎(chǔ)?;咀儞Q顏色變換模型為:g(x,y)=T[f(x,y)]式中:f(x,y)是彩色輸入圖像,其值為一般為向量;
g(x,y)是變換或處理后的彩色圖像,與f(x,y)同維;
T是在空間域上對f的操作。T對圖像顏色的操作有多種方式;2.2.3顏色變換基本變換式中:ri、si為f(x,y)和g(x,y)在圖像中任一點(diǎn)的彩色分量值;{T1,T2,…,Tn}為變換函數(shù)集。n的值由顏色模型而定,若選擇RGB模型,則n=3;r1、r2、r3分別表示輸入圖像的紅、綠、藍(lán)分量;選擇CMYK模型,則n=4。(a)原圖像
(b)HSI模型
(c)RGB模型
彩色圖像直方圖均衡化處理效果2.2.3顏色變換彩色切片彩色切片是通過識別圖像中感興趣的顏色,然后將其作為一個整體從圖像中分離出來。彩色切片效果(a)原圖像(b)提取黃色2.3數(shù)字圖像類型
矢量(Vector)圖和位圖(Bitmap),位圖也稱為柵格圖像。矢量圖是用數(shù)學(xué)(準(zhǔn)確地說是幾何學(xué))公式描述一幅圖像。(計(jì)算機(jī)圖形學(xué))優(yōu)點(diǎn):一是它的文件數(shù)據(jù)量很小,因?yàn)榇鎯Φ氖瞧鋽?shù)學(xué)公式;其二是圖像質(zhì)量與分辨率無關(guān),這意味著無論將圖像放大或縮小了多少次,圖像總是以顯示設(shè)備允許的最大清晰度顯示。缺點(diǎn),就是不易制作色調(diào)豐富或色彩變化太多的圖像,而且繪制出來的圖像不是很逼真,同時也不易在不同的軟件間交換文件。在CorelDraw和AdobeIllustrator中生成的圖像均為矢量圖。2.3數(shù)字圖像類型
位圖是由許多像素點(diǎn)來表示一幅圖像。每個像素具有顏色屬性和位置屬性。線畫稿:黑白二色2.3數(shù)字圖像類型位圖是由許多像素點(diǎn)來表示一幅圖像。每個像素具有顏色屬性和位置屬性灰度圖像:灰度圖像像素的灰度級用8bit表示,每個像素都是介于黑、白之間的256(28=256)種灰度中的一種。2.3數(shù)字圖像類型真彩色圖像:真彩色圖像中,每一個像素由紅、綠和藍(lán)3個字節(jié)組成,每個字節(jié)為8bit,表示0到255之間的不同的亮度值,這3個字節(jié)組合,可以產(chǎn)生1670萬種不同的顏色。2.3數(shù)字圖像類型索引圖像:在這種模式下,預(yù)先定義好每種顏色,且可供選用的一組顏色數(shù)最多為256種。2.3數(shù)字圖像類型多(高)光譜圖像:每一個像素點(diǎn)的值是一個多維向量,是該點(diǎn)在多個波段的反射值。http:///83751595.html高光譜相機(jī)多光譜相機(jī)2.3數(shù)字圖像類型位圖有關(guān)術(shù)語(1)像素點(diǎn)(Pixel)、點(diǎn)Dot和樣點(diǎn)(Sample)
像素:圖像的每個點(diǎn)稱為Pixel
樣點(diǎn):數(shù)字化設(shè)備從源圖像中每英寸取多少個樣點(diǎn),dpi(dotperinch)
點(diǎn):從樣點(diǎn)區(qū)域中選一個點(diǎn)作為該樣點(diǎn)的顏色值(2)分辨率
圖像分辨率
屏幕分辨率
打印機(jī)分辨率
掃描儀分辨率2.4圖像文件格式
數(shù)字圖像有多種存儲格式,每種格式一般由不同的軟件公司開發(fā)所支持。文件一般包含文件頭和圖像數(shù)據(jù)。就像每本書都有封面,目錄,它們的作用類似于文件頭,通過文件頭我們可讀取圖像數(shù)據(jù)。文件頭的內(nèi)容由該圖像文件的公司決定,一般包括文件類型、文件制作者、制作時間、版本號、文件大小等內(nèi)容,還有壓縮方式。常見的圖像(視頻)文件格式2.4.1BMP圖像文件格式
BMP圖像文件的結(jié)構(gòu)可以分為如下三個部分:(1)文件頭(由位圖文件和位圖信息頭兩部分組成),(2)調(diào)色板數(shù)據(jù),(3)圖像數(shù)據(jù)。BMP文件頭的長度為固定值54個字節(jié),其中Bitmapfileheader結(jié)構(gòu)14字節(jié)Bitmapinfoheader結(jié)構(gòu)40字節(jié)2.4.1BMP圖像文件格式BMP圖像文件結(jié)構(gòu)2.4.1BMP圖像文件格式
BITMAPFILEHEADER包含文件類型和大小等信息,定義為:typedefstructtagBITMAPFILEHEADER{ WORD bfType; /*代表BMP格式,必為“BM”即“0x4d42”*/ DWORDbfSize; /*BMP文件總字節(jié)數(shù)*/ WORDbfReserved1; /*預(yù)留,必為0*/ WORDbfReserved2; /*預(yù)留,必為0*/
DWORDbfOffBits; /*以字節(jié)為單位,表示圖像數(shù)據(jù)在文件內(nèi)的起始地址,即圖像數(shù)據(jù)針對文件頭的偏移量*/}BITMAPFILEHEADER2.4.1BMP圖像文件格式
BITMAPINFOHEADER包含位圖的尺寸和顏色格式等信息,其定義如下:typedefstructtagBITMAPINFOHEADER{DWORD biSize; /*bitmapinfo結(jié)構(gòu)的字節(jié)數(shù)為40*/LONG biWidth; /*圖像寬度(像素數(shù))*/LONG biHeight; /*圖像高度(像素數(shù))*/WORD biPlanes; /*目標(biāo)設(shè)備平面數(shù),總為1*/WORD biBitCount; /*每像素位數(shù),可為1、4、8或24*//*數(shù)據(jù)壓縮方式,為0(不壓縮);1(BI_RLE8)或2(BI_RLE4)*/DWORD biCompression;DWORD biSizeImage; /位圖的大小,以字節(jié)表示*/LONG biXPelsPerMeter;/*設(shè)備水平分辨率,以每米像素數(shù)為單位*/LONG biYPelsPerMeter;/*設(shè)備垂直分辨率,以每米像素數(shù)為單位*/DWORD biClrUsed; /*位圖使用的顏色數(shù),0表示所有顏色都使用*/DWORD biClrImportant; /*重要的顏色索引,0表示所有顏色均重要*/}BITMAPINFOHEADER2.4.1BMP圖像文件格式調(diào)色板(Palette)調(diào)色板僅供灰度圖像或索引圖像使用,真彩色圖像并不需要調(diào)色板,位圖信息頭部分后直接是位圖數(shù)據(jù)。調(diào)色板實(shí)際上是一個數(shù)組,共有biClrUsed個元素(如果該值為零,則有2的biBitCount次方個元素)。數(shù)組中每個元素的類型是一個RGBQUAD結(jié)構(gòu),占4個字節(jié)。結(jié)構(gòu)如下:typedefstructtagRGBQUAD{BYTE rgbBlue;BYTE rgbGreen;BYTE rgbRed;BYTE rgbReserved;}RGBQUAD;2.4.1BMP圖像文件格式圖像數(shù)據(jù)對于用到調(diào)色板的位圖,圖像數(shù)據(jù)就是該像素顏色在調(diào)色板中的索引值,對于真彩色圖像,圖像數(shù)據(jù)就是實(shí)際的R、G、B值。需特別注意2點(diǎn):(1)圖像數(shù)據(jù)每一行的字節(jié)數(shù)必須是4的整倍數(shù),否則需要補(bǔ)齊。(2)BMP文件的數(shù)據(jù)存放是從下到上,從左到右。也就是說,圖像數(shù)據(jù)是倒置的,讀取BMP文件時,先讀取最下面的數(shù)據(jù),然后依次從下往上讀取數(shù)據(jù)。DIB(DeviceIndependentBitmap)圖像格式是設(shè)備無關(guān)位圖文件,描述圖像的能力基本與BMP相同,并且能運(yùn)行于多種硬件平臺,只是文件較大。2.4.2其它圖像文件格式
TIF標(biāo)記圖像文件格式TIF(TagImageFileFormat)提供存儲各種信息的完備手段,可以存儲專門的信息而不違反格式宗旨,是目前流行的圖像文件交換標(biāo)準(zhǔn)之一。TIF文件格式是圖像文件格式中最復(fù)雜的一種,要求用更多的代碼來控制它,會導(dǎo)致文件讀寫速度慢。TIF文件由文件頭、參數(shù)指針表與參數(shù)域、參數(shù)數(shù)據(jù)表和圖像數(shù)據(jù)4部分組成。2.4.2其它圖像文件格式
GIFCompuServe開發(fā)的圖形交換文件格式GIF(GraphicsInterchangeFormat),可在不同的系統(tǒng)平臺上交流和傳輸。GIF圖像文件采取LZW壓縮算法,存儲效率高,支持多幅圖像定序或覆蓋,交錯多屏幕繪圖以及文本覆蓋。GIF主要是為數(shù)據(jù)流而設(shè)計(jì)的一種傳輸格式。GIF有5個主要部分以固定順序出現(xiàn),所有部分均由一個或多個塊(block)組成。2.4.2其它圖像文件格式
PBM、PGM、PPM文件PBM(PortableBitMap)、PGM(PortableGreyMap)、PPM(PortablePixMap)是可交換式位圖(灰度、像素)映射文件格式,通常作為各種圖像格式文件之間的轉(zhuǎn)換平臺。PBM、PGM、PPM和BMP文件一樣,圖像數(shù)據(jù)均不壓縮,但前者的文件頭信息非常簡單。文件頭以ASCII方式編碼,圖像數(shù)據(jù)以ASCII碼或字節(jié)形式編碼。文件頭包含3部分信息,第1項(xiàng)是格式標(biāo)識符(MagicIdentifier),表示圖像的類型及存儲格式;第2至第4項(xiàng)分別為圖像的寬度和高度、圖像顏色可能的最大值和注釋。文件頭之后為圖像數(shù)據(jù)。2.4.2其它圖像文件格式
PCX文件PCX文件格式由ZSoft公司設(shè)計(jì)。各種掃描儀掃描得到的圖像均能保存成PCX格式。PCX支持256種顏色,不如TIF等格式功能強(qiáng),但結(jié)構(gòu)較簡單,存取速度快,壓縮比適中,適合于一般軟件的使用。PCX格式支持RGB、索引顏色、灰度和位圖顏色模式,但不支持alpha通道。PCX支持RLE壓縮方法,圖像顏色位數(shù)可為1、4、8或24。PCX圖像文件由3個部分組成:文件頭、圖像數(shù)據(jù)和256色調(diào)色板。PCX的文件頭有128個字節(jié),它包括版本號,被打印或掃描圖像的分辨率(dpi),大小(單位為像素),每掃描行的字節(jié)數(shù),每像素包含的位數(shù)據(jù)和彩色平面數(shù)。位圖數(shù)據(jù)用行程長度壓縮算法(RLE)記錄數(shù)據(jù)。2.4.2其它圖像文件格式
JPEG圖像格式JPEG(JointPhotographer'sExpertsGroup,聯(lián)合圖像專家組)格式,是由ISO和CCITT為靜態(tài)圖像所建立的第一個國際數(shù)字圖像壓縮標(biāo)準(zhǔn)。由于JPEG的高壓縮比和良好的圖像質(zhì)量,被廣泛應(yīng)用于多媒體和網(wǎng)絡(luò)程序中。JPEG和GIF成為HTML語法選用的圖像格式。JPEG格式支持24位顏色,并保留照片和其它連續(xù)色調(diào)圖像中存在的亮度和色相的顯著和細(xì)微變化。JPEG一般基于DCT變換的順序型模式壓縮圖像。JPEG通過有選擇地減少數(shù)據(jù)來壓縮文件大小。因?yàn)樗鼤売脭?shù)據(jù),故JPEG壓縮為有損壓縮。2.5OpenCV編程簡介
OpenCVOpenCV(OpenSourceComputerVisionLibrary)是一個開源、跨平臺的計(jì)算機(jī)視覺庫,可以運(yùn)行在Linux、Windows和MacOS桌面操作平臺或Android和iOS移動操作平臺上。提供了C++、C和Java接口,采用優(yōu)化的C/C++編寫,實(shí)現(xiàn)了圖像處理和計(jì)算機(jī)視覺2500種優(yōu)化后的通用算法。2.5OpenCV編程簡介
數(shù)字圖像處理的主要編程工具(1)Matlab(2)Python(3)VisualStudioC++2.5OpenCV編程簡介
Matlab:MatrixLaboratory以矩陣(數(shù)組)為基本處理單元,非常適合圖像處理,但效率較低,研究領(lǐng)域應(yīng)用較多。2.5OpenCV編程簡介
Python:一種面向?qū)ο蟮慕忉屝陀?jì)算機(jī)程序設(shè)計(jì)語言,由荷蘭人GuidovanRossum于1989年發(fā)明,第一個公開發(fā)行版發(fā)行于1991年。Python是純粹的自由軟件,源代碼和解釋器CPython遵循GPL(GNUGeneralPublicLicense)協(xié)議[2]。Python語法簡潔清晰,特色之一是強(qiáng)制用空白符(whitespace)作為語句縮進(jìn)。
IEEE發(fā)布2017年編程語言排行榜:Python高居首位
。2.5OpenCV編程簡介
C++:面向?qū)ο缶幊?,效率高,?zhí)行速度快,但對編程能力要求較高。OpenCV計(jì)算機(jī)視庫的推出,極大降低了圖像處理的門檻,促進(jìn)了圖像處理的實(shí)際應(yīng)用。2.5OpenCV編程簡介
openCV是一個基于(開源)發(fā)行的跨平臺計(jì)算機(jī)視覺庫,可以運(yùn)行在Linux、Windows和MacOS操作系統(tǒng)上。2.5.1OpenCV簡介
OpenCV的第一個預(yù)覽版本于2000年在IEEEConferenceonComputerVisionandPatternRecognition公開,并且后續(xù)提供了5個測試版本。2006年發(fā)布1.0版2009年10月發(fā)布OpenCV2.0第二個主要版本,主要的更新是增加了C++接口并對現(xiàn)有實(shí)現(xiàn)進(jìn)行了優(yōu)化(特別是多核心特征),提供了使用更容易、類型更安全的新函數(shù)。目前最新版本是OpenCV2.4.8。2012年8月,OpenCV由一個非盈利性組織(OpenCV.org)來維護(hù),并保留了一個開發(fā)者網(wǎng)站()和用戶網(wǎng)站()。OpenCV的內(nèi)建模塊功能強(qiáng)大且靈活多樣,這些模塊能夠解決計(jì)算機(jī)視覺系統(tǒng)中的大多數(shù)問題??梢詫?shí)現(xiàn)人機(jī)互動、物體識別、圖象分割、人臉識別、動作識別、運(yùn)動跟蹤、機(jī)器人視覺、運(yùn)動分析、機(jī)器視覺、結(jié)構(gòu)分析等各種應(yīng)用領(lǐng)域的需求。OpenCV提供了合理的編程架構(gòu)、內(nèi)存管理及GPU支持。2.5.1OpenCV簡介圖像數(shù)據(jù)在計(jì)算機(jī)中表示為二維(灰度圖像)或三維矩陣(數(shù)組)(彩色圖像,多光譜圖像和高光譜圖像)
圖像處理中,以矩陣為處理對象的操作非常多。因此,設(shè)計(jì)以向量、矩陣(Mat)類為核心和多個計(jì)算機(jī)視覺應(yīng)用類和算法庫非常必要。2.5.1OpenCV簡介圖像數(shù)涉及到的一些運(yùn)算有:
(1)圖像加減法I1+I2,I1-I2;(2)圖像矩陣點(diǎn)乘I1.*I2(3)圖像矩陣相乘I1*I2(4)圖像中像素的運(yùn)算v1(r,g,b),向量的內(nèi)積、向量的模、向量的代數(shù)運(yùn)算
(5)圖像的直方圖,特征提取均體現(xiàn)為向量或矩陣2.5.1OpenCV簡介OpenCV提供的內(nèi)建模塊2.5.3OpenCV數(shù)據(jù)結(jié)構(gòu)在OpenCV2中設(shè)計(jì)并定義了大量的基本數(shù)據(jù)結(jié)構(gòu),主要采用類模板來實(shí)現(xiàn)。2維點(diǎn)Point_:2維點(diǎn)Point_類模板定義了公有數(shù)據(jù)成員x和y,重載了+、-、==、!=4個基本的操作,還定義了點(diǎn)乘、叉乘等操作。特別的這個類還提供了inside函數(shù)來判斷一個點(diǎn)是否在矩形區(qū)域內(nèi)。為了方便使用,OpenCV又對常用的類型進(jìn)行了類型重定義:typedefPoint_<int>Point2i;typedefPoint2iPoint;typedefPoint_<float>Point2f;typedefPoint_<double>Point2d;2.5.3OpenCV數(shù)據(jù)結(jié)構(gòu)2維點(diǎn)Point_#include<opencv2/core/core.hpp>#include<opencv2/highgui/highgui.hpp>usingnamespacestd;usingnamespacecv;intmain(){
Point2fa(0.3f,0.f),b(0.f,0.4f);Pointpt=(a+b)*10.f;
cout<<pt.x<<","<<pt.y<<endl;return0;}輸出的結(jié)果:3,42.5.3OpenCV數(shù)據(jù)結(jié)構(gòu)3維點(diǎn)Point3_類似于2維點(diǎn),OpenCV同時提供了Point3_類模板,只不過它是一個3維點(diǎn)(x,y,z)。它的常用類型是:typedefPoint3_<int>Point3i;typedefPoint3_<float>Point3f;typedefPoint3_<double>Point3d;2.5.3OpenCV數(shù)據(jù)結(jié)構(gòu)尺寸Size_類模板Size能夠訪問的成員變量是height和width。還定義了area函數(shù)來求面積。其他的操作基本都是類型轉(zhuǎn)化函數(shù)。它的常用類型是:typedefSize_<int>Size2i;typedefSize2iSize;typedefSize_<float>Size2f2.5.3OpenCV數(shù)據(jù)結(jié)構(gòu)矩形Rect_類模板矩形區(qū)域(x,y,width,height),(x,y)左上角坐標(biāo),范圍[x,x+width),[y,y+height)。rect=rect±point//矩形偏移rect=rect±size//改變大小rect+=point,rect-=point,rect+=size,rect-=sizerect=rect1&rect2//矩形交集rect=rect1|rect2//包含rect1rect2的最小矩形rect&=rect1,rect|=rect1rect==rect1,rect!=rect12.5.3OpenCV數(shù)據(jù)結(jié)構(gòu)旋轉(zhuǎn)矩形RotatedRect類除了基本的矩形之外,OpenCV還提供了一個可以旋轉(zhuǎn)的矩形RotatedRect,它是由中心、變長、旋轉(zhuǎn)角度決定的??梢栽L問它的這三個成員,也可以使用points函數(shù)返回它的4個頂點(diǎn),使用boundingRect求出它的外接矩形(非旋轉(zhuǎn))。RotatedRectrRect=RotatedRect(Point2f(100,100),Size2f(100,50),30);2.5.3OpenCV數(shù)據(jù)結(jié)構(gòu)小矩陣Matx類模板用來記錄一些小的矩形。這些矩形在編譯前大小就固定了:typedefMatx<float,1,2>Matx12f;typedefMatx<double,1,2>Matx12d;...typedefMatx<float,1,6>Matx16f;typedefMatx<double,1,6>Matx16d;typedefMatx<float,2,1>Matx21f;typedefMatx<double,2,1>Matx21d;...typedefMatx<float,6,1>Matx61f;typedefMatx<double,6,1>Matx61d;typedefMatx<float,2,2>Matx22f;typedefMatx<double,2,2>Matx22d;...typedefMatx<float,6,6>Matx66f;typedefMatx<double,6,6>Matx66d;如:Matx33fm(1,2,3,4,5,6,7,8,9);2.5.3OpenCV數(shù)據(jù)結(jié)構(gòu)短向量Vec類模板typedefVec<uchar,2>Vec2b;typedefVec<uchar,3>Vec3b;typedefVec<uchar,4>Vec4b;typedefVec<short,2>Vec2s;typedefVec<short,3>Vec3s;typedefVec<short,4>Vec4s;typedefVec<int,2>Vec2i;typedefVec<int,3>Vec3i;typedefVec<int,4>Vec4i;typedefVec<float,2>Vec2f;typedefVec<float,3>Vec3f;typedefVec<float,4>Vec4f;typedefVec<float,6>Vec6f;typedefVec<double,2>Vec2d;typedefVec<double,3>Vec3d;typedefVec<double,4>Vec4d;typedefVec<double,6>Vec6d;它支持加、減、數(shù)乘、相等、不等、求范數(shù)等運(yùn)算。2.5.3OpenCV數(shù)據(jù)結(jié)構(gòu)四維向量Scalar_類模板Scalar_類其實(shí)是用Vec<tp,4>派生下來的,也就是說,它是一個4元組:typedefScalar_<double>Scalar;他通常用來傳遞像素。Range類Range類用來指定連續(xù)的子序列,比如矩陣的一部分。2.5.3OpenCV數(shù)據(jù)結(jié)構(gòu)Matcv::Mat類是用于保存其它n維數(shù)組,主要用于保存圖像數(shù)據(jù),默認(rèn)情況下,定義cv::Mat類對象時,其大小為0×0。當(dāng)然,也可以給其構(gòu)造函數(shù)提供合適的實(shí)參,以定義需要的數(shù)據(jù)。如:cv::Matima(240,320,CV_8U,cv::Scalar(100));其中,CV_8U表示每個圖像像素用1字節(jié)表示,U表示無符號。也可以用S表示有符號數(shù)。對于彩色圖像,應(yīng)該使用3個通道用表示CV_8UC3。也可以是16位或32位整型CV_8SC3。也可以是32位或64位浮點(diǎn)數(shù)CV_32F。2.5.3OpenCV數(shù)據(jù)結(jié)構(gòu)Mat創(chuàng)建cv::Mat類對象2.5.3OpenCV數(shù)據(jù)結(jié)構(gòu)Mat訪問cv::Mat類對象的元素2.5.3OpenCV數(shù)據(jù)結(jié)構(gòu)Matcv::Mat類對象的表達(dá)式2.5.4讀入、顯示和存儲圖像讀圖像的源程序#include<iostream>//支持標(biāo)準(zhǔn)的輸入輸出#include<opencv2/core/core.hpp>//openCV核心模塊#include<opencv2/highgui/highgui.hpp>//支持簡單的界面usingnamespacestd;//命名空間stdusingnamespacecv;//命名空間cvintmain(){Matimage,result;//創(chuàng)建2個對象cout<<"size:"<<image.size().height<<","<<image.size().width<<endl;image=imread("tiger.jpg");if(!image.data){cout<<"readimagefilefail!"<<endl;
}namedWindow("OriginalImage");imshow("OriginalImage",image);flip(image,result,1);//水平翻轉(zhuǎn)圖像namedWindow("OutputImage");imshow("OutputImage",result);imwrite("output.bmp",result);waitKey(0);return0;}2.5.5操作圖像像素
at方法cv::Mat提供了一個at(inty,intx)函數(shù)模板以操作指定位置的矩陣元素,在使用時需要指定函數(shù)返回的數(shù)據(jù)類型,image.at<uchar>(j,i)=255;image.at<cv::Vec3b>(j,i)[channel]=value;2.5.5操作圖像像素
迭代器類似于STL庫的用法,OpenCV可以采用迭代器實(shí)現(xiàn)像素的操作。同樣,在使用迭代器時需要指定返回的數(shù)據(jù)類型,如:cv::MatIterator_<cv::Vec3b>it;//將Mat對象看作是容器cv::Mat_<cv::Vec3b>::iteratorit;2.5.5操作圖像像素使用指針cv::Mat提供了一個ptr(inti)函數(shù)模板以獲取指定行數(shù)據(jù)的首地址。利用這一地址即可實(shí)現(xiàn)像素的操作。同樣,在使用ptr(inti)函數(shù)時需要指定返回的數(shù)據(jù)類型,如:image.ptr<uchar>(i);整行整列像素值的賦值對于整行或者整列的數(shù)據(jù),可以考慮這種方式處理:img.row(i).setTo(Scalar(255));img.col(j).setTo(Scalar(255));2.5.6圖形交互和媒體接口HighGUI
OpenCV提供了功能強(qiáng)大的UI接口,可以在MFC、Qt、WinForms、Cocoa等平臺下使用。新版本的HighGUI接口包括:(1)創(chuàng)建并控制窗口,用于顯示圖片并記錄其內(nèi)容;(2)為窗口添加了滑桿控件(trackbars控件),可以方便利用鼠標(biāo)進(jìn)行控制;(3)讀寫硬盤和內(nèi)存的圖片;(4)讀取攝像頭的視頻、讀寫視頻文件。習(xí)題熟悉并理解openCV對圖像的主要操作。
編程實(shí)現(xiàn)對一幅圖像采樣與量化,并分析結(jié)果。
編程實(shí)現(xiàn)對一幅圖像的各種顏色模型轉(zhuǎn)換。
數(shù)字圖像處理DigitalImageProcessing目錄1.概論2.數(shù)字圖像處理基礎(chǔ)3.圖像增強(qiáng)4.圖像的幾何變換5.頻域處理6.數(shù)學(xué)形態(tài)學(xué)基礎(chǔ)7.圖像分割8.圖像特征與理解第三章圖像增強(qiáng)1.灰度變換2.直方圖修正3.圖像平滑4.圖像銳化5.偽彩色處理光照偏暗有霧圖像圖像增強(qiáng)目的1.圖像增強(qiáng)的目的:改善圖像的視覺效果或使圖像更適合于人或機(jī)器分析處理。2.從處理的作用域出發(fā),圖像增強(qiáng)可以分為空間域法和頻率域法。前者在空間域(或稱圖像空間)直接對像素進(jìn)行處理,后者在圖像的變換域內(nèi)處理,然后經(jīng)逆變換獲得增強(qiáng)圖像。3.本章將介紹灰度變換、直方圖、直方圖修正、圖像平滑、圖像銳化和偽彩色增強(qiáng)。3.1灰度變換
空域增強(qiáng)是指在由像素組成的空間直接對像素進(jìn)行增強(qiáng)的方法,可表示為:點(diǎn)處理:g(x,y)只依賴于輸入f(x,y),與其它像素?zé)o關(guān)區(qū)處理:g(x,y)依賴于f(x,y)及其周圍的點(diǎn)。
灰度變換是一種點(diǎn)處理,原圖像的像素灰度經(jīng)過某個變換函數(shù)變換成新的圖像灰度。3.1灰度變換
直接灰度變換灰度線性變換分段線性變換非線性變換直方圖修正直方圖均衡化直方圖規(guī)定化灰度變換3.1.1灰度線性變換假定原圖像f(x,y)的灰度范圍為[a,b],希望變換后圖像g(x,y)的灰度范圍擴(kuò)展至[c,d],則灰度線性變換可表示為:3.1.1灰度變換
灰度線性變換可通過下圖直觀表示:abdc3.1.1灰度變換
幾個例子(a)原始圖像(b)[0,255][255,0](c)[0,128][0,255](d)[0,128][64,255]3.1.2分段灰度變換
幾個例子取a=4,b=0對圖像進(jìn)行對比度增強(qiáng)變換方程為:y=ax+b3.1.2分段灰度變換
幾個例子取a=1,b=100將圖像所有灰度值上移變換方程為:y=ax+b3.1.2分段灰度變換
為了突出感興趣的灰度區(qū)間,相對抑制那些不感興趣的灰度區(qū)間,可采用分段線性變換。L-1abf(x,y)L-1cd3.1.2分段灰度變換
為了突出感興趣的灰度區(qū)間,相對抑制那些不感興趣的灰度區(qū)間,可采用分段線性變換。(a)原始圖像
(b)變換曲線
(c)輸出圖像3.1.3非線性變換非線性變換采用非線性變換函數(shù),以滿足特殊的處理需求。
典型的非線性變換函數(shù)有冪函數(shù)、對數(shù)函數(shù)、指數(shù)函數(shù)、閾值函數(shù)、多值量化函數(shù)、窗口函數(shù)等。3.1.3非線性變換冪律變換:圖像獲取、打印和顯示等設(shè)備的輸入輸出響應(yīng)通常為非線性的,滿足冪律關(guān)系。為了得到正確的輸出結(jié)果而對這種冪律關(guān)系進(jìn)行校正的過程就稱之為γ校正。3.2直方圖修正圖像直方圖是對像素的某種屬性(如灰度、顏色、梯度等)分布進(jìn)行統(tǒng)計(jì)分析的重要手段。
通過修正直方圖,可以增強(qiáng)圖像對比度;通過分析直方圖,有助于確定圖像分割的閾值;直方圖還可用于圖像匹配等操作。3.2.1直方圖的基本概念灰度直方圖是灰度級的函數(shù),它反映了圖像中每一灰度級出現(xiàn)的次數(shù)或頻率。
1234566432211664663456661466231364661234565456214灰度直方圖3.2.2直方圖的性質(zhì)所有的空間位置信息全部丟失。圖像與直方圖間的多對一關(guān)系。各子圖像的直方圖之和等于整幅圖像的直方圖。直方圖的分解多對一關(guān)系3.2.3直方圖的計(jì)算
灰度直方圖計(jì)算,依據(jù)定義,若圖像具有L(通常L=256,即8位灰度級)級灰度,則大小為M×N的灰度圖象f(x,y)的灰度直方圖Hist[0…L-1]可用如下算法得到:
1.初始化Hist[k]=0;k=0,…,L-12.統(tǒng)計(jì)gray=f(x,y);Hist[gray]=Hist[gray]+1;x,y=0,…,M-1,0,…,N-1
3.標(biāo)準(zhǔn)化Hist=Hist/(M*N)
其中,直方圖的標(biāo)準(zhǔn)化是一個可選項(xiàng),若不需要進(jìn)行特殊處理可以不進(jìn)行此操作。3.2.3直方圖的計(jì)算彩色圖像是指每個像素的信息由RGB三原色構(gòu)成的圖像,其中RGB是由不同的灰度級來描述的。3.2.3直方圖的計(jì)算統(tǒng)計(jì)圖像中每一種顏色出現(xiàn)的次數(shù),可得到彩色圖像直方圖。偽代碼如下:
Im;//彩色圖像Hist(256,256,256)=0;//初始化直方圖數(shù)組
fori=1:heightforj=1:widthRed=Im(i,j,1);Green=Im(i,j,2);Blue=Im(i,j,3);Hist(Red,Green,Blue)=Hist(Red,Green,Blue)+1;endendHist=Hist/(height*width);//直方圖規(guī)范化3.2.4直方圖均衡化
直方圖均衡化的基本思想是把原始圖像的直方圖變換為均勻分布的形式,從而增加圖像灰度的動態(tài)范圍,達(dá)到增強(qiáng)圖像對比度的效果。
經(jīng)過均衡化處理的圖像,此時圖像的熵最大,圖像所包含的信息量最大。0rHA(r)0rs0sHB(s)255255drds熵:3.2.4直方圖均衡化
設(shè)r為灰度變換前的歸一化灰度級(0≤r≤1),T(r)為變換函數(shù),s=T(r)為變換后的歸一化灰度級(0≤r≤1),變換函數(shù)T(r)滿足下列條件:
在0≤r≤1區(qū)間內(nèi),T(r)單調(diào)增加;在0≤r≤1區(qū)間內(nèi),0≤T(r)≤1;3.2.4直方圖均衡化對圖像A(x,y),灰度范圍為[0,L],其圖像的直方圖為HA(r)歸一化:概率密度函數(shù)為:概率分布函數(shù)為:變換函數(shù)s=T(r)將輸入圖像A(x,y)轉(zhuǎn)換為輸出圖像B(x,y)??傁袼攸c(diǎn)數(shù):3.2.4直方圖均衡化HB(s)為均衡化后的直方圖,每個灰度值具有相同的概率。因此,可簡寫HB(s)=C;PB(s)=C/A0。
根據(jù)直方圖的含義,經(jīng)過灰度變換后對應(yīng)的小面積元相等。0rHA(r)0rs0sHB(s)255255drds3.2.4直方圖均衡化0rHA(r)0rs0sHB(s)255255drds3.2.4直方圖均衡化
離散情況:
舉例:f為原始圖像,對f進(jìn)行直方圖均衡化(1)求出原圖f的灰度直方圖h,設(shè)為h。h為一個10維的向量。1399821373360646820529260fh031224344151647182933.2.4直方圖均衡化
舉例:f為原始圖像,對f進(jìn)行直方圖均衡化(2)求出圖像f的總體像素個數(shù)Nf=m×n(m,n分別為圖像的長和寬),計(jì)算每個灰度級的像素個數(shù)在整個圖像中所占的百分比。hs(i)=h(i)/Nf(i=0,1,…,9)h03122434415164718293hs00.1210.0820.1630.1640.0450.0460.1670.0480.0890.123.2.4直方圖均衡化
舉例:f為原始圖像,對f進(jìn)行直方圖均衡化(3)計(jì)算圖像各灰度級的累計(jì)分布hp
hshp00.1210.0820.1630.1640.0450.0460.1670.0480.0890.1200.1210.2020.3630.5240.5650.6060.7670.8080.8891.003.2.4直方圖均衡化
舉例:f為原始圖像,對f進(jìn)行直方圖均衡化(4)計(jì)算圖像各灰度級的累計(jì)分布hp
1399821373360646820529260fg1.84.7997.93.21.84.77.24.74.76.806.82.26.87.93.205.43.293.26.80hp00.1210.2020.3630.5240.5650.6060.7670.8080.8891.003.2.4直方圖均衡化
直方圖均衡化結(jié)果演示3.3圖像平滑
圖像平滑的主要目的是消除噪聲或模糊圖像,去除小的細(xì)節(jié)或彌合目標(biāo)間的縫隙。
從信號頻譜角度來看,信號緩慢變化的部分在頻率域表現(xiàn)為低頻,而迅速變化的部分表現(xiàn)為高頻。(a)原圖像(b)平滑后3.3.1圖像噪聲
圖像噪聲,是圖像在處理、存儲、傳輸過程中所受到的隨機(jī)干擾信號。噪聲可以理解為“妨礙人們感覺器官對所接收的信源信息理解的因素”。(比如電視上的雪花點(diǎn))噪聲也可以理解為不可預(yù)測的,只能用概率統(tǒng)計(jì)方法來認(rèn)識的隨機(jī)誤差。噪聲可以借用隨機(jī)過程及其概率密度函數(shù)來描述,通常用其數(shù)字特征,如均值、方差等。3.3.1圖像噪聲(1)按照產(chǎn)生原因,圖像噪聲可分為外部噪聲和內(nèi)部噪聲。(2)按照統(tǒng)計(jì)特性,圖像噪聲可分為平穩(wěn)噪聲和非平穩(wěn)噪聲。(3)按照幅度分布,圖像噪聲可以分為高斯噪聲、椒鹽噪聲等。(4)按照噪聲頻譜,圖像噪聲可以分為白噪聲和1/f噪聲等。(5)按噪聲和信號之間的關(guān)系,圖像噪聲可分為加性噪聲和乘性噪聲。加性噪聲乘性噪聲3.3.1圖像噪聲
圖像噪聲的特點(diǎn)噪聲在圖像中的分布和大小不規(guī)則,即具有隨機(jī)性。噪聲一般與圖像具有相關(guān)性。噪聲具有疊加性。在串聯(lián)圖像傳輸系統(tǒng)中,各個串聯(lián)部件引起的噪聲疊加起來,造成信噪比下降。3.3.2模板卷積
模板操作是數(shù)字圖像處理中常用的一種鄰域運(yùn)算方式,主要有卷積和相關(guān)2種,可以實(shí)現(xiàn)圖像平滑、圖像銳化、邊緣檢測等功能。卷積是最近流行的卷積神經(jīng)網(wǎng)絡(luò)(深度學(xué)習(xí))最主要的操作之一。https:///questions/114385/what-is-the-difference-between-convolutional-neural-networks-restricted-boltzma
模板圖像3.3.2模板卷積
模板卷積(或相關(guān))是指模板與圖像進(jìn)行卷積(或相關(guān))運(yùn)算,是一種線性濾波,其輸出像素是輸入鄰域像素的線性加權(quán)和。卷積相關(guān)卷積與相關(guān)運(yùn)算的主要區(qū)別在于卷積運(yùn)算前需要將模板繞模板中心旋轉(zhuǎn)180°,因其余運(yùn)算過程一致而統(tǒng)稱為模板卷積。3.3.2模板卷積卷積舉例評估一個地區(qū)化工廠污染物的排放量:(1)假設(shè)t時刻化工廠污染物的排放量是f(t)g;(2)被排放的藥物在排放后Δt時刻的殘留比率是g(Δt)
g/g;(3)在u時刻,對于t時刻排放出來的污染物,它們對應(yīng)的Δt=u-t。從t1時刻到當(dāng)前時刻u,污染物的總殘余量為:3.3.2模板卷積
模板卷積中的模板又稱為卷積核,其元素稱為卷積系數(shù)、模板系數(shù)或加權(quán)系數(shù),其大小及排列順序決定了對圖像進(jìn)行鄰域處理的類型?;静襟E如下:(1)模板在輸入圖像上移動,讓模板原點(diǎn)與某個輸入像素f(i,j)重合;(2)模板系數(shù)與模板下對應(yīng)的輸入像素相乘,再將乘積相加求和;(3)將第(2)步的運(yùn)算結(jié)果賦予與模板原點(diǎn)對應(yīng)像素的輸出g(i,j)。3.3.2模板卷積模板操作需注意兩點(diǎn)(1)圖像邊界問題。(2)計(jì)算結(jié)果可能超出灰度范圍。(1)通過padding(擴(kuò)充圖像邊界)處理邊界點(diǎn)不能進(jìn)行卷積的問題。(2)采用ReLU函數(shù),使得卷積結(jié)果小于零的置為0。在卷積神經(jīng)網(wǎng)絡(luò)中:3.3.2模板卷積
卷積運(yùn)算優(yōu)化:模板卷積是一種非常耗時的運(yùn)算,尤其是模板尺寸較大時。以3×3模板為例,每次模板運(yùn)算需要9次乘法、8次加法和1次除法。
將二維模板分解為多個一維模板,可有效減少運(yùn)算量。
在卷積神經(jīng)網(wǎng)絡(luò)中,將二維模板拆成多個一維模板來實(shí)現(xiàn)卷積,也是常用的技巧之一,減少了參數(shù)個數(shù),并降低運(yùn)算量。3.3.3鄰域平均
鄰域平均法是一種線性低通濾波器,其思想是用與濾波器模板對應(yīng)的鄰域像素平均值或加權(quán)平均值作為中心像素的輸出結(jié)果,以便去除突變的像素點(diǎn),從而濾除一定的噪聲。鄰域平均的卷積核系數(shù)之和為1。3.3.3鄰域平均鄰域平均法中常用的兩個模板鄰域平均法的主要優(yōu)點(diǎn)是算法簡單,但它在降低噪聲的同時使圖像產(chǎn)生模糊,特別是在邊緣和細(xì)節(jié)處。模板尺寸越大,則圖像模糊程度越大。3.3.3鄰域平均鄰域平滑舉例121431223457689576885678912143122345768957688567893444566783.3.3鄰域平均加權(quán)模板(Weightedaveragefilter)3.3.4中值濾波
中值濾波是一種非線性濾波,它能在濾除噪聲的同時很好地保持圖像邊緣。中值濾波把以某像素為中心的小窗口內(nèi)的所有像素的灰度按從小到大排序,取排序結(jié)果的中間值作為該像素的灰度值。121431223457689576885678912143122345768957688567892345666783.3.4中值濾波中值濾波性質(zhì)不影響階躍信號、斜坡信號.中值濾波的輸出與輸入噪聲的密度分布有關(guān)。中值濾波頻譜特性起伏不大,可以認(rèn)為中值濾波后,信號頻譜基本不變。3.3.4中值濾波中值濾波演示3.3.4中值濾波鄰域平滑與中值濾波比較(a)椒鹽噪聲圖像
(b)圖(a)的均值濾波(c)圖(a)的中值濾波(d)圖(a)的高斯平滑(e)高斯噪聲圖像
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 五年級數(shù)學(xué)口算題
- 青島版數(shù)學(xué)七年級上冊5.2《代數(shù)式》聽評課記錄
- 魯教版地理六年級下冊6.2《自然環(huán)境》聽課評課記錄3
- 蘇教版三年級下冊《兩位數(shù)乘整十?dāng)?shù)的口算》教案
- 委托經(jīng)營管理協(xié)議書范本
- 蘇州蘇教版三年級數(shù)學(xué)上冊《周長是多少》聽評課記錄
- 產(chǎn)品銷售合作協(xié)議書范本(代理商版本)
- 書稿專用版權(quán)合同范本
- 酒店房屋出租辦公經(jīng)營協(xié)議書范本
- 部編版道德與法治九年級下冊《1.2復(fù)雜多變的關(guān)系》聽課評課記錄
- 義務(wù)教育數(shù)學(xué)新課標(biāo)課程標(biāo)準(zhǔn)2022年版考試真題與答案
- 新加坡房子出租合同范本
- 英語語法基礎(chǔ)知識大全
- 河南省安陽市2024年中考一模語文試卷(含答案)
- TD/T 1044-2014 生產(chǎn)項(xiàng)目土地復(fù)墾驗(yàn)收規(guī)程(正式版)
- 2024年湖南現(xiàn)代物流職業(yè)技術(shù)學(xué)院單招職業(yè)適應(yīng)性測試題庫及答案1套
- (正式版)JTT 1499-2024 公路水運(yùn)工程臨時用電技術(shù)規(guī)程
- 2024年職業(yè)技能測試題庫500道【基礎(chǔ)題】
- 垃圾桶創(chuàng)新設(shè)計(jì)說明書
- 《游戲界面設(shè)計(jì)專題實(shí)踐》課件-知識點(diǎn)1:游戲圖標(biāo)設(shè)計(jì)定義、分類與設(shè)計(jì)原則
- 病案信息技術(shù)(中級)考試真題及答案5篇
評論
0/150
提交評論