第一章-數(shù)字圖像處理基礎(chǔ)課件_第1頁
第一章-數(shù)字圖像處理基礎(chǔ)課件_第2頁
第一章-數(shù)字圖像處理基礎(chǔ)課件_第3頁
第一章-數(shù)字圖像處理基礎(chǔ)課件_第4頁
第一章-數(shù)字圖像處理基礎(chǔ)課件_第5頁
已閱讀5頁,還剩112頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第一章數(shù)字圖像處理基礎(chǔ)第一章數(shù)字圖像處理基礎(chǔ)1數(shù)字圖像處理2014年11月數(shù)字圖像處理3教學安排課堂授課、項目與實驗安排課堂授課,36學時第一章數(shù)字圖像處理基礎(chǔ)(5學時)第二章圖像變換(4學時)第三章圖像增強(9學時)第四章圖像復(fù)原(5學時)第五章圖像分割(5學時)第六章彩色圖像處理(4學時)習題分析與討論(4學時)項目與實驗,4(課內(nèi))+4(課外)學時項目,見《數(shù)字圖象處理》課程項目實施方案項目名稱:面部自動定位實施模式:4-5人一組合作完成項目考核方式:項目:成果檢查50%,項目報告50%實驗,6個實驗,見實驗指導(dǎo)書(選做)考核方式平時(出勤、課堂討論、課后作業(yè)):10%,項目與實驗:30%,考試:60%教材、參考書目首選教材:數(shù)字圖像處理,自編講義,2012二選教材:K.R.Castleman,數(shù)字圖像處理,電子工業(yè)出版社,2011參考書目:(1)R.C.Gonzalez,數(shù)字圖像處理(第3版),電子工業(yè)出版社,2011;(2)W.K.Pratt,數(shù)字圖像處理(原書第4版),機械工業(yè)出版社,20103教學安排課堂授課、項目與實驗安排3緒論緒論4緒論什么是數(shù)字圖像處理?數(shù)字圖像處理(DigitalImageProcessing)是一個迅速發(fā)展的專業(yè)領(lǐng)域。它的主要目的是將圖像信號轉(zhuǎn)換成數(shù)字信號并利用計算機對其進行處理和加工,以便提取圖像中的信息。5緒論什么是數(shù)字圖像處理?5這是什么圖像?6這是什么圖像?6什么是圖像?圖像?這玩意兒,你不問我還清楚這是什么;你要真問起來,我反倒不知道該如何解釋它了。卡斯爾曼:一幅圖像就是指某些事物的表示,并包含關(guān)于目標的描述性信息。你會如何定義?眾所周知的事情正因為眾所周知而不為人所知7什么是圖像?圖像?這玩意兒,你不問我還清楚這是什么;你要真問什么是圖像?圖像的類型圖像以各種不同的形式出現(xiàn):數(shù)學上連續(xù)的、離散的是一種二維函數(shù)f(x,y),其中x,y是空間(平面)坐標,幅度f

稱為亮度或灰度物理上:某種物質(zhì)或能量的分布可見的、不可見的8什么是圖像?圖像的類型8什么是數(shù)字圖像處理處理連續(xù)的、離散的數(shù)字圖像 一個2D數(shù)字化采樣值的方形陣列,只有數(shù)字圖像才能用計算機處理 以相等間隔采樣的方形格柵模式(光柵),并 以等幅度間隔量化給出一些連續(xù)和離散圖像處理的例子?9什么是數(shù)字圖像處理處理給出一些連續(xù)和離散圖像處理的例子?9為什么要數(shù)字圖像處理?應(yīng)用需求圖像是人們獲取和交換信息的主要來源,因此數(shù)字圖像處理的應(yīng)用領(lǐng)域必然涉及人類生活和工作的方方面面。技術(shù)進步計算機:不斷增長的性能和不斷降低的價格圖像數(shù)字化與顯示設(shè)備的不斷出現(xiàn)–

數(shù)字相機,掃描儀,視頻捕獲設(shè)備,…–CRT,LCD,打印機,…10為什么要數(shù)字圖像處理?應(yīng)用需求10為什么要數(shù)字圖像處理?具有的獨特優(yōu)勢圖像數(shù)字化,以便于圖像的傳輸、打印和存儲圖像的增強和復(fù)原,改善圖像質(zhì)量圖像的分割和描述,獲得圖像的信息大量圖像的高速處理三維及更高維圖像數(shù)據(jù)的測量和顯示(如遙感圖像和各種內(nèi)臟器官及血管形狀的測量與顯示)11為什么要數(shù)字圖像處理?具有的獨特優(yōu)勢11應(yīng)用舉例醫(yī)學和生物學成像:CT,B超,磁共振…工業(yè):

機器視覺,自動控制,…空間:

航空,導(dǎo)航,遙感(森林,環(huán)境,資源),…監(jiān)控:視頻監(jiān)控,牌照識別,人臉識別,…軍事:偵察,導(dǎo)航,聲納成像,…藝術(shù)等12應(yīng)用舉例醫(yī)學和生物學成像:CT,B超,磁共振…12成像的能量源電磁能量譜: Gamma-射線,X-射線,紫外,可見光,紅外,微波,無線電波: CT(computerizedtomography),MRI(MagneticResonanceImaging),EIT(ElectricalImpedanceTomography)聲波與超聲波:B超,聲納電子:電子顯微鏡計算機圖形學根據(jù)能量源的圖像分類:13成像的能量源電磁能量譜:根據(jù)能量源的圖像分類:13Gamma射線成像PET(positronemissiontomography):正電子射線層析術(shù)Cygnus:天鵝座14Gamma射線成像PET(positronemissionX射線成像Aorticangiogram:大動脈血管造影Anatomical:解剖的,解剖學的15X射線成像Aorticangiogram:大動脈血管造影1顯微成像Taxol紅豆杉醇cholesterol膽固醇Nickeloxide鎳氧化物organicsuperconducting有機超導(dǎo)16顯微成像16多頻譜成像17多頻譜成像17光學成像Intraocularimplant:眼內(nèi)植入18光學成像Intraocularimplant:眼內(nèi)植入18光學成像19光學成像19紅外成像20紅外成像20磁共振成像,MRI21磁共振成像,MRI21超聲波成像Thyroid:甲狀腺,甲狀軟骨22超聲波成像Thyroid:甲狀腺,甲狀軟骨22計算機圖形學Fractal:分維23計算機圖形學Fractal:分維23圖像處理系統(tǒng)的基本步驟24圖像處理系統(tǒng)的基本步驟24一個典型的通用圖像處理系統(tǒng)–輸入Input–存儲Storage–處理器Processor–輸出Output25一個典型的通用圖像處理系統(tǒng)–輸入Input2526廣義圖像非光學圖像高維圖像(包括多頻譜圖像)非標準采樣的圖像非標準量化的圖像圖像處理

與圖像分析圖像處理是指為了能更好地觀察圖像或其他目的而產(chǎn)生一個修改了的圖像圖像分析把圖像轉(zhuǎn)換成某種非圖像的形式,諸如目標的數(shù)量、類型、尺寸等計算機圖形學:

關(guān)于用計算機產(chǎn)生圖像的學科計算機視覺:對景物進行解釋某些相關(guān)術(shù)語26廣義圖像某些相關(guān)術(shù)語26如何學習?閱讀教科書參考文獻討論課堂、小組項目與實驗MATLAB自己動手!27如何學習?閱讀自己動手!27第一章數(shù)字圖像處理基礎(chǔ)第一章數(shù)字圖像處理基礎(chǔ)28提要1.1人眼的視覺1.2圖像獲取1.3圖像數(shù)字化1.4數(shù)字圖像表達1.5數(shù)字圖像質(zhì)量29提要1.1人眼的視覺2929301.1人眼的視覺為什么要討論人類視覺系統(tǒng)

(HumanVisionSystem,HVS)

?圖像的信息來源于觀察。數(shù)字圖像處理的目的在于提供與觀察者的視覺能力相匹配的圖像輸出,以便于觀察者理解和解釋圖像的內(nèi)容,提取圖像信息。人們從外界所獲取的信息中有80%是通過視覺獲得的。通過HVS,人們能感知外界物體的大小、形狀、顏色、明暗、動靜和遠近等。數(shù)字圖像處理是從模擬人類的視覺開始的。盡管數(shù)字圖像處理系統(tǒng)已可以完成相當多的工作,但其性能比起HVS來說還差得很遠。理解人類視覺特性,有助于開發(fā)模擬人眼視覺過程的模型,并對圖像處理系統(tǒng)的設(shè)計具有重要的指導(dǎo)作用。301.1人眼的視覺為什么要討論人類視覺系統(tǒng)

(Huma3031視覺生理和視覺心理通過人眼所形成的圖像包括物理范疇的像和心理范疇的像:即來自外界物體的光線,通過人眼的折光系統(tǒng)在視網(wǎng)膜上所形成的物象,它與外界物體通過照相機中的透鏡組在底片上成像并無原則上的區(qū)別;而來自視網(wǎng)膜的神經(jīng)信息,則通過人腦的神經(jīng)信息處理在視覺中樞內(nèi)形成主觀意識上的映像。以下分別從視覺生理和心理兩個方面來討論人眼的視覺特性。31視覺生理和視覺心理通過人眼所形成的圖像包括物理范疇的像和3132人眼視覺系統(tǒng)(視覺生理)左圖是人的右眼水平切面結(jié)構(gòu)圖。眼內(nèi)與產(chǎn)生視覺直接有關(guān)的結(jié)構(gòu)是眼睛的折光系統(tǒng)和感光系統(tǒng)。折光系統(tǒng)由角膜、房水、晶狀體和玻璃體組成。視網(wǎng)膜含有對光刺激高度敏感的視桿細胞和視錐細胞,能將外界光刺激所包含的視覺信息轉(zhuǎn)變成電信號,并在視網(wǎng)膜內(nèi)進行編碼、加工,再由視神經(jīng)傳向視覺中樞作進一步分析,最后形成視覺。32人眼視覺系統(tǒng)(視覺生理)左圖是人的右眼水平切面結(jié)構(gòu)圖。眼32亮度與顏色視覺視桿細胞(RodCell)在光線較暗時活動,有較高的光敏度,但不能作精細的空間分辨,且不參與色覺。在較明亮的環(huán)境中以視錐細胞(ConeCell)為主,它能提供色覺以及精細視覺。(亮視覺和暗視覺)顏色視覺是指對不同顏色的識別,即不同波長的光線作用于視網(wǎng)膜后在人腦引起不同的主觀映像。正常視網(wǎng)膜可分辨波長380-760nm之間的上百種不同的顏色,每種顏色都與一定波長的光線相對應(yīng)。視網(wǎng)膜中并不存在上百種對不同波長起反應(yīng)的視錐細胞。早在19世紀初期,Young和Helmholtz就提出了三原色理論。該理論認為在視網(wǎng)膜上分布著三種不同的視錐細胞,分別含有對紅、綠、藍三種光敏感的視色素。當某一波長的光線作用于視網(wǎng)膜時,可以一定的比例使三種視錐細胞分別產(chǎn)生不同程度的興奮,這樣的信息傳至中樞,就產(chǎn)生某一種顏色的感受。33亮度與顏色視覺視桿細胞(RodCell)在光線較暗時活動,33亮度與顏色視覺近年來,通過實驗確定,在視網(wǎng)膜中存在三種基本類型的視錐細胞。這些視錐細胞具有不同的吸收特征,該特征是波長的函數(shù),在光譜的紅、綠和藍區(qū)域具有峰值吸收。存在三種視錐細胞,這為彩色視覺的三原色理論提供了生理機能的基礎(chǔ)。當光刺激激活一個視桿細胞或視錐細胞,就發(fā)生一個感光換能反應(yīng),產(chǎn)生一個神經(jīng)脈沖。神經(jīng)脈沖通過視覺系統(tǒng)傳播的方式至今還不是十分清楚。知道的是視神經(jīng)束包含800000量級的神經(jīng)纖維。34三種錐狀細胞的相對視敏函數(shù)曲線相對視敏函數(shù)曲線亮度與顏色視覺近年來,通過實驗確定,在視網(wǎng)膜中存在三種基本類34視覺心理視覺心理是指外界視覺刺激帶來的感覺、知覺、認知等人內(nèi)心的各種情感形式。外界的各種事情經(jīng)由視覺系統(tǒng)接受后,其反應(yīng)在很多情形下與外界的物理特性不一定相同。對于圖像、風景的主觀視覺反應(yīng),由于經(jīng)過高層次復(fù)雜反應(yīng)的合成,因而變得非常復(fù)雜。以下介紹幾種效應(yīng)或效果。35視覺心理視覺心理是指外界視覺刺激帶來的感覺、知覺、認知等人內(nèi)35主觀亮度Scotopic:暗視的,rods視桿細胞;Photopic:明視覺的,cones視錐細胞主觀亮度Scotopic:暗視的,rods視桿細胞;36亮度辨別力韋伯比(Webratio)ΔB/B:大約為2%,但在暗和亮的區(qū)域該值升高。亮度辨別力韋伯比(Webratio)ΔB/B:大約為23738馬赫效應(yīng)在亮度突變處,視覺的主觀感受出現(xiàn)虛幻的亮或暗的條紋。因Mach效應(yīng)而對人眼所見景物有增強其輪廓的作用。38馬赫效應(yīng)在亮度突變處,視覺的主觀感受出現(xiàn)虛幻的亮或暗的條3839從信號處理的角度,這是一個什么濾波器?39從信號處理的角度,這是一個什么濾波器?39側(cè)抑制與側(cè)激勵神經(jīng)叢40側(cè)抑制與側(cè)激勵神經(jīng)叢40臨界閃爍融合頻率CFF

(CriticalFlickerFusionFrequency)對于閃爍的光源,當閃爍頻率增大到某一數(shù)值的時候,就能感覺到它是連續(xù)光源,這種現(xiàn)象叫閃爍融合,這時的頻率叫閃爍融合頻率(簡稱閃頻值)。由于幀率大于CFF,運動圖像看起來就是連續(xù)的討論:TV(PAL,NTSC),HDTV、電影等的幀率?人眼視覺暫留效應(yīng)(0.05-0.2秒)41臨界閃爍融合頻率CFF

(CriticalFlicker42同心圓錯覺42同心圓錯覺4243Jastrow錯覺43Jastrow錯覺4344Muler-Lyer錯覺44Muler-Lyer錯覺4445對比效應(yīng),一方使另一方向自己相反性質(zhì)或程度方向變化的效果。誘導(dǎo)效應(yīng),有多個對象時,一方對另一方、量多者對量少者(或者相反)施加影響而產(chǎn)生的知覺。在圖像顯示中如何利用?也可以考慮作為補充或強調(diào)等特殊手段來使用。45對比效應(yīng),一方使另一方向自己相反性質(zhì)或程度方向變化的效果4546同時對比相同亮度的目標物(方塊)放在不同亮度的背景上,給人眼的亮度感覺是不同的。這種效應(yīng)是由背景的不同引起的。在照明光源中的應(yīng)用?白平衡?46同時對比相同亮度的目標物(方塊)放在不同亮度的背景上,給4647HVS模型波長敏感接收器的輸出饋入到一種代表人眼光學部分的低通線性系統(tǒng)H1,后面跟隨著一個表示視桿或視錐細胞的非線性強度響應(yīng)的一個單調(diào)非線性系統(tǒng),接著橫向抑制過程通過一個具有帶通響應(yīng)的線性系統(tǒng)H2來描述,而人眼神經(jīng)暫存響應(yīng)限制引起的延遲和滯后則由一個線性時間傳遞函數(shù)H3來模型化。47HVS模型波長敏感接收器的輸出饋入到一種代表人眼光學部分471.2圖像獲取

根據(jù)成像原理和方法的不同,可分成數(shù)字圖像(例如數(shù)碼照片、CT圖像)和模擬圖像(例如TV圖像和X光片);本節(jié)主要討論模擬圖像輸入到計算機中的圖像獲取技術(shù)。圖像獲取裝置按其有無機械掃描、有無透鏡和濾色鏡等光學系統(tǒng)、攝像器件種類等要素進行組合,有多種方式。常用的圖像獲取方式有利用掃描儀和利用攝像機的兩種。1.2圖像獲取根據(jù)成像原理和方法的不同,可分成數(shù)字圖像(48掃描儀

掃描儀就是能夠把照片、圖畫以及寫在紙上的原稿等二維圖像分解成一維像素串,并將像素的光信號轉(zhuǎn)換為電信號的裝置。每個像素由光信號變換為電信號的過程稱為光電變換。傳真機和電子式復(fù)印機的輸入,與圖形掃描儀同樣,都利用掃描和光電變換。掃描在歷史上有過各種各樣的方法,大體上可分為機械式和電子式兩類。機械式的一個實用化例子是圖1-7所示的平臺掃描方式和圓筒掃描方式。

掃描儀掃描儀就是能夠把照片、圖畫以及寫在紙上的原稿等二維圖49相機

相機是目前應(yīng)用領(lǐng)域和應(yīng)用范圍最廣的圖像獲取手段。相機的主要成像器件有CCD和CMOS兩種圖像傳感器?;境上襁^程都包括光電轉(zhuǎn)換、電荷收集、信號轉(zhuǎn)換與輸出等步驟。現(xiàn)在的數(shù)碼相機通常都可拍攝靜止圖片和運動視頻。集成有成像芯片和DSP板卡的數(shù)碼相機和攝影機能夠直接輸出數(shù)字信號,只要選用合適(計算機支持)的數(shù)字接口(例如網(wǎng)絡(luò)、USB、IEEE1394等),就可以輸入到計算機中。在某些需要實時完成高速、大數(shù)據(jù)量的視頻圖像采集的應(yīng)用中,往往需要借助視頻/圖像采集卡將攝像機輸出的圖像信號采集到計算機中?;谙鄼C和采集卡的方式,不像掃描儀中有固定的照明,攝取對象大多是實際景物,光照條件易發(fā)生變化。

相機相機是目前應(yīng)用領(lǐng)域和應(yīng)用范圍最廣的圖像獲取手段。相機的501.3圖像數(shù)字化 一個量化采樣值的2D方形陣列什么是數(shù)字化

?如何數(shù)字化

?性能與指標數(shù)字化及其組成511.3圖像數(shù)字化 一個量化采樣值的2D方形陣列511.3.1什么是數(shù)字化

?把圖像從其原來的形式轉(zhuǎn)換成數(shù)字形式什么是圖像的數(shù)字形式?521.3.1什么是數(shù)字化?把圖像從其原來的形式轉(zhuǎn)換成數(shù)字形5353圖像的數(shù)字形式:0-D554圖像的數(shù)字形式:0-D554圖像的數(shù)字形式:1-D[56666544321]55圖像的數(shù)字形式:1-D[56666544圖像的數(shù)字形式:2-D[56666544321566665443215666654432156666544321]f(1,5)=6Rasterscanning光柵掃描56圖像的數(shù)字形式:2-D[56666544如何數(shù)字化

?57如何數(shù)字化?57如何數(shù)字化?假設(shè)模擬圖像f(x,y)的f表示灰度,其數(shù)值稱作灰度值。采樣:是從連續(xù)空間(x,y)中獲取灰度值f的樣本的操作。量化:將樣本的灰度由實數(shù)向整數(shù)進行變換表達的操作(模數(shù)轉(zhuǎn)換)掃描:實際進行采樣、量化的順序和方法。(圖像內(nèi)像素位置的尋址)58如何數(shù)字化?假設(shè)模擬圖像f(x,y)的f表示灰度,其數(shù)值稱作1.3.2采樣采樣格子間隔越小,圖像就越清晰;縮小采樣間隔,圖像尺寸在變大的同時數(shù)據(jù)量也將迅速增加。591.3.2采樣采樣格子間隔越小,圖像就越清晰;59采樣定理模擬信號f(x)不含有比ξmax更高的頻率成分時,與x相關(guān)的間隔為(1/(2ξmax))的f(x)樣本值序列可以完全決定f(x)。60采樣定理模擬信號f(x)不含有比ξmax更高的頻率成分時,與關(guān)于采樣的進一步討論采樣函數(shù)

x=m⊿x,y=n⊿y

(m,n=0,±1,±2,……)采樣函數(shù)定義:61關(guān)于采樣的進一步討論采樣函數(shù)61關(guān)于采樣的進一步討論設(shè)

f(x,y)-原圖像;fs(x,y)-采樣后圖像則:fs(x,y)=f(x,y)s(x,y)分別作傅立葉變換,令:f(x,y)

F(u,v);s(x,y)

S(u,v);fs(x,y)

Fs(u,v)有:Fs(u,v)=F(u,v)*S(u,v)62關(guān)于采樣的進一步討論設(shè)f(x,y)-原圖像;fs(x,y關(guān)于采樣的進一步討論根據(jù)卷積定理,及⊿u=1/⊿x;⊿v=1/⊿y有:說明:采樣圖像的頻譜是原始連續(xù)圖像頻譜在空間域上的無限重復(fù),周期為:1/⊿x(u方向),1/⊿y

(v方向)63關(guān)于采樣的進一步討論根據(jù)卷積定理,及⊿u=1/⊿x;關(guān)于采樣的進一步討論設(shè)原始圖像是有限帶寬的,即:適當選取⊿x,⊿y

,可Fs(u,v)相鄰周期頻譜互不重疊.64關(guān)于采樣的進一步討論設(shè)原始圖像是有限帶寬的,即:適當選取⊿x采樣圖像失真圖像失真當采樣間隔大于奈奎斯特間隔(Δx>(1/(2ξmax))時,由于比1/2采樣頻率高的頻率成分折返混入低頻域,所以稱作折疊噪聲(foldingnoise)。由于在與原本存在的頻率不同的頻率中混疊(alias)產(chǎn)生該信號,該現(xiàn)象稱為圖像失真或混疊現(xiàn)象(aliasing)。對于具有周期性構(gòu)造的圖像,在用與該周期性構(gòu)造具有一定幾何關(guān)系的采樣格子進行采樣時,將會產(chǎn)生波紋圖案(moirepattern)或莫爾條紋(moirefringes)。如圖所示的圖例中,可以看到原本圖像中不存在的墻壁面的周期性條紋。波紋圖案65采樣圖像失真圖像失真當采樣間隔大于奈奎斯特間隔(Δx>(1/1.3.3量化661.3.3量化66量化采樣后得到的圖像樣本值,仍為連續(xù)值。在分級量化中,提取樣本的連續(xù)值變換為離散值。分級量化的數(shù)值一般稱作量化級,在圖像數(shù)字化處理中也稱為灰度級或像素值。由于計算機使用二進制,灰度級Q為2n時,稱作n比特量化級。例如,在256量化級數(shù)情況下,叫做8比特量化級。這時,各像素按8比特表示灰度級,所以該像素也稱為8比特像素。67量化采樣后得到的圖像樣本值,仍為連續(xù)值。在分級量化中,提取樣量化均勻量化把原圖像灰度層次從最暗至最亮均勻分為有限個層次,即:把整個取值范圍[r0,rk]均勻地分為k個子區(qū)間[ri,ri-1],i=0,1,2,…,k-1。K常取2n。量化輸出數(shù)據(jù)采樣輸入樣本均勻量化間隔68量化均勻量化量化輸出數(shù)據(jù)采樣輸入樣本均勻量化間隔6量化非均勻量化量化時采用不均勻分層量化輸出數(shù)據(jù)非均勻量化間隔采樣輸入樣本值69量化非均勻量化量化輸出數(shù)據(jù)非均勻采樣輸入樣本值6970量化誤差量化誤差:原灰度與量化灰度級之間的差。由于在灰度由實數(shù)向整數(shù)進行變換操作中會產(chǎn)生舍入誤差,所以得出與原灰度值有出入的數(shù)值。量化對象的灰度范圍(dynamicrange,動態(tài)范圍)確定的條件下,隨著量化級數(shù)增加,量化級間隔變小,使得量化誤差減小。如何決定量化級數(shù)?70量化誤差量化誤差:原灰度與量化灰度級之間的差。70量化誤差定量分析伴隨量化誤差而產(chǎn)生的信噪比(S/N)設(shè)信號功率的峰-峰值為Sp-p、噪聲功率的均方根值(RMS)為Nrms。不失一般性,假設(shè)動態(tài)范圍是在將圖像進行均等分級量化時產(chǎn)生的。將灰度設(shè)為f,一個量化級的幅度為Δq。如果假定Δq中的量化誤差是一致的,則分級量化噪聲功率Nq為71量化誤差定量分析伴隨量化誤差而產(chǎn)生的信噪比(S/N)71如何決定量化級數(shù)?因為分級量化噪聲的平均值為0,所以Nq就是量化噪聲的方差。同樣,Nrms為量化噪聲的標準差,所以可表示為:另一方面,量化比特數(shù)為n,灰度級數(shù)設(shè)為Q,則有因此,信噪比S/N為據(jù)此,為使得S/N在s以上,對圖像進行量化時,至少要達到滿足以下要求的量化級數(shù)72如何決定量化級數(shù)?因為分級量化噪聲的平均值為0,所以Nq就是73量化誤差對于普通照片,假如設(shè)定為256級灰度(8比特,S/N=sqrt(12)*256=887),肉眼基本上不會感到照片不自然。然而,對于像胸部X線照片等動態(tài)量程大的圖像,就需要達到1024級灰度(10比特,S/N=3574)。相反,設(shè)計圖紙等卻只需要表現(xiàn)出黑白兩個值即可,所以這時進行2級量化就足夠了。量化級數(shù)為2的圖像,稱為2值圖像。具有更高灰度級數(shù)的圖像稱為多值圖像或灰度圖像。73量化誤差對于普通照片,假如設(shè)定為256級灰度(8比特,S7374改變量化級數(shù)的效果虛(偽)輪廓74改變量化級數(shù)的效果虛(偽)輪廓7475虛輪廓(灰梯度輪廓)

在模擬圖像上灰度變化平滑處,如果量化級數(shù)不充分,相鄰灰度級區(qū)域所對應(yīng)的量化誤差將增大,這兩個相鄰區(qū)域的界線就可能呈現(xiàn)在圖像上。該界線原本是不存在于原圖像中,因此稱它為虛輪廓或虛邊緣。75虛輪廓(灰梯度輪廓) 在模擬圖像上灰度變化平滑處,如果7576虛輪廓為了不產(chǎn)生虛輪廓,必須將相鄰量化級所對應(yīng)的亮度差異降低到肉眼分辨不出來的程度。這個程度,可以通過韋伯實驗估計。韋伯比值Cw約為0.02的定值,在1-1000cd/m2范圍有效。舉一個膠片數(shù)字化例子。假設(shè)膠片的最大和最小透射率分別為t1和t2,那么與光學密度有光的動態(tài)量程D可以表示為:因此,必要的量化級數(shù)Q為

當t1=0.9,t2=0.009,Cw=0.02時,則D=2.0,Q=233。這種量化是線性量化嗎?76虛輪廓為了不產(chǎn)生虛輪廓,必須將相鄰量化級所對應(yīng)的亮度差異761.3.4掃描采樣、量化只是一個概念性流程,實際進行的采樣、量化順序和方法,根據(jù)圖像輸入儀器結(jié)構(gòu)和方式的不同也有所不同。順序移動讀取圖像上的點一般稱作掃描。掃描是將二維或三維表達的拍攝對象的灰度變換為一維時間信號的過程。由于聲音原本是一維時間信號,所以在數(shù)字化中不存在掃描的概念,即掃描是圖像數(shù)字化所特有的。掃描不僅用在圖像數(shù)字化上,電視攝像機等的模擬圖像攝像系統(tǒng)向一維時間信號的變換需要掃描。相反,由一維時間信號再生圖像,顯示在平面CRT顯示器和液晶顯示器上也要進行掃描。771.3.4掃描采樣、量化只是一個概念性流程,實際進行的采樣78掃描光柵掃描逐行掃描隔行掃描78掃描光柵掃描78掃描標準(EIA)RS-170

美國單色廣播電視標準30frames/s525lines/frame2fields/frame50us/line225cycles/line225/50=4.5MHzBandwidth2×4.5=9MHzSamplingfrequency(EIA)RS-170A(NTSC)

RS-170略有差異的彩色電視標準CCIR,PAL

歐洲與中國等的單色及彩色模擬電視標準

25frames/s,625lines/frameframe:幀field:場PAL=PhaseAlternatingLine(逐行倒相制式)NTSC=NationalTelevisionSystemCommittee(全國電視系統(tǒng)委員會[美])EIA:ElectronicIndustriesAssociation79掃描標準(EIA)RS-170frame:幀數(shù)字化前后圖像80數(shù)字化前后圖像801.3.5圖像數(shù)字表達數(shù)字圖像L(i,j)中像素為二維排列,其坐標系和像素標號使用了多種形式:處理光柵型數(shù)字圖像時,經(jīng)常使用以左上角為原點的坐標系((a),(b)),處理向量型數(shù)字圖像時,經(jīng)常使用以左下角為原點的坐標系((c),(d))。811.3.5圖像數(shù)字表達數(shù)字圖像L(i,j)中像素為二維排列常用的直角坐標系82常用的直角坐標系82MATLAB編程常用的坐標系Inmatlab:Row12...MCol12...N在這個坐標系統(tǒng)中,圖像被看作離散單元,在像素坐標與Matlab中表示矩陣的下標之間有一一對應(yīng)關(guān)系.這種對應(yīng)關(guān)系使得圖像數(shù)據(jù)矩陣與圖像顯示方式之間的關(guān)系非常易于理解。83MATLAB編程常用的坐標系Inmatlab:RowCol圖像數(shù)字表達20018010080200180100402001005030180703010對于一個32×32圖像,8bit灰度圖像有多少灰度級?總數(shù)據(jù)量是多少?對于這類圖像共可表示多少幅不同的圖像?如果這是一個RGB彩色圖像,8bit×3,那么共有多少種色彩?圖像數(shù)據(jù)量又是多少?84圖像數(shù)字表達20018010080200180100402084彩色圖像、多通道圖像和三維圖像

由于彩色圖像具有相當于三原色的三個通道,所以稱為三通道圖像。單色圖像稱為單通道圖像。

各通道以k表示時,多通道圖像可以表示為Lk(i,j)。假設(shè)k=1,2,…K時,各像素的灰度水平可以記為向量L=[L1,L2,…LK]LK表示通道k的灰度水平。這時向量L是指向K維空間的某一點。在這個意義上,多通道圖像也可稱為多維圖像。85彩色圖像、多通道圖像和三維圖像由于彩色圖像具有相當于86彩色圖像、多通道圖像和三維圖像多通道圖像在計算機中的表達(存儲)方式,按通道排列順序不同,有CIP(ChannelInterleavedbyPixel),CIL(ChannelInterleavedbyLine),CSQ(ChannelSequential)三種格式。如圖1-14所示,當M(行)xN(列)xK(通道)的圖像采用圖1-13(a)坐標系時,其在這三種格式中的像素排列方式。如果能夠?qū)⑷繄D像數(shù)據(jù)放在內(nèi)存或緩存中進行處理時,上述三種排列方式?jīng)]有區(qū)別。但是,由于內(nèi)存有限,依次在內(nèi)存中讀取必要的部分圖像數(shù)據(jù)進行處理時,根據(jù)數(shù)據(jù)存儲格式的不同其訪問速度大不相同,即按像素單位對各通道的灰度水平進行操作時,采用CIP格式較好;但在按各通道單位訪問時,采用CSQ格式較好;CIL格式則居于兩者之間。86彩色圖像、多通道圖像和三維圖像多通道圖像在計算機中的表達8687彩色圖像、多通道圖像和三維圖像87彩色圖像、多通道圖像和三維圖像8788鄰域4-鄰域:

四個水平和垂直像素8-鄰域:4-鄰域+4對角像素0101p10101111p111188鄰域4-鄰域:四個水平和垂直像素010118889鄰接8-鄰接的模糊性!m:mixed混合的89鄰接8-鄰接的模糊性!m:mixed混合的8990距離測量D(p,q)>=0(D(p,q)=0ifp=q)D(p,q)=D(q,p),andD(p,q)<=D(p,z)+D(q,z)D4

距離:D8

距離:歐氏距離:22122101221222222221112210122111222222212101212對于像素p,q,z,以及其坐標(x,y),(s,t),和(u,v),D

就是一個距離函數(shù)或測度,如果90距離測量D(p,q)>=0(D(p,q)=0if901.5數(shù)字圖像質(zhì)量灰度分布特性對比度噪聲分辨率銳化度(自學補充講義)調(diào)制傳遞函數(shù)(自學補充講義)911.5數(shù)字圖像質(zhì)量灰度分布特性91灰度分布特性圖像的明暗變化情況稱作灰度等級或色調(diào),灰度等級的具體表現(xiàn)一般稱作灰度分布特性?;叶确植继匦缘暮脡模Q于中間色調(diào)的數(shù)量以及如何使用這些中間色調(diào)。如果中間色調(diào)數(shù)量少,圖像質(zhì)量將會明顯降低。灰度直方圖反映了圖像灰度級的最小值、最大值、平均值以及標準差等各灰度分布參數(shù),因此可以用作評價灰度分布特性的指標。92灰度分布特性圖像的明暗變化情況稱作灰度等級或色調(diào),灰度等級的灰度分布特性不同的圖像93灰度分布特性不同的圖像93對比度圖像的明暗差別稱作對比度。如何定義圖像的明暗程度依賴于圖像媒介。在自身不發(fā)光的情況下(稱為反射型圖像),使用數(shù)字圖像中的灰度最大值Lmax和最小值Lmin來定義對比度C94對比度圖像的明暗差別稱作對比度。94對比度計算例%Contrast=(255-105)/(255+105)=41.6%25510595對比度計算例%Contrast=(255-105)/(2噪聲是原本并不存在于輸入或輸出之前的圖像灰度中,也不存在于拍攝對象的亮度等原始信號中的信號。噪聲一般分為隨機噪聲和系統(tǒng)噪聲。作為與噪聲相關(guān)的圖像質(zhì)量指標,經(jīng)常使用信噪比(SNR)。信噪比指的是信號S和噪聲N之間的比,以S/N的形式表示。用分貝(dB)單位表示時,S和N使用振幅的平方所表示的量(能量)。(下標p表示功率,下標v表示幅度)96噪聲是原本并不存在于輸入或輸出之前的圖像灰度中,也不存在于拍關(guān)于信噪比計算從數(shù)字圖像灰度的角度出發(fā),關(guān)注信噪比時,不用分貝單位而用無單位S/N計算得出信噪比將會更容易理解。但是,涉及感性的圖像質(zhì)量評價時,建議使用分貝單位的S/N。這時因為人感覺到的亮度以及聲音的大小或音質(zhì)等感覺量與所給予的刺激量的對數(shù)大體上成正比。97關(guān)于信噪比計算從數(shù)字圖像灰度的角度出發(fā),關(guān)注信噪比時,不用分關(guān)于信噪比計算信號S和噪聲N的定義,根據(jù)信號的認知方式和噪聲的性質(zhì)等,有不同的方法。關(guān)于信號S,如果將信號的波形振幅記為AS,那么可以使用AS的平方平均,平均的平方,RMS值,峰值PS以及峰-峰值PPS。作為噪聲N,如將噪聲波形振幅記為AN,隨機噪聲時要使用AN的平方平均和RMS值;而脈沖噪聲時使用峰值PN和峰-峰值PPN。最常用的是功率信噪比(平方平均,常寫為SNR)和峰值信噪比(PSNR)。98關(guān)于信噪比計算信號S和噪聲N的定義,根據(jù)信號的認知方式和噪聲98NMSE(歸一化均方誤差)PMSE(峰值均方誤差)M,N:圖像尺寸,A:峰值系統(tǒng)引入的誤差為:

99NMSE(歸一化均方誤差)PMSE(峰值均方誤差)M,N:圖分辨率分辨率是由空間分辨率(SpatialResolution)和灰度(密度)分辨率(DensityResolution)共同決定的??臻g分辨率,是通過線寬和線間隔相等的周期性黑白條紋圖像上可辨別極限的線密度來定義。灰度分辨率是指在灰度級別中可分辨的最小變化(灰度梯度的一個量度)。常常把大小為M×N、灰度級數(shù)為Q(Q=2k)的數(shù)字圖像稱為空間分辨率為M×N像素、灰度分辨率為Q級(或k比特)灰度的數(shù)字圖像。100分辨率分辨率是由空間分辨率(SpatialResoluti改變空間分辨率對圖像質(zhì)量的影響101改變空間分辨率對圖像質(zhì)量的影響101102102改變灰度分辨率對圖像質(zhì)量的影響103改變灰度分辨率對圖像質(zhì)量的影響103Huang的研究觀察圖中與Crowd圖像相對應(yīng)的等偏好曲線,近于垂直,表明這類圖像的感覺質(zhì)量與所用灰度級數(shù)是近似獨立的。當圖像細節(jié)增加時等偏好曲線變得更垂直。這個結(jié)果表明對于有大量細節(jié)的圖像可能只需要少數(shù)的灰度級。Face和Cameraman圖像的主觀質(zhì)量在空間分辨率增加的情況下,于某段間隔內(nèi)保持相同,但是灰度級數(shù)實際上在減少。FaceCameramanCrowd104Huang的研究觀察圖中與Crowd圖像相對應(yīng)的等偏好曲線附:Matlab簡介

MATLAB

表示

matrixlaboratory,是一種高性能的專業(yè)計算語言。以一種易用環(huán)境集成計算、可視化和編程,只要問題和解可表示成相似的數(shù)學符號,典型應(yīng)用包括:MathandcomputationAlgorithmdevelopmentDataacquisitionModeling,simulation,andprototypingDataanalysis,exploration,andvisualizationScientificandengineeringgraphicsApplicationdevelopment,includinggraphicaluserinterfacebuilding附:Matlab簡介 MATLAB表示matrixla105在大學里,MATLAB用作標準的計算工具,數(shù)學、工程與科學等學科.工業(yè)上,MATLAB是研究、開發(fā)和分析的計算工具TheImageProcessingToolbox(IPT)

:是一組MATLAB函數(shù)集(稱作M函數(shù)或M-文件,擴展了MATLAB環(huán)境中的解決數(shù)字圖像處理問題的函數(shù)集.其他工具包:SignalProcessing,NeuralNetwork,FuzzyLogic,andWaveletToolboxes.在大學里,MATLAB用作標準的計算工具,數(shù)學、工程與科學106讀圖像f=imread(’’)FormatNameDescriptionRecognizedExtensionsTIFFTaggedImage.tif,.tiffJPEGJointPhotographicExpertsGroup.jpg,.jpegGIFGraphicsInterchangeFormats.gifBMPWindowsBitmap.bmpPNGPortableNetworkGraphics.pngothersHDF,PCX,ICO,CUR,RAS,PBM,PGM,PPMImageFormat:讀圖像f=imread(’’)FormatNameDe107圖像類型: TheMatlabimagetoolbox支持四種圖像類型:IntensityimagesBinaryimagesIndexedimagesRGBimages圖像類型:108Readanimageamatrix:f=imread(’lena.bmp’)canincludepath:f=imread(’d:\myimages\lena.jpg’)Getimagesize

size(f)ans=512512[mn]=size(f);Readanimageamatrix:cani109圖像顯示基本句法:f=imshow(f,G)where

f

isanimagearray,andGisthenumberofintensitylevelsusedtodisplayit.IfGisomitted,itdefaultsto256levels.f=imshow(f,[lowhigh])f=imshow(f,[])displaytheintensityvaluesofindividualpixelsinteractively:pixval圖像顯示基本句法:f=imshow(f,[lowhi110寫圖像基本句法:imwrite(f,’’)imwrite(f,’patientl0_runi’,’tif’)imwrite(f,’patientl0_runi.tif’)ForJPEGfileimwrite(f,’bubbles25.jpg’,’quality’,25)寫圖像基本句法:111Matlab編程MATLABprovidesafullprogramminglanguagethatenablesyoutowriteaseriesofMATLABstatementsintoathenexecutethemwithasinglecommand.Youwriteyourpr

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論