《新編數(shù)字圖像處理技術(shù)及應(yīng)用》全套教學(xué)課件_第1頁(yè)
《新編數(shù)字圖像處理技術(shù)及應(yīng)用》全套教學(xué)課件_第2頁(yè)
《新編數(shù)字圖像處理技術(shù)及應(yīng)用》全套教學(xué)課件_第3頁(yè)
《新編數(shù)字圖像處理技術(shù)及應(yīng)用》全套教學(xué)課件_第4頁(yè)
《新編數(shù)字圖像處理技術(shù)及應(yīng)用》全套教學(xué)課件_第5頁(yè)
已閱讀5頁(yè),還剩829頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第1章

概述全套可編輯PPT課件學(xué)習(xí)目標(biāo)1.能用自己的語(yǔ)言闡述數(shù)字圖像處理的相關(guān)概念。2.了解數(shù)字圖像處理技術(shù)的特點(diǎn)及其與相關(guān)學(xué)科

的關(guān)系。3.能闡述數(shù)字圖像處理的研究?jī)?nèi)容。4.了解數(shù)字圖像處理技術(shù)的發(fā)展歷程、研究方法、典型應(yīng)用和新發(fā)展。本章內(nèi)容(概念圖)1.1.1數(shù)字圖像處理的基本概念

1.1什么是數(shù)字圖像處理

數(shù)字圖像處理也叫計(jì)算機(jī)圖像處理。傳統(tǒng)上,人們認(rèn)為數(shù)字圖像處理是將模擬圖像信號(hào)轉(zhuǎn)換成數(shù)字圖像信號(hào)并利用計(jì)算機(jī)對(duì)其進(jìn)行處理的過(guò)程,即處理的輸入、輸出都是圖像。1.1.1數(shù)字圖像處理的基本概念

1.1什么是數(shù)字圖像處理

數(shù)字圖像處理可以通過(guò)圖1.2中的相關(guān)學(xué)科關(guān)系來(lái)界定,這些學(xué)科主要包括計(jì)算幾何、計(jì)算機(jī)輔助幾何設(shè)計(jì)、計(jì)算機(jī)圖形學(xué)、模式識(shí)別與人工智能等。圖像

圖像特征數(shù)據(jù)

幾何模型計(jì)算機(jī)圖形學(xué)人工智能模式識(shí)別計(jì)算幾何、計(jì)算機(jī)輔助幾何設(shè)計(jì)狹義的數(shù)字圖像處理設(shè)計(jì)和構(gòu)造出具有位置、大小、形狀和顏色信息屬性的場(chǎng)景從圖像中提取事物的特征、建立數(shù)學(xué)模型、進(jìn)行識(shí)別決策。廣義的數(shù)字圖像處理圖1.2

數(shù)字圖像處理相關(guān)學(xué)科關(guān)系圖1.1.1數(shù)字圖像處理的基本概念

1.1什么是數(shù)字圖像處理圖1.2中的計(jì)算幾何、計(jì)算機(jī)輔助幾何設(shè)計(jì)主要研究用計(jì)算機(jī)表示、分析和綜合幾何形體,在機(jī)械設(shè)計(jì)等領(lǐng)域已普遍運(yùn)用。計(jì)算機(jī)圖形學(xué)則面向直線、圓、多邊形等實(shí)體,通過(guò)“繪制”的方式產(chǎn)生具有幾何和視覺屬性的二維及三維畫面。模式識(shí)別主要通過(guò)提取聲波、腦電圖、照片、文字符號(hào)等對(duì)象的特征來(lái)進(jìn)行事物的辨識(shí)和分類。而人工智能則旨在構(gòu)造具有一定智能的人工系統(tǒng)。由于多數(shù)的人工系統(tǒng)都離不開對(duì)目標(biāo)或場(chǎng)景信息的識(shí)別,因此往往需要進(jìn)行圖像識(shí)別。數(shù)字圖像處理則處在計(jì)算機(jī)圖形學(xué)與模式識(shí)別之間,其中直接輸入CCD等拍攝的圖像或計(jì)算機(jī)圖形學(xué)的產(chǎn)生結(jié)果(如卡通圖片)、輸出處理結(jié)果(圖像)的過(guò)程就是前面提及的傳統(tǒng)的數(shù)字圖像處理。1.1.1數(shù)字圖像處理的基本概念

1.1什么是數(shù)字圖像處理目前,人們處理圖像的目的至少包括以下一項(xiàng)或幾項(xiàng):①提高圖像的視感質(zhì)量,如圖像增強(qiáng)、圖像復(fù)原等。②對(duì)圖像數(shù)據(jù)進(jìn)行變換、編碼和壓縮,便于圖像存儲(chǔ)和傳輸。③信息可視化,如溫度場(chǎng)、生物組織內(nèi)部結(jié)構(gòu)等本身并非可視的,轉(zhuǎn)化為視覺形式后更利于觀察、分析和研究。

④提取圖像中所包含的某些特征或特殊信息,便于計(jì)算機(jī)分析和識(shí)別。⑤信息安全的需要,如圖像加密等1.1.2數(shù)字圖像處理技術(shù)的產(chǎn)生與發(fā)展

1.1什么是數(shù)字圖像處理

人類歷史上有記載的第一次用計(jì)算機(jī)處理圖像是1964年美國(guó)加州理工學(xué)院噴氣推進(jìn)實(shí)驗(yàn)室對(duì)“徘徊者7號(hào)”探測(cè)器傳回的月球圖像進(jìn)行的畸變校正(屬于圖像復(fù)原)。從此,拉開了數(shù)字圖像處理在空間探測(cè)中應(yīng)用的序幕。

隨后,數(shù)字圖像處理很快就在醫(yī)學(xué)成像、遙感監(jiān)測(cè)和天文領(lǐng)域大量應(yīng)用開來(lái)。典型的有20世紀(jì)70年代發(fā)明的計(jì)算機(jī)斷層掃描(ComputedTomography,CT)圖像、X射線(光)圖像等。這些圖像往往需要降低噪聲污染、修復(fù)模糊變形等,于是圖像增強(qiáng)、圖像復(fù)原等技術(shù)應(yīng)運(yùn)而生。目前,成像波段早已遍及整個(gè)電磁波譜,處理需求也日益復(fù)雜。1.1.2數(shù)字圖像處理技術(shù)的產(chǎn)生與發(fā)展

1.1什么是數(shù)字圖像處理(1)電磁波電磁波是在空間傳播著的交變電磁場(chǎng),電磁波譜(ElectromagneticSpectrum)是按照電磁波波長(zhǎng)或頻率、波數(shù)、能量順序排列起來(lái)的電波順序(見圖1.3)。圖1.3電磁波譜1.1.2數(shù)字圖像處理技術(shù)的產(chǎn)生與發(fā)展

1.1什么是數(shù)字圖像處理(1)電磁波電磁波譜可大致分為長(zhǎng)波振蕩(聲波)、無(wú)線電波、微波、紅外線、可見光、紫外線、X射線、γ(伽馬)或宇宙射線。不同電磁波產(chǎn)生的機(jī)理和方式不同。無(wú)線電波是振蕩電路中自由電子的周期運(yùn)動(dòng)產(chǎn)生的;紅外線、可見光、紫外線是原子的外層電子激發(fā)后產(chǎn)生的;X射線和γ射線則分別由內(nèi)層電子和原子核受激發(fā)產(chǎn)生。實(shí)踐中,根據(jù)不同需要和習(xí)慣,采用不同的頻譜參量計(jì)量單位:對(duì)X射線、紫外線、可見光和紅外線,常用波長(zhǎng)(μm、nm)計(jì)量;對(duì)無(wú)線電波,常用頻率(Hz)或波長(zhǎng)(m)計(jì)量;對(duì)高能粒子輻射,則常用能量(eV)描述。1.1.2數(shù)字圖像處理技術(shù)的產(chǎn)生與發(fā)展

1.1什么是數(shù)字圖像處理

(2)電磁波譜典型成像及其應(yīng)用電磁波譜典型成像及其應(yīng)用自然界中的物體都在晝夜不停地輻射、反射電磁波,通過(guò)光電成像技術(shù)可以攝取到不同景物在同一波段或同一景物在不同波段上的“像”。隨著技術(shù)進(jìn)步,除我們熟悉的可見光和X射線等圖像外,現(xiàn)在的成像范圍已經(jīng)覆蓋從γ射線(最高能量)到無(wú)線電波(最低能量)約整個(gè)電磁波譜。電磁波譜典型成像及其應(yīng)用如表1.1和圖1.4所示。

(a)PET圖像(b)CT圖像(c)可見光圖像(d)紫外圖像(e)紅外偽彩圖像(f)雷達(dá)圖像圖1.4典型圖像示例1.1.2數(shù)字圖像處理技術(shù)的產(chǎn)生與發(fā)展

1.1什么是數(shù)字圖像處理光譜區(qū)作用類型典型成像及應(yīng)用宇宙或γ射線原子核核醫(yī)學(xué):注射同位素后用正電子放射斷層(PositronEmissionTomography,PET)圖像;天文觀測(cè):利用被測(cè)物體自然輻射成像;x射線內(nèi)層電子躍遷醫(yī)學(xué)和工業(yè):x光片、CT圖像天文學(xué)遠(yuǎn)紫外電子躍遷平板印刷、工業(yè)檢測(cè)、熒光顯微鏡、激光、生物成像;天文觀測(cè)紫外線電子躍遷可見光價(jià)電子躍遷工農(nóng)業(yè)、生產(chǎn)、生活近紅外振動(dòng)躍遷短、中、長(zhǎng)波成像、太赫茲成像(頻率在0.1~10THz之間,位于遠(yuǎn)紅外波段),用于醫(yī)療、深空探測(cè)、安防監(jiān)控等紅外光振動(dòng)或轉(zhuǎn)動(dòng)躍遷微波轉(zhuǎn)動(dòng)躍遷雷達(dá)成像無(wú)線電波原子核旋轉(zhuǎn)躍遷醫(yī)學(xué):MRI;天文學(xué)聲波分子振動(dòng)地質(zhì)勘探、工業(yè)、醫(yī)學(xué)(B超)表1.1電磁波譜典型成像及其應(yīng)用1.2.1數(shù)字圖像處理的主要任務(wù)

1.2主要任務(wù)與方法1.圖像信息獲取與數(shù)字化景物通過(guò)光學(xué)成像系統(tǒng)進(jìn)入電子器件轉(zhuǎn)化為模擬圖像信號(hào),再經(jīng)過(guò)模數(shù)轉(zhuǎn)換器即可得到數(shù)字圖像。圖像獲取用到的主要設(shè)備有CCD成像設(shè)備、飛點(diǎn)掃描器、掃描鼓、掃描儀等。2.圖像信息存儲(chǔ)圖像信息的特點(diǎn)是數(shù)據(jù)量大,存儲(chǔ)采用的介質(zhì)有磁帶、磁盤或光盤等。為解決海量存儲(chǔ)問題,需要研究數(shù)據(jù)壓縮、圖像格式和圖像數(shù)據(jù)庫(kù)技術(shù)等。1.2.1數(shù)字圖像處理的主要任務(wù)

1.2主要任務(wù)與方法3.圖像信息處理

圖像信息處理包括幾何處理、算術(shù)處理、圖像變換、圖像編碼與壓縮、圖像增強(qiáng)、圖像復(fù)原與重建、圖像分割、圖像描述、圖像識(shí)別和圖像理解。1.2.1數(shù)字圖像處理的主要任務(wù)

1.2主要任務(wù)與方法3.圖像信息處理(1)幾何處理

幾何處理包括坐標(biāo)變換,圖像的放大、縮小、旋轉(zhuǎn)、移動(dòng),多個(gè)圖像配準(zhǔn),圖像校正,圖像中目標(biāo)的周長(zhǎng)、面積、體積計(jì)算等。

(2)算術(shù)處理

算術(shù)處理主要是圖像與圖像或者圖像與數(shù)值的加、減、乘、除等運(yùn)算。1.2.1數(shù)字圖像處理的主要任務(wù)

1.2主要任務(wù)與方法3.圖像信息處理(3)圖像變換(ImageTransformation)

一方面,數(shù)字圖像陣列通常很大,若直接在空域處理,則計(jì)算量非常大。利用正交變換技術(shù)將圖像的空域處理轉(zhuǎn)換到頻域進(jìn)行,可以明顯減少計(jì)算量。另一方面,圖像的頻率、紋理等特性在空域難以獲得和處理,通過(guò)離散傅里葉變換、離散余弦變換等各種圖像變換,可以間接地在變換域進(jìn)行更有效的處理,如在頻域中進(jìn)行數(shù)字濾波、圖像壓縮和融合等。1.2.1數(shù)字圖像處理的主要任務(wù)

1.2主要任務(wù)與方法3.圖像信息處理(4)圖像編碼與壓縮(ImageCodingandCompression)

由于現(xiàn)有的大容量存儲(chǔ)器和寬帶網(wǎng)絡(luò)仍不能滿足圖像數(shù)據(jù)處理、存儲(chǔ)和傳輸?shù)男枰?,而且單幀圖像中相鄰像素的相關(guān)性較強(qiáng),如相鄰像素有相同或相近的灰度;序列圖像中相鄰幀之間的相關(guān)性更強(qiáng)(僅有少量?jī)?nèi)容發(fā)生改變),如播報(bào)新聞的電視畫面,多數(shù)情況下僅有播音員的嘴巴和眼睛在動(dòng),說(shuō)明圖像信息的壓縮空間較大。因此,利用圖像信號(hào)的統(tǒng)計(jì)特性和人類視覺的生理學(xué)及心理學(xué)特性對(duì)圖像信號(hào)進(jìn)行編碼壓縮不僅是必要的,而且也是可行的。1.2.1數(shù)字圖像處理的主要任務(wù)

1.2主要任務(wù)與方法3.圖像信息處理(4)圖像編碼與壓縮(ImageCodingandCompression)

經(jīng)過(guò)圖像編碼與壓縮,可以做到:①減少數(shù)據(jù)存儲(chǔ)量;②降低碼流以減少傳輸帶寬;③壓縮信息量,便于識(shí)別和理解。1.2.1數(shù)字圖像處理的主要任務(wù)

1.2主要任務(wù)與方法3.圖像信息處理(5)圖像增強(qiáng)(ImageEnhancement)

通常,圖像增強(qiáng)不必考慮圖像降質(zhì)產(chǎn)生的原因,甚至可以是對(duì)沒有降質(zhì)的圖像進(jìn)行處理,目的是突出圖像中所感興趣的部分,如強(qiáng)化圖像高頻分量,使圖像中物體輪廓清晰、細(xì)節(jié)明顯;強(qiáng)化低頻分量以減少圖像中噪聲的影響。圖像增強(qiáng)既可在空域進(jìn)行也可在頻域進(jìn)行,既可以是對(duì)灰度圖像增強(qiáng),也可以是對(duì)彩色圖像增強(qiáng)。圖像增強(qiáng)是數(shù)字圖像處理中發(fā)展最早的領(lǐng)域和工程應(yīng)用最多的領(lǐng)域之一。目前,圖像增強(qiáng)已成為其他圖像處理方法必不可少的前期處理環(huán)節(jié),如先通過(guò)圖像增強(qiáng)改變圖像的全局或局部亮度、對(duì)比度等,再提取圖像中的目標(biāo)會(huì)更容易一些。1.2.1數(shù)字圖像處理的主要任務(wù)

1.2主要任務(wù)與方法3.圖像信息處理(6)圖像復(fù)原與重建(ImageRestorationandImageReconstruction)

圖像復(fù)原的目的是提高圖像的質(zhì)量,如去除噪聲、提高圖像的清晰度等。通常,圖像增強(qiáng)的所有方法均可以用于圖像復(fù)原,但并不僅限于此。原因在于:圖像復(fù)原是有“金標(biāo)準(zhǔn)”的(以理想圖像為目標(biāo)),因此,要求對(duì)圖像降質(zhì)原因有一定了解。一般是根據(jù)降質(zhì)過(guò)程(如運(yùn)動(dòng)模糊、雨絲影響、霧霾影響等)建立“降質(zhì)模型”,再用逆模型得到復(fù)原圖像。1.2.1數(shù)字圖像處理的主要任務(wù)

1.2主要任務(wù)與方法3.圖像信息處理(6)圖像復(fù)原與重建(ImageRestorationandImageReconstruction)理論上講,降質(zhì)模型肯定是非線性、時(shí)變和空間變化的,其逆模型難免會(huì)無(wú)解或存在多個(gè)解。實(shí)踐中,可以在一定的精度下用線性、時(shí)不變和空間不變的模型來(lái)簡(jiǎn)化降質(zhì)模型,通過(guò)建立不同的限定和約束并利用不同方法求解來(lái)形成不同的圖像復(fù)原方法1.2.1數(shù)字圖像處理的主要任務(wù)

1.2主要任務(wù)與方法3.圖像信息處理與圖像復(fù)原相關(guān)的另一個(gè)術(shù)語(yǔ)是圖像重建。圖像采集是由實(shí)際景物產(chǎn)生二維數(shù)組的過(guò)程,反過(guò)來(lái),如果我們已有一組與圖像相關(guān)的物理數(shù)據(jù),如何獲得圖像呢?這正是圖像重建的任務(wù)之所在。CT成像是圖像重建的成功范例,其過(guò)程是輸入物體橫斷面的一組投影數(shù)據(jù),輸出一幅重建圖像。目前,通過(guò)多幅橫斷面成像重建三維實(shí)體、利用低分辨率圖像重建出高分辨率圖像等在醫(yī)學(xué)領(lǐng)域已獲得廣泛應(yīng)用。1.2.1數(shù)字圖像處理的主要任務(wù)

1.2主要任務(wù)與方法3.

圖像信息處理(7)圖像分割(ImageSegmentation)

圖像分割是按一定的規(guī)則將圖像分成若干個(gè)有意義或感興趣區(qū)域的過(guò)程。每個(gè)區(qū)域可能代表一個(gè)對(duì)象(目標(biāo)或目標(biāo)的一部分)。最終,圖像中有意義的特征部分被提取出來(lái)。有意義的特征包括圖像中的邊緣、區(qū)域等,是進(jìn)一步進(jìn)行圖像識(shí)別、分析和理解的基礎(chǔ)。典型的應(yīng)用有車牌識(shí)別、文字識(shí)別中的字符分割與提取。需要說(shuō)明的是,雖然目前已研究出不少邊緣提取、區(qū)域分割方法,但還沒有一個(gè)普適性方法。因此圖像分割仍然是目前圖像處理的研究熱點(diǎn)之一。1.2.1數(shù)字圖像處理的主要任務(wù)

1.2主要任務(wù)與方法3.圖像信息處理(8)圖像分析(ImageAnalysis)

圖像分析是圖像識(shí)別和圖像理解的必要前提。對(duì)最簡(jiǎn)單的二值圖像,往往用其幾何特性來(lái)描述物體的特性;對(duì)一般圖像,則采用二維形狀描述(包括邊界描述和區(qū)域描述兩類方法);對(duì)于特殊的紋理圖像,可以采用二維紋理特征描述;對(duì)于三維物體描述,目前多用體積描述、表面描述、廣義圓柱體描述等方法。1.2.1數(shù)字圖像處理的主要任務(wù)

1.2主要任務(wù)與方法3.圖像信息處理(9)圖像識(shí)別(ImageRecognition)

傳統(tǒng)上,圖像分類識(shí)別屬于模式識(shí)別的范疇。其主要內(nèi)容是圖像經(jīng)過(guò)某些預(yù)處理(如增強(qiáng)、復(fù)原、壓縮)后,進(jìn)行圖像分割和特征提取,從而進(jìn)行判決分類。判決分類既可以采用經(jīng)典的模式識(shí)別技術(shù),也可以采用新興的深度學(xué)習(xí)技術(shù)。1.2.1數(shù)字圖像處理的主要任務(wù)

1.2主要任務(wù)與方法3.圖像信息處理(10)圖像理解(ImageUnderstanding)

圖像理解是由模式識(shí)別發(fā)展起來(lái)的方法,其處理過(guò)程是“輸入圖像,輸出描述”。這種描述并不僅是單純用符號(hào)作出詳細(xì)的描繪,而且要根據(jù)客觀世界的知識(shí)利用計(jì)算機(jī)進(jìn)行聯(lián)想、思考及推論,從而理解圖像所表現(xiàn)的內(nèi)容。因此,圖像理解有時(shí)也稱為景物理解。1.2.2數(shù)字圖像處理的主要方法

1.2主要任務(wù)與方法1.空域法把圖像看作關(guān)于x、y坐標(biāo)位置的像素集合,直接對(duì)二維函數(shù)的集合進(jìn)行相應(yīng)的處理。該類方法可進(jìn)一步分為兩類:(1)點(diǎn)處理法點(diǎn)處理法,包括灰度處理、算術(shù)運(yùn)算和面積、周長(zhǎng)、體積計(jì)算等。(2)鄰域處理法,包括梯度運(yùn)算、平滑算子運(yùn)算和卷積運(yùn)算等。1.2.2數(shù)字圖像處理的主要方法

1.2主要任務(wù)與方法2.變換域法數(shù)字圖像的變換域處理方法是先對(duì)圖像進(jìn)行正交變換,得到變換域系數(shù)陣列,再對(duì)系數(shù)陣列進(jìn)行處理,然后逆變換到空域得到處理結(jié)果的過(guò)程。

值得注意的是,多數(shù)數(shù)字圖像處理任務(wù)需要結(jié)合以上兩種方法才行。1.2.3數(shù)字圖像處理技術(shù)的特點(diǎn)

1.2主要任務(wù)與方法1.具有數(shù)字信號(hào)處理技術(shù)的共同特點(diǎn)(1)處理精度高。

理論上講,一幅模擬圖像可以數(shù)字化為任意大小和精度的二維數(shù)組。(2)重現(xiàn)性能好。

數(shù)字圖像處理不會(huì)因圖像存儲(chǔ)、傳輸?shù)冗^(guò)程而降質(zhì),只要保持足夠的處理精度,就能方便地重現(xiàn)原始圖像。(3)活性高。

數(shù)字圖像處理不僅能進(jìn)行一般的線性和非線性處理,還可以通過(guò)程序?qū)崿F(xiàn)智能信息處理。1.2.3數(shù)字圖像處理技術(shù)的特點(diǎn)

1.2主要任務(wù)與方法2.

數(shù)字圖像處理的結(jié)果應(yīng)用范圍廣數(shù)字圖像處理的結(jié)果既可供人觀察,也可用于機(jī)器視覺。不同人對(duì)一幅圖像的主觀評(píng)價(jià)往往不盡相同,故常通過(guò)有統(tǒng)計(jì)意義的多人評(píng)價(jià)結(jié)果和客觀評(píng)價(jià)指標(biāo)互相印證來(lái)衡量像質(zhì)。對(duì)于機(jī)器視覺而言,通常無(wú)須強(qiáng)調(diào)圖像的自然感、舒適感和真實(shí)感,僅需根據(jù)是否利于“特征提取”和“后續(xù)目標(biāo)識(shí)別和場(chǎng)景理解”來(lái)評(píng)價(jià)。1.2.3數(shù)字圖像處理技術(shù)的特點(diǎn)

1.2主要任務(wù)與方法3.數(shù)字圖像處理技術(shù)適用面寬不管什么圖像,只要被變換為數(shù)字編碼形式后,均可用二維數(shù)組表示,進(jìn)而利用計(jì)算機(jī)進(jìn)行處理。4.數(shù)字圖像處理技術(shù)綜合性強(qiáng)

數(shù)字圖像處理技術(shù)涉及數(shù)學(xué)、物理學(xué)、信號(hào)與信息處理、計(jì)算機(jī)技術(shù)、電子技術(shù)等相關(guān)學(xué)科理論與技術(shù)。1.2.3數(shù)字圖像處理技術(shù)的特點(diǎn)

1.2主要任務(wù)與方法數(shù)字圖像處理與模擬方式處理圖像相比,也有一些不足之處。包括:①數(shù)字圖像處理的信息大多是二維或二維以上的多維信息,數(shù)據(jù)量巨大;②數(shù)字圖像信號(hào)占用的頻帶較寬;③處理費(fèi)時(shí)。1.3.1數(shù)字圖像處理的應(yīng)用領(lǐng)域

1.3數(shù)字圖像處理的應(yīng)用1.航天航空領(lǐng)域航天領(lǐng)域的星際圖像處理是數(shù)字圖像處理的最早應(yīng)用之一。目前我國(guó)發(fā)射的“風(fēng)云四號(hào)”氣象衛(wèi)星的成像通道多達(dá)4個(gè),覆蓋了可見光、短波紅外、中波紅外和長(zhǎng)波紅外等波段;美國(guó)FLIR公司的多款探測(cè)器都已做到機(jī)載寬光譜同步成像。1.3.1數(shù)字圖像處理的應(yīng)用領(lǐng)域

1.3數(shù)字圖像處理的應(yīng)用2.生物醫(yī)學(xué)領(lǐng)域

典型的應(yīng)用包括:顯微圖像處理、X光照片和超聲圖像凍結(jié)、增強(qiáng)及偽彩色處理,CT圖像處理,CT和MRI圖像融合,專家系統(tǒng)手術(shù)規(guī)劃應(yīng)用,生物進(jìn)化圖像分析等。尤其值得一提的是,基于深度學(xué)習(xí)的病灶識(shí)別能力甚至超過(guò)了經(jīng)驗(yàn)豐富的醫(yī)生。1.3.1數(shù)字圖像處理的應(yīng)用領(lǐng)域

1.3數(shù)字圖像處理的應(yīng)用3.工業(yè)領(lǐng)域數(shù)字圖像處理技術(shù)用于產(chǎn)品無(wú)損檢測(cè)、焊縫及內(nèi)部缺陷檢查、裝配流水線零件自動(dòng)檢測(cè),郵件、包裹自動(dòng)分揀等。4.

軍事及安防領(lǐng)域軍事偵察、定位、引導(dǎo)、指揮等應(yīng)用,巡航導(dǎo)彈地形識(shí)別,遙控飛行器引導(dǎo),測(cè)視雷達(dá)的地形偵察等。1.3.1數(shù)字圖像處理的應(yīng)用領(lǐng)域

1.3數(shù)字圖像處理的應(yīng)用5.通信工程領(lǐng)域?qū)㈦娫挕㈦娨暫陀?jì)算機(jī)以三網(wǎng)合一的方式在數(shù)字通信網(wǎng)上傳輸已被廣為采用,這一切都離不開圖像編碼壓縮技術(shù)。在5G及即將到來(lái)的6G時(shí)代,遠(yuǎn)程醫(yī)療、自動(dòng)駕駛、無(wú)人機(jī)作業(yè)等指日可待。6.

交通領(lǐng)域交通管制、機(jī)場(chǎng)監(jiān)控、運(yùn)動(dòng)車船的視覺反饋控制、火車車廂識(shí)別、動(dòng)車監(jiān)控等已十分普遍。1.3.1數(shù)字圖像處理的應(yīng)用領(lǐng)域

1.3數(shù)字圖像處理的應(yīng)用7.機(jī)器視覺

機(jī)器視覺作為智能機(jī)器人的重要感覺器官,主要進(jìn)行三維景物的理解和識(shí)別,是目前處于研究之中的開放課題。機(jī)器視覺主要用于從事軍事偵察、處于危險(xiǎn)環(huán)境的自主機(jī)器人,從事郵政、醫(yī)院和家庭服務(wù)的智能機(jī)器人,裝配線工件識(shí)別、定位、太空機(jī)器人的自主操作等。1.3.1數(shù)字圖像處理的應(yīng)用領(lǐng)域

1.3數(shù)字圖像處理的應(yīng)用8.生活與娛樂領(lǐng)域例如,發(fā)型設(shè)計(jì)、藝術(shù)照片、服裝試穿、指紋簽到、刷臉開鎖、計(jì)算機(jī)美術(shù),4K、8K直播、VR、AR游戲,“全場(chǎng)景”“沉浸式”體驗(yàn),衛(wèi)星地圖生成、名片識(shí)別、二維碼識(shí)別等。1.3.2數(shù)字圖像處理的新發(fā)展

1.3數(shù)字圖像處理的應(yīng)用

1.基于圖像的三維重建(1)單幀圖像三維化

將灰度圖像的數(shù)組下標(biāo)當(dāng)成空間中的兩維、把數(shù)組元素的值當(dāng)作第三維,就可以形成一幅三維圖像。(2)多幀圖像三維化利用運(yùn)動(dòng)序列圖像可獲得相機(jī)和目標(biāo)之間的相對(duì)運(yùn)動(dòng),再通過(guò)匹配點(diǎn)或者多個(gè)目標(biāo)的相互關(guān)系,建立光流方程等也可重建三維景物。1.3.2數(shù)字圖像處理的新發(fā)展

1.3數(shù)字圖像處理的應(yīng)用

2.基于深度學(xué)習(xí)處理數(shù)字圖像傳統(tǒng)的數(shù)字圖像處理可以認(rèn)為是采用了模型驅(qū)動(dòng)的方法。所謂模型驅(qū)動(dòng)法,是指基于目標(biāo)特性、物理機(jī)制和任務(wù)領(lǐng)域知識(shí)用數(shù)學(xué)公式建立圖像處理模型。而現(xiàn)實(shí)世界很復(fù)雜,有時(shí)我們沒有辦法建立固定的狀態(tài)模型或者我們?nèi)狈Ρ匾南闰?yàn)知識(shí),這時(shí)只能通過(guò)數(shù)據(jù)驅(qū)動(dòng)的方法建模。深度學(xué)習(xí)是目前廣為人知的數(shù)據(jù)驅(qū)動(dòng)方法———通過(guò)大量的數(shù)據(jù)獲得模型。因此,深度學(xué)習(xí)一經(jīng)出現(xiàn),就被運(yùn)用到數(shù)字圖像處理的方方面面,如基于深度學(xué)習(xí)的圖像增強(qiáng)、圖像重建、圖像分割、圖像融合等。第2章數(shù)字圖像處理的物理及技術(shù)基礎(chǔ)學(xué)習(xí)目標(biāo)1、敘述成像過(guò)程、模擬圖像的描述及模擬圖像的數(shù)字化方法;熟悉采樣與量化參數(shù)對(duì)圖像數(shù)字化質(zhì)量的影響;2、知道常用的圖像格式及其特點(diǎn)、數(shù)字圖像顯示方法;3、初步掌握像質(zhì)評(píng)價(jià)方法和直方圖及其應(yīng)用;4、闡述不同顏色模型及其特點(diǎn)。本章內(nèi)容(概念圖)①②③④2.1.1成像過(guò)程2.1數(shù)字圖像獲取

成像技術(shù)包括獲取景物的反射或輻射信號(hào)并將其轉(zhuǎn)變?yōu)槿搜劭梢妶D像的全過(guò)程。

通常的成像系統(tǒng)包括五個(gè)主要的子系統(tǒng):光學(xué)系統(tǒng)和掃描器、探測(cè)器和探測(cè)器電子線路、數(shù)字化子系統(tǒng)、圖像處理子系統(tǒng)和圖像重建子系統(tǒng)。圖2.1通用組件模塊圖(凝視型系統(tǒng))經(jīng)過(guò)成像系統(tǒng)獲得的模擬視頻中的任一幀就是圖像,一幅圖像可以看作是空間中各點(diǎn)光強(qiáng)度的集合。光強(qiáng)I是隨空間坐標(biāo)(x,y)、光線的波長(zhǎng)λ和時(shí)間t變化的連續(xù)函數(shù),即2.1.2模擬圖像描述(

I≥0)(2.1)

若僅考慮光的能量而不考慮其波長(zhǎng),則圖像是灰色的,稱之為灰度圖像(grayimage)或單色圖像(monochromeimage)序列,這時(shí)式2.1變?yōu)?/p>

(2.2)如果處理靜止圖像(即內(nèi)容不隨時(shí)間變化的圖像),式2.2變?yōu)?2.3)

要是不考慮圖像內(nèi)容隨時(shí)間變化而考慮成像波長(zhǎng)的話,那就是一幅靜止的彩色圖像了,其函數(shù)是

(2.4)

彩色圖像分為紅(Red,R)、綠(Green,G)、藍(lán)(Blue,B)三個(gè)基色圖像,因此,靜止的彩色圖像函數(shù)常常用R、G、B三個(gè)通道的值表示(2.5)

三個(gè)通道的灰度圖像可以合成一幅彩色圖像、多幅圖像連續(xù)可形成視頻,所以,靜止的灰度圖像是圖像處理理論和方法的主要研究對(duì)象。2.1.3常用的圖像格式

(1)BMP格式:BMP是Bitmap(位圖)的縮寫,是Windows及OS/2操作系統(tǒng)的標(biāo)準(zhǔn)圖像文件格式。典型的BMP文件由三部分組成:1)位圖文件頭數(shù)據(jù)結(jié)構(gòu),含文件類型、顯示內(nèi)容等;2)位圖信息的數(shù)據(jù)結(jié)構(gòu)(即位圖信息頭),如圖像的寬、高、壓縮方法、定義顏色信息等;3)彩色表即調(diào)色板——調(diào)色板以4字節(jié)為單位,大小是2、16和256,每4個(gè)字節(jié)存放一個(gè)顏色值調(diào)色板。圖像數(shù)據(jù)是指向調(diào)色板的索引,所以BMP只能存儲(chǔ)單色、16色、256色和全彩色(24位)四種圖像數(shù)據(jù)。

BMP有壓縮和不壓縮兩種處理方式,其中,壓縮方式只有RLE(RunLengthEncoding)4(16色)和RLE8(256色)兩種。24位BMP格式的圖像文件無(wú)法壓縮。這種格式信息豐富,但占空間大,目前BMP格式的圖像主要在單機(jī)上使用。(2)JPEG格式

JPEG是聯(lián)合照片專家組(JointPhotographicExpertsGroup)的縮寫,文件擴(kuò)展名為.jpg或.jpeg,是目前主流的圖像格式之一,特別是在網(wǎng)絡(luò)和光盤讀物上用的很普遍。其壓縮技術(shù)十分先進(jìn),可以用有損壓縮方式去除冗余的圖像和彩色數(shù)據(jù),在取得極高壓縮率的同時(shí)還能展現(xiàn)十分豐富生動(dòng)的圖像,因?yàn)镴PEG格式的文件尺寸較小,下載速度快,使得Web頁(yè)有可能以較短的下載時(shí)間提供大量美觀的圖像。所以,目前各類瀏覽器均支持JPEG圖像格式。JPEG支持24位真彩色,所以,常用于需要連續(xù)色調(diào)的圖像。(但犧牲了像質(zhì))

TIFF(TagImageFileFormat)是Mac中廣泛使用的圖像格式,文件擴(kuò)展名為.tif或.tiff。該格式有壓縮和非壓縮二種形式,其中壓縮可采用LZW(Lempel-Ziv-Welch)無(wú)損壓縮方案存儲(chǔ)。不過(guò),TIFF格式結(jié)構(gòu)較為復(fù)雜,兼容性較差,有的軟件不能正確識(shí)別TIFF文件(現(xiàn)在絕大部分軟件都已解決了這個(gè)問題)。目前在Mac和PC機(jī)上移植TIFF文件也十分便捷,因而TIFF現(xiàn)在也是微機(jī)上使用最廣泛的圖像文件格式之一。

TIFF圖像格式復(fù)雜、存貯信息多,圖像的質(zhì)量較好,故而非常有利于復(fù)制原稿。(3)TIFF格式

GIF是圖形交換格式(GraphicsInterchangeFormat)的縮寫,特點(diǎn)是壓縮比高,占用磁盤空間少,利于網(wǎng)絡(luò)傳輸。

最初的GIF87a只用來(lái)存儲(chǔ)單幅靜止圖像,后經(jīng)發(fā)展可同時(shí)存儲(chǔ)若干幅靜止圖像形成連續(xù)的動(dòng)畫,是當(dāng)時(shí)支持2D動(dòng)畫為數(shù)不多的格式之一。GIF89a圖像中允許指定透明區(qū)域,顯示效果突出。目前Internet上大量采用的彩色動(dòng)畫文件多采用這種格式。不過(guò),GIF有個(gè)小缺點(diǎn)——即不能存儲(chǔ)超過(guò)256色的圖像。(4)GIF格式

PNG(PortableNetworkGraphics)是一種網(wǎng)絡(luò)圖像格式,該標(biāo)準(zhǔn)結(jié)合了GIF及JPG之長(zhǎng),目前大部分繪圖軟件和瀏覽器開始支持PNG圖像瀏覽。

PNG的特點(diǎn):1)存貯形式豐富,兼有GIF和JPG的色彩模式;2)采用無(wú)損壓縮方式來(lái)減少文件大小的,既能把圖像文件壓縮到極限又能保留所有與圖像品質(zhì)有關(guān)的信息;3)顯示速度很快,只需下載1/64的圖像信息就可顯示出低分辨率的預(yù)覽圖像;4)PNG和GIF一樣支持透明圖像制作,有利于一些特殊效果的制作。缺點(diǎn)是不支持動(dòng)畫應(yīng)用效果。(5)PNG格式(6)PSD格式:PSD是Photoshop的專用格式(PhotoshopDocument),可以以RGB或CMYK彩色模式存儲(chǔ),還能自定義顏色數(shù)。PSD可以看作是Photoshop進(jìn)行平面設(shè)計(jì)的一張"草稿圖",它里面包含有各種圖層、通道、遮罩等設(shè)計(jì)樣稿,以便于下次打開文件時(shí)可以修改上一次的設(shè)計(jì)。(7)SVG格式:SVG是可縮放的矢量圖形(ScalableVectorGraphics)的縮寫,是WorldWideWebConsortium(W3C)聯(lián)盟基于XML(ExtensibleMarkupLanguage)開發(fā)的,支持用戶直接用代碼來(lái)描繪圖像。SVG可以任意放大圖形顯示,但不會(huì)以犧牲圖像質(zhì)量為代價(jià),比JPEG和GIF格式的文件要小很多。1)SWF格式:SWF是Shockwaveformat的縮寫,用于Flash動(dòng)畫制作,是基于矢量技術(shù)制作的,因此不管將畫面放大多少倍,畫面不會(huì)因此而有任何損害。目前已成為網(wǎng)上動(dòng)畫的事實(shí)標(biāo)準(zhǔn)。2)PCX格式:PCX格式是圖像處理軟件Paintbrush開發(fā)的一種格式,表示PCPaintbrushExchange,是MS-DOS下的常用格式,是一種經(jīng)過(guò)壓縮的格式,占用磁盤空間較少。該格式出現(xiàn)時(shí)間較長(zhǎng),并且具有壓縮及全彩色能力,所以現(xiàn)在仍比較流行。3)DXF格式:DXF(AutodeskDrawingExchangeFormat)是AutoCAD中的矢量文件格式,它以ASCII碼方式存儲(chǔ)文件,在表現(xiàn)圖形的大小方面十分精確。4)WMF格式:WMF(WindowsMetafileFormat)是Windows中常見的一種圖元文件格式,屬于矢量文件格式,文件短小、圖案造型化,整個(gè)圖形常由各個(gè)獨(dú)立的組成部分拼接而成,在Office軟件中常用,不過(guò)其圖形往往較粗糙。(8)其它常用的圖像格式總的來(lái)說(shuō),按計(jì)算機(jī)顯示方式可分為矢量圖和位圖:矢量圖使用線段和形狀描述圖像,同時(shí)也包含了色彩和位置信息,“輪廓填色彩”。位圖(光柵圖)是用數(shù)據(jù)點(diǎn)來(lái)映射表示圖像像素,是用一格一格的小點(diǎn)來(lái)描述圖像。

放大的矢量圖

放大的位圖位圖陣列記錄了位圖的每一個(gè)像素值。在生成位圖文件時(shí),Windows從位圖的左下角開始即從下到上逐行掃描位圖,將位圖的像素值一一記錄下來(lái)。這些記錄像素值的字節(jié)組成了位圖陣列。除真彩色圖像之外,其余的位圖圖像都需要調(diào)色板數(shù)據(jù)。1)VGA:能用640*480的分辨率顯示16種顏色;2)SuperVGA:能用640*480的分辨率同時(shí)顯示256種顏色;3)真彩色:能同時(shí)顯示256*256*256=167777216種顏色。補(bǔ)充:位圖數(shù)據(jù)與調(diào)色板

調(diào)色板是在16色或256色顯示系統(tǒng)中,由圖像中出現(xiàn)最頻繁的16種或256種顏色所組成的顏色表。將這些顏色按4位或8位,即0~15或255進(jìn)行編號(hào),每一個(gè)編號(hào)代表其中一種顏色。這種顏色編號(hào)叫做顏色的索引號(hào),4位或8位的索引值與24位的顏色值的對(duì)應(yīng)表叫顏色查找表。

使用調(diào)色板的圖像叫做調(diào)色板圖像。它們的像素值并不是顏色值,而是顏色在調(diào)色板查找表中的索引號(hào)。索引圖像(indexedimages)由數(shù)值矩陣和顏色映射數(shù)組組成。數(shù)值矩陣是每個(gè)像素的顏色索引編號(hào),通過(guò)這個(gè)標(biāo)號(hào)到顏色數(shù)組中查找顏色。顏色是預(yù)先定義的(索引顏色)。索引顏色的圖像最多只能顯示256種顏色。索引圖像RGB圖像RGB每一個(gè)像素由紅、綠和藍(lán)三個(gè)字節(jié)組成,每個(gè)字節(jié)為8,表示0到255之間的不同的亮度值,這三個(gè)字節(jié)組合可以產(chǎn)生16770萬(wàn)種不同的顏色。2.1.4模擬圖像數(shù)字化

(1)圖像的數(shù)字陣列表示

數(shù)字圖像采用數(shù)字陣列表示,陣列中的元素稱為像素(Pixel)或像點(diǎn)。每個(gè)像素位置(i,j)的數(shù)值

f(i,j)就反映了物理圖像上對(duì)應(yīng)點(diǎn)的亮度,被稱為亮度值或強(qiáng)度值或灰度值。通常,一幅圖像的灰度被分為256個(gè)等級(jí),每個(gè)像素的灰度值都在0~255之間。

1)f(i,j)

是位置(i,j)處的點(diǎn)的光強(qiáng)度,而光是能量的一種形式,故f(i,j)

必須大于等于零且為有限值(整數(shù))。2)數(shù)字化采樣一般是按方形點(diǎn)陣取樣的,也可以是三角形點(diǎn)陣、正六邊形點(diǎn)陣等取樣方式。3)用f(i,j)

的數(shù)值來(lái)表示

(i,j)

位置點(diǎn)上灰度級(jí)值的大小,即只反映了黑-白灰度的關(guān)系。如果是一幅彩色圖像,各點(diǎn)的數(shù)值還應(yīng)反映色彩的變化,可用f(i,j,)

表示,其中

是波長(zhǎng),如果圖像是運(yùn)動(dòng)的,則圖像序列還應(yīng)該是時(shí)間t的函數(shù),即可表示為

f(i,j,,t)

。幾點(diǎn)說(shuō)明(2)數(shù)字化過(guò)程圖像的數(shù)字化過(guò)程示意圖

(a)連續(xù)圖像(b)數(shù)字化結(jié)果圖像的數(shù)字化結(jié)果(2)數(shù)字化過(guò)程1)采樣

用空間上部分點(diǎn)的灰度值代表圖像,這些點(diǎn)稱為采樣點(diǎn)。采樣操作需要先將二維信號(hào)變?yōu)橐痪S信號(hào),再對(duì)一維信號(hào)完成采樣。具體做法是先沿垂直方向按一定間隔從上到下順序地沿水平方向直線掃描,取出各水平線上灰度值的一維掃描線信號(hào);然后,再對(duì)一維掃描線信號(hào)按一定間隔采樣得到離散信號(hào)。

對(duì)于運(yùn)動(dòng)圖像,則需要先在時(shí)間軸上采樣,再沿垂直方向采樣,最后沿水平方向采樣。當(dāng)對(duì)一幅圖像采樣時(shí),若每行(即橫向)像素為M個(gè),每列(即縱向)像素為N個(gè),則圖像大小為M×N個(gè)像素。

采樣點(diǎn)間隔大小對(duì)采樣后圖像的質(zhì)量有重要影響。通常圖像中細(xì)節(jié)越多,采樣間隔應(yīng)該越小。根據(jù)一維采樣定理,若一維信號(hào)f(t)

的最大角頻率為ω,以

T≤1/2ω

為間隔采樣,則根據(jù)采樣后的結(jié)果f(i,T)

能完全恢復(fù)f(t),即:

(2.6)

(2.7)

模擬圖像經(jīng)過(guò)采樣后,在時(shí)間和空間上離散化為像素。但經(jīng)過(guò)采樣所得到灰度值仍然是連續(xù)量。把采樣后所得的各像素的灰度值從模擬量轉(zhuǎn)換到離散量的過(guò)程稱為圖像灰度量化。

一幅圖像中不同灰度值的個(gè)數(shù)稱為灰度級(jí),一般為256級(jí)(28

),所以像素灰度取值范圍為0~255之間的整數(shù),對(duì)應(yīng)圖像中的顏色為從黑到白。2)量化灰度等級(jí)示意圖

等間隔量化,就是簡(jiǎn)單地把采樣值的灰度范圍等間隔地分割并進(jìn)行量化。對(duì)于像素灰度值在黑白范圍內(nèi)較均勻分布的圖像,這種量化方法可以得到較小的量化誤差。該方法也稱為均勻量化或線性量化。

非等間隔量化(非均勻量化),是依據(jù)一幅圖像的灰度值分布概率密度函數(shù),按量化總誤差最小原則進(jìn)行量化。具體做法是:對(duì)圖像中像素灰度值頻繁出現(xiàn)的灰度值范圍,量化間隔取得小一些;而對(duì)那些像素灰度值極少出現(xiàn)的范圍,則量化間隔取得大一些。連續(xù)灰度值量化為灰度級(jí)方法說(shuō)明:

由于圖像灰度值的概率分布密度函數(shù)因圖像不同而異,所以不可能找到一個(gè)適用于各種不同圖像的最佳的非等間隔量化方案。因此,實(shí)用上一般都采用等間隔量化。經(jīng)過(guò)上面的采樣和量化就實(shí)現(xiàn)了模擬圖像數(shù)字化。若一幅連續(xù)圖像

數(shù)字化后用一個(gè)離散的矩陣f(i,j)表示,則

(2.8)幾行幾列?4行5列

3)采樣與量化參數(shù)選擇對(duì)于一幅圖像,當(dāng)量化級(jí)數(shù)一定時(shí),采樣點(diǎn)數(shù)M×N對(duì)圖像質(zhì)量有著顯著的影響。如圖

2.3所示,采樣點(diǎn)數(shù)越多,圖像質(zhì)量越好;當(dāng)采樣點(diǎn)數(shù)減少時(shí),圖像上的塊狀效應(yīng)就逐漸明顯。(a)原圖像

(b)采樣點(diǎn)降低到1/2(c)降低到1/4(d)降低到1/8圖2.3量化級(jí)數(shù)一定時(shí)采樣點(diǎn)變化對(duì)圖像質(zhì)量的影響采樣點(diǎn)數(shù)的影響

當(dāng)圖像的采樣點(diǎn)數(shù)一定時(shí),采用不同量化級(jí)數(shù)的圖像質(zhì)量也不同。量化級(jí)數(shù)越多,圖像質(zhì)量越好,當(dāng)量化級(jí)數(shù)越少時(shí),圖像質(zhì)量就會(huì)變差。量化級(jí)數(shù)最小的極端情況就是二值圖像,圖像出現(xiàn)假輪廓。如圖2.4所示。量化級(jí)數(shù)的影響(a)原圖像

(b)64級(jí)

(c)16級(jí)

(d)2級(jí)圖2.4采樣點(diǎn)數(shù)一定時(shí)量化級(jí)數(shù)變化對(duì)圖像質(zhì)量的影響

怎么采樣量化(??迹??具體的過(guò)程一般是:利用數(shù)字化設(shè)備先把圖像劃分為像素,并給出它們的地址(采樣);然后度量每一像素的灰度,并把連續(xù)的度量結(jié)果表示為整數(shù)(量化);最后將這些整數(shù)結(jié)果寫入存儲(chǔ)設(shè)備。

常見的數(shù)字化設(shè)備有數(shù)碼相機(jī)、掃描儀和數(shù)字化儀等,設(shè)備一般必須包含以下5個(gè)部分。①采樣孔:使數(shù)字化設(shè)備能單獨(dú)觀測(cè)特定像元而不受圖像其它部分影響。②掃描機(jī)構(gòu):使采樣孔能按照預(yù)先確定的方式在圖像上移動(dòng),從而按照順序觀測(cè)到每一個(gè)像素。③光傳感器:通常用電荷耦合器件(charge-coupleddevice,CCD)陣列采樣檢測(cè)每一像素的亮度。④量化器:將傳感器輸出的連續(xù)量轉(zhuǎn)化為整數(shù)值。典型的量化器是A/D轉(zhuǎn)換器,它產(chǎn)生一個(gè)與輸入電壓或電流成比例的數(shù)值。⑤輸出存儲(chǔ)裝置:將量化器產(chǎn)生的灰度值按適當(dāng)格式存儲(chǔ)起來(lái),以用于計(jì)算機(jī)后續(xù)處理。4)圖像數(shù)字化設(shè)備2.2數(shù)字圖像顯示及像質(zhì)描述2.2.1數(shù)字圖像顯示

在空間(x,y)坐標(biāo)處顯示對(duì)應(yīng)圖像的亮度值

。(1)顯示設(shè)備

常見的主要是顯示器。此外還有陰極射線管(cathode-raytube,CRT)和各種打印設(shè)備。在每個(gè)偏轉(zhuǎn)位置,CRT電子槍束的強(qiáng)度用電壓來(lái)調(diào)整。每點(diǎn)的電壓與該點(diǎn)所對(duì)應(yīng)的灰度值成正比。這樣,灰度圖就轉(zhuǎn)化為光亮度空間的模式,然后記錄在陰極射線管的屏幕上顯現(xiàn)出來(lái)。

打印設(shè)備輸出圖像上任一點(diǎn)的灰度值可以由該點(diǎn)打印的字符數(shù)量和密度控制。一般報(bào)紙上圖像的分辨率約為每英寸100點(diǎn),而書籍或雜志上圖像的分辨率約為每英寸300點(diǎn)。(2)圖像顯示方法

有永久性顯示和暫時(shí)性顯示兩種。永久性的往往在紙、膠片或其它永久媒介上產(chǎn)生圖像的硬拷貝。暫時(shí)性顯示方法是指在顯示屏上產(chǎn)生一幅暫時(shí)性的圖像。(3)圖像顯示特性

最重要的顯示特性是圖像的大小、光度分辨率、空間分辨率、低頻響應(yīng)和噪聲特性。其中,顯示系統(tǒng)顯示圖像大小的能力包括兩部分:①顯示器自身的物理尺寸,它應(yīng)該足夠大,可以方便地觀察和理解所顯示的圖像;②顯示系統(tǒng)能夠處理的最大數(shù)字圖像的大小。

電子噪聲會(huì)引起顯示亮度與位置兩方面的變化:①幅值噪聲

通常表現(xiàn)為隨機(jī)的黑白點(diǎn),在平坦區(qū)域中尤其明顯。如果噪聲是周期性的并且有足夠的強(qiáng)度,那么它會(huì)在被顯示圖像上產(chǎn)生一個(gè)疊加的“魚骨形圖案”。如果噪聲是周期性的,并且與水平或垂直偏轉(zhuǎn)信號(hào)同步,那么它會(huì)產(chǎn)生條狀圖案。(對(duì)癥下藥)②點(diǎn)位置噪聲

設(shè)備的偏轉(zhuǎn)電路會(huì)帶來(lái)點(diǎn)顯示間距不均勻。除非點(diǎn)位置噪聲極其嚴(yán)重,否則,一般不會(huì)給圖像帶來(lái)可察覺的幾何畸變。但是,如果點(diǎn)之間的相互影響與位置噪聲的組合,會(huì)產(chǎn)生相當(dāng)大的幅值變化。(4)顯示系統(tǒng)噪聲2.2.2像質(zhì)基本描述方法(主、客觀評(píng)價(jià)相結(jié)合)(1)主觀評(píng)價(jià)方法

往往會(huì)借助在統(tǒng)計(jì)學(xué)上有意義的多人打分來(lái)進(jìn)行,常用的打分工具是里克特量表。(有專業(yè)知識(shí)或經(jīng)過(guò)培訓(xùn))分?jǐn)?shù)質(zhì)量尺度妨礙尺度5非常好絲毫看不出圖像質(zhì)量變壞4好能看出圖像質(zhì)量變壞,不妨礙觀看3一般清楚地看出圖像質(zhì)量變壞,對(duì)觀看稍有妨礙2差對(duì)觀看有妨礙1非常差非常嚴(yán)重地妨礙尺度

表2.1圖像主觀評(píng)價(jià)尺度評(píng)分表(2)客觀評(píng)價(jià)方法——用指標(biāo)衡量

常用的客觀評(píng)價(jià)方法從原理上大致可分為三類:基于信息量的指標(biāo)、基于統(tǒng)計(jì)特性的指標(biāo)和基于人眼視覺特性的指標(biāo)。需要說(shuō)明的是:1)圖像的客觀評(píng)價(jià)指標(biāo)很多,既有有參考的評(píng)價(jià)也有無(wú)參考的評(píng)價(jià);2)主客觀評(píng)價(jià)并不總是具有一致性。

——像質(zhì)評(píng)價(jià)依然需要研究(目前主要采用多種方法處理結(jié)果多指標(biāo)比較)常用的像質(zhì)評(píng)價(jià)指標(biāo)1)基于信息量的評(píng)價(jià)指標(biāo)①

信息熵(InformationEntropy,IE)

用來(lái)衡量圖像信息的豐富程度,對(duì)干凈圖像而言,其值越大像質(zhì)越好。但噪聲越嚴(yán)重該值也越大,這時(shí)像質(zhì)反而不好了(后面都是對(duì)干凈圖像而言)。IE定義:

(2.11)式中,L表示圖像的灰度級(jí)數(shù)總數(shù),

表示檢測(cè)到灰度級(jí)為i的像素在整幅圖像中出現(xiàn)的概率。②互信息(MutualInformation,MI)

互信息描述待評(píng)價(jià)圖像與參考圖像之間的信息量相關(guān)程度,其值越高表示待評(píng)價(jià)圖像越接近參考圖像。MI定義如下:

(2.12)式中,和

分別是待評(píng)價(jià)圖像和參考圖像的歸一化灰度概率密度,

是二者的歸一化聯(lián)合概率密度。①標(biāo)準(zhǔn)差(StandardDeviation,SD)

標(biāo)準(zhǔn)差用來(lái)衡量像素灰度分布情況,圖像的標(biāo)準(zhǔn)差越大,說(shuō)明圖像的灰度分布越廣泛,像質(zhì)越好。SD定義:

(2.13)式中,I為圖像,表示圖像I的灰度均值,

為圖像的分辨率尺寸,

為圖像在位置(m,n)的像素值。②平均梯度(AverageGradient,AG)

表示圖像中紋理信息、細(xì)節(jié)信息以及邊緣信息的差異變化,平均梯度越大說(shuō)明圖像的細(xì)節(jié)越豐富,效果越清晰,其定義如下:

(2.14)式中,

表示在方向x的灰度值差分,

表示在方向y的灰度值差分。2)基于統(tǒng)計(jì)特性的評(píng)價(jià)指標(biāo)1)對(duì)比度(Contrast,C)

對(duì)比度測(cè)量的是圖像中不同亮度層級(jí)的大小,對(duì)比度越大,圖像越容易觀察,越符合人眼視覺變化和觀察。其定義如下:

(2.15)式中,

表示相鄰像素點(diǎn)之間灰度值差,

表示相鄰像素灰度差為

的像素點(diǎn)出現(xiàn)的概率。3)基于人眼視覺特性的評(píng)價(jià)指標(biāo)2)邊緣強(qiáng)度(EdgeIntensity,EI)邊緣強(qiáng)度計(jì)算的是圖像邊緣梯度大小,其值越大圖像的邊緣越清晰。

第i行、第j列的圖像像素在x、y方向的一階差分定義為:

(2.16)

(2.17)則圖像的EI定義為:

(2.18)強(qiáng)

調(diào)(1)像質(zhì)評(píng)價(jià)是經(jīng)典的難題,難就難在目前尚無(wú)像質(zhì)評(píng)價(jià)的金標(biāo)準(zhǔn),人們總是根據(jù)具體處理需求來(lái)評(píng)價(jià)圖像。所以,隨著圖像處理的應(yīng)用發(fā)展,像質(zhì)評(píng)價(jià)仍然是一個(gè)不斷發(fā)展的方向。(2)單一的指標(biāo)很難全面衡量圖像質(zhì)量,往往需要多指標(biāo)綜合評(píng)價(jià)。(3)作為一個(gè)完整的研究,后續(xù)的每一章(或方向)實(shí)際上都涉及到一個(gè)結(jié)果的評(píng)價(jià)問題,由于篇幅所限后面內(nèi)容中不再提及。2.3色度學(xué)基礎(chǔ)與顏色模型2.3.1術(shù)語(yǔ):分辨率(1)圖像分辨率

是指每英寸圖像含有多少個(gè)點(diǎn)或像素,即ppi(pixelperinch)。在數(shù)字圖像中,分辨率的大小直接影響圖像的質(zhì)量。分辨率越高,圖像細(xì)節(jié)越清晰,但產(chǎn)生的圖像文件尺寸越大,同時(shí)處理的時(shí)間也越長(zhǎng),對(duì)設(shè)備的要求也越高。

另外,圖像的尺寸、圖像的分辨率和圖像文件的大小三者之間有著密切的聯(lián)系。圖像的尺寸越大,圖像的分辨率越高,圖像文件也就越大。因此,調(diào)整圖像的大小和分辨率即可以改變圖像文件的大小。(2)屏幕分辨率

顯示器上每單位長(zhǎng)度顯示的像素或點(diǎn)的數(shù)量稱為屏幕分辨率,通常也是以每英寸的點(diǎn)數(shù)(dpi)來(lái)表示的。屏幕分辨率取決于顯示器的大小及其像素設(shè)置,由計(jì)算機(jī)的顯卡決定。標(biāo)準(zhǔn)的VGA顯卡的分辨率是640×480點(diǎn)(像素),即水平方向640點(diǎn)(像素),垂直方向480點(diǎn)(像素)?,F(xiàn)在高性能的顯卡已經(jīng)支持1280×1024像素以上的分辨率。(3)打印機(jī)分辨率

打印機(jī)分辨率又稱為輸出分辨率,是指打印機(jī)輸出圖像時(shí)每英寸的點(diǎn)數(shù)(dpi)。打印機(jī)分辨率高,可以減少打印的鋸齒邊緣,在灰度的半色調(diào)表現(xiàn)上也會(huì)較為平滑。打印機(jī)的分辨率可達(dá)到300dpi以上,甚至720dpi,此時(shí)需要使用特殊紙張,而較老機(jī)型的激光打印機(jī)的分辨率通常為300~360dpi。新型激光打印機(jī)的分辨率可達(dá)到600~1200dpi,作為專業(yè)排版輸出已經(jīng)綽綽有余了。人們看到的色彩鮮艷、景物清晰的數(shù)碼照片就是很好的應(yīng)用實(shí)例。2.3.2色度學(xué)基礎(chǔ)(1)三色原理人眼存在桿狀細(xì)胞和錐狀細(xì)胞兩種感光細(xì)胞。在照度足夠高時(shí),錐狀細(xì)胞將電磁光譜的可見部分分為3個(gè)波段:紅(R)、綠(G)、藍(lán)(B)。因此,這3種顏色被稱為三基色。所有顏色都可看作3基色按不同的比例組合而成。

國(guó)際照明委員會(huì)(法語(yǔ)為CommissionInternationaledel′Eclairage,CIE)1931年規(guī)定了3基色的波長(zhǎng)分別為700nm(R)、546.1nm(G)、435.8nm(B)。將這3種單色光作為表色系統(tǒng)的三基色,這就是CIE的R、G、B顏色表示系統(tǒng)。

一幅彩色圖像的像素值可看作光強(qiáng)和波長(zhǎng)的函數(shù)值f(x,y,λ),但在實(shí)際使用時(shí),將其看作一幅普通二維圖像,且每個(gè)像素有紅、綠、藍(lán)3個(gè)灰度值。圖2.5人類視覺系統(tǒng)三類錐狀細(xì)胞的光譜敏感曲線紅,綠,藍(lán)三分量強(qiáng)度分量

彩色圖像和單色圖像(2)顏色的3個(gè)屬性

顏色是外界光刺激作用于人的視覺器官而產(chǎn)生的主觀感覺。顏色分為兩大類:非彩色和彩色。非彩色是指黑色、白色和介于這兩者之間深淺不同的灰色,也稱為無(wú)色系列。彩色是指除了非彩色以外的各種顏色。

顏色有3個(gè)基本屬性,分別是色調(diào)、飽和度和亮度,與此對(duì)應(yīng)的是一種常用的顏色模型HSI(Hue,Saturation,Intensity)模型。2.3.3顏色模型

為了科學(xué)地定量描述和使用顏色,人們提出了各種顏色模型。目前常用的顏色模型按用途可分為兩類:一類是面向視頻監(jiān)視器、彩色攝像機(jī)或打印機(jī)等硬件設(shè)備的;另一類是面向以彩色處理為目的的應(yīng)用,如動(dòng)畫中的彩色圖形的。面向硬件設(shè)備的最常用顏色模型是RGB模型,而面向彩色處理的最常用模型是HSI模型。另外,在印刷工業(yè)和電視信號(hào)傳輸中,經(jīng)常使用CMYK和YUV顏色模型。用三維空間中的一個(gè)點(diǎn)來(lái)表示某一種顏色,每個(gè)點(diǎn)有3個(gè)分量——紅、綠、藍(lán)亮度值,亮度值限定在[0,1]之間。

圖中,原點(diǎn)對(duì)應(yīng)黑色,3個(gè)分量值都為零。離原點(diǎn)最遠(yuǎn)的頂點(diǎn)對(duì)應(yīng)白色,它的3個(gè)分量值都為1。從黑到白的灰度值分布在這兩個(gè)點(diǎn)的連線上,該連線稱為灰色線。其余各點(diǎn)對(duì)應(yīng)不同顏色。立方體的3個(gè)頂點(diǎn)(軸上)對(duì)應(yīng)于三基色,另3個(gè)頂點(diǎn)對(duì)應(yīng)三基色的補(bǔ)色——黃色、青色(藍(lán)綠色)、品紅色(紫色)。(1)RGB顏色模型圖2.6RGB模型示意圖

(a)原圖像(b)R分量(c)G分量(d)B分量圖特別提示:?jiǎn)瓮ǖ缊D像是灰度的,圖中分量是彩色化輸出(另兩個(gè)通道值為0)。(2)HSI顏色模型H表示色調(diào)(Hue):反映該彩色最接近什么樣的光譜波長(zhǎng)(即彩虹中的那種顏色);S表示飽和度(Saturation):表示顏色的深淺程度,飽和度越高,顏色越深,如深紅,深綠等。I表示亮度(Intensity):是指光波作用于感受器所發(fā)生的效應(yīng),其大小由物體反射系數(shù)來(lái)決定。反射系數(shù)越大,物體的亮度越大,反之越小。(2)HSI顏色模型HSI模型由芒塞爾(Munsell)提出,其建立基于兩個(gè)重要事實(shí):一個(gè)是I分量與圖像的彩色信息無(wú)關(guān);另一個(gè)是H和S分量與人感受顏色的方式是密切聯(lián)系的。這些特點(diǎn)使得HSI模型非常適合借助人的視覺系統(tǒng)來(lái)感知彩色特性的圖像處理算法。不失一般性,可以假定0o的彩色為紅色,120o的為綠色,240o的為藍(lán)色。色度從0o~360o覆蓋了所有可見光譜的彩色。圖2.8柱形彩色空間圖2.7色相環(huán)色相H用角度來(lái)表示,它反映了該彩色最接近什么樣的光譜波長(zhǎng)。在環(huán)的外圍圓周是純的或稱飽和的顏色,其飽和度值為1。中心是中性(灰色)的,即飽和度為0?;顒?dòng):

色相環(huán)僅考慮了H和S,如果要同時(shí)考慮H、S、I,如何改進(jìn)圖2.7?

環(huán)形中,0°到240°的色相覆蓋了所有可見光譜的彩色,在240°到300°之間為人眼可見的非光譜色(紫色)。

如果再把亮度作為色環(huán)的垂線,那么H、S、I構(gòu)成一個(gè)柱形彩色空間。三維柱形空間中,灰度陰影沿著軸線從底部的黑變到頂部的白,具有最高亮度。最大飽和度的顏色位于圓柱上頂面的圓周上。(a)原RGB圖像(b)H分量

(c)S分量(d)I分量1)YUV顏色模型

PAL制式彩色電視信號(hào)系統(tǒng)將R、G、B三色信號(hào)轉(zhuǎn)換成Y、U、V信號(hào)。其中,Y信號(hào)表示亮度,U、V信號(hào)是色差信號(hào)。2)CMYK顏色模型

印刷工業(yè)常用。是通過(guò)顏色相減來(lái)產(chǎn)生其它顏色,稱為減色合成法(subtractivecolorsynthesis)。C(Cyan)=

青色,即“天藍(lán)”或是“湛藍(lán)”色;M(Magenta)=

品紅色,又稱為“洋紅”色;Y(Yellow)=黃色;K(即KeyPlate,blacK)=定位套版色(黑色)。進(jìn)行圖像處理時(shí),一般不采用CMYK模式,原因是這種模式的圖像文件很大,占用的磁盤空間和內(nèi)存很大。計(jì)算機(jī)屏幕顯示通常用RGB顏色模型,它是通過(guò)相加來(lái)產(chǎn)生其它顏色的,這種做法通常稱為加色合成法(additivecolorsynthesis)。

(3)其它顏色模型(4)顏色模型的相互轉(zhuǎn)換1)RGB模型轉(zhuǎn)換到HIS模型給定一幅RGB彩色圖像,對(duì)任何3個(gè)[0,1]范圍內(nèi)的R,G,B值,其對(duì)應(yīng)HSI模型中的I,S,H分量的計(jì)算公式為(2.19)假設(shè)S和I的值在[0,1]之間,R,G,B的值也在[0,1]之間,則HSI模型轉(zhuǎn)換為RGB模型的公式分成3段,以便利用對(duì)稱性。當(dāng)H在[0°,120°]之間時(shí)2)HSI模型轉(zhuǎn)換到RGB模型當(dāng)H在[120°,240°]之間

當(dāng)H在[240°,360°]之間(2.22)3)RGB模型轉(zhuǎn)換到CMYK模型(2.23)4)CMYK模型轉(zhuǎn)換到RGB模型(2.24)式(2.23)和(2.24)中,W指白色,R、G、B分別是紅、綠、藍(lán)色,C、M、Y分別代表青色、品紅色和黃色。5)RGB模型轉(zhuǎn)換到Y(jié)UV模型

(2.25)

(2.26)6)

YUV模型轉(zhuǎn)換到RGB模型

(a)原RGB圖像(b)Y分量(c)U分量

(d)V分量

2.3.4彩色顯示(1)用彩色監(jiān)視器顯示,用彩色顯像管的顯示方法,利用相加混色法產(chǎn)生各種顏色。相加混色的規(guī)律為紅色+綠色=黃色紅色+藍(lán)色=紫色藍(lán)色+綠色=青色紅色+藍(lán)色+綠色=白色黃色=白色-藍(lán)色紫色=白色-綠色青色=白色-紅色紅色=白色-藍(lán)色-綠色綠色=藍(lán)色-紅色藍(lán)色=白色-綠色-紅色黑色=白色-藍(lán)色-綠色-紅色(2)彩色硬拷貝設(shè)備,是用相減混色原理顯示彩色圖像的,相減混色的規(guī)律為2.4數(shù)字圖像處理基礎(chǔ)2.4.1灰度直方圖及其應(yīng)用(1)直方圖的定義

灰度直方圖是圖像灰度級(jí)的函數(shù),描述的是圖像中具有該灰度級(jí)的像素的個(gè)數(shù),其橫坐標(biāo)是灰度級(jí),縱坐標(biāo)是該灰度出現(xiàn)的頻率,即等于該灰度的像素的個(gè)數(shù)或者頻數(shù)。

灰度直方圖是反映一幅圖像中的灰度級(jí)與出現(xiàn)這種灰度的概率之間的關(guān)系的圖形,是圖像的最基本的統(tǒng)計(jì)特征,是圖像處理中的重要工具之一。在離散形式下,用代表離散灰度級(jí),用表示概率密度函數(shù),則有

式中,nk為圖像f(x,y)中具有rk這種灰度值的像素?cái)?shù),n為圖像中像素總數(shù),而nk/n為頻數(shù)。(2.27)在直角坐標(biāo)系中做出與的關(guān)系圖形,即為直方圖。

圖2.9一幅圖像及其直方圖imhist(I)活動(dòng):想一想通常在一幅圖像中移動(dòng)某一目標(biāo)對(duì)直方圖有沒有影響?沒有。直方圖描述了每個(gè)灰度級(jí)具有的像素的個(gè)數(shù),但它不能為這些像素在圖像中的空間位置提供任何線索。

圖2.10不同圖像具有相同直方圖(2)

直方圖的性質(zhì)(1)直方圖只反映圖像中不同灰度值出現(xiàn)的次數(shù)(或頻數(shù)),而不能反映某一灰度值像素所在位置。也就是說(shuō),它只包含了該圖像中某一灰度值的像素出現(xiàn)的概率,而丟失了其所在位置的信息。(2)任一幅圖像,都能唯一地確定一幅與它相對(duì)應(yīng)的直方圖,但不同圖像,可能有相同的直方圖。即圖像與直方圖之間是多對(duì)一的映射關(guān)系。(3)由不連續(xù)區(qū)域組成的一幅圖像,若每個(gè)區(qū)域的直方圖已知,則整幅圖像的直方圖等于區(qū)域的直方圖之和。(3)直方圖的基本應(yīng)用1)幫助確定數(shù)字化參數(shù)直方圖可用來(lái)判斷一幅圖像是否合理利用了全部灰度級(jí)。一旦被圖像數(shù)字化的級(jí)數(shù)少于256,丟失的信息除非重新數(shù)字化圖像,否則將不能被恢復(fù)。如果圖像具有超出數(shù)字化器所能處理的范圍的亮度,則這些灰度級(jí)將被簡(jiǎn)單地設(shè)置為0或255,由此將在直方圖的一端或兩端產(chǎn)生尖峰。

通過(guò)對(duì)直方圖的快速檢查可以使數(shù)字化過(guò)程中產(chǎn)生的問題及早暴露出來(lái),以免浪費(fèi)大量的后續(xù)處理時(shí)間。生活經(jīng)驗(yàn)告訴我們:可以通過(guò)物體的輪廓線從一幅圖像中選擇/分割目標(biāo)。在圖像處理中采用的用輪廓線作為邊界的技術(shù)稱為閾值化。例:一幅圖像淺色背景中有一個(gè)深色的物體。其直方圖是雙峰的——深色像素產(chǎn)生了直方圖上的左峰,而淺色像素產(chǎn)生了直方圖上的右峰。由于物體邊界附近具有兩峰之間灰度級(jí)的像素?cái)?shù)目相對(duì)較少,所以產(chǎn)生了兩峰之間的谷。選擇谷作為灰度閾值將得到合理的物體的邊界。2)邊緣閾值選擇圖2.11雙峰直方圖

在谷底的附近,直方圖的值相對(duì)較小,如果試圖測(cè)量物體的面積,選擇谷底處閾值將使測(cè)量對(duì)于閾值灰度變化的敏感性降到最低。所以,在給出圖像的灰度直方圖后,甚至可以在沒有看到圖像的情況下就可以確定物體的最佳灰度閾值,以便計(jì)算物體的面積。(求導(dǎo)求極值)綜合光密度(integratedopticaldensity,IOD)是反映圖像“質(zhì)量”的一種有用度量,其定義為3)綜合光密度對(duì)于數(shù)字圖像,有

式中,NS和NL分別表示圖像的寬度和高度,D(i,j)是點(diǎn)(i,j)處像素的灰度值。(該量與被測(cè)物體的質(zhì)量成正比,在醫(yī)學(xué)中有重要應(yīng)用)(2.28)(2.29)2.4.2圖像處理系統(tǒng)及編程語(yǔ)言(1)圖像處理系統(tǒng)

由數(shù)字化設(shè)備產(chǎn)生的數(shù)字圖像先進(jìn)入一個(gè)適當(dāng)裝置的緩存,然后,根據(jù)指令由計(jì)算機(jī)調(diào)用和執(zhí)行程序庫(kù)的圖像處理程序。在執(zhí)行過(guò)程中,輸入圖像被逐行讀入計(jì)算機(jī),處理之后再逐行按像素輸出圖像。這個(gè)過(guò)程中既離不開合適的硬件也離不開合適的軟件。圖2.12數(shù)字圖像處理系統(tǒng)應(yīng)用程序開發(fā)工具操作系統(tǒng)設(shè)備驅(qū)動(dòng)程序//硬件//圖2.13圖像處理軟件系統(tǒng)(2)圖像處理開發(fā)工具1)MATLAB(本課程采用)

MATLAB是matrix&laboratory的縮寫,是由美國(guó)MathWorks公司出品。具有矩陣運(yùn)算、繪制函數(shù)和數(shù)據(jù)、實(shí)現(xiàn)算法、創(chuàng)建用戶界面、連接其他編程語(yǔ)言等功能。該軟件常用于工程計(jì)算、控制設(shè)計(jì)、信號(hào)處理與通訊、圖像處理、信號(hào)檢測(cè)、金融建模設(shè)計(jì)與分析等領(lǐng)域。由于其基本數(shù)據(jù)單位是矩陣,故處理圖像問題十分方便。(世界十大編程語(yǔ)言之一)2)面向?qū)ο罂梢暬晒ぞ遃C++

VC++在工業(yè)上應(yīng)用較廣泛,多數(shù)工業(yè)相機(jī)廠商都給出了VC++開發(fā)包,而且有很多開源庫(kù)支持,如OpenGL,OpenCV等,使得它功能日益強(qiáng)大。就圖像處理而言,與MATLAB相比,編程稍顯復(fù)雜。3)Python

Python產(chǎn)生于上個(gè)世紀(jì)九十年代,由荷蘭國(guó)家數(shù)學(xué)和計(jì)算機(jī)科學(xué)研究所的GuidovanRossum設(shè)計(jì),其特點(diǎn)是簡(jiǎn)單易上手,是深度學(xué)習(xí)開源碼的主要工具之一,因此,近幾年用戶數(shù)增長(zhǎng)極快。(更簡(jiǎn)單,但庫(kù)函數(shù)和轉(zhuǎn)VC略遜MATLAB)

本章從數(shù)字圖像獲取與顯示入手,首先介紹了成像過(guò)程、模擬圖像描述、圖像數(shù)字化、顯示和像質(zhì)評(píng)價(jià)方法,使我們能夠?qū)斎朐矗ㄖ饕腔叶葓D像)有初步的了解;考慮到現(xiàn)實(shí)中多是彩色化圖像,所以接著對(duì)典型的顏色模型進(jìn)行了介紹;然后,為方便著手處理圖像,介紹了一種重要常用的圖像描述手段——圖像的直方圖,最后指明了圖像處理所必需的軟硬件。本章小結(jié)第3章

數(shù)字圖像處理的

數(shù)學(xué)基礎(chǔ)學(xué)習(xí)目標(biāo)1.編程實(shí)現(xiàn)數(shù)字圖像處理中基本運(yùn)算。2.熟悉使用傅里葉變換、離散余弦變換和小波變換處理圖像的原理和過(guò)程。3能調(diào)用Matlab函數(shù)實(shí)現(xiàn)圖像變換。本

內(nèi)

容3.1.1點(diǎn)運(yùn)算

3.1數(shù)字圖像的基本運(yùn)算點(diǎn)運(yùn)算用于逐點(diǎn)改變一幅圖像的灰度分布。假設(shè)圖像像素矩陣的(i,j)位置的灰度值為f(xi,yj),則圖像的點(diǎn)運(yùn)算為

g(xi,yj)=T(f(xi,yj))(3.1)其中,T(·)表示某類變換,如線性變換、非線性變換;

g(xi,yj)表示運(yùn)算后的結(jié)果(處理后的圖像)。

如:Y=kx+b……3.1數(shù)字圖像的基本運(yùn)算圖像的點(diǎn)運(yùn)算操作的作用:1)改變像素的灰度級(jí),應(yīng)用于光學(xué)儀器校準(zhǔn);2)提高目標(biāo)與背景對(duì)比度,達(dá)到突出感興趣區(qū)域的效果;3)利用灰度線劃分圖像區(qū)域,對(duì)圖像加上輪廓線。g(xi,yj)=kf(xi,yj)+b等等

主要包括像素間的四則運(yùn)算。假設(shè)兩幅灰度圖像分別為f(x,y)和g(x,y),是大小為M×N的灰度圖像,圖像間的代數(shù)運(yùn)算指的是對(duì)應(yīng)像素間執(zhí)行基本四則運(yùn)算(需滿足矩陣運(yùn)算法則)其中,x=0,1,...M;y=0,1,...N。3.1.2代數(shù)運(yùn)算3.1數(shù)字圖像的基本運(yùn)算3.1數(shù)字圖像的基本運(yùn)算+-×÷表3.1

Matlab中圖像的代數(shù)運(yùn)算函數(shù)(X和Y代表兩幅圖像)加法減法乘法除法Z=imadd(X,Y)Z=imsubtract(X,Y)Z=immulitply(X,Y)Z=imdivide(X,Y)如果用運(yùn)算符號(hào),則為:+、-、.*、./代數(shù)運(yùn)算的應(yīng)用,1)降噪:帶有不同噪聲的同一圖像相加可以降噪;2)圖像相減可以增強(qiáng)圖像的差別;3)圖像的相乘(相除)可以用來(lái)校正陰影,等。3.1數(shù)字圖像的基本運(yùn)算例3.1設(shè)g(x,y)是無(wú)噪聲圖像,η(x,y)是噪聲,觀測(cè)gi(x,y)=g(x,y)+ηi(x,y)(i=1,2,...,k),若噪聲η(x,y)在點(diǎn)(x,y)處是不相關(guān)的且均值為零。k幅不同噪聲圖像的平均為:則,數(shù)學(xué)期望重要應(yīng)用:在天文學(xué)領(lǐng)域,單幅成像常伴有傳感器噪聲。使用傳感器陣列獲取圖像(CCD成像),長(zhǎng)時(shí)間觀察同一場(chǎng)景達(dá)到降噪的目的。MATLAB中圖像變換函數(shù)為

Z=imlincomb(K1,A1,K2,A2,…,Kn,An,K),其中,K1,K2,...Kn表示權(quán)重系數(shù);A1,A2,...An表示輸入圖像;K表示一個(gè)常數(shù)。該函數(shù)用來(lái)計(jì)算圖像間的代數(shù)運(yùn)算:

K1*A1+K2*A2+……+Kn*An+K如果取K1=1,K2=-1,對(duì)原始圖像進(jìn)行高斯濾波,即:A2=uint8(filter2(fspecial('gaussian'),A1))此時(shí),該函數(shù)實(shí)際執(zhí)行了A2-A1+128(即K=128)3.1數(shù)字圖像的基本運(yùn)算3.1.3幾何運(yùn)算

包括圖像插值與空間幾何變換。(1)圖像插值:根據(jù)原始圖像的像素值估計(jì)周圍點(diǎn)的像素值,是圖像縮放的基礎(chǔ)。MATLAB提供最近鄰插值、雙線性插值和雙三次插值三種方法:1)最近鄰插值用最近鄰位置的像素值作為目標(biāo)像素值估計(jì);2)雙線性插值采用最近的2×2鄰域內(nèi)像素值加權(quán)平均作為像素值估計(jì);3)雙三次插值采用最近的4×4鄰域內(nèi)像素值加權(quán)平均作為像素值估計(jì)。MATLAB的二維圖像插值函數(shù):ZI=interp2(X,Y,Z,XI,YI,Method)

其中,X和Y為原始像素位置,Z為像素值。XI和YI為相應(yīng)的返回值,ZI為目標(biāo)像素估計(jì)值。Method為插值方法——'linear'表示雙線性插值算法,'nearest'表示最近鄰插值,'cubic'表示雙三次插值。即對(duì)圖像進(jìn)行平移、旋轉(zhuǎn),其數(shù)學(xué)表達(dá)式為3.1數(shù)字圖像的基本運(yùn)算(2)空間

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論