彩色數(shù)字圖像基礎(chǔ)課件_第1頁
彩色數(shù)字圖像基礎(chǔ)課件_第2頁
彩色數(shù)字圖像基礎(chǔ)課件_第3頁
彩色數(shù)字圖像基礎(chǔ)課件_第4頁
彩色數(shù)字圖像基礎(chǔ)課件_第5頁
已閱讀5頁,還剩145頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第5章彩色數(shù)字圖像基礎(chǔ)12/13/20221第5章彩色數(shù)字圖像基礎(chǔ)12/10/20221圖像數(shù)據(jù)壓縮主要根據(jù)的兩個基本事實:對于圖像數(shù)據(jù)中許多重復(fù)數(shù)據(jù),使用數(shù)學(xué)方法來表示可以減少數(shù)據(jù)量,可應(yīng)用于無損壓縮;人的眼睛對圖像細(xì)節(jié)和顏色的辨認(rèn)有一個極限,把超過極限的部分去掉,這也就達(dá)到壓縮數(shù)據(jù)的目的,可應(yīng)用于有損壓縮。實際的圖像壓縮是綜合使用各種有損和無損壓縮技術(shù)來實現(xiàn)的。12/13/20222圖像數(shù)據(jù)壓縮主要根據(jù)的兩個基本事實:12/10/202225.1視角系統(tǒng)對顏色的感知人的視覺系統(tǒng)對顏色的感知的幾個特性:人的視網(wǎng)膜(humanretina)通過神經(jīng)元來感知外部世界的顏色,每個神經(jīng)元或者是一個對顏色敏感的錐體(cone),。紅、綠和藍(lán)三種錐體細(xì)胞對不同頻率的光的感知程度不同,對不同亮度的感知程度也不同,如圖5-01所示。這就意味著,人們可以使用數(shù)字圖像處理技術(shù)來降低數(shù)據(jù)率而不使人感到圖像質(zhì)量明顯下降。自然界中的任何一種顏色都可以由R,G,B這3種顏色值之和來確定,它們構(gòu)成一個3維的RGB矢量空間。這就是說,R,G,B的數(shù)值不同混合得到的顏色就不同,也就是光波的波長不同。自然界中的任何一種顏色都可以由R,G,B這3種顏色值之和來確定,它們構(gòu)成一個3維的RGB矢量空間。這就是說,R,G,B的數(shù)值不同混合得到的顏色就不同,也就是光波的波長不同,如圖5-02表示。12/13/202235.1視角系統(tǒng)對顏色的感知人的視覺系統(tǒng)對顏色的感知的幾個圖5-02產(chǎn)生波長不同的光所需要的三基色值[1]圖5-02表示使用基色波長為700nm(紅色)、546.1nm(綠色)和435.8nm(藍(lán)色)時,在可見光范圍里,相加混色產(chǎn)生某一波長的光波所需要的三種基色的數(shù)值。12/13/20224圖5-02產(chǎn)生波長不同的光所需要的三基色值[1]圖5-025.2圖像的顏色模型5.2.1顯示彩色圖像用RGB相加混色模型陰極射線管(cathoderaytube,CRT)CRT使用3個電子槍分別產(chǎn)生紅(Red)、綠(Green)和藍(lán)(Blue)三種波長的光,并以各種不同的相對強度綜合起來產(chǎn)生顏色,如圖5-03所示。組合這三種光波以產(chǎn)生特定顏色稱為相加混色,稱為RGB相加模型LED???平板顯示器???12/13/202255.2圖像的顏色模型5.2.1顯示彩色圖像用RGB相加圖5-03彩色顯象管產(chǎn)生顏色的原理12/13/20226圖5-03彩色顯象管產(chǎn)生顏色的原理12/10/20226某種顏色和這三種顏色之間的關(guān)系可用下面式子來描述:顏色=R(紅色百分比)+G(綠色百分比)+B(藍(lán)色百分比)圖5-04相加混色三基色等量相加時,得到白色;等量的紅綠相加而藍(lán)為0值時得到黃色;等量的紅藍(lán)相加而綠為0時得到品紅色;等量的綠藍(lán)相加而紅為0時得到青色。

12/13/20227某種顏色和這三種顏色之間的關(guān)系可用下面式子來描述:圖5-04圖5-05一幅圖像由許多像素組成圖像中的單個點稱為像素(pixel),每個像素都有一個值,稱為像素值,它表示特定顏色的強度。一個像素值往往用R,G,B三個分量表示。

12/13/20228圖5-05一幅圖像由許多像素組成圖像中的單表5-01相加色RGB顏色000黑001藍(lán)010綠011青100紅101品紅110黃111白RGB顏色000黑001藍(lán)010綠011青100紅101品紅110黃111白RGB顏色000黑001藍(lán)010綠011青100紅101品紅110黃111白RGB顏色000黑001藍(lán)010綠011青100紅101品紅110黃111白如果每個像素的每個顏色分量用二進(jìn)制的1位來表示,那末每個顏色的分量只有“1”和“0”這兩個值。這也就是說,每種顏色的強度是100%,或者是0%。在這種情況下,每個像素所顯示的顏色是8種可能出現(xiàn)的顏色之一,如表5-01所示。12/13/20229表5-01相加色RGB顏色000黑001藍(lán)010綠011青5.2.2打印彩色圖像用CMY相減混色模型相減色:用彩色墨水或顏料進(jìn)行混合得到的顏色;在理論上說,任何一種顏色都可以用三種基本顏料按一定比例混合得到。這三種顏色是青色(Cyan)、品紅(Magenta)和黃色(Yellow),通常寫成CMY,稱為CMY模型。之所以稱為相減色,乃是因為它減少了為視覺系統(tǒng)識別顏色所需要的反射光。12/13/2022105.2.2打印彩色圖像用CMY相減混色模型12/10/2圖5-06相減混色當(dāng)三基色等量相減時得到黑色;等量黃色(Y)和品紅(M)相減而青色(C)為0時,得到紅色(R);等量青色(C)和品紅(M)相減而黃色(Y)為0時,得到藍(lán)色(B);等量黃色(Y)和青色(C)相減而品紅(M)為0時,得到綠色(G)。

12/13/202211圖5-06相減混色當(dāng)三基色等量相減時得到黑色表5-03相減色青色品紅黃色相減色000白001黃010品紅011紅100青101綠110藍(lán)111黑青色品紅黃色相減色000白001黃010品紅011紅100青101綠110藍(lán)111黑青色品紅黃色相減色000白001黃010品紅011紅100青101綠110藍(lán)111黑青色品紅黃色相減色000白001黃010品紅011紅100青101綠110藍(lán)111黑按每個像素每種顏色用1位表示,相減法產(chǎn)生的8種顏色如表5-03所示12/13/202212表5-03相減色青色品紅黃色相減色000白001黃010表5-04相加色與相減色的關(guān)系相加混色相減混色生成的顏色RGBCMY

000111黑001110藍(lán)010101綠011100青100011紅101010品紅110001黃111000白相加混色相減混色生成的顏色RGBCMY

000111黑001110藍(lán)010101綠011100青100011紅101010品紅110001黃111000白例如,當(dāng)RGB為1∶1∶1時,在相加混色中產(chǎn)生白色,而CMY為1∶1∶1時,在相減混色中產(chǎn)生黑色。從另一個角度也可以看它們的互補性。從表5-04中可以看到,在RGB中的顏色為1的地方,在CMY對應(yīng)的位置上,其顏色值為0。例如RGB為0∶1∶0時,對應(yīng)CMY為1∶0∶1。12/13/202213表5-04相加色與相減色的關(guān)系相加混色相減混色生成的顏色圖5-07RGB彩色空間和CMY彩色空間的表示法12/13/202214圖5-07RGB彩色空間和CMY彩色空間的表示法12/105.3圖像的三個基本屬性5.3.1分辨率1.顯示分辨率指顯示屏上能夠顯示出的像素數(shù)目

分辨率越高,顯示的圖像質(zhì)量也就越高常用點距來衡量一個顯示屏的分辨率點距(dotpitch):顯像管玻璃面上的孔眼之間的距離;2.圖像分辨率組成一幅圖像的像素密度的度量方法.在用掃描儀掃描彩色圖像時,圖像的分辨率用每英寸多少點(dotsperinch,DIP)表示;12/13/2022155.3圖像的三個基本屬性5.3.1分辨率12/10/3.兩個不同的概念圖像分辨率是確定組成一幅圖像的像素數(shù)目顯示分辨率是確定顯示圖像的區(qū)域大小。5.3.2像素深度1.概念:指存儲每個像素所用的位數(shù),它也是用來度量圖像的分辨率;決定彩色圖像的每個像素可能有的顏色數(shù),或者確定灰度圖像的每個像素可能有的灰度級數(shù);表示一個像素的位數(shù)越多,它能表達(dá)的顏色數(shù)目就越多,而它的深度就越深;2.不一定要追求特別深的像素深度設(shè)備的限制;人眼分辨率的限制;12/13/2022163.兩個不同的概念12/10/2022163.屬性(Attribute)位在用二進(jìn)制數(shù)表示彩色圖像的像素時,除R,G,B分量用固定位數(shù)表示外,往往還增加1位或幾位作為屬性(Attribute)位;用來指定該像素應(yīng)具有的性質(zhì)。透明(Transparency)位,記為T。假如顯示屏上已經(jīng)有一幅圖存在,當(dāng)這幅圖或者這幅圖的一部分要重疊在上面時,T位就用來控制原圖是否能看得見。4.α通道(alphachannel)位在用32位表示一個像素時,若R,G,B分別用8位表示,剩下的8位常稱為α通道(alphachannel)位,或稱為復(fù)蓋(overlay)位、中斷位、屬性位。視圖混合(videokeying)技術(shù),它也采用α通道12/13/2022173.屬性(Attribute)位12/10/2022175.3.3真彩色、偽彩色與直接色1.真彩色(truecolor)概念:指在組成一幅彩色圖像的每個像素值中,有R,G,B三個基色分量,每個基色分量直接決定顯示設(shè)備的基色強度;真彩色圖通常是指RGB8:8:8,即圖像的顏色數(shù)等于224,也常稱為全彩色(fullcolor)圖像可生成的顏色數(shù)就是224=16777216種,而人的眼睛是很難分辨出這么多種顏色的許多場合往往用RGB5:5:5來表示,每個彩色分量占5個位,再加1位顯示屬性控制位共2個字節(jié),生成的真顏色數(shù)目為215=32K在顯示器上顯示的顏色就不一定是真彩色,要得到真彩色圖像需要有真彩色顯示適配器,目前在PC上用的VGA適配器是很難得到真彩色圖像的12/13/2022185.3.3真彩色、偽彩色與直接色12/10/2022182.偽彩色(pseudocolor)含義:每個像素的顏色不是由每個基色分量的數(shù)值直接決定,而是把像素值當(dāng)作彩色查找表(colorlook-uptable,CLUT)的表項入口地址,去查找一個顯示圖像時使用的R,G,B強度值,用查找出的R,G,B強度值產(chǎn)生的彩色彩色圖像本身的像素數(shù)值和彩色查找表的索引號有一個變換關(guān)系,這個關(guān)系可以使用Windows95/98定義的變換關(guān)系,也可以使用你自己定義的變換關(guān)系。使用查找得到的數(shù)值顯示的彩色是真的,但不是圖像本身真正的顏色,它沒有完全反映原圖的彩色。12/13/2022192.偽彩色(pseudocolor)12/10/202圖5-08真彩色和偽彩色圖像之間的差別12/13/202220圖5-08真彩色和偽彩色圖像之間的差別12/10/2023.直接色(directcolor)每個像素值分成R,G,B分量,每個分量作為單獨的索引值對它做變換。也就是通過相應(yīng)的彩色變換表找出基色強度,用變換后得到的R,G,B強度值產(chǎn)生的彩色稱為直接色;特點是對每個基色進(jìn)行變換;與真彩色系統(tǒng)相比:相同之處:都采用R,G,B分量決定基色強度;不同之處:真彩色的基色強度直接用R,G,B決定直接色的基色強度由R,G,B經(jīng)變換后決定。試驗結(jié)果表明,使用直接色在顯示器上顯示的彩色圖像看起來真實、很自然。12/13/2022213.直接色(directcolor)12/10/202直接色與偽彩色系統(tǒng)相比:相同之處是都采用查找表;不同之處:直接色對R,G,B分量分別進(jìn)行變換;偽彩色把整個像素當(dāng)作查找表的索引值進(jìn)行彩色變換;12/13/202222直接色與偽彩色系統(tǒng)相比:12/10/2022225.4圖像的種類5.4.1矢量圖與點位圖矢量圖(vectorbasedimage)法:用一系列計算機指令來表示一幅圖;實際上是數(shù)學(xué)方法來描述一幅圖,然后變成許多的數(shù)學(xué)表達(dá)式,再編程,用語言來表達(dá)。在計算顯示圖時,也往往能看到畫圖的過程。繪制和顯示這種圖的軟件通常稱為繪圖程序(drawprograms)

12/13/2022235.4圖像的種類5.4.1矢量圖與點位圖12/10/矢量圖優(yōu)點:當(dāng)需要管理每一小塊圖像時,矢量圖法非常有效;目標(biāo)圖像的移動、縮小放大、旋轉(zhuǎn)、拷貝、屬性的改變(如線條變寬變細(xì)、顏色的改變)也很容易做到;相同的或類似的圖可以把它們當(dāng)作圖的構(gòu)造塊,并把它們存到圖庫中,這樣不僅可以加速畫的生成,而且可以減小矢量圖文件的大小;矢量圖缺陷:當(dāng)圖變得很復(fù)雜時,計算機就要花費很長的時間去執(zhí)行繪圖指令。此外,對于一幅復(fù)雜的彩色照片(例如一幅真實世界的彩照),很難用數(shù)學(xué)來描述,因而就不用矢量法表示12/13/202224矢量圖優(yōu)點:12/10/202224點位圖(bitmappedimage)法把一幅彩色圖分成許多的像素,每個像素用若干個二進(jìn)制位來指定該像素的顏色、亮度和屬性。畫點位圖,或者編輯點位圖,使用的軟件稱為畫圖程序(paintprograms)。點位圖的獲取通常用掃描儀,以及攝像機、錄相機、激光視盤與視頻信號數(shù)字化卡一類設(shè)備,通過這些設(shè)備把模擬的圖像信號變成數(shù)字圖像數(shù)據(jù);12/13/202225點位圖(bitmappedimage)法12/10/20矢量圖與點位圖之比較:矢量圖:側(cè)重于“繪制”、去創(chuàng)造;文件的大小則主要取決圖的復(fù)雜程度;點位圖:偏重于“獲取”、去“復(fù)制”;影響文件大小的因素主要有:圖像分辨率和像素深度;顯示點位圖文件比顯示矢量圖文件要快;矢量圖和點位圖之間可以用軟件進(jìn)行轉(zhuǎn)換:由矢量圖轉(zhuǎn)換成點位圖采用光柵化(rasterizing)技術(shù),這種轉(zhuǎn)換也相對容易;由點位圖轉(zhuǎn)換成矢量圖用跟蹤(tracing)技術(shù),這種技術(shù)在理論上說是容易,但在實際中很難實現(xiàn),對復(fù)雜的彩色圖像尤其如此。12/13/202226矢量圖與點位圖之比較:12/10/2022265.5.2灰度圖與彩色圖灰度圖(gray-scaleimage):按照灰度等級的數(shù)目來劃分。如果每個像素的像素值用一個字節(jié)表示,灰度值級數(shù)就等于256級,每個像素可以是0~255之間的任何一個值單色圖像(monochromeimage):只有黑白兩中顏色,圖中的每個像素的像素值用1位存儲,它的值只有“0”或者“1”。12/13/2022275.5.2灰度圖與彩色圖12/10/202227圖5-09標(biāo)準(zhǔn)單色圖圖5-10標(biāo)準(zhǔn)灰度圖

12/13/202228圖5-09標(biāo)準(zhǔn)單色圖圖5-10標(biāo)準(zhǔn)灰度圖12/10/彩色圖像(colorimage)按照顏色的數(shù)目來劃分,例如256色圖像和真彩色(224=16777216種顏色)等。alpha通道:如24位彩色圖像是用32位存儲的,這個附加的8位叫做alpha通道,它的值叫做alpha值;用來表示該像素如何產(chǎn)生特技效果。12/13/202229彩色圖像(colorimage)12/10/202229圖5-7256色標(biāo)準(zhǔn)圖像轉(zhuǎn)換成的灰度圖256色標(biāo)準(zhǔn)圖像轉(zhuǎn)換成的256級灰度圖像,彩色圖像的每個像素的R、G和B值用一個字節(jié)來表示12/13/202230圖5-7256色標(biāo)準(zhǔn)圖像轉(zhuǎn)換成的灰度圖256色標(biāo)準(zhǔn)圖像轉(zhuǎn)圖5-824位標(biāo)準(zhǔn)圖像轉(zhuǎn)換成的灰度圖真彩色圖像轉(zhuǎn)換成的256級灰度圖像,每個像素的R,G,B分量分別用一個字節(jié)表示12/13/202231圖5-824位標(biāo)準(zhǔn)圖像轉(zhuǎn)換成的灰度圖真彩色圖像轉(zhuǎn)換成的25.5伽馬(γ)校正5.5.1γ的概念冪-律(power-law)轉(zhuǎn)換特性:y=xn→輸出=(輸入)γ

式中的γ(gamma)是冪函數(shù)的指數(shù),它用來衡量非線性部件的轉(zhuǎn)換特性。,“輸入”和“輸出”都縮放到0~1之間。其中,0表示黑電平,1表示顏色分量的最高電平。如果所有部件都有冪函數(shù)的轉(zhuǎn)換特性,那么整個系統(tǒng)的傳遞函數(shù)就是一個冪函數(shù),它的指數(shù)γ等于所有單個部件的γ的乘積。12/13/2022325.5伽馬(γ)校正5.5.1γ的概念12/10/20如果圖像系統(tǒng)的整個γ=1:輸出與輸入就成線性關(guān)系。意味在重現(xiàn)圖像中任何兩個圖像區(qū)域的強度之比率與原始場景的兩個區(qū)域的強度之比率相同。各種環(huán)境下再生圖像真實地再現(xiàn)“原始場景”的情況:“明亮環(huán)境”其他白色物體的亮度與圖像中白色部分的亮度幾乎相同的環(huán)境γ=1“暗淡環(huán)境”房間中的其他東西能夠看到,但比圖像中白色部分的亮度更暗。如電視的環(huán)境和計算機房的環(huán)境;γ≈1.25“黑暗環(huán)境”放映電影和投影幻燈片的環(huán)境γ≈1.512/13/202233如果圖像系統(tǒng)的整個γ=1:12/10/2022335.5.2γ校正所有CRT顯示設(shè)備都有冪-律轉(zhuǎn)換特性,起碼要有一個能夠提供γ校正的非線性部件,用來補償CRT的非線性特性。在所有廣播電視系統(tǒng)中,γ校正是在攝象機中完成的?!皵?shù)字時代”,進(jìn)入計算機的電視圖像依然帶有γ=0.5的校正

12/13/2022345.5.2γ校正12/10/2022345個有非線性轉(zhuǎn)換函數(shù)存在并可引入γ值地方:camera_gamma:攝象機中圖像傳感器的γ(通常γ=0.4或者0.5)encoding_gamma:編碼器編碼圖像文件時引入γ

decoding_gamma:譯碼器讀圖像文件時引入γ

LUT_gamma:圖像幀緩存查找表中引入γ

CRT_gamma:CRT的γ(通常γ=2.5)12/13/2022355個有非線性轉(zhuǎn)換函數(shù)存在并可引入γ值地方:12/10/202【例】在數(shù)字圖像顯示系統(tǒng)中,由于要顯示的圖像不一定就是攝像機來的圖像,假設(shè) 這種圖像的γ值等于1,如果: encoding_gamma=0.5, CRT_gamma=2.5 decoding_gamma=1.0 LUT_gamma=1.0 則,整個系統(tǒng)的γ≈1.0×0.5×2.5×1.0×1.0≈1.2512/13/202236【例】在數(shù)字圖像顯示系統(tǒng)中,由于要顯示的圖像不一定就是攝像機5.6JPEG壓縮編碼5.6.1JPEG算法概要:概念:JPEG(JointPhotographicExpertsGroup)是一個由ISO和IEC兩個組織機構(gòu)聯(lián)合組成的一個專家組,負(fù)責(zé)制定靜態(tài)的數(shù)字圖像數(shù)據(jù)壓縮編碼標(biāo)準(zhǔn),這個專家組開發(fā)的算法稱為JPEG算法,并且成為國際上通用的標(biāo)準(zhǔn),因此又稱為JPEG標(biāo)準(zhǔn)。JPEG是一個適用范圍很廣的靜態(tài)圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn),既可用于灰度圖像又可用于彩色圖像。12/13/2022375.6JPEG壓縮編碼5.6.1JPEG算法概要:1JPEG專家組開發(fā)了兩種基本的壓縮算法:一種是采用以離散余弦變換(DiscreteCosineTransform,DCT)為基礎(chǔ)的有損壓縮算法;在壓縮比為25:1的情況下,壓縮后還原得到的圖像與原始圖像相比較,非圖像專家難于找出它們之間的區(qū)別,因此得到了廣泛的應(yīng)用。近年來JPEG專家組正在制定JPEG2000(簡稱JP2000)標(biāo)準(zhǔn),采用小波變換(wavelet)算法。另一種是采用以預(yù)測技術(shù)為基礎(chǔ)的無損壓縮算法。12/13/202238JPEG專家組開發(fā)了兩種基本的壓縮算法:12/10/2022JPEG壓縮是有損壓縮,它利用了人的視角系統(tǒng)的特性,使用量化和無損壓縮編碼相結(jié)合來去掉視角的冗余信息和數(shù)據(jù)本身的冗余信息。JPEG算法框圖如圖5-13所示;壓縮編碼大致分成三個步驟:使用正向離散余弦變換(forwarddiscretecosinetransform,F(xiàn)DCT)把空間域表示的圖變換成頻率域表示的圖。使用加權(quán)函數(shù)對DCT系數(shù)進(jìn)行量化,這個加權(quán)函數(shù)對于人的視覺系統(tǒng)是最佳的。使用霍夫曼可變字長編碼器對量化系數(shù)進(jìn)行編碼。譯碼或者叫做解壓縮的過程與壓縮編碼過程正好相反。12/13/202239JPEG壓縮12/10/202239圖5-13JPEG壓縮編碼-解壓縮算法框圖12/13/202240圖5-13JPEG壓縮編碼-解壓縮算法框圖12/10/25.6.2JPEG算法的主要計算步驟正向離散余弦變換(FDCT)。量化(quantization)。Z字形編碼(zigzagscan)。使用差分脈沖編碼調(diào)制(differentialpulsecodemodulation,DPCM)對直流系數(shù)(DC)進(jìn)行編碼。使用行程長度編碼(run-lengthencoding,RLE)對交流系數(shù)(AC)進(jìn)行編碼。熵編碼(entropycoding)。12/13/2022415.6.2JPEG算法的主要計算步驟12/10/20221.正向離散余弦變換(1)對每個單獨的彩色圖像分量,把整個分量圖像分成8×8的圖像塊,如圖5-14所示,并作為兩維離散余弦變換DCT的輸入。通過DCT變換,把能量集中在少數(shù)幾個系數(shù)上。 圖5-14離散余弦變換12/13/2022421.正向離散余弦變換12/10/202242(2)DCT變換使用下式計算,......(5-1)

它的逆變換使用下式計算,......(5-2)

上面兩式中,

C(u),C(v)=1/,當(dāng)u,v=0;

C(u),C(v)=1,其他。

f(i,j)經(jīng)DCT變換之后,F(xiàn)(0,0)是直流系數(shù),其他為交流系數(shù)。12/13/202243(2)DCT變換使用下式計算,12/10/202243(3)在計算兩維的DCT變換時,可使用下面的計算式把兩維的DCT變換變成一維的DCT變換,

............(5-3)

.............(5-4)12/13/202244(3)在計算兩維的DCT變換時,可使用下面的計算式把兩維的圖5-15兩維DCT變換方法12/13/202245圖5-15兩維DCT變換方法12/10/2022452.量化是對經(jīng)過FDCT變換后的頻率系數(shù)進(jìn)行量化。目的是減小非“0”系數(shù)的幅度以及增加“0”值系數(shù)的數(shù)目。圖像質(zhì)量下降的最主要原因。對于有損壓縮算法,JPEG算法使用如圖5-16所示的均勻量化器進(jìn)行量化,量化步距是按照系數(shù)所在的位置和每種顏色分量的色調(diào)值來確定12/13/2022462.量化12/10/202246兩種量化表:表5-05亮度量化值表表5-06色度量化值

由于人眼對低頻分量的圖像比對高頻分量的圖像更敏感,因此圖中的左上角的量化步距要比右下角的量化步距小。12/13/202247兩種量化表:表5-05亮度量化值表表5-06色度量化值3.Z字形編排量化后的系數(shù)要重新編排目的是為了增加連續(xù)的“0”系數(shù)的個數(shù),就是“0”的游程長度;方法是按照Z字形的式樣編排,如圖所示。這樣就把一個8×8的矩陣變成一個1×64的矢量,頻率較低的系數(shù)放在矢量的頂部。12/13/2022483.Z字形編排12/10/202248圖5-18量化DCT系數(shù)的序號015614152728247131626294238121725304143911182431404453101923323945525420223338465155602134374750565961353648495758626312/13/202249圖5-18量化DCT系數(shù)的序號01561415272824.直流系數(shù)的編碼8×8圖像塊經(jīng)過DCT變換之后得到的DC直流系數(shù)有兩個特點:一是系數(shù)的數(shù)值比較大;二是相鄰8×8圖像塊的DC系數(shù)值變化不大。根據(jù)這個特點,JPEG算法使用了差分脈沖調(diào)制編碼(DPCM)技術(shù),對相鄰圖像塊之間量化DC系數(shù)的差值(Delta)進(jìn)行編碼, Delta=DC(0,0)k-DC(0,0)k-1

12/13/2022504.直流系數(shù)的編碼12/10/2022505.交流系數(shù)的編碼量化AC系數(shù)的特點:是1×64矢量中包含有許多“0”系數(shù),并且許多“0”是連續(xù)的,因此使用非常簡單和直觀的游程長度編碼(RLE)對它們進(jìn)行編碼。JPEG使用了1個字節(jié)的高4位來表示連續(xù)“0”的個數(shù);而使用它的低4位來表示編碼下一個非“0”系數(shù)所需要的位數(shù);跟在它后面的是量化AC系數(shù)的數(shù)值。12/13/2022515.交流系數(shù)的編碼12/10/2022516.熵編碼在JPEG有損壓縮算法中,使用霍夫曼編碼器來減少熵。使用霍夫曼編碼器的理由:是可以使用很簡單的查表(lookuptable)方法進(jìn)行編碼。壓縮數(shù)據(jù)符號時:霍夫曼編碼器對出現(xiàn)頻度比較高的符號分配比較短的代碼;對出現(xiàn)頻度較低的符號分配比較長的代碼;12/13/2022526.熵編碼12/10/202252[例5.1]表5-07所示的是DC碼表符號舉例ValueSSS00-1,11-3,-2,2,32-7..-4,4..73 如果DC的值(Value)為4,符號SSS用于表達(dá)實際值所需要的位數(shù),實際位數(shù)就等于3。12/13/202253[例5.1]表5-07所示的是DC碼表符號舉例Value7.組成位數(shù)據(jù)流最后一個步驟是把各種標(biāo)記代碼和編碼后的圖像數(shù)據(jù)組成一幀一幀的數(shù)據(jù),這樣做的目的是為了便于傳輸、存儲和譯碼器進(jìn)行譯碼,這樣的組織的數(shù)據(jù)通常稱為JPEG位數(shù)據(jù)流(JPEGbitstream)。12/13/2022547.組成位數(shù)據(jù)流12/10/202254例:已知由8bit表示的彩色圖像中某8×8圖像塊亮度值經(jīng)FDCT變換其FDCT系數(shù)為:235.6-1.0-12.1-5.22.1-1.7-2.71.3-22.6-17.2-6.2-3.2-2.9-0.10.41.2-10.9-9.3-1.61.50.2-0.9-0.6-0.1-7.1-1.90.21.50.9-0.10.00.3-0.6-0.81.51.6-0.1-0.70.61.31.8-0.21.6-0.3-0.81.51.0-1.0-1.3-0.4-0.3-1.5-0.51.71.1-0.8-2.61.6-3.8-1.81.91.2-0.6-0.4已知上一樣本中的DC系數(shù)為12。試求:1)規(guī)格化量化系數(shù)?2)這個圖像塊經(jīng)壓縮編碼后得到的數(shù)據(jù)?3)88樣本塊經(jīng)壓縮編碼后得到的數(shù)據(jù)?4)該圖像塊亮度的壓縮比?5)逆量化系數(shù)?12/13/202255例:已知由8bit表示的彩色圖像中某8×8圖像塊亮度值經(jīng)FD序號123456781150-1000002-2-10000003-1-10000004-10000000500000000600000000700000000800000000規(guī)格化量化系數(shù)12/13/202256序號123456781150-1000002-2-100001611101624405160121214192658605514131624405769561417222951878062182237566810910377243555648110411392496478871031211201017292959811210010399亮度量化表12/13/202257161110162440516012121419265860SizeAmplitude0011、-12-3、-2、2、33-7,-6,-5,-4,4,5,6,74-15,-14,…-8,8,…,14,15BaselineAC(DC)編碼表ClassDodelengthCodeword020013010230113310043101亮度DC系數(shù)差分Huffman表12/13/202258SizeAmplitude0011、-12-3、-2、2、3Run/SizeCodelengthCodeword0/0(EOB)410100/12000/22010/331000/441011…

1/1411001/25110111/371111001…

2/15111002/28111110012/3101111110111…

3/161110103/291111101113/312111111110101…

亮度AC系數(shù)Huffman表12/13/202259Run/SizeCodelengthCodeword0/序號1234567812400-10000002-24-120000003-14-130000004-140000000500000000600000000700000000800000000逆量化系數(shù)12/13/202260序號1234567812400-10000002-24-125.6.3應(yīng)用JPEG算法舉例下面是使用JPEG算法對一個8×8圖像塊計算得到的結(jié)果。在這個例子中,計算正向離散余弦變換(FDCT)之前對源圖像中的每個樣本數(shù)據(jù)減去了128,在逆向離散余弦變換之后對重構(gòu)圖像中的每個樣本數(shù)據(jù)加了128。12/13/2022615.6.3應(yīng)用JPEG算法舉例12/10/20226112/13/20226212/10/20226212/13/20226312/10/2022635.7圖像文件格式5.7.1BMP文件格式1.簡介:位圖文件(Bitmap-File,BMP)格式是Windows采用的圖像文件存儲格式,在Windows環(huán)境下運行的所有圖像處理軟件都支持這種格式。BMP位圖文件默認(rèn)的文件擴展名是BMP或者bmp2.文件結(jié)構(gòu)位圖文件頭(bitmap-fileheader)位圖信息頭(bitmap-informationheader)彩色表(colortable)和定義位圖的字節(jié)陣列12/13/2022645.7圖像文件格式5.7.1BMP文件格式12/10/5.7.2GIF文件格式1簡介:GIF(GraphicsInterchangeFormat)是CompuServe公司開發(fā)的圖像文件存儲格式,圖像文件以數(shù)據(jù)塊(block)為單位來存儲圖像的相關(guān)信息。GIF數(shù)據(jù)流(DataStream):一個GIF文件由表示圖形/圖像的數(shù)據(jù)塊、數(shù)據(jù)子塊以及顯示圖形/圖像的控制信息塊組成,稱為數(shù)據(jù)流,其中的所有控制信息塊和數(shù)據(jù)塊都必須在文件頭(Header)和文件結(jié)束塊(Trailer)之間。12/13/2022655.7.2GIF文件格式12/10/2022652.文件結(jié)構(gòu)1HeaderGIF文件頭

2LogicalScreenDescriptor邏輯屏幕描述塊

3GlobalColorTable全局彩色表

…擴展模塊(任選)…

4ImageDescriptor圖形描述塊

5LocalColorTable局部彩色表(可重復(fù)n次)可6TableBasedImageData表式壓縮圖像數(shù)據(jù)重7GraphicControlExtension圖像控制擴展塊復(fù)8PlainTextExtension無格式文本擴展塊n9CommentExtension注釋擴展塊個10ApplicatonExtension應(yīng)用程序擴展塊

…擴展模塊(任選)…

11GIFTrailerGIF文件結(jié)束塊

12/13/2022662.文件結(jié)構(gòu)1HeaderGIF文件頭2Logical5.7.3JPEG格式1.簡介JPEG文件使用的顏色空間中,每個分量、每個像素的電平規(guī)定為255級,用8位代碼表示。微處理機中的存放順序有正序(bigendian)和逆序(littleendian)之分。正序存放就是高字節(jié)存放在前低字節(jié)在后,而逆序存放就是低字節(jié)在前高字節(jié)在后。JPEG文件中的字節(jié)是按照正序排列的。12/13/2022675.7.3JPEG格式12/10/2022672.文件結(jié)構(gòu)JPEG文件由下面的8個部分組成:(1)圖像開始SOI(StartofImage)標(biāo)記(2)APP0標(biāo)記(Marker)3)APPn標(biāo)記(Markers),其中n=1~15(任選)(4)一個或者多個量化表DQT(difinequantizationtable)(5)幀圖像開始SOF0(StartofFrame)(6)一個或者多個霍夫曼表DHT(DifineHuffmanTable)(7)掃描開始SOS(StartofScan)(8)圖像結(jié)束EOI(EndofImage)12/13/2022682.文件結(jié)構(gòu)12/10/2022685.7.4PNG格式1.簡介流式網(wǎng)絡(luò)圖形格式(PortableNetworkGraphicFormat,PNG)名稱來源于非官方的“PNG‘sNotGIF”,是一種位圖文件(bitmapfile)存儲格式,讀成“ping”。PNG用來存儲灰度圖像時,灰度圖像的深度可多到16位,存儲彩色圖像時,彩色圖像的深度可多到48位,并且還可存儲多到16位的α通道數(shù)據(jù)。PNG使用從LZ77派生的無損數(shù)據(jù)壓縮算法。12/13/2022695.7.4PNG格式12/10/202269PNG文件格式保留GIF文件格式的下列特性:使用彩色查找表或者叫做調(diào)色板可支持256種顏色的彩色圖像。流式讀/寫性能(streamability):圖像文件格式允許連續(xù)讀出和寫入圖像數(shù)據(jù),這個特性很適合于在通信過程中生成和顯示圖像。逐次逼近顯示(progressivedisplay):這種特性可使在通信鏈路上傳輸圖像文件的同時就在終端上顯示圖像,把整個輪廓顯示出來之后逐步顯示圖像的細(xì)節(jié),也就是先用低分辨率顯示圖像,然后逐步提高它的分辨率。透明性(transparency):這個性能可使圖像中某些部分不顯示出來,用來創(chuàng)建一些有特色的圖像。輔助信息(ancillaryinformation):這個特性可用來在圖像文件中存儲一些文本注釋信息。獨立于計算機軟硬件環(huán)境。使用無損壓縮。12/13/202270PNG文件格式保留GIF文件格式的下列特性:12/10/20PNG文件格式中要增加下列GIF文件格式所沒有的特性:

每個像素為48位的真彩色圖像。每個像素為16位的灰度圖像??蔀榛叶葓D和真彩色圖添加α通道。添加圖像的γ信息。使用循環(huán)冗余碼(cyclicredundancycode,CRC)檢測損害的文件。加快圖像顯示的逐次逼近顯示方式。標(biāo)準(zhǔn)的讀/寫工具包。可在一個文件中存儲多幅圖像。12/13/202271PNG文件格式中要增加下列GIF文件格式所沒有的特性:12/2.文件結(jié)構(gòu)PNG圖像格式文件(或者稱為數(shù)據(jù)流)由一個8字節(jié)的PNG文件署名(PNGfilesignature)域和按照特定結(jié)構(gòu)組織的3個以上的數(shù)據(jù)塊(chunk)組成。PNG定義了兩種類型的數(shù)據(jù)塊:一種是稱為關(guān)鍵數(shù)據(jù)塊(criticalchunk),這是標(biāo)準(zhǔn)的數(shù)據(jù)塊;關(guān)鍵數(shù)據(jù)塊定義了4個標(biāo)準(zhǔn)數(shù)據(jù)塊,每個PNG文件都必須包含它們,PNG讀寫軟件也都必須要支持這些數(shù)據(jù)塊。另一種叫做輔助數(shù)據(jù)塊(ancillarychunks),這是可選的數(shù)據(jù)塊。雖然PNG文件規(guī)范沒有要求PNG編譯碼器對可選數(shù)據(jù)塊進(jìn)行編碼和譯碼,但規(guī)范提倡支持可選數(shù)據(jù)塊。12/13/2022722.文件結(jié)構(gòu)12/10/2022725.8圖像文件后綴一覽表在計算機中,有兩種類型的圖:矢量圖(vectorgraphics)用數(shù)學(xué)方法描述的一系列點、線、弧和其他幾何形狀,如圖6-17(a)所示;因此存放這種圖使用的格式稱為矢量圖格式,存儲的數(shù)據(jù)主要是繪制圖形的數(shù)學(xué)描述;位映象圖(bitmappedgraphics)也稱光柵圖(rastergraphics),這種圖就像電視圖像一樣,由象點組成的,如圖6-17(b),因此存放這種圖使用的格式稱為位映象圖格式,經(jīng)常簡稱為位圖格式,存儲的數(shù)據(jù)是描述像素的數(shù)值。12/13/2022735.8圖像文件后綴一覽表在計算機中,有兩種類型的圖:12/經(jīng)常不斷地學(xué)習(xí),你就什么都知道。你知道得越多,你就越有力量StudyConstantly,AndYouWillKnowEverything.TheMoreYouKnow,TheMorePowerfulYouWillBe寫在最后經(jīng)常不斷地學(xué)習(xí),你就什么都知道。你知道得越多,你就越有力量寫謝謝你的到來學(xué)習(xí)并沒有結(jié)束,希望大家繼續(xù)努力LearningIsNotOver.IHopeYouWillContinueToWorkHard演講人:XXXXXX時間:XX年XX月XX日

謝謝你的到來演講人:XXXXXX第5章彩色數(shù)字圖像基礎(chǔ)12/13/202276第5章彩色數(shù)字圖像基礎(chǔ)12/10/20221圖像數(shù)據(jù)壓縮主要根據(jù)的兩個基本事實:對于圖像數(shù)據(jù)中許多重復(fù)數(shù)據(jù),使用數(shù)學(xué)方法來表示可以減少數(shù)據(jù)量,可應(yīng)用于無損壓縮;人的眼睛對圖像細(xì)節(jié)和顏色的辨認(rèn)有一個極限,把超過極限的部分去掉,這也就達(dá)到壓縮數(shù)據(jù)的目的,可應(yīng)用于有損壓縮。實際的圖像壓縮是綜合使用各種有損和無損壓縮技術(shù)來實現(xiàn)的。12/13/202277圖像數(shù)據(jù)壓縮主要根據(jù)的兩個基本事實:12/10/202225.1視角系統(tǒng)對顏色的感知人的視覺系統(tǒng)對顏色的感知的幾個特性:人的視網(wǎng)膜(humanretina)通過神經(jīng)元來感知外部世界的顏色,每個神經(jīng)元或者是一個對顏色敏感的錐體(cone),。紅、綠和藍(lán)三種錐體細(xì)胞對不同頻率的光的感知程度不同,對不同亮度的感知程度也不同,如圖5-01所示。這就意味著,人們可以使用數(shù)字圖像處理技術(shù)來降低數(shù)據(jù)率而不使人感到圖像質(zhì)量明顯下降。自然界中的任何一種顏色都可以由R,G,B這3種顏色值之和來確定,它們構(gòu)成一個3維的RGB矢量空間。這就是說,R,G,B的數(shù)值不同混合得到的顏色就不同,也就是光波的波長不同。自然界中的任何一種顏色都可以由R,G,B這3種顏色值之和來確定,它們構(gòu)成一個3維的RGB矢量空間。這就是說,R,G,B的數(shù)值不同混合得到的顏色就不同,也就是光波的波長不同,如圖5-02表示。12/13/2022785.1視角系統(tǒng)對顏色的感知人的視覺系統(tǒng)對顏色的感知的幾個圖5-02產(chǎn)生波長不同的光所需要的三基色值[1]圖5-02表示使用基色波長為700nm(紅色)、546.1nm(綠色)和435.8nm(藍(lán)色)時,在可見光范圍里,相加混色產(chǎn)生某一波長的光波所需要的三種基色的數(shù)值。12/13/202279圖5-02產(chǎn)生波長不同的光所需要的三基色值[1]圖5-025.2圖像的顏色模型5.2.1顯示彩色圖像用RGB相加混色模型陰極射線管(cathoderaytube,CRT)CRT使用3個電子槍分別產(chǎn)生紅(Red)、綠(Green)和藍(lán)(Blue)三種波長的光,并以各種不同的相對強度綜合起來產(chǎn)生顏色,如圖5-03所示。組合這三種光波以產(chǎn)生特定顏色稱為相加混色,稱為RGB相加模型LED???平板顯示器???12/13/2022805.2圖像的顏色模型5.2.1顯示彩色圖像用RGB相加圖5-03彩色顯象管產(chǎn)生顏色的原理12/13/202281圖5-03彩色顯象管產(chǎn)生顏色的原理12/10/20226某種顏色和這三種顏色之間的關(guān)系可用下面式子來描述:顏色=R(紅色百分比)+G(綠色百分比)+B(藍(lán)色百分比)圖5-04相加混色三基色等量相加時,得到白色;等量的紅綠相加而藍(lán)為0值時得到黃色;等量的紅藍(lán)相加而綠為0時得到品紅色;等量的綠藍(lán)相加而紅為0時得到青色。

12/13/202282某種顏色和這三種顏色之間的關(guān)系可用下面式子來描述:圖5-04圖5-05一幅圖像由許多像素組成圖像中的單個點稱為像素(pixel),每個像素都有一個值,稱為像素值,它表示特定顏色的強度。一個像素值往往用R,G,B三個分量表示。

12/13/202283圖5-05一幅圖像由許多像素組成圖像中的單表5-01相加色RGB顏色000黑001藍(lán)010綠011青100紅101品紅110黃111白RGB顏色000黑001藍(lán)010綠011青100紅101品紅110黃111白RGB顏色000黑001藍(lán)010綠011青100紅101品紅110黃111白RGB顏色000黑001藍(lán)010綠011青100紅101品紅110黃111白如果每個像素的每個顏色分量用二進(jìn)制的1位來表示,那末每個顏色的分量只有“1”和“0”這兩個值。這也就是說,每種顏色的強度是100%,或者是0%。在這種情況下,每個像素所顯示的顏色是8種可能出現(xiàn)的顏色之一,如表5-01所示。12/13/202284表5-01相加色RGB顏色000黑001藍(lán)010綠011青5.2.2打印彩色圖像用CMY相減混色模型相減色:用彩色墨水或顏料進(jìn)行混合得到的顏色;在理論上說,任何一種顏色都可以用三種基本顏料按一定比例混合得到。這三種顏色是青色(Cyan)、品紅(Magenta)和黃色(Yellow),通常寫成CMY,稱為CMY模型。之所以稱為相減色,乃是因為它減少了為視覺系統(tǒng)識別顏色所需要的反射光。12/13/2022855.2.2打印彩色圖像用CMY相減混色模型12/10/2圖5-06相減混色當(dāng)三基色等量相減時得到黑色;等量黃色(Y)和品紅(M)相減而青色(C)為0時,得到紅色(R);等量青色(C)和品紅(M)相減而黃色(Y)為0時,得到藍(lán)色(B);等量黃色(Y)和青色(C)相減而品紅(M)為0時,得到綠色(G)。

12/13/202286圖5-06相減混色當(dāng)三基色等量相減時得到黑色表5-03相減色青色品紅黃色相減色000白001黃010品紅011紅100青101綠110藍(lán)111黑青色品紅黃色相減色000白001黃010品紅011紅100青101綠110藍(lán)111黑青色品紅黃色相減色000白001黃010品紅011紅100青101綠110藍(lán)111黑青色品紅黃色相減色000白001黃010品紅011紅100青101綠110藍(lán)111黑按每個像素每種顏色用1位表示,相減法產(chǎn)生的8種顏色如表5-03所示12/13/202287表5-03相減色青色品紅黃色相減色000白001黃010表5-04相加色與相減色的關(guān)系相加混色相減混色生成的顏色RGBCMY

000111黑001110藍(lán)010101綠011100青100011紅101010品紅110001黃111000白相加混色相減混色生成的顏色RGBCMY

000111黑001110藍(lán)010101綠011100青100011紅101010品紅110001黃111000白例如,當(dāng)RGB為1∶1∶1時,在相加混色中產(chǎn)生白色,而CMY為1∶1∶1時,在相減混色中產(chǎn)生黑色。從另一個角度也可以看它們的互補性。從表5-04中可以看到,在RGB中的顏色為1的地方,在CMY對應(yīng)的位置上,其顏色值為0。例如RGB為0∶1∶0時,對應(yīng)CMY為1∶0∶1。12/13/202288表5-04相加色與相減色的關(guān)系相加混色相減混色生成的顏色圖5-07RGB彩色空間和CMY彩色空間的表示法12/13/202289圖5-07RGB彩色空間和CMY彩色空間的表示法12/105.3圖像的三個基本屬性5.3.1分辨率1.顯示分辨率指顯示屏上能夠顯示出的像素數(shù)目

分辨率越高,顯示的圖像質(zhì)量也就越高常用點距來衡量一個顯示屏的分辨率點距(dotpitch):顯像管玻璃面上的孔眼之間的距離;2.圖像分辨率組成一幅圖像的像素密度的度量方法.在用掃描儀掃描彩色圖像時,圖像的分辨率用每英寸多少點(dotsperinch,DIP)表示;12/13/2022905.3圖像的三個基本屬性5.3.1分辨率12/10/3.兩個不同的概念圖像分辨率是確定組成一幅圖像的像素數(shù)目顯示分辨率是確定顯示圖像的區(qū)域大小。5.3.2像素深度1.概念:指存儲每個像素所用的位數(shù),它也是用來度量圖像的分辨率;決定彩色圖像的每個像素可能有的顏色數(shù),或者確定灰度圖像的每個像素可能有的灰度級數(shù);表示一個像素的位數(shù)越多,它能表達(dá)的顏色數(shù)目就越多,而它的深度就越深;2.不一定要追求特別深的像素深度設(shè)備的限制;人眼分辨率的限制;12/13/2022913.兩個不同的概念12/10/2022163.屬性(Attribute)位在用二進(jìn)制數(shù)表示彩色圖像的像素時,除R,G,B分量用固定位數(shù)表示外,往往還增加1位或幾位作為屬性(Attribute)位;用來指定該像素應(yīng)具有的性質(zhì)。透明(Transparency)位,記為T。假如顯示屏上已經(jīng)有一幅圖存在,當(dāng)這幅圖或者這幅圖的一部分要重疊在上面時,T位就用來控制原圖是否能看得見。4.α通道(alphachannel)位在用32位表示一個像素時,若R,G,B分別用8位表示,剩下的8位常稱為α通道(alphachannel)位,或稱為復(fù)蓋(overlay)位、中斷位、屬性位。視圖混合(videokeying)技術(shù),它也采用α通道12/13/2022923.屬性(Attribute)位12/10/2022175.3.3真彩色、偽彩色與直接色1.真彩色(truecolor)概念:指在組成一幅彩色圖像的每個像素值中,有R,G,B三個基色分量,每個基色分量直接決定顯示設(shè)備的基色強度;真彩色圖通常是指RGB8:8:8,即圖像的顏色數(shù)等于224,也常稱為全彩色(fullcolor)圖像可生成的顏色數(shù)就是224=16777216種,而人的眼睛是很難分辨出這么多種顏色的許多場合往往用RGB5:5:5來表示,每個彩色分量占5個位,再加1位顯示屬性控制位共2個字節(jié),生成的真顏色數(shù)目為215=32K在顯示器上顯示的顏色就不一定是真彩色,要得到真彩色圖像需要有真彩色顯示適配器,目前在PC上用的VGA適配器是很難得到真彩色圖像的12/13/2022935.3.3真彩色、偽彩色與直接色12/10/2022182.偽彩色(pseudocolor)含義:每個像素的顏色不是由每個基色分量的數(shù)值直接決定,而是把像素值當(dāng)作彩色查找表(colorlook-uptable,CLUT)的表項入口地址,去查找一個顯示圖像時使用的R,G,B強度值,用查找出的R,G,B強度值產(chǎn)生的彩色彩色圖像本身的像素數(shù)值和彩色查找表的索引號有一個變換關(guān)系,這個關(guān)系可以使用Windows95/98定義的變換關(guān)系,也可以使用你自己定義的變換關(guān)系。使用查找得到的數(shù)值顯示的彩色是真的,但不是圖像本身真正的顏色,它沒有完全反映原圖的彩色。12/13/2022942.偽彩色(pseudocolor)12/10/202圖5-08真彩色和偽彩色圖像之間的差別12/13/202295圖5-08真彩色和偽彩色圖像之間的差別12/10/2023.直接色(directcolor)每個像素值分成R,G,B分量,每個分量作為單獨的索引值對它做變換。也就是通過相應(yīng)的彩色變換表找出基色強度,用變換后得到的R,G,B強度值產(chǎn)生的彩色稱為直接色;特點是對每個基色進(jìn)行變換;與真彩色系統(tǒng)相比:相同之處:都采用R,G,B分量決定基色強度;不同之處:真彩色的基色強度直接用R,G,B決定直接色的基色強度由R,G,B經(jīng)變換后決定。試驗結(jié)果表明,使用直接色在顯示器上顯示的彩色圖像看起來真實、很自然。12/13/2022963.直接色(directcolor)12/10/202直接色與偽彩色系統(tǒng)相比:相同之處是都采用查找表;不同之處:直接色對R,G,B分量分別進(jìn)行變換;偽彩色把整個像素當(dāng)作查找表的索引值進(jìn)行彩色變換;12/13/202297直接色與偽彩色系統(tǒng)相比:12/10/2022225.4圖像的種類5.4.1矢量圖與點位圖矢量圖(vectorbasedimage)法:用一系列計算機指令來表示一幅圖;實際上是數(shù)學(xué)方法來描述一幅圖,然后變成許多的數(shù)學(xué)表達(dá)式,再編程,用語言來表達(dá)。在計算顯示圖時,也往往能看到畫圖的過程。繪制和顯示這種圖的軟件通常稱為繪圖程序(drawprograms)

12/13/2022985.4圖像的種類5.4.1矢量圖與點位圖12/10/矢量圖優(yōu)點:當(dāng)需要管理每一小塊圖像時,矢量圖法非常有效;目標(biāo)圖像的移動、縮小放大、旋轉(zhuǎn)、拷貝、屬性的改變(如線條變寬變細(xì)、顏色的改變)也很容易做到;相同的或類似的圖可以把它們當(dāng)作圖的構(gòu)造塊,并把它們存到圖庫中,這樣不僅可以加速畫的生成,而且可以減小矢量圖文件的大小;矢量圖缺陷:當(dāng)圖變得很復(fù)雜時,計算機就要花費很長的時間去執(zhí)行繪圖指令。此外,對于一幅復(fù)雜的彩色照片(例如一幅真實世界的彩照),很難用數(shù)學(xué)來描述,因而就不用矢量法表示12/13/202299矢量圖優(yōu)點:12/10/202224點位圖(bitmappedimage)法把一幅彩色圖分成許多的像素,每個像素用若干個二進(jìn)制位來指定該像素的顏色、亮度和屬性。畫點位圖,或者編輯點位圖,使用的軟件稱為畫圖程序(paintprograms)。點位圖的獲取通常用掃描儀,以及攝像機、錄相機、激光視盤與視頻信號數(shù)字化卡一類設(shè)備,通過這些設(shè)備把模擬的圖像信號變成數(shù)字圖像數(shù)據(jù);12/13/2022100點位圖(bitmappedimage)法12/10/20矢量圖與點位圖之比較:矢量圖:側(cè)重于“繪制”、去創(chuàng)造;文件的大小則主要取決圖的復(fù)雜程度;點位圖:偏重于“獲取”、去“復(fù)制”;影響文件大小的因素主要有:圖像分辨率和像素深度;顯示點位圖文件比顯示矢量圖文件要快;矢量圖和點位圖之間可以用軟件進(jìn)行轉(zhuǎn)換:由矢量圖轉(zhuǎn)換成點位圖采用光柵化(rasterizing)技術(shù),這種轉(zhuǎn)換也相對容易;由點位圖轉(zhuǎn)換成矢量圖用跟蹤(tracing)技術(shù),這種技術(shù)在理論上說是容易,但在實際中很難實現(xiàn),對復(fù)雜的彩色圖像尤其如此。12/13/2022101矢量圖與點位圖之比較:12/10/2022265.5.2灰度圖與彩色圖灰度圖(gray-scaleimage):按照灰度等級的數(shù)目來劃分。如果每個像素的像素值用一個字節(jié)表示,灰度值級數(shù)就等于256級,每個像素可以是0~255之間的任何一個值單色圖像(monochromeimage):只有黑白兩中顏色,圖中的每個像素的像素值用1位存儲,它的值只有“0”或者“1”。12/13/20221025.5.2灰度圖與彩色圖12/10/202227圖5-09標(biāo)準(zhǔn)單色圖圖5-10標(biāo)準(zhǔn)灰度圖

12/13/2022103圖5-09標(biāo)準(zhǔn)單色圖圖5-10標(biāo)準(zhǔn)灰度圖12/10/彩色圖像(colorimage)按照顏色的數(shù)目來劃分,例如256色圖像和真彩色(224=16777216種顏色)等。alpha通道:如24位彩色圖像是用32位存儲的,這個附加的8位叫做alpha通道,它的值叫做alpha值;用來表示該像素如何產(chǎn)生特技效果。12/13/2022104彩色圖像(colorimage)12/10/202229圖5-7256色標(biāo)準(zhǔn)圖像轉(zhuǎn)換成的灰度圖256色標(biāo)準(zhǔn)圖像轉(zhuǎn)換成的256級灰度圖像,彩色圖像的每個像素的R、G和B值用一個字節(jié)來表示12/13/2022105圖5-7256色標(biāo)準(zhǔn)圖像轉(zhuǎn)換成的灰度圖256色標(biāo)準(zhǔn)圖像轉(zhuǎn)圖5-824位標(biāo)準(zhǔn)圖像轉(zhuǎn)換成的灰度圖真彩色圖像轉(zhuǎn)換成的256級灰度圖像,每個像素的R,G,B分量分別用一個字節(jié)表示12/13/2022106圖5-824位標(biāo)準(zhǔn)圖像轉(zhuǎn)換成的灰度圖真彩色圖像轉(zhuǎn)換成的25.5伽馬(γ)校正5.5.1γ的概念冪-律(power-law)轉(zhuǎn)換特性:y=xn→輸出=(輸入)γ

式中的γ(gamma)是冪函數(shù)的指數(shù),它用來衡量非線性部件的轉(zhuǎn)換特性。,“輸入”和“輸出”都縮放到0~1之間。其中,0表示黑電平,1表示顏色分量的最高電平。如果所有部件都有冪函數(shù)的轉(zhuǎn)換特性,那么整個系統(tǒng)的傳遞函數(shù)就是一個冪函數(shù),它的指數(shù)γ等于所有單個部件的γ的乘積。12/13/20221075.5伽馬(γ)校正5.5.1γ的概念12/10/20如果圖像系統(tǒng)的整個γ=1:輸出與輸入就成線性關(guān)系。意味在重現(xiàn)圖像中任何兩個圖像區(qū)域的強度之比率與原始場景的兩個區(qū)域的強度之比率相同。各種環(huán)境下再生圖像真實地再現(xiàn)“原始場景”的情況:“明亮環(huán)境”其他白色物體的亮度與圖像中白色部分的亮度幾乎相同的環(huán)境γ=1“暗淡環(huán)境”房間中的其他東西能夠看到,但比圖像中白色部分的亮度更暗。如電視的環(huán)境和計算機房的環(huán)境;γ≈1.25“黑暗環(huán)境”放映電影和投影幻燈片的環(huán)境γ≈1.512/13/2022108如果圖像系統(tǒng)的整個γ=1:12/10/2022335.5.2γ校正所有CRT顯示設(shè)備都有冪-律轉(zhuǎn)換特性,起碼要有一個能夠提供γ校正的非線性部件,用來補償CRT的非線性特性。在所有廣播電視系統(tǒng)中,γ校正是在攝象機中完成的。“數(shù)字時代”,進(jìn)入計算機的電視圖像依然帶有γ=0.5的校正

12/13/20221095.5.2γ校正12/10/2022345個有非線性轉(zhuǎn)換函數(shù)存在并可引入γ值地方:camera_gamma:攝象機中圖像傳感器的γ(通常γ=0.4或者0.5)encoding_gamma:編碼器編碼圖像文件時引入γ

decoding_gamma:譯碼器讀圖像文件時引入γ

LUT_gamma:圖像幀緩存查找表中引入γ

CRT_gamma:CRT的γ(通常γ=2.5)12/13/20221105個有非線性轉(zhuǎn)換函數(shù)存在并可引入γ值地方:12/10/202【例】在數(shù)字圖像顯示系統(tǒng)中,由于要顯示的圖像不一定就是攝像機來的圖像,假設(shè) 這種圖像的γ值等于1,如果: encoding_gamma=0.5, CRT_gamma=2.5 decoding_gamma=1.0 LUT_gamma=1.0 則,整個系統(tǒng)的γ≈1.0×0.5×2.5×1.0×1.0≈1.2512/13/2022111【例】在數(shù)字圖像顯示系統(tǒng)中,由于要顯示的圖像不一定就是攝像機5.6JPEG壓縮編碼5.6.1JPEG算法概要:概念:JPEG(JointPhotographicExpertsGroup)是一個由ISO和IEC兩個組織機構(gòu)聯(lián)合組成的一個專家組,負(fù)責(zé)制定靜態(tài)的數(shù)字圖像數(shù)據(jù)壓縮編碼標(biāo)準(zhǔn),這個專家組開發(fā)的算法稱為JPEG算法,并且成為國際上通用的標(biāo)準(zhǔn),因此又稱為JPEG標(biāo)準(zhǔn)。JPEG是一個適用范圍很廣的靜態(tài)圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn),既可用于灰度圖像又可用于彩色圖像。12/13/20221125.6JPEG壓縮編碼5.6.1JPEG算法概要:1JPEG專家組開發(fā)了兩種基本的壓縮算法:一種是采用以離散余弦變換(DiscreteCosineTransform,DCT)為基礎(chǔ)的有損壓縮算法;在壓縮比為25:1的情況下,壓縮后還原得到的圖像與原始圖像相比較,非圖像專家難于找出它們之間的區(qū)別,因此得到了廣泛的應(yīng)用。近年來JPEG專家組正在制定JPEG2000(簡稱JP2000)標(biāo)準(zhǔn),采用小波變換(wavelet)算法。另一種是采用以預(yù)測技術(shù)為基礎(chǔ)的無損壓縮算法。12/13/2022113JPEG專家組開發(fā)了兩種基本的壓縮算法:12/10/2022JPEG壓縮是有損壓縮,它利用了人的視角系統(tǒng)的特性,使用量化和無損壓縮編碼相結(jié)合來去掉視角的冗余信息和數(shù)據(jù)本身的冗余信息。JPEG算法框圖如圖5-13所示;壓縮編碼大致分成三個步驟:使用正向離散余弦變換(forwarddiscretecosinetransform,F(xiàn)DCT)把空間域表示的圖變換成頻率域表示的圖。使用加權(quán)函數(shù)對DCT系數(shù)進(jìn)行量化,這個加權(quán)函數(shù)對于人的視覺系統(tǒng)是最佳的。使用霍夫曼可變字長編碼器對量化系數(shù)進(jìn)行編碼。譯碼或者叫做解壓縮的過程與壓縮編碼過程正好相反。12/13/2022114JPEG壓縮12/10/202239圖5-13JPEG壓縮編碼-解壓縮算法框圖12/13/2022115圖5-13JPEG壓縮編碼-解壓縮算法框圖12/10/25.6.2JPEG算法的主要計算步驟正向離散余弦變換(FDCT)。量化(quantization)。Z字形編碼(zigzagscan)。使用差分脈沖編碼調(diào)制(differentialpulsecodemodulation,DPCM)對直流系數(shù)(DC)進(jìn)行編碼。使用行程長度編碼(run-lengthencoding,RLE)對交流系數(shù)(AC)進(jìn)行編碼。熵編碼(entropycoding)。12/13/20221165.6.2JPEG算法的主要計算步驟12/10/20221.正向離散余弦變換(1)對每個單獨的彩色圖像分量,把整個分量圖像分成8×8的圖像塊,如圖5-14所示,并作為兩維離散余弦變換DCT的輸入。通過DCT變換,把能量集中在少數(shù)幾個系數(shù)上。 圖5-14離散余弦變換12/13/20221171.正向離散余弦變換12/10/202242(2)DCT變換使用下式計算,......(5-1)

它的逆變換使用下式計算,......(5-2)

上面兩式中,

C(u),C(v)=1/,當(dāng)u,v=0;

C(u),C(v)=1,其他。

f(i,j)經(jīng)DCT變換之后,F(xiàn)(0,0)是直流系數(shù),其他為交流系數(shù)。12/13/2022118(2)DCT變換使用下式計算,12/10/202243(3)在計算兩維的DCT變換時,可使用下面的計算式把兩維的DCT變換變成一維的DCT變換,

............(5-3)

.............(5-4)12/13/2022119(3)在計算兩維的DCT變換時,可使用下面的計算式把兩維的圖5-15兩維DCT變換方法12/13/2022120圖5-15兩維DCT變換方法12/10/2022452.量化是對經(jīng)過FDCT變換后的頻率系數(shù)進(jìn)行量化。目的是減小非“0”系數(shù)的幅度以及增加“0”值系數(shù)的數(shù)目。圖像質(zhì)量下降的最主要原因。對于有損壓縮算法,JPEG算法使用如圖5-16所示的均勻量化器進(jìn)行量化,量化步距是按照系數(shù)所在的位置和每種顏色分量的色調(diào)值來確定12/13/20221212.量化12/10/202246兩種量化表:表5-05亮度量化值表表5-06色度量化值

由于人眼對低頻分量的圖像比對高頻分量的圖像更敏感,因此圖中的左上角的量化步距要比右下角的量化步距小。12/13/2022122兩種量化表:表5-05亮度量化值表表5-06色度量化值3.Z字形編排量化后的系數(shù)要重新編排目的是為了增加連續(xù)的“0”系數(shù)的個數(shù),就是“0”的游程長度;方法是按照Z字形的式樣編排,如圖所示。這樣就把一個8×8的矩陣變成一個1×64的矢量,頻率較低的系數(shù)放在矢量的頂部。12/13/20221233.Z字形編排12/10/202248圖5-18量化DCT系數(shù)的序號015614152728247131626294238121725304143911182431404453101923323945525420223338465155602134374750565961353648495758626312/

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論