數(shù)字圖像處理-第12章圖像編碼

上傳人：1*** IP屬地：上海上傳時間：2024-08-04 格式：PPTX 頁數(shù)：99 大小：2.72MB 積分：9.6 舉報 版權(quán)申訴

已閱讀5頁，還剩94頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1第12章圖像編碼數(shù)字圖像處理：使用MATLAB分析與實現(xiàn)2為減少視頻信號的數(shù)據(jù)量，實現(xiàn)有效的傳輸和存儲，因此，需要關(guān)注壓縮編碼技術(shù)。利用圖像固有的統(tǒng)計特性，以及視覺生理、心理學(xué)特性，或者記錄設(shè)備和顯示設(shè)備等的特性，從原始圖像中經(jīng)過壓縮編碼提取有效信息，盡量去除無用的或用處不大的冗余信息，以便高效率的進(jìn)行圖像的數(shù)字傳輸或存儲，而且在復(fù)原時仍能夠獲得與原始圖像相差不多的復(fù)原圖像。第12章圖像編碼主要內(nèi)容12.1圖像編碼的基本理論12.2圖像的無損編碼12.3圖像的有損編碼12.4JPEG標(biāo)準(zhǔn)和JPEG20003412.1.1圖像壓縮的必要性12.1.2圖像壓縮的可能性12.1.3圖像編碼方法的分類12.1.4圖像編碼壓縮術(shù)語簡介12.1圖像編碼的基本理論512.1.1圖像壓縮的必要性圖像編碼的基本理論如一部90分鐘的彩色電影，每秒放映24幀。把它數(shù)字化，每幀512

512像素，每像素的R、G、B三分量分別占8b，則總比特數(shù)為

512

8bit=97,200MB

如一張CD光盤可存600MB數(shù)據(jù)，存儲這部電影光圖像（還有聲音）就需要160張CD光盤。因此，傳輸帶寬、速度、存儲器容量的限制使得對圖象數(shù)據(jù)進(jìn)行壓縮顯得非常必要。612.1.2圖像壓縮的可能性圖像編碼的基本理論圖像壓縮所要解決的問題是盡量減少表示數(shù)字圖像時需要的數(shù)據(jù)量，而減少數(shù)據(jù)量的基本原理是去除其中的冗余數(shù)據(jù)。數(shù)字圖像中的冗余？-----編碼冗余，像素間冗余，心理視覺冗余。

如果能減少或消除其中的一種或多種冗余，就能取得數(shù)據(jù)壓縮效果。712.1.2圖像壓縮的可能性圖像編碼的基本理論（1）編碼冗余

編碼冗余，又稱為信息熵冗余。如果一個圖像的灰度級編碼，使用了多于實際需要的編碼符號，就稱該圖像包含了編碼冗余。如果用8bit表示該圖像的像素，那么則認(rèn)為該圖像存在編碼冗余。因為該圖像的像素只有兩個灰度級，用1bit即可表示。

在大多數(shù)圖像中，圖像像素的灰度值分布是不均勻的，因此若對圖像的灰度值直接進(jìn)行自然二進(jìn)制編碼（等長編碼），則會對有最大和最小概率可能性的值分配相同比特數(shù)，而產(chǎn)生了編碼冗余。12.1.2圖像壓縮的可能性圖像編碼的基本理論（1）編碼冗余1010000112.1.2圖像壓縮的可能性圖像編碼的基本理論（1）編碼冗余

用自然二進(jìn)制編碼時沒有考慮像素灰度值出現(xiàn)的概率。只有按概率分配編碼長度，才是最精減的編碼方法。灰度級出現(xiàn)概率大的用短碼表示，出現(xiàn)概率小的灰度級用長碼表示，則有可能使編碼總長度下降。12.1.2圖像壓縮的可能性圖像編碼的基本理論（1）編碼冗余1112.1.2圖像壓縮的可能性圖像編碼的基本理論（2）像素間冗余對應(yīng)圖像目標(biāo)的像素之間一般具有相關(guān)性。因此，圖像中一般存在與像素間相關(guān)性直接聯(lián)系著的數(shù)據(jù)冗余——像素相關(guān)冗余。1212.1.2圖像壓縮的可能性圖像編碼的基本理論空間冗余。鄰近像素灰度分布的相關(guān)性很強。頻間冗余。多譜段圖像中各譜段圖像對應(yīng)像素之間灰度相關(guān)性很強。時間冗余。序列圖像幀間畫面對應(yīng)像素灰度的相關(guān)性很強。結(jié)構(gòu)冗余。有些圖像存在較強的紋理結(jié)構(gòu)或自相似性，如墻紙、草席等圖像。知識冗余。有些圖像中包含與某些先驗知識相關(guān)的信息（2）像素間冗余1312.1.2圖像壓縮的可能性圖像編碼的基本理論（3）心理視覺冗余

人的眼睛并不是對所有信息都有相同的敏感度，有些信息在通常的視覺感覺過程中與另外一些信息相比來說并不那么重要，這些信息可以認(rèn)為是心理視覺冗余的。1412.1.3圖像壓縮方法的分類圖像編碼的基本理論（1）基于編碼前后的信息保持程度的分類信息保持編碼，也稱無損編碼

在編解碼過程中保證圖像信息不丟失；

通常壓縮比一般不超過3:1。保真度編碼，也稱有損編碼

丟掉一些人眼不敏感的次要信息，在一定保真度準(zhǔn)則下，最大限度地壓縮圖像。特征提取。在圖像識別、分析和分類等技術(shù)中，只對感興趣部分特征進(jìn)行編碼壓縮。1512.1.3圖像壓縮方法的分類圖像編碼的基本理論（2）基于編碼方法的分類熵編碼?；谛畔⒔y(tǒng)計特性的編碼技術(shù)。

如行程編碼、Huffman編碼和算術(shù)編碼等。預(yù)測編碼。常用的有差分脈沖編碼調(diào)制和運

動估計與補償預(yù)測編碼法。變換編碼。將空間域圖像經(jīng)過正交變換映射

到另一變換域上，再采用適當(dāng)?shù)牧炕挽鼐幋a來有效壓縮圖像。通常采用的變換：離散傅里葉變換（DFT）、離散余弦變換（DCT）和離散小波變換（DWT）等。16其它方法早期的編碼方法，如混合編碼、矢量量化、LZW算法等。近些年來新的壓縮編碼方法，如使用人工神經(jīng)元網(wǎng)絡(luò)ANN的壓縮編碼、分形編碼、小波編碼（WaveletCoding）、基于模型的壓縮編碼（ModelBasedCoding）和基于對象的壓縮編碼（ObjectBasedCoding）等。12.1.3圖像壓縮方法的分類圖像編碼的基本理論1712.1.4圖像編碼術(shù)語簡介圖像編碼的基本理論（1）壓縮比r

一般情況下壓縮比r1，r愈大則壓縮程度愈高。（2）圖像熵H

令p(di)為數(shù)字圖像第i個灰度級di相應(yīng)出現(xiàn)概率1812.1.4圖像編碼術(shù)語簡介圖像編碼的基本理論（3）編碼效率

令Li為數(shù)字圖像第i個灰度級di的編碼長度

1912.2.1無損編碼理論12.2.2Huffman編碼12.2.3算術(shù)編碼12.2.4LZW編碼12.2圖像的無損壓縮編碼2012.2.1無損編碼理論圖像的無損壓縮編碼

其中，H(X)為信源X的熵；

為任意小的正數(shù)該定理一方面指出了每個字符平均碼字長度的下限為信源的熵，另一方面說明存在任意接近該下限的編碼。（1）Shannon無失真編碼定理2112.2.1無損編碼理論圖像的無損壓縮編碼（2）示例若采用等長編碼，等長編碼是將所有符號當(dāng)作等概率事件處理的。碼字：碼流：30位假設(shè)有一原始符號序列為：

2212.2.1無損編碼理論圖像的無損壓縮編碼若采用變字長編碼，變字長編碼是每個符號的碼字長度隨字符出現(xiàn)概率而變化。實際出現(xiàn)次數(shù)統(tǒng)計：a1

共有8次，a2共有2次，a3共有1次，a4共有4次,采用變長編碼：碼流：碼字：25位23若編碼時，對出現(xiàn)概率較大的符號用較少比特數(shù)(短碼)表示，對出現(xiàn)概率較小的符號用較多比特數(shù)(長碼)表示，則其平均碼字長度要比等長編碼時所需碼字少。12.2.1無損編碼理論圖像的無損壓縮編碼（3）變字長最佳編碼定理2412.2.2Huffman編碼圖像的無損壓縮編碼

這為Huffman于1952年提出的一種編碼方法，是一種最佳編碼方法。所謂最佳編碼方法是指采用Huffman編碼方法得到的單元像素的比特數(shù)最接近圖像的實際熵值。而熵為進(jìn)行無失真編碼的理論極限。Huffman編碼是根據(jù)可變長最佳編碼定理，應(yīng)用哈夫曼算法而產(chǎn)生的一種編碼方法。2512.2.2Huffman編碼圖像的無損壓縮編碼（1）Huffman編碼步驟概率統(tǒng)計，得n個不同概率灰度信息符號；由大到小概率排序；相加兩個最小概率(概率個數(shù)減為n-1個)，形成新概率集合；再按上一步方法重排，如此重復(fù)直到僅有兩個概率為止；分配碼字。原則為從最后一步反向進(jìn)行，賦值二進(jìn)制碼元(0,1)，構(gòu)成Huffman碼字；對最后兩個概率：一個賦予“0”碼，一個

賦予“1”碼，這里賦予0和1完全隨機。2612.2.2Huffman編碼圖像的無損壓縮編碼（2）示例

給出一幅8

8的圖像f，要求:對其進(jìn)行Huffman編碼。計算編碼效率、壓縮比及冗余度。2712.2.2Huffman編碼圖像的無損壓縮編碼解：由題意可知，圖像f共有8個灰度級符號：

。對圖像中的灰度級進(jìn)行概率統(tǒng)計符號概率p725/6425/6425/6425/6425/6425/6439/64p511/6411/6411/6412/6416/6423/6425/64p27/647/649/6411/6412/6416/64p37/647/647/649/6411/64p45/645/647/647/64p14/645/645/64p63/644/64p02/64其Huffman編碼過程為:0000001111112812.2.2Huffman編碼圖像的無損壓縮編碼012912.2.2Huffman編碼圖像的無損壓縮編碼編碼結(jié)果為

碼字00011010101100000100001000101碼長54344351平均碼字長度=2.625比特/像素30信源熵=2.564比特/像素編碼效率12.2.2Huffman編碼圖像的無損壓縮編碼31

12.2.2Huffman編碼圖像的無損壓縮編碼32（3）例程----

實現(xiàn)【例12.1】中的圖像的Huffiman編碼12.2.2Huffman編碼圖像的無損壓縮編碼程序見教材【例12.2】程序運行結(jié)果和【例12.1】相同。Huffiman編碼的最佳輸出碼字并不唯一，但其平均碼長是一樣的，所以不影響編碼效率和數(shù)據(jù)壓縮性能。3312.2.3算術(shù)編碼圖像的無損壓縮編碼Huffman編碼需要為每一個符號設(shè)定一個碼字輸出。Huffman編碼碼字輸出必須為整數(shù)比特位。算術(shù)編碼無需為每一個符號設(shè)定一個碼字。即不存在源符號和碼字間的一一對應(yīng)關(guān)系。算術(shù)編碼特點：算術(shù)編碼是用一個單獨的浮點數(shù)來代替一串輸入符號，其編碼輸出可為分?jǐn)?shù)比特位。3412.2.3算術(shù)編碼圖像的無損壓縮編碼（1）算術(shù)編碼的基本思想算術(shù)編碼將待編碼的圖像數(shù)據(jù)看作是由多個符號組成的序列，直接對該符號序列進(jìn)行編碼。為一個多符號序列算術(shù)編碼。經(jīng)算術(shù)編碼后輸出的碼字對應(yīng)于整個符號序列，而每個碼字本身確定了0和1之間的1個實數(shù)區(qū)間。3512.2.3算術(shù)編碼圖像的無損壓縮編碼將輸入圖像看作為一個位于實數(shù)線上區(qū)間[0,1)的信息符號序列。概率統(tǒng)計，建立相應(yīng)概率模型。根據(jù)每個符號出現(xiàn)概率劃分若干個子區(qū)間。各子區(qū)間互不重疊，每個子區(qū)間有一個惟一起始值或左端點。當(dāng)對輸入的符號序列編碼時，依據(jù)符號出現(xiàn)概率來劃分子區(qū)間寬度。這就是區(qū)間作為代碼的原理。（2）算術(shù)編碼的基本原理3612.2.3算術(shù)編碼圖像的無損壓縮編碼（3）算術(shù)編碼的迭代遞推公式：

StartN

=StartB

+LeftC

LEndN=StartB

+RightC

L式中—StartN

：新子區(qū)間的起始位置

EndN

：新子區(qū)間的結(jié)束位置

StartB

：前子區(qū)間的起始位置

LeftC

：當(dāng)前符號的區(qū)間左端

RightC

：當(dāng)前符號的區(qū)間右端

L：前子區(qū)間寬度37（4）示例p(1)=0.4，p(2)=0.2，p(3)=0.2，p(4)=0.212.2.3算術(shù)編碼圖像的無損壓縮編碼解：[0,0.4)；[0.4,0.6)；[0.6,0.8)；[0.8,1.0)；00.40.60.811234對符號1,2,3,4在[0,1)內(nèi)分別建立編碼區(qū)間：試對圖像信源數(shù)據(jù)集:[41312]進(jìn)行算術(shù)編碼。其中各符號出現(xiàn)概率:3812.2.3算術(shù)編碼圖像的無損壓縮編碼根據(jù)算術(shù)編碼迭代公式，計算新區(qū)間：前符號區(qū)間為[0,1

，而符號4為[0.8,1.0

StartN=StartB

+LeftC

L=0+0.8

1=0.8

EndN=StartB

+RightC

L=0+1.0

1=1.0

符號4的新編碼區(qū)間為[0.8,1.0

，寬度為0.2前符號區(qū)間為[0.8,1.0

，而符號1為[0,0.4

StartN=StartB

+LeftC

L=0.8+0

0.2=0.8

EndN=StartB

+RightC

L=0.8+0.4

0.2=0.88

符號1的新編碼區(qū)間為[0.8,0.88

，寬度為0.08對符號4進(jìn)行編碼對符號1進(jìn)行編碼3912.2.3算術(shù)編碼圖像的無損壓縮編碼前符號區(qū)間為[0.8,0.88

，而符號3為[0.6,0.8

StartN=StartB

+LeftC

L=0.8+0.6

0.08=0.848

EndN=StartB

+RightC

L=0.8+0.8

0.08=0.864符號3的新編碼區(qū)間為[0.848,0.864

，寬度為0.016前符號區(qū)間為[0.848,0.864

，而符號1為[0,0.4

:StartN=StartB

+LeftC

L=0.848+0

0.016=0.848

EndN=StartB

+RightC

L=0.848+0.4

0.016=0.8544

符號1的新編碼區(qū)間為[0.848,0.8514

，寬度為0.0064對符號3進(jìn)行編碼對符號1進(jìn)行編碼4012.2.3算術(shù)編碼圖像的無損壓縮編碼前符號區(qū)間為[0.848,0.8544

，而符號2為[0.4,0.6

:StartN=StartB+LeftC

L=0.848+0.4

0.0064=0.85056EndN=StartB+RightC

L=0.848+0.6

0.0064=0.85184

符號2的新編碼區(qū)間為[0.85056,0.85184

數(shù)據(jù)串[41312]的編碼區(qū)間為[0.85056，0.85184

?；蛘哒f在此區(qū)間內(nèi)任一實數(shù)值都唯一對應(yīng)該數(shù)據(jù)序列。對符號2進(jìn)行編碼數(shù)據(jù)串[41312]的編碼輸出4112.2.3算術(shù)編碼圖像的無損壓縮編碼為了取碼長為最短的碼字作為最后的實際編碼碼字輸出把該十進(jìn)制實數(shù)區(qū)間用二進(jìn)制表示為：

[0.110110011011，0.110110100001

忽視小數(shù)點，不考慮“0.”，。輸出碼字為：1101101為對[41312]進(jìn)行算術(shù)編碼的結(jié)果。數(shù)據(jù)串[41312]的編碼值為11011014212.2.3算術(shù)編碼圖像的無損壓縮編碼熵為：=1.92比特/字符

平均碼長：=2比特/字符

編碼效率：43基于MATLAB編程實現(xiàn)對【例12.3】中的圖像實現(xiàn)算術(shù)編碼程序見教材【例12.4】程序運行結(jié)果和【例12.3】相同。12.2.3算術(shù)編碼圖像的無損壓縮編碼由上面的例子可知：算術(shù)編碼就是將每個字符串都與一個子區(qū)間[StartN,

EndN

相對應(yīng)，其中子區(qū)間寬度(EndN

StartN)是有效的編碼空間。（5）例程4412.2.4LZW編碼圖像的無損壓縮編碼

是一種基于字典的編碼，能減少或消除圖像中的像素間的冗余。20世紀(jì)70年代末，以色列人A.Lempel和J.Ziv提出LZ碼，形成LZ77和LZ78壓縮算法。1984年，由Welch充實，形成LZ78變種—LZW算法。改進(jìn)的LZ77、LZ78和LZW一起壟斷當(dāng)今通用數(shù)據(jù)壓縮領(lǐng)域—gz、zip、arj在標(biāo)準(zhǔn)圖像數(shù)據(jù)格式中得到廣泛應(yīng)用—GIF、TIFF思路：用數(shù)據(jù)中出現(xiàn)的字符序列形成字典，

給出字典的索引作為編碼結(jié)果。4512.2.4LZW編碼圖像的無損壓縮編碼（1）LZW編碼的基本思想在起初，構(gòu)造一個信源字符序列的編碼碼本（字典）。每個字符序列對應(yīng)一個索引值。在壓縮過程中，動態(tài)更新碼本（字典）。每壓縮掃描圖像時，發(fā)現(xiàn)一個字典中沒有出現(xiàn)過的字符序列，把該字符序列存到字典中。用字典索引值（編碼）作為該字符序列的代碼，替換原圖中的字符序列。下次再碰到相同字符序列，用字典索引值代替字符序列。壓縮結(jié)果，不保留壓縮過程中形成的字典。4612.2.4LZW編碼圖像的無損壓縮編碼（2）LZW編碼的算法步驟建立初始化字典，末尾添加符號：若“RS”在字典中，則無編碼輸出，令R=RS若“RS”不在字典中，則添加“RS”到字典末尾，編碼輸出為R在字典中位置，令R=S每次讀取一個像素，賦予S。且定義“當(dāng)前識別字符序列”為R，初始化R為空。判斷生成的新連接字串“RS”是否在字典中LZW_CLEAR---編碼開始標(biāo)志LZW_EOI---編碼結(jié)束標(biāo)志47依次讀取圖像信源數(shù)據(jù)流中每個像素，判斷圖像信源數(shù)據(jù)流中是否還有碼字要譯。如果“是”，則返回到步驟2）。如果“否”，則把代表當(dāng)前識別字符序列R在字典中位置作為編碼輸出。輸出結(jié)束標(biāo)志LZW_EOI的索引。12.2.4LZW編碼圖像的無損壓縮編碼（2）LZW編碼的算法步驟48對一幅圖像f進(jìn)行LZW編碼。12.2.4LZW編碼圖像的無損壓縮編碼解：建立初始化字符串表。為一個有512字（位置）的字典，其中位置256~511還沒有用到。位置01…CLEAREOI…511索引值01…256257…511（3）示例4912.2.4LZW編碼圖像的無損壓縮編碼輸入數(shù)據(jù)SRS輸出R生成新字符串及索引NULLNULL256NULL

3030

3030-30303030-30<258>3030-30

30-30

3030-30-302583030-30-30<259>11030-1103011030-110<260>110110-110110110110-110<261>110110-110

110-110

110110-110-110261110110-110-110<262>5012.2.4LZW編碼圖像的無損壓縮編碼輸入數(shù)據(jù)SRS輸出R生成新字符串及索引30110-3011030110-30<263>3030-30

30-30

3030-30-30

30-30-30

3030-30-30-302593030-30-30-30<264>11030-110

30-110

11030-110-11026011030-110-110<265>110110-110

110-110

110110-110-110

110-110-110

26225751最后的編碼結(jié)果為{256,30,258,30,110,261,110,259,260,262,257}進(jìn)行自然二進(jìn)制編碼輸出共119=99bit，而原始數(shù)據(jù)為168=128bit，壓縮比為128/99=1.3:112.2.4LZW編碼圖像的無損壓縮編碼52基于MATLAB編程實現(xiàn)【例12.5】中的圖像的LZW編碼。程序見教材【例12.6】程序運行結(jié)果和【例12.5】相同。12.2.4LZW編碼圖像的無損壓縮編碼（4）例程5312.2.4LZW編碼圖像的無損壓縮編碼（5）LZW編碼的算法特性自適應(yīng)性LZW碼從一個空表到在編解碼過程中逐步生成表中內(nèi)容，從這個意義上講，算法是自適應(yīng)的前綴性表中任何一個字符串的前綴字符串也在表中，即任何一個字符串R和某一個字符S組成一個字符串RS，若RS在串表中，則R也在表中。動態(tài)性編解碼過程中，動態(tài)生成建立字符串表，因此在壓縮文件中不必保存字符串表5412.3.1預(yù)測編碼12.3.2變換編碼12.3圖像的有損壓縮編碼5512.3.1預(yù)測編碼圖像的有損壓縮編碼（1）什么是預(yù)測編碼？

指利用圖像信號的空間或時間相關(guān)性，用已傳輸?shù)南袼貙Ξ?dāng)前的像素進(jìn)行預(yù)測，然后對預(yù)測值與真實值的差——預(yù)測誤差進(jìn)行編碼處理和傳輸。當(dāng)預(yù)測比較準(zhǔn)確，預(yù)測誤差較小時，就可用較少比特進(jìn)行編碼，可達(dá)到壓縮編碼目的。定義56壓縮圖像信道傳輸量化器符號編碼器預(yù)測器符號解碼器預(yù)測器12.3.1預(yù)測編碼圖像的有損壓縮編碼5712.3.1預(yù)測編碼圖像的有損壓縮編碼發(fā)送端原始信號fN

(i,j)和接收端重建信號f

(i,j)之間存在誤差為：此為發(fā)送端量化器所造成的量化誤差誤差的嚴(yán)重程度取決于使用的量化方法和預(yù)測方法之間的相互作用。預(yù)測誤差5812.3.1預(yù)測編碼圖像的有損壓縮編碼（2）DM編碼DM編碼是最簡單的有損預(yù)測編碼方法，其預(yù)測器為1階線性預(yù)測器其中，a是預(yù)測系數(shù)，。c是1個正常數(shù)。DM方法得到的碼率是1比特/像素。59（3）示例---DM編碼12.3.1預(yù)測編碼圖像的有損壓縮編碼設(shè)輸入序列為：這里取DM編碼系統(tǒng)中的

a=1和

c=6。60輸入編碼器解碼器誤差Nfee

025

2501272526312531

42403196373137333037

6313731

14353146373137

2512237856433743796128438564943497971244975655495569855550

649554969524936554955

312.3.1預(yù)測編碼圖像的有損壓縮編碼解：DM編碼過程實現(xiàn)6112.3.1預(yù)測編碼圖像的有損壓縮編碼（4）最優(yōu)預(yù)測器選取適當(dāng)?shù)念A(yù)測系數(shù)ai，實現(xiàn)最佳線性預(yù)測。預(yù)測誤差eN為：預(yù)測誤差的均方值定義：

6212.3.1預(yù)測編碼圖像的有損壓縮編碼（4）最優(yōu)預(yù)測器最佳線性預(yù)測主要是選擇一組預(yù)測系數(shù){ai|i=1,2,…,m}使預(yù)測誤差的均方誤差值為最小。要使均方誤差值為最小，則有：這為一個m階線性方程組，可由此解出m個預(yù)測系數(shù){ai|i=1,2,…,m}使預(yù)測誤差的均方值為最小，因此稱為最佳預(yù)測系數(shù)。6312.3.1預(yù)測編碼圖像的有損壓縮編碼（4）最優(yōu)預(yù)測器求解最佳預(yù)測系數(shù)需要滿足條件：這種限制是為了確保預(yù)測器的輸出能落到灰度級的允許范圍內(nèi)，并減少傳輸噪聲的影響，傳輸噪聲的影響通常在重構(gòu)圖像中表現(xiàn)為水平的條紋。6412.3.1預(yù)測編碼圖像的有損壓縮編碼通常將對當(dāng)前像素進(jìn)行預(yù)測的像素集合中像素的個數(shù)m，稱為預(yù)測器的階數(shù)。（5）示例---一個4階線性預(yù)測系統(tǒng)掃描行X1X0X2X3X4預(yù)測像素1個取樣延遲1行延遲1行加1個取樣延遲1行減1個取樣延遲

4階預(yù)測器X0X1X3X4X26512.3.1預(yù)測編碼圖像的有損壓縮編碼（6）示例---不同階數(shù)的線性預(yù)測預(yù)測器階數(shù)不宜過高應(yīng)盡量減少乘法運算。6612.3.2變換編碼圖像的有損壓縮編碼（1）變換編碼的基本思想將空間域里描述的圖像，經(jīng)過某種變換（如DFT、DCT等），在變換域中進(jìn)行描述，將空間域圖像像素集映射為變換域變換系數(shù)集，然后量化和編碼這些系數(shù)?？沼蜃儞Q域量化熵編碼碼流輸出正交變換圖像的某些特征更加明顯正交變換本身沒有對數(shù)據(jù)壓縮，只是為壓縮創(chuàng)造了條件。6712.3.2變換編碼圖像的有損壓縮編碼（2）變換編碼系統(tǒng)組成輸入圖像子塊劃分

正變換系數(shù)量化

熵編碼信道

熵解碼反變換子塊拼接輸出圖像壓縮

圖像6812.3.2變換編碼圖像的有損壓縮編碼（3）實現(xiàn)編碼的主要問題子塊尺寸選擇通常劃分子塊需滿足：好處是：相鄰子塊間相關(guān)程度減到某個可接受水平子塊的長和寬通常為2的整數(shù)次冪使正交變換后能量更加集中大大降低計算復(fù)雜度一般典型的劃分子塊尺寸是8

8或16

166912.3.2變換編碼圖像的有損壓縮編碼正交變換K-L變換：很少使用。其嚴(yán)重依賴圖像數(shù)據(jù)，每次都重新計算協(xié)方差矩陣，計算量大。DFT變換：塊效應(yīng)嚴(yán)重。DCT變換：被認(rèn)為是準(zhǔn)最佳變換。被國際壓縮標(biāo)準(zhǔn)采納。優(yōu)點是：（3）實現(xiàn)編碼的主要問題基本沒有塊效應(yīng)；信息封裝能力強，把最多的信息封裝在最少的系數(shù)中。7012.3.2變換編碼圖像的有損壓縮編碼區(qū)域編碼由于變換系數(shù)集中在低頻區(qū)域，而低頻區(qū)集中在變換域的左上角，可對該區(qū)域變換系數(shù)進(jìn)行量化、編碼、傳輸；而右下角高頻區(qū)既不編碼又不傳輸，可達(dá)壓縮目的。缺點為高頻分量被丟棄，圖像可視分辨率下降。（3）實現(xiàn)編碼的主要問題比特分配7112.3.2變換編碼圖像的有損壓縮編碼設(shè)定一門限值，只對變換系數(shù)幅值大于此閾值的編碼，這樣使低頻成分不僅保留，而且某些高頻成分也被選擇編碼。重建圖像時，品質(zhì)得到改善。閾值編碼（3）實現(xiàn)編碼的主要問題比特分配7212.4.1JPEG基本系統(tǒng)12.4.2JPEG200012.4JPEG標(biāo)準(zhǔn)和JPEG20007312.4.1JPEG基本系統(tǒng)JPEG標(biāo)準(zhǔn)和JPEG2000JPEG定義了三種不同的編碼系統(tǒng):基于DCT的有損編碼基本系統(tǒng)用于高壓縮比、高精度或漸進(jìn)重建應(yīng)用的擴(kuò)展編碼系統(tǒng)用于無失真應(yīng)用場合的獨立無損編碼系統(tǒng)所有符合JPEG標(biāo)準(zhǔn)編解碼器都支持基本系統(tǒng)JPEG基本系統(tǒng)提供順序建立方式的高效有失真編碼，輸入圖像的精度為8bit/像素，而量化的DCT值限制為11比特。7412.4.1JPEG基本系統(tǒng)JPEG標(biāo)準(zhǔn)和JPEG2000（1）JPEG編碼流程

DCT量化熵

編碼壓縮數(shù)據(jù)量化表編碼表RGB顏色轉(zhuǎn)換零偏置轉(zhuǎn)換YCbCr8

87512.4.1JPEG基本系統(tǒng)JPEG標(biāo)準(zhǔn)和JPEG2000構(gòu)造8

8子塊、顏色模型RGB

YCbCr轉(zhuǎn)換劃分互不重疊的8

8子圖像塊，這些子塊進(jìn)行從左到右，從上到下的處理。人眼對亮度更敏感，提取亮度特征，將RGB轉(zhuǎn)換為YCbCr模型：(見式（2-20）和式（2-21）)

編碼時對亮度采用特殊編碼,賦予更多碼速

率，而對色差分量可給予較少碼速率。7612.4.1JPEG基本系統(tǒng)JPEG標(biāo)準(zhǔn)和JPEG2000在DCT前，對于灰度級為2n的像素，通過減去2n-1，替換像素本身

零偏置轉(zhuǎn)換在IDCT后，應(yīng)加上2n-1，替換像素本身。目的：使像素絕對值出現(xiàn)3位10進(jìn)制概率大大減少。對于n=8，即將0~255的值域，減去128，轉(zhuǎn)換為值域在-128~127之間的值。7712.4.1JPEG基本系統(tǒng)JPEG標(biāo)準(zhǔn)和JPEG2000正向離散DCT變換直流分量這說明：在原點的DCT變換和圖像的平均灰度成正比x,y,u,v=0,1,2,…,77812.4.1JPEG基本系統(tǒng)JPEG標(biāo)準(zhǔn)和JPEG20008

8的DCT變換矩陣，共計64個變換域系數(shù)。F(0,0)系數(shù)稱為直流系數(shù)，即DC系數(shù)，代表該子圖像平均亮度。其余63個系數(shù)稱為交流系數(shù)，即AC系數(shù)。特性：圖像信號能量主要分布在低頻區(qū)域。DCT變換域圖像特性：左上角低頻，右下角高頻。低頻域變換系數(shù)值較大，高頻變換域系數(shù)值較小。正向離散DCT變換7912.4.1JPEG基本系統(tǒng)JPEG標(biāo)準(zhǔn)和JPEG2000量化

根據(jù)人眼的視覺特性，

人眼對亮度信號比對色度信號更加敏感。JPEG標(biāo)準(zhǔn)中使用兩個量化表：亮度量化表和色度量化表。

人眼對低頻信號比對高頻信號更加敏感。

高頻編碼分配較少比特數(shù)。量化的原則是低頻部分用小的值量化，高頻部分用大的值量化，量化的結(jié)果將會在高頻部分出現(xiàn)大量的0。

8012.4.1JPEG基本系統(tǒng)JPEG標(biāo)準(zhǔn)和JPEG2000量化的具體計算公式為----F(u,v)為DCT系數(shù)----Q(u,v)為量化表系數(shù)對于亮度和顏色使用不同的量化表，見書表12-2和12-3.量化表左上角的值較小，右下角的值較大，達(dá)到保持低頻分量、抑制高頻分量的目的。量化81161110162440516112121419265860551413162440576956141722295187806218223756681091037724355564811041139249647887103121120101729295981121001039912.4.1JPEG基本系統(tǒng)JPEG標(biāo)準(zhǔn)和JPEG2000亮度信號量化表17182447999999991821266699999999242656999999999947669999999999999999999999999999999999999999999999999999999999999999999999999999色度信號量化表量化8212.4.1JPEG基本系統(tǒng)JPEG標(biāo)準(zhǔn)和JPEG2000熵編碼DC系數(shù)和AC系數(shù)分別用不同方式進(jìn)行編碼。DC系數(shù)編碼方式為：預(yù)測+統(tǒng)計編碼由兩部分組成：前綴碼編碼(SSSS)+尾碼(預(yù)測誤差編碼)AC系數(shù)編碼方式為：游程+統(tǒng)計編碼由兩部分組成：游程/前綴碼編碼(NNNN/SSSS)+尾碼(AC系數(shù)編碼)8312.4.1JPEG基本系統(tǒng)JPEG標(biāo)準(zhǔn)和JPEG2000用當(dāng)前的DC系數(shù)，減去相鄰的前一個子

塊的DC系數(shù)，則：預(yù)測誤差DIFF：DIFF=DC–PRE_DCDC系數(shù)的編碼步驟SSSS的編碼。通過DIFF查前綴碼表(表12-4)得出前綴碼SSSS根據(jù)SSSS查哈夫曼編碼表(表12-5)得出SSSS的哈夫曼編碼尾碼的編碼。對預(yù)測誤差DIFF編碼。8412.4.1JPEG基本系統(tǒng)JPEG標(biāo)準(zhǔn)和JPEG2000AC系數(shù)的編碼步驟Z形掃描將量化后DCT系數(shù)中63個AC系數(shù)，按“Z”字型方式重新排序，全零結(jié)尾用特殊符號EOB。目的：增加連續(xù)的“0”系數(shù)的個數(shù)8512.4.1JPEG基本系統(tǒng)JPEG標(biāo)準(zhǔn)和JPEG2000NNNN/SSSS的編碼AC系數(shù)的編碼步驟尾碼的編碼

非零AC系數(shù)本身編碼SSSS從表12-6中查出非零AC系數(shù)幅度值所對應(yīng)的前綴碼SSSSNNNN

該系數(shù)前相對于前一個非零系數(shù)值的零行程計數(shù)根據(jù)NNNN/SSSS

查哈夫曼編碼表(表12-7)8612.4.1JPEG基本系統(tǒng)JPEG標(biāo)準(zhǔn)和JPEG2000一個8

8的亮度分量子圖像塊，對其進(jìn)行JPEG基本編碼。（假設(shè)相鄰前一個8

8的亮度分量子圖像塊經(jīng)處理后的量化DC系數(shù)為

30）（2）示例8712.4.1JPEG基本系統(tǒng)JPEG標(biāo)準(zhǔn)和JPEG2000解：零偏置轉(zhuǎn)換8812.4.1JPEG基本系統(tǒng)JPEG標(biāo)準(zhǔn)和JPEG2000正DCT轉(zhuǎn)換8912.4.1JPEG基本系統(tǒng)JPEG標(biāo)準(zhǔn)和JPEG2000量化DCT系數(shù)9012.4.1JPEG基本系統(tǒng)JPEG標(biāo)準(zhǔn)和JPEG2000熵編碼對于DC系數(shù)

差值：DIFF=

（

30）=

5。前綴碼（SSSS）的編碼由DIFF=

5查表12-4，得：SSSS=3。根據(jù)SSSS=3查表12-5，得其Huffman碼字輸出為100。尾碼的編碼由于DIFF=

5，則其二進(jìn)制碼字輸出為010。因此，則有DC系數(shù)的編碼輸出為：100010。9112.4.1JPEG基本系統(tǒng)JPEG標(biāo)準(zhǔn)和JPEG2000對于AC系數(shù)AC系數(shù)

SSSS

2NNNN/SSSS0/4

人人文庫> 全部分類> 專業(yè)文獻(xiàn) > 建筑環(huán)境

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

數(shù)字圖像處理-第12章圖像編碼

文檔簡介

溫馨提示

最新文檔

評論

數(shù)字圖像處理-第12章 圖像編碼

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔

數(shù)字圖像處理-第12章圖像編碼