圖像壓縮與編碼

上傳人：石*** IP屬地：廣東上傳時間：2023-03-02 格式：PPT 頁數(shù)：91 大?。?.25MB 積分：18 舉報 版權(quán)申訴

已閱讀5頁，還剩86頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認(rèn)領(lǐng)

文檔簡介

圖像壓縮與編碼第一頁，共九十一頁，2022年，8月28日圖像編碼的必要性與可能性圖像編碼的必要性數(shù)字圖像的龐大數(shù)據(jù)對計算機的處理速度、存儲容量都提出過高的要求。因此必須把數(shù)據(jù)量壓縮。從傳送圖像的角度來看，則更要求數(shù)據(jù)量壓縮。在信道帶寬、通信鏈路容量一定的前提下，采用編碼壓縮技術(shù)，減少傳輸數(shù)據(jù)量，是提高通信速度的重要手段。第二頁，共九十一頁，2022年，8月28日圖像編碼的可能性組成圖像的各像素之間，無論是在圖像的行方向還是在列方向，都存在著一定的相關(guān)性。常見的靜態(tài)圖像數(shù)據(jù)冗余包括：空間冗余，結(jié)構(gòu)冗余，知識冗余，視覺冗余，圖像區(qū)域的相同性冗余，紋理的統(tǒng)計冗余。第三頁，共九十一頁，2022年，8月28日圖像編碼分類

根據(jù)解壓重建后的圖像和原始圖像之間是否具有誤差，可以將圖像編碼與壓縮方法分為無誤差(亦稱無失真、無損、信息保持)編碼和有誤差(有失真或有損)編碼兩大類。根據(jù)編碼作用域劃分，圖像編碼分為空間域編碼和變換域編碼兩大類。

若從具體編碼技術(shù)來考慮，又可分為預(yù)測編碼、變換編碼、統(tǒng)計編碼、輪廓編碼、模型編碼等。第四頁，共九十一頁，2022年，8月28日8.1圖像編碼基礎(chǔ)概述數(shù)據(jù)壓縮冗余相對冗余R=1-(1/C)冗余種類編碼冗余像素間冗余心理冗余第五頁，共九十一頁，2022年，8月28日第六頁，共九十一頁，2022年，8月28日第七頁，共九十一頁，2022年，8月28日第八頁，共九十一頁，2022年，8月28日第九頁，共九十一頁，2022年，8月28日圖像信息衡量表示一幅圖像究竟要多少位？信息論理論：熵熵在數(shù)字圖像中的含義第十頁，共九十一頁，2022年，8月28日圖像編碼評價準(zhǔn)則

在圖像壓縮編碼中，解碼圖像與原始圖像可能會有差異，因此，需要評價壓縮后圖像的質(zhì)量。描述解碼圖像相對原始圖像偏離程度的測度一般稱為保真度(逼真度)準(zhǔn)則。常用的準(zhǔn)則可分為兩大類：客觀保真度準(zhǔn)則和主觀保真度準(zhǔn)則。第十一頁，共九十一頁，2022年，8月28日（1）客觀保真度準(zhǔn)則

最常用的客觀保真度準(zhǔn)則是原圖像和解碼圖像之間的均方根誤差和均方根信噪比兩種。均方根誤差:均方信噪比:

對上式求平方根，就得到均方根信噪比。

（4-2）（4-3）第十二頁，共九十一頁，2022年，8月28日（2）主觀保真度準(zhǔn)則

具有相同客觀保真度的不同圖像，人的視覺可能產(chǎn)生不同的視覺效果。這是因為客觀保真度是一種統(tǒng)計平均意義下的度量準(zhǔn)則，對于圖像中的細節(jié)無法反映出來。一種常用的方法是對一組(不少于20人)觀察者顯示圖像，并將他們對該圖像的評分取平均，用來評價一幅圖像的主觀質(zhì)量。

第十三頁，共九十一頁，2022年，8月28日

例如可用{-3，-2，-1，0，1，2，3}來代表主觀評價{很差，較差，稍差，相同，稍好，較好，很好}。評分評價說明1優(yōu)秀圖像質(zhì)量非常好，如同人能想象出的最好質(zhì)量2良好圖像質(zhì)量高，觀看舒服，有干擾但不影響觀看3可用圖像質(zhì)量可以接受，有干擾但不太影響觀看4剛可看圖像質(zhì)量差，干擾有些妨礙觀看，觀察者希望改進5差圖像質(zhì)量很差，幾乎無法觀看6不能用圖像質(zhì)量極差，不能使用表8.1電視圖像質(zhì)量評價尺度第十四頁，共九十一頁，2022年，8月28日第十五頁，共九十一頁，2022年，8月28日圖像編碼模型

一個圖像壓縮系統(tǒng)包括兩個不同的結(jié)構(gòu)塊：

編碼器和解碼器。圖像f（x，y）輸入到編碼器中，編碼器可以根據(jù)輸入數(shù)據(jù)生成一組符號。在通過信道進行傳輸之后，將經(jīng)過編碼的表達符號送入解碼器，經(jīng)過重構(gòu)后，生成輸出圖像。f(x,y)信源編碼信道編碼信道信道解碼信源解碼f’(x,y)一個常用于圖像壓縮系統(tǒng)模型第十六頁，共九十一頁，2022年，8月28日(1)信源編碼器和信源解碼器信源編碼器的任務(wù)是減少或消除輸入圖像中的編碼冗余、像素間冗余或心理視覺冗余。

從原理來看主要分為三個階段:

第一階段將輸入數(shù)據(jù)轉(zhuǎn)換為可以減少輸入圖像中像素間冗余的數(shù)據(jù)的集合。第二階段設(shè)法去除原圖像信號的相關(guān)性。第三階段是找一種編碼方式。信源解碼器包含兩部分：符號解碼器和反向轉(zhuǎn)換器。第十七頁，共九十一頁，2022年，8月28日(2)信道編碼器和解碼器

當(dāng)信道帶有噪聲或易于出現(xiàn)錯誤時，信道編碼器和解碼器就在整個譯碼解碼處理中扮演了重要的角色。信道編碼器和解碼器通過向信源編碼數(shù)據(jù)中插入預(yù)制的冗余數(shù)據(jù)來減少信道噪聲的影響最有用的—種信道編碼技術(shù)是由R．w．Hamming提出的。這種技術(shù)是基于這樣的思想，即向被編碼數(shù)據(jù)中加入足夠的位數(shù)以確?？捎玫拇a字間變化的位數(shù)最小。

第十八頁，共九十一頁，2022年，8月28日圖像編碼與壓縮標(biāo)準(zhǔn)第十九頁，共九十一頁，2022年，8月28日第二十頁，共九十一頁，2022年，8月28日第二十一頁，共九十一頁，2022年，8月28日第二十二頁，共九十一頁，2022年，8月28日8.2基本編碼方法霍夫曼編碼

一個事件集合x1,x2,,…xn,處于一個基本概率空間，其相應(yīng)概率為p1,p2,,…pn，且p1+p2+…pn=1。每一個信息的信息量為:

如定義在概率空間中每—事件的概率不相等時的平均不肯定程度或平均信息量叫作熵H，則：1.理論基礎(chǔ)

（4-9）（4-10）第二十三頁，共九十一頁，2022年，8月28日Huffman編碼是1952年由Huffman提出的一種編碼方法。這種編碼方法根據(jù)信源數(shù)據(jù)符號發(fā)生的概率進行編碼。在信源數(shù)據(jù)中出現(xiàn)概率越大的符號，相應(yīng)的碼越短；出現(xiàn)概率越小的符號，其碼長越長，從而達到用盡可能少的碼符號表示源數(shù)據(jù)。它在變長編碼方法中是最佳的。2.Huffman編碼

第二十四頁，共九十一頁，2022年，8月28日設(shè)信源A的信源空間為：其中，現(xiàn)用r個碼符號的碼符號集對信源A中的每個符號（i＝1，2，…，N)進行編碼。具體編碼的方法是:(1)把信源符號按其出現(xiàn)概率的大小順序排列起來；(2)把最末兩個具有最小概率的元素之概率加起來；(3)把該概率之和同其余概率由大到小排隊，然后再把兩個最小概率加起來，再重新排隊；(4)重復(fù)(2)直到最后只剩下兩個概率為止。Huffman編碼具體方法：第二十五頁，共九十一頁，2022年，8月28日例:設(shè)有編碼輸入其頻率分布分別為現(xiàn)求其最佳霍夫曼編碼。解:Huffman編碼過程下圖所示：

符號概率

x10.4x20.3x30.1x40.1x50.06x60.041

0.40.30.10.10.120.40.30.20.130.40.30.340.60.4第二十六頁，共九十一頁，2022年，8月28日

本例中對0.6賦予0，對0.4賦予1，0.4傳遞到x1，所以x1的編碼便是1。0.6傳遞到前一級是兩個0.3相加，大值是單獨一個元素x2的概率，小值是兩個元素概率之和，每個概率都小于0.3，所以x2賦予0，0.2和0.1求和的0.3賦予1。所以x2的編碼是00，而剩余元素編碼的前兩個碼應(yīng)為01。0.1賦予1，0.2賦予0。以此類推，最后得到諸元素的編碼如下：

元素x1x1x2x3x4x5x6概率P(x1)0.40.30.10.10.060.04編碼w110001101000101001011第二十七頁，共九十一頁，2022年，8月28日經(jīng)霍夫曼編碼后，平均碼長為：

= =0.41+0.302+0.13+0.14+0.065+0.045 =2.20(bit)

該信源的熵為H＝2.14bit，編碼后計算的平均碼長為2.2bit,非常接近于熵。可見Huffman編碼是—種較好的編碼。第二十八頁，共九十一頁，2022年，8月28日第二十九頁，共九十一頁，2022年，8月28日注意:短碼不作長碼的起始部分。Huffman編碼是最佳的，其平均碼長相同，不影響編碼效率和數(shù)據(jù)壓縮性能。由于Huffman碼的碼長參差不齊，因此，存在一個輸入、輸出速率匹配問題。解決的辦法是設(shè)置一定容量的緩沖存儲器Huffman碼在存儲或傳輸過程中，如果出現(xiàn)誤碼，可能會引起誤碼的連續(xù)傳播Huffman編碼對不同信源其編碼效率也不盡相同。Huffman編碼應(yīng)用時，均需要與其他編碼結(jié)合起來使用，才能進一步提高數(shù)據(jù)壓縮比。Huffman編碼實現(xiàn)第三十頁，共九十一頁，2022年，8月28日哥倫布編碼（Golombcodes）第三十一頁，共九十一頁，2022年，8月28日第三十二頁，共九十一頁，2022年，8月28日第三十三頁，共九十一頁，2022年，8月28日8.2.3算術(shù)編碼

理論上，用Huffman方法對源數(shù)據(jù)流進行編碼可達到最佳編碼效果。但由于計算機中存儲、處理的最小單位是“位”，因此，在一些情況下，實際壓縮比與理論壓縮比的極限相去甚遠。

算術(shù)編碼沒有延用數(shù)據(jù)編碼技術(shù)中用一個特定的代碼代替一個輸入符號的一般做法，它把要壓縮處理的整段數(shù)據(jù)映射到一段實數(shù)半開區(qū)間[0，1]內(nèi)的某一區(qū)段，構(gòu)造出小于1且大于或等于0的數(shù)值。這個數(shù)值是輸人數(shù)據(jù)流的唯—可譯代碼。第三十四頁，共九十一頁，2022年，8月28日

對一個5符號信源A＝{a1,a2,a3,a3,a4}，各字符出現(xiàn)的概率和設(shè)定的取值范圍如下：字符概率范圍

a10.2

[0.0，0.2）

a20.2

[0.2，0.4）

a30.4

[0.4，0.8) a40.2

[0.8，1.0)

“范圍”給出了字符的賦值區(qū)間。這個區(qū)間是根據(jù)字符發(fā)生的概率劃分的。具體把a1、a2、a3、a4分配在哪個區(qū)間范圍，對編碼本身沒有影響，只要保證編碼器和解碼器對字符的概率區(qū)間有相同的定義即可。為討論方便起見，假定有

第三十五頁，共九十一頁，2022年，8月28日第三十六頁，共九十一頁，2022年，8月28日

式中Ns為新于區(qū)間的起始位置；Fs為前子區(qū)間的起始位置，當(dāng)前符號的區(qū)間左端；Ne為新子區(qū)間的結(jié)束位置；Fe為前子區(qū)間的結(jié)束位置；當(dāng)前符號的區(qū)間右端；L為前子區(qū)間的長度。按上述區(qū)間的定義，若數(shù)據(jù)流的第一個字符為a1，由字符概率取值區(qū)間的定義可知，代碼的實際取值范圍在[0.2，0.4]之間，即輸入數(shù)據(jù)流的第一個字符決定了代碼最高有效位取值的范圍。繼續(xù)對源數(shù)據(jù)流中的后續(xù)字符進行編碼。每讀入一個新的符號，輸出數(shù)值范圍就進一步縮小。讀入第二個符號a2取值范圍在區(qū)間的[0.4，0.8]內(nèi)。由于第一個字符a1已將取值區(qū)間限制在[0.2，0.4]的范圍中，因此a2的實際取值是在前符號范圍[0.2，0.4]的[0.4，0.8]處，從而字符a2的編碼取值范圍在[0.28，0.36]，而不是在[0，1]整個概率分布區(qū)間上。第三十七頁，共九十一頁，2022年，8月28日編碼1.LZ77算法

LZ77是JacobZiv和AbrahamLempel在1977年發(fā)表的一篇論文中提出的。利用該算法進行數(shù)據(jù)壓縮、解壓縮的過程，就像一個窗口在原始數(shù)據(jù)中滑動過程，故也常稱為基于滑動窗口的自適應(yīng)的字典壓縮方法。2LZ78算法

LZ78是JacobZiv和AbrahamLempel在1978年發(fā)表的另一篇論文中提出的。LZ78算法不同于LZ77算法，它放棄了窗口概念，采用樹形結(jié)構(gòu)構(gòu)造字典和保存短語，從而確保文件中的內(nèi)容均能反映到字典中。第三十八頁，共九十一頁，2022年，8月28日3LZW算法

1984年，TerryA.Welch在LZ78的基礎(chǔ)上進行了改進，這就是著名的LZW壓縮算法。

LZW壓縮算法是一種基于字典算法的編碼方法.他的基本思想是建立一個編碼表(轉(zhuǎn)換表)也稱串表,將輸入字符串映射成定長的碼子輸出,通常碼長設(shè)為12bit.12位可以有4096個不同的12位代碼,這就是說,轉(zhuǎn)換表有4096個表項,其中256個表項用來存放已定義的字符,剩下3840個表項用來存放前綴第三十九頁，共九十一頁，2022年，8月28日第四十頁，共九十一頁，2022年，8月28日LZW編碼算法的具體執(zhí)行步驟如下:步驟1:開始時的詞典包含所有可能的根(Root),而當(dāng)前前綴P是空的;步驟2:當(dāng)前字符(C):=字符流中的下一個字符;步驟3:判斷綴2符串P+C是否在詞典中(1)如果“是”:P:=P+CPP(用C擴展P);(2)如果“否”①把代表當(dāng)前前綴P的碼字輸出到碼字流;②把綴2符串P+C添加到詞典;③令P:=CPP(現(xiàn)在的P僅包含一個字符C);步驟4:判斷碼字流中是否還有碼字要譯(1)如果“是”,就返回到步驟2;(2)如果“否”①把代表當(dāng)前前綴P的碼字輸出到碼字流;②結(jié)束.第四十一頁，共九十一頁，2022年，8月28日第四十二頁，共九十一頁，2022年，8月28日例：下列子圖像中

3939126126393912612639391261263939126126用LZW編碼。第四十三頁，共九十一頁，2022年，8月28日第四十四頁，共九十一頁，2022年，8月28日游程編碼游程編碼(RLC)是一種利用空間冗余度壓縮圖像的方法，屬于統(tǒng)計編碼類。設(shè)圖像中的某一行或某一塊像素經(jīng)采樣或經(jīng)某種變換后的系數(shù)為：某一行或某一塊內(nèi)像素值可分為k段，長度為的連續(xù)串，每個串具有相同的值，那么，該圖像的某一行或某一塊可由下面偶對來表示：

其中為每個串內(nèi)的代表值，為串的長度。串長就是游程長度(Run—length)，簡寫為RL，即由灰度值構(gòu)成的數(shù)據(jù)流中各灰度值重復(fù)出現(xiàn)而形成的長度。如果給出了灰度值、對應(yīng)長度及位置，就能很容易地恢復(fù)出原來的數(shù)據(jù)流。第四十五頁，共九十一頁，2022年，8月28日游程編碼分為定長游程編碼和變長游程編碼兩類。定長游程編碼是指編碼的游程所使用位數(shù)是固定的，即RL位數(shù)是固定的。如果灰度連續(xù)相同的個數(shù)超過了固定位數(shù)所能表示的最大值，則進入下一輪游程編碼。變長游程編碼是指對不同范圍的游程使用不同位數(shù)的編碼，即表示RL位數(shù)是不固定的。第四十六頁，共九十一頁，2022年，8月28日例：BMP中的游程編碼第四十七頁，共九十一頁，2022年，8月28日一維CCITT壓縮編碼在一維CCITT第三組壓縮方法中，圖像的每一條線都可以用一系列變長編碼碼字編碼，這些碼字代表從左到右掃描線條過程中，白色和黑色交替的行程長度。碼字本身分兩類。如果行程長度小于63，則使用表8.14中修正的霍夫曼編碼得到的一個終結(jié)編碼。如果行程長度大于63，則根據(jù)表8.15得到最大可能出現(xiàn)的組成編碼(不超過行程長度)，將它與一個終結(jié)編碼一起使用進行編碼，終結(jié)編碼用于表示組成編碼和實際行程長度之間的差異。這個標(biāo)準(zhǔn)要求每條線都從一個白色行程長度碼字開始，事實上它們可能是00110101，這個編碼表示一個零長度的白色行程。最后，惟一的行尾(EOL)碼字000000000001用于結(jié)束每一行，同時標(biāo)記每幅新圖像的第一行。一個圖像序列的結(jié)尾使用6個連續(xù)的EOL標(biāo)記。第四十八頁，共九十一頁，2022年，8月28日第四十九頁，共九十一頁，2022年，8月28日第五十頁，共九十一頁，2022年，8月28日第五十一頁，共九十一頁，2022年，8月28日二維壓縮

為CCITT第三組和第四組標(biāo)準(zhǔn)所采用的二維壓縮方法采用的是逐線方法，這種方法在每個黑色轉(zhuǎn)白色或白色轉(zhuǎn)黑色的掃描轉(zhuǎn)換位置上均參考基準(zhǔn)元素a0進行編碼，基準(zhǔn)元素a0被設(shè)定在當(dāng)前的編碼線上。前面提到的編碼線稱為基準(zhǔn)線；對每幅新圖像的第一條線設(shè)定的基準(zhǔn)線是一條虛構(gòu)的白色線條。

第五十二頁，共九十一頁，2022年，8月28日第五十三頁，共九十一頁，2022年，8月28日圖8.44顯示了對一條單掃描線的基本編碼過程。注意，這個過程的初始步驟在于對幾個關(guān)鍵的轉(zhuǎn)換或變化元素的定位：a0,a1,a2，b1和b2。變化元素定義為在同一條直線上與前一個像素值不同的像素。最重要的變化元素是a0(基準(zhǔn)元素)，這個元素被設(shè)定在虛構(gòu)的白色變化元素的位置上，而這個虛構(gòu)變化元素的位置在每條新編碼線的第一個像素的左邊，或者a0可以根據(jù)以前的編碼模式確定。在a0的位置確定了之后，a1作為在當(dāng)前編碼線上a0右邊的下一個變化元素的位置，a2作為在當(dāng)前編碼線上a1右邊的下一個變化元素的位置，b1作為具有(a0的)相反值的變化元素，位于基準(zhǔn)線(或前一條線)上a0的右邊。b2作為下一個變化元素位于基準(zhǔn)線上b1的右邊。如果這些變化元素中的任何一個沒有被檢測到，則這些元素被設(shè)一定在適當(dāng)線上最后一個像素右邊的一個虛構(gòu)像素位置上。圖8.45給出了在不同變化元素之問一般關(guān)系的兩種說明。第五十四頁，共九十一頁，2022年，8月28日第五十五頁，共九十一頁，2022年，8月28日第五十六頁，共九十一頁，2022年，8月28日第五十七頁，共九十一頁，2022年，8月28日字符編碼（Symbol-BasedCoding）基本原理：子圖像編碼（字符）每個字符存儲其圖像碼和其在字典中的代碼。而圖像的數(shù)據(jù)以三維形式出現(xiàn)。如下圖所示第五十八頁，共九十一頁，2022年，8月28日J(rèn)BIG2壓縮基本思想：將圖像分割成三類子區(qū)域(1)文字區(qū)域(2)半色調(diào)圖像區(qū)域(3)普通區(qū)域第五十九頁，共九十一頁，2022年，8月28日位平面編碼Bit-planecoding思想：將圖像分成一系列的二值圖像，然后用上述二值圖像的壓縮等好方法壓縮。第六十頁，共九十一頁，2022年，8月28日第六十一頁，共九十一頁，2022年，8月28日第六十二頁，共九十一頁，2022年，8月28日子圖像塊的變換編碼（BlockTransformCoding）思想：先將圖像分割成子圖像，然后進行線性變換，再進行量化和編碼。第六十三頁，共九十一頁，2022年，8月28日變換選擇第六十四頁，共九十一頁，2022年，8月28日（1）傅里葉變換第六十五頁，共九十一頁，2022年，8月28日（2）walsh-Hadamardtransform(WHT)第六十六頁，共九十一頁，2022年，8月28日第六十七頁，共九十一頁，2022年，8月28日離散余弦變換（Discretecosinetransform）第六十八頁，共九十一頁，2022年，8月28日例：三種變換比較第六十九頁，共九十一頁，2022年，8月28日J(rèn)PEG圖像編碼壓縮標(biāo)準(zhǔn)

JPEG(JointPhotographicExpertGroup，簡稱JPEG)是聯(lián)合圖像專家小組的英文縮寫。其中“聯(lián)合”的含意是指，國際電報電話咨詢委員會〔CCIITI〕和國際標(biāo)淮化協(xié)會(ISO)聯(lián)合組成的一個圖像專家小組。JPEG算法被確定為JPEG國際標(biāo)準(zhǔn)，它是國際上彩色、灰度、靜止圖像的第一個國際標(biāo)準(zhǔn)。JPEG標(biāo)準(zhǔn)適于靜圖像的壓縮，電視圖像序列的幀內(nèi)圖像的壓縮編碼也常采用JPEG壓縮標(biāo)準(zhǔn)。第七十頁，共九十一頁，2022年，8月28日(1)JPEG的工作模式JPEG對每一個圖像分量單獨編碼。JPEG對每個不同的圖像分量可以采用不同的量化參數(shù)和熵編碼的碼表對于一個圖像分量，JPEG提供4種工作模式。

順序編碼：每一個圖像分量按從左到右，從上到下掃描，一次掃描完成編碼。

累進編碼：圖像編碼在多次掃描中完成。

無失真編碼：解碼后能精確地恢復(fù)源圖像采樣值，其壓縮比低于有失真壓縮編碼方法。

分層編碼：圖像在多個空間分辨率進行編碼。

第七十一頁，共九十一頁，2022年，8月28日(2)基本工作模式基于DCTJPEG編碼的過程框圖

8×8塊編碼器DCT正變換量化器熵編碼器量化表熵編碼器源圖像數(shù)據(jù)壓縮的圖像數(shù)據(jù)第七十二頁，共九十一頁，2022年，8月28日解碼過程框圖

解碼器逆變換(IDCT)反量化器熵解碼器量化表熵編碼器恢復(fù)的圖像數(shù)據(jù)第七十三頁，共九十一頁，2022年，8月28日J(rèn)PEG采用的是8×8大小的子塊的二維離散余弦變換(DCT)。在編碼器的輸入端，把原始圖像順序地分割成一系列8×8的子塊，設(shè)原始圖像的采樣精度為P位，是無符號整數(shù)，輸入時把[0，2P]范圍的無符號整數(shù)變成[-2P-1，2P-1-1]范圍的有符號整數(shù)，以此作為離散余弦正變換的輸入。在解碼器的輸出端經(jīng)離散余弦逆變換(IDCT)后，得到一系列8×8的圖像數(shù)據(jù)塊，需將其數(shù)值范圍由[-2P-1

，2P-1-1]再變回到[0，2P]范圍內(nèi)的無符號整數(shù)，來獲得重構(gòu)圖像。第七十四頁，共九十一頁，2022年，8月28日為了達到壓縮數(shù)據(jù)的目的，對DCT系數(shù)需作量化處理。量化處理是一個多到一的映射，它是造成DCT編解碼信息損失的根源。在JPEG中采用線性均勻量化器，量化定義為對64個DCT系數(shù)除以量化步長，四舍五入取整。量化的作用是在一定的主觀保真度圖像質(zhì)量前提下，丟掉那些對視覺效果影響不大的信息。

第七十五頁，共九十一頁，2022年，8月28日例:給定Lena圖像的一個平坦區(qū)域（8×8子塊）如下：6971757984899169707376839095777476748589957173767986919374777782889193787680848892957678808593949574798185869494給出DCT變換系數(shù)量化過程。第七十六頁，共九十一頁，2022年，8月28日如下是它的DCT變換系數(shù)，可以看到能量集中在少數(shù)低頻系數(shù):660.1250﹣47.049625.998010.39937.87508.48665.60251.3176﹣17.3267﹣2.67495.2236﹣1.32340.52220.29140.2800﹣2.2810.0280﹣0.6463﹣0.95450.96202.47301.9783﹣0.3162.17412.30030.4542﹣2.24033.55591.2907﹣1.00240.15800.9747﹣2.37500.1038﹣3.22200.96531.37502.22580.38753.52360.9294﹣1.3282﹣2.42560.9828﹣1.9317﹣0.69720.1253﹣1.8560.39432.6640﹣0.5669﹣3.4168﹣0.8891﹣1.6182﹣2.545﹣1.7322.16661.7238﹣0.3335﹣0.4808﹣2.6253﹣0.96991.4854﹣1.183第七十七頁，共九十一頁，2022年，8月28日用JPEG的亮度量化矩陣式對每個系數(shù)進行均勻量化，量化器輸出為：41﹣431000010000000000000000000000000000000000000000000000000000000第七十八頁，共九十一頁，2022年，8月28日反量化后，進行DCT反變換，得到的解碼圖像為：

8075717278858990 8075717278858990 8076727379869091 8177727480879192 8277737481879193 8378747581889293 8379757682899394 8479757682899394第七十九頁，共九十一頁，2022年，8月28日8×8子塊的64個變換系數(shù)經(jīng)量化后，按直流系數(shù)DC和交流系數(shù)AC分成兩類處理。坐標(biāo)u=v=0的直流系數(shù)DC實質(zhì)上就是空域圖像中64個像素的平均值。相鄰的8×8子塊之間的DC系數(shù)有強的相關(guān)性，JPEG對DC系數(shù)采用DPCM編碼，即對相鄰塊之間的DC系數(shù)的差值DIFF＝DCi-DCi-1編碼。

DCj-2DCj-1DCjDCj+1DCj+2第八十頁，共九十一頁，2022年，8月28日其余63個系數(shù)稱為交流系數(shù)（AC系數(shù)）采用行程編碼。由于低頻分量多呈圓環(huán)形輻射狀向高頻率衰減，因此可看成按Z字形衰減，如下圖所示。因此，AC系數(shù)按Z字形掃描讀數(shù)。AC0DCAC0AC7AC7第八十一頁，共九十一頁，2022年，8月28日對這63個AC系數(shù)采用非常簡單和直觀的行程編碼，行程編碼采用兩個字節(jié)表示。JPEG使用1字節(jié)的高4位表示連續(xù)“0”的個數(shù)，而使用它的低四位來表示下一個非“0”系數(shù)所需要的位數(shù)，跟在它后面的是量化AC系數(shù)的數(shù)值。AC系數(shù)的行程編碼如下圖所示：NNNNSSSS兩個非零值間連續(xù)零個數(shù)表示下一個非零值需要的比特數(shù)第一個字節(jié)下一個字節(jié)(RunLength)(Size)下一個非零值的實際值第八十二頁，共九十一頁，2022年，8月28日為了進一步達到壓縮數(shù)據(jù)的目的，可以對DPCM編碼后的DC碼和RLE編碼后的AC碼的碼字再作熵編碼。JPEG建議使用兩種熵編碼方法：哈夫曼(Huffman)編碼和自適二進制算術(shù)編碼。熵編碼可分成兩步進行，首先把DPCM編碼后的DC碼DC系數(shù)和行程編碼的AC系數(shù)轉(zhuǎn)換成中間符號序列,然后給這些符號賦以變長碼字。第八十三頁，共九十一頁，2022年，8月28日例JPEG標(biāo)準(zhǔn)編碼和解碼

考慮下列8×8子圖像，使用JPEG基本標(biāo)準(zhǔn)進行壓縮和重構(gòu)：

109

113

144

104

122

154

106

104

126

7079

7585

8387

94第八十四頁，共九十一頁，2022年，8月28日原圖像包含256個可能的灰度級，因此，編碼過程從對原子圖像的像素層次移動-128或128個灰度級開始。得到的移住陣列為：

-76

-73

-67

-62

-58

-67

-64

-55

-65

-69

-62

-38

-19

-43

-59

-56

-66

-69

-60

-15

-24

-62

-55

-65

-70

-57

-6

-22

-58

-59

-61

-67

-60

-24

-2

-40

-60

-58

-49

-63

-68

-58

-51

-65

-70

-53

-43

-57

-64

-69

-73

-67

-63

-45

-41

-49

-59

-60

-63

-52

-50

-34第八十五頁，共九十一頁，2022年，8月28日對N=8，正向DCT，變換的陣列為：-415

-29

-62

-20

-l

-21

-62

-7

-6

6-46

-25

-30

-5-50

-15

-9

-8

-13

-2

-1

-4

-10

-3

-1

-4

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

圖像壓縮與編碼

文檔簡介

溫馨提示

最新文檔

評論

圖像壓縮與編碼

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔