圖像壓縮與編碼_第1頁
圖像壓縮與編碼_第2頁
圖像壓縮與編碼_第3頁
圖像壓縮與編碼_第4頁
圖像壓縮與編碼_第5頁
已閱讀5頁,還剩86頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

圖像壓縮與編碼第一頁,共九十一頁,2022年,8月28日圖像編碼的必要性與可能性圖像編碼的必要性數(shù)字圖像的龐大數(shù)據(jù)對計算機的處理速度、存儲容量都提出過高的要求。因此必須把數(shù)據(jù)量壓縮。從傳送圖像的角度來看,則更要求數(shù)據(jù)量壓縮。在信道帶寬、通信鏈路容量一定的前提下,采用編碼壓縮技術(shù),減少傳輸數(shù)據(jù)量,是提高通信速度的重要手段。第二頁,共九十一頁,2022年,8月28日圖像編碼的可能性組成圖像的各像素之間,無論是在圖像的行方向還是在列方向,都存在著一定的相關(guān)性。常見的靜態(tài)圖像數(shù)據(jù)冗余包括:空間冗余,結(jié)構(gòu)冗余,知識冗余,視覺冗余,圖像區(qū)域的相同性冗余,紋理的統(tǒng)計冗余。第三頁,共九十一頁,2022年,8月28日圖像編碼分類

根據(jù)解壓重建后的圖像和原始圖像之間是否具有誤差,可以將圖像編碼與壓縮方法分為無誤差(亦稱無失真、無損、信息保持)編碼和有誤差(有失真或有損)編碼兩大類。根據(jù)編碼作用域劃分,圖像編碼分為空間域編碼和變換域編碼兩大類。

若從具體編碼技術(shù)來考慮,又可分為預(yù)測編碼、變換編碼、統(tǒng)計編碼、輪廓編碼、模型編碼等。第四頁,共九十一頁,2022年,8月28日8.1圖像編碼基礎(chǔ)概述數(shù)據(jù)壓縮冗余相對冗余R=1-(1/C)冗余種類編碼冗余像素間冗余心理冗余第五頁,共九十一頁,2022年,8月28日第六頁,共九十一頁,2022年,8月28日第七頁,共九十一頁,2022年,8月28日第八頁,共九十一頁,2022年,8月28日第九頁,共九十一頁,2022年,8月28日圖像信息衡量表示一幅圖像究竟要多少位?信息論理論:熵熵在數(shù)字圖像中的含義第十頁,共九十一頁,2022年,8月28日圖像編碼評價準(zhǔn)則

在圖像壓縮編碼中,解碼圖像與原始圖像可能會有差異,因此,需要評價壓縮后圖像的質(zhì)量。描述解碼圖像相對原始圖像偏離程度的測度一般稱為保真度(逼真度)準(zhǔn)則。常用的準(zhǔn)則可分為兩大類:客觀保真度準(zhǔn)則和主觀保真度準(zhǔn)則。第十一頁,共九十一頁,2022年,8月28日(1)客觀保真度準(zhǔn)則

最常用的客觀保真度準(zhǔn)則是原圖像和解碼圖像之間的均方根誤差和均方根信噪比兩種。均方根誤差:均方信噪比:

對上式求平方根,就得到均方根信噪比。

(4-2)(4-3)第十二頁,共九十一頁,2022年,8月28日(2)主觀保真度準(zhǔn)則

具有相同客觀保真度的不同圖像,人的視覺可能產(chǎn)生不同的視覺效果。這是因為客觀保真度是一種統(tǒng)計平均意義下的度量準(zhǔn)則,對于圖像中的細節(jié)無法反映出來。一種常用的方法是對一組(不少于20人)觀察者顯示圖像,并將他們對該圖像的評分取平均,用來評價一幅圖像的主觀質(zhì)量。

第十三頁,共九十一頁,2022年,8月28日

例如可用{-3,-2,-1,0,1,2,3}來代表主觀評價{很差,較差,稍差,相同,稍好,較好,很好}。評分評價說明1優(yōu)秀圖像質(zhì)量非常好,如同人能想象出的最好質(zhì)量2良好圖像質(zhì)量高,觀看舒服,有干擾但不影響觀看3可用圖像質(zhì)量可以接受,有干擾但不太影響觀看4剛可看圖像質(zhì)量差,干擾有些妨礙觀看,觀察者希望改進5差圖像質(zhì)量很差,幾乎無法觀看6不能用圖像質(zhì)量極差,不能使用表8.1電視圖像質(zhì)量評價尺度第十四頁,共九十一頁,2022年,8月28日第十五頁,共九十一頁,2022年,8月28日圖像編碼模型

一個圖像壓縮系統(tǒng)包括兩個不同的結(jié)構(gòu)塊:

編碼器和解碼器。圖像f(x,y)輸入到編碼器中,編碼器可以根據(jù)輸入數(shù)據(jù)生成一組符號。在通過信道進行傳輸之后,將經(jīng)過編碼的表達符號送入解碼器,經(jīng)過重構(gòu)后,生成輸出圖像。f(x,y)信源編碼信道編碼信道信道解碼信源解碼f’(x,y)一個常用于圖像壓縮系統(tǒng)模型第十六頁,共九十一頁,2022年,8月28日(1)信源編碼器和信源解碼器信源編碼器的任務(wù)是減少或消除輸入圖像中的編碼冗余、像素間冗余或心理視覺冗余。

從原理來看主要分為三個階段:

第一階段將輸入數(shù)據(jù)轉(zhuǎn)換為可以減少輸入圖像中像素間冗余的數(shù)據(jù)的集合。第二階段設(shè)法去除原圖像信號的相關(guān)性。第三階段是找一種編碼方式。信源解碼器包含兩部分:符號解碼器和反向轉(zhuǎn)換器。第十七頁,共九十一頁,2022年,8月28日(2)信道編碼器和解碼器

當(dāng)信道帶有噪聲或易于出現(xiàn)錯誤時,信道編碼器和解碼器就在整個譯碼解碼處理中扮演了重要的角色。信道編碼器和解碼器通過向信源編碼數(shù)據(jù)中插入預(yù)制的冗余數(shù)據(jù)來減少信道噪聲的影響最有用的—種信道編碼技術(shù)是由R.w.Hamming提出的。這種技術(shù)是基于這樣的思想,即向被編碼數(shù)據(jù)中加入足夠的位數(shù)以確??捎玫拇a字間變化的位數(shù)最小。

第十八頁,共九十一頁,2022年,8月28日圖像編碼與壓縮標(biāo)準(zhǔn)第十九頁,共九十一頁,2022年,8月28日第二十頁,共九十一頁,2022年,8月28日第二十一頁,共九十一頁,2022年,8月28日第二十二頁,共九十一頁,2022年,8月28日8.2基本編碼方法霍夫曼編碼

一個事件集合x1,x2,,…xn,處于一個基本概率空間,其相應(yīng)概率為p1,p2,,…pn,且p1+p2+…pn=1。每一個信息的信息量為:

如定義在概率空間中每—事件的概率不相等時的平均不肯定程度或平均信息量叫作熵H,則:1.理論基礎(chǔ)

(4-9)(4-10)第二十三頁,共九十一頁,2022年,8月28日Huffman編碼是1952年由Huffman提出的一種編碼方法。這種編碼方法根據(jù)信源數(shù)據(jù)符號發(fā)生的概率進行編碼。在信源數(shù)據(jù)中出現(xiàn)概率越大的符號,相應(yīng)的碼越短;出現(xiàn)概率越小的符號,其碼長越長,從而達到用盡可能少的碼符號表示源數(shù)據(jù)。它在變長編碼方法中是最佳的。2.Huffman編碼

第二十四頁,共九十一頁,2022年,8月28日設(shè)信源A的信源空間為:其中,現(xiàn)用r個碼符號的碼符號集對信源A中的每個符號(i=1,2,…,N)進行編碼。具體編碼的方法是:(1)把信源符號按其出現(xiàn)概率的大小順序排列起來;(2)把最末兩個具有最小概率的元素之概率加起來;(3)把該概率之和同其余概率由大到小排隊,然后再把兩個最小概率加起來,再重新排隊;(4)重復(fù)(2)直到最后只剩下兩個概率為止。Huffman編碼具體方法:第二十五頁,共九十一頁,2022年,8月28日例:設(shè)有編碼輸入其頻率分布分別為現(xiàn)求其最佳霍夫曼編碼。 解:Huffman編碼過程下圖所示:

符號概率

x10.4x20.3x30.1x40.1x50.06x60.041

0.40.30.10.10.120.40.30.20.130.40.30.340.60.4第二十六頁,共九十一頁,2022年,8月28日

本例中對0.6賦予0,對0.4賦予1,0.4傳遞到x1,所以x1的編碼便是1。0.6傳遞到前一級是兩個0.3相加,大值是單獨一個元素x2的概率,小值是兩個元素概率之和,每個概率都小于0.3,所以x2賦予0,0.2和0.1求和的0.3賦予1。所以x2的編碼是00,而剩余元素編碼的前兩個碼應(yīng)為01。0.1賦予1,0.2賦予0。以此類推,最后得到諸元素的編碼如下:

元素x1x1x2x3x4x5x6概率P(x1)0.40.30.10.10.060.04編碼w110001101000101001011第二十七頁,共九十一頁,2022年,8月28日經(jīng)霍夫曼編碼后,平均碼長為:

= =0.41+0.302+0.13+0.14+0.065+0.045 =2.20(bit)

該信源的熵為H=2.14bit,編碼后計算的平均碼長為2.2bit,非常接近于熵。可見Huffman編碼是—種較好的編碼。第二十八頁,共九十一頁,2022年,8月28日第二十九頁,共九十一頁,2022年,8月28日注意:短碼不作長碼的起始部分。Huffman編碼是最佳的,其平均碼長相同,不影響編碼效率和數(shù)據(jù)壓縮性能。由于Huffman碼的碼長參差不齊,因此,存在一個輸入、輸出速率匹配問題。解決的辦法是設(shè)置一定容量的緩沖存儲器Huffman碼在存儲或傳輸過程中,如果出現(xiàn)誤碼,可能會引起誤碼的連續(xù)傳播Huffman編碼對不同信源其編碼效率也不盡相同。Huffman編碼應(yīng)用時,均需要與其他編碼結(jié)合起來使用,才能進一步提高數(shù)據(jù)壓縮比。Huffman編碼實現(xiàn)第三十頁,共九十一頁,2022年,8月28日哥倫布編碼(Golombcodes)第三十一頁,共九十一頁,2022年,8月28日第三十二頁,共九十一頁,2022年,8月28日第三十三頁,共九十一頁,2022年,8月28日8.2.3算術(shù)編碼

理論上,用Huffman方法對源數(shù)據(jù)流進行編碼可達到最佳編碼效果。但由于計算機中存儲、處理的最小單位是“位”,因此,在一些情況下,實際壓縮比與理論壓縮比的極限相去甚遠。

算術(shù)編碼沒有延用數(shù)據(jù)編碼技術(shù)中用一個特定的代碼代替一個輸入符號的一般做法,它把要壓縮處理的整段數(shù)據(jù)映射到一段實數(shù)半開區(qū)間[0,1]內(nèi)的某一區(qū)段,構(gòu)造出小于1且大于或等于0的數(shù)值。這個數(shù)值是輸人數(shù)據(jù)流的唯—可譯代碼。第三十四頁,共九十一頁,2022年,8月28日

對一個5符號信源A={a1,a2,a3,a3,a4},各字符出現(xiàn)的概率和設(shè)定的取值范圍如下: 字符概率范圍

a10.2

[0.0,0.2)

a20.2

[0.2,0.4)

a30.4

[0.4,0.8) a40.2

[0.8,1.0)

“范圍”給出了字符的賦值區(qū)間。這個區(qū)間是根據(jù)字符發(fā)生的概率劃分的。具體把a1、a2、a3、a4分配在哪個區(qū)間范圍,對編碼本身沒有影響,只要保證編碼器和解碼器對字符的概率區(qū)間有相同的定義即可。為討論方便起見,假定有

第三十五頁,共九十一頁,2022年,8月28日第三十六頁,共九十一頁,2022年,8月28日

式中Ns為新于區(qū)間的起始位置;Fs為前子區(qū)間的起始位置,當(dāng)前符號的區(qū)間左端;Ne為新子區(qū)間的結(jié)束位置;Fe為前子區(qū)間的結(jié)束位置;當(dāng)前符號的區(qū)間右端;L為前子區(qū)間的長度。按上述區(qū)間的定義,若數(shù)據(jù)流的第一個字符為a1,由字符概率取值區(qū)間的定義可知,代碼的實際取值范圍在[0.2,0.4]之間,即輸入數(shù)據(jù)流的第一個字符決定了代碼最高有效位取值的范圍。繼續(xù)對源數(shù)據(jù)流中的后續(xù)字符進行編碼。每讀入一個新的符號,輸出數(shù)值范圍就進一步縮小。讀入第二個符號a2取值范圍在區(qū)間的[0.4,0.8]內(nèi)。由于第一個字符a1已將取值區(qū)間限制在[0.2,0.4]的范圍中,因此a2的實際取值是在前符號范圍[0.2,0.4]的[0.4,0.8]處,從而字符a2的編碼取值范圍在[0.28,0.36],而不是在[0,1]整個概率分布區(qū)間上。第三十七頁,共九十一頁,2022年,8月28日編碼1.LZ77算法

LZ77是JacobZiv和AbrahamLempel在1977年發(fā)表的一篇論文中提出的。利用該算法進行數(shù)據(jù)壓縮、解壓縮的過程,就像一個窗口在原始數(shù)據(jù)中滑動過程,故也常稱為基于滑動窗口的自適應(yīng)的字典壓縮方法。2LZ78算法

LZ78是JacobZiv和AbrahamLempel在1978年發(fā)表的另一篇論文中提出的。LZ78算法不同于LZ77算法,它放棄了窗口概念,采用樹形結(jié)構(gòu)構(gòu)造字典和保存短語,從而確保文件中的內(nèi)容均能反映到字典中。第三十八頁,共九十一頁,2022年,8月28日3LZW算法

1984年,TerryA.Welch在LZ78的基礎(chǔ)上進行了改進,這就是著名的LZW壓縮算法。

LZW壓縮算法是一種基于字典算法的編碼方法.他的基本思想是建立一個編碼表(轉(zhuǎn)換表)也稱串表,將輸入字符串映射成定長的碼子輸出,通常碼長設(shè)為12bit.12位可以有4096個不同的12位代碼,這就是說,轉(zhuǎn)換表有4096個表項,其中256個表項用來存放已定義的字符,剩下3840個表項用來存放前綴第三十九頁,共九十一頁,2022年,8月28日第四十頁,共九十一頁,2022年,8月28日LZW編碼算法的具體執(zhí)行步驟如下:步驟1:開始時的詞典包含所有可能的根(Root),而當(dāng)前前綴P是空的;步驟2:當(dāng)前字符(C):=字符流中的下一個字符;步驟3:判斷綴2符串P+C是否在詞典中(1)如果“是”:P:=P+CPP(用C擴展P);(2)如果“否”①把代表當(dāng)前前綴P的碼字輸出到碼字流;②把綴2符串P+C添加到詞典;③令P:=CPP(現(xiàn)在的P僅包含一個字符C);步驟4:判斷碼字流中是否還有碼字要譯(1)如果“是”,就返回到步驟2;(2)如果“否”①把代表當(dāng)前前綴P的碼字輸出到碼字流;②結(jié)束.第四十一頁,共九十一頁,2022年,8月28日第四十二頁,共九十一頁,2022年,8月28日例:下列子圖像中

3939126126393912612639391261263939126126用LZW編碼。第四十三頁,共九十一頁,2022年,8月28日第四十四頁,共九十一頁,2022年,8月28日游程編碼游程編碼(RLC)是一種利用空間冗余度壓縮圖像的方法,屬于統(tǒng)計編碼類。設(shè)圖像中的某一行或某一塊像素經(jīng)采樣或經(jīng)某種變換后的系數(shù)為:某一行或某一塊內(nèi)像素值可分為k段,長度為的連續(xù)串,每個串具有相同的值,那么,該圖像的某一行或某一塊可由下面偶對來表示:

其中為每個串內(nèi)的代表值,為串的長度。串長就是游程長度(Run—length),簡寫為RL,即由灰度值構(gòu)成的數(shù)據(jù)流中各灰度值重復(fù)出現(xiàn)而形成的長度。如果給出了灰度值、對應(yīng)長度及位置,就能很容易地恢復(fù)出原來的數(shù)據(jù)流。第四十五頁,共九十一頁,2022年,8月28日游程編碼分為定長游程編碼和變長游程編碼兩類。定長游程編碼是指編碼的游程所使用位數(shù)是固定的,即RL位數(shù)是固定的。如果灰度連續(xù)相同的個數(shù)超過了固定位數(shù)所能表示的最大值,則進入下一輪游程編碼。變長游程編碼是指對不同范圍的游程使用不同位數(shù)的編碼,即表示RL位數(shù)是不固定的。第四十六頁,共九十一頁,2022年,8月28日例:BMP中的游程編碼第四十七頁,共九十一頁,2022年,8月28日一維CCITT壓縮編碼在一維CCITT第三組壓縮方法中,圖像的每一條線都可以用一系列變長編碼碼字編碼,這些碼字代表從左到右掃描線條過程中,白色和黑色交替的行程長度。碼字本身分兩類。如果行程長度小于63,則使用表8.14中修正的霍夫曼編碼得到的一個終結(jié)編碼。如果行程長度大于63,則根據(jù)表8.15得到最大可能出現(xiàn)的組成編碼(不超過行程長度),將它與一個終結(jié)編碼一起使用進行編碼,終結(jié)編碼用于表示組成編碼和實際行程長度之間的差異。這個標(biāo)準(zhǔn)要求每條線都從一個白色行程長度碼字開始,事實上它們可能是00110101,這個編碼表示一個零長度的白色行程。最后,惟一的行尾(EOL)碼字000000000001用于結(jié)束每一行,同時標(biāo)記每幅新圖像的第一行。一個圖像序列的結(jié)尾使用6個連續(xù)的EOL標(biāo)記。第四十八頁,共九十一頁,2022年,8月28日第四十九頁,共九十一頁,2022年,8月28日第五十頁,共九十一頁,2022年,8月28日第五十一頁,共九十一頁,2022年,8月28日二維壓縮

為CCITT第三組和第四組標(biāo)準(zhǔn)所采用的二維壓縮方法采用的是逐線方法,這種方法在每個黑色轉(zhuǎn)白色或白色轉(zhuǎn)黑色的掃描轉(zhuǎn)換位置上均參考基準(zhǔn)元素a0進行編碼,基準(zhǔn)元素a0被設(shè)定在當(dāng)前的編碼線上。前面提到的編碼線稱為基準(zhǔn)線;對每幅新圖像的第一條線設(shè)定的基準(zhǔn)線是一條虛構(gòu)的白色線條。

第五十二頁,共九十一頁,2022年,8月28日第五十三頁,共九十一頁,2022年,8月28日圖8.44顯示了對一條單掃描線的基本編碼過程。注意,這個過程的初始步驟在于對幾個關(guān)鍵的轉(zhuǎn)換或變化元素的定位:a0,a1,a2,b1和b2。變化元素定義為在同一條直線上與前一個像素值不同的像素。最重要的變化元素是a0(基準(zhǔn)元素),這個元素被設(shè)定在虛構(gòu)的白色變化元素的位置上,而這個虛構(gòu)變化元素的位置在每條新編碼線的第一個像素的左邊,或者a0可以根據(jù)以前的編碼模式確定。在a0的位置確定了之后,a1作為在當(dāng)前編碼線上a0右邊的下一個變化元素的位置,a2作為在當(dāng)前編碼線上a1右邊的下一個變化元素的位置,b1作為具有(a0的)相反值的變化元素,位于基準(zhǔn)線(或前一條線)上a0的右邊。b2作為下一個變化元素位于基準(zhǔn)線上b1的右邊。如果這些變化元素中的任何一個沒有被檢測到,則這些元素被設(shè)一定在適當(dāng)線上最后一個像素右邊的一個虛構(gòu)像素位置上。圖8.45給出了在不同變化元素之問一般關(guān)系的兩種說明。第五十四頁,共九十一頁,2022年,8月28日第五十五頁,共九十一頁,2022年,8月28日第五十六頁,共九十一頁,2022年,8月28日第五十七頁,共九十一頁,2022年,8月28日字符編碼(Symbol-BasedCoding)基本原理:子圖像編碼(字符)每個字符存儲其圖像碼和其在字典中的代碼。而圖像的數(shù)據(jù)以三維形式出現(xiàn)。如下圖所示第五十八頁,共九十一頁,2022年,8月28日J(rèn)BIG2壓縮基本思想:將圖像分割成三類子區(qū)域(1)文字區(qū)域(2)半色調(diào)圖像區(qū)域(3)普通區(qū)域第五十九頁,共九十一頁,2022年,8月28日位平面編碼Bit-planecoding思想:將圖像分成一系列的二值圖像,然后用上述二值圖像的壓縮等好方法壓縮。第六十頁,共九十一頁,2022年,8月28日第六十一頁,共九十一頁,2022年,8月28日第六十二頁,共九十一頁,2022年,8月28日子圖像塊的變換編碼(BlockTransformCoding)思想:先將圖像分割成子圖像,然后進行線性變換,再進行量化和編碼。第六十三頁,共九十一頁,2022年,8月28日變換選擇第六十四頁,共九十一頁,2022年,8月28日(1)傅里葉變換第六十五頁,共九十一頁,2022年,8月28日(2)walsh-Hadamardtransform(WHT)第六十六頁,共九十一頁,2022年,8月28日第六十七頁,共九十一頁,2022年,8月28日離散余弦變換(Discretecosinetransform)第六十八頁,共九十一頁,2022年,8月28日例:三種變換比較第六十九頁,共九十一頁,2022年,8月28日J(rèn)PEG圖像編碼壓縮標(biāo)準(zhǔn)

JPEG(JointPhotographicExpertGroup,簡稱JPEG)是聯(lián)合圖像專家小組的英文縮寫。其中“聯(lián)合”的含意是指,國際電報電話咨詢委員會〔CCIITI〕和國際標(biāo)淮化協(xié)會(ISO)聯(lián)合組成的一個圖像專家小組。JPEG算法被確定為JPEG國際標(biāo)準(zhǔn),它是國際上彩色、灰度、靜止圖像的第一個國際標(biāo)準(zhǔn)。JPEG標(biāo)準(zhǔn)適于靜圖像的壓縮,電視圖像序列的幀內(nèi)圖像的壓縮編碼也常采用JPEG壓縮標(biāo)準(zhǔn)。第七十頁,共九十一頁,2022年,8月28日(1)JPEG的工作模式JPEG對每一個圖像分量單獨編碼。JPEG對每個不同的圖像分量可以采用不同的量化參數(shù)和熵編碼的碼表對于一個圖像分量,JPEG提供4種工作模式。

順序編碼:每一個圖像分量按從左到右,從上到下掃描,一次掃描完成編碼。

累進編碼:圖像編碼在多次掃描中完成。

無失真編碼:解碼后能精確地恢復(fù)源圖像采樣值,其壓縮比低于有失真壓縮編碼方法。

分層編碼:圖像在多個空間分辨率進行編碼。

第七十一頁,共九十一頁,2022年,8月28日(2)基本工作模式基于DCTJPEG編碼的過程框圖

8×8塊編碼器DCT正變換量化器熵編碼器量化表熵編碼器源圖像數(shù)據(jù)壓縮的圖像數(shù)據(jù)第七十二頁,共九十一頁,2022年,8月28日解碼過程框圖

解碼器逆變換(IDCT)反量化器熵解碼器量化表熵編碼器恢復(fù)的圖像數(shù)據(jù)第七十三頁,共九十一頁,2022年,8月28日J(rèn)PEG采用的是8×8大小的子塊的二維離散余弦變換(DCT)。在編碼器的輸入端,把原始圖像順序地分割成一系列8×8的子塊,設(shè)原始圖像的采樣精度為P位,是無符號整數(shù),輸入時把[0,2P]范圍的無符號整數(shù)變成[-2P-1,2P-1-1]范圍的有符號整數(shù),以此作為離散余弦正變換的輸入。在解碼器的輸出端經(jīng)離散余弦逆變換(IDCT)后,得到一系列8×8的圖像數(shù)據(jù)塊,需將其數(shù)值范圍由[-2P-1

,2P-1-1]再變回到[0,2P]范圍內(nèi)的無符號整數(shù),來獲得重構(gòu)圖像。第七十四頁,共九十一頁,2022年,8月28日為了達到壓縮數(shù)據(jù)的目的,對DCT系數(shù)需作量化處理。量化處理是一個多到一的映射,它是造成DCT編解碼信息損失的根源。在JPEG中采用線性均勻量化器,量化定義為對64個DCT系數(shù)除以量化步長,四舍五入取整。量化的作用是在一定的主觀保真度圖像質(zhì)量前提下,丟掉那些對視覺效果影響不大的信息。

第七十五頁,共九十一頁,2022年,8月28日例:給定Lena圖像的一個平坦區(qū)域(8×8子塊)如下:6971757984899169707376839095777476748589957173767986919374777782889193787680848892957678808593949574798185869494給出DCT變換系數(shù)量化過程。第七十六頁,共九十一頁,2022年,8月28日如下是它的DCT變換系數(shù),可以看到能量集中在少數(shù)低頻系數(shù):660.1250﹣47.049625.998010.39937.87508.48665.60251.3176﹣17.3267﹣2.67495.2236﹣1.32340.52220.29140.2800﹣2.2810.0280﹣0.6463﹣0.95450.96202.47301.9783﹣0.3162.17412.30030.4542﹣2.24033.55591.2907﹣1.00240.15800.9747﹣2.37500.1038﹣3.22200.96531.37502.22580.38753.52360.9294﹣1.3282﹣2.42560.9828﹣1.9317﹣0.69720.1253﹣1.8560.39432.6640﹣0.5669﹣3.4168﹣0.8891﹣1.6182﹣2.545﹣1.7322.16661.7238﹣0.3335﹣0.4808﹣2.6253﹣0.96991.4854﹣1.183第七十七頁,共九十一頁,2022年,8月28日用JPEG的亮度量化矩陣式對每個系數(shù)進行均勻量化,量化器輸出為:41﹣431000010000000000000000000000000000000000000000000000000000000第七十八頁,共九十一頁,2022年,8月28日反量化后,進行DCT反變換,得到的解碼圖像為:

8075717278858990 8075717278858990 8076727379869091 8177727480879192 8277737481879193 8378747581889293 8379757682899394 8479757682899394第七十九頁,共九十一頁,2022年,8月28日8×8子塊的64個變換系數(shù)經(jīng)量化后,按直流系數(shù)DC和交流系數(shù)AC分成兩類處理。坐標(biāo)u=v=0的直流系數(shù)DC實質(zhì)上就是空域圖像中64個像素的平均值。相鄰的8×8子塊之間的DC系數(shù)有強的相關(guān)性,JPEG對DC系數(shù)采用DPCM編碼,即對相鄰塊之間的DC系數(shù)的差值DIFF=DCi-DCi-1編碼。

DCj-2DCj-1DCjDCj+1DCj+2第八十頁,共九十一頁,2022年,8月28日其余63個系數(shù)稱為交流系數(shù)(AC系數(shù))采用行程編碼。由于低頻分量多呈圓環(huán)形輻射狀向高頻率衰減,因此可看成按Z字形衰減,如下圖所示。因此,AC系數(shù)按Z字形掃描讀數(shù)。AC0DCAC0AC7AC7第八十一頁,共九十一頁,2022年,8月28日對這63個AC系數(shù)采用非常簡單和直觀的行程編碼,行程編碼采用兩個字節(jié)表示。JPEG使用1字節(jié)的高4位表示連續(xù)“0”的個數(shù),而使用它的低四位來表示下一個非“0”系數(shù)所需要的位數(shù),跟在它后面的是量化AC系數(shù)的數(shù)值。AC系數(shù)的行程編碼如下圖所示:NNNNSSSS兩個非零值間連續(xù)零個數(shù)表示下一個非零值需要的比特數(shù)第一個字節(jié)下一個字節(jié)(RunLength)(Size)下一個非零值的實際值第八十二頁,共九十一頁,2022年,8月28日為了進一步達到壓縮數(shù)據(jù)的目的,可以對DPCM編碼后的DC碼和RLE編碼后的AC碼的碼字再作熵編碼。JPEG建議使用兩種熵編碼方法:哈夫曼(Huffman)編碼和自適二進制算術(shù)編碼。熵編碼可分成兩步進行,首先把DPCM編碼后的DC碼DC系數(shù)和行程編碼的AC系數(shù)轉(zhuǎn)換成中間符號序列,然后給這些符號賦以變長碼字。第八十三頁,共九十一頁,2022年,8月28日例JPEG標(biāo)準(zhǔn)編碼和解碼

考慮下列8×8子圖像,使用JPEG基本標(biāo)準(zhǔn)進行壓縮和重構(gòu):

52

55

61

66

70

61

64

73

63

59

66

90

109

85

69

72

62

59

68

113

144

104

66

73

63

58

71

122

154

106

70

69

67

61

68

104

126

88

68

7079

65

60

70

77

68

58

7585

71

64

59

55

61

65

8387

79

69

68

65

76

78

94第八十四頁,共九十一頁,2022年,8月28日原圖像包含256個可能的灰度級,因此,編碼過程從對原子圖像的像素層次移動-128或128個灰度級開始。得到的移住陣列為:

-76

-73

-67

-62

-58

-67

-64

-55

-65

-69

-62

-38

-19

-43

-59

-56

-66

-69

-60

-15

16

-24

-62

-55

-65

-70

-57

-6

26

-22

-58

-59

-61

-67

-60

-24

-2

-40

-60

-58

-49

-63

-68

-58

-51

-65

-70

-53

-43

-57

-64

-69

-73

-67

-63

-45

-41

-49

-59

-60

-63

-52

-50

-34第八十五頁,共九十一頁,2022年,8月28日對N=8,正向DCT,變換的陣列為:-415

-29

-62

25

55

-20

-l

3

7

-21

-62

9

11

-7

-6

6-46

8

77

-25

-30

10

7

-5-50

13

35

-15

-9

6

0

3

11

-8

-13

-2

-1

1

-4

1

-10

1

3

-3

-1

0

2

-1

-4

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論