圖像壓縮編碼技術(shù)_第1頁(yè)
圖像壓縮編碼技術(shù)_第2頁(yè)
圖像壓縮編碼技術(shù)_第3頁(yè)
圖像壓縮編碼技術(shù)_第4頁(yè)
圖像壓縮編碼技術(shù)_第5頁(yè)
已閱讀5頁(yè),還剩82頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第7章圖像壓縮編碼(ImageCompressionCodingTechnology)

圖像壓縮所解決的問(wèn)題是盡量減少表示數(shù)字圖像時(shí)需要的數(shù)據(jù)量。減少數(shù)據(jù)量的基本原理是去除其中多余的數(shù)據(jù)。以數(shù)學(xué)的觀點(diǎn)來(lái)看,這一過(guò)程實(shí)際上就是將二維像素陣列變換為一個(gè)在統(tǒng)計(jì)上無(wú)關(guān)聯(lián)的數(shù)據(jù)集合。這種變換在圖像存儲(chǔ)或傳輸之前進(jìn)行。在以后的某個(gè)時(shí)候,再對(duì)壓縮圖像進(jìn)行解壓縮來(lái)重構(gòu)原圖像或原圖像的近似圖像。7.1概述7.2無(wú)失真圖像壓縮編碼7.3預(yù)測(cè)壓縮技術(shù)7.4變換壓縮技術(shù)7.5靜態(tài)圖像壓縮標(biāo)準(zhǔn)JPEG7.6圖像壓縮編碼的新進(jìn)展要點(diǎn)總結(jié)第7章圖像壓縮編碼(ImageCompressionCodingTechnology)

7.1概述(Introduction)

舉例1:對(duì)于電視畫面的分辨率640*480的彩色圖像,每秒30幀,則一秒鐘的數(shù)據(jù)量為:640*480*3*30=37.64MB,1張CD可存640MB,如果不進(jìn)行壓縮,1張CD則僅可以存放23.15秒的數(shù)據(jù).舉例2:目前的WWW互聯(lián)網(wǎng)包含大量的圖像信息,如果圖像信息的數(shù)據(jù)量太大,會(huì)使本來(lái)就已經(jīng)非常緊張的網(wǎng)絡(luò)帶寬變得更加不堪重負(fù)(WorldWideWeb變成了WorldWideWait)為什么要對(duì)圖像進(jìn)行壓縮7.1.1圖像的信息量與信息熵

(InformationContentandEntropy)

1.信息量設(shè)信息源X可發(fā)出的消息符號(hào)集合為

并設(shè)X發(fā)出符號(hào)的概率

為,則定義符號(hào)的自信息量為:通常,上式中的對(duì)數(shù)取2為底,這時(shí)定義的信息量單位為“比特”(bit)。

由于圖像信息的編碼必須在保持信息源內(nèi)容不變,或者損失不大的前提下才有意義,這就必然涉及信息的度量問(wèn)題。2.信息熵

對(duì)信息源X的各符號(hào)的自信息量取統(tǒng)計(jì)平均,可得平均自信息量為:這個(gè)平均自信息量H(X)

稱為信息源X的熵(entropy),單位為bit/符號(hào),通常也稱為X的零階熵。由信息論的基本概念可以知道,在無(wú)失真信源編碼中,信息熵給出了無(wú)失真編碼時(shí),每個(gè)符號(hào)所需平均碼長(zhǎng)的下限。。)

7.1.1圖像的信息量與信息熵

(InformationContentandEntropy)

現(xiàn)在把信息論中熵值的概念應(yīng)用到圖像信息源。以灰度級(jí)為[0,L-1]的圖像為例,可以通過(guò)直方圖得到各灰度級(jí)概率,k=0,2,,L-1,這時(shí)圖像的熵為:【例7.1】大小為256×256像素、灰度級(jí)為256的Lena圖像如圖7.1所示,試求其熵。I=imread('lena.bmp');x=double(I);n=256;%計(jì)算出圖像的直方圖xh=hist(x(:),n);%求出各個(gè)灰度級(jí)出現(xiàn)的概率xh=xh/sum(xh(:));i=find(xh);%求出圖像的熵h=-sum(xh(i).*log2(xh(i)))運(yùn)行程序的結(jié)果是h=7.5534。說(shuō)明對(duì)該圖像進(jìn)行無(wú)失真編碼。其平均碼長(zhǎng)一定不會(huì)小于7.5534。通常一幅圖像中的各點(diǎn)像素點(diǎn)之間存在一定的相關(guān)性。特別是在活動(dòng)圖像中,由于兩幅相鄰圖像之間的時(shí)間間隔很短,因此這兩幅圖像信息中包含了大量的相關(guān)信息。這些就是圖像信息中的冗余。數(shù)據(jù)壓縮的目的就是要去除圖像信息中的大量冗余,同時(shí)又能保證圖像的質(zhì)量。一般針對(duì)不同類型的冗余,采取不同的壓縮方法。7.1.2圖像數(shù)據(jù)冗余

(Imagedataredundancy)1.空間冗余

圖7.2是一幅圖像,其中心部分為一個(gè)灰色的方塊,在灰色區(qū)域中的所有像素點(diǎn)的光強(qiáng)和彩色以及飽和度都是相同的,因此該區(qū)域中的數(shù)據(jù)之間存在很大的冗余度。

圖7.2空間冗余

空間冗余是圖像數(shù)據(jù)中最基本的冗余。要去除這種冗余,人們通常將其視為一個(gè)整體,并用極少的數(shù)據(jù)量來(lái)表示,從而減少鄰近像素之間的空間相關(guān)性,已達(dá)到數(shù)據(jù)壓縮的目的。7.1.2圖像數(shù)據(jù)冗余

(Imagedataredundancy)2.時(shí)間冗余

由于活動(dòng)圖像序列中的任意兩相鄰的圖像之間的時(shí)間間隔很短,因此兩幅圖像中存在大量的相關(guān)信息,如圖7.3所示,前后兩幅圖像的背景并沒(méi)有變化,所不同的是其中的運(yùn)動(dòng)物體的位置隨時(shí)間t發(fā)生變化。時(shí)間冗余是活動(dòng)圖像和語(yǔ)音數(shù)據(jù)中經(jīng)常存在的一種冗余。圖7.3時(shí)間冗余7.1.2圖像數(shù)據(jù)冗余

(Imagedataredundancy)3.信息熵冗余

信息熵冗余是針對(duì)數(shù)據(jù)的信息量而言的。設(shè)某種編碼的平均碼長(zhǎng)為式中,為分配給第

符號(hào)的比特?cái)?shù),為符號(hào)出現(xiàn)的概率。這種壓縮的目的就是要使L接近

7.1.2圖像數(shù)據(jù)冗余

(Imagedataredundancy)

例如圖7.4表示一個(gè)圖像塊的灰度值,該塊圖像共有64個(gè)像素,其中灰度值為3的點(diǎn)40個(gè),灰度值為255的點(diǎn)21個(gè),灰度值是150的點(diǎn)3個(gè)。若每個(gè)灰度值用8位二進(jìn)制表示,則共需要64

8=512位(比特)的存儲(chǔ)空間。我們可以用一位二進(jìn)制的0表示出現(xiàn)次數(shù)最多的3,用一位二進(jìn)制的1表示255,用二位二進(jìn)制的10表示出現(xiàn)次數(shù)最少的150,則表示該塊圖像只需要40+21+2

3=67位(比特)空間即可。32553255325533325532553255333255325532553332553255325533325532553255333255315032553332553150325533325531503255334.視覺(jué)冗余人觀察圖像的目的就是獲得有用的信息,但人眼并不是對(duì)所有的視覺(jué)信息具有相同的敏感度,在實(shí)際應(yīng)用中,人也不是對(duì)所有的信息具有相同的關(guān)心度。在特定場(chǎng)合,一些信息相對(duì)另外一些信息而言就不那么重要,這些相對(duì)不重要的信息就是視覺(jué)冗余。科學(xué)實(shí)驗(yàn)表明,人眼的分辨力是有限的,人眼不能區(qū)別各種顏色或灰度級(jí)。對(duì)整幅圖像而言,人眼能區(qū)別40~60個(gè)灰度級(jí),而對(duì)圖像的局部,人眼只能區(qū)別32個(gè)灰度級(jí),其他灰度級(jí)相對(duì)來(lái)說(shuō)就是視覺(jué)冗余。

7.1.2圖像數(shù)據(jù)冗余

(Imagedataredundancy)圖7.4與圖7.5看起來(lái)是沒(méi)有差別,但他們對(duì)應(yīng)的數(shù)據(jù)卻不一致。在這二幅圖像中,2、3、4的灰度級(jí)與3相近;149、150、151的灰度級(jí)與150相近;253、254、255的灰度級(jí)與255相近。若將圖7.5中的相應(yīng)灰度級(jí)都換成對(duì)應(yīng)的3、150、255,這樣就有利于壓縮。2254325542543232553253325323225432552254333255325432544222543253425533325531493254242254315022534432553151325533

5.結(jié)構(gòu)冗余

圖7.5表示了一種結(jié)構(gòu)冗余。從圖中可以看出。它存在著非常強(qiáng)的紋理結(jié)構(gòu),這使圖像在結(jié)構(gòu)上產(chǎn)生了冗余。

圖7.5結(jié)構(gòu)冗余7.1.2圖像數(shù)據(jù)冗余

(Imagedataredundancy)6.知識(shí)冗余

隨著人們認(rèn)識(shí)的深入,某些圖像所具有的先驗(yàn)知識(shí),如人臉圖像的固有結(jié)構(gòu)(包括眼、耳、鼻、口等)為人們所熟悉。這些由先驗(yàn)知識(shí)得到的規(guī)律結(jié)構(gòu)就是知識(shí)冗余。

7.1.2圖像數(shù)據(jù)冗余

(Imagedataredundancy)7.1.3圖像壓縮編碼分類

(CodingmethodsofImageCompression1、圖像壓縮編碼的分類(1)無(wú)損編碼又稱為信息保持編碼。要求編碼—解碼過(guò)程中能夠無(wú)誤差的重建圖像。如在醫(yī)學(xué)圖像應(yīng)用中。(2)有損編碼常被稱為保真度編碼。常用在圖像的信宿為人眼的應(yīng)用中,如數(shù)字電視、可視電話等。(3)特征抽取編碼是另一種有損編碼。常用在圖像的信宿為計(jì)算機(jī)的應(yīng)用中,這是只需要保留計(jì)算機(jī)處理的信息特征。如圖像識(shí)別。7.1.3圖像壓縮編碼分類

(CodingmethodsofImageCompression2、圖像壓縮編碼的具體方法(1)熵編碼:信息保持編碼;(2)預(yù)測(cè)法:信息保持編碼、保真度編碼(更常用);(3)變換法:特征保持編碼;(4)其他編碼法7.1.4壓縮技術(shù)的性能指標(biāo)(EvaluationIndexofImageCompressionapproaches)

1.壓縮比壓縮編碼的效率,通常用壓縮比來(lái)表示,它的定義為:

其中表示壓縮前圖像每像素的平均比特?cái)?shù),表示壓縮后每像素所需的平均比特?cái)?shù)。一般的情況下壓縮比c總是大于等于1的,c愈大則壓縮程度愈高。2.平均碼字長(zhǎng)度平均碼字長(zhǎng)度:設(shè)為數(shù)字圖像第k個(gè)碼字的長(zhǎng)度(編碼成二進(jìn)制碼的位數(shù))。其相應(yīng)出現(xiàn)的概率為,則該數(shù)字圖像所賦予的平均碼字長(zhǎng)度為:

單位為bit

7.1.4壓縮技術(shù)的性能指標(biāo)(EvaluationIndexofImagecompressionapproaches)

3.編碼效率在一般情況下,編碼效率往往可用下列簡(jiǎn)單公式表示:其中,H是原始圖像的熵,L是實(shí)際編碼圖像的平均碼字長(zhǎng)度。4.冗余度

R=1-

R越小,說(shuō)明可壓縮的余地越小。

7.1.4壓縮技術(shù)的性能指標(biāo)(EvaluationIndexofImagecompressionapproaches)

消除視覺(jué)冗余會(huì)導(dǎo)致一定量的視覺(jué)信息的丟失。因?yàn)榭赡軙?huì)由此失去重要的信息,所以迫切需要一種可重復(fù)對(duì)于丟失信息的性質(zhì)和范圍進(jìn)行定量評(píng)估的方法。作為這種評(píng)估基礎(chǔ)的兩種準(zhǔn)則是:(1)客觀保真度準(zhǔn)則(2)主觀保真度準(zhǔn)則

7.1.5保真度準(zhǔn)則(FidelityCriteria)

1.客觀保真度準(zhǔn)則

當(dāng)信息損失的程度可以表示成初始圖像以及經(jīng)過(guò)了壓縮后解壓的輸出圖像的函數(shù)時(shí),就說(shuō)是基于客觀保真度準(zhǔn)則的。常用均方根(rms)誤差表示。令表示輸入圖像,表示對(duì)輸入圖像壓縮、解壓縮后得到的的估值。其間誤差可以定義為:均方根誤差為:另一種客觀保真度準(zhǔn)則是解壓縮圖像的均方信噪比。

2.主觀保真度準(zhǔn)則

主觀評(píng)價(jià)是通過(guò)向典型的觀察者顯示典型的壓縮圖像并將他們的評(píng)估結(jié)果進(jìn)行平均得到的。值等級(jí)描述1極好具有極高品質(zhì)的圖像,和希望的一樣好2好高品質(zhì)的圖像,感覺(jué)良好,其中的干擾可以接受3過(guò)得去品質(zhì)不良的圖像,希望能得到改進(jìn)干擾在某種程度上難于接受4勉強(qiáng)可以品質(zhì)不良的圖像,希望能得到改進(jìn),干擾在某種程度上難于接受5差非常不好的圖像,但還可以看。有明顯不能接受的干擾6不可用差到無(wú)法觀看的圖像7.2無(wú)失真圖像壓縮編碼

(Losslessimagecompression)

無(wú)失真圖像壓縮編碼就是指圖像經(jīng)過(guò)壓縮、編碼后恢復(fù)的圖像與原圖像完全—樣,沒(méi)有任何失真.

常用的無(wú)失真圖像壓縮編碼有許多種。如哈夫曼(Huffman)編碼、游程編碼和算術(shù)編碼。7.2.1哈夫曼編碼(Huffmancoding)

哈夫曼編碼是根據(jù)可變長(zhǎng)最佳編碼定理,應(yīng)用哈夫曼算法而產(chǎn)生的一種編碼方法。

1.可變長(zhǎng)最佳編碼定理對(duì)于一個(gè)無(wú)記憶離散信源中每一個(gè)符號(hào),若采用相同長(zhǎng)度的不同碼字代表相應(yīng)符號(hào),就叫做等長(zhǎng)編碼。若對(duì)信源中的不同符號(hào)用不同長(zhǎng)度的碼字表示就叫做不等長(zhǎng)或變長(zhǎng)編碼。在變長(zhǎng)編碼中,對(duì)出現(xiàn)概率大的信息符號(hào)賦予短碼字,而對(duì)于出現(xiàn)概率小的信息符號(hào)賦予長(zhǎng)碼字。如果碼字長(zhǎng)度嚴(yán)格按照所對(duì)應(yīng)符號(hào)出現(xiàn)概率大小逆序排列,則編碼結(jié)果的平均碼字長(zhǎng)度一定小于任何其他排列形式。2.哈夫曼(Huffman)編碼的編碼思路哈夫曼于1952年提出了一種編碼方法,它完全依據(jù)信息源字符出現(xiàn)的概率大小來(lái)構(gòu)造碼字,這種編碼方法形成的平均碼字長(zhǎng)度最短。

實(shí)現(xiàn)哈夫曼編碼的基本步驟如下:(1)將信源符號(hào)出現(xiàn)的概率按由大到小的順序排列。

(2)將兩處最小的概率進(jìn)行組合相加,形成一個(gè)新概率。并按第(1)步方法重排,如此重復(fù)進(jìn)行直到只有兩個(gè)概率為止。

(3)分配碼字,碼字分配從最后一步開(kāi)始反向進(jìn)行,對(duì)最后兩個(gè)概率一個(gè)賦于“0”碼字,一個(gè)賦于“1”碼字。如此反向進(jìn)行到開(kāi)始的概率排列。7.2.1哈夫曼編碼(Huffmancoding)

舉例:設(shè)輸入圖像的灰度級(jí){y1,y2,y3,y4,y5,y6,y7,y8}出現(xiàn)的概率分別為0.40,0.18,0.10,0.10,0.07,0.06,0.05,0.04。試進(jìn)行哈夫曼編碼,并計(jì)算編碼效率、壓縮比、冗余度。按照上述的編碼過(guò)程和例題所給出的參數(shù),其哈夫曼編碼過(guò)程及其編碼的結(jié)果如圖7.6所示。7.2.1哈夫曼編碼(Huffmancoding)

圖7.6哈夫曼編碼過(guò)程7.2.1哈夫曼編碼(Huffmancoding)

圖像信源熵為:根據(jù)哈夫曼編碼過(guò)程圖所給出的結(jié)果,可以求出它的平均碼字長(zhǎng)度:7.2.1哈夫曼編碼(Huffmancoding)

編碼效率:

壓縮比:壓縮之前8個(gè)符號(hào)需3個(gè)比特量化,經(jīng)壓縮之后的平均碼字長(zhǎng)度為2.61,因此壓縮比為:冗余度為:7.2.1哈夫曼編碼(Huffmancoding)

3.哈夫曼(Huffman)編碼的特點(diǎn)(1)Huffman編碼所構(gòu)造的碼并不是唯一的,但其編碼效率是唯一的。(2)對(duì)不同信源,其編碼效率是不同的。(3)實(shí)現(xiàn)電路復(fù)雜,且存在誤碼傳播問(wèn)題。(4)Huffman編碼只能用近似的整數(shù)而不是理想的小數(shù)來(lái)表示單個(gè)符號(hào),這也是Huffman編碼無(wú)法達(dá)到最理想的壓縮效果的原因.7.2.1哈夫曼編碼(Huffmancoding)

7.2.2游程編碼(Run-lengthcoding)

某些圖像,特別是計(jì)算機(jī)生成的圖像往往包含許多顏色相同的塊。在這些塊中,許多連續(xù)的掃描行或者同一掃描行上有許多連續(xù)的像素都具有相同的顏色值。在這些情況下就不需要存儲(chǔ)每一個(gè)像素的顏色值,而是僅僅存儲(chǔ)一個(gè)像素值以及具有相同顏色的像素?cái)?shù)目,將這種編碼方法稱為行程編碼(Run-LengthEncoding,RLE),連續(xù)的具有相同顏色值的所有像素構(gòu)成一個(gè)行程。7.2.2游程編碼(Run-lengthcoding)

下面以二值圖像為例進(jìn)行說(shuō)明。二值圖像是指圖像中的像素值只有兩種值,即“0”和“1”,因而在圖像中這些符號(hào)會(huì)連續(xù)地出現(xiàn),例如已知一個(gè)二值序列00101110001001…,根據(jù)游程編碼的規(guī)則,可知其游程序列為21133121…。

可見(jiàn)圖像中具有相同灰度(或顏色)的圖像塊越大、越多,壓縮的效果就越好。反之當(dāng)圖像越復(fù)雜,即其中的顏色層次越多時(shí),則其壓縮效果越不好。

7.2.2游程編碼(Run-lengthcoding)

對(duì)于復(fù)雜的圖像,通常采用游程編碼與Huffman編碼的混合編碼方式,即首先進(jìn)行二值序列的游程編碼,然后根據(jù)“0”游程與“1”游程長(zhǎng)度的分布概率,再進(jìn)行Huffman編碼。游程編碼常用于二值圖像的壓縮,這種方法已經(jīng)被CCITT制定為標(biāo)準(zhǔn),主要是用于在公用電話網(wǎng)上傳真二值圖像。7.2.3算術(shù)編碼(Arithmeticcoding)

前面已經(jīng)說(shuō)明,Huffman編碼使用的是二進(jìn)制符號(hào)進(jìn)行編碼,這種方法在許多情況下無(wú)法得到最佳的壓縮效果。假設(shè)某個(gè)信息源符號(hào)出現(xiàn)的概率為85%,那么其自信息量為,其值為0.234?56,也就是說(shuō)用0.234?5位編碼就可以了。但是Huffman編碼只能分配一位0或一位1進(jìn)行編碼。由此可知,整個(gè)數(shù)據(jù)的85%的信息在Huffman編碼中用的是理想長(zhǎng)度4倍的碼字,其壓縮效果可想而知。算術(shù)編碼就能解決這個(gè)問(wèn)題,算術(shù)編碼在圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn)(如JPEG2000)中起到很重要的作用。7.2.3算術(shù)編碼(Arithmeticcoding)

算術(shù)編碼是一種從整個(gè)符號(hào)序列出發(fā),采用遞推形式連續(xù)編碼的方法。在算術(shù)編碼中,源符號(hào)和碼字間的一一對(duì)應(yīng)關(guān)系并不存在。不是將單個(gè)信息源符號(hào)映射成一個(gè)碼字,而是把整個(gè)信息源表示為實(shí)數(shù)線上的0~1之間的一個(gè)區(qū)間。隨著符號(hào)序列中的符號(hào)數(shù)量增加,用來(lái)代表它的區(qū)間減少而用來(lái)表達(dá)區(qū)間所需的信息單位的數(shù)量變大。與哈夫曼方法不同,這里不需要將每個(gè)信源符號(hào)轉(zhuǎn)換為整數(shù)個(gè)碼字(即1次編1個(gè)符號(hào)),所以在理論上它可達(dá)到無(wú)失真編碼定理給出的極限。

舉例:假設(shè)信源符號(hào)為X={00,01,10,11},其中各符號(hào)的概率為P(X)={0.1,0.4,0.2,0.3}。對(duì)這個(gè)信源進(jìn)行算法編碼的具體步驟如下:

1)已知符號(hào)的概率后,就可以沿著“概率線”為每個(gè)符號(hào)設(shè)定一個(gè)范圍:[0,0.1),[0.1,0.5),[0.5,0.7),[0.7,1.0)。把以上信息綜合到表7.1中。7.2.3算術(shù)編碼(Arithmeticcoding)

2)假如輸入的消息序列為:10、00、11、00、10、11、01,其算術(shù)編碼過(guò)程為:第一步:初始化時(shí),范圍range為1.0,低端值low為0。下一個(gè)范圍的低、高端值分別由下式計(jì)算:

其中等號(hào)右邊的range和low為上一個(gè)被編碼符號(hào)的范圍和低端值;range_low和range_high分別為被編碼符號(hào)已給定的出現(xiàn)概率范圍的低端值和高端值。7.2.3算術(shù)編碼(Arithmeticcoding)

對(duì)第一個(gè)信源符號(hào)10編碼:所以,信源符號(hào)10將區(qū)間

下一個(gè)信源符號(hào)的范圍為

第二步:對(duì)第二個(gè)信源符號(hào)00編碼:所以信源符號(hào)00將區(qū)間

下一個(gè)信源符號(hào)的范圍為

7.2.3算術(shù)編碼(Arithmeticcoding)

第三步:對(duì)第三個(gè)信源符號(hào)11編碼:所以信源符號(hào)11將區(qū)間

下一個(gè)信源符號(hào)的范圍為

第四步:對(duì)信源符號(hào)00編碼:下一個(gè)信源符號(hào)的范圍為。7.2.3算術(shù)編碼(Arithmeticcoding)

第五步:對(duì)第五個(gè)信源符號(hào)10編碼:所以,信源符號(hào)10將區(qū)間

下一個(gè)信源符號(hào)的范圍為

第六步:對(duì)第六個(gè)信源符號(hào)11編碼:所以,信源符號(hào)11將區(qū)間

7.2.3算術(shù)編碼(Arithmeticcoding)

下一個(gè)信源符號(hào)的范圍為

第七步:對(duì)第七個(gè)信源符號(hào)01編碼:所以,信源符號(hào)01將區(qū)間

最后從[0.5143876,0.514402]中選擇一個(gè)數(shù)作為編碼輸出,這里選擇0.5143876。7.2.3算術(shù)編碼(Arithmeticcoding)

綜上所述,算術(shù)編碼是從全序列出發(fā),采用遞推形式的一種連續(xù)編碼,使得每個(gè)序列對(duì)應(yīng)該區(qū)間內(nèi)一點(diǎn),也就是一個(gè)浮點(diǎn)小數(shù);這些點(diǎn)把[0,1)區(qū)間分成許多小段,每一段長(zhǎng)度則等于某序列的概率。再在段內(nèi)取一個(gè)浮點(diǎn)小數(shù),其長(zhǎng)度可與序列的概率匹配,從而達(dá)到高效的目的。7.2.3算術(shù)編碼(Arithmeticcoding)

解碼是編碼的逆過(guò)程,通過(guò)編碼最后的下標(biāo)界值0.5143876得到信源“10001100101101”是唯一的編碼。解碼操作過(guò)程綜合如下:7.2.3算術(shù)編碼(Arithmeticcoding)

從以上算術(shù)編碼算法可以看出,算術(shù)編碼具有以下特點(diǎn):1、由于實(shí)際的計(jì)算機(jī)精度不可能無(wú)限長(zhǎng),運(yùn)算中會(huì)出現(xiàn)溢出問(wèn)題。2、算術(shù)編碼器對(duì)整個(gè)消息只產(chǎn)生一個(gè)碼字,這個(gè)碼字是在[0,1)之間的一個(gè)實(shí)數(shù),因此譯碼器必須在接收到這個(gè)實(shí)數(shù)后才能譯碼。3、算術(shù)編碼也是一種對(duì)錯(cuò)誤很敏感的方法。7.2.3算術(shù)編碼(Arithmeticcoding)

7.3預(yù)測(cè)壓縮技術(shù)1)基本思想2)預(yù)測(cè)誤差的熵編碼3)DPCM預(yù)測(cè)編碼4)最佳線性預(yù)測(cè)5)有失真預(yù)測(cè)編碼6)最佳量化7.3預(yù)測(cè)壓縮技術(shù)1)基本思想圖像相鄰像素間存在很強(qiáng)的相關(guān)性,通過(guò)觀察其相鄰像素取值,可以預(yù)測(cè)一個(gè)像素的大概情況。預(yù)測(cè)值和實(shí)際值存在誤差,稱為預(yù)測(cè)誤差。預(yù)測(cè)誤差的方差必然比原圖像像素的方差小,因此對(duì)預(yù)測(cè)誤差進(jìn)行編碼必然壓縮其平均碼長(zhǎng)。對(duì)預(yù)測(cè)誤差進(jìn)行編碼的技術(shù)稱為DPCM(差分脈沖編碼調(diào)制)。7.3預(yù)測(cè)壓縮技術(shù)2)預(yù)測(cè)誤差的熵編碼對(duì)比一幅圖像和其差分圖像的標(biāo)準(zhǔn)差和熵。從Lenna和Bob的差分圖像的直方圖看:不同圖像的差分圖像直方圖分布形態(tài)大致相同,只是方差有所不同。7.3預(yù)測(cè)壓縮技術(shù)Lenna差分圖象7.3預(yù)測(cè)壓縮技術(shù)Bob差分圖象7.3預(yù)測(cè)壓縮技術(shù)3)DPCM預(yù)測(cè)編碼預(yù)測(cè)器的階數(shù)對(duì)當(dāng)前像素進(jìn)行預(yù)測(cè)的像素集合中的像素個(gè)數(shù),稱為預(yù)測(cè)器的階數(shù)。理論上預(yù)測(cè)器的階數(shù)越大越好,當(dāng)階數(shù)大于3時(shí)其性能的改變非常有限。預(yù)測(cè)器的系數(shù)如一個(gè)3階預(yù)測(cè)器中,各像素的權(quán)重稱為預(yù)測(cè)器的系數(shù)。其既可以固定不變,也可以變化。如何預(yù)測(cè)?7.3預(yù)測(cè)壓縮技術(shù)4)最佳線性預(yù)測(cè)目的:尋找使預(yù)測(cè)器的某種誤差函數(shù)為最小的線性預(yù)測(cè)器;準(zhǔn)則:均方預(yù)測(cè)誤差最小化。7.3預(yù)測(cè)壓縮技術(shù)最常用的一階DPCM編碼器在實(shí)際中最常用的是一階DPCM編碼器,此時(shí)有唯一的一個(gè)預(yù)測(cè)系數(shù)1。7.3預(yù)測(cè)壓縮技術(shù)為實(shí)現(xiàn)無(wú)失真編碼,通常對(duì)差分圖像進(jìn)行熵編碼(通常是Huffman編碼);預(yù)測(cè)誤差熵編碼的步驟:建立碼表和編碼。通常采用一個(gè)通用碼表,節(jié)省建立專用碼表時(shí)間,由此帶來(lái)壓縮比損失較?。痪幋a:若對(duì)差分圖像所有灰度建立碼表,則項(xiàng)數(shù)較多。通常對(duì)-16~16采用Huffman編碼,其他直接用前綴+實(shí)際灰度值。7.3預(yù)測(cè)壓縮技術(shù)采用同一掃描行中前幾個(gè)像素值進(jìn)行預(yù)測(cè),稱為一維預(yù)測(cè);采用同一行或前幾行像素值進(jìn)行預(yù)測(cè),稱為二維預(yù)測(cè);采用前幾行和前幾幀像素值進(jìn)行預(yù)測(cè),稱為三維預(yù)測(cè)。7.3預(yù)測(cè)壓縮技術(shù)5)有失真預(yù)測(cè)編碼由于預(yù)測(cè)誤差的方差遠(yuǎn)比像素取樣值小,因此需要對(duì)預(yù)測(cè)誤差重新量化。7.3預(yù)測(cè)壓縮技術(shù)由于量化器存在量化誤差,因此帶量化器的DPCM系統(tǒng)是有失真預(yù)測(cè)編碼。7.3預(yù)測(cè)壓縮技術(shù)6)最佳量化根據(jù)量化誤差的均方值最小原則設(shè)計(jì)。自適應(yīng)量化:將圖像分割為圖像方塊,按各自標(biāo)準(zhǔn)差進(jìn)行量化。但需要將各塊的方差編碼發(fā)送給接收端。另一種方法:將圖像方塊方差大小分為4類:平坦區(qū)域,紋理區(qū)域,緩變區(qū)域和陡峭區(qū)域。每一類方塊采用不同的量化器。

7.4變換壓縮技術(shù)1)基本概念將在空域上描述的圖像,經(jīng)過(guò)某種變換(通常采用傅立葉變換,沃爾什變換等),在某種變換域里進(jìn)行描述。在變換域里,首先降低了圖像的相關(guān)性;其次通過(guò)某種圖像處理(如頻域的二維濾波)以及熵編碼,則可進(jìn)一步壓縮圖像的編碼比特率。7.4變換壓縮技術(shù)2)變換壓縮原

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論