第四章多媒體數(shù)據(jù)壓縮編碼技術(shù)

上傳人：1*** IP屬地：湖北上傳時(shí)間：2022-04-29 格式：PPT 頁(yè)數(shù)：105 大?。?.07MB 積分：28 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩100頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、要點(diǎn)：1、多媒體數(shù)據(jù)壓縮編碼的重要性和分類；2、常用壓縮編碼的基本原理即實(shí)現(xiàn)技術(shù)，統(tǒng)計(jì)編碼、算術(shù)編碼、預(yù)測(cè)編碼、變換編碼（K-L變換，DCT變換）3、量化的基本原理和量化器的設(shè)計(jì)思想。4、靜態(tài)圖像壓縮編碼的國(guó)際標(biāo)準(zhǔn)（JPEG）的原理及實(shí)現(xiàn)技術(shù)，動(dòng)態(tài)圖像壓縮編碼國(guó)際標(biāo)準(zhǔn)（MPEG）的基本原理。4.1 多媒體數(shù)據(jù)壓縮的重要性與分類多媒體數(shù)據(jù)壓縮的重要性與分類多媒體技術(shù)最大難題是海量數(shù)據(jù)存儲(chǔ)與傳送電視信號(hào)、傳輸電視信號(hào)數(shù)字化后的數(shù)據(jù)量。那么數(shù)據(jù)量是否等于信息量？例如：一個(gè)512512分辨率的一分鐘視頻需要如下的存儲(chǔ)容量：512 512 8 3=6291456=6.3M bit/s 6.3 30幀

2、/s =188M bit/s 188/8 = 23.5MByte/s 那么一張650MByte的光盤(pán)就只能存儲(chǔ) 650M byte 硬盤(pán)/23.5M bytes/s = 27.5秒例如：語(yǔ)音信號(hào)，正常人談話音頻20Hz4KHz，采樣定理,精度為8位，人類語(yǔ)言帶寬為4KHz，則 4K 2 8 =64Kbit/s = 8Kbyte/s 與圖像相比: 23.5M/8K=3000倍。所以必須進(jìn)行壓縮。知識(shí)：信息量與數(shù)據(jù)量的關(guān)系：知識(shí)：信息量與數(shù)據(jù)量的關(guān)系： wI = D - duwI 信息量wD數(shù)據(jù)量wdu冗余量1du在平時(shí)說(shuō)話時(shí)是大量存在的。2中文廣播員一分鐘讀180個(gè)漢字,一個(gè)漢字兩個(gè)字節(jié), 3

3、60個(gè)Byte 。采樣1分鐘,8K 60 = 480 K Byte/分 480 K byte / 360 byte = 1000倍的冗余3中文百科全書(shū)掃描進(jìn)入計(jì)算機(jī)冗余更大。4圖像信息、視頻信息的冗余就更大了。一、為什么要進(jìn)行數(shù)據(jù)壓縮？一、為什么要進(jìn)行數(shù)據(jù)壓縮？（1）多媒體信息包括文本、數(shù)據(jù)、聲音、動(dòng)畫(huà)、圖形以及視頻等多種媒體信息，經(jīng)過(guò)數(shù)字化處理后其數(shù)據(jù)量非常大，如果不進(jìn)行數(shù)據(jù)壓縮處理，計(jì)算機(jī)系統(tǒng)就無(wú)法對(duì)它進(jìn)行存儲(chǔ)和交換；（2）多媒體信息中的圖像、音頻和視頻這些媒體具有很大的壓縮潛力。因?yàn)檫@些數(shù)據(jù)中存在著空間冗余、時(shí)間冗余、結(jié)構(gòu)冗余、視覺(jué)冗余、圖像區(qū)域的相同性冗余、紋理的統(tǒng)計(jì)冗余等，它們?yōu)?/p>

4、數(shù)據(jù)壓縮技術(shù)的應(yīng)用提供了可能的條件。（3）數(shù)據(jù)壓縮是以一定的質(zhì)量損失為容限，質(zhì)量損失一般在人眼允許的誤差范圍之內(nèi)，壓縮前后的圖像如果不作詳細(xì)的觀察很難覺(jué)察出兩者的差別。（4）壓縮處理一般由兩個(gè)過(guò)程組成：一是編碼過(guò)程，即將原始數(shù)據(jù)經(jīng)過(guò)編碼再進(jìn)行壓縮，以便于存儲(chǔ)和傳輸；二是解碼過(guò)程，即將編碼數(shù)據(jù)還原為可使用的數(shù)據(jù)。二、多媒體數(shù)據(jù)壓縮編碼可能性（冗二、多媒體數(shù)據(jù)壓縮編碼可能性（冗余性）余性）為什么能壓縮為什么能壓縮圖像信息之所以能進(jìn)行壓縮是因?yàn)樾畔⒈旧硗ǔ４鎴D像信息之所以能進(jìn)行壓縮是因?yàn)樾畔⒈旧硗ǔ４嬖诤艽蟮娜哂嗔吭诤艽蟮娜哂嗔?1.空間冗余例: 圖象中的“A”是一個(gè)規(guī)則物體。光的亮度、飽和度及

5、顏色都一樣，因此，數(shù)據(jù)A有很大的冗余。 2.時(shí)間冗余例: 序列圖象。（相鄰畫(huà)面的背景和移動(dòng)畫(huà)面）以上面的視頻連續(xù)畫(huà)面為例，它的每一幀畫(huà)面是由若干個(gè)像素組成的，因?yàn)閯?dòng)態(tài)圖像通常反映的是一個(gè)連續(xù)的過(guò)程，它的相鄰的幀之間存在著很大的相關(guān)性，從一幅畫(huà)面到下一幅畫(huà)面，背景與前景就可以沒(méi)有太多的變化。也就是說(shuō)，連續(xù)多幀畫(huà)面在很大程度上是相似的，而這些相似的信息(或稱作冗余信息)為數(shù)據(jù)的壓縮提供了基礎(chǔ)。二、多媒體數(shù)據(jù)壓縮編碼可能性（冗余性）二、多媒體數(shù)據(jù)壓縮編碼可能性（冗余性）3.信息熵冗余 l 信息量：指從N個(gè)相等的可能事件中選出一個(gè)事件所需要的信息度量和含量。 l 信息熵：指一團(tuán)數(shù)據(jù)所帶的信息量

6、，平均信息量就是信息熵（entropy）。例如:從64個(gè)數(shù)中選出某一個(gè)數(shù),可先問(wèn)“是否大于32?”消除半數(shù)的可能,這樣只要6次就可選出某數(shù)。這是因?yàn)槊刻釂?wèn)一次都會(huì)得到1比特的信息量。因此，在64個(gè)數(shù)中選定某一數(shù)所需的信息量是 log2 64=6(bits) 。設(shè)從N個(gè)數(shù)中選任意一個(gè)數(shù)X的概率為 P(x)，假定選定任意一個(gè)數(shù)的概率都相等，P(x)= 1/N，因此定義信息量：I(xI(x)=log)=log2 2N= -logN= -log2 2(1/N)= -log(1/N)= -log2 2P(x)=IP(xP(x)=IP(x) )二、多媒體數(shù)據(jù)壓縮編碼可能性（冗二、多媒體數(shù)據(jù)壓縮編碼可能

7、性（冗余性）余性） 4.結(jié)構(gòu)冗余 v 圖象有非常強(qiáng)的紋理結(jié)構(gòu)。 v 如草席圖結(jié)構(gòu)上存在冗余。 5.知識(shí)冗余 q 圖像的理解與某些基礎(chǔ)知識(shí)有關(guān)。 q 例:人臉的圖像有同樣的結(jié)構(gòu)：嘴的上方有鼻子，鼻子上方有眼睛，鼻子在中線上 6.視覺(jué)冗余視覺(jué)冗余是非均勻、非線性的。例:人類視覺(jué)分辨率為2 ，但常數(shù)2就是數(shù)據(jù)冗余。二、數(shù)據(jù)壓縮方法的分類二、數(shù)據(jù)壓縮方法的分類常用壓縮編碼分為兩大類：常用壓縮編碼分為兩大類：一類是冗余壓縮法；也稱無(wú)損壓縮或無(wú)失真壓縮；它是為保留原始多媒體對(duì)象（包括圖像、語(yǔ)音和視頻）而設(shè)計(jì)的。在無(wú)損壓縮中，數(shù)據(jù)在壓縮或解壓縮過(guò)程中不會(huì)改變或損失，解壓縮產(chǎn)生的數(shù)據(jù)是對(duì)原始對(duì)象的完

8、整復(fù)制。二類是熵壓縮法；也稱有損壓縮或有失真壓縮當(dāng)圖像的冗余度很少（即同類像素重復(fù)性很?。r(shí)，用無(wú)損壓縮技術(shù)不能得到可接受的結(jié)果，這時(shí)就要采用有損壓縮。有損壓縮會(huì)造成一些信息的損失，關(guān)鍵問(wèn)題是看這種損失對(duì)圖像質(zhì)量帶來(lái)的影響。只要這種損失被限制在允許的范圍內(nèi)，有損壓縮就是可接受的。有損壓縮技術(shù)主要的應(yīng)用領(lǐng)域是在影像節(jié)目、可視電話會(huì)議和多媒體網(wǎng)絡(luò)這樣的由音頻、彩色圖像和視頻組成的多媒體應(yīng)用中，并且得到了廣泛的應(yīng)用。影響數(shù)據(jù)壓縮的幾個(gè)要素u一個(gè)好的壓縮方法對(duì)多媒體信息的存儲(chǔ)和傳輸是至關(guān)重要的，影響壓縮性能的主要指標(biāo)有：壓縮比壓縮比對(duì)壓縮前后的文件大小和數(shù)據(jù)量進(jìn)行比較，作為壓縮率的衡量指標(biāo)。

9、人們普遍希望壓縮的倍數(shù)越高越好，壓縮的速度越快越好，并且希望壓縮所耗費(fèi)的資源、時(shí)間對(duì)用戶來(lái)講是透明的。但同時(shí)人們又希望確保數(shù)據(jù)壓縮的精度，即壓縮完了以后，解壓縮的數(shù)據(jù)和原來(lái)的數(shù)據(jù)最好沒(méi)有什么差別，沒(méi)有什么數(shù)據(jù)損失。然而追求壓縮比率和追求精度往往是矛盾的，因此就需要在這兩者之間權(quán)衡取舍。圖像質(zhì)量圖像質(zhì)量雖然有損壓縮可獲得較大的壓縮比，但壓縮比過(guò)高，還原后的圖像質(zhì)量就可能降低。圖像質(zhì)量的評(píng)估法常采用客觀評(píng)估和主觀評(píng)估兩種方法。客觀評(píng)估則是通過(guò)一種具體的算法來(lái)統(tǒng)計(jì)多媒體數(shù)據(jù)壓縮結(jié)果的損失。例如采用純誤差測(cè)度，即原始圖像與恢復(fù)圖像之間的簡(jiǎn)單數(shù)學(xué)統(tǒng)計(jì)差別。盡管這種方法將誤差量化表達(dá)，但并不能反映觀

10、察者對(duì)誤差的視覺(jué)感知。主觀評(píng)估基于人的視覺(jué)感知，因?yàn)橛^察者作為最終視覺(jué)信宿，他們能對(duì)恢復(fù)圖像的質(zhì)量作出直觀的判斷。方法之一是進(jìn)行主觀測(cè)試，讓觀察者通過(guò)觀測(cè)一系列恢復(fù)圖像，并與原圖像進(jìn)行比較，再根據(jù)損傷的可見(jiàn)程度進(jìn)行評(píng)級(jí)，以判斷哪種壓縮方法的失真少。壓縮與解壓縮的速度壓縮與解壓縮的速度壓縮和解壓縮的速度是壓縮系統(tǒng)的兩項(xiàng)單獨(dú)的性能度量。在有些應(yīng)用中，壓縮和解壓縮都需要實(shí)時(shí)進(jìn)行，如電視會(huì)議的圖像傳輸。在有些應(yīng)用中，壓縮可以用非實(shí)時(shí)壓縮，而只要解壓縮是實(shí)時(shí)的，這種壓縮稱為非對(duì)稱壓縮，如多媒體CD-ROM的節(jié)目制作。從目前開(kāi)發(fā)的壓縮技術(shù)來(lái)看，一般壓縮的計(jì)算量比解壓縮要大。壓縮的速度不僅與采用的壓縮

11、方法有關(guān)，而且與快速算法的計(jì)算量有關(guān)，如果在算法上有較大的突破，無(wú)疑將對(duì)多媒體的開(kāi)發(fā)與應(yīng)用產(chǎn)生很大的影響。執(zhí)行的硬件與軟件執(zhí)行的硬件與軟件采用什么樣的硬件與軟件去執(zhí)行壓縮/解壓縮，與采用壓縮方案和算法的復(fù)雜程度有著密切的關(guān)系。設(shè)計(jì)精巧的簡(jiǎn)單算法可以在簡(jiǎn)單的硬件上執(zhí)行，且執(zhí)行速度很快。而設(shè)計(jì)復(fù)雜的算法需要在功能強(qiáng)大的硬件和軟件的支持下才能運(yùn)行。但僅靠算法來(lái)提高壓縮/解壓縮的速度還是有限的。在大多數(shù)情況下，不得不依靠硬件本身提供的功能去完成，例如采用專用多媒體處理芯片。因此在壓縮/解壓縮系統(tǒng)中，速度和硬件之間的選擇就顯得十分重要。二、數(shù)據(jù)壓縮方法的分類二、數(shù)據(jù)壓縮方法的分類按編碼算法原理分:

12、(1) 預(yù)測(cè)編碼 (2) 變換編碼 (3) 量化與向量量化編碼 (4) 信息熵編碼 (5) 子帶編碼 (6) 結(jié)構(gòu)編碼 (7) 基于知識(shí)的編碼圖像壓縮編碼分類的一般方法圖像壓縮編碼分類的一般方法4.2.1 量化原理量化處理是使數(shù)據(jù)比特率下降的一個(gè)強(qiáng)有力的措施。脈沖編碼調(diào)制（PCM）的量化處理是采樣之后進(jìn)行，從理論分析的角度，圖像灰度值是連續(xù)的數(shù)值，而我們通常看到的是以（0255）的整數(shù)表示圖像灰度，這是經(jīng)A/D變換后的以256級(jí)灰度分層量化處理了的離散數(shù)值，這樣可以用log2256=8比特表示一個(gè)圖像像素的灰度值，或色差信號(hào)值。 4.2 量化數(shù)據(jù)壓縮編碼中的量化處理，不是指A/D變換后的

13、量化，而是指以PCM碼作為輸入，經(jīng)正交變換、差分、或預(yù)測(cè)處理后，熵編碼之前，對(duì)正交變換系數(shù)、差值或預(yù)測(cè)誤差的量化處理。量化輸入值的動(dòng)態(tài)范圍很大，需要很多的比特?cái)?shù)表示一個(gè)數(shù)值，量化輸出只能取有限個(gè)整數(shù)，稱作量化級(jí)，希望量化后的數(shù)值用較少的比特?cái)?shù)便可表示。每個(gè)量化輸入被強(qiáng)行歸到與其接近的某個(gè)輸出，即量化到某個(gè)級(jí)。量化處理總是把一批輸入，量化到一個(gè)輸出級(jí)上，所以量化處理是一個(gè)多對(duì)一的處理過(guò)程，是個(gè)不可逆過(guò)程，量化處理中有信息丟失，或者說(shuō)，會(huì)引起量化誤差（量化噪聲）。4.2.2 4.2.2 標(biāo)量量化器的設(shè)計(jì)標(biāo)量量化器的設(shè)計(jì) 量化器的設(shè)計(jì)要求量化器的設(shè)計(jì)要求通常設(shè)計(jì)量化器有下述兩種情況：通常設(shè)計(jì)量化器

14、有下述兩種情況：給定量化分層級(jí)數(shù)，滿足量化誤差最小。給定量化分層級(jí)數(shù)，滿足量化誤差最小。限定量化誤差，確定分層級(jí)數(shù)，滿足以盡限定量化誤差，確定分層級(jí)數(shù)，滿足以盡量小的平均比特?cái)?shù)，表示量化輸出。量小的平均比特?cái)?shù)，表示量化輸出。量化方法有標(biāo)量量化和矢量量化之分，標(biāo)量化方法有標(biāo)量量化和矢量量化之分，標(biāo)量量化又可分為，均勻量化、非均勻量化量量化又可分為，均勻量化、非均勻量化和自適應(yīng)量化。和自適應(yīng)量化。 4.2.3 4.2.3 矢量量化矢量量化 w 矢量量化編碼是近年來(lái)圖像、語(yǔ)音信號(hào)編碼技術(shù)中頗為流行的一種新型量化編碼方法。矢量量化編碼方法一般是有失真編碼方法。矢量量化的名字是相對(duì)于標(biāo)量量化而提出

15、的。對(duì)于PCM數(shù)據(jù)，一個(gè)數(shù)一個(gè)數(shù)地進(jìn)行量化叫標(biāo)量量化。若對(duì)這些數(shù)據(jù)分組，每組K個(gè)數(shù)構(gòu)成一個(gè)K維矢量，然后以矢量為單元，逐個(gè)矢量進(jìn)行量化，稱矢量量化。 w 矢量量化編碼解碼框圖 (P105圖4.5)4.3.1 4.3.1 統(tǒng)計(jì)編碼原理統(tǒng)計(jì)編碼原理在討論數(shù)據(jù)壓縮的時(shí)候，需要涉及現(xiàn)代科學(xué)領(lǐng)域的一個(gè)重要分支信息論。信息論有關(guān)信息熵的概念對(duì)數(shù)據(jù)壓縮有著重要的指導(dǎo)意義，它一方面給出了數(shù)據(jù)壓縮的理論極限，另一方面又指明了數(shù)據(jù)壓縮的技術(shù)途徑。現(xiàn)代信息論的創(chuàng)始人香農(nóng)（C.E Shannon）在他發(fā)表的著名論文通信的數(shù)學(xué)理論中，從研究通信系統(tǒng)傳輸?shù)膶?shí)質(zhì)出發(fā)，對(duì)信息作了科學(xué)的定義，并進(jìn)行了定性和定量的描述。香農(nóng)

16、認(rèn)為：信息是有秩序的量度，是人們對(duì)事物了解的不確定性的消除或減少。信息是對(duì)組織程度的一種測(cè)度，信息能使物質(zhì)系統(tǒng)有序性增強(qiáng)，減少破壞、混亂和噪音。香農(nóng)提出：信息的傳播過(guò)程是“信源”（信息的發(fā)送者）把要提供的信息經(jīng)過(guò)“信道”傳遞給“信宿”（信息的接收者），信宿接收這些經(jīng)過(guò)“譯碼”（即解釋符號(hào)）的信息符號(hào)的過(guò)程。并由此建立了通信系統(tǒng)模型。我們從一則消息中獲得了信息，那么我們獲得的信息有多少呢？量度信息多少的測(cè)度就是信息量。信息的度量反映了人們對(duì)于信息的定量認(rèn)識(shí)。根據(jù)香農(nóng)的有關(guān)信息的定義，信息如何測(cè)度呢？顯然，信息量與不確定性消除程度有關(guān)。消除多少不確定性，就獲得多少信息量。用數(shù)學(xué)的語(yǔ)言來(lái)講，不

17、確定就是隨機(jī)性。不確定性的大小可以直觀地看成是事先猜測(cè)某隨機(jī)事件是否發(fā)生的難易程度。4.3.1 4.3.1 統(tǒng)計(jì)編碼原理統(tǒng)計(jì)編碼原理信息量和信息熵信息量和信息熵圖像的概率分布、信息量和信息熵之間有什么關(guān)系？在圖像編碼壓縮理論研究中，為什么要引入信息論中“熵”值的概念，有什么重要意義？這是我們下面需要說(shuō)明的問(wèn)題。現(xiàn)以一個(gè)信源編碼器模型來(lái)說(shuō)明其中其中 X X是消息集是消息集, , 由幾個(gè)信號(hào)單元由幾個(gè)信號(hào)單元xjxj構(gòu)成（構(gòu)成（j=1,2,j=1,2,n,n） Z Z是輸出集，由幾個(gè)碼字是輸出集，由幾個(gè)碼字zjzj構(gòu)成（構(gòu)成（j=1,2,j=1,2,n,n），），zjzj與與xjxj一一一一

18、對(duì)應(yīng)。對(duì)應(yīng)。 AmAm是符號(hào)集，由是符號(hào)集，由m m個(gè)碼元個(gè)碼元aiai構(gòu)成構(gòu)成(i=1,2,(i=1,2,m),m)，符號(hào)集中的碼，符號(hào)集中的碼元組成輸出碼字。元組成輸出碼字。 1.信息:是用不確定性的量度定義的。 2.信息量:從N個(gè)相等可能事件中選出一個(gè)事件所需要的信息度量或含量。 3.熵:如果將信源所有可能事件信息量進(jìn)行平均就得到信息的熵(熵就是平均信息量)。 (1). 信源均含有的平均信息量(熵),就是進(jìn)行無(wú)失真編碼的理論極限。 (2). 信源中或多或少的含有自然冗余。 (3). 則信息源X的熵為: 信息量和信息熵信息量和信息熵信息熵H（X）其中，I（Xj）為log2N=-log2（1

19、/n）=-log2P（x）=IP(X) 取以 2為底：公式2Shannon 論文論文傳輸包括: (1). 傳輸所需要的信息。 (2). 以任意小的失真或零失真接收這些信息。已經(jīng)證明：只要符號(hào)速率不超過(guò)信道容量C符號(hào)可以以任意小的差錯(cuò)概率向該信道中傳輸。另外幾種典型的方法是: Fans, Huffman,編碼方法定理,變字長(zhǎng)編碼,最佳編碼定理。變字長(zhǎng)編碼定理變字長(zhǎng)編碼定理: 在變字長(zhǎng)編碼中，對(duì)于出現(xiàn)概率大的信息符號(hào)，編以短字長(zhǎng)的碼,對(duì)于出現(xiàn)概率小的信息符號(hào)編以長(zhǎng)字長(zhǎng)的碼，如果碼字長(zhǎng)度嚴(yán)格按照符號(hào)概率的大小的相反順序排列，則平均碼字長(zhǎng)一定小于按任何其他符號(hào)順序排列方式得到的碼字長(zhǎng)度。證明

20、:最佳的平均碼字長(zhǎng)度: 公式其中：其中：P(aiP(ai) )是信源符號(hào)是信源符號(hào)ai ai出現(xiàn)的概率；出現(xiàn)的概率； ni是符號(hào)是符號(hào)ai的編碼長(zhǎng)度。的編碼長(zhǎng)度。根據(jù)編碼方法定義規(guī)定：根據(jù)編碼方法定義規(guī)定： P(ai)=P(as) nins 如果將如果將ai 的碼字與的碼字與as的碼字互換，則的碼字互換，則: 公式公式熵、熵編碼原理、變字長(zhǎng)編碼最佳編碼定理。熵、熵編碼原理、變字長(zhǎng)編碼最佳編碼定理。 (二二). Huffman就是利用了這個(gè)定理就是利用了這個(gè)定理進(jìn)行編碼。進(jìn)行編碼。 (1). 把信源符號(hào)按概率大小順序排列，并設(shè)法按逆次序分配碼字的長(zhǎng)度。 (2). 在分配碼字長(zhǎng)度時(shí)，首先將出

21、現(xiàn)概率最小的兩個(gè)符號(hào)的概率相加合成一個(gè)概率。 (3). 把這個(gè)合成概率看成是一個(gè)新組合符號(hào)地概率，重復(fù)上述做法直到最后只剩下兩個(gè)符號(hào)概率為止。 (4). 完成以上概率順序排列后，再反過(guò)來(lái)逐步向前進(jìn)行編碼，每一次有三個(gè)分支各賦予一個(gè)二進(jìn)制碼，可以對(duì)概率大的賦為零，概率小的賦為1。 4.3.2 哈夫曼編碼 Huffman 編碼就是利用變字長(zhǎng)最佳編碼實(shí)現(xiàn)信源符號(hào)按概率大小順序排列。（1）先將信源符號(hào)按概率大小順序排列（2）出現(xiàn)概率最小的兩個(gè)符號(hào)概率相加合成一個(gè)概率。（3）將合成概率看成一個(gè)新組合符號(hào)概率，重復(fù)上述做法，直到最后只剩下兩個(gè)符號(hào)概率為止。（4）反過(guò)來(lái)逐步向前編碼，每一步有兩個(gè)

22、分支各賦予一個(gè)二進(jìn)制碼，可以對(duì)概率大的編碼為0。 Huffman 編碼舉例編碼舉例例如例如：信源有四個(gè)符號(hào)： X a1 a2 a3 a4 1/2 1/4 1/8 1/8 信息熵： H(x)= -1/2log2(1/2)-1/4log2 (1/4)-(1/8log2 (1/8) 2 = 1. .75 bit/字符采用三元（二進(jìn)制編碼） a1 a2 a3 a4 0 10 110 111 平均碼長(zhǎng)：L= (1/2) 1+(1/4) 2+(1/8) （3+3） = 1.75 bit/字符字符 Huffman 編碼樹(shù)編碼樹(shù)a1a2a3a41/21/41/81/81/41/21000111a1a2a

23、3a4010110111L(a1)=1L(a2)=2L(a3)=3L(a4)=3 編碼效率編碼效率編碼效率：=1.75/1.75=100% 4個(gè)符號(hào) PCM編碼： R= log24=2 bit a1 a2 a3 a4 00 01 10 11 L=2 Pi = 2 編碼效率： =H(x)/L=1.75/2=87.5% Huffman 編碼字長(zhǎng)參差不齊 Huffman編碼在信源編碼概率分布不均勻時(shí)效率高，所以效率比較均勻時(shí)，不用Huffman編碼。 Huffman編碼表省缺。好處：解決對(duì)稱性，降低了編碼時(shí)間。概率統(tǒng)計(jì)和Huffman編碼一般不對(duì)稱 4.3.3 4.3.3 算術(shù)編碼算術(shù)編碼1

24、、基本原理算術(shù)編碼方法是將被編碼的信息表示成實(shí)數(shù)0和1之間的一個(gè)間隔。信息越長(zhǎng)編碼表示它的間隙就越小，表示這一間隙所需二進(jìn)制位就越多，大概率符號(hào)出現(xiàn)的概率越大對(duì)應(yīng)于區(qū)間愈寬，可用長(zhǎng)度較短的碼字表示；小概率符號(hào)出現(xiàn)概率越小區(qū)間愈窄，需要較長(zhǎng)碼字表示。信息源中連續(xù)的符號(hào)根據(jù)某一模式生成概率的大小來(lái)減少間隔?？赡艹霈F(xiàn)的符號(hào)要比不太可能出現(xiàn)的符號(hào)減少范圍少，因此只增加了較少的比特位。 Huffman 編碼使用整數(shù)個(gè)二進(jìn)制位對(duì)符號(hào)進(jìn)行編碼，這種方法在許多情況下無(wú)法得到最優(yōu)的壓縮效果。假設(shè)某個(gè)字符的出現(xiàn)概率為 80%，該字符事實(shí)上只需要 -log2(0.8) = 0.322 位編碼，但 Huffman

25、編碼一定會(huì)為其分配一位 0 或一位 1 的編碼?？梢韵胂?，整個(gè)信息的 80% 在壓縮后都幾乎相當(dāng)于理想長(zhǎng)度的 3 倍左右，壓縮效果可想而知。算術(shù)編碼對(duì)整條信息（無(wú)論信息有多么長(zhǎng)），其輸出僅僅是一個(gè)數(shù)，而且是一個(gè)介于 0 和 1 之間的二進(jìn)制小數(shù)。例如算術(shù)編碼對(duì)某條信息的輸出為 1010001111，那么它表示小數(shù) 0.1010001111，也即十進(jìn)制數(shù) 0.64。 2、自適應(yīng)二進(jìn)制算術(shù)編碼、自適應(yīng)二進(jìn)制算術(shù)編碼（1）基本工作原理設(shè)編碼初始化子區(qū)間為0，1設(shè) 大概率 Pe MPS（Most Probable Symbol）小概率Qe LPS （Least Probable Symbol

26、） Pe=1-Qe 編碼時(shí)，設(shè)置兩個(gè)專用寄存器（C，A）初始時(shí)：令 C 寄存器的值為子區(qū)域的起始位置 A 寄存器的值為子區(qū)域的寬度 (該寬度恰好是已輸入符號(hào)串的概率) 初始化時(shí)：C=0 A=1 隨著被編碼數(shù)據(jù)源輸入，C和A的內(nèi)容按以下規(guī)律修正：當(dāng)?shù)透怕史?hào)LPS到來(lái)時(shí)： C=C C=C A=AQe A=AQe 當(dāng)高概率符號(hào)MPS到來(lái)時(shí)： C=C+AQeC=C+AQe A=APe A=APe=A=A（1-Qe1-Qe）舉例舉例例: 碼字表示字符串： 11011111 0 為 LPS Qe= 1/8 =（0.001）b 1 為MPS Pe= 7/8 =（0.111）b 初始狀態(tài)： C=0

27、子區(qū)間起始位置 A=1 子區(qū)域?qū)挾?w 頭頭 0.01010.0101尾尾 w 傳送碼字為 0101 0 為 LPS Qe= 1/8 =（0.001）b 1 為 MPS Pe= 7/8 =（0.111）b 設(shè)Qe=1/8，Pe=7/8符號(hào)0的區(qū)間左端為0，1/8,符號(hào)1的區(qū)間為(1/8，1)符號(hào)“0”的子區(qū)間左端為B=0，長(zhǎng)度為L(zhǎng)=1/8；符號(hào)“1”的子區(qū)間左端為B=1/8，長(zhǎng)度為L(zhǎng)=7/8初始狀態(tài)： C=0 子區(qū)間起始位置 A=1 子區(qū)間寬度即初始子區(qū)間為0，1， 0X1w編碼算法過(guò)程如下：w 步序信源符號(hào) C Aw 1 1 1/8 7/8w 2 1 1/8+1/87/8=15/64 7

28、/87/8=49/64w 3 0 15/64+049/64=15/64 49/641/8=49/512w 4 1 15/64+1/849/512=1009/4096 49/5127/8=343/4096算術(shù)編碼原理圖(P113圖4.11)解碼解碼解碼：按 Qe Pe分成兩個(gè)子區(qū)間，判斷被解碼的碼字落在哪個(gè)區(qū)間，并賦予對(duì)應(yīng)符號(hào)：設(shè) c=（0.0101） b 是被解碼的值初始值 A=1 Qe=0.001 當(dāng)c落在0-QeA之間，解碼符號(hào)為 D=0； C=C A=QeA ；當(dāng)c落在Qe A -A之間，解碼符號(hào)為D=1； C=C-QeA； A=A（1-Qe）算術(shù)編碼的特點(diǎn)：算術(shù)編碼的特點(diǎn)： (

29、1) 不需要碼表； (2) 當(dāng)信源概率比較接近時(shí)，建議使用算術(shù)編碼。 (3) JPEG成員對(duì)多幅圖進(jìn)行算術(shù)編碼效率可以提高5%。JPEG擴(kuò)展系統(tǒng)用算術(shù)編碼代替Huffman。 4.44.4預(yù)測(cè)編碼預(yù)測(cè)編碼4.4.1 4.4.1 基本原理基本原理預(yù)測(cè)編碼是數(shù)據(jù)壓縮理論的一個(gè)重要分支。它根據(jù)離散信號(hào)之間存在一定相關(guān)性的特點(diǎn)，利用前面的一個(gè)或多個(gè)信號(hào)對(duì)下一個(gè)信號(hào)進(jìn)行預(yù)測(cè)，然后對(duì)實(shí)際值和預(yù)測(cè)值的差(預(yù)測(cè)誤差）進(jìn)行編碼。如果預(yù)測(cè)比較準(zhǔn)確，那么誤差信號(hào)就會(huì)很小，就可以用較少的碼位進(jìn)行編碼，以達(dá)到數(shù)據(jù)壓縮的目的。第n個(gè)符號(hào)Xn的熵滿足：所以參與預(yù)測(cè)的符號(hào)越多，預(yù)測(cè)就越準(zhǔn)確，該信源的不確定性就越小，數(shù)碼率就可

30、以降低。4.4.2 DPCM4.4.2 DPCM和和ADPCMADPCM 一、DPCM 差分脈沖編碼調(diào)制 DPCM 編/解碼原理圖(下頁(yè)）1.預(yù)測(cè)器的設(shè)計(jì) 2. ADPCM自適應(yīng)預(yù)測(cè)編碼這種編碼方法中，量化器的步長(zhǎng)和預(yù)測(cè)器的參數(shù)均能根據(jù)圖象的局部特征作自適應(yīng)的調(diào)整。 3.ADPCM的分類 ADPCM分成兩類: (1)線性自適應(yīng)預(yù)測(cè)器 Yamada（1977年）提出了二維DPCM自適應(yīng)預(yù)測(cè)方案。 (2) 非線性自適應(yīng)預(yù)測(cè)器引進(jìn)幾個(gè)和臨近象素有關(guān)的值，入i和di非線性改變預(yù)測(cè)的數(shù)。所以，叫非線性的自適應(yīng)預(yù)測(cè)。DPCM DPCM 編編/ /解碼原理圖解碼原理圖輸入輸入輸出輸出 f (i, j)量

31、化器量化器編碼器編碼器預(yù)測(cè)器預(yù)測(cè)器解碼器解碼器預(yù)測(cè)器預(yù)測(cè)器信信道道傳傳輸輸 e (i, j) f (i, j) f (i, j) f (i, j) f (i, j) f (i, j) e (i, j) e (i, j)預(yù)測(cè)方程式預(yù)測(cè)方程式線性預(yù)測(cè)：如果ai是常數(shù)，則為時(shí)不變線性預(yù)測(cè)，否則為自適應(yīng)線性預(yù)測(cè)（ADPCM）最簡(jiǎn)單的預(yù)測(cè)方程：11)(kiiikxkax),.,(1321kxxxxfxkk1kkxx最佳線性預(yù)測(cè)最佳線性預(yù)測(cè)使誤差函數(shù)達(dá)到最小值的預(yù)測(cè)方程式叫做最佳線性預(yù)測(cè)。求最佳線性預(yù)測(cè)的各個(gè)參數(shù)ai，列方程組：2)(nnxxEmse)1,.,2,1(,0)(2niaxxEinn11n

32、iiinxax代入得到聯(lián)立方程組：)1,.,2,1(, 11nixxEaxxEnlillin如果為一階線性預(yù)測(cè)，則可求得：2111nnnxExxEa11nnxax圖像信號(hào)的預(yù)測(cè)編碼圖像信號(hào)的預(yù)測(cè)編碼一副數(shù)字圖像可以看成一個(gè)空間點(diǎn)陣，圖像信號(hào)不僅在水平方向是相關(guān)的，在垂直方向也是相關(guān)的。根據(jù)已知樣值與待預(yù)測(cè)樣值間的位置關(guān)系，可以分為：（1）一維預(yù)測(cè)（行內(nèi)預(yù)測(cè)）：利用同一行上相鄰的樣值進(jìn)行預(yù)測(cè)。（2）二維預(yù)測(cè)（幀內(nèi)預(yù)測(cè)）：利用同一行和前面幾行的數(shù)據(jù)進(jìn)行預(yù)測(cè)。（3）三維預(yù)測(cè)（幀間預(yù)測(cè)）：利用相鄰幾幀（或不同波段）上的取樣值進(jìn)行預(yù)測(cè)靜止圖像的二維預(yù)測(cè)編碼靜止圖像的二維預(yù)測(cè)編碼這種壓縮算法被應(yīng)用到

33、JPEG標(biāo)準(zhǔn)的無(wú)損壓縮模式之中，中等復(fù)雜程度的圖像壓縮比可達(dá)到2:1。cabx選擇值選擇值預(yù)測(cè)值預(yù)測(cè)值0 0非預(yù)測(cè)非預(yù)測(cè)1 1a a2 2b b3 3c c4 4a+b-ca+b-c5 5a+(b-c)/2a+(b-c)/26 6b+(a-c)/2b+(a-c)/27 7(a+b)/2(a+b)/2d三鄰域預(yù)測(cè)法三鄰域預(yù)測(cè)法活動(dòng)圖像的幀間預(yù)測(cè)編碼活動(dòng)圖像的幀間預(yù)測(cè)編碼w 視頻信號(hào)的冗余度主要體現(xiàn)在空間相關(guān)性（幀內(nèi)）、時(shí)間相關(guān)性（幀間）和色度空間表示上的相關(guān)性。w 對(duì)于每秒25幀（30）的電視信號(hào)，其相繼幀之間存在極強(qiáng)的相關(guān)性。據(jù)統(tǒng)計(jì)256級(jí)灰度的黑白圖像序列，幀間差值超過(guò)3的象素?cái)?shù)不超過(guò)4。所

34、以在活動(dòng)圖像序列中可以利用前面的幀來(lái)預(yù)測(cè)后面的幀，以實(shí)現(xiàn)數(shù)據(jù)壓縮。w 幀間預(yù)測(cè)編碼技術(shù)被廣泛應(yīng)用到H.261、H.263、MPEG-1和MPEG-2等視頻壓縮標(biāo)準(zhǔn)之中。具有運(yùn)動(dòng)補(bǔ)償?shù)膸g預(yù)測(cè)具有運(yùn)動(dòng)補(bǔ)償?shù)膸g預(yù)測(cè)w活動(dòng)圖像序列中的一個(gè)畫(huà)面可以大致劃分為3個(gè)區(qū)域：（1）背景區(qū)：相鄰兩個(gè)畫(huà)面的背景區(qū)基本相同。（2）運(yùn)動(dòng)物體區(qū)：可以視為由前一個(gè)畫(huà)面的某一區(qū)域的像素平移而成。（位移矢量）（3）暴露區(qū)：指物體運(yùn)動(dòng)后而顯露出來(lái)的曾被遮蓋的背景區(qū)域。w運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)就是將前一個(gè)畫(huà)面的背景區(qū)平移前一個(gè)畫(huà)面的背景區(qū)平移后的運(yùn)動(dòng)物體區(qū)后的運(yùn)動(dòng)物體區(qū)作為后一個(gè)畫(huà)面的預(yù)測(cè)值。運(yùn)動(dòng)補(bǔ)償幀間預(yù)測(cè)編碼運(yùn)動(dòng)補(bǔ)償幀間預(yù)測(cè)編碼運(yùn)動(dòng)

35、補(bǔ)償幀間預(yù)測(cè)從原理上包括如下幾個(gè)基本步驟：（1）圖像分割：把圖像劃分為靜止的背景和若干運(yùn)動(dòng)的物體，各個(gè)物體可能有不同的位移，但構(gòu)成同一物體的所有像素的位移相同。（2）運(yùn)動(dòng)矢量估值：考察前后兩個(gè)畫(huà)面，利用運(yùn)動(dòng)估值算法得到每個(gè)物體的位移矢量。（3）運(yùn)動(dòng)補(bǔ)償：用運(yùn)動(dòng)矢量補(bǔ)償物體的運(yùn)動(dòng)效果再進(jìn)行預(yù)測(cè)。（4）編碼：除了對(duì)實(shí)測(cè)值與預(yù)測(cè)值之間的差值進(jìn)行編碼傳送外，還要傳送位移矢量以及區(qū)域分割信息。運(yùn)動(dòng)補(bǔ)償幀間預(yù)測(cè)編碼運(yùn)動(dòng)補(bǔ)償幀間預(yù)測(cè)編碼編碼器編碼器運(yùn)動(dòng)運(yùn)動(dòng)補(bǔ)償補(bǔ)償圖像輸入圖像輸入運(yùn)動(dòng)矢量輸出運(yùn)動(dòng)矢量輸出-譯碼器譯碼器幀幀緩存緩存運(yùn)動(dòng)運(yùn)動(dòng)估值估值預(yù)測(cè)誤差輸出預(yù)測(cè)誤差輸出運(yùn)動(dòng)估計(jì)有下述三種方法：運(yùn)動(dòng)估計(jì)有下述三

36、種方法： (1). 塊匹配法（Block Matching Algorithm BMA）以象素塊為準(zhǔn)進(jìn)行運(yùn)動(dòng)估計(jì)。 (2). 象素遞歸法（Pixel Recursive Algorithm PRA）以象素為準(zhǔn)進(jìn)行遞歸的運(yùn)動(dòng)估計(jì)。 (3). 傅立葉變換法。變換編碼變換編碼正交變換：設(shè): 原始圖象為X, 變換矩陣為T(mén), 均為方陣.則: Y = T * X, Y就是變換后的圖象.若變換矩陣T滿足：T * T = I, T-1*T = I, 則變換T稱為正交變換.由Y還原出原始圖象X的方法是：因?yàn)?Y = T * X , 所以 X= T * Y 最佳的正交變換最佳的正交變換KL變換變換KL變換

37、的物理意義：KL變換實(shí)質(zhì)上是作坐標(biāo)系的轉(zhuǎn)換，盡量讓向量落在最少的坐標(biāo)軸上或其周圍，從而只用較少的變換系數(shù)就可以恢復(fù)出質(zhì)量不錯(cuò)的圖像，壓縮效率比較高，均方誤差小。缺點(diǎn)：圖像變化后變換核矩陣也要相應(yīng)變換，求解過(guò)程比較復(fù)雜，沒(méi)有快捷方法。離散余弦變換離散余弦變換離散余弦變換(Discrete cosine Transform)簡(jiǎn)稱DCT。任何連續(xù)的實(shí)對(duì)稱函數(shù)的傅里葉變換中只含余弦項(xiàng)，因此余弦變換與傅里葉變換一樣有明確的物理量意義。DCT是先將整體圖像分成NN像素塊,然后對(duì)NN像素塊逐一進(jìn)行DCT變換。由于大多數(shù)圖像的高頻分量較小，相應(yīng)于圖像高頻成分的系數(shù)經(jīng)常為零，加上人眼對(duì)高頻成分的失真不

38、太敏感，所以可用更粗的量化，因此傳送變換系數(shù)所用的數(shù)碼率要大大小于傳送圖像像素所用的數(shù)碼率。到達(dá)接收端后再通過(guò)反離散余弦變換回到樣值，雖然會(huì)有一定的失真，但人眼是可以接受的。二維正反離散余弦變換的算式： N代表像素?cái)?shù)，一般N=8，88的二維數(shù)據(jù)塊經(jīng)DCT后變成88個(gè)變換系數(shù)，這些系數(shù)都有明確的物理意義：U代表水平像素號(hào)，V代表垂直像素號(hào)。如當(dāng)U=0，V=0時(shí)，F(xiàn)(0，0)是原 64個(gè) 樣值的平均，相當(dāng)于直流分量，隨著U、V值增加，相應(yīng)系數(shù)分別代表逐步增加的水平空間頻率分量和垂直空間頻率分量的大小。當(dāng)我們先只考慮水平方向上一行數(shù)據(jù)（8個(gè)像素）的情況時(shí)，如下圖所示：嚴(yán)格說(shuō)DCT本身并不

39、能進(jìn)行碼率壓縮，因?yàn)?4個(gè)樣值仍然得到64個(gè)系數(shù)，如下圖所示。這里給出了一個(gè)88像塊的具體例子，經(jīng)DCT變換后，比特?cái)?shù)增加了。在這個(gè)例子中樣值是8比特，從0225得到的直流分量的最大值是原來(lái)256的64/8倍，即02047，交流分量的范圍是-10241023。只是在經(jīng)過(guò)量化后，特別是按人眼的生理特征對(duì)低頻分量和高頻分量設(shè)置不同的量化，會(huì)使大多數(shù)高頻分量的系數(shù)變?yōu)榱恪Ｒ话阏f(shuō)來(lái)，人眼對(duì)低頻分量比較敏感，而對(duì)高頻分量不太敏感。因此對(duì)低頻分量采用較細(xì)的量化，而對(duì)高頻分量采用較粗的量化。 4.5多媒體數(shù)據(jù)壓縮的國(guó)際標(biāo)準(zhǔn)多媒體數(shù)據(jù)壓縮的國(guó)際標(biāo)準(zhǔn)w 國(guó)際標(biāo)準(zhǔn)化組織（ISO）w 國(guó)際電子委員會(huì)（

40、IEC）w 國(guó)際電信聯(lián)盟（ITU）有關(guān)圖像壓縮編碼的國(guó)際標(biāo)準(zhǔn)：w JPEG標(biāo)準(zhǔn)w MPEG標(biāo)準(zhǔn)w H.261標(biāo)準(zhǔn)算法概要 JPEG(Joint Photographic Experts Group) 是一個(gè)由 ISO和CCITT兩個(gè)組織機(jī)構(gòu)聯(lián)合組成的一個(gè)圖像專家小組，負(fù)責(zé)制定靜態(tài)的數(shù)字圖像數(shù)據(jù)壓縮編碼標(biāo)準(zhǔn)，這個(gè)專家組開(kāi)發(fā)的算法稱為JPEG算法，并且成為國(guó)際上通用的標(biāo)準(zhǔn)。JPEG是一個(gè)適用范圍很廣的靜態(tài)圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn)，既可用于灰度圖像又可用于彩色圖像。JPEG不僅適于靜止圖像的壓縮，電視圖像的幀內(nèi)圖像的壓縮編碼，也常采用此算法。JPEG標(biāo)準(zhǔn)還可以大范圍地調(diào)節(jié)圖像壓縮率及其保真度。標(biāo)準(zhǔn)主要采用

41、了兩種基本的壓縮算法，一種是采用以離散余弦變換(DCT)為基礎(chǔ)的有損壓縮算法，另一種是采用以預(yù)測(cè)技術(shù)為基礎(chǔ)的DPCM無(wú)損壓縮算法。JPEG編碼標(biāo)準(zhǔn)編碼標(biāo)準(zhǔn)JPEG編碼標(biāo)準(zhǔn)編碼標(biāo)準(zhǔn)w 基于DPCM的無(wú)損編碼模式：壓縮比可以達(dá)到2:1。w 基于DCT的有損順序編碼模式：壓縮比可以達(dá)到10:1以上。w 基于DCT的遞增編碼模式w 基于DCT的分層編碼模式JPEG規(guī)定了4種運(yùn)行模式，以滿足不同需要：JPEG壓縮的使用范圍壓縮的使用范圍w 可大范圍調(diào)節(jié)圖像壓縮率及其相應(yīng)的圖像保真度，解碼器可參數(shù)化，用戶應(yīng)用可以選擇期望的壓縮質(zhì)量比；w 可用于連接任何連續(xù)色調(diào)數(shù)字圖像，不限制圖像的景象內(nèi)容w 只需一定能力

42、的CPU就可實(shí)現(xiàn)，而不要求很高的檔次；w 可運(yùn)行四種模式：無(wú)失真壓縮、基于DCT的順序工作、基于DCT的累進(jìn)工作方式和基于DCT的分層工作方式。JPEG有損順序編碼算法的主要計(jì)算步驟如下：1. 將源圖像分成幾個(gè)顏色平面（分量圖像）。2. 分成88數(shù)據(jù)塊進(jìn)行正向離散余弦變換(FDCT) 2. 量化(quantization)。 3. Z字形排列量化結(jié)果(zigzag scan)。 4. 使用差分脈沖編碼調(diào)制(differential pulse code modulation，DPCM)對(duì)直流系數(shù)(DC)進(jìn)行編碼。 5. 使用行程長(zhǎng)度編碼(run-length encoding，RLE)對(duì) 交流

43、系數(shù)(AC)進(jìn)行編碼。 6. 熵編碼(entropy coding)。JPEG編碼標(biāo)準(zhǔn)編碼標(biāo)準(zhǔn)JPEG編碼標(biāo)準(zhǔn)編碼標(biāo)準(zhǔn)譯碼或者叫做解壓縮的過(guò)程與壓縮編碼過(guò)程正好相反。IDCTIDCTJPEG編碼標(biāo)準(zhǔn)編碼標(biāo)準(zhǔn)正向離散余弦變換對(duì)每個(gè)單獨(dú)的彩色圖像分量，把整個(gè)分量圖像分成88的圖像塊，如圖所示，并作為兩維離散余弦變換DCT的輸入。通過(guò)DCT變換，把能量集中在少數(shù)幾個(gè)系數(shù)上。DCT變換使用下式計(jì)算逆變換使用下式計(jì)算JPEG編碼標(biāo)準(zhǔn)編碼標(biāo)準(zhǔn)量化對(duì)于有損壓縮算法，JPEG算法使用如圖所示的均勻量化器進(jìn)行量化，量化步距是按照系數(shù)所在的位置和每種顏色分量的色調(diào)值來(lái)確定。 JPEG編碼標(biāo)準(zhǔn)編碼標(biāo)準(zhǔn)量化因?yàn)?/p>

44、人眼對(duì)亮度信號(hào)比對(duì)色差信號(hào)更敏感，因此使用了兩種量化表：亮度量化值和色差量化值。此外，由于人眼對(duì)低頻分量的圖像比對(duì)高頻分量的圖像更敏感，因此圖中的左上角的量化步距要比右下角的量化步距小。JPEG編碼標(biāo)準(zhǔn)編碼標(biāo)準(zhǔn)色度量化表亮度量化表DC系數(shù)DPCM編碼和AC系數(shù)Z形排列之后采用RLE編碼JPEG編碼標(biāo)準(zhǔn)編碼標(biāo)準(zhǔn)AC01AC77行程編碼（直流和交流系數(shù)）行程編碼（直流和交流系數(shù)）AC01DCAC07AC77AC70熵編碼使用熵編碼還可以對(duì)DPCM編碼后的直流DC系數(shù)和RLE編碼后的交流AC系數(shù)作進(jìn)一步的壓縮。 JPEG標(biāo)準(zhǔn)規(guī)定了兩種熵編碼算法：哈夫曼編碼和自適應(yīng)算術(shù)編碼。哈夫曼編碼采用的一般是

45、固定的哈夫曼編碼表，而不是臨時(shí)統(tǒng)計(jì)出來(lái)的，并且對(duì)亮度分量和色度分量采用了不同的哈夫曼表。JPEG編碼標(biāo)準(zhǔn)編碼標(biāo)準(zhǔn)基于DPCM的無(wú)損編碼模式：主要采用了三鄰域二維預(yù)測(cè)編碼和熵編碼。無(wú)失真編碼器無(wú)失真編碼器源圖像數(shù)據(jù)壓縮的圖像數(shù)據(jù)預(yù)測(cè)器熵編碼器表說(shuō)明DPCM預(yù)測(cè)編碼框圖JPEG編碼標(biāo)準(zhǔn)編碼標(biāo)準(zhǔn)JPEG編碼標(biāo)準(zhǔn)編碼標(biāo)準(zhǔn)基于DCT的遞增編碼模式：此模式與順序模式編碼步驟基本一致，不同之處在于遞增模式每個(gè)圖像分量的編碼要經(jīng)過(guò)多次掃描才完成。第一次掃描只進(jìn)行一次粗糙的壓縮，然后根據(jù)此數(shù)據(jù)先重建一幅質(zhì)量低的圖像，以后的掃描再作較細(xì)的掃描，使重建圖像質(zhì)量不斷提高，直到滿意為止。遞增模式分為兩種：（1）按

46、頻段累進(jìn)。（2）按位累進(jìn)。JPEG編碼標(biāo)準(zhǔn)編碼標(biāo)準(zhǔn)基于DCT的分層編碼模式：（1）降低原始圖像的空間分辨率。（2）對(duì)已經(jīng)降低分辨率的圖像按照順序編碼模式進(jìn)行壓縮并存儲(chǔ)或傳輸。（3）對(duì)低分辨率圖像進(jìn)行解碼，然后用插值法提高圖像的分辨率。（4）將分辨率已經(jīng)升高的圖像作為原圖像的預(yù)測(cè)值，并把它與原圖像的差值進(jìn)行基于DCT的編碼。（5）重復(fù)步驟3、4直到圖像達(dá)到完整的分辨率。JPEG圖像文件格式圖像文件格式 JPEG標(biāo)準(zhǔn)委員會(huì)沒(méi)有對(duì)JPEG文件格式作出明確的定義，現(xiàn)在被廣泛采用的是1992年9月由C-Cube Microsystems公司提出的JPEG文件交換格式（JPEG File Interch

47、ange Format，JFIF），版本號(hào)為1.02。JFIF文件格式直接使用JPEG標(biāo)準(zhǔn)為應(yīng)用程序定義的許多標(biāo)記，因此JFIF格式成了事實(shí)上JPEG文件交換格式標(biāo)準(zhǔn)。 JEPG文件大體上可以分成兩個(gè)部分：標(biāo)記碼（tag）和壓縮數(shù)據(jù)。標(biāo)記碼部分給出了JPEG圖像的所有信息，如圖像的寬、高、Huffman表、量化表等等。JPEG圖像文件格式圖像文件格式w JPEG文件使用的顏色空間是電視圖像信號(hào)數(shù)字化標(biāo)準(zhǔn)ITU-RBT 601推薦標(biāo)準(zhǔn)規(guī)定的YCbCr彩色空間。從RGB轉(zhuǎn)換成YCbCr的計(jì)算公式如下： Y = 0.299 R + 0.587G + 0.114 B Cb = - 0.1687R -

48、0.3313G + 0.5B + 128 Cr = 0.5 R - 0.4187G - 0.0813 B + 1284、運(yùn)動(dòng)圖像壓縮編碼的國(guó)際標(biāo)準(zhǔn)(MPEG I, ,和)隨著數(shù)字化、網(wǎng)絡(luò)化、全球一體化信息時(shí)代的來(lái)臨，多媒體技術(shù)成為信息技術(shù)的重要組成部分。它包括聲音、圖形、數(shù)據(jù)以及圖像在內(nèi)的多種媒體信息的傳送和處理，其關(guān)鍵在于壓縮技術(shù)。此外，在多媒體的傳輸、處理、應(yīng)用中還有許多問(wèn)題：如何在網(wǎng)絡(luò)上傳輸視頻？如何通過(guò)手機(jī)上網(wǎng)并接收視頻和圖像？如何對(duì)多媒體數(shù)據(jù)進(jìn)行快速有效的檢索？如何對(duì)多媒體信息進(jìn)行統(tǒng)一的存?。康鹊?。 MPEG是活動(dòng)圖像專家組(Moving Picture Exports Group)

49、英文的縮寫(xiě)，于1988年成立，是為數(shù)字視/音頻制定壓縮標(biāo)準(zhǔn)的專家組，目前已擁有300多名成員，包括IBM、SUN、BBC、NEC、INTEL、AT&T等世界知名公司。MPEG組織最初得到的授權(quán)是制定用于“活動(dòng)圖像”編碼的各種標(biāo)準(zhǔn)，隨后擴(kuò)充為“及其伴隨的音頻”及其組合編碼。后來(lái)針對(duì)不同的應(yīng)用需求，解除了“用于數(shù)字存儲(chǔ)媒體”的限制，成為現(xiàn)在制定“活動(dòng)圖像和音頻編碼”標(biāo)準(zhǔn)的組織。MPEG組織制定的各個(gè)標(biāo)準(zhǔn)都有不同的目標(biāo)和應(yīng)用，目前已提出MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21標(biāo)準(zhǔn)。 MPEG-1標(biāo)準(zhǔn)及其應(yīng)用標(biāo)準(zhǔn)及其應(yīng)用MPEG-1標(biāo)準(zhǔn)于1993年8月公布，用于傳

50、輸1.5Mbps數(shù)據(jù)傳輸率的數(shù)字存儲(chǔ)媒體運(yùn)動(dòng)圖像及其伴音的編碼。該標(biāo)準(zhǔn)包括五個(gè)部分：第一部分說(shuō)明了如何根據(jù)第二部分（視頻）以及第三部分（音頻）的規(guī)定，對(duì)音頻和視頻進(jìn)行復(fù)合編碼。第四部分說(shuō)明了檢驗(yàn)解碼器或編碼器的輸出比特流符合前三部分規(guī)定的過(guò)程。第五部分是一個(gè)用完整的C語(yǔ)言實(shí)現(xiàn)的編碼和解碼器。該標(biāo)準(zhǔn)從頒布的那一刻起，MPEG-1取得一連串的成功，如VCD和MP3的大量使用，Windows95以后的版本都帶有一個(gè)MPEG-1軟件解碼器，可攜式MPEG-1攝像機(jī)等等。 MPEG1曾經(jīng)是VCD的主要壓縮標(biāo)準(zhǔn)，是目前實(shí)時(shí)視頻壓縮的主流，可適用于不同帶寬的設(shè)備，如CD-ROM、Video-CD、CD-I。

51、與M-JPEG技術(shù)相比較，在實(shí)時(shí)壓縮、每幀數(shù)據(jù)量、處理速度上均有顯著的提高。MPEG1可以滿足多達(dá)16路以上25幀/秒的壓縮速度，在500kbit/s的壓縮碼流和352像素288行的清晰度下，每幀大小僅為2k。若從VCD到超級(jí)VCD到DVD的不同格式來(lái)看，MPEG1的352 288格式，MPEG2可有576352、704 576等，用于CDROM上存儲(chǔ)同步和彩色運(yùn)動(dòng)標(biāo)視頻信號(hào)，旨在達(dá)到VCR（模擬式磁帶錄放機(jī)Video Cassette Recorder；VCR）質(zhì)量，其視頻壓縮率為26：1。 MPEG1可使圖像在空間軸上最多壓縮1/38，在時(shí)間軸上對(duì)相對(duì)變化較小的數(shù)據(jù)最多壓縮1/5。MPEG

52、1壓縮后的數(shù)據(jù)傳輸率為1.5Mbps，壓縮后的源輸入格式SIF（Source Input Format），分辨率為352像素288行（PAL制），亮度信號(hào)的分辨率為360240，色度信號(hào)的分辨率為180120，每秒30幀。MPEG1對(duì)色差分量采用4：1：1的二次采樣率。MPEG1、MPEG2是傳送一張張不同動(dòng)作的局部畫(huà)面。在實(shí)現(xiàn)方式上，MPEG1可以借助于現(xiàn)有的解碼芯片來(lái)完成，而不像M-JPEG那樣過(guò)多依賴于主機(jī)的CPU。與軟件壓縮相比，硬件壓縮可以節(jié)省計(jì)算機(jī)資源，降低系統(tǒng)成本。但也存在著諸多不足：一、壓縮比還不夠大，在多路監(jiān)控情況下，錄像所要求的磁盤(pán)空間過(guò)大。尤其當(dāng)DVR主機(jī)超過(guò)8路時(shí)，為

53、了保存一個(gè)月的存儲(chǔ)量，通常需要10個(gè)80G硬盤(pán)，或更多，硬盤(pán)投資大，而由此引起的硬盤(pán)故障和維護(hù)更是叫人頭疼。二、是圖像清晰度還不夠高。由于MPEG1最大清晰度僅為352 X 288，考慮到容量、模擬數(shù)字量化損失等其它因素，回放清晰度不高，這也是市場(chǎng)反應(yīng)的主要問(wèn)題。三、是對(duì)傳輸圖像的帶寬有一定的要求，不適合網(wǎng)絡(luò)傳輸，尤其是在常用的低帶寬網(wǎng)絡(luò)上無(wú)法實(shí)現(xiàn)遠(yuǎn)程多路視頻傳送。四、是MPEG1的錄像幀數(shù)固定為每秒25幀，不能丟幀錄像，使用靈活性較差。從目前廣泛采用的壓縮芯片來(lái)看，也缺乏有效的調(diào)控手段，例如關(guān)鍵幀設(shè)定、取樣區(qū)域設(shè)定等等，造成在保安監(jiān)控領(lǐng)域應(yīng)用不適合，造價(jià)也高。MPEG-2標(biāo)準(zhǔn)及其應(yīng)用標(biāo)準(zhǔn)及

54、其應(yīng)用MPEG-2制定于1994年，設(shè)計(jì)目標(biāo)是高級(jí)工業(yè)標(biāo)準(zhǔn)的圖象質(zhì)量以及更高的傳輸率。MPEG-2所能提供的傳輸率在3-10Mbits/sec間,其在NTSC制式下的分辨率可達(dá)720X486，MPEG-2也可提供并能夠提供廣播級(jí)的視像和CD級(jí)的音質(zhì)。MPEG-2的音頻編碼可提供左右中及兩個(gè)環(huán)繞聲道,以及一個(gè)加重低音聲道，和多達(dá)7個(gè)伴音聲道(DVD可有8種語(yǔ)言配音的原因)。由于MPEG-2在設(shè)計(jì)時(shí)的巧妙處理，使得大多數(shù)MPEG-2解碼器也可播放MPEG-1格式的數(shù)據(jù)，如VCD。 MPEG-2圖像壓縮的原理是利用了圖像中的兩種特性：空間相關(guān)性和時(shí)間相關(guān)性。一幀圖像內(nèi)的任何一個(gè)場(chǎng)景都是由若干像素點(diǎn)構(gòu)

55、成的，因此一個(gè)像素通常與它周圍的某些像素在亮度和色度上存在一定的關(guān)系，這種關(guān)系叫作空間相關(guān)性；一個(gè)節(jié)目中的一個(gè)情節(jié)常常由若干幀連續(xù)圖像組成的圖像序列構(gòu)成，一個(gè)圖像序列中前后幀圖像間也存在一定的關(guān)系，這種關(guān)系叫作時(shí)間相關(guān)性。這兩種相關(guān)性使得圖像中存在大量的冗余信息。如果我們能將這些冗余信息去除，只保留少量非相關(guān)信息進(jìn)行傳輸，就可以大大節(jié)省傳輸頻帶。而接收機(jī)利用這些非相關(guān)信息，按照一定的解碼算法，可以在保證一定的圖像質(zhì)量的前提下恢復(fù)原始圖像。一個(gè)好的壓縮編碼方案就是能夠最大限度地去除圖像中的冗余信息。 MPEG-2的編碼圖像被分為三類，分別稱為I幀，P幀和B幀。I幀圖像采用幀內(nèi)編碼方式，即只利用了

56、單幀圖像內(nèi)的空間相關(guān)性，而沒(méi)有利用時(shí)間相關(guān)性。I幀使用幀內(nèi)壓縮，不使用運(yùn)動(dòng)補(bǔ)償，由于I幀不依賴其它幀，所以是隨機(jī)存取的入點(diǎn)，同時(shí)是解碼的基準(zhǔn)幀。I幀主要用于接收機(jī)的初始化和信道的獲取，以及節(jié)目的切換和插入，I幀圖像的壓縮倍數(shù)相對(duì)較低。I幀圖像是周期性出現(xiàn)在圖像序列中的，出現(xiàn)頻率可由編碼器選擇。P幀和B幀圖像采用幀間編碼方式，即同時(shí)利用了空間和時(shí)間上的相關(guān)性。P幀圖像只采用前向時(shí)間預(yù)測(cè)，可以提高壓縮效率和圖像質(zhì)量。P幀圖像中可以包含幀內(nèi)編碼的部分，即P幀中的每一個(gè)宏塊可以是前向預(yù)測(cè)，也可以是幀內(nèi)編碼。B幀圖像采用雙向時(shí)間預(yù)測(cè)，可以大大提高壓縮倍數(shù)。值得注意的是，由于B幀圖像采用了未來(lái)幀作為參考，

57、因此MPEG-2編碼碼流中圖像幀的傳輸順序和顯示順序是不同的。MPEG-2的編碼碼流分為六個(gè)層次。為更好地表示編碼數(shù)據(jù)，MPEG-2用句法規(guī)定了一個(gè)層次性結(jié)構(gòu)。它分為六層，自上到下分別是：圖像序列層、圖像組(GOP)、圖像、宏塊條、宏塊、塊。MPEG-2標(biāo)準(zhǔn)的主要應(yīng)用如下：1、視音頻資料的保存 2、非線性編輯系統(tǒng)及非線性編輯網(wǎng)絡(luò)3、衛(wèi)星傳輸4、電視節(jié)目的播出同時(shí)，由于MPEG-2的出色性能表現(xiàn)，已能適用于HDTV，使得原打算為HDTV設(shè)計(jì)的MPEG-3，還沒(méi)出世就被拋棄了。(MPEG-3要求傳輸速率在20Mbits/sev-40Mbits/sec間，但這將使畫(huà)面有輕度扭曲)。而現(xiàn)在網(wǎng)絡(luò)上大行其

58、道的數(shù)字音樂(lè)格式 MP3并不是MPEG3，而是MPEG1的第三層 (MPEG1 Layer3) 。除了作為DVD的指定標(biāo)準(zhǔn)外，MPEG-2還可用于為廣播，有線電視網(wǎng)，電纜網(wǎng)絡(luò)以及衛(wèi)星直播 (Direct Broadcast Satellite) 提供廣播級(jí)的數(shù)字視頻。從技術(shù)層面講，MP4使用的是MPEG-2 AAC技術(shù)，也就是簡(jiǎn)稱為A2B或AAC的技術(shù)。它的特點(diǎn)是音質(zhì)更加完美而壓縮比更大(15:1-20:1)。MPEG-2 AAC在采樣頻率為896KHz時(shí)可提供148個(gè)聲道可選范圍的高質(zhì)量音頻編碼。AAC就是Advanced Audio Coding(先進(jìn)音頻編碼)的縮寫(xiě)，它適用于從比特率為

59、8kbps單聲道的電話語(yǔ)音音質(zhì)到160kbps多聲道超高質(zhì)量音頻信號(hào)范圍內(nèi)的編碼，并且允許對(duì)多媒體進(jìn)行編碼/解碼。它增加了諸如對(duì)立體聲的完美再現(xiàn)、比特流效果音掃描、多媒體控制、降噪等MP3沒(méi)有的特性，使得在音頻壓縮后仍能完美的再現(xiàn)CD的音質(zhì)。 wMPEG-2的另一特點(diǎn)是，其可提供一個(gè)較廣的范圍改變壓縮比，以適應(yīng)不同畫(huà)面質(zhì)量，存儲(chǔ)容量，以及帶寬的要求。w 對(duì)于最終用戶來(lái)說(shuō)，由于現(xiàn)存電視機(jī)分辨率限制，MPEG-2所帶來(lái)的高清晰度畫(huà)面質(zhì)量(如DVD畫(huà)面)在電視上效果并不明顯，倒是其音頻特性(如加重低音，多伴音聲道等)更引人注目。w MPEG2是DVD的壓縮標(biāo)準(zhǔn)，對(duì)每秒30幀的720576分辨率的視頻

60、信號(hào)進(jìn)行壓縮，適用于計(jì)算機(jī)顯示質(zhì)量的圖像，壓縮后的數(shù)據(jù)率為6Mbps，它將視頻節(jié)目中的視頻、音頻、數(shù)據(jù)內(nèi)容等組成部分復(fù)合成單一的比特流，以便在網(wǎng)上傳送或者在存儲(chǔ)設(shè)備中存放的壓縮。在DVR產(chǎn)品中只有少量采用MPEG2壓縮標(biāo)準(zhǔn)。MPEG-4標(biāo)準(zhǔn)及其應(yīng)用標(biāo)準(zhǔn)及其應(yīng)用運(yùn)動(dòng)圖像專家組MPEG 于1999年2月正式公布了MPEG-4（ISO/IEC14496）標(biāo)準(zhǔn)第一版本。同年年底MPEG-4第二版亦告底定，且于2000年年初正式成為國(guó)際標(biāo)準(zhǔn)。MPEG-4與MPEG-1和MPEG-2有很大的不同。MPEG-4不只是具體壓縮算法，它是針對(duì)數(shù)字電視、交互式繪圖應(yīng)用（影音合成內(nèi)容）、交互式多媒體（WWW、資料擷取與分

人人文庫(kù)> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

第四章多媒體數(shù)據(jù)壓縮編碼技術(shù)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

第四章多媒體數(shù)據(jù)壓縮編碼技術(shù)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔