第四章多媒體數(shù)據(jù)壓縮編碼技術(shù)_第1頁(yè)
第四章多媒體數(shù)據(jù)壓縮編碼技術(shù)_第2頁(yè)
第四章多媒體數(shù)據(jù)壓縮編碼技術(shù)_第3頁(yè)
第四章多媒體數(shù)據(jù)壓縮編碼技術(shù)_第4頁(yè)
第四章多媒體數(shù)據(jù)壓縮編碼技術(shù)_第5頁(yè)
已閱讀5頁(yè),還剩100頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、要點(diǎn):1、多媒體數(shù)據(jù)壓縮編碼的重要性和分類;2、常用壓縮編碼的基本原理即實(shí)現(xiàn)技術(shù),統(tǒng)計(jì)編碼、算術(shù)編碼、預(yù)測(cè)編碼、變換編碼(K-L變換,DCT變換)3、量化的基本原理和量化器的設(shè)計(jì)思想。4、靜態(tài)圖像壓縮編碼的國(guó)際標(biāo)準(zhǔn)(JPEG)的原理及實(shí)現(xiàn)技術(shù),動(dòng)態(tài)圖像壓縮編碼國(guó)際標(biāo)準(zhǔn)(MPEG)的基本原理。4.1 多媒體數(shù)據(jù)壓縮的重要性與分類多媒體數(shù)據(jù)壓縮的重要性與分類 多媒體技術(shù)最大難題是海量數(shù)據(jù)存儲(chǔ)與傳送電視信號(hào)、傳輸電視信號(hào)數(shù)字化后的數(shù)據(jù)量。那么數(shù)據(jù)量是否等于信息量? 例如:一個(gè)512512分辨率的一分鐘視頻需要如下的存儲(chǔ)容量:512 512 8 3=6291456=6.3M bit/s 6.3 30幀

2、/s =188M bit/s 188/8 = 23.5MByte/s 那么一張650MByte的光盤(pán)就只能存儲(chǔ) 650M byte 硬盤(pán)/23.5M bytes/s = 27.5秒 例如:語(yǔ)音信號(hào),正常人談話音頻20Hz4KHz,采樣定理,精度為8位,人類語(yǔ)言帶寬為4KHz,則 4K 2 8 =64Kbit/s = 8Kbyte/s 與圖像相比: 23.5M/8K=3000倍。所以必須進(jìn)行壓縮。知識(shí):信息量與數(shù)據(jù)量的關(guān)系:知識(shí):信息量與數(shù)據(jù)量的關(guān)系: wI = D - duwI 信息量wD數(shù)據(jù)量wdu冗余量1du在平時(shí)說(shuō)話時(shí)是大量存在的。2中文廣播員一分鐘讀180個(gè)漢字,一個(gè)漢字兩個(gè)字節(jié), 3

3、60個(gè)Byte 。 采樣1分鐘,8K 60 = 480 K Byte/分 480 K byte / 360 byte = 1000倍的冗余3中文百科全書(shū)掃描進(jìn)入計(jì)算機(jī)冗余更大。4圖像信息、視頻信息的冗余就更大了。 一、為什么要進(jìn)行數(shù)據(jù)壓縮?一、為什么要進(jìn)行數(shù)據(jù)壓縮?(1)多媒體信息包括文本、數(shù)據(jù)、聲音、動(dòng)畫(huà)、圖形以及視頻等多種媒體信息,經(jīng)過(guò)數(shù)字化處理后其數(shù)據(jù)量非常大,如果不進(jìn)行數(shù)據(jù)壓縮處理,計(jì)算機(jī)系統(tǒng)就無(wú)法對(duì)它進(jìn)行存儲(chǔ)和交換;(2)多媒體信息中的圖像、音頻和視頻這些媒體具有很大的壓縮潛力。因?yàn)檫@些數(shù)據(jù)中存在著空間冗余、時(shí)間冗余、結(jié)構(gòu)冗余、視覺(jué)冗余、圖像區(qū)域的相同性冗余、紋理的統(tǒng)計(jì)冗余等,它們?yōu)?/p>

4、數(shù)據(jù)壓縮技術(shù)的應(yīng)用提供了可能的條件。(3)數(shù)據(jù)壓縮是以一定的質(zhì)量損失為容限,質(zhì)量損失一般在人眼允許的誤差范圍之內(nèi),壓縮前后的圖像如果不作詳細(xì)的觀察很難覺(jué)察出兩者的差別。(4)壓縮處理一般由兩個(gè)過(guò)程組成:一是編碼過(guò)程,即將原始數(shù)據(jù)經(jīng)過(guò)編碼再進(jìn)行壓縮,以便于存儲(chǔ)和傳輸;二是解碼過(guò)程,即將編碼數(shù)據(jù)還原為可使用的數(shù)據(jù)。二、多媒體數(shù)據(jù)壓縮編碼可能性(冗二、多媒體數(shù)據(jù)壓縮編碼可能性(冗余性)余性)為什么能壓縮為什么能壓縮 圖像信息之所以能進(jìn)行壓縮是因?yàn)樾畔⒈旧硗ǔ4鎴D像信息之所以能進(jìn)行壓縮是因?yàn)樾畔⒈旧硗ǔ4嬖诤艽蟮娜哂嗔吭诤艽蟮娜哂嗔?1.空間冗余 例: 圖象中的“A”是一個(gè)規(guī)則物體。光的亮度、飽和度及

5、顏色都一樣, 因此,數(shù)據(jù)A有很大的冗余。 2.時(shí)間冗余 例: 序列圖象。(相鄰畫(huà)面的背景和移動(dòng)畫(huà)面) 以上面的視頻連續(xù)畫(huà)面為例,它的每一幀畫(huà)面是由若干個(gè)像素組成的,因?yàn)閯?dòng)態(tài)圖像通常反映的是一個(gè)連續(xù)的過(guò)程,它的相鄰的幀之間存在著很大的相關(guān)性,從一幅畫(huà)面到下一幅畫(huà)面,背景與前景就可以沒(méi)有太多的變化。也就是說(shuō),連續(xù)多幀畫(huà)面在很大程度上是相似的,而這些相似的信息(或稱作冗余信息)為數(shù)據(jù)的壓縮提供了基礎(chǔ)。二、多媒體數(shù)據(jù)壓縮編碼可能性(冗余性)二、多媒體數(shù)據(jù)壓縮編碼可能性(冗余性)3.信息熵冗余 l 信息量: 指從N個(gè)相等的可能事件中選出一個(gè)事件所需要的信息度量和含量。 l 信息熵:指一團(tuán)數(shù)據(jù)所帶的信息量

6、,平均信息量就是信息熵(entropy)。 例如:從64個(gè)數(shù)中選出某一個(gè)數(shù),可先問(wèn)“是否大于32?”消除半數(shù)的可能,這樣只要6次就可選出某數(shù)。這是因?yàn)槊刻釂?wèn)一次都會(huì)得到1比特的信息量。因此,在64個(gè)數(shù)中選定某一數(shù)所需的信息量是 log2 64=6(bits) 。 設(shè)從N個(gè)數(shù)中選任意一個(gè)數(shù)X的概率為 P(x),假定選定任意一個(gè)數(shù)的概率都相等,P(x)= 1/N,因此定義信息量:I(xI(x)=log)=log2 2N= -logN= -log2 2(1/N)= -log(1/N)= -log2 2P(x)=IP(xP(x)=IP(x) )二、多媒體數(shù)據(jù)壓縮編碼可能性(冗二、多媒體數(shù)據(jù)壓縮編碼可能

7、性(冗余性)余性) 4.結(jié)構(gòu)冗余 v 圖象有非常強(qiáng)的紋理結(jié)構(gòu)。 v 如草席圖結(jié)構(gòu)上存在冗余。 5.知識(shí)冗余 q 圖像的理解與某些基礎(chǔ)知識(shí)有關(guān)。 q 例:人臉的圖像有同樣的結(jié)構(gòu):嘴的上方有鼻子,鼻子上方有眼睛,鼻子在中線上 6.視覺(jué)冗余 視覺(jué)冗余是非均勻、非線性的。 例:人類視覺(jué)分辨率為2 ,但常數(shù)2就是數(shù)據(jù)冗余。二、數(shù)據(jù)壓縮方法的分類二、數(shù)據(jù)壓縮方法的分類 常用壓縮編碼分為兩大類:常用壓縮編碼分為兩大類: 一類是冗余壓縮法;也稱無(wú)損壓縮或無(wú)失真壓縮; 它是為保留原始多媒體對(duì)象(包括圖像、語(yǔ)音和視頻)而設(shè)計(jì)的。在無(wú)損壓縮中,數(shù)據(jù)在壓縮或解壓縮過(guò)程中不會(huì)改變或損失,解壓縮產(chǎn)生的數(shù)據(jù)是對(duì)原始對(duì)象的完

8、整復(fù)制。 二類是熵壓縮法;也稱有損壓縮或有失真壓縮 當(dāng)圖像的冗余度很少(即同類像素重復(fù)性很?。r(shí),用無(wú)損壓縮技術(shù)不能得到可接受的結(jié)果,這時(shí)就要采用有損壓縮。有損壓縮會(huì)造成一些信息的損失,關(guān)鍵問(wèn)題是看這種損失對(duì)圖像質(zhì)量帶來(lái)的影響。只要這種損失被限制在允許的范圍內(nèi),有損壓縮就是可接受的。 有損壓縮技術(shù)主要的應(yīng)用領(lǐng)域是在影像節(jié)目、可視電話會(huì)議和多媒體網(wǎng)絡(luò)這樣的由音頻、彩色圖像和視頻組成的多媒體應(yīng)用中,并且得到了廣泛的應(yīng)用。影響數(shù)據(jù)壓縮的幾個(gè)要素u一個(gè)好的壓縮方法對(duì)多媒體信息的存儲(chǔ)和傳輸是至關(guān)重要的,影響壓縮性能的主要指標(biāo)有: 壓縮比壓縮比 對(duì)壓縮前后的文件大小和數(shù)據(jù)量進(jìn)行比較,作為壓縮率的衡量指標(biāo)。

9、人們普遍希望壓縮的倍數(shù)越高越好,壓縮的速度越快越好,并且希望壓縮所耗費(fèi)的資源、時(shí)間對(duì)用戶來(lái)講是透明的。但同時(shí)人們又希望確保數(shù)據(jù)壓縮的精度,即壓縮完了以后,解壓縮的數(shù)據(jù)和原來(lái)的數(shù)據(jù)最好沒(méi)有什么差別,沒(méi)有什么數(shù)據(jù)損失。然而追求壓縮比率和追求精度往往是矛盾的,因此就需要在這兩者之間權(quán)衡取舍。 圖像質(zhì)量圖像質(zhì)量 雖然有損壓縮可獲得較大的壓縮比,但壓縮比過(guò)高,還原后的圖像質(zhì)量就可能降低。圖像質(zhì)量的評(píng)估法常采用客觀評(píng)估和主觀評(píng)估兩種方法。 客觀評(píng)估則是通過(guò)一種具體的算法來(lái)統(tǒng)計(jì)多媒體數(shù)據(jù)壓縮結(jié)果的損失。例如采用純誤差測(cè)度,即原始圖像與恢復(fù)圖像之間的簡(jiǎn)單數(shù)學(xué)統(tǒng)計(jì)差別。盡管這種方法將誤差量化表達(dá),但并不能反映觀

10、察者對(duì)誤差的視覺(jué)感知。 主觀評(píng)估基于人的視覺(jué)感知,因?yàn)橛^察者作為最終視覺(jué)信宿,他們能對(duì)恢復(fù)圖像的質(zhì)量作出直觀的判斷。方法之一是進(jìn)行主觀測(cè)試,讓觀察者通過(guò)觀測(cè)一系列恢復(fù)圖像,并與原圖像進(jìn)行比較,再根據(jù)損傷的可見(jiàn)程度進(jìn)行評(píng)級(jí),以判斷哪種壓縮方法的失真少。壓縮與解壓縮的速度壓縮與解壓縮的速度 壓縮和解壓縮的速度是壓縮系統(tǒng)的兩項(xiàng)單獨(dú)的性能度量。在有些應(yīng)用中,壓縮和解壓縮都需要實(shí)時(shí)進(jìn)行,如電視會(huì)議的圖像傳輸。在有些應(yīng)用中,壓縮可以用非實(shí)時(shí)壓縮,而只要解壓縮是實(shí)時(shí)的,這種壓縮稱為非對(duì)稱壓縮,如多媒體CD-ROM的節(jié)目制作。從目前開(kāi)發(fā)的壓縮技術(shù)來(lái)看,一般壓縮的計(jì)算量比解壓縮要大。 壓縮的速度不僅與采用的壓縮

11、方法有關(guān),而且與快速算法的計(jì)算量有關(guān),如果在算法上有較大的突破,無(wú)疑將對(duì)多媒體的開(kāi)發(fā)與應(yīng)用產(chǎn)生很大的影響。執(zhí)行的硬件與軟件執(zhí)行的硬件與軟件 采用什么樣的硬件與軟件去執(zhí)行壓縮/解壓縮,與采用壓縮方案和算法的復(fù)雜程度有著密切的關(guān)系。設(shè)計(jì)精巧的簡(jiǎn)單算法可以在簡(jiǎn)單的硬件上執(zhí)行,且執(zhí)行速度很快。而設(shè)計(jì)復(fù)雜的算法需要在功能強(qiáng)大的硬件和軟件的支持下才能運(yùn)行。但僅靠算法來(lái)提高壓縮/解壓縮的速度還是有限的。在大多數(shù)情況下,不得不依靠硬件本身提供的功能去完成,例如采用專用多媒體處理芯片。因此在壓縮/解壓縮系統(tǒng)中,速度和硬件之間的選擇就顯得十分重要。二、數(shù)據(jù)壓縮方法的分類二、數(shù)據(jù)壓縮方法的分類 按編碼算法原理分:

12、(1) 預(yù)測(cè)編碼 (2) 變換編碼 (3) 量化與向量量化編碼 (4) 信息熵編碼 (5) 子帶編碼 (6) 結(jié)構(gòu)編碼 (7) 基于知識(shí)的編碼 圖像壓縮編碼分類的一般方法圖像壓縮編碼分類的一般方法4.2.1 量化原理 量化處理是使數(shù)據(jù)比特率下降的一個(gè)強(qiáng)有力的措施。脈沖編碼調(diào)制(PCM)的量化處理是采樣之后進(jìn)行,從理論分析的角度,圖像灰度值是連續(xù)的數(shù)值,而我們通常看到的是以(0255)的整數(shù)表示圖像灰度,這是經(jīng)A/D變換后的以256級(jí)灰度分層量化處理了的離散數(shù)值,這樣可以用log2256=8比特表示一個(gè)圖像像素的灰度值,或色差信號(hào)值。 4.2 量化 數(shù)據(jù)壓縮編碼中的量化處理,不是指A/D變換后的

13、量化,而是指以PCM碼作為輸入,經(jīng)正交變換、差分、或預(yù)測(cè)處理后,熵編碼之前,對(duì)正交變換系數(shù)、差值或預(yù)測(cè)誤差的量化處理。量化輸入值的動(dòng)態(tài)范圍很大,需要很多的比特?cái)?shù)表示一個(gè)數(shù)值,量化輸出只能取有限個(gè)整數(shù),稱作量化級(jí),希望量化后的數(shù)值用較少的比特?cái)?shù)便可表示。每個(gè)量化輸入被強(qiáng)行歸到與其接近的某個(gè)輸出,即量化到某個(gè)級(jí)。量化處理總是把一批輸入,量化到一個(gè)輸出級(jí)上,所以量化處理是一個(gè)多對(duì)一的處理過(guò)程,是個(gè)不可逆過(guò)程,量化處理中有信息丟失,或者說(shuō),會(huì)引起量化誤差(量化噪聲)。4.2.2 4.2.2 標(biāo)量量化器的設(shè)計(jì)標(biāo)量量化器的設(shè)計(jì) 量化器的設(shè)計(jì)要求量化器的設(shè)計(jì)要求 通常設(shè)計(jì)量化器有下述兩種情況:通常設(shè)計(jì)量化器

14、有下述兩種情況: 給定量化分層級(jí)數(shù),滿足量化誤差最小。給定量化分層級(jí)數(shù),滿足量化誤差最小。 限定量化誤差,確定分層級(jí)數(shù),滿足以盡限定量化誤差,確定分層級(jí)數(shù),滿足以盡量小的平均比特?cái)?shù),表示量化輸出。量小的平均比特?cái)?shù),表示量化輸出。 量化方法有標(biāo)量量化和矢量量化之分,標(biāo)量化方法有標(biāo)量量化和矢量量化之分,標(biāo)量量化又可分為,均勻量化、非均勻量化量量化又可分為,均勻量化、非均勻量化和自適應(yīng)量化。和自適應(yīng)量化。 4.2.3 4.2.3 矢量量化矢量量化 w 矢量量化編碼是近年來(lái)圖像、語(yǔ)音信號(hào)編碼技術(shù)中頗為流行的一種新型量化編碼方法。矢量量化編碼方法一般是有失真編碼方法。矢量量化的名字是相對(duì)于標(biāo)量量化而提出

15、的。對(duì)于PCM數(shù)據(jù),一個(gè)數(shù)一個(gè)數(shù)地進(jìn)行量化叫標(biāo)量量化。若對(duì)這些數(shù)據(jù)分組,每組K個(gè)數(shù)構(gòu)成一個(gè)K維矢量,然后以矢量為單元,逐個(gè)矢量進(jìn)行量化,稱矢量量化。 w 矢量量化編碼解碼框圖 (P105圖4.5)4.3.1 4.3.1 統(tǒng)計(jì)編碼原理統(tǒng)計(jì)編碼原理在討論數(shù)據(jù)壓縮的時(shí)候,需要涉及現(xiàn)代科學(xué)領(lǐng)域的一個(gè)重要分支信息論。信息論有關(guān)信息熵的概念對(duì)數(shù)據(jù)壓縮有著重要的指導(dǎo)意義,它一方面給出了數(shù)據(jù)壓縮的理論極限,另一方面又指明了數(shù)據(jù)壓縮的技術(shù)途徑。 現(xiàn)代信息論的創(chuàng)始人香農(nóng)(C.E Shannon)在他發(fā)表的著名論文通信的數(shù)學(xué)理論中,從研究通信系統(tǒng)傳輸?shù)膶?shí)質(zhì)出發(fā),對(duì)信息作了科學(xué)的定義,并進(jìn)行了定性和定量的描述。 香農(nóng)

16、認(rèn)為:信息是有秩序的量度,是人們對(duì)事物了解的不確定性的消除或減少。信息是對(duì)組織程度的一種測(cè)度,信息能使物質(zhì)系統(tǒng)有序性增強(qiáng),減少破壞、混亂和噪音。 香農(nóng)提出:信息的傳播過(guò)程是“信源”(信息的發(fā)送者)把要提供的信息經(jīng)過(guò)“信道”傳遞給“信宿”(信息的接收者),信宿接收這些經(jīng)過(guò)“譯碼”(即解釋符號(hào))的信息符號(hào)的過(guò)程。并由此建立了通信系統(tǒng)模型。 我們從一則消息中獲得了信息,那么我們獲得的信息有多少呢?量度信息多少的測(cè)度就是信息量。信息的度量反映了人們對(duì)于信息的定量認(rèn)識(shí)。 根據(jù)香農(nóng)的有關(guān)信息的定義,信息如何測(cè)度呢?顯然,信息量與不確定性消除程度有關(guān)。消除多少不確定性,就獲得多少信息量。用數(shù)學(xué)的語(yǔ)言來(lái)講,不

17、確定就是隨機(jī)性。不確定性的大小可以直觀地看成是事先猜測(cè)某隨機(jī)事件是否發(fā)生的難易程度。4.3.1 4.3.1 統(tǒng)計(jì)編碼原理統(tǒng)計(jì)編碼原理信息量和信息熵信息量和信息熵 圖像的概率分布、信息量和信息熵之間有什么關(guān)系?在圖像編碼壓縮理論研究中,為什么要引入信息論中“熵”值的概念,有什么重要意義?這是我們下面需要說(shuō)明的問(wèn)題。 現(xiàn)以一個(gè)信源編碼器模型來(lái)說(shuō)明 其中其中 X X是消息集是消息集, , 由幾個(gè)信號(hào)單元由幾個(gè)信號(hào)單元xjxj構(gòu)成(構(gòu)成(j=1,2,j=1,2,n,n) Z Z是輸出集,由幾個(gè)碼字是輸出集,由幾個(gè)碼字zjzj構(gòu)成(構(gòu)成(j=1,2,j=1,2,n,n),),zjzj與與xjxj一一一一

18、對(duì)應(yīng)。對(duì)應(yīng)。 AmAm是符號(hào)集,由是符號(hào)集,由m m個(gè)碼元個(gè)碼元aiai構(gòu)成構(gòu)成(i=1,2,(i=1,2,m),m),符號(hào)集中的碼,符號(hào)集中的碼元組成輸出碼字。元組成輸出碼字。 1.信息:是用不確定性的量度定義的。 2.信息量:從N個(gè)相等可能事件中選出一個(gè)事件所需要的信息度量或含量。 3.熵:如果將信源所有可能事件信息量進(jìn)行平均就得到信息的熵(熵就是平均信息量)。 (1). 信源均含有的平均信息量(熵),就是進(jìn)行無(wú)失真編碼的理論極限。 (2). 信源中或多或少的含有自然冗余。 (3). 則信息源X的熵為: 信息量和信息熵信息量和信息熵信息熵H(X)其中,I(Xj)為log2N=-log2(1

19、/n)=-log2P(x)=IP(X) 取以 2為底:公式2Shannon 論文論文 傳輸包括: (1). 傳輸所需要的信息。 (2). 以任意小的失真或零失真接收這些信息。 已經(jīng)證明:只要符號(hào)速率不超過(guò)信道容量C符號(hào)可以以任意小的差錯(cuò)概率向該信道中傳輸。 另外幾種典型的方法是: Fans, Huffman,編碼方法定理,變字長(zhǎng)編碼,最佳編碼定理。 變字長(zhǎng)編碼定理變字長(zhǎng)編碼定理: 在變字長(zhǎng)編碼中,對(duì)于出現(xiàn)概率大的信息符號(hào),編以短字長(zhǎng)的碼,對(duì)于出現(xiàn)概率小的信息符號(hào)編以長(zhǎng)字長(zhǎng)的碼,如果碼字長(zhǎng)度嚴(yán)格按照符號(hào)概率的大小的相反順序排列,則平均碼字長(zhǎng)一定小于按任何其他符號(hào)順序排列方式得到的碼字長(zhǎng)度。 證明

20、:最佳的平均碼字長(zhǎng)度: 公式 其中:其中:P(aiP(ai) )是信源符號(hào)是信源符號(hào)ai ai出現(xiàn)的概率;出現(xiàn)的概率; ni是符號(hào)是符號(hào)ai的編碼長(zhǎng)度。的編碼長(zhǎng)度。 根據(jù)編碼方法定義規(guī)定:根據(jù)編碼方法定義規(guī)定: P(ai)=P(as) nins 如果將如果將ai 的碼字與的碼字與as的碼字互換,則的碼字互換,則: 公式公式 熵、熵編碼原理、變字長(zhǎng)編碼最佳編碼定理。熵、熵編碼原理、變字長(zhǎng)編碼最佳編碼定理。 (二二). Huffman就是利用了這個(gè)定理就是利用了這個(gè)定理進(jìn)行編碼。進(jìn)行編碼。 (1). 把信源符號(hào)按概率大小順序排列,并設(shè)法按逆次序分配碼字的長(zhǎng)度。 (2). 在分配碼字長(zhǎng)度時(shí),首先將出

21、現(xiàn)概率最小的兩個(gè)符號(hào)的概率相加合成一個(gè)概率。 (3). 把這個(gè)合成概率看成是一個(gè)新組合符號(hào)地概率,重復(fù)上述做法直到最后只剩下兩個(gè)符號(hào)概率為止。 (4). 完成以上概率順序排列后,再反過(guò)來(lái)逐步向前進(jìn)行編碼,每一次有三個(gè)分支各賦予一個(gè)二進(jìn)制碼,可以對(duì)概率大的賦為零,概率小的賦為1。 4.3.2 哈夫曼編碼 Huffman 編碼就是利用變字長(zhǎng)最佳編碼實(shí)現(xiàn)信源符號(hào)按概率大小順序排列。 (1)先將信源符號(hào)按概率大小順序排列 (2)出現(xiàn)概率最小的兩個(gè)符號(hào)概率相加合成一個(gè)概率。 (3) 將合成概率看成一個(gè)新組合符號(hào)概率,重復(fù)上述做法,直到最后只剩下兩個(gè)符號(hào)概率為止。 (4) 反過(guò)來(lái)逐步向前編碼,每一步有兩個(gè)

22、分支各賦予一個(gè)二進(jìn)制碼,可以對(duì)概率大的編碼為0。 Huffman 編碼舉例編碼舉例 例如例如: 信源有四個(gè)符號(hào): X a1 a2 a3 a4 1/2 1/4 1/8 1/8 信息熵: H(x)= -1/2log2(1/2)-1/4log2 (1/4)-(1/8log2 (1/8) 2 = 1. .75 bit/字符 采用三元(二進(jìn)制編碼) a1 a2 a3 a4 0 10 110 111 平均碼長(zhǎng):L= (1/2) 1+(1/4) 2+(1/8) (3+3) = 1.75 bit/字符字符 Huffman 編碼樹(shù)編碼樹(shù)a1a2a3a41/21/41/81/81/41/21000111a1a2a

23、3a4010110111L(a1)=1L(a2)=2L(a3)=3L(a4)=3 編碼效率編碼效率 編碼效率:=1.75/1.75=100% 4個(gè)符號(hào) PCM編碼: R= log24=2 bit a1 a2 a3 a4 00 01 10 11 L=2 Pi = 2 編碼效率: =H(x)/L=1.75/2=87.5% Huffman 編碼字長(zhǎng)參差不齊 Huffman編碼在信源編碼概率分布不均 勻時(shí)效率高,所以效率比較均勻時(shí),不用Huffman編碼。 Huffman編碼表省缺。 好處:解決對(duì)稱性,降低了編碼時(shí)間。 概率統(tǒng)計(jì)和Huffman編碼一般不對(duì)稱 4.3.3 4.3.3 算術(shù)編碼算術(shù)編碼1

24、、基本原理 算術(shù)編碼方法是將被編碼的信息表示成實(shí)數(shù)0和1之間的一個(gè)間隔。信息越長(zhǎng)編碼表示它的間隙就越小,表示這一間隙所需二進(jìn)制位就越多,大概率符號(hào)出現(xiàn)的概率越大對(duì)應(yīng)于區(qū)間愈寬,可用長(zhǎng)度較短的碼字表示;小概率符號(hào)出現(xiàn)概率越小區(qū)間愈窄,需要較長(zhǎng)碼字表示。 信息源中連續(xù)的符號(hào)根據(jù)某一模式生成概率的大小來(lái)減少間隔??赡艹霈F(xiàn)的符號(hào)要比不太可能出現(xiàn)的符號(hào)減少范圍少,因此只增加了較少的比特位。 Huffman 編碼使用整數(shù)個(gè)二進(jìn)制位對(duì)符號(hào)進(jìn)行編碼,這種方法在許多情況下無(wú)法得到最優(yōu)的壓縮效果。假設(shè)某個(gè)字符的出現(xiàn)概率為 80%,該字符事實(shí)上只需要 -log2(0.8) = 0.322 位編碼,但 Huffman

25、 編碼一定會(huì)為其分配一位 0 或一位 1 的編碼??梢韵胂?,整個(gè)信息的 80% 在壓縮后都幾乎相當(dāng)于理想長(zhǎng)度的 3 倍左右,壓縮效果可想而知。 算術(shù)編碼對(duì)整條信息(無(wú)論信息有多么長(zhǎng)),其輸出僅僅是一個(gè)數(shù),而且是一個(gè)介于 0 和 1 之間的二進(jìn)制小數(shù)。例如算術(shù)編碼對(duì)某條信息的輸出為 1010001111,那么它表示小數(shù) 0.1010001111,也即十進(jìn)制數(shù) 0.64。 2、自適應(yīng)二進(jìn)制算術(shù)編碼、自適應(yīng)二進(jìn)制算術(shù)編碼 (1)基本工作原理 設(shè)編碼初始化子區(qū)間為0,1設(shè) 大概率 Pe MPS(Most Probable Symbol) 小概率Qe LPS (Least Probable Symbol

26、) Pe=1-Qe 編碼時(shí),設(shè)置兩個(gè)專用寄存器(C,A) 初始時(shí):令 C 寄存器的值為子區(qū)域的起始位置 A 寄存器的值為子區(qū)域的寬度 (該寬度恰好是已輸入符號(hào)串的概率) 初始化時(shí):C=0 A=1 隨著被編碼數(shù)據(jù)源輸入,C和A的內(nèi)容按以下規(guī)律修正: 當(dāng)?shù)透怕史?hào)LPS到來(lái)時(shí): C=C C=C A=AQe A=AQe 當(dāng)高概率符號(hào)MPS到來(lái)時(shí): C=C+AQeC=C+AQe A=APe A=APe=A=A(1-Qe1-Qe)舉例舉例 例: 碼字表示 字符串: 11011111 0 為 LPS Qe= 1/8 =(0.001)b 1 為MPS Pe= 7/8 =(0.111)b 初始狀態(tài): C=0

27、子區(qū)間起始位置 A=1 子區(qū)域?qū)挾?w 頭頭 0.01010.0101尾尾 w 傳送碼字為 0101 0 為 LPS Qe= 1/8 =(0.001)b 1 為 MPS Pe= 7/8 =(0.111)b 設(shè)Qe=1/8,Pe=7/8符號(hào)0的區(qū)間左端為0,1/8,符號(hào)1的區(qū)間為(1/8,1)符號(hào)“0”的子區(qū)間左端為B=0,長(zhǎng)度為L(zhǎng)=1/8;符號(hào)“1”的子區(qū)間左端為B=1/8,長(zhǎng)度為L(zhǎng)=7/8初始狀態(tài): C=0 子區(qū)間起始位置 A=1 子區(qū)間寬度 即初始子區(qū)間為0,1, 0X1w編碼算法過(guò)程如下:w 步序 信源符號(hào) C Aw 1 1 1/8 7/8w 2 1 1/8+1/87/8=15/64 7

28、/87/8=49/64w 3 0 15/64+049/64=15/64 49/641/8=49/512w 4 1 15/64+1/849/512=1009/4096 49/5127/8=343/4096算術(shù)編碼原理圖(P113圖4.11)解碼解碼解碼: 按 Qe Pe分成兩個(gè)子區(qū)間,判斷被解碼的碼字落在哪個(gè)區(qū)間,并賦予對(duì)應(yīng)符號(hào): 設(shè) c=(0.0101) b 是被解碼的值 初始值 A=1 Qe=0.001 當(dāng)c落在0-QeA之間,解碼符號(hào)為 D=0; C=C A=QeA ; 當(dāng)c落在Qe A -A之間,解碼符號(hào)為D=1; C=C-QeA; A=A(1-Qe)算術(shù)編碼的特點(diǎn):算術(shù)編碼的特點(diǎn): (

29、1) 不需要碼表; (2) 當(dāng)信源概率比較接近時(shí),建議使用算術(shù)編碼。 (3) JPEG成員對(duì)多幅圖進(jìn)行算術(shù)編碼效率可以提高5%。JPEG擴(kuò)展系統(tǒng)用算術(shù)編碼代替Huffman。 4.44.4預(yù)測(cè)編碼預(yù)測(cè)編碼4.4.1 4.4.1 基本原理基本原理預(yù)測(cè)編碼是數(shù)據(jù)壓縮理論的一個(gè)重要分支。它根據(jù)離散信號(hào)之間存在一定相關(guān)性的特點(diǎn),利用前面的一個(gè)或多個(gè)信號(hào)對(duì)下一個(gè)信號(hào)進(jìn)行預(yù)測(cè),然后對(duì)實(shí)際值和預(yù)測(cè)值的差(預(yù)測(cè)誤差)進(jìn)行編碼。如果預(yù)測(cè)比較準(zhǔn)確,那么誤差信號(hào)就會(huì)很小,就可以用較少的碼位進(jìn)行編碼,以達(dá)到數(shù)據(jù)壓縮的目的。第n個(gè)符號(hào)Xn的熵滿足:所以參與預(yù)測(cè)的符號(hào)越多,預(yù)測(cè)就越準(zhǔn)確,該信源的不確定性就越小,數(shù)碼率就可

30、以降低。4.4.2 DPCM4.4.2 DPCM和和ADPCMADPCM 一、DPCM 差分脈沖編碼調(diào)制 DPCM 編/解碼原理圖(下頁(yè))1.預(yù)測(cè)器的設(shè)計(jì) 2. ADPCM自適應(yīng)預(yù)測(cè)編碼 這種編碼方法中,量化器的步長(zhǎng)和預(yù)測(cè)器的參數(shù)均能根據(jù)圖象的局部特征作自適應(yīng)的調(diào)整。 3.ADPCM的分類 ADPCM分成兩類: (1)線性自適應(yīng)預(yù)測(cè)器 Yamada(1977年)提出了二維DPCM自適應(yīng)預(yù)測(cè)方案。 (2) 非線性自適應(yīng)預(yù)測(cè)器 引進(jìn)幾個(gè)和臨近象素有關(guān)的值,入i和di非線性改變預(yù)測(cè)的數(shù)。所以,叫非線性的自適應(yīng)預(yù)測(cè)。DPCM DPCM 編編/ /解碼原理圖解碼原理圖輸入輸入輸出輸出 f (i, j)量

31、化器量化器編碼器編碼器預(yù)測(cè)器預(yù)測(cè)器解碼器解碼器預(yù)測(cè)器預(yù)測(cè)器信信道道傳傳輸輸 e (i, j) f (i, j) f (i, j) f (i, j) f (i, j) f (i, j) e (i, j) e (i, j)預(yù)測(cè)方程式預(yù)測(cè)方程式線性預(yù)測(cè): 如果ai是常數(shù),則為時(shí)不變線性預(yù)測(cè),否則為自適應(yīng)線性預(yù)測(cè)(ADPCM) 最簡(jiǎn)單的預(yù)測(cè)方程:11)(kiiikxkax),.,(1321kxxxxfxkk1kkxx最佳線性預(yù)測(cè)最佳線性預(yù)測(cè)使誤差函數(shù)達(dá)到最小值的預(yù)測(cè)方程式叫做最佳線性預(yù)測(cè)。求最佳線性預(yù)測(cè)的各個(gè)參數(shù)ai,列方程組:2)(nnxxEmse)1,.,2,1(,0)(2niaxxEinn11n

32、iiinxax代入得到聯(lián)立方程組:)1,.,2,1(, 11nixxEaxxEnlillin如果為一階線性預(yù)測(cè),則可求得:2111nnnxExxEa11nnxax圖像信號(hào)的預(yù)測(cè)編碼圖像信號(hào)的預(yù)測(cè)編碼一副數(shù)字圖像可以看成一個(gè)空間點(diǎn)陣,圖像信號(hào)不僅在水平方向是相關(guān)的,在垂直方向也是相關(guān)的。根據(jù)已知樣值與待預(yù)測(cè)樣值間的位置關(guān)系,可以分為: (1)一維預(yù)測(cè)(行內(nèi)預(yù)測(cè)):利用同一行上相鄰的樣值進(jìn)行預(yù)測(cè)。 (2)二維預(yù)測(cè)(幀內(nèi)預(yù)測(cè)):利用同一行和前面幾行的數(shù)據(jù)進(jìn)行預(yù)測(cè)。 (3)三維預(yù)測(cè)(幀間預(yù)測(cè)):利用相鄰幾幀(或不同波段)上的取樣值進(jìn)行預(yù)測(cè)靜止圖像的二維預(yù)測(cè)編碼靜止圖像的二維預(yù)測(cè)編碼這種壓縮算法被應(yīng)用到

33、JPEG標(biāo)準(zhǔn)的無(wú)損壓縮模式之中,中等復(fù)雜程度的圖像壓縮比可達(dá)到2:1。cabx選擇值選擇值預(yù)測(cè)值預(yù)測(cè)值0 0非預(yù)測(cè)非預(yù)測(cè)1 1a a2 2b b3 3c c4 4a+b-ca+b-c5 5a+(b-c)/2a+(b-c)/26 6b+(a-c)/2b+(a-c)/27 7(a+b)/2(a+b)/2d三鄰域預(yù)測(cè)法三鄰域預(yù)測(cè)法活動(dòng)圖像的幀間預(yù)測(cè)編碼活動(dòng)圖像的幀間預(yù)測(cè)編碼w 視頻信號(hào)的冗余度主要體現(xiàn)在空間相關(guān)性(幀內(nèi))、時(shí)間相關(guān)性(幀間)和色度空間表示上的相關(guān)性。w 對(duì)于每秒25幀(30)的電視信號(hào),其相繼幀之間存在極強(qiáng)的相關(guān)性。據(jù)統(tǒng)計(jì)256級(jí)灰度的黑白圖像序列,幀間差值超過(guò)3的象素?cái)?shù)不超過(guò)4。所

34、以在活動(dòng)圖像序列中可以利用前面的幀來(lái)預(yù)測(cè)后面的幀,以實(shí)現(xiàn)數(shù)據(jù)壓縮。w 幀間預(yù)測(cè)編碼技術(shù)被廣泛應(yīng)用到H.261、H.263、MPEG-1和MPEG-2等視頻壓縮標(biāo)準(zhǔn)之中。具有運(yùn)動(dòng)補(bǔ)償?shù)膸g預(yù)測(cè)具有運(yùn)動(dòng)補(bǔ)償?shù)膸g預(yù)測(cè)w活動(dòng)圖像序列中的一個(gè)畫(huà)面可以大致劃分為3個(gè)區(qū)域:(1)背景區(qū):相鄰兩個(gè)畫(huà)面的背景區(qū)基本相同。(2)運(yùn)動(dòng)物體區(qū):可以視為由前一個(gè)畫(huà)面的某一區(qū)域的像素平移而成。(位移矢量)(3)暴露區(qū):指物體運(yùn)動(dòng)后而顯露出來(lái)的曾被遮蓋的背景區(qū)域。w運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)就是將前一個(gè)畫(huà)面的背景區(qū)平移前一個(gè)畫(huà)面的背景區(qū)平移后的運(yùn)動(dòng)物體區(qū)后的運(yùn)動(dòng)物體區(qū)作為后一個(gè)畫(huà)面的預(yù)測(cè)值。運(yùn)動(dòng)補(bǔ)償幀間預(yù)測(cè)編碼運(yùn)動(dòng)補(bǔ)償幀間預(yù)測(cè)編碼運(yùn)動(dòng)

35、補(bǔ)償幀間預(yù)測(cè)從原理上包括如下幾個(gè)基本步驟:(1)圖像分割:把圖像劃分為靜止的背景和若干運(yùn)動(dòng)的物體,各個(gè)物體可能有不同的位移,但構(gòu)成同一物體的所有像素的位移相同。(2)運(yùn)動(dòng)矢量估值:考察前后兩個(gè)畫(huà)面,利用運(yùn)動(dòng)估值算法得到每個(gè)物體的位移矢量。(3)運(yùn)動(dòng)補(bǔ)償:用運(yùn)動(dòng)矢量補(bǔ)償物體的運(yùn)動(dòng)效果再進(jìn)行預(yù)測(cè)。(4)編碼:除了對(duì)實(shí)測(cè)值與預(yù)測(cè)值之間的差值進(jìn)行編碼傳送外,還要傳送位移矢量以及區(qū)域分割信息。運(yùn)動(dòng)補(bǔ)償幀間預(yù)測(cè)編碼運(yùn)動(dòng)補(bǔ)償幀間預(yù)測(cè)編碼編碼器編碼器運(yùn)動(dòng)運(yùn)動(dòng)補(bǔ)償補(bǔ)償圖像輸入圖像輸入運(yùn)動(dòng)矢量輸出運(yùn)動(dòng)矢量輸出-譯碼器譯碼器幀幀緩存緩存運(yùn)動(dòng)運(yùn)動(dòng)估值估值預(yù)測(cè)誤差輸出預(yù)測(cè)誤差輸出運(yùn)動(dòng)估計(jì)有下述三種方法:運(yùn)動(dòng)估計(jì)有下述三

36、種方法: (1). 塊匹配法(Block Matching Algorithm BMA)以象素塊為準(zhǔn)進(jìn)行運(yùn)動(dòng)估計(jì)。 (2). 象素遞歸法 (Pixel Recursive Algorithm PRA)以象素為準(zhǔn)進(jìn)行遞歸的運(yùn)動(dòng)估計(jì)。 (3). 傅立葉變換法。 變換編碼變換編碼正交變換:設(shè): 原始圖象為X, 變換矩陣為T(mén), 均為方陣.則: Y = T * X, Y就是變換后的圖象.若 變換矩陣T滿足:T * T = I, T-1*T = I, 則 變換T稱為正交變換.由Y還原出原始圖象X的方法是:因?yàn)?Y = T * X , 所以 X= T * Y 最佳的正交變換最佳的正交變換KL變換變換KL變換

37、的物理意義:KL變換實(shí)質(zhì)上是作坐標(biāo)系的轉(zhuǎn)換,盡量讓向量落在最少的坐標(biāo)軸上或其周圍,從而只用較少的變換系數(shù)就可以恢復(fù)出質(zhì)量不錯(cuò)的圖像,壓縮效率比較高,均方誤差小。缺點(diǎn):圖像變化后變換核矩陣也要相應(yīng)變換,求解過(guò)程比較復(fù)雜,沒(méi)有快捷方法。離散余弦變換離散余弦變換 離散余弦變換(Discrete cosine Transform)簡(jiǎn)稱DCT。任何連續(xù)的實(shí)對(duì)稱函數(shù)的傅里葉變換 中只含余弦項(xiàng),因此余弦變換與傅里葉變換一樣有明確 的物理量意義。DCT是先將整體圖像分成NN像素塊,然后對(duì)NN像素塊逐一進(jìn)行DCT變換。 由于大多數(shù)圖像的高頻分量較小,相應(yīng)于圖像高頻成分的系數(shù)經(jīng)常為零,加上人眼對(duì)高頻成分的 失真不

38、太敏感,所以可用更粗的量化,因此傳送變換系數(shù)所用的數(shù)碼率要大大小于傳送圖像像素所用的數(shù)碼率。到達(dá)接收端后再通過(guò)反離散余弦變換回到樣值,雖然會(huì)有一定的失真 ,但人眼是可以接受的。二維正反離散余弦變換的算式: N代表像素?cái)?shù),一般N=8,88的二維數(shù)據(jù)塊經(jīng)DCT后變成88個(gè)變換系數(shù),這些系數(shù)都 有 明確的物理意義:U代表水平像素號(hào),V代表垂直像素號(hào)。如當(dāng)U=0,V=0時(shí),F(xiàn)(0,0)是原 64個(gè) 樣值的平均,相當(dāng)于直流分量,隨著U、V值增加,相應(yīng)系數(shù)分別代表逐步增加的水平空間頻 率分量和垂直空間頻率分量的大小。 當(dāng)我們先只考慮水平方向上一行數(shù)據(jù)(8個(gè)像素)的情況時(shí),如下圖所示: 嚴(yán)格說(shuō)DCT本身并不

39、能進(jìn)行碼率壓縮,因?yàn)?4個(gè)樣值仍然得到64個(gè)系數(shù),如下圖所示。這 里 給出了一個(gè)88像塊的具體例子,經(jīng)DCT變換后,比特?cái)?shù)增加了。在這個(gè)例子中樣值是8比特 ,從0225得到的直流分量的最大值是原來(lái)256的64/8倍,即02047,交流分 量的范圍是-10241023。只是在經(jīng)過(guò)量化后,特別是按人眼的生理特征對(duì)低頻分量和高頻分 量設(shè)置不同的量化,會(huì)使大多數(shù)高頻分量的系數(shù)變?yōu)榱恪R话阏f(shuō)來(lái),人眼對(duì)低頻分量比較敏 感,而對(duì)高頻分量不太敏感。因此對(duì)低頻分量采用較細(xì)的量化,而對(duì)高頻分量采用較粗的量 化。 4.5多媒體數(shù)據(jù)壓縮的國(guó)際標(biāo)準(zhǔn)多媒體數(shù)據(jù)壓縮的國(guó)際標(biāo)準(zhǔn)w 國(guó)際標(biāo)準(zhǔn)化組織(ISO)w 國(guó)際電子委員會(huì)(

40、IEC)w 國(guó)際電信聯(lián)盟(ITU)有關(guān)圖像壓縮編碼的國(guó)際標(biāo)準(zhǔn):w JPEG標(biāo)準(zhǔn)w MPEG標(biāo)準(zhǔn)w H.261標(biāo)準(zhǔn)算法概要 JPEG(Joint Photographic Experts Group) 是一個(gè)由 ISO和CCITT兩個(gè)組織機(jī)構(gòu)聯(lián)合組成的一個(gè)圖像專家小組,負(fù)責(zé)制定靜態(tài)的數(shù)字圖像數(shù)據(jù)壓縮編碼標(biāo)準(zhǔn),這個(gè)專家組開(kāi)發(fā)的算法稱為JPEG算法,并且成為國(guó)際上通用的標(biāo)準(zhǔn)。JPEG是一個(gè)適用范圍很廣的靜態(tài)圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn),既可用于灰度圖像又可用于彩色圖像。JPEG不僅適于靜止圖像的壓縮,電視圖像的幀內(nèi)圖像的壓縮編碼,也常采用此算法。JPEG標(biāo)準(zhǔn)還可以大范圍地調(diào)節(jié)圖像壓縮率及其保真度。 標(biāo)準(zhǔn)主要采用

41、了兩種基本的壓縮算法,一種是采用以離散余弦變換(DCT)為基礎(chǔ)的有損壓縮算法,另一種是采用以預(yù)測(cè)技術(shù)為基礎(chǔ)的DPCM無(wú)損壓縮算法。JPEG編碼標(biāo)準(zhǔn)編碼標(biāo)準(zhǔn)JPEG編碼標(biāo)準(zhǔn)編碼標(biāo)準(zhǔn)w 基于DPCM的無(wú)損編碼模式:壓縮比可以達(dá)到2:1。w 基于DCT的有損順序編碼模式:壓縮比可以達(dá)到10:1以上。w 基于DCT的遞增編碼模式w 基于DCT的分層編碼模式JPEG規(guī)定了4種運(yùn)行模式,以滿足不同需要:JPEG壓縮的使用范圍壓縮的使用范圍w 可大范圍調(diào)節(jié)圖像壓縮率及其相應(yīng)的圖像保真度,解碼器可參數(shù)化,用戶應(yīng)用可以選擇期望的壓縮質(zhì)量比;w 可用于連接任何連續(xù)色調(diào)數(shù)字圖像,不限制圖像的景象內(nèi)容w 只需一定能力

42、的CPU就可實(shí)現(xiàn),而不要求很高的檔次;w 可運(yùn)行四種模式:無(wú)失真壓縮、基于DCT的順序工作、基于DCT的累進(jìn)工作方式和基于DCT的分層工作方式。JPEG有損順序編碼算法的主要計(jì)算步驟如下:1. 將源圖像分成幾個(gè)顏色平面(分量圖像)。2. 分成88數(shù)據(jù)塊進(jìn)行正向離散余弦變換(FDCT) 2. 量化(quantization)。 3. Z字形排列量化結(jié)果(zigzag scan)。 4. 使用差分脈沖編碼調(diào)制(differential pulse code modulation,DPCM)對(duì)直流系數(shù)(DC)進(jìn)行編碼。 5. 使用行程長(zhǎng)度編碼(run-length encoding,RLE)對(duì) 交流

43、系數(shù)(AC)進(jìn)行編碼。 6. 熵編碼(entropy coding)。JPEG編碼標(biāo)準(zhǔn)編碼標(biāo)準(zhǔn)JPEG編碼標(biāo)準(zhǔn)編碼標(biāo)準(zhǔn)譯碼或者叫做解壓縮的過(guò)程與壓縮編碼過(guò)程正好相反。IDCTIDCTJPEG編碼標(biāo)準(zhǔn)編碼標(biāo)準(zhǔn)正向離散余弦變換 對(duì)每個(gè)單獨(dú)的彩色圖像分量,把整個(gè)分量圖像分成88的圖像塊,如圖所示,并作為兩維離散余弦變換DCT的輸入。通過(guò)DCT變換,把能量集中在少數(shù)幾個(gè)系數(shù)上。DCT變換使用下式計(jì)算逆變換使用下式計(jì)算JPEG編碼標(biāo)準(zhǔn)編碼標(biāo)準(zhǔn)量化 對(duì)于有損壓縮算法,JPEG算法使用如圖所示的均勻量化器進(jìn)行量化,量化步距是按照系數(shù)所在的位置和每種顏色分量的色調(diào)值來(lái)確定。 JPEG編碼標(biāo)準(zhǔn)編碼標(biāo)準(zhǔn)量化 因?yàn)?/p>

44、人眼對(duì)亮度信號(hào)比對(duì)色差信號(hào)更敏感,因此使用了兩種量化表:亮度量化值和色差量化值。此外,由于人眼對(duì)低頻分量的圖像比對(duì)高頻分量的圖像更敏感,因此圖中的左上角的量化步距要比右下角的量化步距小。JPEG編碼標(biāo)準(zhǔn)編碼標(biāo)準(zhǔn)色度量化表 亮度量化表DC系數(shù)DPCM編碼和AC系數(shù)Z形排列之后采用RLE編碼JPEG編碼標(biāo)準(zhǔn)編碼標(biāo)準(zhǔn)AC01AC77行程編碼(直流和交流系數(shù))行程編碼(直流和交流系數(shù))AC01DCAC07AC77AC70熵編碼 使用熵編碼還可以對(duì)DPCM編碼后的直流DC系數(shù)和RLE編碼后的交流AC系數(shù)作進(jìn)一步的壓縮。 JPEG標(biāo)準(zhǔn)規(guī)定了兩種熵編碼算法:哈夫曼編碼和自適應(yīng)算術(shù)編碼。哈夫曼編碼采用的一般是

45、固定的哈夫曼編碼表,而不是臨時(shí)統(tǒng)計(jì)出來(lái)的,并且對(duì)亮度分量和色度分量采用了不同的哈夫曼表。JPEG編碼標(biāo)準(zhǔn)編碼標(biāo)準(zhǔn)基于DPCM的無(wú)損編碼模式:主要采用了三鄰域二維預(yù)測(cè)編碼和熵編碼。無(wú)失真編碼器無(wú)失真編碼器源圖像數(shù)據(jù)壓縮的圖像數(shù)據(jù)預(yù)測(cè)器熵編碼器表說(shuō)明DPCM預(yù)測(cè)編碼框圖JPEG編碼標(biāo)準(zhǔn)編碼標(biāo)準(zhǔn)JPEG編碼標(biāo)準(zhǔn)編碼標(biāo)準(zhǔn)基于DCT的遞增編碼模式: 此模式與順序模式編碼步驟基本一致,不同之處在于遞增模式每個(gè)圖像分量的編碼要經(jīng)過(guò)多次掃描才完成。第一次掃描只進(jìn)行一次粗糙的壓縮,然后根據(jù)此數(shù)據(jù)先重建一幅質(zhì)量低的圖像,以后的掃描再作較細(xì)的掃描,使重建圖像質(zhì)量不斷提高,直到滿意為止。 遞增模式分為兩種: (1)按

46、頻段累進(jìn)。 (2)按位累進(jìn)。JPEG編碼標(biāo)準(zhǔn)編碼標(biāo)準(zhǔn)基于DCT的分層編碼模式:(1)降低原始圖像的空間分辨率。(2)對(duì)已經(jīng)降低分辨率的圖像按照順序編碼模式進(jìn)行壓縮并存儲(chǔ)或傳輸。(3)對(duì)低分辨率圖像進(jìn)行解碼,然后用插值法提高圖像的分辨率。(4)將分辨率已經(jīng)升高的圖像作為原圖像的預(yù)測(cè)值,并把它與原圖像的差值進(jìn)行基于DCT的編碼。(5)重復(fù)步驟3、4直到圖像達(dá)到完整的分辨率。JPEG圖像文件格式圖像文件格式 JPEG標(biāo)準(zhǔn)委員會(huì)沒(méi)有對(duì)JPEG文件格式作出明確的定義,現(xiàn)在被廣泛采用的是1992年9月由C-Cube Microsystems公司提出的JPEG文件交換格式(JPEG File Interch

47、ange Format,JFIF),版本號(hào)為1.02。JFIF文件格式直接使用JPEG標(biāo)準(zhǔn)為應(yīng)用程序定義的許多標(biāo)記,因此JFIF格式成了事實(shí)上JPEG文件交換格式標(biāo)準(zhǔn)。 JEPG文件大體上可以分成兩個(gè)部分:標(biāo)記碼(tag)和壓縮數(shù)據(jù)。標(biāo)記碼部分給出了JPEG圖像的所有信息,如圖像的寬、高、Huffman表、量化表等等。JPEG圖像文件格式圖像文件格式w JPEG文件使用的顏色空間是電視圖像信號(hào)數(shù)字化標(biāo)準(zhǔn)ITU-RBT 601推薦標(biāo)準(zhǔn)規(guī)定的YCbCr彩色空間。從RGB轉(zhuǎn)換成YCbCr的計(jì)算公式如下: Y = 0.299 R + 0.587G + 0.114 B Cb = - 0.1687R -

48、0.3313G + 0.5B + 128 Cr = 0.5 R - 0.4187G - 0.0813 B + 1284、運(yùn)動(dòng)圖像壓縮編碼的國(guó)際標(biāo)準(zhǔn)(MPEG I, ,和)隨著數(shù)字化、網(wǎng)絡(luò)化、全球一體化信息時(shí)代的來(lái)臨,多媒體技術(shù)成為信息技術(shù)的重要組成部分。它包括聲音、圖形、數(shù)據(jù)以及圖像在內(nèi)的多種媒體信息的傳送和處理,其關(guān)鍵在于壓縮技術(shù)。此外,在多媒體的傳輸、處理、應(yīng)用中還有許多問(wèn)題:如何在網(wǎng)絡(luò)上傳輸視頻?如何通過(guò)手機(jī)上網(wǎng)并接收視頻和圖像?如何對(duì)多媒體數(shù)據(jù)進(jìn)行快速有效的檢索?如何對(duì)多媒體信息進(jìn)行統(tǒng)一的存?。康鹊?。 MPEG是活動(dòng)圖像專家組(Moving Picture Exports Group)

49、英文的縮寫(xiě),于1988年成立,是為數(shù)字視/音頻制定壓縮標(biāo)準(zhǔn)的專家組,目前已擁有300多名成員,包括IBM、SUN、BBC、NEC、INTEL、AT&T等世界知名公司。MPEG組織最初得到的授權(quán)是制定用于“活動(dòng)圖像”編碼的各種標(biāo)準(zhǔn),隨后擴(kuò)充為“及其伴隨的音頻”及其組合編碼。后來(lái)針對(duì)不同的應(yīng)用需求,解除了“用于數(shù)字存儲(chǔ)媒體”的限制,成為現(xiàn)在制定“活動(dòng)圖像和音頻編碼”標(biāo)準(zhǔn)的組織。MPEG組織制定的各個(gè)標(biāo)準(zhǔn)都有不同的目標(biāo)和應(yīng)用,目前已提出MPEG-1、MPEG-2、MPEG-4、MPEG-7和MPEG-21標(biāo)準(zhǔn)。 MPEG-1標(biāo)準(zhǔn)及其應(yīng)用標(biāo)準(zhǔn)及其應(yīng)用MPEG-1標(biāo)準(zhǔn)于1993年8月公布,用于傳

50、輸1.5Mbps數(shù)據(jù)傳輸率的數(shù)字存儲(chǔ)媒體運(yùn)動(dòng)圖像及其伴音的編碼。該標(biāo)準(zhǔn)包括五個(gè)部分:第一部分說(shuō)明了如何根據(jù)第二部分(視頻)以及第三部分(音頻)的規(guī)定,對(duì)音頻和視頻進(jìn)行復(fù)合編碼。第四部分說(shuō)明了檢驗(yàn)解碼器或編碼器的輸出比特流符合前三部分規(guī)定的過(guò)程。第五部分是一個(gè)用完整的C語(yǔ)言實(shí)現(xiàn)的編碼和解碼器。該標(biāo)準(zhǔn)從頒布的那一刻起,MPEG-1取得一連串的成功,如VCD和MP3的大量使用,Windows95以后的版本都帶有一個(gè)MPEG-1軟件解碼器,可攜式MPEG-1攝像機(jī)等等。 MPEG1曾經(jīng)是VCD的主要壓縮標(biāo)準(zhǔn),是目前實(shí)時(shí)視頻壓縮的主流,可適用于不同帶寬的設(shè)備,如CD-ROM、Video-CD、CD-I。

51、與M-JPEG技術(shù)相比較,在實(shí)時(shí)壓縮、每幀數(shù)據(jù)量、處理速度上均有顯著的提高。MPEG1可以滿足多達(dá)16路以上25幀/秒的壓縮速度,在500kbit/s的壓縮碼流和352像素288行的清晰度下,每幀大小僅為2k。若從VCD到超級(jí)VCD到DVD的不同格式來(lái)看,MPEG1的352 288格式,MPEG2可有576352、704 576等,用于CDROM上存儲(chǔ)同步和彩色運(yùn)動(dòng)標(biāo)視頻信號(hào),旨在達(dá)到VCR(模擬式磁帶錄放機(jī)Video Cassette Recorder;VCR)質(zhì)量,其視頻壓縮率為26:1。 MPEG1可使圖像在空間軸上最多壓縮1/38,在時(shí)間軸上對(duì)相對(duì)變化較小的數(shù)據(jù)最多壓縮1/5。MPEG

52、1壓縮后的數(shù)據(jù)傳輸率為1.5Mbps,壓縮后的源輸入格式SIF(Source Input Format),分辨率為352像素288行(PAL制),亮度信號(hào)的分辨率為360240,色度信號(hào)的分辨率為180120,每秒30幀。MPEG1對(duì)色差分量采用4:1:1的二次采樣率。MPEG1、MPEG2是傳送一張張不同動(dòng)作的局部畫(huà)面。在實(shí)現(xiàn)方式上,MPEG1可以借助于現(xiàn)有的解碼芯片來(lái)完成,而不像M-JPEG那樣過(guò)多依賴于主機(jī)的CPU。與軟件壓縮相比,硬件壓縮可以節(jié)省計(jì)算機(jī)資源,降低系統(tǒng)成本。 但也存在著諸多不足:一、壓縮比還不夠大,在多路監(jiān)控情況下,錄像所要求的磁盤(pán)空間過(guò)大。尤其當(dāng)DVR主機(jī)超過(guò)8路時(shí),為

53、了保存一個(gè)月的存儲(chǔ)量,通常需要10個(gè)80G硬盤(pán),或更多,硬盤(pán)投資大,而由此引起的硬盤(pán)故障和維護(hù)更是叫人頭疼。二、是圖像清晰度還不夠高。由于MPEG1最大清晰度僅為352 X 288,考慮到容量、模擬數(shù)字量化損失等其它因素,回放清晰度不高,這也是市場(chǎng)反應(yīng)的主要問(wèn)題。三、是對(duì)傳輸圖像的帶寬有一定的要求,不適合網(wǎng)絡(luò)傳輸,尤其是在常用的低帶寬網(wǎng)絡(luò)上無(wú)法實(shí)現(xiàn)遠(yuǎn)程多路視頻傳送。四、是MPEG1的錄像幀數(shù)固定為每秒25幀,不能丟幀錄像,使用靈活性較差。從目前廣泛采用的壓縮芯片來(lái)看,也缺乏有效的調(diào)控手段,例如關(guān)鍵幀設(shè)定、取樣區(qū)域設(shè)定等等,造成在保安監(jiān)控領(lǐng)域應(yīng)用不適合,造價(jià)也高 。MPEG-2標(biāo)準(zhǔn)及其應(yīng)用標(biāo)準(zhǔn)及

54、其應(yīng)用MPEG-2制定于1994年,設(shè)計(jì)目標(biāo)是高級(jí)工業(yè)標(biāo)準(zhǔn)的圖象質(zhì)量以及更高的傳輸率。MPEG-2所能提供的傳輸率在3-10Mbits/sec間,其在NTSC制式下的分辨率可達(dá)720X486,MPEG-2也可提供并能夠提供廣播級(jí)的視像和CD級(jí)的音質(zhì)。MPEG-2的音頻編碼可提供左右中及兩個(gè)環(huán)繞聲道,以及一個(gè)加重低音聲道,和多達(dá)7個(gè)伴音聲道(DVD可有8種語(yǔ)言配音的原因)。由于MPEG-2在設(shè)計(jì)時(shí)的巧妙處理,使得大多數(shù)MPEG-2解碼器也可播放MPEG-1格式的數(shù)據(jù),如VCD。 MPEG-2圖像壓縮的原理是利用了圖像中的兩種特性:空間相關(guān)性和時(shí)間相關(guān)性。一幀圖像內(nèi)的任何一個(gè)場(chǎng)景都是由若干像素點(diǎn)構(gòu)

55、成的,因此一個(gè)像素通常與它周圍的某些像素在亮度和色度上存在一定的關(guān)系,這種關(guān)系叫作空間相關(guān)性;一個(gè)節(jié)目中的一個(gè)情節(jié)常常由若干幀連續(xù)圖像組成的圖像序列構(gòu)成,一個(gè)圖像序列中前后幀圖像間也存在一定的關(guān)系,這種關(guān)系叫作時(shí)間相關(guān)性。這兩種相關(guān)性使得圖像中存在大量的冗余信息。如果我們能將這些冗余信息去除,只保留少量非相關(guān)信息進(jìn)行傳輸,就可以大大節(jié)省傳輸頻帶。而接收機(jī)利用這些非相關(guān)信息,按照一定的解碼算法,可以在保證一定的圖像質(zhì)量的前提下恢復(fù)原始圖像。一個(gè)好的壓縮編碼方案就是能夠最大限度地去除圖像中的冗余信息。 MPEG-2的編碼圖像被分為三類,分別稱為I幀,P幀和B幀。I幀圖像采用幀內(nèi)編碼方式,即只利用了

56、單幀圖像內(nèi)的空間相關(guān)性,而沒(méi)有利用時(shí)間相關(guān)性。I幀使用幀內(nèi)壓縮,不使用運(yùn)動(dòng)補(bǔ)償,由于I幀不依賴其它幀,所以是隨機(jī)存取的入點(diǎn),同時(shí)是解碼的基準(zhǔn)幀。I幀主要用于接收機(jī)的初始化和信道的獲取,以及節(jié)目的切換和插入,I幀圖像的壓縮倍數(shù)相對(duì)較低。I幀圖像是周期性出現(xiàn)在圖像序列中的,出現(xiàn)頻率可由編碼器選擇。P幀和B幀圖像采用幀間編碼方式,即同時(shí)利用了空間和時(shí)間上的相關(guān)性。P幀圖像只采用前向時(shí)間預(yù)測(cè),可以提高壓縮效率和圖像質(zhì)量。P幀圖像中可以包含幀內(nèi)編碼的部分,即P幀中的每一個(gè)宏塊可以是前向預(yù)測(cè),也可以是幀內(nèi)編碼。B幀圖像采用雙向時(shí)間預(yù)測(cè),可以大大提高壓縮倍數(shù)。值得注意的是,由于B幀圖像采用了未來(lái)幀作為參考,

57、因此MPEG-2編碼碼流中圖像幀的傳輸順序和顯示順序是不同的。MPEG-2的編碼碼流分為六個(gè)層次。為更好地表示編碼數(shù)據(jù),MPEG-2用句法規(guī)定了一個(gè)層次性結(jié)構(gòu)。它分為六層,自上到下分別是:圖像序列層、圖像組(GOP)、圖像、宏塊條、宏塊、塊。MPEG-2標(biāo)準(zhǔn)的主要應(yīng)用如下:1、視音頻資料的保存 2、非線性編輯系統(tǒng)及非線性編輯網(wǎng)絡(luò)3、衛(wèi)星傳輸4、電視節(jié)目的播出同時(shí),由于MPEG-2的出色性能表現(xiàn),已能適用于HDTV,使得原打算為HDTV設(shè)計(jì)的MPEG-3,還沒(méi)出世就被拋棄了。(MPEG-3要求傳輸速率在20Mbits/sev-40Mbits/sec間,但這將使畫(huà)面有輕度扭曲)。而現(xiàn)在網(wǎng)絡(luò)上大行其

58、道的數(shù)字音樂(lè)格式 MP3并不是MPEG3,而是MPEG1的第三層 (MPEG1 Layer3) 。除了作為DVD的指定標(biāo)準(zhǔn)外,MPEG-2還可用于為廣播,有線電視網(wǎng),電纜網(wǎng)絡(luò)以及衛(wèi)星直播 (Direct Broadcast Satellite) 提供廣播級(jí)的數(shù)字視頻。 從技術(shù)層面講,MP4使用的是MPEG-2 AAC技術(shù),也就是簡(jiǎn)稱為A2B或AAC的技術(shù)。它的特點(diǎn)是音質(zhì)更加完美而壓縮比更大(15:1-20:1)。MPEG-2 AAC在采樣頻率為896KHz時(shí)可提供148個(gè)聲道可選范圍的高質(zhì)量音頻編碼。AAC就是Advanced Audio Coding(先進(jìn)音頻編碼)的縮寫(xiě),它適用于從比特率為

59、8kbps單聲道的電話語(yǔ)音音質(zhì)到160kbps多聲道超高質(zhì)量音頻信號(hào)范圍內(nèi)的編碼,并且允許對(duì)多媒體進(jìn)行編碼/解碼。它增加了諸如對(duì)立體聲的完美再現(xiàn)、比特流效果音掃描、多媒體控制、降噪等MP3沒(méi)有的特性,使得在音頻壓縮后仍能完美的再現(xiàn)CD的音質(zhì)。 wMPEG-2的另一特點(diǎn)是,其可提供一個(gè)較廣的范圍改變壓縮比,以適應(yīng)不同畫(huà)面質(zhì)量,存儲(chǔ)容量,以及帶寬的要求。w 對(duì)于最終用戶來(lái)說(shuō),由于現(xiàn)存電視機(jī)分辨率限制,MPEG-2所帶來(lái)的高清晰度畫(huà)面質(zhì)量(如DVD畫(huà)面)在電視上效果并不明顯,倒是其音頻特性(如加重低音,多伴音聲道等)更引人注目。w MPEG2是DVD的壓縮標(biāo)準(zhǔn),對(duì)每秒30幀的720576分辨率的視頻

60、信號(hào)進(jìn)行壓縮,適用于計(jì)算機(jī)顯示質(zhì)量的圖像,壓縮后的數(shù)據(jù)率為6Mbps,它將視頻節(jié)目中的視頻、音頻、數(shù)據(jù)內(nèi)容等組成部分復(fù)合成單一的比特流,以便在網(wǎng)上傳送或者在存儲(chǔ)設(shè)備中存放的壓縮。在DVR產(chǎn)品中只有少量采用MPEG2壓縮標(biāo)準(zhǔn)。MPEG-4標(biāo)準(zhǔn)及其應(yīng)用標(biāo)準(zhǔn)及其應(yīng)用 運(yùn)動(dòng)圖像專家組MPEG 于1999年2月正式公布了MPEG-4(ISO/IEC14496)標(biāo)準(zhǔn)第一版本。同年年底MPEG-4第二版亦告底定,且于2000年年初正式成為國(guó)際標(biāo)準(zhǔn)。MPEG-4與MPEG-1和MPEG-2有很大的不同。MPEG-4不只是具體壓縮算法,它是針對(duì)數(shù)字電視、交互式繪圖應(yīng)用(影音合成內(nèi)容)、交互式多媒體(WWW、資料擷取與分

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論