光電圖像處理-圖像編碼_第1頁
光電圖像處理-圖像編碼_第2頁
光電圖像處理-圖像編碼_第3頁
光電圖像處理-圖像編碼_第4頁
光電圖像處理-圖像編碼_第5頁
已閱讀5頁,還剩115頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

光電圖像處理

(六)圖像編碼電子工程學(xué)院光電子技術(shù)系16.1圖像編碼概述6.2哈夫曼編碼6.3香農(nóng)-范諾編碼6.4行程編碼6.5

LZW編碼6.6算術(shù)編碼6.7預(yù)測(cè)編碼6.8圖像編碼的國際標(biāo)準(zhǔn)主要內(nèi)容26.1圖像編碼概述6.2哈夫曼編碼6.3香農(nóng)-范諾編碼6.4行程編碼6.5

LZW編碼6.6算術(shù)編碼6.7預(yù)測(cè)編碼6.8圖像編碼的國際標(biāo)準(zhǔn)主要內(nèi)容36.1

圖像編碼概述6.1.1

圖像編碼技術(shù)的研究背景

6.1.2圖像編碼基本原理

6.1.3圖像編碼的方法

6.1.4圖像編碼新技術(shù)

6.1.5圖像編碼評(píng)價(jià)4

6.1.1圖像編碼技術(shù)的研究背景通信方式的改變

文字+語音

圖像+文字+語音通信對(duì)象的改變

人與人

人與機(jī)器,機(jī)器與機(jī)器1.信息傳輸方式發(fā)生了很大的改變5

(a)彩色視頻信息對(duì)于電視畫面的分辨率640

480的彩色圖像,每秒30幀,則一秒鐘的數(shù)據(jù)量為:

640

480

24

30=221.184Mbit

所以播放時(shí),需要221Mbps的通信回路。參考數(shù)據(jù):寬帶網(wǎng)為512K,電話線為56K。存儲(chǔ)時(shí),1張CD可存640M,則僅可以存放2.89秒的數(shù)據(jù)。2.圖像傳輸與存儲(chǔ)需要的信息量空間6

(b)傳真數(shù)據(jù)如果只傳送2值圖像,以200dpi的分辨率傳輸,一張A4稿紙的內(nèi)容的數(shù)據(jù)量為:3888768bit

按目前14.4K的電話線傳輸速率,需要傳送的時(shí)間是:270秒(4.5分)

按每分鐘4元計(jì)算:18元

由于通信方式和通信對(duì)象的改變帶來的最大問題是:

傳輸帶寬、速度、存儲(chǔ)器容量的限制。給我們帶來的一個(gè)難題,也給了我們一個(gè)機(jī)會(huì):

如何用軟件的手段來解決硬件上的物理極限。7圖像信息源圖像預(yù)處理圖像信源

編碼信道編碼調(diào)制信道傳輸解調(diào)信道解碼圖像信源

解碼顯示圖像

圖像通信系統(tǒng)模型81.數(shù)字圖像的冗余的概念6.1.2圖像編碼基本原理

你的妻子,Helen,將于明天晚上6點(diǎn)零5分在上海的虹橋機(jī)場(chǎng)接你。

(23

2+10=56個(gè)半角字符)

你的妻子將于明天晚上6點(diǎn)零5分在虹橋機(jī)場(chǎng)接你。

(20

2+3=43個(gè)半角字符)

Helen將于明晚6點(diǎn)在虹橋接你。

(10

2+7=27個(gè)半角字符)結(jié)論:只要接收端不會(huì)產(chǎn)生誤解,就可以減少承載信息的數(shù)據(jù)量。9描述語言

(1)“這是一幅2

2的圖像,圖像的第一個(gè)像素是紅的,第二個(gè)像素是紅的,第三個(gè)像素是紅的,第四個(gè)像素是紅的”。

(2)“這是一幅2

2的圖像,整幅圖都是紅色”。

由此我們知道,整理圖像的描述方法可以達(dá)到壓縮的目的。10圖像冗余無損壓縮的原理RGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGB16RGB從原來的16

3

8=384bits壓縮為:(1+3)

8=32bits11圖像冗余有損壓縮的原理3635343434343432343433373034343434343434343534343134343434343434343434343434343434343434343434343434253412

空間冗余:圖像內(nèi)部相鄰像素之間存在較強(qiáng)的相關(guān)性所造成的冗余。

時(shí)間冗余:視頻圖像序列中的不同幀之間的相關(guān)性所造成的冗余。視覺冗余:是指人眼不能感知或不敏感的那部分圖像信息。2.數(shù)字圖像冗余的分類13信息熵冗余:也稱編碼冗余,如果圖像中平均每個(gè)像素使用 的比特?cái)?shù)大于該圖像的信息熵,則圖像中存在冗 余,這種冗余稱為信息熵冗余。結(jié)構(gòu)冗余:是指圖像中存在很強(qiáng)的紋理結(jié)構(gòu)或自相似性。知識(shí)冗余:是指在有些圖像中還包含與某些先驗(yàn)知識(shí)有關(guān)的信 息。圖像編碼的目的:充分利用圖像中存在的各種冗余信息,特別是空間冗余、時(shí)間冗余以及視覺冗余,以盡量少的比特?cái)?shù)來表示圖像。14幾種常見應(yīng)用的碼率15有損壓縮:存在信息損耗,不能精確重建原始圖像,存在一定程度的失真。包括哈夫曼編碼、行程編碼和算術(shù)編碼無損壓縮:不存在信息損失,解壓縮時(shí)能夠從壓縮數(shù)據(jù)精確地恢復(fù)原始圖像。包括預(yù)測(cè)編碼、變換編碼等等。6.1.3圖像編碼的方法

1.根據(jù)編碼過程是否存在信息損耗16熵編碼:基于信號(hào)統(tǒng)計(jì)特性的編碼技術(shù),無損編碼?;驹硎墙o出現(xiàn)概率較大的符號(hào)賦予一個(gè)短碼字,而給出現(xiàn)概率較小的符號(hào)賦予一個(gè)長碼字,從而使得最終的平均碼長很小。包括行程編碼(RunLengthEncoding)、哈夫曼編碼和算術(shù)編碼等。預(yù)測(cè)編碼:基于圖像數(shù)據(jù)的空間或時(shí)間冗余特性,用相鄰的已知像素(或像素塊)來預(yù)測(cè)當(dāng)前像素(或像素塊)的取值,然后再對(duì)預(yù)測(cè)誤差進(jìn)行量化和編碼??煞譃閹瑑?nèi)預(yù)測(cè)和幀間預(yù)測(cè),常用的預(yù)測(cè)編碼有差分脈沖碼調(diào)制(DifferentialPulseCodeModulation,DPCM)和運(yùn)動(dòng)補(bǔ)償法。2.根據(jù)編碼原理17變換編碼:是將空間域上的圖像經(jīng)過正交變換映射到另一變換域上,使變換后的系數(shù)之間的相關(guān)性降低。圖像變換本身并不能壓縮數(shù)據(jù),但變換后圖像的大部分能量只集中到少數(shù)幾個(gè)變換系數(shù)上,采用適當(dāng)?shù)牧炕挽鼐幋a就可以有效地壓縮圖像?;旌暇幋a:混合編碼是指綜合了熵編碼、變換編碼或預(yù)測(cè)編碼的編碼方法,如JPEG標(biāo)準(zhǔn)和MPEG標(biāo)準(zhǔn)。18信息保持編碼:也稱無失真編碼,它要求在編解碼過程中保證圖像信息不丟失,從而可以完整地重建圖像。保真度編碼:利用人眼的視覺特性,在允許的失真(Lossy)條件下或一定的保真度準(zhǔn)則下,最大限度地壓縮圖像。特征提取:在圖像識(shí)別、分析和分類等技術(shù)中,往往并不需要全部圖像信息,而只要對(duì)感興趣的部分特征信息進(jìn)行編碼即可壓縮數(shù)據(jù)。3.根據(jù)對(duì)壓縮編碼后的圖像進(jìn)行重建的準(zhǔn)確程度196.1.4

圖像編碼新技術(shù)

分形編碼(FractalCoding):最大限度地利用了圖像在空間域上的自相似性(即局部與整體之間存在某種相似性),通過消除圖像的幾何冗余來壓縮數(shù)據(jù)。小波編碼(WaveletCoding):經(jīng)過小波變換后的圖像,具有良好的空間方向選擇性,而且是多分辨率的,能夠保持原圖像在各種分辨率下的精細(xì)結(jié)構(gòu),與人的視覺特性十分吻合。模型編碼(ModelBasedCoding):在編、解碼兩端分別建立起相同的模型,編碼時(shí)利用先驗(yàn)?zāi)P统槿D像中的主要信息并用模型參數(shù)的形式表示,解碼時(shí)則利用所接收的模型參數(shù)重建圖像。

206.1.5

圖像編碼評(píng)價(jià)

1.

算法的編碼效率2.

編碼圖像的質(zhì)量3.

算法的適用范圍4.

算法的復(fù)雜程度

一般來說,評(píng)價(jià)圖像壓縮算法的優(yōu)劣主要有以下4個(gè)參數(shù):21R——平均碼字長度r——圖像的壓縮比(rate)bps——每秒鐘所需的傳輸比特?cái)?shù)(bitspersecond)η——圖像熵與平均碼長之比1.

算法的編碼效率

22

設(shè)一幅灰度級(jí)為N的圖像,圖像中第k級(jí)灰度出現(xiàn)的概率為Pk,圖像大小為Nx

Ny,每個(gè)像素用d比特表示,每兩幀圖像間隔Δt。

對(duì)于一種圖像編碼方法,設(shè)第k級(jí)灰度的碼字長度為Bk,則該圖像的平均碼字長度R為:則按信息論中信息熵的定義,則數(shù)字圖像的熵H為:由此可見,圖像熵H表示各灰度級(jí)比特?cái)?shù)的統(tǒng)計(jì)平均值。23編碼效率η為:

每秒鐘所需的傳輸比特?cái)?shù)bps為:壓縮比r為:

由于同一壓縮算法對(duì)不同圖像的編碼效率會(huì)有所不同,因此常需定義一些“標(biāo)準(zhǔn)圖像”,一般通過測(cè)量不同壓縮算法對(duì)同一組“標(biāo)準(zhǔn)圖像”的編碼性能來評(píng)價(jià)各圖像壓縮算法的編碼效率。

未壓縮前信源的碼長242.編碼圖像的質(zhì)量圖像質(zhì)量評(píng)價(jià)可分為:客觀質(zhì)量評(píng)價(jià)和主觀質(zhì)量評(píng)價(jià)。最常用的客觀質(zhì)量評(píng)價(jià)指標(biāo)是:均方誤差(MSE)和峰值信噪比(PSNR)。25

主觀質(zhì)量評(píng)價(jià)是指:由一批觀察者對(duì)編碼圖像進(jìn)行觀察并打分,然后綜合所有人的評(píng)判結(jié)果,給出圖像的質(zhì)量評(píng)價(jià)??陀^質(zhì)量評(píng)價(jià)能夠快速有效地評(píng)價(jià)編碼圖像的質(zhì)量,但符合客觀質(zhì)量評(píng)價(jià)指標(biāo)的圖像不一定具有較好的主觀質(zhì)量。主觀質(zhì)量評(píng)價(jià)能夠與人的視覺效果相匹配,但其評(píng)判過程緩慢費(fèi)時(shí)。

26

特定的圖像編碼算法具有其相應(yīng)的適用范圍,并不對(duì)所有圖像都有效。一般說來,大多數(shù)基于圖像信息統(tǒng)計(jì)特性的壓縮算法具有較廣的適用范圍,而一些特定的編碼算法的適用范圍較窄,如分形編碼主要用于自相似性高的圖像。

3.算法的適用范圍27

算法的復(fù)雜度即指完成圖像壓縮和解壓縮所需的運(yùn)算量和硬件實(shí)現(xiàn)該算法的難易程度。優(yōu)秀的壓縮算法要求有較高的壓縮比,壓縮和解壓縮快,算法簡單,易于硬件實(shí)現(xiàn),還要求解壓縮后的圖像質(zhì)量較好。選用編碼方法時(shí)一定要考慮圖像信源本身的統(tǒng)計(jì)特性、多媒體系統(tǒng)(硬件和軟件產(chǎn)品)的適應(yīng)能力、應(yīng)用環(huán)境以及技術(shù)標(biāo)準(zhǔn)。4.算法的復(fù)雜程度

286.1圖像編碼概述

6.2哈夫曼編碼6.3香農(nóng)-范諾編碼6.4行程編碼6.5

LZW編碼6.6算術(shù)編碼6.7預(yù)測(cè)編碼6.8圖像編碼的國際標(biāo)準(zhǔn)主要內(nèi)容296.2哈夫曼編碼

1.哈夫曼編碼的理論基礎(chǔ)

R≥H——總可設(shè)計(jì)出一種無失真編碼;R>>H時(shí),表明該編碼方法效率很低;R等于或很接近于H時(shí)——最佳編碼,無失真;R<H時(shí),壓縮比較高,但會(huì)引起圖像失真。

30設(shè)D為編碼所使用的數(shù)制,則變長最佳編碼的平均碼字長度R的范圍為:

變長最佳編碼定理:在變長編碼中,如果碼字長度嚴(yán)格按照對(duì)應(yīng)符號(hào)出現(xiàn)的概率大小逆序排列,則其平均碼字長度為最小,這就是變長最佳編碼定理。變長最佳編碼定理是哈夫曼編碼的理論基礎(chǔ)。31

2.哈夫曼編碼算法

首先,統(tǒng)計(jì)信源中各符號(hào)出現(xiàn)的概率,按符號(hào)出現(xiàn)的概率從大到小排序。把最小的兩個(gè)概率相加合并成新的概率,與剩余的概率組成新的概率集合。對(duì)新的概率集合重新排序,再次把其中最小的兩個(gè)概率相加,組成新的概率集合。如此重復(fù)進(jìn)行,直到最后兩個(gè)概率的和為1。32

分配碼字。碼字分配從最后一步開始反向進(jìn)行,對(duì)于每次相加的兩個(gè)概率,給大的賦“0”,小的賦“1”(也可全部相反)讀出時(shí)由該符號(hào)開始一直走到最后的概率和“1”,將路線上所遇到的“0”和“1”按最低位到最高位的順序排好,就是該符號(hào)的哈夫曼編碼。33

例:設(shè)一幅灰度級(jí)為8(分別用S0、S1、S2、S3、S4、S5、S6、S7表示)的圖像中,各灰度所對(duì)應(yīng)的概率分別為0.40、0.18、0.10、0.10、0.07、0.06、0.05、0.04。現(xiàn)對(duì)其進(jìn)行哈夫曼編碼:

34035下面來看一下哈夫曼編碼的編碼效率。平均碼長R為:36數(shù)字圖像的熵H為:

則哈夫曼編碼的編碼效率η為:

37

對(duì)不同概率分布的信源,哈夫曼編碼的編碼效率有所差別。根據(jù)信息論中信源編碼理論,對(duì)于二進(jìn)制編碼,當(dāng)信源概率為2的負(fù)冪次方時(shí),哈夫曼編碼的編碼效率可達(dá)100%,其平均碼字長度也很短,而當(dāng)信源概率為均勻分布時(shí),其編碼效果明顯降低。38哈夫曼編碼在不同概率分布下的編碼效果對(duì)比39哈夫曼編碼的特點(diǎn):1)哈夫曼編碼構(gòu)造出來的編碼值不是唯一的。原因是在給兩個(gè)最小概率的圖像的灰度值進(jìn)行編碼時(shí),可以是大概率為“0”,小概率為“1”,也可相反。當(dāng)兩個(gè)灰度值的概率相等時(shí),“0”、“1”的分配也是人為定義的,這就造成了編碼的不唯一性。但不影響解碼的正確性。

2)當(dāng)圖像灰度值分布很不均勻時(shí),哈夫曼編碼的效率就高。當(dāng)信源概率是2的負(fù)冪次方時(shí),編碼效率為100%,而在圖像灰度值的概率分布比較均勻時(shí),其編碼效果最差。

3)哈夫曼編碼必須先計(jì)算出圖像數(shù)據(jù)的概率特性,再形成編碼表后,才能對(duì)圖像數(shù)據(jù)編碼,因此,哈夫曼編碼缺乏構(gòu)造性。即不能使用某種數(shù)學(xué)模型建立信源符號(hào)與編碼之間的對(duì)應(yīng)關(guān)系,而必須通過查找的方法,建立起他們之間的對(duì)應(yīng)關(guān)系。如果信源符號(hào)很多,那么碼表就會(huì)很大,這勢(shì)必會(huì)影響到存儲(chǔ)與傳輸。40Step1:精確地統(tǒng)計(jì)出原始圖像中每個(gè)灰度值出現(xiàn)的概率;Step2:建立哈夫曼樹并進(jìn)行編碼。在計(jì)算哈夫曼編碼表時(shí)需要對(duì)原始的圖象掃描兩遍:

由于需要建立二叉樹并遍歷二叉樹生成編碼,數(shù)據(jù)壓縮和還原速度都較慢。但是該編碼方法簡單有效,而且編碼效率相當(dāng)高,因而應(yīng)用非常廣泛。41

我們知道,對(duì)一幅圖像進(jìn)行編碼時(shí),如果圖像的大小大于256時(shí),這幅圖像的不同的碼字就有可能是很大,例如極限為256個(gè)不同的碼字。對(duì)整幅圖直接進(jìn)行Huffman編碼時(shí),小分布的灰度值,就有可能具有很長的編碼。如:100位以上,這樣不但達(dá)不到壓縮的效果反而會(huì)使數(shù)據(jù)量加大,應(yīng)該如何處理?Question??42

常用的且有效的方法是:將圖像分割成若干的小塊,對(duì)每塊進(jìn)行獨(dú)立的Huffman編碼。例如:分成8×8的子塊,就可以大大降低不同灰度值的個(gè)數(shù)(最多是64而不是256)。436.1圖像編碼概述6.2哈夫曼編碼6.3香農(nóng)-范諾編碼6.4行程編碼6.5

LZW編碼6.6算術(shù)編碼6.7預(yù)測(cè)編碼6.8圖像編碼的國際標(biāo)準(zhǔn)主要內(nèi)容446.3

香農(nóng)-范諾編碼

香農(nóng)-范諾(Shannon-Fannon)編碼也是一種常見的可變字長編碼。與哈夫曼編碼相似,當(dāng)信源符號(hào)出現(xiàn)的概率正好為2-i(i>0)時(shí),采用香農(nóng)-范諾編碼同樣能夠達(dá)到100%的編碼效率。香農(nóng)-范諾編碼的理論基礎(chǔ)是符號(hào)的碼字長度Ni完全由該符號(hào)出現(xiàn)的概率來決定,即式中,D為編碼所用的數(shù)制。

45香農(nóng)-范諾編碼的步驟如下:

(1)將信源符號(hào)按其出現(xiàn)概率從大到小排序;(2)計(jì)算出各概率對(duì)應(yīng)的碼字長度Ni;(3)計(jì)算累加概率Ai,即

Ai=Ai-1+Pi-1i=1,2,…,N-1;A0=0

(4)把各個(gè)累加概率Ai由十進(jìn)制轉(zhuǎn)化為二進(jìn)制,取該二進(jìn)制數(shù)的前Ni位作為對(duì)應(yīng)信源符號(hào)的碼字。46香農(nóng)-范諾編碼47二分法香農(nóng)-范諾編碼方法:

(1)首先統(tǒng)計(jì)出每個(gè)符號(hào)出現(xiàn)的概率;(2)對(duì)上述概率從大到小排序;(3)從這個(gè)概率集合中的某個(gè)位置將其分為兩個(gè)子集合,并盡量使兩個(gè)子集合的概率和近似相等,給前面一個(gè)子集合賦值為0,后面一個(gè)子集合賦值為1;(4)重復(fù)步驟3,直到各個(gè)子集合中只有一個(gè)元素為止;(5)將每個(gè)元素所屬的子集合的值依次串起來,即可得到各個(gè)元素的香農(nóng)-范諾編碼。48二分法香農(nóng)-范諾編碼496.1圖像編碼概述6.2哈夫曼編碼6.3香農(nóng)-范諾編碼

6.4行程編碼6.5

LZW編碼6.6算術(shù)編碼6.7預(yù)測(cè)編碼6.8圖像編碼的國際標(biāo)準(zhǔn)主要內(nèi)容506.4

行程編碼

將具有相同值的連續(xù)串用其串長和一個(gè)代表值來代替,該連續(xù)串就稱為行程,串長稱為行程長度。例如

aaaa

bbb

cc

d

eeeee

fffffff(共22

8=176bits)

4a3b2c1d5e7f

(共12

8=96bits)

1.行程編碼基本原理和方法

行程編碼——行程長度編碼(RunLengthEncoding,RLE)51

定長編碼:編碼的行程長度所用的二進(jìn)制位數(shù)固定。

變長行程編碼:對(duì)不同范圍的行程長度使用不同位數(shù)的二進(jìn)制位進(jìn)行編碼。使用變長行程編碼需要增加標(biāo)志位來表明所使用的二進(jìn)制位數(shù)。

2.行程編碼的分類3.

行程編碼的應(yīng)用1)行程編碼比較適合于二值圖像的編碼,一般用于量化后出現(xiàn)大量零系數(shù)連續(xù)的場(chǎng)合,用行程來表示連零碼。

2)如果圖像是由很多塊顏色或灰度相同的大面積區(qū)域組成的,那么采用行程編碼可以達(dá)到很高的壓縮比。

3)如果圖像中的數(shù)據(jù)非常分散,則行程編碼不但不能壓縮數(shù)據(jù),反而會(huì)增加圖像文件的大小。這時(shí)一般和其他編碼結(jié)合使用。52傳真件中一般都是白色比較多,而黑色相對(duì)比較少。所以可能常常會(huì)出現(xiàn)如下的情況:

600w3b100w12b4w3b200w

上面的行程編碼所需用的字節(jié)數(shù)為:7

因?yàn)椋?12<600<1024

所以:計(jì)數(shù)值必須用10bit來表示

10

7=70bit在傳真中的應(yīng)用53

現(xiàn)在我們就希望對(duì)其有一個(gè)改善。白色:10bit,黑色:4bit

600W3b100w12b4w3b200w

所需字節(jié)數(shù)為:

4

10+3

4=52bit

比原來的方式10

7=70bit減少了18bit54PCX文件:文件頭+圖像壓縮數(shù)據(jù)+256色調(diào)色板。文件頭全長128字節(jié),包含了圖像的大小和顏色以及PCX文件的版本標(biāo)識(shí)等信息。圖像壓縮數(shù)據(jù)緊跟在文件頭之后。按顏色平面和掃描行存儲(chǔ)。如果沒有使用調(diào)色板,那么圖像壓縮數(shù)據(jù)存儲(chǔ)的是實(shí)際像素值;否則,存儲(chǔ)的是調(diào)色板的索引值。4.PCX文件中的行程編碼PCX格式是ZSOFT公司在開發(fā)圖像處理軟件Paintbrush時(shí)開發(fā)的一種格式,基于PC的繪圖程序的專用格式,一般的桌面排版、圖形藝術(shù)和視頻捕獲軟件都支持這種格式。PCX支持256色調(diào)色板或全24位的RGB,圖像大小最多達(dá)64K

64K像素。不支持CMYK或HSI顏色模式,photoshop等多種圖像處理軟件均支持PCX格式。PCX壓縮屬于無損壓縮。551)圖像數(shù)據(jù)以字節(jié)為單位進(jìn)行編碼的,每行填充到偶數(shù)字節(jié).2)PCX文件規(guī)定編碼時(shí)的最大行程長度為63,如果行程長度大于63,則必須分多次存儲(chǔ)。對(duì)于長度大于1的行程,編碼時(shí)先存入其行程長度(長度L加上192即0xC0),再存入該行程的代表值,行程長度和行程的代表值分別占一字節(jié)。

3)如果遇到不重復(fù)的像素值,如果該像素值小于等于0xC0,則直接存入該像素值。否則首先存入一個(gè)0xC1,然后再存入該像素值。這樣做是為了避免該像素值被誤認(rèn)為是數(shù)據(jù)長度。

4)對(duì)于連續(xù)重復(fù)的像素值,統(tǒng)計(jì)其連續(xù)出現(xiàn)的次數(shù)iCount(最大取值為63),先存入長度信息(iCount|0xC0),然后再存入像素值。如果連續(xù)次數(shù)超過63次,則必須分多次處理。例如,連續(xù)132個(gè)0x98,編碼時(shí)必須分三次處理,編碼結(jié)果為:0xFF0x980xFF0x980xC60x98。編碼原則:56從壓縮數(shù)據(jù)部分讀取一個(gè)字節(jié),判斷該值是否大于0xC0如果大于0xC0,則表明該字節(jié)是行程長度信息,取其低六位(相當(dāng)于減去0xC0)作為行程長度L,讀取下一個(gè)字節(jié)作為像素值并重復(fù)L次存入圖像數(shù)據(jù)緩沖區(qū)如果小于等于0xC0,直接將該字節(jié)存入圖像數(shù)據(jù)緩沖區(qū)。256色PCX文件解碼:雖然幾乎所有的圖像應(yīng)用軟件都支持PCX文件格式,但由于它的壓縮比不高,因而現(xiàn)在用得不是很多。576.1圖像編碼概述6.2哈夫曼編碼6.3香農(nóng)-范諾編碼6.4行程編碼6.5

LZW編碼6.6算術(shù)編碼6.7預(yù)測(cè)編碼6.8圖像編碼的國際標(biāo)準(zhǔn)主要內(nèi)容586.5LZW編碼

LZW(Lempel-Ziv&Welch)——又稱字串表編碼,無損編碼。

LZW編碼與行程編碼類似,也是對(duì)字符串進(jìn)行編碼從而實(shí)現(xiàn)壓縮,但它在編碼的同時(shí)還生成了特定字符串以及與之對(duì)應(yīng)的索引字符串表。59對(duì)文件進(jìn)行編碼的同時(shí),生成了特定字符序列的表以及它們對(duì)應(yīng)的代碼。比如8位圖像編成12位碼,除了256代表原來8位字符,其他代碼分配給在壓縮過程中出現(xiàn)的字符串。(如字符對(duì))當(dāng)表中沒有的字符串第一次出現(xiàn)的時(shí)候,原樣保存,同時(shí)將分配它的代碼也一起保存。只有如果這個(gè)字符串再次出現(xiàn),只存儲(chǔ)代碼。字符串表在壓縮中動(dòng)態(tài)生成,而且也不用存儲(chǔ),解壓時(shí)可以由壓縮文件中信息重構(gòu)它。LZW編碼原則:60

GIF(GraphicsInterchangeFormat)是由CompuServe公司開發(fā)的一種壓縮位圖格式。它可支持多達(dá)256種的顏色,具有極佳的壓縮效率,已成為Internet上一種流行的文件格式。GIF圖像文件采用的是一種改良的LZW壓縮算法,通常稱為GIF-LZW壓縮算法。GIF-LZW壓縮編碼61S1、S2——兩個(gè)存放字符串的臨時(shí)變量LZW_CLEAR——字符表初始化標(biāo)志LZW_EOI編碼結(jié)束標(biāo)志設(shè):(1)根據(jù)圖像中使用的顏色數(shù)初始化一個(gè)字串表,字串表中的每個(gè)顏色對(duì)應(yīng)一個(gè)索引。在初始字串表的末尾再添加兩個(gè)符號(hào)(LZW_CLEAR和LZW_EOI)的索引。設(shè)置字符串變量S1、S2并初始化為空。(2)接著輸出LZW_CLEAR在字串表中的索引。編碼步驟:62(3)從圖像數(shù)據(jù)流中第一個(gè)字符(假設(shè)數(shù)據(jù)以字符串表示)開始,每次讀取一個(gè)字符,將其賦給字符串變量S2。(4)判斷“S1+S2”是否已存在于字串表中。如果字串表中存在“S1+S2”,則S1=S1+S2;否則,輸出S1在字串表中的索引,并在字串表末尾為“S1+S2”添加索引,同時(shí),S1=S2。(5)重復(fù)第3和第4步,直到所有字符讀完為止。(6)輸出S1中的字符串在字串表中的索引,然后輸出結(jié)束標(biāo)志LZW_EOI的索引,編碼完畢。63GIF-LZW解碼流程

64

設(shè)有一來源于4色(以a、b、c、d表示)圖像的數(shù)據(jù)流aabcabbbbd,現(xiàn)對(duì)其進(jìn)行LZW編碼。編碼過程如下:編碼前,首先需要初始化一個(gè)字符串表。

LZW編碼實(shí)例字符串索引a0Hb1Hc2Hd3HLZW_CLEAR4HLZW_EOI5H65GIF-LZW編碼過程編碼結(jié)果:4001271B35(十六進(jìn)制表示)b66GIF-LZW解碼過程676.1圖像編碼概述6.2哈夫曼編碼6.3香農(nóng)-范諾編碼6.4行程編碼6.5

LZW編碼6.6算術(shù)編碼6.7預(yù)測(cè)編碼6.8圖像編碼的國際標(biāo)準(zhǔn)主要內(nèi)容686.6算術(shù)編碼

基于信源概率統(tǒng)計(jì)特性的固定編碼模式針對(duì)未知信源概率模型的自適應(yīng)模式基本原理:將被編碼的數(shù)據(jù)序列表示成0和1之間的一個(gè)間隔(即一個(gè)小數(shù)范圍),該間隔的位置與輸入數(shù)據(jù)的概率分布有關(guān)。

算術(shù)編碼有兩種模式:69例:設(shè)一待編碼的數(shù)據(jù)序列(即信源)為“dacab”,信源中各符號(hào)出現(xiàn)的概率依次為P(a)=0.4,P(b)=0.2,P(c)=0.2,P(d)=0.2。首先,數(shù)據(jù)序列中的各數(shù)據(jù)符號(hào)在區(qū)間[0,1]內(nèi)的間隔(賦值范圍)設(shè)定為a=[0,0.4),b=[0.4,0.6),c=[0.6,0.8),d=[0.8,1.0)StartN=StartB+LeftC×L

EndN=StartB+RightC×L

70

第一個(gè)被壓縮的符號(hào)為“d”,其初始間隔為[0.8,1.0);第二個(gè)被壓縮的符號(hào)為“a”,由于前面的符號(hào)“d”的取值區(qū)間被限制在[0.8,1.0)范圍內(nèi),所以“a”的取值范圍應(yīng)在前一符號(hào)間隔[0.8,1.0)的[0,0.4)子區(qū)間內(nèi),根據(jù)上式可知:StartN=0.8+0×(1.0-0.8)=0.8EndN=0.8+0.4×(1.0-0.8)=0.88即“a”的實(shí)際編碼區(qū)間在[0.8,0.88)之間。71

第三個(gè)被壓縮的符號(hào)為“c”,其編碼取值范圍應(yīng)在[0.8,0.88)區(qū)間的[0.6,0.8)的子區(qū)間內(nèi),據(jù)上式可知

第四個(gè)被壓縮的符號(hào)為“a”,其編碼取值范圍應(yīng)在[0.848,0.864)區(qū)間的[0,0.4)的子區(qū)間內(nèi)StartN=0.848+0×(0.864-0.848)=0.848

EndN=0.848+0.4×(0.864-0.848)=0.854472

第五個(gè)被壓縮的符號(hào)為“b”,其編碼取值范圍應(yīng)在[0.848,0.8544)區(qū)間的[0.4,0.6)的子區(qū)間內(nèi)StartN=0.848+0.4×(0.8544-0.848)=0.85056

EndN=0.848+0.6×(0.8544-0.848)=0.85184至此,數(shù)據(jù)序列“dacab”已被描述為一個(gè)實(shí)數(shù)區(qū)間[0.85056,0.85184],或者說在此區(qū)間內(nèi)的任一實(shí)數(shù)值都唯一對(duì)應(yīng)該數(shù)據(jù)序列。這樣,就可以用一個(gè)實(shí)數(shù)表示這一數(shù)據(jù)序列。我們把區(qū)間[0.85056,0.85184]用二進(jìn)制形式表示為[0.110110011011,

0.110110100001]。73

在這個(gè)區(qū)間中,0.1101101位于這個(gè)區(qū)間內(nèi)并且其編碼最短,故把其作為數(shù)據(jù)序列“dacab”的編碼輸出。考慮到算術(shù)編碼中任一數(shù)據(jù)序列的編碼都含有“0.”,所以在編碼時(shí),可以不考慮“0.”,于是把1101101作為本例中的數(shù)據(jù)序列的算術(shù)編碼。由此可見,數(shù)據(jù)序列“dacab”用7比特的二進(jìn)制代碼就可以表示,平均碼長為1.4比特/字符。

746.1圖像編碼概述6.2哈夫曼編碼6.3香農(nóng)-范諾編碼6.4行程編碼6.5

LZW編碼6.6算術(shù)編碼6.7預(yù)測(cè)編碼6.8圖像編碼的國際標(biāo)準(zhǔn)主要內(nèi)容756.7預(yù)測(cè)編碼預(yù)測(cè):根據(jù)過去時(shí)刻的樣本序列,采用一種模型預(yù)測(cè)當(dāng)前的樣本值;預(yù)測(cè)編碼的基本思想:通過僅提取每個(gè)像素中的新信息并對(duì)它們編碼來消除像素間的相關(guān)性和冗余性。1個(gè)象素的新信息——該像素的當(dāng)前或現(xiàn)實(shí)值與預(yù)測(cè)值的差。前提:像素間具有相關(guān)性。1.無損預(yù)測(cè)編碼2.有損預(yù)測(cè)編碼76輸入圖像預(yù)測(cè)器整數(shù)舍入符號(hào)編碼器fn+-en壓縮圖像1.無損預(yù)測(cè)編碼預(yù)測(cè)器符號(hào)解碼器fn+en壓縮圖像+解壓圖像772.

有損預(yù)測(cè)編碼輸入圖像預(yù)測(cè)器符號(hào)編碼器fn+-en壓縮圖像量化器++預(yù)測(cè)器符號(hào)編碼器+壓縮圖像+解壓圖像786.1圖像編碼概述6.2哈夫曼編碼6.3香農(nóng)-范諾編碼6.4行程編碼6.5

LZW編碼6.6算術(shù)編碼6.7預(yù)測(cè)編碼6.8圖像編碼的國際標(biāo)準(zhǔn)主要內(nèi)容796.8圖像編碼的國際標(biāo)準(zhǔn)1.靜止圖像壓縮標(biāo)準(zhǔn)

JPEG2.運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)

MPEG

近十年來,圖像編碼技術(shù)得到了迅速發(fā)展和廣泛應(yīng)用,并且日臻成熟,其標(biāo)志就是幾個(gè)圖像壓縮國際標(biāo)準(zhǔn)的制定。即關(guān)于靜止圖像的編碼標(biāo)準(zhǔn)JPEG和JPEG2000、關(guān)于電話/會(huì)議電視的視頻編碼標(biāo)準(zhǔn)H.261,H.263和關(guān)于活動(dòng)圖像的編碼標(biāo)準(zhǔn)MPEG-1,MPEG-2,

MPEG-4和H.264等。JPEG(JointPhotographicExpertGroup);MPEG(MotionPictureExpertsGroup)80圖像壓縮國際標(biāo)準(zhǔn)標(biāo)準(zhǔn)標(biāo)題起止日期目標(biāo)比特率應(yīng)用場(chǎng)合主要編碼技術(shù)JPEG連續(xù)色調(diào)靜態(tài)圖像1986.3~1992.10壓縮比為2~30·因特網(wǎng)·數(shù)字照相·圖像/視頻編輯·DCT·知覺量化·霍夫曼編碼·算術(shù)編碼JPEG2000新一代靜態(tài)圖像編碼標(biāo)準(zhǔn)1996.2~2000.12壓縮比為2~50·因特網(wǎng)·移動(dòng)通信·數(shù)字照相·遙感·傳真·數(shù)字圖書館·JPEG所有技術(shù)·小波變換·EBCOTROI編碼·可擴(kuò)展編碼81標(biāo)準(zhǔn)標(biāo)題目標(biāo)比特率應(yīng)用場(chǎng)合主要編碼技術(shù)MPEG-1運(yùn)動(dòng)圖像及其伴音不超過1.5Mb/s·光盤存儲(chǔ)·VCD·視頻監(jiān)控·JPEG所有技術(shù)·自適應(yīng)量化·運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)MPEG-2運(yùn)動(dòng)圖像及其伴音1.5~35Mb/s·數(shù)字高清晰度電視·高品質(zhì)視頻·衛(wèi)星/有線電視·地面廣播·MPEG-1所有技術(shù)·基于幀/場(chǎng)的運(yùn)動(dòng)補(bǔ)償·擴(kuò)展編碼·容錯(cuò)編碼82標(biāo)準(zhǔn)標(biāo)題目標(biāo)比特率應(yīng)用場(chǎng)合主要編碼技術(shù)MPEG-4音視頻對(duì)象的通用編碼8kb/s~35Mb/s·因特網(wǎng)·交互式視頻·2D/3D計(jì)算機(jī)圖形·移動(dòng)通信·MPEG-2所有技術(shù)·小波變換·運(yùn)動(dòng)估計(jì)/補(bǔ)償·可擴(kuò)展編碼·位圖形狀編碼·對(duì)象編碼·動(dòng)態(tài)網(wǎng)絡(luò)編碼MPEG-7多媒體描述接口·多媒體數(shù)據(jù)庫等MPEG-21多媒體框架83標(biāo)準(zhǔn)標(biāo)題目標(biāo)比特率應(yīng)用場(chǎng)合主要編碼技術(shù)H.261Px64kb/s的音視頻服務(wù)Px64kb/s(p:1~30)·ISDN視頻會(huì)議·DCT·自適應(yīng)量化·運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)·運(yùn)動(dòng)估計(jì)·霍夫曼編碼H.263低比特率通信的視頻編碼8kb/s~1.5Mb/s·POTS視頻電話·桌面視頻電話·移動(dòng)視頻電話·H.261所有技術(shù)·雙向運(yùn)動(dòng)補(bǔ)償·半像素運(yùn)動(dòng)估計(jì)·高級(jí)運(yùn)動(dòng)估計(jì)·重疊運(yùn)動(dòng)補(bǔ)償·算術(shù)編碼84JPEG(jointpictureexpertgroup)——面向靜態(tài)圖像編碼的標(biāo)準(zhǔn)。在相同圖像質(zhì)量條件下,JPEG文件擁有比其他圖像文件格式更高的壓縮比。JPEG目前被廣泛應(yīng)用于多媒體和網(wǎng)絡(luò)程序中,是現(xiàn)今萬維網(wǎng)中使用最廣泛的兩種圖像文件格式之一。JPEG是一種有損壓縮,即在壓縮過程中會(huì)丟失數(shù)據(jù),每次編輯JPEG圖像后,圖像就會(huì)被重復(fù)壓縮一次,損失就會(huì)有所增加。

1.靜止圖像壓縮標(biāo)準(zhǔn)——JPEG851)順序式(Sequential)DCT方式

2)漸進(jìn)式(Progressive)DCT方式JPEG允許的四種編碼模式:

頻譜選擇法逐次逼近法3)無失真(Lossless)方式

4)分層(Hierarchical)方式861)順序式(Sequential)DCT方式:從左到右、從上到下對(duì)圖像順序進(jìn)行基于離散余弦變換(DCT)的編碼。DCT理論上是可逆的,但在計(jì)算時(shí)存在誤差,因而基于DCT的編碼模式是一種有損編碼。2)漸進(jìn)式(Progressive)DCT方式:基于DCT,對(duì)圖像分層次進(jìn)行處理,從模糊到清晰地傳輸圖像(與GIF文件的交錯(cuò)方式類似)。有兩種實(shí)現(xiàn)方法,一種是頻譜選擇法,即按Z形掃描的序號(hào)將DCT量化序數(shù)分成幾個(gè)頻段,每個(gè)頻段對(duì)應(yīng)一次掃描,每塊均先傳送低頻掃描數(shù)據(jù),得到原圖概貌,再依次傳送高頻掃描數(shù)據(jù),使圖像逐漸清晰;另一種是逐次逼近法,即每次掃描全部DCT量化序數(shù),但每次的表示精度逐漸提高。873)無失真(Lossless)方式:使用線性預(yù)測(cè)器,如DPCM,而不是基于DCT。4)分層(Hierarchical)方式:在空間域?qū)⒃磮D像以不同的分辨率表示,每個(gè)分辨率對(duì)應(yīng)一次掃描,處理時(shí)可以基于DCT或預(yù)測(cè)編碼,可以是漸進(jìn)式,也可以是順序式。差分脈沖編碼調(diào)制88

1)基本系統(tǒng)(BaselineSystem)

2)擴(kuò)展系統(tǒng)(ExtendedSystem)

3)無失真壓縮系統(tǒng)(LosslessSystem)一個(gè)符合JPEG標(biāo)準(zhǔn)的編解碼器至少要滿足基本系統(tǒng)的技術(shù)指標(biāo)?;镜腏PEG算法屬于變換類編碼,下面針對(duì)基于DCT的順序式基本系統(tǒng)編碼來說明JPEG的編碼方法。

JPEG定義了三種系統(tǒng):89JPEG編碼/解碼的流程圖

熵編碼即編碼過程中按熵原理不丟失任何信息的編碼。信息熵為信源的平均信息量(不確定性的度量)。常見的熵編碼有:香農(nóng)(Shannon)編碼、哈夫曼(Huffman)編碼和算術(shù)編碼(arithmeticcoding)。在視頻編碼中,熵編碼把一系列用來表示視頻序列的元素符號(hào)轉(zhuǎn)變?yōu)橐粋€(gè)用來傳輸或是存儲(chǔ)的壓縮碼流。輸入的符號(hào)可能包括量化后的變換系數(shù),運(yùn)動(dòng)向量,頭信息(宏塊頭,圖像頭,序列的頭等)以及附加信息(對(duì)于正確解碼來說重要的標(biāo)記位信息)。901)數(shù)據(jù)分塊

將圖像從RGB空間轉(zhuǎn)換到Y(jié)CbCr空間。將每個(gè)分量圖像分割成不重疊的8×8像素塊——DU(DataUnit)。在YCbCr空間中壓縮圖像的每個(gè)彩色分量。二次采樣——采用不同的采樣頻率對(duì)圖像采樣。由于亮度比色彩更重要,因而對(duì)Y分量的采樣頻率可高于對(duì)Cb、Cr的采樣頻率,這樣有利于節(jié)省存儲(chǔ)空間。YCbCr其中Y是指亮度分量,Cb指藍(lán)色色度分量,而Cr指紅色色度分量。

91把采樣頻率最低的分量圖像中一個(gè)DU所對(duì)應(yīng)的像區(qū)上覆蓋的所有各分量上的DU按順序編組為一個(gè)最小編碼單元(MCU)。

對(duì)灰度圖像而言,只有一個(gè)Y分量,MCU就是一個(gè)數(shù)據(jù)單元。對(duì)彩色圖像而言,以4:1:1的采樣方案為例,則一個(gè)MCU由4個(gè)Y分量的DU、1個(gè)Cb分量的DU和1個(gè)Cr分量的DU組成。92

以MCU為單位順序?qū)U進(jìn)行二維離散余弦變換。對(duì)以無符號(hào)數(shù)表示的具有P位精度的輸入數(shù)據(jù),在DCT前要減去2P-1,轉(zhuǎn)換成有符號(hào)數(shù),而在IDCT后,應(yīng)加上2P-1,轉(zhuǎn)換成無符號(hào)數(shù)。對(duì)每個(gè)8×8的數(shù)據(jù)塊DU進(jìn)行DCT后,得到的64個(gè)系數(shù)代表了該圖像塊的頻率成分,其中低頻分量集中在左上角,高頻分量分布在右下角。系數(shù)矩陣左上角的叫做直流(DC)系數(shù),它代表了該數(shù)據(jù)塊的平均值,其余63個(gè)叫交流(AC)系數(shù)。2)DCT處理93

在DCT處理中得到的64個(gè)系數(shù)中,低頻分量包含了圖像亮度等主要信息。在從空間域到頻域的變換中,圖像中的緩慢變化比快速變化更易引起人眼的注意,所以在重建圖像時(shí),低頻分量的重要性高于高頻分量。因而在編碼時(shí)可以忽略高頻分量,從而達(dá)到壓縮的目的,這也是量化的根據(jù)和目的。3)系數(shù)量化94亮度量化表色度量化表95DCT系數(shù)量化后,構(gòu)成一個(gè)稀疏矩陣,用Z(Zigzag)形掃描將其變成一維數(shù)列,將有利于熵編碼。Z形掃描的順序如圖所示。DCT系數(shù)的Z形掃描順序

4)Z形掃描

96DC系數(shù)反映了一個(gè)8×8數(shù)據(jù)塊的平均亮度,一般與相鄰塊有較大的相關(guān)性。

JPEG對(duì)DC系數(shù)作差分編碼,即用前一數(shù)據(jù)塊的同一分量的DC系數(shù)作為當(dāng)前塊的預(yù)測(cè)值,再對(duì)當(dāng)前塊的實(shí)際值與預(yù)測(cè)值的差值作哈夫曼編碼。

5)DC系數(shù)編碼97

若DC系數(shù)的動(dòng)態(tài)范圍為-1024~+1024,則差值的動(dòng)態(tài)范圍為-2047~+2047。如果為每個(gè)差值賦予一個(gè)碼字,則碼表過于龐大。采用“前綴碼(SSSS)+尾碼”來表示。前綴碼指明了尾碼的有效位數(shù)B,可以根據(jù)DIFF(DC系數(shù)的差值)從對(duì)應(yīng)表中查出前綴碼對(duì)應(yīng)的哈夫曼編碼。尾碼的取值取決于DC系數(shù)的差值和前綴碼。如果DC系數(shù)的差值DIFF大于等于0,則尾碼的碼字為DIFF的B位原碼;否則,取DIFF的B位反碼。98

經(jīng)Z形排列后的AC系數(shù),更有可能出現(xiàn)連續(xù)0組成的字符串,——行程編碼將有利于壓縮數(shù)據(jù)。

JPEG將一個(gè)非零DC系數(shù)及其前面的0行程長度(連續(xù)0的個(gè)數(shù))的組合稱為一個(gè)事件。將每個(gè)事件編碼表示為“NNNN/SSSS+尾碼”,

NNNN——0行程的長度

SSSS——尾碼的有效位數(shù)B(即當(dāng)前非0系數(shù)所占的比特?cái)?shù)),如果非零AC系數(shù)大于等于0,則尾碼的碼字為該系數(shù)的B位原碼,否則,取該系數(shù)的B位反碼。6)AC系數(shù)編碼992.運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)H.261:主要為電視會(huì)議等應(yīng)用制訂。也稱P×64標(biāo)準(zhǔn)??稍试S通過T1線路(帶寬為1.544Mbit/s)以小于150ms的延遲傳輸運(yùn)動(dòng)視頻。

MPEG-1:娛樂質(zhì)量的視頻壓縮標(biāo)準(zhǔn),主要用于數(shù)字媒體上壓縮圖像數(shù)據(jù)的儲(chǔ)存和提取。

MPEG-2:用于視頻傳輸?shù)膲嚎s標(biāo)準(zhǔn),適用于從普通電視直到高清晰度電視的帶寬范圍。

MPEG-4:適應(yīng)在窄帶寬上對(duì)動(dòng)態(tài)圖像進(jìn)行傳輸?shù)囊?。可?duì)各種音頻視頻AV進(jìn)行有效的編碼,同時(shí)支持固定碼流和變碼流。100一、MPEG-1視頻壓縮標(biāo)準(zhǔn)

MPEG-1是由ISO/IEC于1991年提出的,正式名稱為“用于數(shù)字存儲(chǔ)媒體的1.5Mbit/s以下的活動(dòng)圖像及相關(guān)音頻編碼”(ISO/IEC11172)。其中的數(shù)字存儲(chǔ)媒體包括光盤(CD),視頻光盤(VCD),其中分配比特的方案是在1.5Mbps的數(shù)據(jù)傳輸中1.2Mbps用于編碼視頻,256Kbps用于立體聲。MPEG-1包括五個(gè)部分:系統(tǒng)、視頻、音頻、一致性、及軟件。在MPEG-1只采用逐行掃描方式,采用4:2:0的亞采樣格式,其源輸入格式是SIF,有352x288x25和352x288x30兩種格式。101MPEG-1采用兩種壓縮方法:幀內(nèi)壓縮算法:采用與JPEG壓縮算法大致相同的方法,即基于DCT的變換編碼技術(shù),用以減少空間冗余信息。幀間壓縮算法:采用運(yùn)動(dòng)補(bǔ)償算法、預(yù)測(cè)編碼方法、以及差補(bǔ)法等編碼方法。幀間編碼技術(shù)可以減少時(shí)間冗余信息。102MPEG-1視頻壓縮編碼算法在MPEG-1編碼中,為了支持隨機(jī)訪問與高效壓縮的要求,定義了四種編碼類型:

I幀圖像編碼(幀內(nèi)圖像)、

P幀圖像編碼(預(yù)測(cè)圖像)、

B幀圖像編碼(差補(bǔ)圖或雙向預(yù)測(cè)圖像)。

D幀圖像編碼(直流分量圖像)這四種類型的幀按某種方式組織在一起就構(gòu)成了GOP。103I幀圖像的編碼

I幀圖像是利用圖像的空間相關(guān)性進(jìn)行壓縮,其壓縮編碼采用類似JPEG壓縮算法,同時(shí)I幀圖像又是P幀圖像和B幀圖像的參考圖像,所以I幀圖像壓縮率不高,壓縮倍數(shù)在8倍左右。

幀內(nèi)圖像I不參照任何過去的或者將來的其它圖像幀,壓縮編碼采用類似JPEG壓縮算法:如果電視圖像是用RGB空間表示的,則首先把它轉(zhuǎn)換成YCrCb空間表示的圖像。每個(gè)圖像平面分成8×8的圖塊,對(duì)每個(gè)圖塊進(jìn)行離散余弦變換DCT。DCT變換后經(jīng)過量化的交流分量系數(shù)后進(jìn)行Z掃描,然后再使用無損壓縮技術(shù)進(jìn)行編碼。104DCT變換后經(jīng)過量化的直流分量系數(shù)采用差分脈沖編碼DPCM,交流分量系數(shù)采用游程編碼RLE,然后再采用哈夫曼(Huffman)編碼或者用算術(shù)編碼。105P幀圖像的編碼

P幀圖像是參考過去的I幀圖像(幀內(nèi)圖像)或者過去的預(yù)測(cè)得到P幀圖像用運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)技術(shù)進(jìn)行編碼,這些預(yù)測(cè)圖像通常作為進(jìn)一步預(yù)測(cè)的參考幀,預(yù)測(cè)圖像的編碼效率較高。

P幀圖像的編碼也是以圖像宏塊為基本編碼單元。預(yù)測(cè)編碼的基礎(chǔ)是運(yùn)動(dòng)估值,它將直接影響到整個(gè)系統(tǒng)的編碼效率和壓縮性能,因此希望找到一種預(yù)測(cè)精度高同時(shí)計(jì)算量又小的運(yùn)動(dòng)估值算法。106P幀編碼時(shí),編碼器需要對(duì)每一個(gè)宏塊作以下選擇:(1)決定是否作運(yùn)動(dòng)補(bǔ)償(MC/No-MC),即是將運(yùn)動(dòng)矢量發(fā)送出去,還是設(shè)其為0。在許多情況下,使用非零的運(yùn)動(dòng)矢量并不比使用零值的運(yùn)動(dòng)矢量所形成的誤差少多少。而非零運(yùn)動(dòng)矢量需要額外的編碼比特,因此這時(shí)可設(shè)運(yùn)動(dòng)矢量為0,這樣可以提高編碼效率。(2)決定采用幀內(nèi)編碼還是幀間編碼,即是采用幀內(nèi)宏塊編碼還是利用運(yùn)動(dòng)矢量預(yù)測(cè)編碼。在許多情況下,某些宏塊采用幀內(nèi)編碼方式也許會(huì)用更少的比特。這通常發(fā)生在由于運(yùn)動(dòng)十分劇烈而導(dǎo)致運(yùn)動(dòng)估計(jì)失敗的情況。107(3)決定宏塊要不要編碼。有時(shí)在量化后,宏塊中所有的DCT系數(shù)都是0,這種宏塊就不需要被編碼。在對(duì)這種宏塊解碼時(shí),只需要從過去的幀中把對(duì)應(yīng)的宏塊復(fù)制到這個(gè)宏塊就行了。(4)決定量化等級(jí)是否符合要求,是否需要改變。108B幀圖像的編碼

B幀圖像(或稱雙向圖)在預(yù)測(cè)時(shí),既可使用前向預(yù)測(cè)方式,也可使用后向預(yù)測(cè)方式,或同時(shí)使用雙向預(yù)測(cè)后取平均方式(雙向幀間預(yù)測(cè)),取決于哪一種方式下表示該宏塊所需的信息量為最少。使用雙向預(yù)測(cè)后,可以使那些在前一幀中預(yù)測(cè)不到的內(nèi)容很好地在后一幀中預(yù)測(cè)到,而且通過預(yù)測(cè)后取平均,非常有效地減少了預(yù)測(cè)噪聲的影響。它的壓縮效率最高,但雙向預(yù)測(cè)圖像不作為預(yù)測(cè)的參考圖像。109類似于P幀,B幀在編碼前同樣要作一系列的決定,其流程如下:(1)決定運(yùn)動(dòng)補(bǔ)償模式,即前向,后向及插值

運(yùn)動(dòng)補(bǔ)償中哪個(gè)能達(dá)到最佳。

宏塊運(yùn)動(dòng)補(bǔ)償模式的選擇是基于代價(jià)函數(shù)的最小值。代價(jià)函數(shù)是運(yùn)動(dòng)補(bǔ)償宏塊和當(dāng)前宏塊的亮度差的均方誤差。解碼器通過一種簡單的方法為前向運(yùn)動(dòng)補(bǔ)償計(jì)算最佳運(yùn)動(dòng)補(bǔ)償宏塊。然后再為后向運(yùn)動(dòng)補(bǔ)償計(jì)算最佳運(yùn)動(dòng)補(bǔ)償宏塊。最后再求兩種運(yùn)動(dòng)補(bǔ)償

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論