光電圖像處理-圖像編碼

上傳人：c*** IP屬地：湖北上傳時(shí)間：2024-10-22 格式：PPT 頁(yè)數(shù)：120 大?。?.22MB 積分：30 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩115頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

光電圖像處理

（六）圖像編碼電子工程學(xué)院光電子技術(shù)系16.1圖像編碼概述6.2哈夫曼編碼6.3香農(nóng)-范諾編碼6.4行程編碼6.5

LZW編碼6.6算術(shù)編碼6.7預(yù)測(cè)編碼6.8圖像編碼的國(guó)際標(biāo)準(zhǔn)主要內(nèi)容26.1圖像編碼概述6.2哈夫曼編碼6.3香農(nóng)-范諾編碼6.4行程編碼6.5

LZW編碼6.6算術(shù)編碼6.7預(yù)測(cè)編碼6.8圖像編碼的國(guó)際標(biāo)準(zhǔn)主要內(nèi)容36.1

圖像編碼概述6.1.1

圖像編碼技術(shù)的研究背景

6.1.2圖像編碼基本原理

6.1.3圖像編碼的方法

6.1.4圖像編碼新技術(shù)

6.1.5圖像編碼評(píng)價(jià)4

6.1.1圖像編碼技術(shù)的研究背景通信方式的改變

文字+語(yǔ)音

圖像+文字+語(yǔ)音通信對(duì)象的改變

人與人

人與機(jī)器，機(jī)器與機(jī)器1.信息傳輸方式發(fā)生了很大的改變5

(a)彩色視頻信息對(duì)于電視畫(huà)面的分辨率640

480的彩色圖像，每秒30幀，則一秒鐘的數(shù)據(jù)量為：

640

480

30=221.184Mbit

所以播放時(shí)，需要221Mbps的通信回路。參考數(shù)據(jù)：寬帶網(wǎng)為512K,電話線為56K。存儲(chǔ)時(shí)，1張CD可存640M，則僅可以存放2.89秒的數(shù)據(jù)。2.圖像傳輸與存儲(chǔ)需要的信息量空間6

(b)傳真數(shù)據(jù)如果只傳送2值圖像，以200dpi的分辨率傳輸，一張A4稿紙的內(nèi)容的數(shù)據(jù)量為：3888768bit

按目前14.4K的電話線傳輸速率，需要傳送的時(shí)間是：270秒（4.5分）

按每分鐘4元計(jì)算：18元

由于通信方式和通信對(duì)象的改變帶來(lái)的最大問(wèn)題是：

傳輸帶寬、速度、存儲(chǔ)器容量的限制。給我們帶來(lái)的一個(gè)難題，也給了我們一個(gè)機(jī)會(huì)：

如何用軟件的手段來(lái)解決硬件上的物理極限。7圖像信息源圖像預(yù)處理圖像信源

編碼信道編碼調(diào)制信道傳輸解調(diào)信道解碼圖像信源

解碼顯示圖像

圖像通信系統(tǒng)模型81.數(shù)字圖像的冗余的概念6.1.2圖像編碼基本原理

你的妻子，Helen，將于明天晚上6點(diǎn)零5分在上海的虹橋機(jī)場(chǎng)接你。

(23

2+10=56個(gè)半角字符)

你的妻子將于明天晚上6點(diǎn)零5分在虹橋機(jī)場(chǎng)接你。

(20

2+3=43個(gè)半角字符）

Helen將于明晚6點(diǎn)在虹橋接你。

(10

2+7=27個(gè)半角字符）結(jié)論：只要接收端不會(huì)產(chǎn)生誤解，就可以減少承載信息的數(shù)據(jù)量。9描述語(yǔ)言

(1)“這是一幅2

2的圖像，圖像的第一個(gè)像素是紅的，第二個(gè)像素是紅的，第三個(gè)像素是紅的，第四個(gè)像素是紅的”。

(2)“這是一幅2

2的圖像，整幅圖都是紅色”。

由此我們知道，整理圖像的描述方法可以達(dá)到壓縮的目的。10圖像冗余無(wú)損壓縮的原理RGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGBRGB16RGB從原來(lái)的16

8=384bits壓縮為:(1+3)

8=32bits11圖像冗余有損壓縮的原理3635343434343432343433373034343434343434343534343134343434343434343434343434343434343434343434343434253412

空間冗余：圖像內(nèi)部相鄰像素之間存在較強(qiáng)的相關(guān)性所造成的冗余。

時(shí)間冗余：視頻圖像序列中的不同幀之間的相關(guān)性所造成的冗余。視覺(jué)冗余：是指人眼不能感知或不敏感的那部分圖像信息。2.數(shù)字圖像冗余的分類(lèi)13信息熵冗余：也稱(chēng)編碼冗余，如果圖像中平均每個(gè)像素使用的比特?cái)?shù)大于該圖像的信息熵，則圖像中存在冗余，這種冗余稱(chēng)為信息熵冗余。結(jié)構(gòu)冗余：是指圖像中存在很強(qiáng)的紋理結(jié)構(gòu)或自相似性。知識(shí)冗余：是指在有些圖像中還包含與某些先驗(yàn)知識(shí)有關(guān)的信息。圖像編碼的目的：充分利用圖像中存在的各種冗余信息，特別是空間冗余、時(shí)間冗余以及視覺(jué)冗余，以盡量少的比特?cái)?shù)來(lái)表示圖像。14幾種常見(jiàn)應(yīng)用的碼率15有損壓縮：存在信息損耗，不能精確重建原始圖像，存在一定程度的失真。包括哈夫曼編碼、行程編碼和算術(shù)編碼無(wú)損壓縮：不存在信息損失，解壓縮時(shí)能夠從壓縮數(shù)據(jù)精確地恢復(fù)原始圖像。包括預(yù)測(cè)編碼、變換編碼等等。6.1.3圖像編碼的方法

1.根據(jù)編碼過(guò)程是否存在信息損耗16熵編碼：基于信號(hào)統(tǒng)計(jì)特性的編碼技術(shù)，無(wú)損編碼?；驹硎墙o出現(xiàn)概率較大的符號(hào)賦予一個(gè)短碼字，而給出現(xiàn)概率較小的符號(hào)賦予一個(gè)長(zhǎng)碼字，從而使得最終的平均碼長(zhǎng)很小。包括行程編碼（RunLengthEncoding）、哈夫曼編碼和算術(shù)編碼等。預(yù)測(cè)編碼：基于圖像數(shù)據(jù)的空間或時(shí)間冗余特性，用相鄰的已知像素（或像素塊）來(lái)預(yù)測(cè)當(dāng)前像素（或像素塊）的取值，然后再對(duì)預(yù)測(cè)誤差進(jìn)行量化和編碼?？煞譃閹瑑?nèi)預(yù)測(cè)和幀間預(yù)測(cè)，常用的預(yù)測(cè)編碼有差分脈沖碼調(diào)制（DifferentialPulseCodeModulation，DPCM）和運(yùn)動(dòng)補(bǔ)償法。2.根據(jù)編碼原理17變換編碼：是將空間域上的圖像經(jīng)過(guò)正交變換映射到另一變換域上，使變換后的系數(shù)之間的相關(guān)性降低。圖像變換本身并不能壓縮數(shù)據(jù)，但變換后圖像的大部分能量只集中到少數(shù)幾個(gè)變換系數(shù)上，采用適當(dāng)?shù)牧炕挽鼐幋a就可以有效地壓縮圖像?；旌暇幋a：混合編碼是指綜合了熵編碼、變換編碼或預(yù)測(cè)編碼的編碼方法，如JPEG標(biāo)準(zhǔn)和MPEG標(biāo)準(zhǔn)。18信息保持編碼：也稱(chēng)無(wú)失真編碼，它要求在編解碼過(guò)程中保證圖像信息不丟失，從而可以完整地重建圖像。保真度編碼：利用人眼的視覺(jué)特性，在允許的失真（Lossy）條件下或一定的保真度準(zhǔn)則下，最大限度地壓縮圖像。特征提取：在圖像識(shí)別、分析和分類(lèi)等技術(shù)中，往往并不需要全部圖像信息，而只要對(duì)感興趣的部分特征信息進(jìn)行編碼即可壓縮數(shù)據(jù)。3.根據(jù)對(duì)壓縮編碼后的圖像進(jìn)行重建的準(zhǔn)確程度196.1.4

圖像編碼新技術(shù)

分形編碼（FractalCoding）:最大限度地利用了圖像在空間域上的自相似性（即局部與整體之間存在某種相似性），通過(guò)消除圖像的幾何冗余來(lái)壓縮數(shù)據(jù)。小波編碼（WaveletCoding）：經(jīng)過(guò)小波變換后的圖像，具有良好的空間方向選擇性，而且是多分辨率的，能夠保持原圖像在各種分辨率下的精細(xì)結(jié)構(gòu)，與人的視覺(jué)特性十分吻合。模型編碼（ModelBasedCoding)：在編、解碼兩端分別建立起相同的模型，編碼時(shí)利用先驗(yàn)?zāi)Ｐ统槿D像中的主要信息并用模型參數(shù)的形式表示，解碼時(shí)則利用所接收的模型參數(shù)重建圖像。

206.1.5

圖像編碼評(píng)價(jià)

算法的編碼效率2.

編碼圖像的質(zhì)量3.

算法的適用范圍4.

算法的復(fù)雜程度

一般來(lái)說(shuō)，評(píng)價(jià)圖像壓縮算法的優(yōu)劣主要有以下4個(gè)參數(shù)：21R——平均碼字長(zhǎng)度r——圖像的壓縮比（rate）bps——每秒鐘所需的傳輸比特?cái)?shù)（bitspersecond）η——圖像熵與平均碼長(zhǎng)之比1.

算法的編碼效率

設(shè)一幅灰度級(jí)為N的圖像，圖像中第k級(jí)灰度出現(xiàn)的概率為Pk，圖像大小為Nx

Ny，每個(gè)像素用d比特表示，每?jī)蓭瑘D像間隔Δt。

對(duì)于一種圖像編碼方法，設(shè)第k級(jí)灰度的碼字長(zhǎng)度為Bk，則該圖像的平均碼字長(zhǎng)度R為：則按信息論中信息熵的定義，則數(shù)字圖像的熵H為：由此可見(jiàn)，圖像熵H表示各灰度級(jí)比特?cái)?shù)的統(tǒng)計(jì)平均值。23編碼效率η為：

每秒鐘所需的傳輸比特?cái)?shù)bps為：壓縮比r為：

由于同一壓縮算法對(duì)不同圖像的編碼效率會(huì)有所不同，因此常需定義一些“標(biāo)準(zhǔn)圖像”，一般通過(guò)測(cè)量不同壓縮算法對(duì)同一組“標(biāo)準(zhǔn)圖像”的編碼性能來(lái)評(píng)價(jià)各圖像壓縮算法的編碼效率。

未壓縮前信源的碼長(zhǎng)242.編碼圖像的質(zhì)量圖像質(zhì)量評(píng)價(jià)可分為：客觀質(zhì)量評(píng)價(jià)和主觀質(zhì)量評(píng)價(jià)。最常用的客觀質(zhì)量評(píng)價(jià)指標(biāo)是：均方誤差（MSE）和峰值信噪比（PSNR）。25

主觀質(zhì)量評(píng)價(jià)是指：由一批觀察者對(duì)編碼圖像進(jìn)行觀察并打分，然后綜合所有人的評(píng)判結(jié)果，給出圖像的質(zhì)量評(píng)價(jià)?？陀^質(zhì)量評(píng)價(jià)能夠快速有效地評(píng)價(jià)編碼圖像的質(zhì)量，但符合客觀質(zhì)量評(píng)價(jià)指標(biāo)的圖像不一定具有較好的主觀質(zhì)量。主觀質(zhì)量評(píng)價(jià)能夠與人的視覺(jué)效果相匹配，但其評(píng)判過(guò)程緩慢費(fèi)時(shí)。

特定的圖像編碼算法具有其相應(yīng)的適用范圍，并不對(duì)所有圖像都有效。一般說(shuō)來(lái)，大多數(shù)基于圖像信息統(tǒng)計(jì)特性的壓縮算法具有較廣的適用范圍，而一些特定的編碼算法的適用范圍較窄，如分形編碼主要用于自相似性高的圖像。

3.算法的適用范圍27

算法的復(fù)雜度即指完成圖像壓縮和解壓縮所需的運(yùn)算量和硬件實(shí)現(xiàn)該算法的難易程度。優(yōu)秀的壓縮算法要求有較高的壓縮比，壓縮和解壓縮快，算法簡(jiǎn)單，易于硬件實(shí)現(xiàn)，還要求解壓縮后的圖像質(zhì)量較好。選用編碼方法時(shí)一定要考慮圖像信源本身的統(tǒng)計(jì)特性、多媒體系統(tǒng)(硬件和軟件產(chǎn)品)的適應(yīng)能力、應(yīng)用環(huán)境以及技術(shù)標(biāo)準(zhǔn)。4.算法的復(fù)雜程度

286.1圖像編碼概述

6.2哈夫曼編碼6.3香農(nóng)-范諾編碼6.4行程編碼6.5

LZW編碼6.6算術(shù)編碼6.7預(yù)測(cè)編碼6.8圖像編碼的國(guó)際標(biāo)準(zhǔn)主要內(nèi)容296.2哈夫曼編碼

1.哈夫曼編碼的理論基礎(chǔ)

R≥H——總可設(shè)計(jì)出一種無(wú)失真編碼；R＞＞H時(shí)，表明該編碼方法效率很低；R等于或很接近于H時(shí)——最佳編碼，無(wú)失真；R<H時(shí)，壓縮比較高，但會(huì)引起圖像失真。

30設(shè)D為編碼所使用的數(shù)制，則變長(zhǎng)最佳編碼的平均碼字長(zhǎng)度R的范圍為：

變長(zhǎng)最佳編碼定理：在變長(zhǎng)編碼中，如果碼字長(zhǎng)度嚴(yán)格按照對(duì)應(yīng)符號(hào)出現(xiàn)的概率大小逆序排列，則其平均碼字長(zhǎng)度為最小，這就是變長(zhǎng)最佳編碼定理。變長(zhǎng)最佳編碼定理是哈夫曼編碼的理論基礎(chǔ)。31

2.哈夫曼編碼算法

首先，統(tǒng)計(jì)信源中各符號(hào)出現(xiàn)的概率，按符號(hào)出現(xiàn)的概率從大到小排序。把最小的兩個(gè)概率相加合并成新的概率，與剩余的概率組成新的概率集合。對(duì)新的概率集合重新排序，再次把其中最小的兩個(gè)概率相加，組成新的概率集合。如此重復(fù)進(jìn)行，直到最后兩個(gè)概率的和為1。32

分配碼字。碼字分配從最后一步開(kāi)始反向進(jìn)行，對(duì)于每次相加的兩個(gè)概率，給大的賦“0”，小的賦“1”（也可全部相反）讀出時(shí)由該符號(hào)開(kāi)始一直走到最后的概率和“1”，將路線上所遇到的“0”和“1”按最低位到最高位的順序排好，就是該符號(hào)的哈夫曼編碼。33

例：設(shè)一幅灰度級(jí)為8（分別用S0、S1、S2、S3、S4、S5、S6、S7表示）的圖像中，各灰度所對(duì)應(yīng)的概率分別為0.40、0.18、0.10、0.10、0.07、0.06、0.05、0.04。現(xiàn)對(duì)其進(jìn)行哈夫曼編碼：

34035下面來(lái)看一下哈夫曼編碼的編碼效率。平均碼長(zhǎng)R為：36數(shù)字圖像的熵H為：

則哈夫曼編碼的編碼效率η為：

對(duì)不同概率分布的信源，哈夫曼編碼的編碼效率有所差別。根據(jù)信息論中信源編碼理論，對(duì)于二進(jìn)制編碼，當(dāng)信源概率為2的負(fù)冪次方時(shí)，哈夫曼編碼的編碼效率可達(dá)100%，其平均碼字長(zhǎng)度也很短，而當(dāng)信源概率為均勻分布時(shí)，其編碼效果明顯降低。38哈夫曼編碼在不同概率分布下的編碼效果對(duì)比39哈夫曼編碼的特點(diǎn)：1）哈夫曼編碼構(gòu)造出來(lái)的編碼值不是唯一的。原因是在給兩個(gè)最小概率的圖像的灰度值進(jìn)行編碼時(shí)，可以是大概率為“0”，小概率為“1”，也可相反。當(dāng)兩個(gè)灰度值的概率相等時(shí)，“0”、“1”的分配也是人為定義的，這就造成了編碼的不唯一性。但不影響解碼的正確性。

2）當(dāng)圖像灰度值分布很不均勻時(shí)，哈夫曼編碼的效率就高。當(dāng)信源概率是2的負(fù)冪次方時(shí)，編碼效率為100％，而在圖像灰度值的概率分布比較均勻時(shí)，其編碼效果最差。

3）哈夫曼編碼必須先計(jì)算出圖像數(shù)據(jù)的概率特性，再形成編碼表后，才能對(duì)圖像數(shù)據(jù)編碼，因此，哈夫曼編碼缺乏構(gòu)造性。即不能使用某種數(shù)學(xué)模型建立信源符號(hào)與編碼之間的對(duì)應(yīng)關(guān)系，而必須通過(guò)查找的方法，建立起他們之間的對(duì)應(yīng)關(guān)系。如果信源符號(hào)很多，那么碼表就會(huì)很大，這勢(shì)必會(huì)影響到存儲(chǔ)與傳輸。40Step1:精確地統(tǒng)計(jì)出原始圖像中每個(gè)灰度值出現(xiàn)的概率；Step2:建立哈夫曼樹(shù)并進(jìn)行編碼。在計(jì)算哈夫曼編碼表時(shí)需要對(duì)原始的圖象掃描兩遍：

由于需要建立二叉樹(shù)并遍歷二叉樹(shù)生成編碼，數(shù)據(jù)壓縮和還原速度都較慢。但是該編碼方法簡(jiǎn)單有效，而且編碼效率相當(dāng)高，因而應(yīng)用非常廣泛。41

我們知道，對(duì)一幅圖像進(jìn)行編碼時(shí)，如果圖像的大小大于256時(shí)，這幅圖像的不同的碼字就有可能是很大，例如極限為256個(gè)不同的碼字。對(duì)整幅圖直接進(jìn)行Huffman編碼時(shí)，小分布的灰度值，就有可能具有很長(zhǎng)的編碼。如：100位以上，這樣不但達(dá)不到壓縮的效果反而會(huì)使數(shù)據(jù)量加大，應(yīng)該如何處理？Question??42

常用的且有效的方法是：將圖像分割成若干的小塊，對(duì)每塊進(jìn)行獨(dú)立的Huffman編碼。例如：分成8×8的子塊，就可以大大降低不同灰度值的個(gè)數(shù)（最多是64而不是256）。436.1圖像編碼概述6.2哈夫曼編碼6.3香農(nóng)-范諾編碼6.4行程編碼6.5

LZW編碼6.6算術(shù)編碼6.7預(yù)測(cè)編碼6.8圖像編碼的國(guó)際標(biāo)準(zhǔn)主要內(nèi)容446.3

香農(nóng)-范諾編碼

香農(nóng)-范諾（Shannon-Fannon）編碼也是一種常見(jiàn)的可變字長(zhǎng)編碼。與哈夫曼編碼相似，當(dāng)信源符號(hào)出現(xiàn)的概率正好為2-i（i>0）時(shí)，采用香農(nóng)-范諾編碼同樣能夠達(dá)到100%的編碼效率。香農(nóng)-范諾編碼的理論基礎(chǔ)是符號(hào)的碼字長(zhǎng)度Ni完全由該符號(hào)出現(xiàn)的概率來(lái)決定，即式中，D為編碼所用的數(shù)制。

45香農(nóng)-范諾編碼的步驟如下：

（1）將信源符號(hào)按其出現(xiàn)概率從大到小排序；（2）計(jì)算出各概率對(duì)應(yīng)的碼字長(zhǎng)度Ni；（3）計(jì)算累加概率Ai，即

Ai=Ai-1+Pi-1i=1,2,…,N-1；A0=0

（4）把各個(gè)累加概率Ai由十進(jìn)制轉(zhuǎn)化為二進(jìn)制，取該二進(jìn)制數(shù)的前Ni位作為對(duì)應(yīng)信源符號(hào)的碼字。46香農(nóng)-范諾編碼47二分法香農(nóng)-范諾編碼方法:

（1）首先統(tǒng)計(jì)出每個(gè)符號(hào)出現(xiàn)的概率；（2）對(duì)上述概率從大到小排序；（3）從這個(gè)概率集合中的某個(gè)位置將其分為兩個(gè)子集合，并盡量使兩個(gè)子集合的概率和近似相等，給前面一個(gè)子集合賦值為0，后面一個(gè)子集合賦值為1；（4）重復(fù)步驟3，直到各個(gè)子集合中只有一個(gè)元素為止；（5）將每個(gè)元素所屬的子集合的值依次串起來(lái)，即可得到各個(gè)元素的香農(nóng)-范諾編碼。48二分法香農(nóng)-范諾編碼496.1圖像編碼概述6.2哈夫曼編碼6.3香農(nóng)-范諾編碼

6.4行程編碼6.5

LZW編碼6.6算術(shù)編碼6.7預(yù)測(cè)編碼6.8圖像編碼的國(guó)際標(biāo)準(zhǔn)主要內(nèi)容506.4

行程編碼

將具有相同值的連續(xù)串用其串長(zhǎng)和一個(gè)代表值來(lái)代替，該連續(xù)串就稱(chēng)為行程，串長(zhǎng)稱(chēng)為行程長(zhǎng)度。例如

aaaa

bbb

eeeee

fffffff(共22

8=176bits)

4a3b2c1d5e7f

(共12

8=96bits)

1.行程編碼基本原理和方法

行程編碼——行程長(zhǎng)度編碼（RunLengthEncoding，RLE）51

定長(zhǎng)編碼：編碼的行程長(zhǎng)度所用的二進(jìn)制位數(shù)固定。

變長(zhǎng)行程編碼：對(duì)不同范圍的行程長(zhǎng)度使用不同位數(shù)的二進(jìn)制位進(jìn)行編碼。使用變長(zhǎng)行程編碼需要增加標(biāo)志位來(lái)表明所使用的二進(jìn)制位數(shù)。

2.行程編碼的分類(lèi)3.

行程編碼的應(yīng)用1)行程編碼比較適合于二值圖像的編碼，一般用于量化后出現(xiàn)大量零系數(shù)連續(xù)的場(chǎng)合，用行程來(lái)表示連零碼。

2)如果圖像是由很多塊顏色或灰度相同的大面積區(qū)域組成的，那么采用行程編碼可以達(dá)到很高的壓縮比。

3)如果圖像中的數(shù)據(jù)非常分散，則行程編碼不但不能壓縮數(shù)據(jù)，反而會(huì)增加圖像文件的大小。這時(shí)一般和其他編碼結(jié)合使用。52傳真件中一般都是白色比較多，而黑色相對(duì)比較少。所以可能常常會(huì)出現(xiàn)如下的情況：

600w3b100w12b4w3b200w

上面的行程編碼所需用的字節(jié)數(shù)為：7

因?yàn)椋?12<600<1024

所以：計(jì)數(shù)值必須用10bit來(lái)表示

7=70bit在傳真中的應(yīng)用53

現(xiàn)在我們就希望對(duì)其有一個(gè)改善。白色：10bit，黑色：4bit

600W3b100w12b4w3b200w

所需字節(jié)數(shù)為：

10+3

4=52bit

比原來(lái)的方式10

7=70bit減少了18bit54PCX文件：文件頭＋圖像壓縮數(shù)據(jù)＋256色調(diào)色板。文件頭全長(zhǎng)128字節(jié)，包含了圖像的大小和顏色以及PCX文件的版本標(biāo)識(shí)等信息。圖像壓縮數(shù)據(jù)緊跟在文件頭之后。按顏色平面和掃描行存儲(chǔ)。如果沒(méi)有使用調(diào)色板，那么圖像壓縮數(shù)據(jù)存儲(chǔ)的是實(shí)際像素值；否則，存儲(chǔ)的是調(diào)色板的索引值。4.PCX文件中的行程編碼PCX格式是ZSOFT公司在開(kāi)發(fā)圖像處理軟件Paintbrush時(shí)開(kāi)發(fā)的一種格式，基于PC的繪圖程序的專(zhuān)用格式，一般的桌面排版、圖形藝術(shù)和視頻捕獲軟件都支持這種格式。PCX支持256色調(diào)色板或全24位的RGB，圖像大小最多達(dá)64K

64K像素。不支持CMYK或HSI顏色模式，photoshop等多種圖像處理軟件均支持PCX格式。PCX壓縮屬于無(wú)損壓縮。551)圖像數(shù)據(jù)以字節(jié)為單位進(jìn)行編碼的，每行填充到偶數(shù)字節(jié).2)PCX文件規(guī)定編碼時(shí)的最大行程長(zhǎng)度為63，如果行程長(zhǎng)度大于63，則必須分多次存儲(chǔ)。對(duì)于長(zhǎng)度大于1的行程，編碼時(shí)先存入其行程長(zhǎng)度（長(zhǎng)度L加上192即0xC0），再存入該行程的代表值，行程長(zhǎng)度和行程的代表值分別占一字節(jié)。

3)如果遇到不重復(fù)的像素值，如果該像素值小于等于0xC0，則直接存入該像素值。否則首先存入一個(gè)0xC1，然后再存入該像素值。這樣做是為了避免該像素值被誤認(rèn)為是數(shù)據(jù)長(zhǎng)度。

4)對(duì)于連續(xù)重復(fù)的像素值，統(tǒng)計(jì)其連續(xù)出現(xiàn)的次數(shù)iCount（最大取值為63），先存入長(zhǎng)度信息（iCount|0xC0)，然后再存入像素值。如果連續(xù)次數(shù)超過(guò)63次，則必須分多次處理。例如，連續(xù)132個(gè)0x98，編碼時(shí)必須分三次處理，編碼結(jié)果為：0xFF0x980xFF0x980xC60x98。編碼原則：56從壓縮數(shù)據(jù)部分讀取一個(gè)字節(jié)，判斷該值是否大于0xC0如果大于0xC0，則表明該字節(jié)是行程長(zhǎng)度信息，取其低六位（相當(dāng)于減去0xC0）作為行程長(zhǎng)度L，讀取下一個(gè)字節(jié)作為像素值并重復(fù)L次存入圖像數(shù)據(jù)緩沖區(qū)如果小于等于0xC0，直接將該字節(jié)存入圖像數(shù)據(jù)緩沖區(qū)。256色PCX文件解碼:雖然幾乎所有的圖像應(yīng)用軟件都支持PCX文件格式，但由于它的壓縮比不高，因而現(xiàn)在用得不是很多。576.1圖像編碼概述6.2哈夫曼編碼6.3香農(nóng)-范諾編碼6.4行程編碼6.5

LZW編碼6.6算術(shù)編碼6.7預(yù)測(cè)編碼6.8圖像編碼的國(guó)際標(biāo)準(zhǔn)主要內(nèi)容586.5LZW編碼

LZW（Lempel-Ziv&Welch）——又稱(chēng)字串表編碼，無(wú)損編碼。

LZW編碼與行程編碼類(lèi)似，也是對(duì)字符串進(jìn)行編碼從而實(shí)現(xiàn)壓縮，但它在編碼的同時(shí)還生成了特定字符串以及與之對(duì)應(yīng)的索引字符串表。59對(duì)文件進(jìn)行編碼的同時(shí)，生成了特定字符序列的表以及它們對(duì)應(yīng)的代碼。比如8位圖像編成12位碼，除了256代表原來(lái)8位字符，其他代碼分配給在壓縮過(guò)程中出現(xiàn)的字符串。（如字符對(duì)）當(dāng)表中沒(méi)有的字符串第一次出現(xiàn)的時(shí)候，原樣保存，同時(shí)將分配它的代碼也一起保存。只有如果這個(gè)字符串再次出現(xiàn)，只存儲(chǔ)代碼。字符串表在壓縮中動(dòng)態(tài)生成，而且也不用存儲(chǔ)，解壓時(shí)可以由壓縮文件中信息重構(gòu)它。LZW編碼原則：60

GIF（GraphicsInterchangeFormat）是由CompuServe公司開(kāi)發(fā)的一種壓縮位圖格式。它可支持多達(dá)256種的顏色，具有極佳的壓縮效率，已成為Internet上一種流行的文件格式。GIF圖像文件采用的是一種改良的LZW壓縮算法，通常稱(chēng)為GIF-LZW壓縮算法。GIF-LZW壓縮編碼61S1、S2——兩個(gè)存放字符串的臨時(shí)變量LZW_CLEAR——字符表初始化標(biāo)志LZW_EOI編碼結(jié)束標(biāo)志設(shè)：（1）根據(jù)圖像中使用的顏色數(shù)初始化一個(gè)字串表，字串表中的每個(gè)顏色對(duì)應(yīng)一個(gè)索引。在初始字串表的末尾再添加兩個(gè)符號(hào)（LZW_CLEAR和LZW_EOI）的索引。設(shè)置字符串變量S1、S2并初始化為空。（2）接著輸出LZW_CLEAR在字串表中的索引。編碼步驟：62（3）從圖像數(shù)據(jù)流中第一個(gè)字符（假設(shè)數(shù)據(jù)以字符串表示）開(kāi)始，每次讀取一個(gè)字符，將其賦給字符串變量S2。（4）判斷“S1+S2”是否已存在于字串表中。如果字串表中存在“S1+S2”，則S1=S1+S2；否則，輸出S1在字串表中的索引，并在字串表末尾為“S1+S2”添加索引，同時(shí)，S1=S2。（5）重復(fù)第3和第4步，直到所有字符讀完為止。（6）輸出S1中的字符串在字串表中的索引，然后輸出結(jié)束標(biāo)志LZW_EOI的索引，編碼完畢。63GIF-LZW解碼流程

設(shè)有一來(lái)源于4色（以a、b、c、d表示）圖像的數(shù)據(jù)流aabcabbbbd，現(xiàn)對(duì)其進(jìn)行LZW編碼。編碼過(guò)程如下：編碼前，首先需要初始化一個(gè)字符串表。

LZW編碼實(shí)例字符串索引a0Hb1Hc2Hd3HLZW_CLEAR4HLZW_EOI5H65GIF-LZW編碼過(guò)程編碼結(jié)果：4001271B35（十六進(jìn)制表示）b66GIF-LZW解碼過(guò)程676.1圖像編碼概述6.2哈夫曼編碼6.3香農(nóng)-范諾編碼6.4行程編碼6.5

LZW編碼6.6算術(shù)編碼6.7預(yù)測(cè)編碼6.8圖像編碼的國(guó)際標(biāo)準(zhǔn)主要內(nèi)容686.6算術(shù)編碼

基于信源概率統(tǒng)計(jì)特性的固定編碼模式針對(duì)未知信源概率模型的自適應(yīng)模式基本原理：將被編碼的數(shù)據(jù)序列表示成0和1之間的一個(gè)間隔（即一個(gè)小數(shù)范圍），該間隔的位置與輸入數(shù)據(jù)的概率分布有關(guān)。

算術(shù)編碼有兩種模式：69例：設(shè)一待編碼的數(shù)據(jù)序列（即信源）為“dacab”，信源中各符號(hào)出現(xiàn)的概率依次為P(a)=0.4，P(b)=0.2，P(c)=0.2，P(d)=0.2。首先，數(shù)據(jù)序列中的各數(shù)據(jù)符號(hào)在區(qū)間［0,1］內(nèi)的間隔（賦值范圍）設(shè)定為a=［0,0.4）,b=［0.4,0.6）,c=［0.6,0.8）,d=［0.8,1.0）StartN=StartB+LeftC×L

EndN=StartB+RightC×L

第一個(gè)被壓縮的符號(hào)為“d”，其初始間隔為［0.8,1.0)；第二個(gè)被壓縮的符號(hào)為“a”，由于前面的符號(hào)“d”的取值區(qū)間被限制在［0.8,1.0)范圍內(nèi)，所以“a”的取值范圍應(yīng)在前一符號(hào)間隔［0.8,1.0)的［0,0.4)子區(qū)間內(nèi)，根據(jù)上式可知：StartN=0.8+0×(1.0-0.8)=0.8EndN=0.8+0.4×(1.0-0.8)=0.88即“a”的實(shí)際編碼區(qū)間在［0.8,0.88)之間。71

第三個(gè)被壓縮的符號(hào)為“c”，其編碼取值范圍應(yīng)在［0.8,0.88)區(qū)間的［0.6,0.8)的子區(qū)間內(nèi)，據(jù)上式可知

第四個(gè)被壓縮的符號(hào)為“a”，其編碼取值范圍應(yīng)在［0.848,0.864)區(qū)間的［0,0.4)的子區(qū)間內(nèi)StartN=0.848+0×(0.864-0.848)=0.848

EndN=0.848+0.4×(0.864-0.848)=0.854472

第五個(gè)被壓縮的符號(hào)為“b”，其編碼取值范圍應(yīng)在［0.848，0.8544)區(qū)間的［0.4,0.6)的子區(qū)間內(nèi)StartN=0.848+0.4×(0.8544-0.848)=0.85056

EndN=0.848+0.6×(0.8544-0.848)=0.85184至此，數(shù)據(jù)序列“dacab”已被描述為一個(gè)實(shí)數(shù)區(qū)間［0.85056,0.85184］，或者說(shuō)在此區(qū)間內(nèi)的任一實(shí)數(shù)值都唯一對(duì)應(yīng)該數(shù)據(jù)序列。這樣，就可以用一個(gè)實(shí)數(shù)表示這一數(shù)據(jù)序列。我們把區(qū)間［0.85056,0.85184］用二進(jìn)制形式表示為［0.110110011011,

0.110110100001］。73

在這個(gè)區(qū)間中，0.1101101位于這個(gè)區(qū)間內(nèi)并且其編碼最短，故把其作為數(shù)據(jù)序列“dacab”的編碼輸出?？紤]到算術(shù)編碼中任一數(shù)據(jù)序列的編碼都含有“0.”，所以在編碼時(shí)，可以不考慮“0.”，于是把1101101作為本例中的數(shù)據(jù)序列的算術(shù)編碼。由此可見(jiàn)，數(shù)據(jù)序列“dacab”用7比特的二進(jìn)制代碼就可以表示，平均碼長(zhǎng)為1.4比特／字符。

746.1圖像編碼概述6.2哈夫曼編碼6.3香農(nóng)-范諾編碼6.4行程編碼6.5

LZW編碼6.6算術(shù)編碼6.7預(yù)測(cè)編碼6.8圖像編碼的國(guó)際標(biāo)準(zhǔn)主要內(nèi)容756.7預(yù)測(cè)編碼預(yù)測(cè)：根據(jù)過(guò)去時(shí)刻的樣本序列，采用一種模型預(yù)測(cè)當(dāng)前的樣本值;預(yù)測(cè)編碼的基本思想：通過(guò)僅提取每個(gè)像素中的新信息并對(duì)它們編碼來(lái)消除像素間的相關(guān)性和冗余性。1個(gè)象素的新信息——該像素的當(dāng)前或現(xiàn)實(shí)值與預(yù)測(cè)值的差。前提：像素間具有相關(guān)性。1.無(wú)損預(yù)測(cè)編碼2.有損預(yù)測(cè)編碼76輸入圖像預(yù)測(cè)器整數(shù)舍入符號(hào)編碼器fn+-en壓縮圖像1.無(wú)損預(yù)測(cè)編碼預(yù)測(cè)器符號(hào)解碼器fn+en壓縮圖像+解壓圖像772.

有損預(yù)測(cè)編碼輸入圖像預(yù)測(cè)器符號(hào)編碼器fn+-en壓縮圖像量化器++預(yù)測(cè)器符號(hào)編碼器+壓縮圖像+解壓圖像786.1圖像編碼概述6.2哈夫曼編碼6.3香農(nóng)-范諾編碼6.4行程編碼6.5

LZW編碼6.6算術(shù)編碼6.7預(yù)測(cè)編碼6.8圖像編碼的國(guó)際標(biāo)準(zhǔn)主要內(nèi)容796.8圖像編碼的國(guó)際標(biāo)準(zhǔn)1.靜止圖像壓縮標(biāo)準(zhǔn)

JPEG2.運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)

MPEG

近十年來(lái)，圖像編碼技術(shù)得到了迅速發(fā)展和廣泛應(yīng)用，并且日臻成熟，其標(biāo)志就是幾個(gè)圖像壓縮國(guó)際標(biāo)準(zhǔn)的制定。即關(guān)于靜止圖像的編碼標(biāo)準(zhǔn)JPEG和JPEG2000、關(guān)于電話/會(huì)議電視的視頻編碼標(biāo)準(zhǔn)H.261，H.263和關(guān)于活動(dòng)圖像的編碼標(biāo)準(zhǔn)MPEG-1，MPEG-2,

MPEG-4和H.264等。JPEG(JointPhotographicExpertGroup);MPEG(MotionPictureExpertsGroup)80圖像壓縮國(guó)際標(biāo)準(zhǔn)標(biāo)準(zhǔn)標(biāo)題起止日期目標(biāo)比特率應(yīng)用場(chǎng)合主要編碼技術(shù)JPEG連續(xù)色調(diào)靜態(tài)圖像1986.3～1992.10壓縮比為2～30·因特網(wǎng)·數(shù)字照相·圖像/視頻編輯·DCT·知覺(jué)量化·霍夫曼編碼·算術(shù)編碼JPEG2000新一代靜態(tài)圖像編碼標(biāo)準(zhǔn)1996.2～2000.12壓縮比為2～50·因特網(wǎng)·移動(dòng)通信·數(shù)字照相·遙感·傳真·數(shù)字圖書(shū)館·JPEG所有技術(shù)·小波變換·EBCOTROI編碼·可擴(kuò)展編碼81標(biāo)準(zhǔn)標(biāo)題目標(biāo)比特率應(yīng)用場(chǎng)合主要編碼技術(shù)MPEG-1運(yùn)動(dòng)圖像及其伴音不超過(guò)1.5Mb/s·光盤(pán)存儲(chǔ)·VCD·視頻監(jiān)控·JPEG所有技術(shù)·自適應(yīng)量化·運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)MPEG-2運(yùn)動(dòng)圖像及其伴音1.5～35Mb/s·數(shù)字高清晰度電視·高品質(zhì)視頻·衛(wèi)星/有線電視·地面廣播·MPEG-1所有技術(shù)·基于幀/場(chǎng)的運(yùn)動(dòng)補(bǔ)償·擴(kuò)展編碼·容錯(cuò)編碼82標(biāo)準(zhǔn)標(biāo)題目標(biāo)比特率應(yīng)用場(chǎng)合主要編碼技術(shù)MPEG-4音視頻對(duì)象的通用編碼8kb/s～35Mb/s·因特網(wǎng)·交互式視頻·2D/3D計(jì)算機(jī)圖形·移動(dòng)通信·MPEG-2所有技術(shù)·小波變換·運(yùn)動(dòng)估計(jì)/補(bǔ)償·可擴(kuò)展編碼·位圖形狀編碼·對(duì)象編碼·動(dòng)態(tài)網(wǎng)絡(luò)編碼MPEG-7多媒體描述接口·多媒體數(shù)據(jù)庫(kù)等MPEG-21多媒體框架83標(biāo)準(zhǔn)標(biāo)題目標(biāo)比特率應(yīng)用場(chǎng)合主要編碼技術(shù)H.261Px64kb/s的音視頻服務(wù)Px64kb/s(p:1～30)·ISDN視頻會(huì)議·DCT·自適應(yīng)量化·運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)·運(yùn)動(dòng)估計(jì)·霍夫曼編碼H.263低比特率通信的視頻編碼8kb/s～1.5Mb/s·POTS視頻電話·桌面視頻電話·移動(dòng)視頻電話·H.261所有技術(shù)·雙向運(yùn)動(dòng)補(bǔ)償·半像素運(yùn)動(dòng)估計(jì)·高級(jí)運(yùn)動(dòng)估計(jì)·重疊運(yùn)動(dòng)補(bǔ)償·算術(shù)編碼84JPEG（jointpictureexpertgroup）——面向靜態(tài)圖像編碼的標(biāo)準(zhǔn)。在相同圖像質(zhì)量條件下，JPEG文件擁有比其他圖像文件格式更高的壓縮比。JPEG目前被廣泛應(yīng)用于多媒體和網(wǎng)絡(luò)程序中，是現(xiàn)今萬(wàn)維網(wǎng)中使用最廣泛的兩種圖像文件格式之一。JPEG是一種有損壓縮，即在壓縮過(guò)程中會(huì)丟失數(shù)據(jù)，每次編輯JPEG圖像后，圖像就會(huì)被重復(fù)壓縮一次，損失就會(huì)有所增加。

1.靜止圖像壓縮標(biāo)準(zhǔn)——JPEG851）順序式（Sequential）DCT方式

2）漸進(jìn)式（Progressive）DCT方式JPEG允許的四種編碼模式：

頻譜選擇法逐次逼近法3）無(wú)失真（Lossless）方式

4）分層（Hierarchical）方式861）順序式（Sequential）DCT方式：從左到右、從上到下對(duì)圖像順序進(jìn)行基于離散余弦變換（DCT）的編碼。DCT理論上是可逆的，但在計(jì)算時(shí)存在誤差，因而基于DCT的編碼模式是一種有損編碼。2）漸進(jìn)式（Progressive）DCT方式：基于DCT，對(duì)圖像分層次進(jìn)行處理，從模糊到清晰地傳輸圖像（與GIF文件的交錯(cuò)方式類(lèi)似）。有兩種實(shí)現(xiàn)方法，一種是頻譜選擇法，即按Z形掃描的序號(hào)將DCT量化序數(shù)分成幾個(gè)頻段，每個(gè)頻段對(duì)應(yīng)一次掃描，每塊均先傳送低頻掃描數(shù)據(jù)，得到原圖概貌，再依次傳送高頻掃描數(shù)據(jù)，使圖像逐漸清晰；另一種是逐次逼近法，即每次掃描全部DCT量化序數(shù)，但每次的表示精度逐漸提高。873）無(wú)失真（Lossless）方式：使用線性預(yù)測(cè)器，如DPCM，而不是基于DCT。4）分層（Hierarchical）方式：在空間域?qū)⒃磮D像以不同的分辨率表示，每個(gè)分辨率對(duì)應(yīng)一次掃描，處理時(shí)可以基于DCT或預(yù)測(cè)編碼，可以是漸進(jìn)式，也可以是順序式。差分脈沖編碼調(diào)制88

1）基本系統(tǒng)（BaselineSystem）

2）擴(kuò)展系統(tǒng)（ExtendedSystem）

3）無(wú)失真壓縮系統(tǒng)（LosslessSystem）一個(gè)符合JPEG標(biāo)準(zhǔn)的編解碼器至少要滿足基本系統(tǒng)的技術(shù)指標(biāo)。基本的JPEG算法屬于變換類(lèi)編碼，下面針對(duì)基于DCT的順序式基本系統(tǒng)編碼來(lái)說(shuō)明JPEG的編碼方法。

JPEG定義了三種系統(tǒng)：89JPEG編碼/解碼的流程圖

熵編碼即編碼過(guò)程中按熵原理不丟失任何信息的編碼。信息熵為信源的平均信息量（不確定性的度量）。常見(jiàn)的熵編碼有：香農(nóng)(Shannon)編碼、哈夫曼(Huffman)編碼和算術(shù)編碼(arithmeticcoding)。在視頻編碼中，熵編碼把一系列用來(lái)表示視頻序列的元素符號(hào)轉(zhuǎn)變?yōu)橐粋€(gè)用來(lái)傳輸或是存儲(chǔ)的壓縮碼流。輸入的符號(hào)可能包括量化后的變換系數(shù)，運(yùn)動(dòng)向量，頭信息（宏塊頭，圖像頭，序列的頭等）以及附加信息（對(duì)于正確解碼來(lái)說(shuō)重要的標(biāo)記位信息）。901）數(shù)據(jù)分塊

將圖像從RGB空間轉(zhuǎn)換到Y(jié)CbCr空間。將每個(gè)分量圖像分割成不重疊的8×8像素塊——DU（DataUnit）。在YCbCr空間中壓縮圖像的每個(gè)彩色分量。二次采樣——采用不同的采樣頻率對(duì)圖像采樣。由于亮度比色彩更重要，因而對(duì)Y分量的采樣頻率可高于對(duì)Cb、Cr的采樣頻率，這樣有利于節(jié)省存儲(chǔ)空間。YCbCr其中Y是指亮度分量，Cb指藍(lán)色色度分量，而Cr指紅色色度分量。

91把采樣頻率最低的分量圖像中一個(gè)DU所對(duì)應(yīng)的像區(qū)上覆蓋的所有各分量上的DU按順序編組為一個(gè)最小編碼單元（MCU）。

對(duì)灰度圖像而言，只有一個(gè)Y分量，MCU就是一個(gè)數(shù)據(jù)單元。對(duì)彩色圖像而言，以4:1:1的采樣方案為例，則一個(gè)MCU由4個(gè)Y分量的DU、1個(gè)Cb分量的DU和1個(gè)Cr分量的DU組成。92

以MCU為單位順序?qū)U進(jìn)行二維離散余弦變換。對(duì)以無(wú)符號(hào)數(shù)表示的具有P位精度的輸入數(shù)據(jù)，在DCT前要減去2P-1，轉(zhuǎn)換成有符號(hào)數(shù)，而在IDCT后，應(yīng)加上2P-1，轉(zhuǎn)換成無(wú)符號(hào)數(shù)。對(duì)每個(gè)8×8的數(shù)據(jù)塊DU進(jìn)行DCT后，得到的64個(gè)系數(shù)代表了該圖像塊的頻率成分，其中低頻分量集中在左上角，高頻分量分布在右下角。系數(shù)矩陣左上角的叫做直流（DC）系數(shù)，它代表了該數(shù)據(jù)塊的平均值，其余63個(gè)叫交流（AC）系數(shù)。2）DCT處理93

在DCT處理中得到的64個(gè)系數(shù)中，低頻分量包含了圖像亮度等主要信息。在從空間域到頻域的變換中，圖像中的緩慢變化比快速變化更易引起人眼的注意，所以在重建圖像時(shí)，低頻分量的重要性高于高頻分量。因而在編碼時(shí)可以忽略高頻分量，從而達(dá)到壓縮的目的，這也是量化的根據(jù)和目的。3）系數(shù)量化94亮度量化表色度量化表95DCT系數(shù)量化后，構(gòu)成一個(gè)稀疏矩陣，用Z（Zigzag）形掃描將其變成一維數(shù)列，將有利于熵編碼。Z形掃描的順序如圖所示。DCT系數(shù)的Z形掃描順序

4）Z形掃描

96DC系數(shù)反映了一個(gè)8×8數(shù)據(jù)塊的平均亮度，一般與相鄰塊有較大的相關(guān)性。

JPEG對(duì)DC系數(shù)作差分編碼，即用前一數(shù)據(jù)塊的同一分量的DC系數(shù)作為當(dāng)前塊的預(yù)測(cè)值，再對(duì)當(dāng)前塊的實(shí)際值與預(yù)測(cè)值的差值作哈夫曼編碼。

5）DC系數(shù)編碼97

若DC系數(shù)的動(dòng)態(tài)范圍為-1024～+1024，則差值的動(dòng)態(tài)范圍為-2047～+2047。如果為每個(gè)差值賦予一個(gè)碼字，則碼表過(guò)于龐大。采用“前綴碼（SSSS）+尾碼”來(lái)表示。前綴碼指明了尾碼的有效位數(shù)B，可以根據(jù)DIFF(DC系數(shù)的差值)從對(duì)應(yīng)表中查出前綴碼對(duì)應(yīng)的哈夫曼編碼。尾碼的取值取決于DC系數(shù)的差值和前綴碼。如果DC系數(shù)的差值DIFF大于等于0，則尾碼的碼字為DIFF的B位原碼；否則，取DIFF的B位反碼。98

經(jīng)Z形排列后的AC系數(shù)，更有可能出現(xiàn)連續(xù)0組成的字符串，——行程編碼將有利于壓縮數(shù)據(jù)。

JPEG將一個(gè)非零DC系數(shù)及其前面的0行程長(zhǎng)度（連續(xù)0的個(gè)數(shù)）的組合稱(chēng)為一個(gè)事件。將每個(gè)事件編碼表示為“NNNN/SSSS+尾碼”，

NNNN——0行程的長(zhǎng)度

SSSS——尾碼的有效位數(shù)B（即當(dāng)前非0系數(shù)所占的比特?cái)?shù)），如果非零AC系數(shù)大于等于0，則尾碼的碼字為該系數(shù)的B位原碼，否則，取該系數(shù)的B位反碼。6）AC系數(shù)編碼992.運(yùn)動(dòng)圖像壓縮標(biāo)準(zhǔn)H.261：主要為電視會(huì)議等應(yīng)用制訂。也稱(chēng)P×64標(biāo)準(zhǔn)。可允許通過(guò)T1線路（帶寬為1.544Mbit/s）以小于150ms的延遲傳輸運(yùn)動(dòng)視頻。

MPEG-1：娛樂(lè)質(zhì)量的視頻壓縮標(biāo)準(zhǔn)，主要用于數(shù)字媒體上壓縮圖像數(shù)據(jù)的儲(chǔ)存和提取。

MPEG-2：用于視頻傳輸?shù)膲嚎s標(biāo)準(zhǔn)，適用于從普通電視直到高清晰度電視的帶寬范圍。

MPEG-4：適應(yīng)在窄帶寬上對(duì)動(dòng)態(tài)圖像進(jìn)行傳輸?shù)囊??？蓪?duì)各種音頻視頻AV進(jìn)行有效的編碼，同時(shí)支持固定碼流和變碼流。100一、MPEG-1視頻壓縮標(biāo)準(zhǔn)

MPEG-1是由ISO/IEC于1991年提出的，正式名稱(chēng)為“用于數(shù)字存儲(chǔ)媒體的1.5Mbit/s以下的活動(dòng)圖像及相關(guān)音頻編碼”（ISO/IEC11172）。其中的數(shù)字存儲(chǔ)媒體包括光盤(pán)（CD），視頻光盤(pán)（VCD），其中分配比特的方案是在1.5Mbps的數(shù)據(jù)傳輸中1.2Mbps用于編碼視頻，256Kbps用于立體聲。MPEG-1包括五個(gè)部分：系統(tǒng)、視頻、音頻、一致性、及軟件。在MPEG-1只采用逐行掃描方式，采用4：2：0的亞采樣格式，其源輸入格式是SIF，有352x288x25和352x288x30兩種格式。101MPEG-1采用兩種壓縮方法：幀內(nèi)壓縮算法：采用與JPEG壓縮算法大致相同的方法，即基于DCT的變換編碼技術(shù)，用以減少空間冗余信息。幀間壓縮算法：采用運(yùn)動(dòng)補(bǔ)償算法、預(yù)測(cè)編碼方法、以及差補(bǔ)法等編碼方法。幀間編碼技術(shù)可以減少時(shí)間冗余信息。102MPEG－1視頻壓縮編碼算法在MPEG-1編碼中，為了支持隨機(jī)訪問(wèn)與高效壓縮的要求，定義了四種編碼類(lèi)型：

I幀圖像編碼(幀內(nèi)圖像)、

P幀圖像編碼（預(yù)測(cè)圖像）、

B幀圖像編碼（差補(bǔ)圖或雙向預(yù)測(cè)圖像）。

D幀圖像編碼（直流分量圖像）這四種類(lèi)型的幀按某種方式組織在一起就構(gòu)成了GOP。103I幀圖像的編碼

I幀圖像是利用圖像的空間相關(guān)性進(jìn)行壓縮，其壓縮編碼采用類(lèi)似JPEG壓縮算法,同時(shí)I幀圖像又是P幀圖像和B幀圖像的參考圖像，所以I幀圖像壓縮率不高，壓縮倍數(shù)在8倍左右。

幀內(nèi)圖像I不參照任何過(guò)去的或者將來(lái)的其它圖像幀，壓縮編碼采用類(lèi)似JPEG壓縮算法：如果電視圖像是用RGB空間表示的，則首先把它轉(zhuǎn)換成YCrCb空間表示的圖像。每個(gè)圖像平面分成8×8的圖塊，對(duì)每個(gè)圖塊進(jìn)行離散余弦變換DCT。DCT變換后經(jīng)過(guò)量化的交流分量系數(shù)后進(jìn)行Z掃描，然后再使用無(wú)損壓縮技術(shù)進(jìn)行編碼。104DCT變換后經(jīng)過(guò)量化的直流分量系數(shù)采用差分脈沖編碼DPCM，交流分量系數(shù)采用游程編碼RLE，然后再采用哈夫曼(Huffman)編碼或者用算術(shù)編碼。105P幀圖像的編碼

P幀圖像是參考過(guò)去的I幀圖像（幀內(nèi)圖像）或者過(guò)去的預(yù)測(cè)得到P幀圖像用運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)技術(shù)進(jìn)行編碼，這些預(yù)測(cè)圖像通常作為進(jìn)一步預(yù)測(cè)的參考幀，預(yù)測(cè)圖像的編碼效率較高。

P幀圖像的編碼也是以圖像宏塊為基本編碼單元。預(yù)測(cè)編碼的基礎(chǔ)是運(yùn)動(dòng)估值，它將直接影響到整個(gè)系統(tǒng)的編碼效率和壓縮性能，因此希望找到一種預(yù)測(cè)精度高同時(shí)計(jì)算量又小的運(yùn)動(dòng)估值算法。106P幀編碼時(shí),編碼器需要對(duì)每一個(gè)宏塊作以下選擇:(1)決定是否作運(yùn)動(dòng)補(bǔ)償(MC/No-MC)，即是將運(yùn)動(dòng)矢量發(fā)送出去，還是設(shè)其為0。在許多情況下,使用非零的運(yùn)動(dòng)矢量并不比使用零值的運(yùn)動(dòng)矢量所形成的誤差少多少。而非零運(yùn)動(dòng)矢量需要額外的編碼比特，因此這時(shí)可設(shè)運(yùn)動(dòng)矢量為0，這樣可以提高編碼效率。(2)決定采用幀內(nèi)編碼還是幀間編碼，即是采用幀內(nèi)宏塊編碼還是利用運(yùn)動(dòng)矢量預(yù)測(cè)編碼。在許多情況下，某些宏塊采用幀內(nèi)編碼方式也許會(huì)用更少的比特。這通常發(fā)生在由于運(yùn)動(dòng)十分劇烈而導(dǎo)致運(yùn)動(dòng)估計(jì)失敗的情況。107(3)決定宏塊要不要編碼。有時(shí)在量化后，宏塊中所有的DCT系數(shù)都是0，這種宏塊就不需要被編碼。在對(duì)這種宏塊解碼時(shí)，只需要從過(guò)去的幀中把對(duì)應(yīng)的宏塊復(fù)制到這個(gè)宏塊就行了。(4)決定量化等級(jí)是否符合要求，是否需要改變。108B幀圖像的編碼

B幀圖像(或稱(chēng)雙向圖)在預(yù)測(cè)時(shí)，既可使用前向預(yù)測(cè)方式，也可使用后向預(yù)測(cè)方式，或同時(shí)使用雙向預(yù)測(cè)后取平均方式（雙向幀間預(yù)測(cè)），取決于哪一種方式下表示該宏塊所需的信息量為最少。使用雙向預(yù)測(cè)后，可以使那些在前一幀中預(yù)測(cè)不到的內(nèi)容很好地在后一幀中預(yù)測(cè)到，而且通過(guò)預(yù)測(cè)后取平均，非常有效地減少了預(yù)測(cè)噪聲的影響。它的壓縮效率最高，但雙向預(yù)測(cè)圖像不作為預(yù)測(cè)的參考圖像。109類(lèi)似于P幀，B幀在編碼前同樣要作一系列的決定,其流程如下:(1)決定運(yùn)動(dòng)補(bǔ)償模式，即前向，后向及插值

運(yùn)動(dòng)補(bǔ)償中哪個(gè)能達(dá)到最佳。

宏塊運(yùn)動(dòng)補(bǔ)償模式的選擇是基于代價(jià)函數(shù)的最小值。代價(jià)函數(shù)是運(yùn)動(dòng)補(bǔ)償宏塊和當(dāng)前宏塊的亮度差的均方誤差。解碼器通過(guò)一種簡(jiǎn)單的方法為前向運(yùn)動(dòng)補(bǔ)償計(jì)算最佳運(yùn)動(dòng)補(bǔ)償宏塊。然后再為后向運(yùn)動(dòng)補(bǔ)償計(jì)算最佳運(yùn)動(dòng)補(bǔ)償宏塊。最后再求兩種運(yùn)動(dòng)補(bǔ)償

人人文庫(kù)> 全部分類(lèi)> 專(zhuān)業(yè)文獻(xiàn) > 工程機(jī)械

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

光電圖像處理-圖像編碼

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

光電圖像處理-圖像編碼

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔