第8章-數(shù)字圖像壓縮編碼

上傳人：0*** IP屬地：湖北上傳時(shí)間：2023-02-03 格式：PPT 頁數(shù)：87 大?。?71KB 積分：28 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩82頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

多媒體通信北京科技大學(xué)楊揚(yáng)第8章圖像壓縮編碼圖像數(shù)據(jù)壓縮基礎(chǔ)圖像壓縮編碼算法靜態(tài)圖像壓縮標(biāo)準(zhǔn)動(dòng)態(tài)圖像壓縮標(biāo)準(zhǔn)H.26X標(biāo)準(zhǔn)1、圖像數(shù)據(jù)壓縮基礎(chǔ)色彩的基本概念彩色空間及其變換圖像數(shù)據(jù)壓縮的可能性1.1色彩的基本概念從人的視覺系統(tǒng)看，色彩可用色調(diào)、飽和度和亮度來描述。人眼看到的任一彩色光都是這三個(gè)特性的綜合效果，這三個(gè)特性可以說是色彩的三要素。其中：色調(diào)與光波的波長有直接關(guān)系；亮度和飽和度與光波的幅度有關(guān)。1.1色彩的基本概念—色調(diào)繪畫中要求有固定的色彩感覺，有統(tǒng)一的色調(diào)，否則難以表現(xiàn)畫面的情調(diào)和主題。例如我們說一幅畫具紅色調(diào)，是指它在色彩上總體偏紅。計(jì)算機(jī)在圖像處理上采用數(shù)字化，可以非常精確地表現(xiàn)色彩的變化，色調(diào)是相對(duì)連續(xù)變化的。用一個(gè)圓環(huán)來表現(xiàn)色譜的變化，就構(gòu)成了一個(gè)色彩連續(xù)變化的色環(huán)。1.1色彩的基本概念—亮度亮度可以說是指各種純正的色彩相互比較所產(chǎn)生的明暗差別。在純正光譜中，黃色的明度最高，顯得最亮；其次是橙、綠；再其次是紅、藍(lán)；紫色明度最低，顯得最暗。1.1色彩的基本概念—飽和度飽和度是指顏色色調(diào)的表現(xiàn)程度。飽和度越高，色彩越艷麗、越鮮明突出，越能發(fā)揮其色彩的固有特性。但飽和度高的色彩容易讓人感到單調(diào)刺眼。飽和度低，色感比較柔和協(xié)調(diào)，可混色太雜則容易讓人感覺渾濁，色調(diào)顯得灰暗。對(duì)于同一色調(diào)的彩色光，飽和度越深，顏色越鮮明或說越純，相反則越淡。1.1色彩的基本概念視覺系統(tǒng)對(duì)顏色和亮度的響應(yīng)特性1.1色彩的基本概念—圖像深度與色彩類型圖像深度是指位圖中記錄每個(gè)像素點(diǎn)所占的位數(shù)，它決定了彩色圖像中可出現(xiàn)的最多顏色數(shù)，或者灰度圖像中的最大灰度等級(jí)數(shù)。

每個(gè)像素點(diǎn)的圖像深度的分配還與圖像所用的色彩空間有關(guān)。以最常用的RGB色彩空間為例，圖像深度與色彩的映射關(guān)系主要有真彩色、偽彩色和調(diào)配色。1.1色彩的基本概念—圖像深度與色彩類型真彩色（true-color）是指圖像中的每個(gè)像素值都分成R、G、B三個(gè)基色分量，每個(gè)基色分量直接決定其基色的強(qiáng)度，這樣產(chǎn)生的色彩稱為真彩色。例如圖像深度為24，用R：G：B＝8：8：8來表示色彩，則R、G、B各占用8位來表示各自基色分量的強(qiáng)度，每個(gè)基色分量的強(qiáng)度等級(jí)為28＝256種。圖像可容納224＝16M種色彩。這樣得到的色彩可以反映原圖的真實(shí)色彩，故稱真彩色。1.1色彩的基本概念—圖像深度與色彩類型偽彩色（pseudo-color）圖像的每個(gè)像素值實(shí)際上是一個(gè)索引值或代碼，該代碼值作為色彩查找表CLUT（ColorLook-UpTable）中某一項(xiàng)的入口地址，根據(jù)該地址可查找出包含實(shí)際R、G、B的強(qiáng)度值。用這種方式產(chǎn)生的色彩本身是真的，不過它不一定反映原圖的色彩。在VGA顯示系統(tǒng)中，調(diào)色板就相當(dāng)于色彩查找表。從16色標(biāo)準(zhǔn)VGA調(diào)色板的定義可以看出這種偽彩色的工作方式。1.1色彩的基本概念—圖像深度與色彩類型調(diào)配色（direct-color）的獲取是通過每個(gè)像素點(diǎn)的R、G、B分量分別作為單獨(dú)的索引值進(jìn)行變換，經(jīng)相應(yīng)的色彩變換表找出各自的基色強(qiáng)度，用變換后的R、G、B強(qiáng)度值產(chǎn)生的色彩。1.2圖像編碼概述能夠?qū)Χ嗝襟w數(shù)據(jù)進(jìn)行壓縮編碼的前提是因?yàn)閿?shù)據(jù)存在大量的冗余，尤其是聲音和圖像。數(shù)據(jù)壓縮的目的就是盡可能消除這些冗余。冗余一般分以下幾類：統(tǒng)計(jì)冗余(空間冗余和時(shí)間冗余）信息熵冗余結(jié)構(gòu)冗余知識(shí)冗余視覺冗余1.2圖像編碼概述—統(tǒng)計(jì)冗余圖像數(shù)據(jù)存在大量的統(tǒng)計(jì)特征的重復(fù)，這種重復(fù)包括靜態(tài)單幀圖像數(shù)據(jù)在空間上的冗余和音頻、視頻數(shù)據(jù)在時(shí)間上的冗余。

在動(dòng)態(tài)圖像序列中，前后兩幀圖像之間具有較大的相關(guān)性，表現(xiàn)出幀與幀之間的重復(fù)，因而存在時(shí)間冗余。1.2圖像編碼概述—信息熵冗余信息熵定義為一組數(shù)據(jù)所表示的信息量，即

式中，E為信息熵，N為數(shù)據(jù)的種類(或稱碼元)個(gè)數(shù)，pi為第i個(gè)碼元出現(xiàn)的概率。一組數(shù)據(jù)的數(shù)據(jù)量顯然等于各記錄碼元的二進(jìn)制位數(shù)(即編碼長度)與該碼元出現(xiàn)的概率乘積之和，即

式中，D為數(shù)據(jù)量，為第i個(gè)碼元的二進(jìn)制位數(shù)。一般取b0=b1=…bN-1(如ASCII編碼把所有碼元都編碼為7比特)，這樣得到的D必然大于E。這種因碼元編碼長度的不經(jīng)濟(jì)帶來的冗余稱為信息熵冗余或編碼冗余。1.2圖像編碼概述—結(jié)構(gòu)冗余有些圖像從大面積上或整體上看存在著重復(fù)出現(xiàn)的相同或相近的紋理結(jié)構(gòu)，例如布紋圖像和草席圖像，被稱為結(jié)構(gòu)冗余。1.2圖像編碼概述—知識(shí)冗余有許多圖像的理解與圖像所表現(xiàn)內(nèi)容的基礎(chǔ)知識(shí)(先驗(yàn)或背景知識(shí))有相當(dāng)大的相關(guān)性，從這種知識(shí)出發(fā)可以歸納出圖像的某種規(guī)律性變化，這類冗余稱為知識(shí)冗余。知識(shí)冗余的一個(gè)典型例子是對(duì)人像的理解，比如，鼻子上方有眼睛，鼻子又在嘴的上方等。1.2圖像編碼概述—視覺冗余人類的視覺系統(tǒng)實(shí)際上只在一定程度上對(duì)圖像的變化產(chǎn)生敏感，即圖像數(shù)據(jù)中存在著大量人類視覺覺察不到的細(xì)節(jié)。事實(shí)上，人類視覺系統(tǒng)的一般分辨力為64灰度級(jí)，而一般圖像量化采用的是256灰度級(jí)，這類冗余稱為視覺冗余。1.2圖像編碼概述—幾種常見應(yīng)用的碼率1.3圖像編碼的方法根據(jù)編碼過程中是否存在信息損耗可將圖像編碼分為有損壓縮和無損壓縮。無損壓縮無信息損失，解壓縮時(shí)能夠從壓縮數(shù)據(jù)精確地恢復(fù)原始圖像；有損壓縮不能精確重建原始圖像，存在一定程度的失真。根據(jù)編碼原理可以將圖像編碼分為熵編碼、預(yù)測編碼、變換編碼和混合編碼等。1.3圖像編碼的方法（1）熵編碼。熵編碼是純粹基于信號(hào)統(tǒng)計(jì)特性的編碼技術(shù)，是一種無損編碼。熵編碼的基本原理是給出現(xiàn)概率較大的符號(hào)賦予一個(gè)短碼字，而給出現(xiàn)概率較小的符號(hào)賦予一個(gè)長碼字，從而使得最終的平均碼長很小。常見的熵編碼方法有行程編碼（RunLengthEncoding）、哈夫曼編碼和算術(shù)編碼。1.3圖像編碼的方法（2）預(yù)測編碼。預(yù)測編碼是基于圖像數(shù)據(jù)的空間或時(shí)間冗余特性，用相鄰的已知像素（或像素塊）來預(yù)測當(dāng)前像素（或像素塊）的取值，然后再對(duì)預(yù)測誤差進(jìn)行量化和編碼。預(yù)測編碼可分為幀內(nèi)預(yù)測和幀間預(yù)測，常用的預(yù)測編碼有差分脈碼調(diào)制（DifferentialPulseCodeModulation，DPCM）和運(yùn)動(dòng)補(bǔ)償法。1.3圖像編碼的方法（3）變換編碼。變換編碼通常是將空間域上的圖像經(jīng)過正交變換映射到另一變換域上，使變換后的系數(shù)之間的相關(guān)性降低。圖像變換本身并不能壓縮數(shù)據(jù)，但變換后圖像的大部分能量只集中到少數(shù)幾個(gè)變換系數(shù)上，采用適當(dāng)?shù)牧炕挽鼐幋a就可以有效地壓縮圖像。（4）混合編碼。混合編碼是指綜合了熵編碼、變換編碼或預(yù)測編碼的編碼方法，如JPEG標(biāo)準(zhǔn)和MPEG標(biāo)準(zhǔn)。1.3圖像編碼的方法根據(jù)對(duì)壓縮編碼后的圖像進(jìn)行重建的準(zhǔn)確程度，可將常用的圖像編碼方法分為三類：（1）信息保持編碼：也稱無失真編碼，它要求在編解碼過程中保證圖像信息不丟失，從而可以完整地重建圖像。信息保持編碼的壓縮比較低，一般不超過3:1，主要應(yīng)用在圖像的數(shù)字存儲(chǔ)方面，常用于醫(yī)學(xué)圖像編碼中。1.3圖像編碼的方法（2）保真度編碼：主要利用人眼的視覺特性，在允許的失真（Lossy）條件下或一定的保真度準(zhǔn)則下，最大限度地壓縮圖像。保真度編碼可以實(shí)現(xiàn)較大的壓縮比，主要用于數(shù)字電視技術(shù)、靜止圖像通信、娛樂等方面。對(duì)于這些圖像，過高的空間分辨率和過多的灰度層次，不僅增加了數(shù)據(jù)量，而且人眼也接收不到。因此在編碼過程中，可以丟掉一些人眼不敏感的信息，在保證一定的視覺效果條件下提高壓縮比。

1.3圖像編碼的方法（3）特征提?。涸趫D像識(shí)別、分析和分類等技術(shù)中，往往并不需要全部圖像信息，而只要對(duì)感興趣的部分特征信息進(jìn)行編碼即可壓縮數(shù)據(jù)。例如，對(duì)遙感圖像進(jìn)行農(nóng)作物分類時(shí)，就只需對(duì)用于區(qū)別農(nóng)作物與非農(nóng)作物，以及農(nóng)作物類別之間的特征進(jìn)行編碼，而可以忽略道路、河流、建筑物等其他背景信息。1.4圖像編碼的新技術(shù)圖像編碼已經(jīng)發(fā)展了幾十年，人們不斷提出新的壓縮方法。如，利用人工神經(jīng)網(wǎng)絡(luò)（ArtificialNeuralNetwork，ANN）的壓縮編碼、分形編碼（FractalCoding）、小波編碼（WaveletCoding）、基于對(duì)象的壓縮編碼（ObjectBasedCoding）和基于模型的壓縮編碼（ModelBasedCoding）等等1.4圖像編碼的新技術(shù)1）分形編碼分形編碼是在波蘭美籍?dāng)?shù)學(xué)家B.B.Mandelbrot建立的分形幾何理論的基礎(chǔ)上發(fā)展起來的一種編碼方法。分形編碼最大限度地利用了圖像在空間域上的自相似性（即局部與整體之間存在某種相似性），通過消除圖像的幾何冗余來壓縮數(shù)據(jù)。M.Barnsley將迭代函數(shù)系統(tǒng)（IterateFunctionSystem，IFS）用于描述圖像的自相似性，并將其用于圖像編碼，對(duì)某些特定圖像獲得了10000:1的壓縮比。分形編碼過程十分復(fù)雜，而解碼過程卻很簡單，故通常用于對(duì)圖像編碼一次，而需譯碼多次的信息傳播應(yīng)用中。1.4圖像編碼的新技術(shù)

2）小波編碼1989年，S.G.Mallat首次將小波變換用于圖像編碼。經(jīng)過小波變換后的圖像，具有良好的空間方向選擇性，而且是多分辨率的，能夠保持原圖像在各種分辨率下的精細(xì)結(jié)構(gòu)，與人的視覺特性十分吻合。1.4圖像編碼的新技術(shù)3）模型編碼模型編碼是近幾年發(fā)展起來的一種很有前途的低比特率編碼方法，其基本出發(fā)點(diǎn)是在編、解碼兩端分別建立起相同的模型，編碼時(shí)利用先驗(yàn)?zāi)Ｐ统槿D像中的主要信息并用模型參數(shù)的形式表示，解碼時(shí)則利用所接收的模型參數(shù)重建圖像。1.4圖像編碼評(píng)價(jià)隨著眾多圖像壓縮算法的出現(xiàn)，如何評(píng)價(jià)圖像壓縮算法就成為重要的課題。一般說來，評(píng)價(jià)圖像壓縮算法的優(yōu)劣主要有以下4個(gè)參數(shù)。

1）算法的編碼效率算法的編碼效率通常有幾種表現(xiàn)形式：平均碼字長度（R），圖像的壓縮比（rate，r），每秒鐘所需的傳輸比特?cái)?shù)（bitspersecond，bps），圖像熵與平均碼長之比（η），這些表現(xiàn)形式很容易相互轉(zhuǎn)換。下面給出與圖像編碼效率有關(guān)的幾個(gè)定義。1.4圖像編碼評(píng)價(jià)

設(shè)一幅灰度級(jí)為N的圖像，圖像中第k級(jí)灰度出現(xiàn)的概率為Pk，圖像大小為Nx×Ny，每個(gè)像素用d比特表示，每兩幀圖像間隔Δt，則按信息論中信息熵的定義，數(shù)字圖像的熵H由下式定義：

由此可見，圖像熵H表示各灰度級(jí)比特?cái)?shù)的統(tǒng)計(jì)平均值。1.4圖像編碼評(píng)價(jià)對(duì)于一種圖像編碼方法，設(shè)第k級(jí)灰度的碼字長度為Bk，則該圖像的平均碼字長度R為

1.4圖像編碼評(píng)價(jià)于是，可定義編碼效率η為每秒鐘所需的傳輸比特?cái)?shù)bps為1.4圖像編碼評(píng)價(jià)

壓縮比r為

由于同一壓縮算法對(duì)不同圖像的編碼效率會(huì)有所不同，因此常需定義一些“標(biāo)準(zhǔn)圖像”，如國際上流行的三幅圖像Lena、Barbara和Mandrill。一般通過測量不同壓縮算法對(duì)同一組“標(biāo)準(zhǔn)圖像”的編碼性能來評(píng)價(jià)各圖像壓縮算法的編碼效率。1.4圖像編碼評(píng)價(jià)

2）編碼圖像的質(zhì)量圖像質(zhì)量評(píng)價(jià)可分為客觀質(zhì)量評(píng)價(jià)和主觀質(zhì)量評(píng)價(jià)。最常用的客觀質(zhì)量評(píng)價(jià)指標(biāo)是均方誤差（MSE）和峰值信噪比（PSNR），其定義如下：

1.4圖像編碼評(píng)價(jià)

主觀質(zhì)量評(píng)價(jià)是指由一批觀察者對(duì)編碼圖像進(jìn)行觀察并打分，然后綜合所有人的評(píng)判結(jié)果，給出圖像的質(zhì)量評(píng)價(jià)?？陀^質(zhì)量評(píng)價(jià)能夠快速有效地評(píng)價(jià)編碼圖像的質(zhì)量，但符合客觀質(zhì)量評(píng)價(jià)指標(biāo)的圖像不一定具有較好的主觀質(zhì)量。主觀質(zhì)量評(píng)價(jià)能夠與人的視覺效果相匹配，但其評(píng)判過程緩慢費(fèi)時(shí)。1.4圖像編碼評(píng)價(jià)

3）算法的適用范圍特定的圖像編碼算法具有其相應(yīng)的適用范圍，并不對(duì)所有圖像都有效。一般說來，大多數(shù)基于圖像信息統(tǒng)計(jì)特性的壓縮算法具有較廣的適用范圍，而一些特定的編碼算法的適用范圍較窄，如分形編碼主要用于自相似性高的圖像。1.4圖像編碼評(píng)價(jià)

4）算法的復(fù)雜度算法的復(fù)雜度即指完成圖像壓縮和解壓縮所需的運(yùn)算量和硬件實(shí)現(xiàn)該算法的難易程度。優(yōu)秀的壓縮算法要求有較高的壓縮比，壓縮和解壓縮快，算法簡單，易于硬件實(shí)現(xiàn)，還要求解壓縮后的圖像質(zhì)量較好。選用編碼方法時(shí)一定要考慮圖像信源本身的統(tǒng)計(jì)特性、多媒體系統(tǒng)(硬件和軟件產(chǎn)品)的適應(yīng)能力、應(yīng)用環(huán)境以及技術(shù)標(biāo)準(zhǔn)。2.1圖像壓縮編碼算法—行程長度編碼把一系列的重復(fù)值（例如圖像象素的灰度值）用一個(gè)單獨(dú)的值再加上一個(gè)計(jì)數(shù)值來取代。

比如有這樣一個(gè)字母序列aabbbccccccccdddddd它的行程長度編碼就是2a3b8c6d。

很多位圖文件格式都用行程長度編碼，例如TIFF，PCX。2.1圖像壓縮編碼算法—行程長度編碼例如：有一線狀圖像，其灰度隨長度坐標(biāo)的關(guān)系如下圖所示。描述這個(gè)一維圖像可以用順序的七個(gè)3bit的二進(jìn)制數(shù)表示：011，011，011，011，101，101，101，共21比特。

如果用行程編碼方法對(duì)其編碼，其編碼就變成了100，011；011，101，共用了12比特，比前一種編碼節(jié)約了9個(gè)比特。2.2圖像壓縮編碼算法—哈夫曼編碼

基本思路：出現(xiàn)頻率越高的符號(hào)，對(duì)應(yīng)的編碼長度越短編碼步驟如下：統(tǒng)計(jì)信源符號(hào)出現(xiàn)的概率；將信源符號(hào)按概率遞減順序排列；

把兩個(gè)最小的概率值加起來，作為一個(gè)新組合符號(hào)的概率；重復(fù)步驟(2)、(3)，直到概率和達(dá)到1為止；在每次合并信源時(shí)，將合并的信源分別標(biāo)記“1”和“0”（例如，概率小的標(biāo)記為“1”，概率大的標(biāo)記為“0”）；尋找從每一信源符號(hào)到概率為1的路徑，記錄下路徑上的“1”和“0”；對(duì)每一符號(hào)寫出“1”和“0”序列；2.2圖像壓縮編碼算法—哈夫曼編碼考慮信源：進(jìn)行哈夫曼編碼的過程如下：編碼前：平均碼長為3編碼后：平均碼長為2.45壓縮比：2.45/32.2圖像壓縮編碼算法—哈夫曼編碼哈夫曼編碼的不足：它必須精確地統(tǒng)計(jì)出原始文件中每個(gè)值的出現(xiàn)頻率，如果沒有這個(gè)精確統(tǒng)計(jì)，壓縮的效果就會(huì)大打折扣，甚至根本達(dá)不到壓縮的效果。因此哈夫曼編碼通常要經(jīng)過兩遍操作，第一遍進(jìn)行統(tǒng)計(jì)，第二遍產(chǎn)生編碼，所以編碼的過程是比較慢的。另外由于各種長度的編碼的譯碼過程也比較復(fù)雜，因此解壓縮的過程也比較慢。它對(duì)于位的增刪比較敏感。

2.2圖像壓縮編碼算法—辭典編碼辭典編碼是一種通用編碼技術(shù)，屬于無損壓縮技術(shù)?！o典編碼的思想辭典編碼的根據(jù)是數(shù)據(jù)本身包含的重復(fù)代碼，如文本文件和光柵圖像就具有這種特性。辭典編碼歸納起來有兩類。第一類辭典編碼的想法是：查找壓縮的字符序列是否在以前輸入的數(shù)據(jù)中出現(xiàn)過，然后用已經(jīng)出現(xiàn)過的字符串代替重復(fù)的部分，它的輸出僅僅是指向早期出現(xiàn)過的字符串的“指針”。2.2圖像壓縮編碼算法—辭典編碼第二類算法的思想是，從輸入的數(shù)據(jù)中創(chuàng)建一個(gè)“短語辭典”，編碼數(shù)據(jù)過程中，遇到已經(jīng)在辭典中出現(xiàn)的“短語”時(shí)，編碼器就輸出這個(gè)詞典中該短語的“索引號(hào)”，而不是短語本身。J.Ziv和A.Lempel在1978年首次發(fā)表了介紹這種編碼的文章，在他們研究的基礎(chǔ)上，TerryA.Weltch在1984年發(fā)表了改進(jìn)這種編碼算法的文章，因此這種編碼方法稱為LZW壓縮編碼。2.3圖像壓縮編碼算法—LZW編碼LZW（Lempel-Ziv&Welch）編碼又稱字串表編碼，屬于一種無損編碼，是Welch將Lempel和Ziv所提出的無損壓縮技術(shù)改進(jìn)后的壓縮方法。LZW編碼的基本思想是：在編碼過程中，將所遇到的字符串建立一個(gè)字符串表，表中的每個(gè)字符串都對(duì)應(yīng)一個(gè)索引，編碼時(shí)用該字符串在字串表中的索引來代替原始的數(shù)據(jù)串。2.3圖像壓縮編碼算法—LZW編碼例如，一幅8位的灰度圖像，我們可以采用12位來表示每個(gè)字符串的索引，前256個(gè)索引用于對(duì)應(yīng)可能出現(xiàn)的256種灰度，由此可建立一個(gè)初始的字符串表，而剩余的3840個(gè)索引就可分配給在壓縮過程中出現(xiàn)的新字符串，這樣就生成了一個(gè)完整的字符串表，壓縮數(shù)據(jù)就可以只保存它在字符串表中的索引，從而達(dá)到壓縮數(shù)據(jù)的目的。字符串表是在壓縮過程中動(dòng)態(tài)生成的，不必將它保存在壓縮文件里，因?yàn)榻鈮嚎s時(shí)字符串表可以由壓縮文件中的信息重新生成。2.4圖像壓縮編碼算法—算術(shù)編碼算術(shù)編碼在圖像數(shù)據(jù)壓縮標(biāo)準(zhǔn)(如JPEG，JBIG)中扮演了重要的角色。在算術(shù)編碼中，消息用0到1之間的實(shí)數(shù)進(jìn)行編碼，算術(shù)編碼用到兩個(gè)基本的參數(shù)：符號(hào)的概率和它的編碼間隔。信源符號(hào)的概率決定壓縮編碼的效率，也決定編碼過程中信源符號(hào)的間隔，而這些間隔包含在0到1之間。編碼過程中的間隔決定了符號(hào)壓縮后的輸出。2.4圖像壓縮編碼算法—算術(shù)編碼算法舉例假設(shè)信源符號(hào)為{00,01,10,11}，這些符號(hào)的概率分別為{0.1,0.4,0.2,0.3}，根據(jù)這些概率可把間隔[0,1)分成4個(gè)子間隔：[0,0.1),[0.1,0.5),[0.5,0.7),[0.7,1)，二進(jìn)制消息序列的輸入為：10001100101101算術(shù)編碼過程如下頁圖所示：2.4圖像壓縮編碼算法—算術(shù)編碼3、靜態(tài)圖像壓縮標(biāo)準(zhǔn)JPEGJPEG20003、靜態(tài)圖像壓縮標(biāo)準(zhǔn)JPEG是國際標(biāo)準(zhǔn)化組織(ISO)和國際電報(bào)電話咨詢委員會(huì)(CCITT)關(guān)于靜止圖像編碼的聯(lián)合專家組(JointPhotographicExpertsGroup)名稱的縮寫。該標(biāo)準(zhǔn)可用于自然景象或任何連續(xù)色調(diào)圖像的數(shù)字?jǐn)?shù)據(jù)的壓縮編碼和解碼。對(duì)于數(shù)字化精度為每種彩色分量每個(gè)樣點(diǎn)4至16比特的數(shù)字圖像有良好的壓縮效果，但不適用于二值圖像。3、靜態(tài)圖像壓縮標(biāo)準(zhǔn)JPEG標(biāo)準(zhǔn)綜合了多年來圖像壓縮編碼的研究成果，是一種集大成的算法。該標(biāo)準(zhǔn)規(guī)定了兩種工作方式，即順序方式和漸進(jìn)方式；還規(guī)定了三種級(jí)別的編碼算法，即基本系統(tǒng)(Baselinesystem)、擴(kuò)展系統(tǒng)(Extendedsystem)和無失真系統(tǒng)(Losslesscoding)。3.1JPEGJPEG是面向靜態(tài)圖像編碼的國際標(biāo)準(zhǔn)。在相同圖像質(zhì)量條件下，JPEG文件擁有比其他圖像文件格式更高的壓縮比。JPEG目前被廣泛應(yīng)用于多媒體和網(wǎng)絡(luò)程序中，是現(xiàn)今萬維網(wǎng)中使用最廣泛的兩種圖像文件格式之一。JPEG是一種有損壓縮，即在壓縮過程中會(huì)丟失數(shù)據(jù)，每次編輯JPEG圖像后，圖像就會(huì)被重復(fù)壓縮一次，損失就會(huì)有所增加。3.1JPEG順序（Sequential）方式：從左到右、從上到下對(duì)圖像順序進(jìn)行基于離散余弦變換（DCT）的編碼。DCT理論上是可逆的，但在計(jì)算時(shí)存在誤差，因而基于DCT的編碼模式是一種有損編碼。3.1JPEG漸進(jìn)方式（Progressivemode）：整個(gè)圖像首先以一種低于最終質(zhì)量要求的質(zhì)量標(biāo)準(zhǔn)(如分辨率或數(shù)據(jù)精度)進(jìn)行編碼，完成后再以較上次高一級(jí)的質(zhì)量要求再進(jìn)行一次編碼，但僅傳送為改善質(zhì)量所需增加的那部分信息。這種過程可以重復(fù)若干次直至達(dá)到所需的最終質(zhì)量要求。每個(gè)子過程中的編碼則還是順序方式的。3.1JPEG---基本系統(tǒng)以離散余弦變換為核心，采用順序工作方式，適用于一般精度(每種分量每個(gè)樣點(diǎn)8比特)的圖像，有良好的壓縮效果，壓縮比可調(diào)。標(biāo)準(zhǔn)規(guī)定，每個(gè)JPEG靜止圖像壓縮編解碼器都必須具有實(shí)現(xiàn)基本系統(tǒng)的功能。3.1JPEG---基本系統(tǒng)流程基本系統(tǒng)3.1JPEG---基本系統(tǒng)流程通過離散余弦變換減少圖像數(shù)據(jù)的相關(guān)性；利用人眼視覺特性對(duì)系數(shù)進(jìn)行自適應(yīng)量化；對(duì)每個(gè)子塊量化后的系數(shù)矩陣進(jìn)行Z形掃描，將系數(shù)矩陣變換成符號(hào)序列；用哈夫曼變長碼對(duì)符號(hào)進(jìn)行熵編碼。3.1JPEG---基本系統(tǒng)流程Z形掃描3.1JPEG---漸近方式漸進(jìn)方式的基本實(shí)現(xiàn)有三種方式（1）頻譜選擇法，即按Z形掃描的序號(hào)將DCT量化序數(shù)分成幾個(gè)頻段，每個(gè)頻段對(duì)應(yīng)一次掃描，每塊均先傳送低頻掃描數(shù)據(jù)，得到原圖概貌，再依次傳送高頻掃描數(shù)據(jù)，使圖像逐漸清晰；（2）逐次逼近法，即每次掃描全部DCT量化序數(shù)，但每次的表示精度逐漸提高。（3）階梯方式，圖像以數(shù)種分辨率來壓縮，其目的是為了讓具有高分辨率的圖像也可以在較低分辨率的設(shè)備上顯示。3.1JPEG---壓縮效果采用JPEG算法所能達(dá)到的壓縮效果，與被壓縮圖像的特性有關(guān)。對(duì)于在開發(fā)和測試本算法標(biāo)準(zhǔn)時(shí)所用的那些內(nèi)容是彩色自然景物和人像的測試圖片，壓縮到0.15比特/像素時(shí)，圖像可識(shí)別；0.25比特/像素時(shí)，解碼后的圖像可評(píng)價(jià)為“有用(usefulimage)”；約0.75比特/像素時(shí)，被認(rèn)為是“極佳(verygood)”；大約1.5比特/像素時(shí)基本上與原圖像無法區(qū)別。用無失真算法對(duì)這些測試圖片進(jìn)行壓縮編碼，大致可以得到2:1的壓縮比。3.2JPEG2000JPEG2000的核心JPEG2000的優(yōu)勢JPEG2000的應(yīng)用3.2JPEG2000---核心放棄了JPEG所采用的以離散余弦變換算法為主的區(qū)塊編碼方式，而改用以離散小波變換算法為主的多解析編碼方式。JPEG2000還將彩色靜態(tài)畫面采用的JPEG編碼方式、2值圖像采用的JBIG(JointBinaryImageGroup)編碼方式及低壓縮率采用JPEGLS統(tǒng)一起來，成為對(duì)應(yīng)各種圖像的通用編碼方式。3.2JPEG2000---優(yōu)勢高壓縮率無損壓縮漸進(jìn)傳輸感興趣區(qū)域壓縮3.2JPEG2000---應(yīng)用目前，支持JPEG2000的軟件已經(jīng)出現(xiàn)，如LuraWaveSmartCompressFreewareforWindows為ACDSee3.0提供JPEG2000LWF格式的外掛插件，這樣只要安置了這個(gè)插件就可以觀看和制作采用JPEG2000編碼的LWF格式文件。在不久的將來，JPEG2000無論是在傳統(tǒng)的JPEG市場（如數(shù)碼相機(jī)、掃描儀等）還是在新興應(yīng)用領(lǐng)域（如網(wǎng)路傳輸、無線通訊、醫(yī)療影像等）都將大有用武之地。4、動(dòng)態(tài)圖像壓縮標(biāo)準(zhǔn)MPEG是運(yùn)動(dòng)圖像專家組(MotionPictureExpertsGroup)的縮寫，是國際標(biāo)準(zhǔn)化組織中IEC/JTC1/SC2/WG11的一個(gè)小組。MPEG下分三個(gè)小組：視頻組(MPEG-Video)的任務(wù)是研究壓縮傳輸速度上限為1.5Mbps的視頻信號(hào)；音頻組(MPEG-Audio)的任務(wù)是研究壓縮每信道64、128和192Kbps的數(shù)字音頻信號(hào)；系統(tǒng)組(MPEG-System)則解決多道壓縮視頻、音頻位流的同步及合成問題。

MPEG委員會(huì)的工作始于1988年，1990年制訂出標(biāo)準(zhǔn)草案。兩年中MPEG工作參加單位由15家發(fā)展到150家。MPEG工作一開始就兼顧JPEG標(biāo)準(zhǔn)，CCITT的H.261標(biāo)準(zhǔn)，支持這兩個(gè)標(biāo)準(zhǔn)的優(yōu)秀成果。4、動(dòng)態(tài)圖像壓縮標(biāo)準(zhǔn)MPEG標(biāo)準(zhǔn)主要有以下五個(gè)，MPEG-1、MPEG-2、MPEG-4、MPEG-7及MPEG-21等。MPEG標(biāo)準(zhǔn)的視頻壓縮編碼技術(shù)主要利用了具有運(yùn)動(dòng)補(bǔ)償?shù)膸g壓縮編碼技術(shù)以減小時(shí)間冗余度，利用DCT技術(shù)以減小圖象的空間冗余度，利用熵編碼則在信息表示方面減小了統(tǒng)計(jì)冗余度。這幾種技術(shù)的綜合運(yùn)用，大大增強(qiáng)了壓縮性能。4、動(dòng)態(tài)圖像壓縮標(biāo)準(zhǔn)MPEG-1標(biāo)準(zhǔn)于1992年正式出版，標(biāo)準(zhǔn)的編號(hào)為ISO/IEC11172，其標(biāo)題為“碼率約為1.5Mb/s用于數(shù)字存貯媒體活動(dòng)圖象及其伴音的編碼”。MPEG-2標(biāo)準(zhǔn)于1994年公布，包括編號(hào)為13818-1系統(tǒng)部分、編號(hào)為13818-2的視頻部分、編號(hào)為13818-3的音頻部分及編號(hào)為13818-4的符合性測試部分。該標(biāo)準(zhǔn)希望囊括數(shù)字電視、圖象通信各領(lǐng)域的編碼標(biāo)準(zhǔn)。MPEG-4是基于內(nèi)容的壓縮編碼標(biāo)準(zhǔn)。MPEG-7是“多媒體內(nèi)容描述接口標(biāo)準(zhǔn)”。MPEG-21是有關(guān)多媒體框架的協(xié)議。4.1MPEG-1標(biāo)準(zhǔn)MPEG-1標(biāo)準(zhǔn)叫作“運(yùn)動(dòng)圖像和伴隨聲音的編碼—用于速率約在1.5Mb/s以下的數(shù)字存儲(chǔ)媒體”，主要用于多媒體存儲(chǔ)與再現(xiàn)，如VCD等。

MPEG-1采用CIF視頻格式(分辨率為352×288)，幀速率為25幀/秒或30幀/秒，碼率為1.5Mb/s(其中視頻約1.2Mb/s，音頻約0.3Mb/s)。

MPEG-1將視頻圖像序列劃分為I幀、P幀和B幀

標(biāo)準(zhǔn)草案于1991年11月完成，1992年11月正式通過。4.1MPEG-1標(biāo)準(zhǔn)MPEG-1由五個(gè)部分組成：MPEG-1Systems，規(guī)定電視圖像數(shù)據(jù)、聲音數(shù)據(jù)及其它相關(guān)數(shù)據(jù)的同步MPEG-1Video,規(guī)定視頻數(shù)據(jù)的編碼和解碼，MPEG-1Audio,規(guī)定音頻數(shù)據(jù)的編碼和解碼MPEG-1Conformancetesting，詳細(xì)說明如何測試比特?cái)?shù)據(jù)流(bitstreams)和解碼器是否滿足MPEG-1前3個(gè)部分(Part1，2和3)中所規(guī)定的要求MPEG-1Softwaresimulation4.2MPEG-2標(biāo)準(zhǔn)MPEG-2標(biāo)準(zhǔn)的基本算法也是運(yùn)動(dòng)補(bǔ)償?shù)念A(yù)測和帶有DCT的幀間內(nèi)變長編碼與MPEG-1的主要區(qū)別在于：

能夠有效地支持電視的隔行掃描格式

支持可分級(jí)的可調(diào)視頻編碼，這適用于需要同時(shí)提供多種質(zhì)量的視頻業(yè)務(wù)的情況

根據(jù)MPEG-2的標(biāo)準(zhǔn)CCIR601格式(702×576×25幀)的信號(hào)可壓縮到4Mb/s～6Mb/s，而HDTV格式(1280×720×60幀)的信號(hào)可壓縮到20Mb/s左右。4.2MPEG-2標(biāo)準(zhǔn)---組成（1）MPEG-2Systems，規(guī)定電視圖像數(shù)據(jù)、聲音數(shù)據(jù)及其它相關(guān)數(shù)據(jù)的同步（2）MPEG-2Video，規(guī)定視頻數(shù)據(jù)的編碼和解碼

（3）MPEG-2Audio，規(guī)定聲音數(shù)據(jù)的編碼和解碼，是MPEG-1Audio的擴(kuò)充，支持多個(gè)聲道

（4）MPEG-2Conformancetesting4.2MPEG-2標(biāo)準(zhǔn)---組成（5）MPEG-2Softwaresimulation（6）MPEG-2數(shù)字存儲(chǔ)媒體命令和控制擴(kuò)展協(xié)議

（7）MPEG-2先進(jìn)聲音編碼(MPEG-2AAC)，是多聲道聲音編碼算法標(biāo)準(zhǔn)

（8）MPEG-2系統(tǒng)解碼器實(shí)時(shí)接口擴(kuò)展標(biāo)準(zhǔn)

（9）MPEG-2DSM-CC一致性擴(kuò)展測試

4.3MPEG-4標(biāo)準(zhǔn)MPEG-4于1998年10月定案，在1999年1月成為一個(gè)國際性標(biāo)準(zhǔn)，隨后為擴(kuò)展用途又進(jìn)行了第二版的開發(fā)，于1999年底結(jié)束，其正式名稱為ISO14496-2，是為了滿足交互式多媒體應(yīng)用而制定的新一代國際標(biāo)準(zhǔn)，具有更高的靈活性和可擴(kuò)展性。MPEG-4主要應(yīng)用于可視電話、視頻郵件和電子新聞等，對(duì)傳輸速率要求較低，在4800bps～64000bps之間。4.3MPEG-4標(biāo)準(zhǔn)利用很窄的帶寬，通過幀重建技術(shù)，壓縮和傳輸數(shù)據(jù)，以求以最小的數(shù)據(jù)獲得最佳的圖像質(zhì)量?；趦?nèi)容的壓縮、更高的壓縮比和時(shí)空可伸縮性，是MPEG-4最重要的三個(gè)技術(shù)特征。

MPEG-4標(biāo)準(zhǔn)同以前標(biāo)準(zhǔn)的最顯著的差別在于它是采用基于對(duì)象的編碼理念，即在編碼時(shí)將一幅景物分成若干在時(shí)間和空間上相互聯(lián)系的視頻音頻對(duì)象，分別編碼后，再經(jīng)過復(fù)用傳輸?shù)浇邮斩?，然后再?duì)不同的對(duì)象分別解碼，從而組合成所需要的視頻和音頻。4.4MPEG-7標(biāo)準(zhǔn)國際標(biāo)準(zhǔn)化組織（ISO）在制定MPEG-1、MPEG-2及MPEG-4的標(biāo)準(zhǔn)基礎(chǔ)上，推出了新的標(biāo)準(zhǔn)MPEG-7，該標(biāo)準(zhǔn)的正式名稱為“多媒體內(nèi)容描述接口”（MultimediaContentDescriptionInterface）,其目標(biāo)是產(chǎn)生一種描述多媒體內(nèi)容數(shù)據(jù)的標(biāo)準(zhǔn)，滿足實(shí)時(shí)、非實(shí)時(shí)以及推-拉應(yīng)用的需求。它既不同于基于波形和基于壓縮的表示方式如MPEG-1和MPEG-2,又不同于基于對(duì)象的表示方式如MPEG-4，而是將對(duì)各種不同類型的多媒體信息進(jìn)行標(biāo)準(zhǔn)化描述，并將該描述與所

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

第8章-數(shù)字圖像壓縮編碼

文檔簡介

溫馨提示

最新文檔

評(píng)論

第8章-數(shù)字圖像壓縮編碼

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔