第2章多媒體信息壓縮_第1頁
第2章多媒體信息壓縮_第2頁
第2章多媒體信息壓縮_第3頁
第2章多媒體信息壓縮_第4頁
第2章多媒體信息壓縮_第5頁
已閱讀5頁,還剩59頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、p概述:概述:本章主要講述了多媒體數(shù)據(jù)的壓縮技術(shù)。本章主要講述了多媒體數(shù)據(jù)的壓縮技術(shù)。1、數(shù)據(jù)壓縮的基本原理和方法;、數(shù)據(jù)壓縮的基本原理和方法;2、統(tǒng)計(jì)編碼、統(tǒng)計(jì)編碼3、圖像壓縮編碼、圖像壓縮編碼4、數(shù)字音頻壓縮編碼、數(shù)字音頻壓縮編碼 5、數(shù)字視頻壓縮編碼、數(shù)字視頻壓縮編碼p為什么要進(jìn)行數(shù)據(jù)壓縮?為什么要進(jìn)行數(shù)據(jù)壓縮?p多媒體信息多媒體信息包括了文本、數(shù)據(jù)、聲音、動(dòng)畫、圖包括了文本、數(shù)據(jù)、聲音、動(dòng)畫、圖形、圖像以及視頻等多種媒體信息。雖然經(jīng)過數(shù)形、圖像以及視頻等多種媒體信息。雖然經(jīng)過數(shù)字化處理后其字化處理后其數(shù)據(jù)量是非常大的,如果不進(jìn)行數(shù)數(shù)據(jù)量是非常大的,如果不進(jìn)行數(shù)據(jù)壓縮處理,計(jì)算機(jī)系統(tǒng)就無

2、法對(duì)它進(jìn)行存儲(chǔ)和據(jù)壓縮處理,計(jì)算機(jī)系統(tǒng)就無法對(duì)它進(jìn)行存儲(chǔ)和交換。交換。另一個(gè)原因是圖像、音頻和視頻這些另一個(gè)原因是圖像、音頻和視頻這些媒體媒體具有很大的壓縮潛力。具有很大的壓縮潛力。因?yàn)樵诙嗝襟w數(shù)據(jù)中,存因?yàn)樵诙嗝襟w數(shù)據(jù)中,存在著空間冗余、時(shí)間冗余、結(jié)構(gòu)冗余、知識(shí)冗余、在著空間冗余、時(shí)間冗余、結(jié)構(gòu)冗余、知識(shí)冗余、視覺冗余、圖像區(qū)域的相同性冗余、紋理的統(tǒng)計(jì)視覺冗余、圖像區(qū)域的相同性冗余、紋理的統(tǒng)計(jì)冗余等。它們?yōu)閿?shù)據(jù)壓縮技術(shù)的應(yīng)用提供了可能冗余等。它們?yōu)閿?shù)據(jù)壓縮技術(shù)的應(yīng)用提供了可能的條件。的條件。p空間冗余:相鄰區(qū)域空間冗余:相鄰區(qū)域p時(shí)間冗余:相鄰時(shí)間時(shí)間冗余:相鄰時(shí)間p結(jié)構(gòu)冗余:相鄰位置結(jié)構(gòu)冗

3、余:相鄰位置p知識(shí)冗余:知識(shí)推理知識(shí)冗余:知識(shí)推理p視覺冗余:邊緣區(qū)域視覺冗余:邊緣區(qū)域p相似性冗余:多個(gè)區(qū)域相似相似性冗余:多個(gè)區(qū)域相似p聽覺冗余:較弱的聲音聽覺冗余:較弱的聲音p數(shù)據(jù)壓縮技術(shù)的分類數(shù)據(jù)壓縮技術(shù)的分類 (1)根據(jù)質(zhì)量有無損失可分為)根據(jù)質(zhì)量有無損失可分為有損失有損失編碼編碼和和無損失編碼。無損失編碼。 (2)根據(jù)數(shù)據(jù)壓縮算法,可以將數(shù)據(jù))根據(jù)數(shù)據(jù)壓縮算法,可以將數(shù)據(jù)壓縮技術(shù)分為壓縮技術(shù)分為統(tǒng)計(jì)編碼、預(yù)測編碼、統(tǒng)計(jì)編碼、預(yù)測編碼、變換編碼、分析合成編碼和其他變換編碼、分析合成編碼和其他編碼編碼。 p統(tǒng)計(jì)編碼:根據(jù)出現(xiàn)的概率分布統(tǒng)計(jì)編碼:根據(jù)出現(xiàn)的概率分布p預(yù)測編碼:原始信號(hào)取樣

4、,量化存儲(chǔ)差值預(yù)測編碼:原始信號(hào)取樣,量化存儲(chǔ)差值pPCM編碼:對(duì)連續(xù)語音進(jìn)行采樣編碼:對(duì)連續(xù)語音進(jìn)行采樣p量化與向量化編碼:將模擬量轉(zhuǎn)化數(shù)字量化與向量化編碼:將模擬量轉(zhuǎn)化數(shù)字p頻段劃分編碼:基于頻段劃分處理頻段劃分編碼:基于頻段劃分處理p變換編碼:對(duì)信號(hào)進(jìn)行函數(shù)變換變換編碼:對(duì)信號(hào)進(jìn)行函數(shù)變換p知識(shí)編碼:規(guī)則庫知識(shí)編碼:規(guī)則庫p混合編碼:兩種以上編碼混合編碼:兩種以上編碼冗余壓縮法(無損壓縮法)冗余壓縮法(無損壓縮法) 該方法在壓縮時(shí)去掉部分冗余信息,而該方法在壓縮時(shí)去掉部分冗余信息,而這些被丟失信息經(jīng)過解壓后可以完整的被恢這些被丟失信息經(jīng)過解壓后可以完整的被恢復(fù)到壓縮前的狀態(tài),是一個(gè)復(fù)到壓

5、縮前的狀態(tài),是一個(gè)可逆可逆的過程。因的過程。因此,冗余壓縮法不會(huì)產(chǎn)生數(shù)據(jù)失真,一般用此,冗余壓縮法不會(huì)產(chǎn)生數(shù)據(jù)失真,一般用于于文本、數(shù)據(jù)文本、數(shù)據(jù)的壓縮,以保證完全的恢復(fù)原的壓縮,以保證完全的恢復(fù)原始數(shù)據(jù)。但這種方法的壓縮比較小,一般在始數(shù)據(jù)。但這種方法的壓縮比較小,一般在2:15:1之間。之間。熵壓縮法(有損壓縮法)熵壓縮法(有損壓縮法) 該方法壓縮時(shí)會(huì)丟失部分冗余信息,且該方法壓縮時(shí)會(huì)丟失部分冗余信息,且這些被丟失信息不能被恢復(fù),是一個(gè)這些被丟失信息不能被恢復(fù),是一個(gè)不可逆不可逆的過程。解壓后的數(shù)據(jù)存在一定程度的失真。的過程。解壓后的數(shù)據(jù)存在一定程度的失真。這種壓縮方法的壓縮比可達(dá)幾十到上

6、百,常這種壓縮方法的壓縮比可達(dá)幾十到上百,常用于用于圖像、聲音、動(dòng)態(tài)視頻圖像、聲音、動(dòng)態(tài)視頻等數(shù)據(jù)的壓等數(shù)據(jù)的壓縮??s。p數(shù)據(jù)壓縮技術(shù)的性能指標(biāo) (1)壓縮比壓縮比 :壓縮比例:壓縮比例(2)壓縮、解壓縮速度壓縮、解壓縮速度(3)壓縮質(zhì)量壓縮質(zhì)量 :感知效果:感知效果p 統(tǒng)計(jì)編碼屬于無損壓縮編碼,是根統(tǒng)計(jì)編碼屬于無損壓縮編碼,是根據(jù)信源符號(hào)出現(xiàn)概率的分布特性而據(jù)信源符號(hào)出現(xiàn)概率的分布特性而進(jìn)行的壓縮編碼。進(jìn)行的壓縮編碼。p其目的是在信源符號(hào)和碼字之間建其目的是在信源符號(hào)和碼字之間建立明確的一一對(duì)應(yīng)關(guān)系,以便在恢立明確的一一對(duì)應(yīng)關(guān)系,以便在恢復(fù)時(shí)能準(zhǔn)確地再現(xiàn)原信號(hào),同時(shí)要復(fù)時(shí)能準(zhǔn)確地再現(xiàn)原信號(hào),

7、同時(shí)要使平均碼長或碼率盡量小。使平均碼長或碼率盡量小。 p 相關(guān)概念相關(guān)概念p信息:信息:信息是用不確定性的量度定義的。信息是用不確定性的量度定義的。p信息量:信息量:是指從是指從N個(gè)相等可能事件中選出一個(gè)相等可能事件中選出一個(gè)事件所需要的信息度量或含量,也就是個(gè)事件所需要的信息度量或含量,也就是在辯識(shí)在辯識(shí)N個(gè)事件中特定的一個(gè)事件的過程中個(gè)事件中特定的一個(gè)事件的過程中所需要提問所需要提問“是或否是或否”的最少次數(shù)的最少次數(shù)p 相關(guān)概念相關(guān)概念 (3) 熵:熵:如果將信源所有可能事件的信息如果將信源所有可能事件的信息量進(jìn)行平均,就得到了信息熵量進(jìn)行平均,就得到了信息熵(entropy)。熵。熵

8、就是平均信息量。就是平均信息量。p如果用如果用0 0和和1 1組成的二進(jìn)制數(shù)碼為含有組成的二進(jìn)制數(shù)碼為含有n n個(gè)符個(gè)符號(hào)的某條信息編碼,假設(shè)符號(hào)號(hào)的某條信息編碼,假設(shè)符號(hào)FnFn在整條信在整條信息中重復(fù)出現(xiàn)的概率為息中重復(fù)出現(xiàn)的概率為PnPn,則該符號(hào)的熵,則該符號(hào)的熵也即表示該符號(hào)所需的位數(shù)為:也即表示該符號(hào)所需的位數(shù)為:pEn = En = loglog2 2(Pn)(Pn)p整條信息的熵,即表示整條信息所需的位整條信息的熵,即表示整條信息所需的位數(shù)為:數(shù)為:E = EnE = Enp例如:對(duì)下面這條只出現(xiàn)了例如:對(duì)下面這條只出現(xiàn)了a a、b b、c c三個(gè)字符的字三個(gè)字符的字符串:符串

9、:aabbaccbaa aabbaccbaa ,字符串長度為,字符串長度為1010,字符,字符a a、b b、c c分別出現(xiàn)了分別出現(xiàn)了5 5、3 3、2 2次,則次,則a a、b b、c c在信息中出現(xiàn)在信息中出現(xiàn)的概率分別為的概率分別為0.50.5、0.30.3、0.20.2,他們的熵分別為:,他們的熵分別為:pEa=-logEa=-log2 2(0.5)=1(0.5)=1pEb=-logEb=-log2 2(0.3)=1.737(0.3)=1.737pEc=-logEc=-log2 2(0.2)=2.322(0.2)=2.322pE=EaE=Ea* *5+Eb5+Eb* *3+Ec3+E

10、c* *2=14.8552=14.855位位 最佳編碼定理p在變字長碼中,對(duì)于出現(xiàn)概率大的信息符在變字長碼中,對(duì)于出現(xiàn)概率大的信息符號(hào)編以短字長的碼,對(duì)于出現(xiàn)概率小的信號(hào)編以短字長的碼,對(duì)于出現(xiàn)概率小的信息符號(hào)編以長字長的碼,如果碼字長度嚴(yán)息符號(hào)編以長字長的碼,如果碼字長度嚴(yán)格按照符號(hào)概率的大小的相反順序排列,格按照符號(hào)概率的大小的相反順序排列,則平均碼字長度一定小于按任何其它符號(hào)則平均碼字長度一定小于按任何其它符號(hào)順序排列方式得到的碼字長度。順序排列方式得到的碼字長度。Huffman 編碼編碼步驟:步驟:(1 1)概率統(tǒng)計(jì),得到)概率統(tǒng)計(jì),得到n n個(gè)不同概率的信息符號(hào);個(gè)不同概率的信息符號(hào)

11、; (2 2)將)將n n個(gè)信源信息符號(hào)的個(gè)信源信息符號(hào)的n n個(gè)概率,按概率大小排序;個(gè)概率,按概率大小排序;(3 3)將)將n n個(gè)概率中,最后兩個(gè)小概率相加,這時(shí)概率個(gè)數(shù)減個(gè)概率中,最后兩個(gè)小概率相加,這時(shí)概率個(gè)數(shù)減為為n-1n-1個(gè);個(gè); (4 4)將)將n-1n-1個(gè)概率,按大小重新排序;個(gè)概率,按大小重新排序; (5 5)重復(fù)()重復(fù)(3 3),將新排序后的最后兩個(gè)小概率相加,相加),將新排序后的最后兩個(gè)小概率相加,相加和與其余概率再排序;和與其余概率再排序; (6 6)如此反復(fù)重復(fù))如此反復(fù)重復(fù)n-2n-2次,得到只剩兩個(gè)概率序列;次,得到只剩兩個(gè)概率序列; (7 7)以二進(jìn)制碼

12、元()以二進(jìn)制碼元(0 0,1 1)賦值,構(gòu)成哈夫曼碼字,編碼)賦值,構(gòu)成哈夫曼碼字,編碼結(jié)束。結(jié)束。010.39010.35010.611000.261010.11a1a2a3a4a5a6a70.200.190.180.170.150.100.01101100000101001100111信源符號(hào)信源符號(hào)概率概率HuffmanHuffman碼碼編碼過程編碼過程HuffmanHuffman編碼過程編碼過程x1x2x3x4x5x6x70.350.200.150.100.100.060.040.350.200.150.100.100.100.350.200.200.150.100.350.250.

13、200.200.400.350.250.600.40信源符號(hào)信源符號(hào) 概率概率編碼過程編碼過程第一步第一步第二步第二步第五步第五步第四步第四步第三步第三步輸入輸入輸入輸入HuffmanHuffman編碼步驟編碼步驟圖圖4.8 Huffman4.8 Huffman碼字的構(gòu)成碼字的構(gòu)成x1x2x3x4x5x6x70.350.200.150.100.100.060.040.350.200.150.100.100.100.350.200.200.150.100.350.250.200.200.400.350.250.600.40第一步第一步第二步第二步第五步第五步第四步第四步第三步第三步碼長碼長 輸入

14、輸入 哈夫曼碼哈夫曼碼2233344001001001111011101111 0010010011110111 001011010011 00011011 1000101 x1x2x3x4x5x6x70.350.200.150.100.100.060.04碼長碼長哈夫曼碼哈夫曼碼2233344001001001111011101111 信源符號(hào)信源符號(hào)概率概率編碼過程編碼過程010.25010.60010.4001010.20010.10pelbitsLPLPNjjjjnjj/55. 24)04. 006. 0(3)10. 010. 015. 0(2)20. 035. 0()(711碼字的平

15、均碼長碼字的平均碼長N按下式計(jì)算:按下式計(jì)算:Pj:信源符號(hào):信源符號(hào)Xj出現(xiàn)的概率出現(xiàn)的概率Lj:編碼長度:編碼長度0.350.200.150.100.100.060.04碼長碼長2233344001001001111011101111 概率概率哈夫曼碼哈夫曼碼行程編碼行程編碼行程編碼的基本原理是:用一個(gè)符號(hào)值行程編碼的基本原理是:用一個(gè)符號(hào)值或串長代替具有相同值的連續(xù)符號(hào)(連或串長代替具有相同值的連續(xù)符號(hào)(連續(xù)符號(hào)構(gòu)成了一段連續(xù)的續(xù)符號(hào)構(gòu)成了一段連續(xù)的“行程行程”),),使符號(hào)長度少于原始數(shù)據(jù)的長度。使符號(hào)長度少于原始數(shù)據(jù)的長度。 例如:例如:55555577777333222211111

16、115555557777733322221111111,其行程,其行程編碼為:(編碼為:(5 5,6 6)()(7 7,5 5)()(3 3,3 3)()(2 2,4 4)(l l,7 7)。)。 算術(shù)編碼算術(shù)編碼算術(shù)編碼從全序列出發(fā),采用遞推形式的算術(shù)編碼從全序列出發(fā),采用遞推形式的連續(xù)編碼。它不是將單個(gè)信源符號(hào)映射成連續(xù)編碼。它不是將單個(gè)信源符號(hào)映射成一個(gè)碼字,而是將整個(gè)輸入符號(hào)序列映射一個(gè)碼字,而是將整個(gè)輸入符號(hào)序列映射為實(shí)數(shù)軸上的為實(shí)數(shù)軸上的00,11區(qū)間內(nèi)的一個(gè)間隔,區(qū)間內(nèi)的一個(gè)間隔,其長度就等于該序列的概率,并在該間隔其長度就等于該序列的概率,并在該間隔內(nèi)選擇一個(gè)代表性的二進(jìn)制小數(shù)

17、,作為實(shí)內(nèi)選擇一個(gè)代表性的二進(jìn)制小數(shù),作為實(shí)際的編碼輸出,使其平均碼長逼近信源的際的編碼輸出,使其平均碼長逼近信源的熵,從而達(dá)到高效編碼的目的熵,從而達(dá)到高效編碼的目的 LZW編碼編碼pLZW壓縮技術(shù)把數(shù)據(jù)流中復(fù)雜的數(shù)據(jù)用壓縮技術(shù)把數(shù)據(jù)流中復(fù)雜的數(shù)據(jù)用簡單的代碼來表示,并把代碼和數(shù)據(jù)的對(duì)簡單的代碼來表示,并把代碼和數(shù)據(jù)的對(duì)應(yīng)關(guān)系建立一個(gè)轉(zhuǎn)換表,又叫應(yīng)關(guān)系建立一個(gè)轉(zhuǎn)換表,又叫“字符串字符串表表”。p轉(zhuǎn)換表是在壓縮或解壓縮過程中動(dòng)態(tài)生成轉(zhuǎn)換表是在壓縮或解壓縮過程中動(dòng)態(tài)生成的表,該表只在進(jìn)行壓縮或解壓縮過程中的表,該表只在進(jìn)行壓縮或解壓縮過程中需要,一旦壓縮和解壓縮結(jié)束,該表將不需要,一旦壓縮和解壓

18、縮結(jié)束,該表將不再起任何作用。再起任何作用。 p圖像壓縮的基本方法圖像壓縮的基本方法p預(yù)測編碼預(yù)測編碼p預(yù)測編碼是根據(jù)某一模型利用以往的預(yù)測編碼是根據(jù)某一模型利用以往的樣本值對(duì)于新樣本進(jìn)行預(yù)測,然后將樣本值對(duì)于新樣本進(jìn)行預(yù)測,然后將樣本的實(shí)際值與預(yù)測值相減得到一個(gè)樣本的實(shí)際值與預(yù)測值相減得到一個(gè)誤差值,對(duì)這一誤差值進(jìn)行編碼。誤差值,對(duì)這一誤差值進(jìn)行編碼。pDPCMp它是利用圖像信號(hào)的相關(guān)性找出可反映信號(hào)變化特性的一個(gè)差值編碼。是對(duì)模擬信號(hào)幅度抽樣的差值進(jìn)行量化編碼的調(diào)制方式。這種方式是用已經(jīng)過去的抽樣值來預(yù)測當(dāng)前的抽樣值,對(duì)它們的差值進(jìn)行編碼。差值編碼可以提高編碼頻率,這種技術(shù)已應(yīng)用于模擬信號(hào)

19、的數(shù)字通信之中。pADPCMp綜合了APCM的自適應(yīng)特性和DPCM系統(tǒng)的差分特性,是一種性能比較好的波形編碼。使用過去的樣本值估算下一個(gè)輸入樣本的預(yù)測值,使實(shí)際樣本值和預(yù)測值之間的差值總是最小。p優(yōu)點(diǎn):算法復(fù)雜度低,壓縮比大、編解碼延時(shí)最短p缺點(diǎn):還原質(zhì)量一般 p圖像壓縮的基本方法圖像壓縮的基本方法p變換編碼變換編碼p變換編碼不是直接對(duì)原圖像信號(hào)壓縮編碼,而變換編碼不是直接對(duì)原圖像信號(hào)壓縮編碼,而是首先將圖像信號(hào)進(jìn)行某種函數(shù)變換,從一種是首先將圖像信號(hào)進(jìn)行某種函數(shù)變換,從一種信號(hào)映射到另一個(gè)域中,產(chǎn)生一組變換系數(shù),信號(hào)映射到另一個(gè)域中,產(chǎn)生一組變換系數(shù),然后對(duì)這些系數(shù)量化、編碼、傳輸。在空間上

20、然后對(duì)這些系數(shù)量化、編碼、傳輸。在空間上具有強(qiáng)相關(guān)性的信號(hào),反映在頻域上是某些特具有強(qiáng)相關(guān)性的信號(hào),反映在頻域上是某些特定的區(qū)域內(nèi)能量常常被集中在一起,或是變換定的區(qū)域內(nèi)能量常常被集中在一起,或是變換系數(shù)矩陣的分布具有規(guī)律性??衫眠@些規(guī)律,系數(shù)矩陣的分布具有規(guī)律性。可利用這些規(guī)律,在不同的頻域上分配不同的量化比特?cái)?shù),從而在不同的頻域上分配不同的量化比特?cái)?shù),從而達(dá)到壓縮數(shù)據(jù)的目的。達(dá)到壓縮數(shù)據(jù)的目的。p離散余弦變化壓縮離散余弦變化壓縮 離散傅里葉變換需要進(jìn)行復(fù)數(shù)運(yùn)算,盡管有FFT可以提高運(yùn)算速度,但在圖像編碼、特別是在實(shí)時(shí)處理中非常不便。離散傅里葉變換在實(shí)際的圖像通信系統(tǒng)中很少使用,但它具有理

21、論的指導(dǎo)意義。根據(jù)離散傅里葉變換的性質(zhì),使偶函數(shù)的傅里葉變換只含實(shí)的余弦項(xiàng),因此構(gòu)造了一種實(shí)數(shù)域的變換離散余弦變換(DCT)。通過研究發(fā)現(xiàn),DCT除了具有一般的正交變換性質(zhì)外,其變換陣的基向量很近似于Toeplitz矩陣的特征向量,后者體現(xiàn)了人類的語言、圖像信號(hào)的相關(guān)特性。因此,在對(duì)語音、圖像信號(hào)變換的確定的變換矩陣正交變換中,DCT變換被認(rèn)為是一種準(zhǔn)最佳變換。在近年頒布的一系列視頻壓縮編碼的國際標(biāo)準(zhǔn)建議中,都把 DCT 作為其中的一個(gè)基本處理模塊。pK-L變換變換以矢量信號(hào)X的協(xié)方差矩陣的歸一化正交特征矢量q所構(gòu)成的正交矩陣Q,來對(duì)該矢量信號(hào)X做正交變換Y=QX,則稱此變換為K-L變換(K-

22、LT或KLT),K-LT是Karhunen-Love Transform的簡稱,p在模式識(shí)別和圖像處理中一個(gè)主要的問題就是降維,在實(shí)際模式識(shí)別問題中,我們選擇的特征經(jīng)常彼此相關(guān),在識(shí)別這些特征時(shí),數(shù)量很多,大部分都是無用的。如果我們能減少特征的數(shù)量,即減少特征空間的維數(shù),那么我們將以更少的存儲(chǔ)和計(jì)算復(fù)雜度獲得更高的準(zhǔn)確性。 KL變換是一種常用的特征提取方法,在消除模式特征之間的相關(guān)性、突出差異性方面有最優(yōu)的效果。p小波變換小波變換小波變換是一種新的變換分析方法,它繼承和發(fā)展了短時(shí)傅立葉變換局部化的思想,同時(shí)又克服了窗口大小不隨頻率變化等缺點(diǎn),能夠提供一個(gè)隨頻率改變的“時(shí)間-頻率”窗口,是進(jìn)行信

23、號(hào)時(shí)頻分析和處理的理想工具。它的主要特點(diǎn)是通過變換能夠充分突出問題某些方面的特征,能對(duì)時(shí)間(空間)頻率的局部化分析,通過伸縮平移運(yùn)算對(duì)信號(hào)(函數(shù))逐步進(jìn)行多尺度細(xì)化,最終達(dá)到高頻處時(shí)間細(xì)分,低頻處頻率細(xì)分,能自動(dòng)適應(yīng)時(shí)頻信號(hào)分析的要求,從而可聚焦到信號(hào)的任意細(xì)節(jié),p圖像壓縮的基本方法圖像壓縮的基本方法p分形編碼分形編碼p分形圖像編碼是目前較有發(fā)展前途的圖像編碼方法之一, 也是目前研究較為廣泛的編碼方法之一。對(duì)其研究已有近十年的歷史,其間,人們發(fā)現(xiàn)了它所具有的許多優(yōu)點(diǎn):比如,它突破以往熵壓縮編碼的界限,在編碼過程中,采用了類似描述的方法,而解碼是通過迭代完成的,且具有分辨率無關(guān)的解碼特性等。p分

24、形圖像編碼的思想最早由Barnsley和Sloan引入,將原始圖像表示為圖像空間中一系列壓縮映射的吸引子。在此基礎(chǔ)上,Jacquin設(shè)計(jì)了第一個(gè)實(shí)用的基于方塊分割的分形圖像編碼器,他首先將原始圖像分割為值域子塊和定義域子塊,對(duì)于每一個(gè)值域子塊,尋找一個(gè)定義域子塊和仿射變換(包括幾何變換、對(duì)比度放縮和亮度平移),p使變換后的定義域子塊最佳逼近值域子塊。隨后Fisher等提出了四象限樹編碼方案,采用有效的分類技術(shù),極大的提高了編碼性能。隨著幾十種新算法和改進(jìn)方案的問世,分形圖像編碼目前已形成了三個(gè)主要發(fā)展方向:加快分形的編解碼速度、提高分形編碼質(zhì)量、分形序列圖像編碼。 p圖像壓縮標(biāo)準(zhǔn)圖像壓縮標(biāo)準(zhǔn)J

25、PEGpJPEG算法被確定為算法被確定為JPEG國際標(biāo)準(zhǔn),它是國際標(biāo)準(zhǔn),它是國際上彩色、灰度、靜止圖像的第一個(gè)國國際上彩色、灰度、靜止圖像的第一個(gè)國際標(biāo)準(zhǔn)。際標(biāo)準(zhǔn)。 pJPEG標(biāo)準(zhǔn)是一個(gè)適合范圍廣泛的通用標(biāo)準(zhǔn)。標(biāo)準(zhǔn)是一個(gè)適合范圍廣泛的通用標(biāo)準(zhǔn)。它不僅適于靜圖像的壓縮,電視圖像序列它不僅適于靜圖像的壓縮,電視圖像序列的幀內(nèi)圖像的壓縮編碼也常采用的幀內(nèi)圖像的壓縮編碼也常采用JPEG壓縮壓縮標(biāo)準(zhǔn)。標(biāo)準(zhǔn)。 量化的基本原理量化的基本原理 量化的作用是在圖像質(zhì)量或聲音質(zhì)量達(dá)量化的作用是在圖像質(zhì)量或聲音質(zhì)量達(dá)到一定保真度的前提下,舍棄那些對(duì)視覺到一定保真度的前提下,舍棄那些對(duì)視覺或聽覺影響不大的信息。量化的

26、過程是?;蚵犛X影響不大的信息。量化的過程是模擬信號(hào)到數(shù)字信號(hào)的映射。模擬量是連續(xù)擬信號(hào)到數(shù)字信號(hào)的映射。模擬量是連續(xù)量,而數(shù)字量是離散量,因此量化操作實(shí)量,而數(shù)字量是離散量,因此量化操作實(shí)質(zhì)上是用有限的離散量代替無限的連續(xù)模質(zhì)上是用有限的離散量代替無限的連續(xù)模擬量的多對(duì)一的映射操作。擬量的多對(duì)一的映射操作。量化的基本原理量化的基本原理p 量化概念主要來自于從模擬量到數(shù)字量的轉(zhuǎn)換,量化概念主要來自于從模擬量到數(shù)字量的轉(zhuǎn)換,即即A/D轉(zhuǎn)換,也就是通過采樣把連續(xù)的模擬量轉(zhuǎn)換,也就是通過采樣把連續(xù)的模擬量離散化。量化過程預(yù)先設(shè)置一組判決電平和一離散化。量化過程預(yù)先設(shè)置一組判決電平和一組重建電平,各個(gè)判

27、決電平覆蓋一定的區(qū)間,組重建電平,各個(gè)判決電平覆蓋一定的區(qū)間,所有判決電平將覆蓋整個(gè)有效取值區(qū)間。量化所有判決電平將覆蓋整個(gè)有效取值區(qū)間。量化時(shí)將模擬量的取樣值同這些電平比較,若采樣時(shí)將模擬量的取樣值同這些電平比較,若采樣值幅度落在覆蓋區(qū)間之上,則取這個(gè)量化級(jí)的值幅度落在覆蓋區(qū)間之上,則取這個(gè)量化級(jí)的代表值,稱為碼字。一個(gè)量化器只能取有限多代表值,稱為碼字。一個(gè)量化器只能取有限多個(gè)量化級(jí),因此量化過程不可避免地存在量化個(gè)量化級(jí),因此量化過程不可避免地存在量化誤差。誤差。量化器的設(shè)計(jì)要求量化器的設(shè)計(jì)要求 通常設(shè)計(jì)量化器有下述兩種情況:通常設(shè)計(jì)量化器有下述兩種情況: p(1)給定量化分層級(jí)數(shù),滿足

28、量化誤差)給定量化分層級(jí)數(shù),滿足量化誤差最小。最小。 p(2)限定量化誤差,確定分層級(jí)數(shù),滿)限定量化誤差,確定分層級(jí)數(shù),滿足以盡量小的平均比特?cái)?shù),表示量化輸出。足以盡量小的平均比特?cái)?shù),表示量化輸出。幀間預(yù)測編碼幀間預(yù)測編碼(P119) p幀間預(yù)測編碼技術(shù)的對(duì)象是序列圖象。隨幀間預(yù)測編碼技術(shù)的對(duì)象是序列圖象。隨著大規(guī)模集成電路技術(shù)的發(fā)展,已有可能著大規(guī)模集成電路技術(shù)的發(fā)展,已有可能把幾幀的圖象存起來作實(shí)時(shí)處理,利用幀把幾幀的圖象存起來作實(shí)時(shí)處理,利用幀間的時(shí)間相關(guān)性進(jìn)一步消除圖象信號(hào)的冗間的時(shí)間相關(guān)性進(jìn)一步消除圖象信號(hào)的冗余度,提高壓縮比。幀間編碼的技術(shù)基礎(chǔ)余度,提高壓縮比。幀間編碼的技術(shù)基礎(chǔ)

29、是預(yù)測技術(shù)。是預(yù)測技術(shù)。 pJPEG2000標(biāo)準(zhǔn)p特色特色:p(1)高壓縮比(低比特率)。)高壓縮比(低比特率)。p(2)無損壓縮。)無損壓縮。p(3)漸進(jìn)傳輸。)漸進(jìn)傳輸。p(4)感興趣區(qū)域壓縮。)感興趣區(qū)域壓縮。p(5)其他優(yōu)點(diǎn)。)其他優(yōu)點(diǎn)。pJPEG 2000是基于小波變換的圖像壓縮標(biāo)準(zhǔn),由Joint Photographic Experts Group組織創(chuàng)建和維護(hù)。JPEG 2000通常被認(rèn)為是未來取代JPEG(基于離散余弦變換)的下一代圖像壓縮標(biāo)準(zhǔn)。pJPEG2000的壓縮比更高,而且不會(huì)產(chǎn)生原先的基于離散馀弦變換的JPEG標(biāo)準(zhǔn)產(chǎn)生的塊狀模糊瑕疵。JPEG2000同時(shí)支持有損壓縮和

30、無損壓縮。另外,JPEG2000也支持更復(fù)雜的漸進(jìn)式顯示和下載。p在有損壓縮下,JPEG2000一個(gè)比較明顯的優(yōu)點(diǎn)就是沒有JPEG壓縮中的馬賽克失真效果。JPEG2000的失真主要是模糊失真。模糊失真產(chǎn)生的主要原因是在編碼過程中高頻量一定程度的衰減。傳統(tǒng)的JPEG壓縮也存在模糊失真的問題。p就圖像整體壓縮性能來說,目前有一些文章可能夸大JPEG2000的性能。事實(shí)上,在低壓縮比情形下(比如壓縮比小于10:1),傳統(tǒng)的JPEG圖像質(zhì)量有可能要比JPEG2000要好。JPEG2000在壓縮比比較高的情形下,優(yōu)勢才開始明顯。整體來說,和傳統(tǒng)的JPEG相比,JPEG2000仍然有很大的技術(shù)優(yōu)勢,通常壓

31、縮性能大概可以提高20%以上。一般在壓縮比達(dá)到100:1的情形下,采用JPEG壓縮的圖像已經(jīng)嚴(yán)重失真并開始難以識(shí)別了,但JPEG2000的圖像仍可識(shí)別。 對(duì)于不同類型的音頻信號(hào)而言,其信號(hào)帶寬是對(duì)于不同類型的音頻信號(hào)而言,其信號(hào)帶寬是不同的,如電話音頻信號(hào)不同的,如電話音頻信號(hào)(200Hz-3.4kHz)(200Hz-3.4kHz),調(diào),調(diào)幅廣播音頻信號(hào)幅廣播音頻信號(hào)(50Hz- 7kHz)(50Hz- 7kHz),調(diào)頻廣播音頻,調(diào)頻廣播音頻信號(hào)信號(hào)(20Hz- 15kHz)(20Hz- 15kHz),激光唱盤音頻信號(hào),激光唱盤音頻信號(hào)(10Hz- (10Hz- 20kHz)20kHz)。針對(duì)

32、不同的音頻信號(hào),制定了相應(yīng)的。針對(duì)不同的音頻信號(hào),制定了相應(yīng)的壓縮標(biāo)準(zhǔn)。壓縮標(biāo)準(zhǔn)。 音頻壓縮編碼的基本方法音頻壓縮編碼的基本方法1 1統(tǒng)計(jì)編碼統(tǒng)計(jì)編碼2 2波形編碼波形編碼 3. 3. 參數(shù)編碼參數(shù)編碼 4 4混合編碼混合編碼 5 5感知編碼感知編碼 視頻壓縮技術(shù)標(biāo)準(zhǔn)主要有:視頻壓縮技術(shù)標(biāo)準(zhǔn)主要有:ITU H.261ITU H.261建議建議,用于,用于ISDNISDN信道的信道的PCPC電視電話、桌面視電視電話、桌面視頻會(huì)議和音像郵件等通信終端。頻會(huì)議和音像郵件等通信終端。MPEGMPEG1 1視頻壓縮標(biāo)準(zhǔn),用于視頻壓縮標(biāo)準(zhǔn),用于 VCDVCD、MPCMPC、PCPCTVTV一體機(jī)、一體機(jī)、

33、交互電視交互電視ITVITV和電視點(diǎn)播和電視點(diǎn)播VODVOD。MPEGMPEG2 2ITU H.262ITU H.262視頻視頻標(biāo)準(zhǔn),主要用于數(shù)字存儲(chǔ)。視標(biāo)準(zhǔn),主要用于數(shù)字存儲(chǔ)。視頻廣播和通信,如頻廣播和通信,如HDTVHDTV、CATVCATV、DVDDVD、VODVOD和電影點(diǎn)播和電影點(diǎn)播MODMOD等。等。ITU H.263ITU H.263建議,用于網(wǎng)上的可視電話、移動(dòng)多媒體終建議,用于網(wǎng)上的可視電話、移動(dòng)多媒體終端、多媒體可視圖文、遙感、電子郵件、電子報(bào)紙和交互端、多媒體可視圖文、遙感、電子郵件、電子報(bào)紙和交互式計(jì)算機(jī)成像等。式計(jì)算機(jī)成像等。MPEGMPEG4 4和和 ITU H.V

34、LCITU H.VLCL L低碼率多媒體通信標(biāo)準(zhǔn)仍在發(fā)低碼率多媒體通信標(biāo)準(zhǔn)仍在發(fā)展之中展之中. . MPEGMPEG標(biāo)準(zhǔn)概述標(biāo)準(zhǔn)概述MPEGMPEG的全稱是運(yùn)動(dòng)圖像專家組(的全稱是運(yùn)動(dòng)圖像專家組(Moving Picture Experts Moving Picture Experts GroupGroup)MPEGMPEG標(biāo)準(zhǔn)由標(biāo)準(zhǔn)由MPEGMPEG視頻、視頻、MPEGMPEG音頻和視頻與音頻同步三個(gè)部音頻和視頻與音頻同步三個(gè)部分組成。分組成。MPEGMPEG壓縮標(biāo)準(zhǔn)是針對(duì)運(yùn)動(dòng)圖像而設(shè)計(jì)的?;痉椒ㄊ菈嚎s標(biāo)準(zhǔn)是針對(duì)運(yùn)動(dòng)圖像而設(shè)計(jì)的?;痉椒ㄊ窃趩挝粫r(shí)間內(nèi)采集并保存第一幀信息,然后就只存儲(chǔ)其余

35、在單位時(shí)間內(nèi)采集并保存第一幀信息,然后就只存儲(chǔ)其余幀相對(duì)第一幀發(fā)生變化的部分,以達(dá)到壓縮的目的。幀相對(duì)第一幀發(fā)生變化的部分,以達(dá)到壓縮的目的。 MPEGMPEG壓縮標(biāo)準(zhǔn)可實(shí)現(xiàn)幀之間的壓縮,其平均壓縮比可達(dá)壓縮標(biāo)準(zhǔn)可實(shí)現(xiàn)幀之間的壓縮,其平均壓縮比可達(dá)5050:1 1,壓縮率比較高,且又有統(tǒng)一的格式,兼容性好。壓縮率比較高,且又有統(tǒng)一的格式,兼容性好。 MPEG視頻壓縮技術(shù)pMPEG視頻壓縮技術(shù)是針對(duì)運(yùn)動(dòng)圖象的數(shù)視頻壓縮技術(shù)是針對(duì)運(yùn)動(dòng)圖象的數(shù)據(jù)壓縮技術(shù)。為了提高壓縮比,據(jù)壓縮技術(shù)。為了提高壓縮比,幀內(nèi)圖象幀內(nèi)圖象數(shù)據(jù)壓縮數(shù)據(jù)壓縮和和幀間圖象數(shù)據(jù)壓縮技術(shù)幀間圖象數(shù)據(jù)壓縮技術(shù)必須同必須同時(shí)使用。時(shí)使用

36、。MPEG將圖像分成三種類型pI圖像(圖像(Intra Picture 幀內(nèi)圖)幀內(nèi)圖)pP圖像(圖像(Predicted Picture預(yù)測圖)預(yù)測圖)pB圖像(圖像(Bidirectional Picture雙向預(yù)雙向預(yù)測圖)。測圖)。 MPEG1:MPEG1:基于數(shù)字存儲(chǔ)媒體運(yùn)動(dòng)圖像和聲音的壓縮標(biāo)準(zhǔn)基于數(shù)字存儲(chǔ)媒體運(yùn)動(dòng)圖像和聲音的壓縮標(biāo)準(zhǔn)”著眼于解決多媒體的存儲(chǔ)問題。著眼于解決多媒體的存儲(chǔ)問題。由于由于MPEG-1MPEG-1的成功制定,以的成功制定,以VCDVCD和和MP3MP3為代表的為代表的MPEG-1MPEG-1產(chǎn)品產(chǎn)品在世界范圍內(nèi)迅速普及。在世界范圍內(nèi)迅速普及。 MPEG-1MPEG-1用于傳輸用于傳輸1 15Mbps5Mbps數(shù)據(jù)傳輸率的數(shù)字存儲(chǔ)媒體運(yùn)動(dòng)數(shù)據(jù)傳輸率的數(shù)字存儲(chǔ)媒體運(yùn)動(dòng)圖像及其伴音的編碼,經(jīng)過圖像及其伴音的編碼,經(jīng)過MPEG-1MPEG-1標(biāo)準(zhǔn)壓縮后,視頻數(shù)據(jù)標(biāo)準(zhǔn)壓縮后,視頻數(shù)據(jù)壓縮率為壓縮率為1/100-11/100-1200200,音頻壓縮率為,音頻壓縮率為1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論