多媒體數(shù)據(jù)編碼技術(shù)_第1頁
多媒體數(shù)據(jù)編碼技術(shù)_第2頁
多媒體數(shù)據(jù)編碼技術(shù)_第3頁
多媒體數(shù)據(jù)編碼技術(shù)_第4頁
多媒體數(shù)據(jù)編碼技術(shù)_第5頁
已閱讀5頁,還剩138頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第三章 多媒體數(shù)據(jù)壓縮編 碼技術(shù)3.1 多媒體數(shù)據(jù)壓縮編碼的重要性和分類3.2 量化3.3 統(tǒng)計編碼3.3 預(yù)測編碼3.5 變換編碼3.6 多媒體數(shù)據(jù)壓縮編碼的國際標(biāo)準(zhǔn)本章重點介紹1.統(tǒng)計編碼、預(yù)測編碼和變換編碼的原理2.多媒體數(shù)據(jù)壓縮編碼的國際標(biāo)準(zhǔn) JPEG3.多媒體數(shù)據(jù)壓縮編碼的國際標(biāo)準(zhǔn) MPEG3.1 多媒體數(shù)據(jù)壓縮編碼的 重要性和分類3.1.1 多媒體數(shù)據(jù)壓縮編碼的重要性3.1.2 多媒體數(shù)據(jù)壓縮的可能性3.1.3 多媒體數(shù)據(jù)壓縮方法的分類3.1.1 多媒體數(shù)據(jù)壓縮編碼 的重要性多媒體技術(shù)最大難題是海量數(shù)據(jù)存儲與傳送電視信號數(shù)字化后的數(shù)據(jù)量。信息量與數(shù)據(jù)量的關(guān)系 I = D + duI

2、 信息量D數(shù)據(jù)量du冗余量1. du在平時說話時是大量存在的。2. 中文百科全書掃描進(jìn)入計算機冗余更大。3. 圖像信息、視頻信息的冗余就更大了。3.1.2 多媒體數(shù)據(jù)壓縮的可能性1.空間冗余規(guī)則物體和規(guī)則背景的表面物理特性具有相關(guān)性。例: 圖象中的“A”是一個規(guī)則物體,光的亮 度、飽和度及顏色都一樣具有規(guī)則,因此,數(shù)據(jù)A有很大的冗余。 2.時間冗余 3.信息熵冗余(編碼冗余)信息量: 指從N個相等的可能事件中選出一個事件所需要的信息度量和含量。信息熵:指一團數(shù)據(jù)所帶的信息量,平均信息量就是信息熵(entropy)。 4.結(jié)構(gòu)冗余 圖象有非常強的紋理結(jié)構(gòu)。 如草席圖結(jié)構(gòu)上存在冗余。5.知識冗余

3、圖像的理解與某些基礎(chǔ)知識有關(guān)。 例:人臉的圖像有同樣的結(jié)構(gòu):嘴的上方有鼻子,鼻子上方有眼睛,鼻子在中線上 6.視覺冗余 視覺冗余是非均勻、非線性的,視覺系統(tǒng)并不能對于圖像的任何變化都有所感知。 7.其他冗余 圖象空白的非定長性。 3.1.3 多媒體數(shù)據(jù)壓縮方法 的分類 按編碼算法原理分: (1) 預(yù)測編碼 (2) 變換編碼 (3) 量化與向量量化編碼 (3) 信息熵編碼 (5) 子帶編碼 (6) 結(jié)構(gòu)編碼 (7) 基于知識的編碼多媒體數(shù)據(jù)編碼分類PCM:脈沖編碼調(diào)制 多媒體數(shù)據(jù)壓縮方法根據(jù)不同的依據(jù)產(chǎn)生不同的分類: 根據(jù)質(zhì)量有無損失有損失編碼和無損失編碼(不可逆編碼和可逆編碼); 按照其作用域

4、在空間或頻率上空間方法,變換方法和混合方法; 根據(jù)是否自適應(yīng)自適應(yīng)性編碼和非適應(yīng)性編碼。按壓縮方法分: 有失真壓縮、 無失真壓縮1脈沖編碼調(diào)制PCM脈沖編碼是連續(xù)模擬信號的數(shù)字采樣表示。若量化器為N級,N=2b ,則每一個采樣用b位的二進(jìn)制代碼表示。信號的量化中,每一色彩分量一般用8位表示。脈沖編碼調(diào)制編碼器和解碼器位于一個圖像編碼系統(tǒng)的起點(A/D轉(zhuǎn)換器)和終點(D/A轉(zhuǎn)換器2預(yù)測編碼DPCM編碼器記錄與傳輸?shù)牟皇菢颖镜恼鎸嵵?,而是它與預(yù)測值的差差值脈沖編碼調(diào)制方法。預(yù)測值由欲編碼圖像信號的過去信息決定。本方法通常采用線性預(yù)測,比例系數(shù)由統(tǒng)計特性估計得到。預(yù)測不僅可以在相鄰像素值之間進(jìn)行,還

5、可以在行與行之間進(jìn)行。由于真實值與預(yù)測值的差值變化遠(yuǎn)遠(yuǎn)小于真實值的變化范圍,因而可采用較少的位數(shù)來表示。如果利用人的視覺特性對差值進(jìn)行非均勻量化,能夠獲得更高的壓縮比。3變換編碼利用圖像塊(矩陣)的像素值之間的相關(guān)性,把圖像變換到一組新的域上,使得能量集中到少數(shù)幾個變換系數(shù)上,通過存儲這些系數(shù)達(dá)到壓縮的目的。本方法采用對整幅的原始圖像分成許多個矩形區(qū)域子圖像獨立進(jìn)行變換。常用變換有: 卡亨南洛維變換(KLT) 離散余弦變換(DCT) 沃爾什哈達(dá)瑪變換(WHT) 離散傅里葉變換(DFT)。4統(tǒng)計編碼哈夫曼(Huffman)編碼(統(tǒng)計編碼最常用的一種)。對于出現(xiàn)頻率大的符號用較少的位數(shù)來表示;對于

6、出現(xiàn)頻率小的符號用較多的位數(shù)來表示。其編碼效率主要取決于需編碼的符號出現(xiàn)的概率分布,越集中則壓縮比越高。算術(shù)編碼每一符號對應(yīng)0,1上的一子區(qū)間,區(qū)間長度為該符號出現(xiàn)的概率。算術(shù)編碼的優(yōu)點是可方便地使用自適應(yīng)編碼,可以根據(jù)當(dāng)前接收的數(shù)據(jù)不斷地更改概率模型。5混合編碼合并變換和預(yù)測技術(shù)的編碼方法。在某一方向上進(jìn)行酉變換,而在另一方向上采用DPCM對變換系數(shù)進(jìn)行預(yù)測編碼。對動態(tài)圖像而言,采用二維變換加上時間方向上的DPCM預(yù)測。3.2 量 化3.2.1 量化原理3.2.2 標(biāo)量量化器的設(shè)計3.2.3 矢量量化量化指模擬信號到數(shù)字信號的映射。量化操作:實質(zhì)上是用有限的離散量代替無限的連續(xù)模擬量的多對一

7、映射操作。3.2.1量化原理將一個連續(xù)性的一批數(shù)值集合,量化到一個輸出值上。如:256圖像灰度值是連續(xù)的,而我們 通常使用和看到的是用0255之間的整數(shù)表示的圖像灰度,即:0255級。 這樣可以用log2256=8比特表示一個圖像像素的灰度值,或色差信號值量化原理 量化原理:是使數(shù)據(jù)比特率下降的一個強有力的措施。 量化輸入值動態(tài)范圍很大,需要以多比特數(shù)表示一個數(shù)值,量化輸出只能取有限個整數(shù),稱量化級。每個量化輸入被強迫歸一到與其接近的某個輸出,即量化到某個級。量化處理總是把一批輸入量化到一個輸出級上,所以量化是個多對一的處理過程,量化中有信息丟失,或者說,會引起量化誤差(量化噪聲)。 數(shù)據(jù)壓縮

8、編碼中的量化不是指A/D變換后的量化,而是指以PCM(脈沖編碼調(diào)制)碼作為輸入,經(jīng)正交變換、差分或預(yù)測處理后,在熵編碼前,對正交系數(shù)、差值或預(yù)測誤差的量化處理。 PCM編碼:模擬量經(jīng)過A/D轉(zhuǎn)換,得到二進(jìn)制碼的過程,就是脈沖編碼調(diào)制(PCM)編碼過程,也稱PCM編碼。3.2.2標(biāo)準(zhǔn)量化器的設(shè)計1.量化器的設(shè)計要求設(shè)計量化器的兩種情況:給定量化分層級數(shù),滿足量化誤差最??;限定量化誤差,確定分層級數(shù),滿足以盡量小的平均比特數(shù),表示量化輸出。2量化方法和量化特性W1 W2 W3 W4 W5 W6 W7 W8(-255255)點數(shù)灰度差W1 W2 W3 W4 W5 W6 W7 W8(a)圖(b)圖(c

9、)圖3.2.3矢量量化矢量量化編碼是近年來圖像語音信號編碼技術(shù)中流行的一種新型量化編碼方法。矢量量化編碼方法一般是有失真編碼方法。對于PCM數(shù)據(jù),一個數(shù)一個數(shù)地進(jìn)行量化叫標(biāo)量量化。對于數(shù)據(jù)分組,每組K個數(shù)構(gòu)成一個K維矢量,然后以矢量進(jìn)行量化,稱矢量量化。矢量量化可以更有效地提高壓縮比。 矢量量化 *量化的關(guān)鍵問題是設(shè)計一個良好的碼本*矢量量化編碼、解碼框圖編碼搜索輸入矢量發(fā)送端碼本C傳輸矢量下標(biāo)ii查表碼本C輸出矢量接收端33 統(tǒng)計編碼3.3.1 統(tǒng)計編碼原理信息量和 信息熵3.3.2 哈夫曼(Huffman)編碼3.3.3 算術(shù)編碼根據(jù)信息論的原理,可以找到最佳數(shù)據(jù)壓縮編碼方法,數(shù)據(jù)壓縮的理

10、論極限是信息熵(一組數(shù)據(jù)所攜帶的信息量)。熵編碼要求在編碼過程中不丟失信息量,即要求保存信息熵,這種信息保存編碼又叫熵保存編碼。熵編碼是無失真數(shù)據(jù)壓縮。用這種編碼結(jié)果經(jīng)過解碼后可無失真地恢復(fù)原圖像。3.3.1統(tǒng)計編碼原理信息量和信息熵為什么要引入信息熵?信息熵與圖像的概率分布和信息量之間有何關(guān)系?就下面信源編碼模型可以說明問題。 編碼器信源(消息集)編碼輸出集X=x1,xnZ=z1,zn符號集Am=a1,amX:是消息集,由幾個信號單元xj構(gòu)成(j=1,2,.n)Z:是輸出集,由幾個碼字zj構(gòu)成(j=1,2,n),zj與xj一一對應(yīng)。Am 是符號集,由m個碼元 ai構(gòu)成( i=1,2,m),符

11、號集中的碼元組成輸出碼字。當(dāng)信源發(fā)出某個隨機事件(消息)xj后,接收端收到一個相應(yīng)的碼字zj,從數(shù)量上說,所收到的碼字中包含有多少可用的信息量是不確定的。 概念 1. 信息:是用不確定性的量度定義的。2. 信息量:從N個相等可能事件中選出一個 事件所需要的信息度量或含量。3. 熵:如果將信源所有可能事件信息量進(jìn)行平均就得到信息的熵(熵就是平均 信息量)。信息量信息量指從N個相等可能事件中選出一個事件所需要的信息含量。信息是用不確定性的度量定義的。一個消息的可能性愈小,其信息愈多;反之,消息的可能性愈大,信息愈少。在數(shù)學(xué)上,所傳輸?shù)南⑹瞧涑霈F(xiàn)概率的單調(diào)下降函數(shù)。 舉例:確定一個在一組數(shù)之中的數(shù)

12、例如:從63個數(shù)中選出某一個數(shù),可先問“是否大于32?”消除半數(shù)的可能,這樣只要6次就可選出某數(shù)。這是因為每提問一次都會得到1比特的信息量。因此,在63個數(shù)中選定某一數(shù)所需的信息量是log2 63=6(bits) 。設(shè)從N個數(shù)中選任意一個數(shù)X的概率為P(x),假定選定任意一個數(shù)的概率都相等, P(x)= 1/N,因此定義信息量I(x)=log2N= -log2(1/N)= -log2P(x)=IP(x)信息論定義一種度量信息量的方法為:I(xj) =-log2 P(xj) 信息熵信息熵:指一團數(shù)據(jù)所帶的信息量,平均信息量就是信息熵(entropy)。如果將信源所有可能事件的信息量進(jìn)行平均,就得

13、到了信息熵(entropy)。熵就是平均信息量。信息源的符號集為 Xj (j=1,2,3.N)設(shè)X出現(xiàn)的概率為P(xj),則信息源X的熵為 H(X)=P(xj) log2 P(xj)3.3.2哈夫曼(Huffman)編碼最佳編碼定理:在變字長碼中,對于出現(xiàn)概率大的信息符號編以短字長的碼,對于出現(xiàn)概率小的信息符號編以長字長的碼,如果碼字長度嚴(yán)格按照符號概率的大小的相反順序排列,則平均碼字長度一定小于按任何其他符號順序排列方式得到的碼字長度。 Huffman編碼就是利用這個定理,把信源符號按概率大小順序排列,并設(shè)法按逆次序分配碼字長度。 Huffman編碼的方法(1) 把信源符號按概率大小順序排列

14、,并設(shè)法按逆次序分配碼字的長度。(2) 在分配碼字長度時,首先將出現(xiàn)概率最小的兩個符號的概率相加合成一個概率。(3) 把這個合成概率看成是一個新組合符號地概率,重復(fù)上述做法直到最后只剩下兩個符號概率為止。(3) 完成以上概率順序排列后,再反過來逐步向前進(jìn)行編碼,每一次有二個分支各賦予一個二進(jìn)制碼,可以對概率大的賦為0,概率小的賦為1。Huffman 編碼字長參差不齊Huffman編碼在信源編碼概率分布不均勻時效率高,所以效率比較均勻時,不用Huffman編碼。好處:解決對稱性,降低了編碼時間。概率統(tǒng)計和Huffman編碼一般不對稱。 舉例說明舉例說明 4 X0.25 0.250.20 0.15

15、 0.10 0.05對其進(jìn)行編碼,寫出其碼樹、碼長,并計算平均碼長。符號 概率 編碼過程 編碼X1 0.25 01X2 0.25 10X3 0.20 11X3 0.15 000X5 0.10 0010X6 0.05 0011所以碼長分別為:2,2,2,3,4,4。平均碼長為2.83幾個問題值得注意1.霍夫曼碼沒有錯誤保護(hù)功能;2.霍夫曼碼是可變長度碼,因此很難隨意查找或調(diào)用壓縮文件中間的內(nèi)容,然后再譯碼;3.接收端需保存一個與發(fā)送端相同的霍夫曼碼表。3.3.3 算術(shù)編碼20世紀(jì)60年代初,E1ias提出了算術(shù)編碼概念。1976年,Bissanen和Pasco首次介紹了它的實用技術(shù)。算術(shù)編碼在圖

16、像數(shù)據(jù)壓縮標(biāo)準(zhǔn)(如JPEG,JBIG)中扮演了重要的角色。在算術(shù)編碼中,消息用0到1之間的實數(shù)進(jìn)行編碼,算術(shù)編碼用到兩個基本的參數(shù):符號的概率和它的編碼間隔。信源符號的概率決定壓縮編碼的效率,也決定編碼過程中信源符號的間隔,而這些間隔包含在0到1之間。編碼過程中的間隔決定了符號壓縮后的輸出。基本思路 用一個浮點輸出數(shù)值代替一個流的輸入符號 把要壓縮的整段數(shù)據(jù)映射到一段實數(shù)半開區(qū)間0,1)內(nèi)的某一區(qū)段,然后構(gòu)造出小于l且大于或等于0的一個數(shù)值,這個數(shù)值就是對該輸入流進(jìn)行壓縮編碼后的輸出代碼。 例如:可將輸入字符流“eai”映射到區(qū)間0.23,0.236),然后取該區(qū)間的任一個數(shù),如0.23,作為

17、該輸入字符流的編碼?;驹韺⒕幋a的信息表示成實數(shù)0和1之間的一個間隔,信息越長,編碼表示它的間隔就越小,表示這一間隔所需的二進(jìn)制位就越多。算法舉例 假設(shè)信源符號為00, 01, 10, 11,這些符號的概率分別為 0.1, 0.4, 0.2, 0.3 ,根據(jù)這些概率可把間隔0, 1)分成4個子間隔:0, 0.1), 0.1, 0.5), 0.5, 0.7), 0.7, 1),二進(jìn)制消息序列的輸入為:10 00 11 00 10 11 01算法舉例算術(shù)編碼算術(shù)編碼是一種二元碼的編碼方法。在不考慮信源統(tǒng)計的情況下,只要監(jiān)視一小段時間內(nèi)碼出現(xiàn)的頻率,不管統(tǒng)計是平穩(wěn)的或非平穩(wěn)的,編碼的碼率總能趨近于

18、信源熵值,每次迭代時的編碼算法只處理一個數(shù)據(jù)符號,并且只有算術(shù)運算。設(shè)編碼初始化子區(qū)間為0,1),Qe從0算起,則Pe=1-Qe。隨著被編碼數(shù)據(jù)流符號的輸入,子區(qū)間逐漸縮小。 新子區(qū)間的起始位置=前子區(qū)間的起始位置+當(dāng)前符號的區(qū)間左端前子區(qū)間長度;新子區(qū)間的長度=前子區(qū)間的長度當(dāng)前符號的概率(等價于范圍長度);最后得到的子區(qū)間的長度決定了表示該區(qū)域內(nèi)的某一個數(shù)所需的位數(shù)。算術(shù)編碼在編、譯碼的過程中,子區(qū)間的起始位置和長度值的小數(shù)點后的位數(shù)越來越長,實際中無法實現(xiàn)。因此較實用的改進(jìn)算法是限制小數(shù)點后的位數(shù)例如:已知信源0 1X 0.250.75試對1011進(jìn)行算術(shù)編碼LPS 0 Qe0.25,M

19、ps 1 Pe=0.75設(shè)C為子區(qū)間的左端起始位置,L為子區(qū)間的長度, 則符號“0”有 C0,L0.25 符號“1”有 C0.25,L0.75LPS:C=C,L=L*0.25Mps:C=C+L*0.25,L=L*0.75初始區(qū)間為0,1),算法編碼如下:步序 符號 C L 1 1 0.25 0.75 2 0 0.25 0.75*0.25 3 1 0.25+0.1875*0.25 0.1875*0.75 4 1 0.3375+0.1306*0.25 0.013*0.75最后的子區(qū)間左端起始位置C(0.332)d=(0.01010101) b最后的子區(qū)間長度L(0.10536875)d=(0.01

20、11) b編碼取值為0.011可編碼為011在算術(shù)編碼中需要注意的幾個問題:1.由于實際計算機精度不可能無限長,運算中溢出是明顯的問題,但多數(shù)機器都有16位、32位或者64位的精度,因此可使用比例縮放法解決。 2.算術(shù)編碼器對消息只產(chǎn)生一個碼字,這個碼字是在0, 1)中的一個實數(shù),因此譯碼器在接受到表示這個實數(shù)的所有位之前不能進(jìn)行譯碼。 3.算術(shù)編碼也是一種對錯誤很敏感的編碼方法,如果有一位發(fā)生錯誤就會導(dǎo)致整個消息譯錯。算術(shù)編碼 算術(shù)編碼可以是靜態(tài)的或者自適應(yīng)的。在靜態(tài)算術(shù)編碼中,信源符號的概率是固定的。在自適應(yīng)算術(shù)編碼中,信源符號的概率根據(jù)編碼時符號出現(xiàn)的頻繁程度動態(tài)地進(jìn)行修改,在編碼期間估

21、算信源符號概率的過程叫做建模。需要開發(fā)算術(shù)編碼的原因是因為事先知道精確的信源概率是很難的,而且是不切實際的。當(dāng)壓縮消息時,我們不能期待一個算術(shù)編碼器獲得最大的效率,所能做的最有效的方法是在編碼過程中估算概率。因此動態(tài)建模就成為確定編碼器壓縮效率的關(guān)鍵。特點:不必預(yù)先定義概率模型,自適應(yīng)模式具有獨特的優(yōu)點;信源符號概率接近時,建議使用算術(shù)編碼,這種情況下其效率高于Huffman編碼。算術(shù)編碼實現(xiàn)方法復(fù)雜一些,但JPEG成員對多幅圖像的測試結(jié)果表明,算術(shù)編碼比Huffman編碼提高了5%左右的效率,因此在JPEG擴展系統(tǒng)中用算術(shù)編碼取代Huffman編碼。3.3 預(yù)測編碼3.3.1 預(yù)測編碼的基本

22、原理3.3.2 DPCM 和ADPCM3.3.3 幀間預(yù)測編碼3.3.1預(yù)測編碼方法基本原理 從相鄰數(shù)據(jù)之間由強的相關(guān)性特點考慮,可以利用前面已經(jīng)出現(xiàn)的數(shù)值,進(jìn)行預(yù)測(估計),得到一個預(yù)測值,將實際值與預(yù)測值求差,對這個差值信號進(jìn)行編碼、傳送,這種編碼方法即成為預(yù)測編碼方法。DPCM基本原理轉(zhuǎn)入f(i,j)e(i,j)量化器預(yù)測器預(yù)測器編碼器解碼器信道傳輸e(i,j)f(i,j)輸出f(i,j)f(i,j)f(i,j)f(i,j)預(yù)測編碼 不帶量化器的DPCM線性預(yù)測編碼,屬于無失真編碼系 統(tǒng);帶有量化器的DPCM線性預(yù)測編碼,屬于有失真編碼系統(tǒng)。 最佳量化器的設(shè)計,可利用人眼的視覺可見度閾值

23、和視覺掩蔽效應(yīng)等生理特征,來確定量化器的級數(shù)和步距,使量化誤差總處于人眼難以覺察的范圍內(nèi),達(dá)到主觀評定準(zhǔn)則的要求。3.3.2自適應(yīng)預(yù)測編碼ADPCM 自適應(yīng)技術(shù)的概念是:預(yù)測器的預(yù)測系數(shù)和量化器的量化參數(shù),能夠根據(jù)圖像的局部區(qū)域分布特點自動調(diào)整。 實踐證明,ADPCM編、解碼系統(tǒng)與DPCM編、解碼系統(tǒng)相比,不僅能改善恢復(fù)圖像的評測質(zhì)量和視覺效果,同時還能進(jìn)一步壓縮數(shù)據(jù)。 ADPCM系統(tǒng)包括自適應(yīng)預(yù)測,即預(yù)測系數(shù)的自適應(yīng)調(diào)整和自適應(yīng)量化,即量化器參數(shù)的自適應(yīng)調(diào)整兩部分內(nèi)容。3.3.3 幀間預(yù)測編碼條件補充法運動補償法均方誤差MSE平均絕對幀差MAD3.5變換編碼3.5.1 變換編碼的基本原理3.

24、5.2 K-L變換3.5.3 離散余弦變換(DCT變換)3.5.1 變換編碼的基本原理利用圖像塊像素值之間的相關(guān)性,把圖像變換到一組新的基上,使得能量集中到少數(shù)幾個變換系數(shù)上,通過存儲這些系數(shù)達(dá)到壓縮的目的。本方法采用對整幅的原始圖像分成許多個矩形區(qū)域子圖像獨立進(jìn)行變換。常用變換有: 卡亨南洛維變換(KLT) 離散余弦變換(DCT) 沃爾什哈達(dá)瑪變換(WHT) 離散傅里葉變換(DFT)?;驹韴D子塊 1子塊 2子塊 n.正變換濾波量化編碼信道解碼逆變換綜合拼接源圖像(發(fā)送)恢復(fù)圖像(接收)變換編碼沃爾什(Walsh)變換傅立葉(Fouries)變換離散正弦(DST)變換離散余弦(DCT)變換

25、哈爾(Haar)變換斜(Slant)變換K-L(Karhunen-Loeve)變換小波(Wavelet)變換3.5.3 離散余弦變換(DCT變換)DCT變換使用下式計算逆變換使用下式計算3.6多媒體數(shù)據(jù)壓縮的國際標(biāo)準(zhǔn)3.6.1 靜態(tài)圖像壓縮標(biāo)準(zhǔn)JPEG3.6.2 MPEG3.6.1 靜態(tài)圖像壓縮標(biāo)準(zhǔn)JPEG內(nèi)容:1、 JPEG標(biāo)準(zhǔn)的主要內(nèi)容2、 JPEG靜態(tài)圖像壓縮算法JPEG標(biāo)準(zhǔn)的主要內(nèi)容JPEG 是 Joint Photograph Experts Group的縮寫,這是一個在1986年CCITT和ISO聯(lián)合成立的一個圖像專家組。JPEG標(biāo)準(zhǔn)即多灰度連續(xù)色調(diào)靜態(tài)圖像壓縮編碼,這是一個適用于

26、彩色和單色多灰度或連續(xù)色調(diào)靜止數(shù)字圖像的壓縮標(biāo)準(zhǔn)。JPEG壓縮算法具有如下特點:1)參數(shù)化解碼器,可大范圍調(diào)節(jié)壓縮質(zhì)量比;2)適應(yīng)于任何連續(xù)色調(diào)圖像;3)硬件要求低;3)有四種工作模式: a.基于DPCM (空間線性預(yù)測技術(shù))的無失真算法 b.順序編碼 c.累進(jìn)編碼 d.分層編碼JPEG標(biāo)準(zhǔn)選定ADCT作為靜態(tài)圖像壓縮的標(biāo)準(zhǔn)化算法。該算法包含以下兩種方式: (1)DCT方式(非可逆編碼),包含基本系統(tǒng)(必須保證的功能)和擴展系統(tǒng)(擴充功能);(2)空間方式(可逆編碼)。JPEG標(biāo)準(zhǔn)有兩大分類:第一類方式以DCT(離散余弦變換)為基礎(chǔ);第二類方式以二維空間DPCM(線性空間預(yù)測編碼)為基礎(chǔ)。在D

27、CT方式中,又分為基本系統(tǒng)和擴展系統(tǒng)兩類基本系統(tǒng)是實現(xiàn)DCT編碼與解碼所需的最小功能集,大多數(shù)的應(yīng)用系統(tǒng)只要用此標(biāo)準(zhǔn),就能基本上滿足要求。擴展系統(tǒng)是為了滿足更為廣闊領(lǐng)域的應(yīng)用要求而設(shè)置的。另一方面,空間方式對于基本系統(tǒng)相擴展系統(tǒng)來說,被稱為獨立功能。2、JPEG靜態(tài)圖像壓縮算法1.)基于DPCM的無失真壓縮算法 2.)基于DCT的有失真壓縮編碼3.)基于DCT的累進(jìn)操作方式編碼 3.)基于DCT的分層操作方式1.基于DPCM無失真壓縮算法基于DPCM的無失真編碼中,為了滿足無失真壓縮的需要,JPEG選擇一個簡單的預(yù)測編碼。優(yōu)點: 硬件易實現(xiàn),重建圖像質(zhì)量好缺點: 壓縮比太低,大約為2:1預(yù)測器

28、的工作原理是對X的預(yù)測值, 將X- 進(jìn)行無失真熵編碼。熵編碼器采用Huffman編碼或算術(shù)編碼。2.基于DCT的有失真壓縮編碼基于DCT壓縮編碼算法包括兩種不同的系統(tǒng),即基本系統(tǒng)和增強系統(tǒng)。增強系統(tǒng)是基本系統(tǒng)的擴充?;贒CT編碼其壓縮比:10:1100:1。在壓縮比小于30:1的情況下,壓縮后還原得到的圖象與原始圖象相比較,主觀效果幾乎一樣,因此得到了廣泛的應(yīng)用?;贒CT編碼器的工作原理框圖表示了圖像中一個單分量信號(Y,U,V)的壓縮過程?;贒CT的有失真壓縮編碼基于DCT的JPEG壓縮算法,對中等復(fù)雜程度壓縮效果的評價:基于DCT編碼的關(guān)鍵步驟為:第一步:分割子塊第二步:對子塊進(jìn)行正

29、向離散余弦變換FDCT;第三步:對獲得的DCT系數(shù)進(jìn)行量化處理;第四步:DC系數(shù)差分編碼、AC系數(shù)行程編碼;第五步:熵編碼?;贒CT編碼的關(guān)鍵步驟第一步分割子塊把原始圖像順序分割成88子塊;子塊:8 8 象元,特點:象元間變化平緩,相關(guān)性高基于DCT編碼的關(guān)鍵步驟第二步正向離散余弦變換 對每個單獨的彩色圖像分量,把整個分量圖像分成88的圖像塊,如圖所示,并作為兩維離散余弦變換DCT的輸入。通過DCT變換,把能量集中在少數(shù)幾個系數(shù)上。DCT變換使用下式計算逆變換使用下式計算基于DCT編碼的關(guān)鍵步驟第三步量 化對于有損壓縮算法,JPEG算法使用如圖所示的均勻量化器進(jìn)行量化,量化步距是按照系數(shù)所在

30、的位置和每種顏色分量的色調(diào)值來確定。 量化表 因為人眼對亮度信號比對色差信號更敏感,因此使用了兩種量化表:亮度量化值和色差量化值。此外,由于人眼對低頻分量的圖像比對高頻分量的圖像更敏感,因此圖中的左上角的量化步距要比右下角的量化步距小。基于DCT編碼的關(guān)鍵步驟第四步DC系數(shù)編碼和AC系數(shù)ZIGZAG編碼熵編碼可分成兩步進(jìn)行,先把DC碼和行程碼轉(zhuǎn)換為中間符號序列,然后給這些符號賦以變長碼字。 JPEG建議的熵編碼是Huffman編碼和自適應(yīng)二進(jìn)制算術(shù)編碼?;贒CT編碼的關(guān)鍵步驟第五步 使用熵編碼還可以對DPCM編碼后的直流DC系數(shù)和RLE編碼后的交流AC系數(shù)作進(jìn)一步的壓縮。 在JPEG有損壓縮

31、算法中,使用霍夫曼編碼器來減少熵。使用霍夫曼編碼器的理由是可以使用很簡單的查表(lookup table)方法進(jìn)行編碼。壓縮數(shù)據(jù)符號時,霍夫曼編碼器對出現(xiàn)頻度比較高的符號分配比較短的代碼,而對出現(xiàn)頻度較低的符號分配比較長的代碼。這種可變長度的霍夫曼碼表可以事先進(jìn)行定義?;贒CT的有失真壓縮編碼算法總結(jié)DCT變換子塊分割差分編碼 量 化 行程編碼 熵編碼3.基于DCT的累進(jìn)操作方式編碼 基于DCT的累進(jìn)操作方式編碼方法基本與順序方式一致。不同的是,累進(jìn)方式中每個圖像分量的編碼要經(jīng)過多次掃描才完成。第一次掃描只進(jìn)行一次粗糙圖像的掃描壓縮,以相對于總的傳輸時間快得多的時間傳輸粗糙圖像,并重建一幀質(zhì)

32、量較低的可識別圖像,在隨后的掃描中再對圖像作較細(xì)的壓縮,這時只傳遞增加的信息,可重建一幅質(zhì)量提高一些的圖像。這樣不斷累進(jìn),直到滿意的圖像為止。有兩種累進(jìn)方式:(1)頻譜選擇法: 一次掃描中,只對63個DCT變換系數(shù)中某些頻帶的系數(shù)進(jìn)行編碼、傳送,在隨后的掃描中,對其他頻帶編碼、傳送,直到全部系數(shù)傳送完畢為止;(2)按位逼近法: 沿DCT量化系數(shù)有效位方向分段累進(jìn)編碼。如第一次掃描只取最高有效位的”位編碼、傳送,然后對其余位進(jìn)行編碼、傳送;掃描分段依次為7653位,3位,.,0位。在必須使用低分辨率的設(shè)備來存取或觀察高分辨率圖像的應(yīng)用中,分層操作方式很有效。所謂的分層方式,即將一幅原始圖像的空間

33、分辨率,分成多個分辨率進(jìn)行“錐形”的編碼方法。水平(垂直)方向分辨率的下降以2的倍數(shù)因子發(fā)生改變。3. 基于DCT的分層操作方式基于DPCM的預(yù)測編碼無失真編碼器源圖像數(shù)據(jù)壓縮的圖像數(shù)據(jù)預(yù)測器熵編碼器表說明DPCM預(yù)測編碼框圖3.6.2 MPEGMPEG的全稱是運動圖像專家組Moving Picture Experts Group是專門制定多媒體領(lǐng)域內(nèi)的國際標(biāo)準(zhǔn)的一個組織,該組織成立于1988年,由全世界大約300名多媒體技術(shù)專家組成。1 MPEG標(biāo)準(zhǔn)簡介MPEG標(biāo)準(zhǔn)是面向運動圖像壓縮的一個系列標(biāo)準(zhǔn)。最初MPEG專家組的工作項目是3個,即在1.5Mbps,l0Mbps,30Mbps傳輸速率下對

34、圖像編碼,分別命名為MPEG-1,MPEG-2,MPEG-3。l992年,MPEG-2適用范圍擴大到HDTV,能支持MPEG-3的所有功能,因而MFEG-3被取消。MPEG-1即“用于數(shù)字存儲媒體運動圖像及其伴音速率為1.5Mbps的壓縮編碼”。MPEG-1的任務(wù)主要是,將視頻信號及其伴音以可接收的重建質(zhì)量壓縮到約1.5Mbps的碼率,并復(fù)合成一個單一的MPEG位流,同時保證視頻和音頻的同步。2 MPEG-1標(biāo)準(zhǔn)MPEG系統(tǒng):定義音頻、視頻及有關(guān)數(shù)據(jù)的同步;MPEG視頻:定義視頻數(shù)據(jù)的編碼和重建圖像所需的解碼過程,亮度信號分辨率為360230,色度信號分辨率為180120;MPEG音頻:定義音

35、頻數(shù)據(jù)的編碼和解碼;一致性測試。MPEG-1標(biāo)準(zhǔn)分3個部分MPEG-1標(biāo)準(zhǔn)沒有規(guī)定編碼器和解碼器的體系結(jié)構(gòu)或?qū)崿F(xiàn)方法,但提出了功能和性能上的要求。此外,MPEG算法編碼過程和解碼過程是一種非鏡像對稱算法,也就是說運動圖像的壓縮編碼過程與還原解碼過程是不對稱算法,解碼過程要比編碼過程相對簡單。實際上,MPEG-1和MPEG-2只規(guī)定了解碼的方案,重點將解碼算法標(biāo)準(zhǔn)化。因而用硬件實現(xiàn)MPEG算法時,人們首先實現(xiàn)MPEG的解碼器,如CCube公司CL350解碼器系列。 MPEG音頻壓縮算法是第一個高保真音頻數(shù)據(jù)壓縮國際標(biāo)準(zhǔn),它同時可完全獨立應(yīng)用。MPEG音頻(1)音頻信號采樣率可以是32kHz,33

36、.1kHz或 38kHz;(2)壓縮后的比特流可以按3種模式之一支持單 聲道或雙聲道;(3)壓縮后的比特流具有預(yù)定義的比特率之一;(3)MPEG音頻標(biāo)準(zhǔn)提供3個獨立的壓縮層次;(5)編碼后的比特流支持循環(huán)冗余校驗CRC;(6)MPEG音頻標(biāo)準(zhǔn)支持在比特流中載帶附加信息MPEG音頻標(biāo)準(zhǔn)具有如下特點:MPEG數(shù)據(jù)壓縮過程中存在的主要問題是:(1)僅使用幀內(nèi)編碼方法無法達(dá)到很高的壓縮比;(2)用單一的靜止幀內(nèi)編碼方法能最好地滿足隨機存取的要求。MPEG-1視頻編碼技術(shù)具體實現(xiàn)中采用了一個折中解決方案,在MPEG算法中采用兩種基本技術(shù)(1)基于塊的運動補償技術(shù),目的是減少時間上冗余性;(2)基于DCT

37、變換的ADCT技術(shù),以減少空間上冗余性。基于塊的運動補償技術(shù) MPEG視頻數(shù)據(jù)流的結(jié)構(gòu)基于塊的運動補償技術(shù) MPEG視頻數(shù)據(jù)流的結(jié)構(gòu)宏塊 一個塊由一個1616的亮度信息和兩個88色度信息構(gòu)成。運動信息包含在宏塊中,每個宏塊可有一個/二個運動矢量?;趬K的運動補償技術(shù)圖像類型MPEG將運動圖像類型分為3種:I圖像(幀內(nèi)圖)P圖像(預(yù)測圖)B圖像(雙圖)基于塊的運動補償技術(shù)圖像類型 (1)I圖像 利用圖像自身的相關(guān)性壓縮,提供壓縮數(shù)據(jù)流中的隨機存取的點,采用基于ADCT的編碼技術(shù),壓縮后,每個像素為12比特。 I圖像也稱幀內(nèi)圖,類似與JPEG中的幀內(nèi)編碼。(2)P圖像 用最近的前一個I圖像(或P圖

38、像)預(yù)測編碼得到(前向預(yù)測),也可以作為下一次預(yù)測的參照圖像,也稱為預(yù)測圖。(3)B圖像 B圖像在預(yù)測時,既可使用前一個圖像作參照,也可使用下一個圖像作參照或同時使用前后兩個圖像作為參照圖像(雙向預(yù)測),也稱雙圖。其預(yù)測方法采用4種技術(shù): (1)幀內(nèi)編碼 (2)前向預(yù)測 (3)后向預(yù)測 (4)雙向預(yù)測 基于塊的運動補償技術(shù)運動序列流的組成基于塊的運動補償技術(shù)運動補償技術(shù)主要用于消除P圖像和B圖像在時間上的冗余性,提高壓縮效率。在MPEG方案中,運動補償技術(shù)在宏塊一級工作。各圖像類型的宏塊及處理技術(shù)見下表 所謂基于塊的運動補償技術(shù)即:(1)在參照幀中尋找符合一定條件限制、當(dāng)前被預(yù)測塊的最佳匹配塊

39、;(2)當(dāng)找到匹配塊后,在恢復(fù)被預(yù)測塊時,采用兩種處理方法: 直接用匹配塊代替; 用匹配塊加上預(yù)測誤差(預(yù)測誤差采用ADCT編碼)。每個包含運動信息的1616宏塊,相對于前面相鄰塊的運動信息作差分偏碼,得到運動差值;然后對運動差值,使用變長碼編碼方法,進(jìn)一步壓縮數(shù)據(jù)。注意:MPEG標(biāo)準(zhǔn)只說明了怎樣表示運動信息,并沒有說明運動矢量如何計算。MPEG標(biāo)準(zhǔn) 幀內(nèi)圖像I 不參照任何過去的或者將來的其他圖像幀,壓縮編碼采用類似JPEG壓縮算法幀內(nèi)圖像I的壓縮編碼算法 預(yù)測圖像P使用兩種類型的參數(shù)來表示:一種參數(shù)是當(dāng)前要編碼的圖像宏塊與參考圖像的宏塊之間的差值,另一種參數(shù)是宏塊的移動矢量。*P380預(yù)測圖

40、像P的壓縮編碼算法預(yù)測圖像P的壓縮編碼算法移動矢量的算法框圖預(yù)測圖像P的壓縮編碼算法絕對差值A(chǔ)E均方誤差MSE平均絕對幀差MAD最佳匹配判據(jù)算法框圖插補圖像B的壓縮編碼算法MPEG三種圖像的壓縮后的典型值(比特)MPEG-2標(biāo)準(zhǔn) MPEG-2標(biāo)準(zhǔn)從1990年開始研究,1993年ISO漢城會議正式通過。它是一個直接與數(shù)字電視廣播有關(guān)的高質(zhì)量圖像和聲音編碼標(biāo)準(zhǔn)。MPEG-2可以說是MPEG-1的擴充,因為它們的基本編碼算法都相同。但MPEG-2增加了許多MPEG-1所沒有的功能,例如增加了隔行掃描電視的編碼,提供了位速率的可變性能(scalability)功能。MPEG-2要達(dá)到的最基本目標(biāo)是:位

41、速率為39 Mbit/s,最高達(dá)15 Mbit/s。 MPEG-2的標(biāo)準(zhǔn)號為ISO/IEC 13818,標(biāo)準(zhǔn)名稱為“信息技術(shù) 電視圖像和伴音信息的通用編碼 MPEG-2標(biāo)準(zhǔn)的主要內(nèi)容如下:(1)MPEG2視頻利用網(wǎng)絡(luò)提供的更高的帶寬(1.5Mbps以上),來支持具有更高分辨率圖像的壓縮和更高的圖像質(zhì)量;(2)為了適應(yīng)不同應(yīng)用的要求,保證數(shù)據(jù)的可交換性,定義了不同的功能檔次,每個檔次又分為幾個等級(3)編碼器的設(shè)計有較大的自由度(4)MPEG-2定義了11種規(guī)范,以保證與MPEG-1向下兼容及廣播、通信、計算機、家用視聽設(shè)備的需求;(5)MPEG-2音頻向后與MPEG1音頻兼容MPEG-2的編碼

42、方法和MPEG-l的區(qū)別主要是在隔行掃描制式下,DCT變換是在場內(nèi)還是在幀內(nèi)進(jìn)行由用戶自行選擇,亦可自適應(yīng)選擇。一般情況下,對細(xì)節(jié)多、運動部分少的圖像在幀內(nèi)進(jìn)行DCT;而細(xì)節(jié)少、運動分量多的圖像在場內(nèi)進(jìn)行DCT。 MPEG2采用可調(diào)型和非可調(diào)型兩種編碼結(jié)構(gòu),且采用兩層等級編碼方式。MPEG-2編碼方法 MPEG2視頻體系要求必須保證與MPEG1向下兼容,并同時力求滿足數(shù)字存儲媒體、會議電視/可視電話、數(shù)字電視、高清晰度電視(HDTV)、廣播、通信、網(wǎng)絡(luò)等應(yīng)用領(lǐng)域?qū)Χ嗝襟w視頻、音頻通用編碼方法日益增長的新需求。 如分辨率有低、中、次高、高不同檔次,壓縮方法從簡單到復(fù)雜有不同級別等。MPEG2 Video 配置(框架)和級別 視頻壓縮編碼的數(shù)據(jù)分層比特流結(jié)構(gòu) 對比特流制定了更高層語法結(jié)構(gòu)的語義規(guī)范MPEG2 Video 特色編碼方式:信噪比可變性(Signal-to-Noise Scalability空間分辨率可變性(Spatial Scalability)時間分辨率可變性(Temporal Scalability)MPEG2 Video 配置和級別MPEG標(biāo)準(zhǔn)MPEG2 Video 配置MPEG2 Video 級別Simple Main SNR Spatial

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論