圖像壓縮講稿_第1頁
圖像壓縮講稿_第2頁
圖像壓縮講稿_第3頁
圖像壓縮講稿_第4頁
圖像壓縮講稿_第5頁
已閱讀5頁,還剩72頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、關(guān)于圖像壓縮第一張,PPT共七十七頁,創(chuàng)作于2022年6月8.5 有損壓縮概述犧牲圖像復(fù)原的準(zhǔn)確度以換取壓縮能力的增加如果產(chǎn)生的失真可以容忍,則壓縮能力的增加是有效的壓縮率較大有損預(yù)測編碼變換編碼第二張,PPT共七十七頁,創(chuàng)作于2022年6月8.5.1 有損預(yù)測編碼在各類編碼方法中,預(yù)測編碼是比較易于實現(xiàn)的,如微分(差分)脈沖編碼調(diào)制(DPCM)方法。在這種方法中,每一個象素灰度值,用先前掃描過的象素灰度值去減,求出他們的差值,此差值稱為預(yù)測誤差,預(yù)測誤差被量化和編碼與傳送。接收端再將此差值與預(yù)測值相加,重建原始圖像象素信號。由于量化和傳送的僅是誤差信號,根據(jù)一般掃描圖像信號在空間及時間鄰域內(nèi)

2、個象素的相關(guān)性,預(yù)測誤差分布更加集中,即熵值比原來圖象小,可用較少的單位象素比特率進行編碼,使得圖象數(shù)據(jù)得以壓縮。 有損預(yù)測編碼:直接對像素在圖像空間進行操作,稱為空域方法第三張,PPT共七十七頁,創(chuàng)作于2022年6月8.5.1 有損預(yù)測編碼量化器將預(yù)測誤差映射成有限范圍內(nèi)的輸出 ,確定了與有損預(yù)測編碼相聯(lián)系的壓縮和失真的量。 +-符號編碼壓縮圖像輸入圖像enfn fn量化器預(yù)測器預(yù)測編碼器第四張,PPT共七十七頁,創(chuàng)作于2022年6月符號編碼壓縮圖像+-en輸入圖像fn量化器預(yù)測器 fn+修正后的預(yù)測編碼器+ +符號解碼預(yù)測器解壓縮圖像壓縮圖像 fn預(yù)測解碼器第五張,PPT共七十七頁,創(chuàng)作于

3、2022年6月3.預(yù)測編碼/解碼步驟:編碼步驟第一步:壓縮頭處理第二步:對每一個符號:f(x,y),由前面的值,通過預(yù)測器,求出預(yù)測值第三步:求出預(yù)測誤差 e(x,y) = f(x,y) -第四步:對誤差e(x,y)編碼,作為壓縮值。重復(fù)二、三、四步解碼步驟第一步:對頭解壓縮第二步:對每一個預(yù)測誤差的編碼解碼,得到預(yù)測誤差 e(x,y)。第三步:由前面的值,得到預(yù)測值 。第四步:誤差e(x,y),與預(yù)測值 相加,得到解碼f(x,y)。重復(fù)二、三、四步第六張,PPT共七十七頁,創(chuàng)作于2022年6月Delta調(diào)制預(yù)測器量化器這里:顆粒噪聲:斜率過載緩變區(qū)快變區(qū)第七張,PPT共七十七頁,創(chuàng)作于202

4、2年6月預(yù)測器預(yù)測器基本思想:選擇最小化均方預(yù)測誤差作為預(yù)測的最佳準(zhǔn)則最優(yōu)準(zhǔn)則是最小化均方預(yù)測誤差,設(shè)量化誤差可以忽略( e n e n ),并用m個先前像素的線性組合進行預(yù)測上述限制并不是必需的,但它們都極大地簡化了分析,也減少了預(yù)測器的計算復(fù)雜性.基于上述條件的預(yù)測編碼方法稱為差值脈沖碼調(diào)制法(DPCM)第八張,PPT共七十七頁,創(chuàng)作于2022年6月i最優(yōu)預(yù)測器(續(xù))假設(shè)用1個4階線性預(yù)測器:f x, y 1 f x, y 1 2 f x 1, y 1 3 f x 1, y 4 f x 1, y 1來預(yù)測通常,預(yù)測系數(shù)的和要小于或等于1。即上述限制是確保預(yù)測器的輸出能夠落到灰度級的允許范圍

5、內(nèi)減少傳輸噪聲的影響.減小DPCM解碼器對輸入噪聲的敏感性是很重要的,因為單個差錯會傳播到所有以后的輸出。這樣,解碼器的輸出會變得不穩(wěn)定imi 1 1第九張,PPT共七十七頁,創(chuàng)作于2022年6月例:預(yù)測技術(shù)的對比預(yù)測器1:預(yù)測器3:預(yù)測器4:預(yù)測器2:最佳預(yù)測器:選擇最小化均方預(yù)測誤差為最佳準(zhǔn)則水平梯度垂直梯度考慮對單色圖像進行DPCM編碼產(chǎn)生的預(yù)測誤差假設(shè)量化誤差為0,即 en en定義下列4個線性預(yù)測器,并使用其中1個:第十張,PPT共七十七頁,創(chuàng)作于2022年6月例:預(yù)測技術(shù)的對比1階3階結(jié)論:隨著預(yù)測器階數(shù)的增加誤差減少了2階4階第十一張,PPT共七十七頁,創(chuàng)作于2022年6月量化器

6、基本思想:減少數(shù)據(jù)量的最簡單的辦法是將圖像量化成較少的灰度級,通過減少圖像的灰度級來實現(xiàn)圖像的壓縮。這種量化是不可逆的,因而解碼時圖像有損失。量化器t=q(s)是s的奇函數(shù)斷點定義了函數(shù)的不連續(xù)性,被稱為量化器的判決和重構(gòu)級階梯量化函數(shù)第十二張,PPT共七十七頁,創(chuàng)作于2022年6月Es ti 最優(yōu)量化量化器的設(shè)計就是要在給定優(yōu)化準(zhǔn)則和輸入概率密度函數(shù)p(s)的條件下選擇最優(yōu)的si和ti。 優(yōu)化準(zhǔn)則可以是統(tǒng)計的或心理視覺的準(zhǔn)則如果用最小均方量化誤差2 作為準(zhǔn)則,且p(s)是個偶函數(shù),那么最小誤差條件為s is i 1 s t i p s ds 0其中對于任意的L,滿足上列公式的si和ti在均方

7、誤差意義下是最佳的;相應(yīng)的量化器稱為L層的Lloyd-Max量化器LLi 0si ti ti 1 / 2si si判定層在重構(gòu)層之間的一半處i 0i 1,2,3., 12q是一個奇函數(shù)的結(jié)果2ti ti第十三張,PPT共七十七頁,創(chuàng)作于2022年6月Lloyd_Max量化器定義1)要達到最小誤差的條件有兩個:a)每個決策級si正好落在兩個相鄰重構(gòu)級ti 、ti+1的中點。 0 i = 0si = (ti + ti+1) / 2 i = 1,2,.,L/2 1 i = L/2且si = si t-i = ti (q為奇函數(shù))inputs1s2=6S(L/2)-1outputstt1t2=4t(L

8、/2)-t(L/2)S-(L/2)-1t = q(s)t3 =8b)每個重構(gòu)級 ti 落在兩個相繼決策級si區(qū)間的 p(s)(概率密度函數(shù))的質(zhì)心上。第十四張,PPT共七十七頁,創(chuàng)作于2022年6月2)以上兩個條件構(gòu)成一個方程組,必須通過迭代才能求解決策級si和重構(gòu)級ti。3)對于任何滿足兩個最小誤差條件有的L、si和ti,在均方誤差意義上是最優(yōu)的,相應(yīng)的量化器被稱為:L級 Lloyd_Max量化器4)由于對于多數(shù)p(s),得到一個符合最優(yōu)量化兩個條件的解是困難的,因此這些解可通過數(shù)字來產(chǎn)生。單位方差的拉普拉斯概率密度函數(shù)的勞埃德-馬克斯量化器第十五張,PPT共七十七頁,創(chuàng)作于2022年6月最

9、優(yōu)量化總結(jié)實際應(yīng)用表明,2級量化器(例如:delta調(diào)制)所產(chǎn)生的由于斜率過載而造成的解碼圖中邊緣模糊的程度比4級和8級量化器的程度要高 具有步長的最優(yōu)均勻量化器在具有相同輸出可靠性的條件下能提供比固定長度編碼的Lloyd-Max量化器更低的碼率Lloyd-Max量化器和最優(yōu)均勻量化器都不是自適應(yīng)的,但如果根據(jù)圖像局部性質(zhì)調(diào)解量化值也能提供效率可以較細量化緩慢變化區(qū)域而較粗量化快速變化區(qū)域。這可同時減少顆粒噪聲和斜率過載,且碼率增加很少。這也會增加量化器的復(fù)雜性第十六張,PPT共七十七頁,創(chuàng)作于2022年6月量化和復(fù)原例子:DPCM結(jié)果圖像使用3階預(yù)測器 f x, y 0.75f x, y10

10、.75f x1, y0.5f x1, y12層Lloyd-Max量化器自適應(yīng)量化方法:在4個可能的量化器中選擇最好的一個4層Lloyd-Max量化器8層Lloyd-Max量化器 a),c),e):2級,4級,8級勞埃德量化 b),d),f):2級,4級,8級自適應(yīng)量化第十七張,PPT共七十七頁,創(chuàng)作于2022年6月量化和復(fù)原例子:標(biāo)定過的DPCM結(jié)果圖像第十八張,PPT共七十七頁,創(chuàng)作于2022年6月量化和復(fù)原例子:標(biāo)定過的DPCM結(jié)果圖像圖a圖b圖c圖d圖e圖f圖a到f中差異圖像的rms誤差注明了不同的預(yù)測器和量化器2層自適應(yīng)量化器的均方誤差與4層Lloyd-Max量化器相近4層自適應(yīng)量化器

11、的均方誤差小于8層Lloyd-Max量化器有損DPCM均方根誤差第十九張,PPT共七十七頁,創(chuàng)作于2022年6月8.5.2 變換編碼圖像變換會使圖象信號能量在空間重新分布,其中低頻成分占據(jù)能量的絕大部分,而高頻成分所占比重很小,根據(jù)統(tǒng)計編碼的原理,能量分布集中,熵值最小,可實現(xiàn)平均碼長最短。變換編碼的基本原理是將原來在空域描述的圖像信號,變換到另外一些正交空間中去,用變換系數(shù)來表示原始圖像,并對變換系數(shù)進行編碼。一般來說在變換域里描述要比在空域簡單,因為圖像的相關(guān)性明顯下降。盡管變換本身并不帶來數(shù)據(jù)壓縮,但由于變換圖像的能量大部分只集中于少數(shù)幾個變換系數(shù)上,采用量化和熵編碼則可以有效地壓縮圖像

12、的編碼比特率。第二十張,PPT共七十七頁,創(chuàng)作于2022年6月有損壓縮8.5.2 變換編碼基于圖像變換的編碼方法。稱為頻域方法用可逆的線性變換(如傅里葉變換)將圖像映射成1組變換系數(shù),然后將這些系數(shù)量化和編碼大多數(shù)圖像變換得到的系數(shù)值都很小,這些系數(shù)可以較粗地量化,或忽略不計雖然失真很小,信息仍然不能完全復(fù)原,所以還是有損壓縮第二十一張,PPT共七十七頁,創(chuàng)作于2022年6月子圖分解圖像變換量化編碼變換編碼系統(tǒng)對每子圖像的象素進行解相關(guān)或用少量的系數(shù)包含盡量多的信息原則:粗量化包含少量信息的系數(shù)通常使用變長編碼第二十二張,PPT共七十七頁,創(chuàng)作于2022年6月圖像變換將空域中的信號變換到另外一

13、個域,即使用該域中的一組基函數(shù)的線性組合來合成任意函數(shù)單位正交基函數(shù)(相同基函數(shù)內(nèi)積為1,不同基函數(shù)的內(nèi)積為0)使用這組基函數(shù)的線性組合得到任意函數(shù)f(x,y),每個基函數(shù)的系數(shù)就是f(x,y)與該基函數(shù)的內(nèi)積第二十三張,PPT共七十七頁,創(chuàng)作于2022年6月圖像變換圖像變換的目的在于:1. 使圖像處理問題簡化;2.有利于圖像特征提??;3. 有助于從概念上增強對圖像信息的理解圖像變換通常是一種二維正交變換。一般要求: 1. 正交變換必須是可逆的; 2. 正變換和反變換的算法不能太復(fù)雜; 3. 正交變換的特點是在變換域中圖像能量將集中分布在低頻率成分上,邊緣、線狀信息反映在高頻率成分上,有利于圖

14、像處理因此正交變換廣泛應(yīng)用在圖像增強、圖像恢復(fù)、特征提取、圖像壓縮編碼和形狀分析等方面第二十四張,PPT共七十七頁,創(chuàng)作于2022年6月變換選擇常用的變換編碼所使用的正交變換有離散傅立葉變換(DFT)、離散余弦變換(DCT)和沃爾什-哈達馬變換(WHT)。變換后圖象能量更加集中,在量化和編碼時,結(jié)合人類視覺心理因素等,采用“區(qū)域取樣”或“閾值取樣”等方法,保留變換系數(shù)中幅值較大的元素,進行量化編碼,而大多數(shù)幅值小或某些特定區(qū)域的變換系數(shù)將全部當(dāng)作零處理。第二十五張,PPT共七十七頁,創(chuàng)作于2022年6月變換選擇考慮大小為NN的圖像f(x,y),該圖像的正向離散變換T(u,v)表示為N 1 N

15、1T u, v f x, ygx, y, u, vx0 y 0u,v=0,1,2,N-1。給定T(u,v),f(x,y)可用離散反變換得到N 1 N 1f x, y T u, vhx, y, u, vu 0 v0 x,y=0,1,2,N-1g(x,y,u,v)和h(x,y,u,v):正向和逆向變換核函數(shù)T(u,v):變換系數(shù)第二十六張,PPT共七十七頁,創(chuàng)作于2022年6月變換選擇如果下列等式成立,正向核函數(shù)g(x,y,u,v)稱為是可分離的gx, y, u, v g1 x, ug2 ( y, v)如果g1在函數(shù)上等于g2,則核函數(shù)是對稱的gx, y, u, v g1 x, u g1 ( y,

16、 v)如果上述等式對逆向核函數(shù)h(x,y,u,v)成立,則h(x,y,u,v)也具有上述結(jié)論第二十七張,PPT共七十七頁,創(chuàng)作于2022年6月1 j 2 uxvy / NNbi x pi u bi y pi v 1核函數(shù):DFT變換(離散傅里葉變換的簡化版本(M=N)gx, y, u, v 2 ehx, y, u, v e j 2 uxvy / NWHT變換gx, y, u, v hx, y, u, v 1i0Nm-1DCT變換第二十八張,PPT共七十七頁,創(chuàng)作于2022年6月N=4時Walsh-Hadamard基函數(shù)WHT的重要意義:所有核的值均為+1或-1,實現(xiàn)上簡單N=4時的核,每個塊包

17、括4416個子方塊白色表示1,而黑色表示1左上角的塊:u=v=0,x,y=0,1,2,3時g(x,y,0,0)的值:1左上第二塊:u=0,v=1,x,y=0,1,2,3時g(x,y,0,1)的值第二十九張,PPT共七十七頁,創(chuàng)作于2022年6月N=4時DCT基函數(shù)g的值不是整數(shù)0為黑,1為白,較大的g值,對應(yīng)較淺的灰度級第三十張,PPT共七十七頁,創(chuàng)作于2022年6月三種變換舉例 例8.19說明:512512大小的單色圖像先將原圖分割為88大小的子圖像,然后用DFT,WHT和DCT的一種,表示每一個子圖像將得到所有系數(shù)的50%去掉,即丟掉32個系數(shù)對截取的系數(shù)陣列進行逆變換,保留32個系數(shù)丟掉

18、的32個系數(shù),對復(fù)原圖像質(zhì)量的視覺影響很小產(chǎn)生的均方誤差rmsDFTrmsWHTrmsDCT第三十一張,PPT共七十七頁,創(chuàng)作于2022年6月三種變換舉例DFT還原圖像WHT還原圖像DCT還原圖像rmsDFT=1.28rmsWHT=0.86rmsDCT=0.68均方誤差近似等于被丟棄的變換系數(shù)的方差之和!第三十二張,PPT共七十七頁,創(chuàng)作于2022年6月三種變換舉例 結(jié)論DCT的信息壓縮能力比DFT和WHT的能力要強WHT是最容易實現(xiàn)的DCT在信息壓縮能力和計算復(fù)雜性之間提供了很好的平衡,因此,許多變換編碼系統(tǒng)都是以DCT變換為基礎(chǔ)的對比其它方法,DCT變換具有使用單一的集成電路就可以實現(xiàn),可

19、以將最多的信息包裝在最少的系數(shù)之中可使“分塊噪聲”的塊效應(yīng)最小,這些分塊噪聲是由子圖像之間的可見邊界造成第三十三張,PPT共七十七頁,創(chuàng)作于2022年6月三種變換舉例結(jié)論(續(xù))DFT的n點周期性造成邊界中斷,當(dāng)DFT系數(shù)被截尾或量化時,邊界值以分塊噪聲的形式出現(xiàn),即相鄰子圖像之間的邊界變得可見。而DCT變換不會產(chǎn)生固有的邊界中斷DFTDCT第三十四張,PPT共七十七頁,創(chuàng)作于2022年6月變換編碼子圖像尺寸選擇子圖像尺寸是影響變換編碼誤差和計算復(fù)雜度的一個重要因素一般滿足下列2個條件相鄰子圖像之間的相關(guān)(冗余)減少到可接受子圖像的長和寬都是2的整數(shù)次冪。這主要是為了簡化對子圖像變換的計算最常用

20、的子圖像尺寸是88和1616第三十五張,PPT共七十七頁,創(chuàng)作于2022年6月把圖像分割為nn的子圖像(n=2,4,8,16和32)計算每幅子圖像的變換,截取75的系數(shù),對截取后的陣列進行反變換得到當(dāng)圖像尺寸大于88,WHT和DCT曲線變得比較平緩,而DFT曲線下降得較快。對更大的n值,DFT將穿過WHT并逼近DCT當(dāng)圖像尺寸為22時,3條曲線交于同1點。此時各變換都只保留了4個系數(shù)中的1個(25),即直流分量子圖像尺寸選擇一個試驗例子:子圖像的大小影響變換編碼誤差和計算復(fù)雜性。大多數(shù)應(yīng)用中,圖像被進一步分割以便將相鄰子圖像之間的相關(guān)性減少到可接受程度。子圖像增大,壓縮水平增加,但計算復(fù)雜性增

21、加。一般8*8,16*16第三十六張,PPT共七十七頁,創(chuàng)作于2022年6月(1)子圖像尺寸的選擇a)8*8大小子圖像壓縮結(jié)果b)誤差圖像c)放大的局部圖像d)2*2子圖像e)4*4子圖像f)8*8子圖像第三十七張,PPT共七十七頁,創(chuàng)作于2022年6月(2)比特分配截斷誤差和2個因素有關(guān):截除的變換系數(shù)的數(shù)量和相對重要性用來表示所保留系數(shù)的精度在大多數(shù)變換編碼系統(tǒng)中,保留的系數(shù)是根據(jù)最大值方差進行選擇,稱為區(qū)域編碼,或根據(jù)系數(shù)從大到小選擇,稱為門限編碼。對變換后的系數(shù)進行截取、量化和編碼的整個過程通常稱為比特分配。使用8*8DCT系數(shù)的12.5%對源圖像進行近似的結(jié)果a),c),e) 門限編

22、碼結(jié)果(誤差?。゜),d),f) 區(qū)域編碼結(jié)果第三十八張,PPT共七十七頁,創(chuàng)作于2022年6月典型的區(qū)域模板 具有最大方差的變換系數(shù)攜帶著圖像大部分信息并在編碼處理的過程中應(yīng)該保留下來。區(qū)域取樣的目的是“選擇要保留的系數(shù)”。處理可看成每個T(u,v)與相應(yīng)的區(qū)域模板中的元素相乘。對區(qū)域取樣過程中保留的系數(shù)必須進行量化和編碼。因此,區(qū)域模板有時表示成對每個系數(shù)編碼的比特數(shù)。兩種分配方案:給系數(shù)分配相同的比特數(shù)給系數(shù)不均勻地分配幾個固定數(shù)目的比特數(shù)(a)(b)區(qū)域編碼最大方差的系數(shù)通常被定位在圖像變換的原點周圍。第三十九張,PPT共七十七頁,創(chuàng)作于2022年6月典型的閾值模板 和 系數(shù)排序序列對

23、任何子圖像,最大量級的變換系數(shù)對重構(gòu)子圖像的品質(zhì)具有最大的影響.因為不同子圖像的最大系數(shù)的位置是變化的,所以通常將 (u,v)T(u,v) 的元素重新排列成一個一維行程編碼.門限編碼第四十張,PPT共七十七頁,創(chuàng)作于2022年6月有3種基本途徑對一幅變換后的子圖像進行門限處理(即生成子圖像門限模板函數(shù)) 對所有的子圖像使用單一的全局門限; 對不同圖像的壓縮等級不同. 對每幅圖像使用不同的門限; 對每幅子圖像丟棄相同數(shù)目的系數(shù),編碼率恒定. 門限隨子圖像中每個系數(shù)的位置函數(shù)的變化而變化. 編碼率變化,但是可以將門限處理和量化過程結(jié)合起來.門限編碼第四十一張,PPT共七十七頁,創(chuàng)作于2022年6月

24、是 取閾值和量化近似,Z是變換的歸一化矩陣 使用下式代替(u,v)T(u,v), 將取閾值和量化結(jié)合起來(2)門限編碼量化第四十二張,PPT共七十七頁,創(chuàng)作于2022年6月(a)一條門限編碼量化曲線對Z(u,v)賦予某個常數(shù)c(b) JPEG編碼標(biāo)準(zhǔn)中的DCT量化步長矩陣Z (2)門限編碼量化第四十三張,PPT共七十七頁,創(chuàng)作于2022年6月門限編碼結(jié)果比較a)采用JPEG標(biāo)準(zhǔn)模板Z(u,v) 壓縮率34:1 rms :3.42像素b)標(biāo)準(zhǔn)模板Z(u,v) *4 壓縮率67:1 rms :6.33像素第四十四張,PPT共七十七頁,創(chuàng)作于2022年6月變換編碼其它編碼方法子帶(subband)編

25、碼小波編碼分形(fractal)編碼矢量量化(vector quantization,VQ)編碼統(tǒng)計編碼/熵編碼第四十五張,PPT共七十七頁,創(chuàng)作于2022年6月8.6 圖像壓縮標(biāo)準(zhǔn)相關(guān)的國際組織 ISO(International StandardizationOrganization,國際標(biāo)準(zhǔn)化組織)ITU(International Telecommunication Union,國際電信聯(lián)盟),前身是CCITT(國際電話電報咨詢委員會)相關(guān)工作覆蓋了從二值到灰度(彩色)值的靜止和運動圖像采用的大部分基本技術(shù)前面已經(jīng)介紹,主要包括預(yù)測和變換編碼技術(shù)第四十六張,PPT共七十七頁,創(chuàng)作于20

26、22年6月制定圖像標(biāo)準(zhǔn)的國際組織: ISO(國際標(biāo)準(zhǔn)化組織)CCITT(國際電報電話咨詢委員會)聯(lián)合組織下進行制定的標(biāo)準(zhǔn)的類型(三類): (1) 二值圖像壓縮標(biāo)準(zhǔn):面向傳真而設(shè)計連續(xù)調(diào)圖像壓縮標(biāo)準(zhǔn):(2) 靜止幀黑白、彩色壓縮:面向靜止的單幅圖像(3) 連續(xù)幀黑白、彩色壓縮:面向連續(xù)的視頻影像圖像壓縮標(biāo)準(zhǔn)第四十七張,PPT共七十七頁,創(chuàng)作于2022年6月二值圖像壓縮標(biāo)準(zhǔn)G3和G4這兩個標(biāo)準(zhǔn)是由CCITT的兩個小組負責(zé)制定的,最初是CCITT為傳真應(yīng)用而設(shè)計的。G3采用了非自適應(yīng)、1-D行程編碼技術(shù),對每組N行掃描線中的后N-1行也可使用2-D行程編碼。G4是G3的一種簡化版,其中只使用2-D行

27、程編碼。G3的壓縮率一般為15:1G4的壓縮率一般比G3高1倍第四十八張,PPT共七十七頁,創(chuàng)作于2022年6月JBIG這個標(biāo)準(zhǔn)由上述2合組織的二值圖聯(lián)合組(joint bilevel imaging group,JBIG)于1991年制定的。因為G3和G4是基于非自適應(yīng)技術(shù)的,所以對半色調(diào)灰度圖像編碼時常產(chǎn)生擴展,JBIG的目標(biāo)就是采用一種自適應(yīng)技術(shù)解決這個問題。編碼效率提高了,對于打印字符的掃描圖像,壓縮比可提高1.1-1.5倍,對計算機生成的打印字符圖像,壓縮比可提高5倍。對抖動或半色調(diào)圖像,壓縮比可提高2-30倍。二值圖像壓縮標(biāo)準(zhǔn)第四十九張,PPT共七十七頁,創(chuàng)作于2022年6月靜止圖

28、像壓縮標(biāo)準(zhǔn)JPEG(Joint Picture Expert Group)由ISO和CCITT聯(lián)合成立的專家組負責(zé)制定靜態(tài)圖像(彩色與灰度圖像)的壓縮算法定義了3種編碼系統(tǒng)基于DCT的有損編碼基本系統(tǒng),可用于絕大多數(shù)壓縮應(yīng)用場合用于高壓縮比、高精確度或漸進重建應(yīng)用的擴展編碼系統(tǒng)用于無失真應(yīng)用場合的無損系統(tǒng)JPEG對錄像機質(zhì)量的靜止圖像的壓縮率一般可達到25:1第五十張,PPT共七十七頁,創(chuàng)作于2022年6月JPEG基本系統(tǒng)編碼器框圖源圖像DCT正變換量化器熵編碼器壓縮圖像表說明表說明壓縮過程DCT計算量化變長碼賦值第五十一張,PPT共七十七頁,創(chuàng)作于2022年6月具體壓縮過程先把整個圖像分解成

29、多個88的圖像塊;88的圖像塊經(jīng)過DCT變換后,低頻分量都集中在左上角,高頻分量則分布在右下角(DCT變換類似于低通濾波器),因為低頻分量包含了圖像的主要信息,所以可以忽略高頻分量,達到壓縮的目的;使用量化操作去掉高頻分量,量化操作就是將某一個值除以量化表中的對應(yīng)值。由于量化表中左上角的值較小,而右下角的值較大,這樣達到保持低頻分量,抑制高頻分量的目的;在左上角的低頻分量中,F(0,0)代表了直流(DC)系數(shù),即88子塊的平均值。由于兩個相鄰圖像塊的DC系數(shù)相差很小,所以采用差分編碼DPCM,其它63個元素是交流(AC)系數(shù),采用之字型(zig-zag)順序進行行程編碼,使系數(shù)為0的值更集中;

30、 在得到DC碼字和AC行程碼字后,為了進一步提高壓縮比,再進行熵編碼,采用了Huffman編碼第五十二張,PPT共七十七頁,創(chuàng)作于2022年6月靜止圖像壓縮標(biāo)準(zhǔn)JPEG(joint picture expert group)圖像應(yīng)用系統(tǒng)要想與JPEG兼容,必須要支持其基本系統(tǒng)。在視覺效果不受到嚴重損失的前提下,對灰度圖像壓縮算法可以達到15到20的壓縮比。如果在圖像質(zhì)量上稍微犧牲一點的話,可以達到40:1或更高的壓縮比。如果處理的是彩色圖像,JPEG算法首先將RGB分量轉(zhuǎn)化成亮度分量和色差分量,同時丟失一半的色彩信息(空間分辨率減半)。然后,用離散余弦變換來進行變換編碼,舍棄高頻的系數(shù),并對余

31、下的系數(shù)進行量化,以進一步減小數(shù)據(jù)量。最后,使用行程長度編碼和Huffman編碼來完成壓縮任務(wù)。JPEG解壓縮過程就是JPEG壓縮過程的逆過程,這使得算法具有對稱性。第五十三張,PPT共七十七頁,創(chuàng)作于2022年6月JPEG2000相對于原始JPEG標(biāo)準(zhǔn),在對連續(xù)色調(diào)靜止圖像的壓縮方面以及對壓縮數(shù)據(jù)的訪問方面提供了更大的靈活性。該標(biāo)準(zhǔn)是以小波編碼技術(shù)為基礎(chǔ)的。該標(biāo)準(zhǔn)在1997年開始征集提案,1999年形成草案,2000年開始使用。靜止圖像壓縮標(biāo)準(zhǔn)第五十四張,PPT共七十七頁,創(chuàng)作于2022年6月8.6.3視頻壓縮標(biāo)準(zhǔn)視頻壓縮標(biāo)準(zhǔn)基本概念電視會議標(biāo)準(zhǔn)H.261、H.263MPEG標(biāo)準(zhǔn)MPEG-1

32、、MPEG-2、MPEG-4、MPEG-7和MPEG-21第五十五張,PPT共七十七頁,創(chuàng)作于2022年6月連續(xù)幀圖像的定義連續(xù)幀圖像壓縮的基本思想幀間運動補償預(yù)測編碼技術(shù)H.261標(biāo)準(zhǔn)MPEG1/2/4/7標(biāo)準(zhǔn)運動圖像壓縮標(biāo)準(zhǔn)第五十六張,PPT共七十七頁,創(chuàng)作于2022年6月1. 連續(xù)幀圖像的定義由多幅尺寸相同的靜止圖像組成的圖像序列,被稱為連續(xù)幀圖像。與靜止幀圖像相比,連續(xù)幀圖像多了一個時間軸,成為三維信號,因此連續(xù)幀圖像也被稱為三維圖像。運動圖像壓縮標(biāo)準(zhǔn)第五十七張,PPT共七十七頁,創(chuàng)作于2022年6月2. 連續(xù)幀圖像壓縮的基本思想基于如下基本假設(shè):在各連續(xù)幀之間存在簡單的相關(guān)性平移運動

33、。一個特定畫面上的像素量值:1)可以根據(jù)同幀附近像素來加以預(yù)測,被稱為:幀內(nèi)編碼技術(shù)2)可以根據(jù)附近幀中的像素來加以預(yù)測,被稱為:幀間編碼技術(shù)運動圖像壓縮標(biāo)準(zhǔn) 壓縮的基本思想通過減少幀間圖像數(shù)據(jù)冗余,來達到減少數(shù)據(jù)量、壓縮連續(xù)幀圖像體積的目的將連續(xù)幀圖像序列,分為參考幀和預(yù)測幀,參考幀用靜止圖像壓縮方法進行壓縮,預(yù)測幀用于對幀差圖像進行壓縮由于幀差圖像的數(shù)據(jù)量大大小于參考幀的數(shù)據(jù)量,從而可以達到很高的壓縮比第五十八張,PPT共七十七頁,創(chuàng)作于2022年6月3. 幀間運動補償預(yù)測編碼技術(shù)幀間預(yù)測編碼+-熵編碼幀間預(yù)測器運動補償壓縮圖像塊輸入圖像塊enfnfn運動補償預(yù)測幀間誤差圖像運動補償預(yù)測圖

34、像運動圖像壓縮標(biāo)準(zhǔn)第五十九張,PPT共七十七頁,創(chuàng)作于2022年6月向前預(yù)測雙向預(yù)測前一幀當(dāng)前幀前一幀當(dāng)前幀下一幀I 幀(Intra-picture) : 不進行預(yù)測、進行幀內(nèi)編碼的編碼幀(參考幀);P幀(Predicted-picture):通過向前預(yù)測得到的誤差編碼幀;B幀(Bidirectional-picture):通過雙向預(yù)測得到的誤差編碼幀.因圖像序列存放在存儲器中,可以使用下一幀.運動圖像壓縮標(biāo)準(zhǔn)第六十張,PPT共七十七頁,創(chuàng)作于2022年6月編碼中的運動補償運動補償概念 以對幀間運動的估算為基礎(chǔ)的,若物體均在空間上有一位移,那么用有限的運動參數(shù)來對幀間的運動加以描述,如:對于像

35、素的平移運動,可用運動矢量來描述。一個來自前一編碼幀的運動補償預(yù)測像素,就能給出一個當(dāng)前像素的最佳預(yù)測。預(yù)測誤差和運動矢量一同參與編碼。由于一些運動矢量之間的空間相關(guān)性通常較高,因此,一個像素的運動矢量,可以代表一個相鄰像素塊的運動。實現(xiàn)中,畫面一般劃分成一些不連接的像素塊(在MPEGl和MPEG2標(biāo)準(zhǔn)中一個像素塊為1616像素),對于每一個這樣的像素塊,只估算一個運動矢量。運動圖像壓縮標(biāo)準(zhǔn)第六十一張,PPT共七十七頁,創(chuàng)作于2022年6月運動圖像壓縮標(biāo)準(zhǔn)一種基于運動補償視頻壓縮的DPCM/DCT編碼器第六十二張,PPT共七十七頁,創(chuàng)作于2022年6月MPEG幀的分類MPEG 的畫面組(GOP

36、)第六十三張,PPT共七十七頁,創(chuàng)作于2022年6月MPEG幀的分類由于畫面內(nèi)容有連貫性,因此當(dāng)前畫面的內(nèi)容可以看作是前面畫面內(nèi)容的位移(運動)。運動矢量畫面各處相應(yīng)的位移量(幅度、方向)各有不同,因此畫面應(yīng)細分成塊(宏塊),以宏塊為單位,找出兩幀畫面中相應(yīng)宏塊之間的位移量-運動矢量第六十四張,PPT共七十七頁,創(chuàng)作于2022年6月畫面的重新排序GOP(Group of Pictures)例0B1B2I3B4B5P6B7B8P9B10I畫面的顯示順序是:畫面的編碼順序是:B B I B B P B B P B I0 1 2 3 4 5 6 7 8 9 10I B B P B B P B B I

37、 B2 0 1 5 3 4 8 6 7 10 9因此,每一個GOP中的畫面在編碼前和解碼后都必須重排序第六十五張,PPT共七十七頁,創(chuàng)作于2022年6月電視會議標(biāo)準(zhǔn)H.261標(biāo)準(zhǔn) 應(yīng)用范圍:電視會議 主要編碼技術(shù):DCT變換向前運動補償預(yù)測Zig-zag排序霍夫曼編碼IPPPPPPIPPP.第六十六張,PPT共七十七頁,創(chuàng)作于2022年6月電視會議標(biāo)準(zhǔn)H.263標(biāo)準(zhǔn)應(yīng)用范圍:可視電話主要編碼技術(shù):DCT變換雙向運動補償預(yù)測Zig-zag排序霍夫曼編碼IBBPBBPBBIBBP . . . .第六十七張,PPT共七十七頁,創(chuàng)作于2022年6月多媒體壓縮標(biāo)準(zhǔn)MPEG系列標(biāo)準(zhǔn)(Moving Pict

38、ure ExpertGroup)ISO/IEC/JTC1/SC29的一個工作組WG11, 1988年成立, 目前有25個國家(團體)的200多個公司300多名成員分10個組工作JPEG的目標(biāo)是專門集中于靜止圖像壓縮,MPEG的目標(biāo)是針對運動圖像的數(shù)據(jù)壓縮,但是JPEG和MPEG有密切聯(lián)系MPEG專家小組,不僅限制于數(shù)字視頻壓縮,音頻及音頻和視頻的同步問題都不能脫離視頻壓縮獨立進行第六十八張,PPT共七十七頁,創(chuàng)作于2022年6月MPEG-1標(biāo)準(zhǔn)MPEG-1標(biāo)準(zhǔn)(ISO/IEC11172). 1992年發(fā)布。用于1.5Mbps數(shù)據(jù)傳輸率的運動圖像及其伴音的編碼。主要應(yīng)用于 VCD,MP3音樂等MPEG-1在JPEG和H.261等優(yōu)秀標(biāo)準(zhǔn)的基礎(chǔ)上, 對參加競爭的14個方案,通過反復(fù)協(xié)調(diào)而得到統(tǒng)一,從而成為先進、合理、質(zhì)量高、成本低的優(yōu)秀標(biāo)準(zhǔn)MPEG-1促進了大規(guī)模集成電路專用芯片的發(fā)展,為多媒體技術(shù)和產(chǎn)品的繁榮立下了功勞第六十九張,PPT共七十七頁,創(chuàng)作于2022年6

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論