版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
一、圖像壓縮與編碼基本概念二、哈夫曼編碼三、香農(nóng)-范諾編碼四、算術(shù)編碼五、預測編碼六、變換編碼七、圖像壓縮編碼JPEG、MPEG第6章圖像編碼2023最新整理收集do
something
一.圖像壓縮與編碼基本概念1.為什么要進行圖像壓縮?
數(shù)字圖像通常要求很大的比特數(shù),這給圖像的傳輸和存儲帶來相當大的困難。要占用很多的資源,花很高的費用。如一幅512x512的灰度圖象的比特數(shù)為
512x512x8=256k
再如一部90分鐘的彩色電影,每秒放映24幀。把它數(shù)字化,每幀512x512象素,每象素的R、G、B三分量分別占8bit,總比特數(shù)為90x60x24x3x512x512x8bit=97,200M。
如一張CD光盤可存600兆字節(jié)數(shù)據(jù),這部電影光圖像(還有聲音)就需要160張CD光盤用來存儲。
對圖像數(shù)據(jù)進行壓縮顯得非常必要。2.圖像數(shù)據(jù)壓縮的可能性
一般原始圖像中存在很大的冗余度。用戶通常允許圖像失真。當信道的分辨率不及原始圖像的分辨率時,降低輸入的原始圖像的分辨率對輸出圖像分辨率影響不大。用戶對原始圖像的信號不全都感興趣,可用特征提取和圖像識別的方法,丟掉大量無用的信息。提取有用的信息,使必須傳輸和存儲的圖像數(shù)據(jù)大大減少。3.常見的數(shù)據(jù)冗余(1)編碼冗余:
如果一個圖像的灰度級編碼,使用了多于實際需要的編碼符號,就稱該圖像包含了編碼冗余。例:如果用8位表示該圖像的像素,我們就說該圖像存在著編碼冗余,因為該圖像的像素只有兩個灰度,用一位即可表示。(2)像素冗余:
由于任何給定的像素值,原理上都可以通過它的鄰居預測到,單個像素攜帶的信息相對是小的。 對于一個圖像,很多單個像素對視覺的貢獻是冗余的。這是建立在對鄰居值預測的基礎(chǔ)上。原始圖像越有規(guī)則,各像素之間的相關(guān)性越強,它可能壓縮的數(shù)據(jù)就越多。(3)視覺心理冗余:
一些信息在一般視覺處理中比其它信息的相對重要程度要小,這種信息就被稱為視覺心理冗余。4.圖像數(shù)據(jù)壓縮技術(shù)的重要指標(1)壓縮比:圖像壓縮前后所需的信息存儲量之比,壓縮比越大越好。(2)壓縮算法:利用不同的編碼方式,實現(xiàn)對圖像的數(shù)據(jù)壓縮。(3)失真性:壓縮前后圖像存在的誤差大小。
圖像信號在編碼和傳輸過程中會產(chǎn)生誤差,尤其是在有損壓縮編碼中,產(chǎn)生的誤差應在允許的范圍之內(nèi)。在這種情況下,保真度準則可以用來衡量編碼方法或系統(tǒng)質(zhì)量的優(yōu)劣。通常,這種衡量的尺度可分為:客觀保真度準則主觀保真度準則在0,1,2,…,N-1范圍內(nèi)x,y的任意值,輸入像素和對應的輸出圖像之間的誤差可用下式表示:而包含N×N像素的圖像之均方誤差為:由式可得到均方根誤差為
如果把輸入、輸出圖像間的誤差看作是噪聲,那么,重建圖像g(x,y)可由下式表示:在這種情況下,另一個客觀保真度準則——圖像的均方信噪比如下式表示:主觀保真度準則圖像處理的結(jié)果,大多是給人觀看,由研究人員來解釋的,因此,圖像質(zhì)量的好壞,既與圖像本身的客觀質(zhì)量有關(guān),也與視覺系統(tǒng)的特性有關(guān)。有時候,客觀保真度完全一樣的兩幅圖像可能會有完全不相同的視覺質(zhì)量,所以又規(guī)定了主觀保真度準則,這種方法是把圖像顯示給觀察者,然后把評價結(jié)果加以平均,以此來評價一幅圖像的主觀質(zhì)量。
圖象熵 設(shè)數(shù)字圖像像素灰度級集合為(W1,W2,…,WM),其對應的概率分別為P1,P2,…,PM,則數(shù)字圖像的信息熵H為:
H=a取2時,H的單位為比特。a取e時,H的單位為奈特。圖像編碼中a取2。
例:設(shè)8個隨機變量具有同等概率為1/8,計算信息熵H。
解:根據(jù)公式可得:
H= 8*[-1/8*(log2(1/8)) = 8*[-1/8*(-3)]=3
一幅圖像的信息熵就是這幅圖像的平均信息量,即表示圖像中各個灰度級比特數(shù)的統(tǒng)計平均值。等概率事件的熵最大。
信息熵是進行無失真編碼理論的極限,低于此極限的無失真編碼方法是不存在的。編碼效率在一般情況下,編碼效率往往用下列簡單公式表示:
=H/R%H為信息熵,R為平均碼字長度。平均碼字長度設(shè)
k為數(shù)字圖像第k個碼字的長度(二進制代碼的位數(shù)),其相應出現(xiàn)的概率為Pk,則該數(shù)字圖像所賦予的碼字平均碼長R為:R=根據(jù)信息熵編碼理論,可以證明在RH下,總可以設(shè)計出某種無失真編碼方法。若編碼結(jié)果遠大于H,表明這種編碼效率很低,占用的比特數(shù)太多。若編碼結(jié)果使R等于或接近于H,這種狀態(tài)的編碼方法稱為最佳編碼。若要求編碼結(jié)果使R<H,則必然丟失信息而引起圖像失真。這就是在允許失真條件下的一些失真編碼方法。源數(shù)據(jù)編碼:完成原數(shù)據(jù)的壓縮。通道編碼:為了抗干擾,增加一些容錯、校驗位,實際上是增加冗余。通道:如Internet、廣播、通訊、可移動介質(zhì)源數(shù)據(jù)編碼通道編碼通道通道解碼源數(shù)據(jù)解碼5.圖像的編碼模型有損預測編碼圖像壓縮技術(shù)無損壓縮有損壓縮哈夫曼編碼行程編碼算術(shù)編碼
變換編碼
其他編碼6.常用的編碼方法※無損壓縮算法中刪除的僅僅是圖像數(shù)據(jù)中冗余的信息,因此在解壓縮時能精確恢復原圖像,無損壓縮的壓縮比很少有能超過3:1的,常用于要求高的場合?!袚p壓縮是通過犧牲圖像的準確率以實現(xiàn)較大的壓縮率,如果容許解壓圖像有一定的誤差,則壓縮率可顯著提高。有損壓縮在壓縮比大于30:1時仍然可重構(gòu)圖像,而如果壓縮比為10:1到20:1,則重構(gòu)的圖像與原圖幾乎沒有差別Huffman編碼是1952年由Huffman提出的一種編碼方法。這種編碼方法根據(jù)信源數(shù)據(jù)符號發(fā)生的概率進行編碼。在信源數(shù)據(jù)中出現(xiàn)概率越大的符號,相應的碼越短;出現(xiàn)概率越小的符號,其碼長越長。從而達到用盡可能少的碼符號表示源數(shù)據(jù)。它在變長編碼方法中是最佳的。二.Huffman編碼
設(shè)信源A的信源空間為:其中,現(xiàn)用r個碼符號的碼符號集對信源A中的每個符號(i=1,2,…,N)進行編碼。Huffman編碼方法:具體編碼的方法:(1)把信源符號按其出現(xiàn)概率的大小順序排列起來;(2)把最末兩個具有最小概率的元素之概率加起來;(3)把該概率之和同其余概率由大到小排隊,然后再把兩個最小概率加起來,再重新排隊;重復(2)、(3)直到最后只剩下兩個概率為止。從最后一步剩下的兩個概率開始逐步向前進行編碼。每步只需對兩個分支各賦予一個二進制碼,對概率大的賦予碼0,對概率小的賦予碼1Huffman編碼例輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.048灰度級Huffman編碼例輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1Huffman編碼例輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1Huffman編碼例輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3Huffman編碼例輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.4Huffman編碼例輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101Huffman編碼例輸入S1S2S3S4S5S6概率0.40.30.10.10.060.04第1步0.40.30.10.10.1第2步0.40.30.20.1第3步0.40.30.3第4步0.60.4000101010011010001010101001011請寫出Huffman編碼?
該信源的熵為H=2.14bit,假設(shè)1000x1000的圖像,
編碼效率?壓縮比?輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04Huffman編碼討論編碼最佳,碼不唯一,平均碼長相同,不影響效率和壓縮性能;碼長參差不齊,存在輸入、輸出速率匹配問題。設(shè)置緩沖器;如果出現(xiàn)誤碼,會引起誤碼的連續(xù)傳播;對不同信源其編碼效率也不盡相同;應用時,均需要與其他編碼結(jié)合起來使用,才能進一步提高數(shù)據(jù)壓縮比。
1.設(shè)一幅灰度級為8(分別用S0、S1、S2、S3、S4、S5、S6、S7表示)的圖像中,各灰度所對應的概率分別為0.40、0.18、0.10、0.10、0.07、0.06、0.05、0.04?,F(xiàn)對其進行哈夫曼編碼思考與練習5432112745362634450205741總結(jié):Huffman步驟(1)把信源符號按其出現(xiàn)概率的大小順序排列起來;(2)把最末兩個具有最小概率的元素之概率加起來;(3)把該概率之和同其余概率由大到小排隊,然后再把兩個最小概率加起來,再重新排隊;重復(2)、(3)直到最后只剩下兩個概率為止。從最后一步剩下的兩個概率開始逐步向前進行編碼。每步只需對兩個分支各賦予一個二進制碼,對概率大的賦予碼0,對概率小的賦予碼1三.香農(nóng)—范諾編碼
香農(nóng)—范諾(Shannon-Fannon)編碼也是一種典型的可變字長編碼。與哈夫曼編碼相似,當信源符號出現(xiàn)的概率正好為2的負冪次方時,香農(nóng)—范諾編碼的編碼效率可以達到100%。
香農(nóng)—范諾編碼的理論基礎(chǔ)是符號的碼字長度Ni完全由該符號出現(xiàn)的概率來決定,對于二進制編碼即有:編碼步驟(1)將信源符號按其出現(xiàn)的概率由大到小順序排列,若兩個符號的概率相等,則相等概率的字符順序可以任意排列;
(2)計算各概率符號所對應的碼字長度Ni;
(3)將各符號的概率累加,計算累加概率P,即:(4)把各個累加概率P由十進制轉(zhuǎn)換為二進制;
(5)根據(jù)上式取二進制累加概率前Ni位的數(shù)字,并省去小數(shù)點前的“0.”字符,即為對應信源符號的香農(nóng)—范諾編碼碼字。編碼舉例
例:設(shè)一幅灰度級為8的圖像中,各灰度級分別用S0、S1、S2、S3、S4、S5、S6、S7表示,對應的概率分別為0.40、0.18、0.10、0.10、0.07、0.06、0.05、0.04。現(xiàn)對其進行編碼。編碼步驟如下:(1)將信源符號按其出現(xiàn)概率由大到小順序排列,為0.40,0.18,0.10,0.10,0.07,0.06,0.05,0.04;(2)對于概率0.40對應的符號S0,根據(jù)(5)計算N0=2,將累加概率0.00轉(zhuǎn)換位二進制小數(shù)為0.00,取前N0=2位,并去除小數(shù)點前的字符,即S0字符編碼為00;(3)對于概率0.18對應的符號S1,根據(jù)(5)計算N1=3,將累加概率0.40轉(zhuǎn)換位二進制小數(shù)為0.0110,取前N1=3位,并去除小數(shù)點前的字符,即S1字符編碼為011;(4)對于概率0.10對應的符號S2,根據(jù)(5)計算N2=4,將累加概率0.58轉(zhuǎn)換位二進制小數(shù)為0.10010,取前N2=4位,并去除小數(shù)點前的字符,即S2字符編碼為1001;(5)對于概率0.10對應的符號S3,根據(jù)(5)計算N3=4,將累加概率0.68轉(zhuǎn)換位二進制小數(shù)為0.10100,取前N3=4位,并去除小數(shù)點前的字符,即S3字符編碼為1010;(6)對于概率0.07對應的符號S4,根據(jù)(5)計算N4=4,將累加概率0.78轉(zhuǎn)換位二進制小數(shù)為0.11000,取前N4=4位,并去除小數(shù)點前的字符,即S4字符編碼為1100;(7)對于概率0.06對應的符號S5,根據(jù)(5)計算N5=5,將累加概率0.85轉(zhuǎn)換位二進制小數(shù)為0.1101100,取前N5=5位,并去除小數(shù)點前的字符,即S5字符編碼為11011;(8)對于概率0.05對應的符號S6,根據(jù)(5)計算N6=5,將累加概率0.91轉(zhuǎn)換位二進制小數(shù)為0.1110100,取前N6=5位,并去除小數(shù)點前的字符,即S6字符編碼為11101;(9)對于概率0.04對應的符號S7,根據(jù)(5)計算N7=5,將累加概率0.68轉(zhuǎn)換位二進制小數(shù)為0.11110100,取前N7=5位,并去除小數(shù)點前的字符,即S7字符編碼為11110;香農(nóng)—范諾編碼效能
(1)圖像信息熵為(2)平均碼字長度為效率為:信息冗余度為四.算術(shù)編碼
從理論上分析,采用哈夫曼編碼可以獲得最佳信源字符編碼效果;實際應用中,由于信源字符出現(xiàn)的概率并非滿足2的負冪次方,因此往往無法達到理論上的編碼效率和信息壓縮比;以信源字符序列{x,y}為例設(shè)字符序列{x,y}對應的概率為{1/3,2/3},Nx和Ny分別表示字符x和y的最佳碼長,則根據(jù)信息論有:字符x、y的最佳碼長分別為1.58bit和0.588bi;這表明,要獲得最佳編碼效果,需要采用小數(shù)碼字長度,這是不可能實現(xiàn)的;哈夫曼方法對{x,y}的碼字分別為0和1,也就是兩個符號信息的編碼長度都為1。對于出現(xiàn)概率大的字符y并未能賦予較短的碼字;實際編碼效果往往不能達到理論效率;為提高編碼效率,Elias等人提出了算術(shù)編碼算法。算術(shù)編碼的特點
算術(shù)編碼是信息保持型編碼,它不像哈夫曼編碼,無需為一個符號設(shè)定一個碼字;算術(shù)編碼分為固定方式和自適應方式兩種編碼;選擇不同的編碼方式,將直接影響到編碼效率;自適應算術(shù)編碼的方式,無需先定義概率模型,適合于無法知道信源字符概率分布的情況;當信源字符出現(xiàn)的概率比較接近時,算術(shù)編碼效率高于哈夫曼編碼的效率,在圖像通信中常用它來取代哈夫曼編碼;實現(xiàn)算術(shù)編碼算法的硬件比哈夫曼編碼復雜。編碼原理算術(shù)編碼方法是將被編碼的信源消息表示成0~1之間的一個間隔,即小數(shù)區(qū)間,消息越長,編碼表示它的間隔就越小;以小數(shù)表示間隔,表示的間隔越小所需的二進制位數(shù)就越多,碼字就越長。反之,間隔越大,編碼所需的二進制位數(shù)就少,碼字就短。算術(shù)編碼將被編碼的圖像數(shù)據(jù)看作是由多個符號組成的字符序列,對該序列遞歸地進行算術(shù)運算后,成為一個二進制分數(shù);接收端解碼過程也是算術(shù)運算,由二進制分數(shù)重建圖像符號序列。編碼舉例設(shè)圖像信源編碼可用a、b、c、d這4個符號來表示,若圖像信源字符集為{dacba},信源字符出現(xiàn)的概率分別如下表所示,采用算術(shù)編碼對圖像字符集編碼。信源字符abcd出現(xiàn)概率0.40.20.20.2算術(shù)編碼的基本步驟(1)根據(jù)已知條件和數(shù)據(jù)可知,信源各字符在區(qū)間[0,1]內(nèi)的子區(qū)間間隔分別如下:
a=[0.0,0.4)b=[0.4,0.6)c=[0.6,0.8)d=[0.8,1.0)(2)計算中按如下公式產(chǎn)生新的子區(qū)間:(3)第1個被壓縮的字符為“d”,其初始子區(qū)間為[0.8,1.0)(4)第2個被壓縮的字符為“a”,由于其前面的字符取值區(qū)間為[0.8,1.0)范圍,因此,字符“a”應在前一字符區(qū)間間隔[0.8,1.0)的[0.0,0.4)子區(qū)間內(nèi),根據(jù)公式可得:
=0.8+0.0×(1.0-0.8)=0.8=0.8+0.4×(1.0-0.8)=0.88(5)第3個被壓縮的字符為“c”,由于其前面的字符取值區(qū)間為[0.8,0.88)范圍內(nèi),因此,字符“c”應在前一字符區(qū)間間隔[0.8,0.88)的[0.6,0.8)子區(qū)間內(nèi),根據(jù)(6)可得:
=0.8+0.6×(0.88-0.8)=0.848=0.8+0.8×(0.88-0.8)=0.864(6)第4個被壓縮的字符為“b”,由于其前面的字符取值區(qū)間為[0.848,0.864)范圍內(nèi),因此,字符“b”應在前一字符區(qū)間間隔[0.848,0.864)的[0.4,0.6)子區(qū)間內(nèi),根據(jù)(6)可得:
=0.848+0.4×(0.864-0.848)=0.8544=0.848+0.6×(0.864-0.848)=0.8576(7)第5個被壓縮的字符為“a”,由于其前面的字符取值區(qū)間為[0.8544,0.8)范圍內(nèi),因此,字符“a”應在前一字符區(qū)間間隔[0.8544,0.8576)的[0.0,0.4)子區(qū)間內(nèi),根據(jù)(8-15)可得:
=0.8544+0.0×(0.8576-0.8544)=0.8544=0.8544+0.4×(0.8576-0.86544)=0.85568經(jīng)過上述計算,字符集{dacba}被描述在實數(shù)[0.8544,0.85568)子區(qū)間內(nèi),即該區(qū)間內(nèi)的任一實數(shù)值都惟一對應該符序列{dacba};因此,可以用[0.8544,0.85568)內(nèi)的一個實數(shù)表示字符集{dacba}。[0.8544,0.85568)子區(qū)間的二進制表示形式為:[0.1101101010000110,0.1101101100001101);在該區(qū)間內(nèi)的最短二進制代碼為0.11011011,去掉小數(shù)點及其前的字符,從而得到該字符序列的算術(shù)編碼為11011011。算術(shù)編碼可以通過硬件電路實現(xiàn),在上述乘法運算,可以通過右移來實現(xiàn),因此在算術(shù)編碼算法中只有加法和移位運算。算術(shù)編碼效能
根據(jù)上述運算結(jié)果,編碼11011011惟一代表字符序列{dacba},因此,平均碼字長度為:思考熵編碼包括?各自的基本思想?無損預測編碼預測編碼有線性預測和非線性預測兩大類,可以在一幅圖像內(nèi)進行,即所謂的幀內(nèi)預測法,也可以在多幅圖像之間進行,即所謂的幀間預測法。線性預測法通常稱為差值脈沖編碼調(diào)制法(DifferentialPulseCodeModulation),簡稱DPCM相鄰像素間的空域相關(guān)性相鄰幀之間的時域相關(guān)性預測編碼的基本思想:通過僅提取每個象素中的新信息并對它們編碼,來消除象素間的冗余該象素的當前或現(xiàn)實值與預測值的差預測器整數(shù)舍入符號編碼器預測器符號解碼器SS輸入圖像壓縮圖像解壓圖像預測誤差,enfnf^nen+f^n++-fn壓縮圖像預測誤差:en=fn-f^n差組成預測誤差序列預測誤差的熵為信源的高階熵通過預測可以消除相當多的象素間冗余,所以預測誤差的概率密度函數(shù)一般在0點有1個高峰,并且與輸入灰度值分布相比,其方差較小。事實上,預測誤差的概率密度函數(shù)一般用0均值不相關(guān)拉普拉斯概率密度函數(shù)表示pe(e)=有損壓縮有損預測編碼變換編碼有損預測編碼在無損預測編碼系統(tǒng)基礎(chǔ)上,加1個量化器構(gòu)成,如圖所示S量化器符號編碼器預測器SS符號解碼器預測器輸入圖像壓縮圖像壓縮圖像解壓圖像fnf^n-ene’nf’ne’nf^n量化器插在符號編碼器與預測誤差產(chǎn)生處之間,把原來無損編碼器中的整數(shù)舍入模塊吸引進來,它將預測誤差映射進有限個輸出e’n中,e’n確定了有損預測編碼中的壓縮量和失真量為接納量化步驟,需要改變無損編碼器,以使編碼器和解碼器所產(chǎn)生的預測能相等從上圖可以看出,將有損編碼器的預測器放在1個反饋環(huán)中,這個環(huán)的輸入是過去預測和與其相對應的量化誤差的函數(shù):f’n=e’n+f^n
這樣一個閉環(huán)結(jié)構(gòu),其目的是能防止在解碼器的輸出端產(chǎn)生誤差德爾塔調(diào)制(DM)是1中最簡單的有損預測編碼方法,其預測器和量化器分別定義為:f^n=af’n-1e’n=+c對en>0-c其它其中a是預測系數(shù)(一般小于等于1),c是1個正的常數(shù)因為量化器的輸出可用單個位符表示(輸出只有2個值),所以上圖編碼器中的符號編碼器只用長度固定為1bit的碼,由DM方法得到的碼率是1比特/象素DM編碼示例取上述公式中的a=1和c=6.5。設(shè)輸入序列為{14,15,14,15,13,15,15,14,20,26,27,28,27,27,29,37,47,62,75,77,78,79,80,81,82,82}。編碼開始時,先將第一個輸入象素直接傳給編碼器。在編碼器和解碼器兩端都建立初始條件f’0=f0=14后,其余的f^,e,e’,和f’可用上述公式計算得到給出DM編碼例子,如表所示輸入編碼器解碼器誤差nff^ee’f’f^f’[f-f’]014---14.0-14.00.011514.01.06.520.514.020.5-5.521420.5-6.5-6.514.020.514.00.031514.01.06.520.514.020.5-5.5………………………142920.58.56.527.020.527.02.0153727.010.06.533.527.033.53.5164733.513.56.540.033.540.07.0176240.022.06.546.540.046.515.5187546.528.56.553.046.553.022.0197753.024.06.559.553.059.517.5………………………畫出對應表中的輸入和輸出(f和f.)2點值得指出:1、當c遠大于輸入中的最小變化時,如在n=0到n=7的相對平滑區(qū)域,DM編碼會產(chǎn)生顆粒噪聲。2、當c遠小于輸入中的最大變化時,如在n=14到n=19的相對陡峭區(qū)間,DM編碼會產(chǎn)生斜率過載。顆粒噪聲斜率過載信號f信號f.nf,f.6248101214161820222426對大多數(shù)圖像而言,上述2種情況分別會導致圖像中目標邊緣發(fā)生模糊和整個圖像產(chǎn)生紋狀表面
變換編碼的基本原理是將空域中的圖像信號,變換到另外一些正交空間中去,用變換系數(shù)來表示原始圖像,并對變換系數(shù)進行編碼。一般來說在變換域里描述要比在空域簡單,因為圖像的相關(guān)性明顯下降。盡管變換本身并不帶來數(shù)據(jù)壓縮,但變換圖像的能量大部分只集中于少數(shù)幾個變換系數(shù)上,采用量化和熵編碼則可以有效地壓縮圖像的編碼比特率。變換編碼
變換本身不能直接減少數(shù)碼率,只有通過適當?shù)木幋a,才能利用變換來壓縮圖像數(shù)據(jù)。例,設(shè)一幅8x8的圖像信息如下圖并對其進行二維Walsh變換變換編碼的基本步驟編碼、解碼流程例:原圖像為:DCT變換除以量化矩陣,取整實現(xiàn)變換壓縮算法的主要問題變換的選擇子圖尺寸的選擇正向變換量化器符號編碼器構(gòu)造nxn的子圖輸入圖像NxN壓縮圖像圖像壓縮標準二值圖像壓縮標準靜止圖像壓縮標準序列圖像壓縮標準二值圖像壓縮標準G3和G4-由CCITT國家電話電報咨詢委員會(consultativecommitteeoftheinternationaltelephoneandtelegraph)的兩個小組(Group3和Group4)負責制定的,最初為傳真應用而設(shè)計現(xiàn)在稱為ITU(internationaltelecommunicationunion)JBIG(jointbilevelimaginggroup)-這個標準是由ISO和CCITT兩個組織的二值圖聯(lián)合組在1991年制定的。非自適應編碼方式通過8組具有代表性的“實驗”圖來評判打印文字、幾種語言手寫文字、線繪圖JBIG的目標之一就是采用1種自適應技術(shù),以解決這個問題。另外也想使壓縮方法可用于與上述8幅不同類型的圖,以及漸進的傳輸與重建應用G3和G4是非自適應技術(shù)的,所以對半調(diào)灰度圖像編碼是常產(chǎn)生擴展的效果(而不是壓縮)。采用自適應技術(shù),其編碼效率比G3和G4要高靜止圖像壓縮標準JPEG(jointpictureexpertgroup)-對靜止灰度或彩色圖像的壓縮,由上述2個組織的灰度圖聯(lián)合專家制定,于1991年開始使用的,實際上定義了三種編碼系統(tǒng)(1)基于DCT地有損壓縮編碼基本系統(tǒng),可用于絕大多數(shù)壓縮應用場合(2)用于高壓縮比、高精度或漸進重建應用的擴展編碼系統(tǒng)(3)用于無失真應用場合的無損系統(tǒng)圖像應用系統(tǒng)想與JPEG兼容,必須支持JPEG基本系統(tǒng),但另一方面,JPEG并沒有規(guī)定文件格式、圖像分辨率或所用彩色空間模型,這樣它就有可能適用于不同應用場合對錄像機質(zhì)量的靜止圖像的壓縮率一般可達25:1JPEG的基本系統(tǒng):源圖像DCT變換量化器熵編碼器壓縮圖像編碼器輸入和輸出數(shù)據(jù)的精度都是8bit,但量化DCT值的精度是11bit一個實際的編碼和解碼過程JPEG2000-于1997年開始征集提案的-采用小波子帶編碼作為核心編碼方案相比JPEG而言,不僅能提高對圖像的壓縮質(zhì)量,尤其是低碼率時的壓縮質(zhì)量,而且還將得到許多增加了的功能,包括根據(jù)圖像質(zhì)量、視覺感受和分辨率進行漸進傳輸,對碼流的隨機存取和處理,開放結(jié)構(gòu)、向下兼容等應用范圍:
*文獻圖像*醫(yī)療成像
*傳真技術(shù)*安全像機
*互連網(wǎng)*遠程傳感
*掃描儀*數(shù)字化圖書館
*電子攝影序列圖像壓縮標準兩大系列:
1、國際電信聯(lián)盟ITU(CCITT)
H.26X系列
主要在通信傳輸領(lǐng)域內(nèi)應用
2、國際標準化組織ISO
MPEG-X系列
應用范圍很寬-視頻圖像壓縮編解碼H.261由CCITT于1990年制定的序列灰度圖像壓縮標準,主要為電視會議等應用而制定,也稱為P×64標準(P=1,2,…30),其碼流可為64,128,…1920kbit/s。它可允許帶寬為1.544Mbit/s以小于150ms的延遲傳輸運動視頻它將前面介紹的基于DCT的壓縮方法進行了擴展,并將減少幀間冗余的方法也包含量進來。包含兩個最基本的步驟:(1)對序列中的第一幀(或某參考幀)圖用類似于JPEG中用的DCT壓縮,以減少幀內(nèi)冗余度(2)估計目標的運動(通過計算當前幀與下1幀間的相關(guān)),以確定如何壓縮下1幀,以減少幀間冗余度∑DCT量化器變長編碼緩沖存儲IDCT反量化∑濾波器運動補償幀存儲器運動估值圖像輸入編碼輸出量化間隔值幀間預測誤差運動矢量重建圖像數(shù)據(jù)量化后的幀間預測誤差幀間預測值H.262標準
ITU為基于ATM寬帶網(wǎng)絡(luò)的視頻會議而制定的,與ISO的MPEG-2標準完全一樣。
H.263標準-同H.261編碼相同,進行一些改進:1、半像素的運動補償-可提高運動補償算法塊匹配的預測性能
2、改進的游程編碼
3、減小一般性的比特開銷
4、增加了可選模式
5、算術(shù)編碼替代游程編碼或Huffman編碼
6、增強的運動預測
7、雙向預測代替了單純的單向預測
連續(xù)幀圖像的定義連續(xù)幀圖像壓縮的基本思想幀間運動補償預測編碼技術(shù)
MPEG1/2/4標準運動圖像壓縮編碼標準-MPEG
連續(xù)幀圖像由多幅尺寸相同的靜止圖像組成的圖像序列,被稱為連續(xù)幀圖像。與靜止幀圖像相比,連續(xù)幀圖像多了一個時間軸,成為三維信號,因此連續(xù)幀圖像也被稱為三維圖像。
連續(xù)幀圖像壓縮的基本思想基于如下基本假設(shè):在各連續(xù)幀之間存在簡單的相關(guān)性平移運動。一個特定畫面上的像素量值:1)可以根據(jù)同幀附近像素來加以預測,被稱為:幀內(nèi)編碼技術(shù)2)可以根據(jù)附近幀中的像素來加以預測,被稱為:幀間編碼技術(shù)通過減少幀
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 黑龍江省-2023年-社區(qū)網(wǎng)格員-上半年筆試真題卷
- 合成材料制造過程中的安全與質(zhì)量控制考核試卷
- 農(nóng)藥制造與農(nóng)資市場的關(guān)系與應對策略考核試卷
- 廣告與消費者洞察的關(guān)聯(lián)與影響研究考核試卷
- 建筑設(shè)計勞務(wù)分包協(xié)議
- 離婚協(xié)議書中金融投資規(guī)劃
- 設(shè)備轉(zhuǎn)讓協(xié)議書簽訂違約責任
- 兒童營養(yǎng)廚房主廚合同
- 鋼鐵冶煉生產(chǎn)線建設(shè)協(xié)議
- 能源事故損害賠償
- 安全培訓教育效果評價表
- Photoshop(PS)教學課件:第6章調(diào)色
- FAI首件檢驗報告
- 生活滿意度量表(SWLS)
- 冪函數(shù)評課稿
- 能你也能:IPD產(chǎn)品管理實踐
- 細胞生物學主題知識講座
- 小作坊食品安全管理制度(3篇)
- 幼兒園小班音樂教案《媽媽來抓兔兔》含反思
- 中原銀行2023年招聘人員(鄭州)筆試歷年難、易錯考點試題含答案附詳解
- 一道新能 《2022年度環(huán)境、社會及治理(ESG)報告》
評論
0/150
提交評論