數(shù)字圖像處理第4章圖象壓縮編碼_第1頁
數(shù)字圖像處理第4章圖象壓縮編碼_第2頁
數(shù)字圖像處理第4章圖象壓縮編碼_第3頁
數(shù)字圖像處理第4章圖象壓縮編碼_第4頁
數(shù)字圖像處理第4章圖象壓縮編碼_第5頁
已閱讀5頁,還剩78頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第四章圖象壓縮編碼4.1概述4.2熵編碼4.3預(yù)測編碼4.4變換編碼

壓縮編碼的必要性圖象壓縮編碼的必要性:數(shù)據(jù)量非常龐大例:一幅黑白靜止圖象,512×512×8=2Mbit地球資源衛(wèi)星一幀(4幅),2340×2340×7×4=153Mbit數(shù)字電視PAL制4.43×106×3×8=106Mb/s

占用數(shù)字話路106M/64k=1656圖象壓縮編碼的目的:

減少表示一幅數(shù)字圖象所需的數(shù)據(jù)量。節(jié)省圖象存儲的容量,縮短圖象處理時間,減少傳輸信道容量。壓縮編碼的可能性圖象壓縮編碼的可能性:圖象數(shù)據(jù)存在冗余??臻g冗余:圖像中大部分景物是均勻的、連續(xù)的。相鄰象素的數(shù)據(jù)完全一樣或十分接近。像素的值可以通過與它相鄰的象素值為基礎(chǔ)進(jìn)行預(yù)測。f(x,y)鄰域空間冗余壓縮編碼的可能性時間冗余:視頻圖像序列中的不同幀之間的相關(guān)性造成的冗余。f(x,y,t3)f(x,y,t2)f(x,y,t1)時間冗余壓縮編碼的可能性心理視覺冗余:人眼不能感知或不敏感的那部分圖像信息被認(rèn)為是心理視覺冗余的。去除這些信息并不會明顯降低圖象質(zhì)量,此種壓縮往往是不可逆的。壓縮編碼的可能性編碼冗余:如果一個圖象的灰度級編碼,使用了多于實際需要的編碼符號,就稱該圖象包含了編碼冗余。圖象中象素灰度出現(xiàn)不均勻,用同樣長度比特表示每一個灰度,則必然存在冗余。如果用8位表示該圖象的象素,我們就說該圖象存在編碼冗余,因為該圖象的象素只有兩個灰度,用一位即可表示。壓縮編碼的可能性結(jié)構(gòu)冗余:圖像中存在很強的紋理結(jié)構(gòu)或自相關(guān)性。知識冗余:圖像中包含與某些先驗知識有關(guān)的信息。壓縮編碼的分類根據(jù)對壓縮編碼后的圖象進(jìn)行重建的準(zhǔn)確程度分類:1.信息保持型數(shù)據(jù)壓縮(無失真、無損、可逆編碼)

多用于圖象的數(shù)字存儲,可以實現(xiàn)高速“讀”和“寫”;各類圖像可以通過數(shù)字存儲介質(zhì)進(jìn)行多次重復(fù)復(fù)制而不失真。目前壓縮率2~10。在醫(yī)療或商業(yè)文件的歸檔,有損壓縮因為法律原因而被禁止;衛(wèi)星成象的收集,考慮數(shù)據(jù)使用和所花費用,不希望有任何數(shù)據(jù)損失;X光拍片,信息的丟失會導(dǎo)致診斷的錯誤……壓縮編碼的分類2.保真度型數(shù)據(jù)壓縮(有失真、有損、不可逆編碼)

多應(yīng)用在數(shù)字電視技術(shù)和多媒體圖象通信中。丟失一些對信宿無用或作用不大的信息,也就是在允許失真條件下或一定的保真度準(zhǔn)則下進(jìn)行圖象編碼。有損壓縮方法在圖象壓縮比大于30:1時仍然能夠重構(gòu)圖象,而如果壓縮比為10:1到20:1,則重構(gòu)的圖象與原圖幾乎沒有差別。3.特征保持型數(shù)據(jù)壓縮在圖象識別、分析與理解中,僅對于實際需要的特征信息進(jìn)行編碼,無用信息都可丟掉。壓縮編碼的分類根據(jù)編碼原理分類:

統(tǒng)計編碼:基于信號統(tǒng)計特性的編碼技術(shù)。哈夫曼編碼、費諾香農(nóng)編碼、算術(shù)編碼……

預(yù)測編碼:預(yù)測編碼是基于圖象數(shù)據(jù)的空間或時間冗余特性,用相鄰的已知象素來預(yù)測當(dāng)前象素的取值,然后再對預(yù)測誤差進(jìn)行量化和編碼。DPCM、ADPCM、

M……

變換編碼:變換編碼通常是將空間域上的圖象經(jīng)過正交變換映射到另一變換域上,使變換后的系數(shù)之間的相關(guān)性降低。Fourier、Walsh、Hadamard、Haar、Cosine、Sine、K-L……

其他編碼:方塊編碼、輪廓編碼、跳過白色塊編碼……圖像編碼技術(shù)經(jīng)典現(xiàn)代空域變換域熵編碼矢量量化方塊編碼預(yù)測編碼塊編碼多分辨率編碼傅里葉變換編碼離散余弦變換編碼沃爾什變換編碼KL變換編碼小波變換編碼子帶編碼塔形編碼分形編碼模型基編碼神經(jīng)網(wǎng)絡(luò)編碼圖象壓縮編碼模型信源編碼:完成輸入圖象數(shù)據(jù)的壓縮。信道編碼:為了抗干擾,增加一些容錯、校驗位,實際上是增加冗余。信道:如Internet、廣播、通訊、可移動介質(zhì)……g(x,y)f(x,y)信源編碼信道編碼信道信道解碼信源解碼信源編、解碼模型信源編碼的模型映射器:減少象素間冗余,如游程編碼或變換編碼。量化器:減少心理視覺冗余,不可逆,僅用于有損壓縮。符號編碼器:減少編碼冗余,如使用哈夫曼編碼。信源解碼的模型映射器量化器符號編碼器符號解碼器反向映射器基本概念1.信息量信源信道信宿消息集X={x1,x2,…xn}編碼輸出集Z={z1,z2,…zn}符號集Am={a1,a2,…an}以10為底,哈特利Hartley以e為底,奈特nat以2為底,比特bit信息量與碼長呈線性等概率事件的信息量最大基本概念熵(entropy)——平均信息量無失真編碼的理論極限

平均碼字長度編碼效率基本概念5.變長最佳編碼定理在變長編碼中,對出現(xiàn)概率大的信息符號賦予短碼字,而對于出現(xiàn)概率小的信息符號賦予長碼字。如果碼字嚴(yán)格按照所對應(yīng)符號出現(xiàn)概率大小逆序排列,則編碼結(jié)果平均碼字長度一定小于任何其他排列方式。6.可變長度最佳編碼的平均碼字長度基本概念7.非續(xù)長碼任何一個碼字都不是其它碼字的續(xù)長,也就是不能在某一個碼字后面添加一些碼元而構(gòu)成另一個碼字。8.單義碼任意有限長的碼字序列,只能被唯一地分割成一個個碼字,而其它任何分割方法都會產(chǎn)生不屬于碼字集合的碼字??藙诜蛱?kraft)不等式:

非續(xù)長碼一定是單義碼,但單義碼不一定是非續(xù)長碼?;靖拍畲a1:非單義,續(xù)長。碼2:非單義,續(xù)長。碼3:單義,非續(xù)長,可用。碼4:單義,續(xù)長。01無法判斷,需下一個碼字出現(xiàn)才能正確譯碼。Huffman編碼步驟:將輸入符號按出現(xiàn)的概率由大到小順序排列。將兩個最小概率相加,形成一個新的概率集合。再按1重排,如此重復(fù)進(jìn)行直到只有兩個概率為止。分配碼字。碼字分配從最后一步開始反向進(jìn)行,對最后兩個概率一個賦予“0”碼,一個賦予“1”碼。Huffman編碼方法舉例

例:

信號源s={s1,s2,s3,s4,s5,s6},其概率分布為p1=0.4p2=0.3p3=0.1p4=0.1p5=0.06p6=0.04,求最佳Huffman碼。Huffman編碼例輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04Huffman編碼例輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1Huffman編碼例輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1Huffman編碼例輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3Huffman編碼例輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.4Huffman編碼例輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101Huffman編碼例輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S1=1Huffman編碼例輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S2=00Huffman編碼例輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S3=011Huffman編碼例輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S4=0100Huffman編碼例輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S5=01010Huffman編碼例輸入S1S2S3S4S5S6輸入概率0.40.30.10.10.060.04第一步0.40.30.10.10.1第二步0.40.30.20.1第三步0.40.30.3第四步0.60.40101010101S6=01011Huffman編碼Huffman編碼Huffman編碼特點1)Huffman及Fano-shannon碼不是唯一的;2)Huffman碼缺乏構(gòu)造性。即不能用數(shù)學(xué)方法建立消息和碼字的一一對應(yīng)關(guān)系,只能用查表方法實現(xiàn)。如果消息較多,則表必定很大,存儲器也大,設(shè)備亦復(fù)雜。3)非等長碼給傳輸和存儲譯碼帶來許多困難。4)對于二進(jìn)制編碼,當(dāng)信源概率為2的負(fù)冪次方時,huffman編碼效率可達(dá)100%;當(dāng)信源概率為均勻分布時,其編碼效率明顯降低。也就是說圖像灰度值分布很不均勻是,huffman編碼效率高;而圖像灰度值分布比較均勻是,huffman編碼效率低。香農(nóng)編碼將輸人灰度級(信息符號)按出現(xiàn)的概率由大到小順序排列(相等者可以任意顛倒排列位置)。按式(4.2.5)或式(4.2.6)計算各概率對應(yīng)的碼字長度ti。計算各概率對應(yīng)的累加概率ai

,即把各個累加概率由十進(jìn)制小數(shù)轉(zhuǎn)換成二進(jìn)制小數(shù)。取二進(jìn)制表示的累加概率小數(shù)點后面ti位,即獲得各個信息符號的碼字例:香農(nóng)編碼效率比哈夫曼編碼效率低些,但仍算是一種高效編碼方法。算術(shù)編碼特點模式選擇直接影響效率,有固定模式和自適應(yīng)模式。自適應(yīng)模式無需先定義概率模型,適合無法進(jìn)行概率統(tǒng)計的信源,在這點上優(yōu)越于哈夫曼編碼。在信源符號概率接近時,比哈夫曼編碼效率高。硬件實現(xiàn)比哈夫曼編碼復(fù)雜。在JPEG的擴(kuò)展系統(tǒng)中被推薦代替哈夫曼編碼。算術(shù)編碼基本原理:用0到1的線段上的一個區(qū)間來定義一個信源符號序列的算術(shù)碼字,區(qū)間長度等于概率。例:已知信源,試對1011進(jìn)行算術(shù)編碼。游程長度編碼(行程編碼)現(xiàn)實中有許多這樣的圖像,在一幅圖像中具有許多顏色相同的圖塊。在這些圖塊中,許多行上都具有相同的顏色,或者在一行上有許多連續(xù)的象素都具有相同的顏色值。行程編碼:不需要存儲每一個象素的顏色值,而僅僅存儲一個象素的顏色值以及具有相同顏色的象素數(shù)目就可以,或者存儲一個象素的顏色值以及具有相同顏色值的行數(shù)。行程長度:具有相同顏色并且是連續(xù)的象素數(shù)目。例子假定一幅灰度圖像,第n行的象素值為:用RLC編碼方法得到的代碼為:80315084180。代碼中用黑體表示的數(shù)字是行程長度,黑體字后面的數(shù)字代表象素的顏色值。例如黑體字50代表有連續(xù)50個象素具有相同的顏色值,它的顏色值是8。特點對比RLC編碼前后的代碼數(shù)可以發(fā)現(xiàn),在編碼前要用73個代碼表示這一行的數(shù)據(jù),而編碼后只要用11個代碼表示代表原來的73個代碼,壓縮前后的數(shù)據(jù)量之比約為7:1,即壓縮比為7:1這說明RLC確實是一種壓縮技術(shù),而且這種編碼技術(shù)相當(dāng)直觀,也非常經(jīng)濟(jì)。壓縮比:RLC所能獲得的壓縮比有多大,這主要是取決于圖像本身的特點。如果圖像中具有相同顏色的圖像塊越大,圖像塊數(shù)目越少,獲得的壓縮比就越高。反之,壓縮比就越小。譯碼時按照與編碼時采用的相同規(guī)則進(jìn)行,還原后得到的數(shù)據(jù)與壓縮前的數(shù)據(jù)完全相同。因此,RLC是無損壓縮技術(shù)。適用場景行程編碼多用于黑白二值圖像的壓縮中。例如000000001111111111110000011111181256被轉(zhuǎn)化為一系列黑串和白串長度的編碼:8C56(0x)行程編碼(RunLengthcoding,RLC)分析:對于有大面積色塊的圖象,壓縮效果很好;對于紛雜的圖象,壓縮效果不好,最壞情況下,會加倍圖象。脈沖編碼調(diào)制(PCM)量化器基本思想:減少數(shù)據(jù)量的最簡單的辦法是將圖象量化成較少的灰度級;這種量化是不可逆的,因而解碼時圖象有損失。量化器的定義:階梯形量化函數(shù)t=q(s),是奇函數(shù)q(-s)=-q(s)。si量化器的決策級(閾值);

ti量化器的重構(gòu)級(代表級);L量化器的級數(shù)。脈沖編碼調(diào)制(PCM)inputs1s2S(L/2)-1outputstt1t2t(L/2)-t(L/2)S-[(L/2)-1]t=q(s)決策級(閾值)重構(gòu)級(代表級)增量調(diào)制(ΔPCM、ΔM、DM)

只有一個量化箱,即其增量只能增加一個Δ或減小一個Δ。

ΔM方案最大的缺點是易于過載。自適應(yīng)增量調(diào)制(ADM)基本思想:為了適應(yīng)圖象信號變化陡度大的情況而相應(yīng)改變量化箱Δ

的大小,對于平穩(wěn)信號,Δ

變得很小,變化陡度大的信號,Δ

可變得很大。000、111——最寬箱101、010——窄檔箱011、001、110、100——中等箱差分脈沖編碼調(diào)制(DPCM)基本原理:是基于圖象中相鄰象素之間具有較強的相關(guān)性。每個象素可以根據(jù)以前已知的幾個象素值來預(yù)測。因此在預(yù)測編碼中,編碼和傳輸?shù)牟皇窍笏厝又当旧?,而是這個取樣值和預(yù)測值之間的差值。差分脈沖編碼調(diào)制(DPCM)最佳線性預(yù)測假定一幅二維靜止黑白圖像,經(jīng)過逐幀行掃描而獲得的圖像信號X(t)是一個均值為零、方差為σ2的平穩(wěn)隨機過程。X(t)在時刻抽樣值分別為,那么,根據(jù)Xi到XN-1的N-1個抽樣值,就可以按下式獲得tN時刻抽樣值的線性預(yù)測值

1)基本原理其中,ai(i=1,2,3,…,N-1)為線性

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論