第6章-圖像壓縮

上傳人：1*** IP屬地：四川上傳時間：2023-02-28 格式：PPT 頁數(shù)：57 大?。?.08MB 積分：30 舉報 版權(quán)申訴

已閱讀5頁，還剩52頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

第6章圖像壓縮圖像壓縮壓縮模型信息理論無損壓縮有損壓縮圖像壓縮標準引言（一）、圖像數(shù)據(jù)壓縮的重要性和必要性：

#A4大小300dpi二值掃描——1MB

#640*480的24bit真彩色圖像——0.92MB

#3656*2664的24bit電影膠片——29MB

#PAL制數(shù)字視頻——20M

#高清晰度電視HDTV——166MB（二）、圖像數(shù)據(jù)壓縮的應用領(lǐng)域：

1、辦公自動化；

2、醫(yī)學圖像處理；

3、衛(wèi)星遙感遙測系統(tǒng)；

4、高清晰度電視HDTV；

5、可視電話、會議電視；

6、移動多媒體圖像及視頻傳輸：

彩信業(yè)務，手機視頻；……

凡是涉及到圖像數(shù)據(jù)的傳輸、交換與存儲的領(lǐng)域均要求進行圖像數(shù)據(jù)的壓縮。（三）、圖像中冗余信息的主要表現(xiàn)：

1、圖像的空間冗余；-象素間冗余相同的目標相同的直方圖象素間的相關(guān)性不同2、圖像彩色光譜空間的冗余；

3、視頻圖像信號在時間上的冗余；

4、圖像的視覺心理冗余；

——壓縮的目的就是去除信息冗余如何評價圖像編碼中的解碼圖像與原始圖像之間的偏離程度？通過保真度(逼真度)準則兩大類準則：客觀保真度準則，主觀保真度準則客觀保真度準則當所損失的信息量可用編碼輸入圖像與解碼輸出圖像的函數(shù)表示時，基于客觀保真度準則的。常用的準則有：均方根誤差erms總誤差均方信噪比SNRrms主觀保真度準則一般狀況下，解壓圖像最終是依靠人的視覺來推斷的，用主觀保真度準則。如對電視圖像質(zhì)量進行確定評價的尺度為評分評價說明1優(yōu)秀的優(yōu)秀的具有極高質(zhì)量的圖像2好的

是可供觀賞的高質(zhì)量的圖像，干擾并不令人討厭

3可通過的圖像質(zhì)量可以接受，干擾不討厭4邊緣的圖像質(zhì)量較低，希望能加以改善，干擾有些討厭5劣等的圖像質(zhì)量很差，尚能觀看，干擾顯著地令人討厭6不能用圖像質(zhì)量非常之差，無法觀看壓縮模型信源編碼器信道編碼器信道解碼器信源解碼器信道EncoderDecoder輸入圖像f^(x,y)RemovesinputredundanciesIncreasesthenoiseimmunity編碼器信息理論（一）、信源空間概述

1、信息：事物運動狀態(tài)或存在方式的不確定性的描述；

2、信源空間：隨機符號及其出現(xiàn)概率的空間；

3、信源的分類：

（1）、連續(xù)信源—離散信源—混合信源；

（2）、無記憶信源—有記憶信源（相關(guān)信源）—有限長度記憶信源（Markov信源）（二）、信息的度量

1、信息公理

（1）、信息由不確定性程度進行度量；

確定事務的信息量為零。

（2）、不確定性程度越高信息量越大；

（3）、相互獨立性與信息量可加性；

獨立事務的聯(lián)合信息等于兩個獨立事務的信息總和。

滿足上述公理的函數(shù)為：2、離散無記憶信源（DNMS）的信息量度量：

（1）信源符號的自信息量定義為：(a)、非負性；(b)、信息量的單位：底為2時——單位為：比特（bit）底為e時——單位為：奈特（Nat）底為10時——單位為：哈特（2）、信源平均自信息量（信息熵）

離散無記憶信源A的平均自信息量（信息熵）定義為：3、平均碼字長借助熵的概念可以定義量度任何特定碼的性能的準則，即平均碼字長度。其中βi為灰度級di所對應的碼字長度。的單位也是比特/字符。4、編碼效率編碼符號是在字母集合A={a1,a2,a3,…am}中選取的。假如編碼后形成一個新的等概率的無記憶信源，字母數(shù)為n，則它的最大熵應為logn比特/符號。因此這是一個極限值。假如H(d)/=logn，則可以認為編碼效率已經(jīng)達到100%，假如H(d)/<logn，則可認為編碼效率較低。5、壓縮比壓縮比是衡量數(shù)據(jù)壓縮程度的指標之一。目前常用的壓縮比定義為其中LB為源代碼長度，Ld為壓縮后代碼長度，Pr為壓縮比。壓縮比的物理意義是被壓縮掉的數(shù)據(jù)占據(jù)源數(shù)據(jù)的百分比。當壓縮比Pr接近100%時壓縮效果最志向。6、互信息信源編碼輸出為bk給出的關(guān)于ai的信息量原委為多少呢？為此將引入另外一個信息量度－互信息對給定的兩個離散信源X和Y，Y中事務bk的發(fā)生給出關(guān)于X中事務ai的互信息I(ai:bk)定義為：其中，p(ai|bk)表示信源編碼輸出為bk，估計信源輸入為ai的條件概率。I(ai|bk)稱為條件自信息量，表示在發(fā)覺信源編碼輸出為bk，對信源輸入為ai的不確定性的揣測或知道bk后ai還保留的信息量。I(ai)表示ai的不確定性。兩者值差即為bk解除的ai不確定性的多少。無損壓縮編碼哈夫曼編碼游程編碼無損預料編碼哈夫曼編碼50年頭提出，一種無損的統(tǒng)計編碼方法用變長的碼使冗余量達到最小，用一棵二叉樹來編碼，使常出現(xiàn)的字符用較短的碼表示，不常出現(xiàn)的字符用較長的碼表示。用一個例子來介紹哈夫曼編碼的步驟1、縮減信源符合數(shù)量－將概率從大到小排列，再將兩個概率最小的符號結(jié)合得到1個組合符號，假如剩下的符號多余2個，接著上述過程，直到只剩2個符號為止。給出一組初始信源的概率分布符號a1a2a3a4a5a6概率0.10.40.060.10.040.3初始信源信源的消減步驟符號概率1234a20.40.40.40.40.6a60.30.30.30.30.4a10.10.10.20.3a40.10.10.1a30.060.1a50.0412342、對每個信源賦值－先從(消減到)最小的信源起先，逐步回到初始信源，過程如表所示。對一個只有2個符號的信源，最短長度的二元碼由符號0和1組成，將它們賜予對應最右列2個概率的符號初始信源對消減信源的賦值符號概率碼字1碼字2碼字3碼字4碼字a20.410.410.410.410.60a60.3000.3000.3000.3000.41a10.10110.10110.20100.301a40.101000.101000.1011a30.06010100.10101a50.04010111234哈夫曼編碼效率信源熵為：H=-∑Pilog2Pi=-(0.4log20.4+0.3log20.3+2*0.1log20.1+0.06log20.06+0.04log20.04)=2.14比特/符號平均碼字長度：R=∑βiPi碼字長度R=∑βiPi=0.4×1+0.3×2+0.1×3+0.1×4+0.06×5+0.04×5=2.2比特/符號編碼效率：η=H/R(%)η=H/R=2.14/2.2=0.973=97.3%游程編碼－RLC依據(jù)對各類圖像的統(tǒng)計，發(fā)覺圖像信源中象素的空間相關(guān)性比較強。在經(jīng)過接受和量化形成數(shù)字彩色圖像后，其相鄰象素的相關(guān)性體現(xiàn)在相鄰象素亮度取值變更不大對典型的黑白文本圖像進行分析發(fā)覺，前一象素為白色象素時，當前象素取值為白的條件概率P(W|W)平均在97%以上，而由白象素變?yōu)楹谙笏氐母怕蔖(B|W)僅為3%，類似的，當前一象素為黑，當前象素為黑的條件概率P(B|B)平均為75%，由黑變白的概率P(W|B)僅為25%。對重復出現(xiàn)的字符、字符連續(xù)重復的個數(shù)以及起始位置進行編碼，就能復原該字符串重復字符游程標志游程長度基本RLC結(jié)構(gòu)從RLC基本數(shù)據(jù)占用3個字節(jié)，即只有當重復字符串長度大于24(即連續(xù)有24個象素取值相同)時，才有數(shù)據(jù)壓縮效益。先推斷游程長度，再確定是否運用RLC從根本上講，游程編碼照舊是通過去除圖像象素間的相關(guān)性，來達到數(shù)據(jù)壓縮的目的但是它不僅僅只利用一個相鄰象素的信息，事實上，利用了圖像多個象素間的相關(guān)性，其熵為高階熵數(shù)字傳真壓縮編碼標準二值文本圖像無損預料編碼預料編碼有線性預料和非線性預料兩大類，可以在一幅圖像內(nèi)進行，即所謂的幀內(nèi)預料法，也可以在多幅圖像之間進行，即所謂的幀間預料法。線性預料法通常稱為差值脈沖編碼調(diào)制法(DifferentialPulseCodeModulation),簡稱DPCM相鄰像素間的空域相關(guān)性相鄰幀之間的時域相關(guān)性預料編碼的基本思想：通過僅提取每個象素中的新信息并對它們編碼，來消退象素間的冗余該象素的當前或現(xiàn)實值與預料值的差預測器整數(shù)舍入符號編碼器預測器符號解碼器SS輸入圖像壓縮圖像解壓圖像預測誤差,enfnf^nen+f^n++-fn壓縮圖像預料誤差：en=fn-f^n差組成預料誤差序列預料誤差的熵為信源的高階熵通過預料可以消退相當多的象素間冗余，所以預料誤差的概率密度函數(shù)一般在0點有1個高峰，并且與輸入灰度值分布相比，其方差較小，事實上，預料誤差的概率密度函數(shù)一般用0均值不相關(guān)拉普拉斯概率密度函數(shù)表示pe(e)=有損壓縮有損預料編碼變換編碼有損預料編碼在無損預料編碼系統(tǒng)基礎(chǔ)上，加1個量化器構(gòu)成，如圖所示S量化器符號編碼器預測器SS符號解碼器預測器輸入圖像壓縮圖像壓縮圖像解壓圖像fnf^n-ene.nf.ne.nf^n量化器插在符號編碼器與預料誤差產(chǎn)生處之間，把原來無損編碼器中的整數(shù)舍入模塊吸引進來，它將預料誤差映射進有限個輸出e.n中，e.n確定了有損預料編碼中的壓縮量和失真量為接納量化步驟，須要變更無損編碼器，以使編碼器和解碼器所產(chǎn)生的預料能相等從上圖可以看出，將有損編碼器的預料器放在1個反饋環(huán)中，這個環(huán)的輸入是過去預料和與其相對應的量化誤差的函數(shù)：f.n=e.n+f^n這樣一個閉環(huán)結(jié)構(gòu)，其目的是能防止在解碼器的輸出端產(chǎn)生誤差德爾塔調(diào)制(DM)是1中最簡潔的有損預料編碼方法，其預料器和量化器分別定義為：f^n=af.n-1e.n=+c對en>0-c其它其中a是預料系數(shù)(一般小于等于1)，c是1個正的常數(shù)因為量化器的輸出可用單個位符表示(輸出只有2個值)，所以上圖編碼器中的符號編碼器只用長度固定為1bit的碼，由DM方法得到的碼率是1比特/象素DM編碼示例取上述公式中的a=1和c=6.5。設(shè)輸入序列為{14，15，14，15，13，15，15，14，20，26，27，28，27，27，29，37，47，62，75，77，78，79，80，81，82，82}。編碼起先時，先將第一個輸入象素干脆傳給編碼器。在編碼器和解碼器兩端都建立初始條件f.0=f0=14后，其余的f^，e，e.，和f.可用上述公式計算得到給出DM編碼例子，如表所示輸入編碼器解碼器誤差nff^ee.f.f^f.[f-f.]014－－－14.0－14.00.011514.01.06.520.514.020.5-5.521420.5-6.5-6.514.020.514.00.031514.01.06.520.514.020.5-5.5………………………142920.58.56.527.020.527.02.0153727.010.06.533.527.033.53.5164733.513.56.540.033.540.07.0176240.022.06.546.540.046.515.5187546.528.56.553.046.553.022.0197753.024.06.559.553.059.517.5………………………畫出對應表中的輸入和輸出(f和f.)2點值得指出：1、當c遠大于輸入中的最小變更時，如在n=0到n=7的相對平滑區(qū)域，DM編碼會產(chǎn)生顆粒噪聲。2、當c遠小于輸入中的最大變更時，如在n=14到n=19的相對陡峭區(qū)間，DM編碼會產(chǎn)生斜率過載。顆粒噪聲斜率過載信號f信號f.nf，f.6248101214161820222426對大多數(shù)圖像而言，上述2種狀況分別會導致圖像中目標邊緣發(fā)生模糊和整個圖像產(chǎn)生紋狀表面DCT編碼基于離散余弦變換（DCT）的編碼方法是JPEG算法的核心內(nèi)容。該算法包括兩個不同層次的系統(tǒng)：其一為基本系統(tǒng)(baselinesystem)，接受依次工作方式編碼，只接受哈夫曼編碼，解碼只能存儲兩套哈夫曼表；而另一個增加系統(tǒng)，接受累進工作方式，它是基本系統(tǒng)的擴充和增加，接受了有適應實力的算術(shù)編碼，如圖給出編解碼過程DCT變換－JPEG采樣的是8×8大小的子塊的二維離散余弦變換DCT。在編碼器的輸入端，首先把原始圖像依次地分割成一系列8×8的子塊。設(shè)原始圖像的采樣精度為P位，是無符號整數(shù)，然后把(0,2p-1)范圍的無符號整數(shù)變成[-2p-1,2p-1－1]范圍內(nèi)的有符號整數(shù)，以此作為DCT的輸入。在解碼器輸出端，經(jīng)離散余弦反變換IDCT后又得到一系列8×8塊的圖像數(shù)據(jù)塊，將其數(shù)值范圍由[-2p-1,2p-1－1]再變回[0,2p-1]范圍內(nèi)的無符號整數(shù)，即獲得重構(gòu)的圖像。量化－為了達到壓縮數(shù)據(jù)的目的，對DCT系數(shù)F(u,v)需作量化處理。量化處理是一個多對一的映射，它是造成DCT編解碼信息失真的主要根源。量化有勻整量化和非勻整量化等方法DC系數(shù)的編碼和AC系數(shù)的行程編碼－64個變換系數(shù)經(jīng)量化處理后，坐標u=v=0是直流重量DC系數(shù)，即64個空域圖像采樣值的平均值，相鄰8×8塊之間的DC系數(shù)有強的相關(guān)性。編碼方式如圖所示。在JPEG中對DC系數(shù)采樣DPCM編碼，其余63個AC溝通系數(shù)采樣行程編碼熵編碼-為了進一步達到壓縮數(shù)據(jù)的目的，須要對DC碼和AC行程編碼的碼字再作基于統(tǒng)計特性的熵編碼。在JPEG中建議采樣兩種熵編碼方法，即哈夫曼編碼和自適應二進制算術(shù)編碼圖像壓縮標準二值圖像壓縮標準靜止圖像壓縮標準序列圖像壓縮標準二值圖像壓縮標準G3和G4－由CCITT國家電話電報詢問委員會(consultativecommitteeoftheinternationaltelephoneandtelegraph)的兩個小組(Group3和Group4)負責制定的，最初為傳真應用而設(shè)計現(xiàn)在稱為ITU(internationaltelecommunicationunion)JBIG(jointbilevelimaginggroup)－這個標準是由ISO和CCITT兩個組織的二值圖聯(lián)合組預1991年制定的。非自適應編碼方式通過8組具有代表性的“試驗”圖來評判打印文字、幾種語言手寫文字、線繪圖JBIG的目標之一就是接受1種自適應技術(shù)，以解決這個問題。另外也想使壓縮方法可用于與上述8幅不同類型的圖，以及漸進的傳輸與重建應用G3和G4是非自適應技術(shù)的，所以對半調(diào)灰度圖像編碼是常產(chǎn)生擴展的效果(而不是壓縮)。接受自適應技術(shù)，其編碼效率比G3和G4要高靜止圖像壓縮標準JPEG(jointpictureexpertgroup)－對靜止灰度或彩色圖像的壓縮，由上述2個組織的灰度圖聯(lián)合專家制定，于1991年起先運用的，事實上定義了三種編碼系統(tǒng)(1)基于DCT地有損壓縮編碼基本系統(tǒng)，可用于絕大多數(shù)壓縮應用場合(2)用于高壓縮比、高精度或漸進重建應用的擴展編碼系統(tǒng)(3)用于無失真應用場合的無損系統(tǒng)圖像應用系統(tǒng)想與JPEG兼容，必需支持JPEG基本系統(tǒng)，但另一方面，JPEG并沒有規(guī)定文件格式、圖像辨別率或所用彩色空間模型，這樣它就有可能適用于不同應用場合對錄像機質(zhì)量的靜止圖像的壓縮率一般可達25：1JPEG的基本系統(tǒng)：源圖像DCT變換量化器熵編碼器壓縮圖像編碼器輸入和輸出數(shù)據(jù)的精度都是8bit，但量化DCT值的精度是11bitJPEG2000-于1997年起先征集提案的－接受小波子帶編碼作為核心編碼方案相比JPEG而言，不僅能提高對圖像的壓縮質(zhì)量，尤其是低碼率時的壓縮質(zhì)量，而且還將得到很多增加了的功能，包括依據(jù)圖像質(zhì)量、視覺感受和辨別率進行漸進傳輸，對碼流的隨機存取和處理，開放結(jié)構(gòu)、向下兼容等應用范圍:

*文獻圖像*醫(yī)療成像

*傳真技術(shù)*平安像機

*互連網(wǎng)*遠程傳感

*掃描儀*數(shù)字化圖書館

*電子攝影序列圖像壓縮標準兩大系列：

1、國際電信聯(lián)盟ITU（CCITT）

H.26X系列

主要在通信傳輸領(lǐng)域內(nèi)應用

2、國際標準化組織ISO

MPEG-X系列

應用范圍很寬－視頻圖像壓縮編解碼H.261由CCITT于1990年制定的序列灰度圖像壓縮標準，主要為電視會議等應用而制定，也稱為P×64標準(P=1,2,…30)，其碼流可為64,128,…1920kbit/s。它可允許帶寬為1.544Mbit/s以小于150ms的延遲傳輸運動視頻它將前面介紹的基于DCT的壓縮方法進行了擴展，并將削減幀間冗余的方法也包含量進來。包含兩個最基本的步驟：(1)對序列中的第一幀(或某參考幀)圖用類似于JPEG中用的DCT壓縮，以削減幀內(nèi)冗余度(2)估計目標的運動(通過計算當前幀與下1幀間的相關(guān))，以確定如何壓縮下1幀，以削減幀間冗余度∑DCT量化器變長編碼緩沖存儲IDCT反量化∑濾波器運動補償幀存儲器運動估值圖像輸入編碼輸出量化間隔值幀間預測誤差運動矢量重建圖像數(shù)據(jù)量化后的幀間預測誤差幀間預測值H.262標準

ITU為基于ATM寬帶網(wǎng)絡(luò)的視頻會議而制定的，與ISO的MPEG-2標準完全一樣。

H.263標準－同H.261編碼相同，進行一些改進1、半像素的運動補償－可提高運動補償算法塊匹配的預料性能

2、改進的游程編碼

3、減小一般性的比特開銷

4、增加了可選模式

5、算術(shù)編碼替代游程編碼或Huffman編碼

6、增加的運動預料

7、雙向預料代替了單純的單向預料MPEG-1由上述2個組織聯(lián)合的運動圖像專家組(movingpictureexpertgroupMPEG)于1992年制定的第一個運動圖像壓縮標準。它是一種消遣質(zhì)量的視頻壓縮標準，主要用于數(shù)字媒體上壓縮圖像數(shù)據(jù)的儲存和提取。如CDROM、數(shù)字錄音帶、計算機硬盤、可擦寫光盤等這個標準并沒有指定具體的編碼程序，而只是確定了1個標準的編碼碼流和對應的解碼器，碼流速率不超過1.5Mb/s與H.261比較，MPEG-1的新特點：

1、隨機存儲

通過加入隨機訪問點來實現(xiàn)－要求在允許的時間內(nèi)對隨意一幀圖像進

人人文庫> 全部分類> 應用文書 > 辦公表格

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

第6章-圖像壓縮

文檔簡介

溫馨提示

最新文檔

評論

第6章-圖像壓縮

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔