圖像處理第8章 圖像編碼基礎_第1頁
圖像處理第8章 圖像編碼基礎_第2頁
圖像處理第8章 圖像編碼基礎_第3頁
圖像處理第8章 圖像編碼基礎_第4頁
圖像處理第8章 圖像編碼基礎_第5頁
已閱讀5頁,還剩38頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第三單元圖像編碼本單元包括3章,分別為:

●第8章圖像編碼基礎

●第9章圖像變換編碼

●第10章其他圖像編碼方法

圖象編碼的目的是在保證一定視覺質(zhì)量的前提下減少數(shù)據(jù)量(從而也減少圖象傳輸所需的時間),這也可看作使用較少的數(shù)據(jù)量來獲得較好的視覺質(zhì)量。圖象編碼以信息論為基礎,以壓縮數(shù)據(jù)量為主要目的,所以圖象編碼也常被稱為圖象壓縮。本章主要內(nèi)容圖像壓縮原理編碼定理變長編碼位平面編碼第8章圖像編碼基礎8.1圖像壓縮原理{在保持圖象中的原有信息或讓信息損失滿足應用要求的基礎上盡可能地減少數(shù)據(jù)量}8.1.1數(shù)據(jù)冗余數(shù)據(jù)冗余:表達了無用的信息;表達了已表達的信息;表達沒有最優(yōu)而多使用的信息。數(shù)據(jù)冗余的定量描述。設n1、n2分別代表表達相同信息的兩個數(shù)據(jù)集合中的信息載體單位的個數(shù),那么第1個數(shù)據(jù)集合相對于第2個數(shù)據(jù)集合的相對數(shù)據(jù)冗余:RD=1-1/CR其中CR稱為壓縮率:CR=n1/n2CR和RD分別在開區(qū)間(0,∞)和(-∞,1)之間取值。圖像中的數(shù)據(jù)冗余主要有三種:①心理視覺冗余(與主觀感覺有關(guān));②像素間冗余(空間冗余,幾何冗余);③編碼冗余(與灰度分布的概率特性有關(guān))。1、心理視覺冗余眼睛并不是對所有信息有相同的敏感度。對于那些視覺過程中不重要的信息可認為是心理視覺上的冗余,去掉這些信息不會明顯降低所感受到的圖像質(zhì)量。心理視覺冗余與人觀察圖像的方式有關(guān),這個因人而異,因應用要求而異。1、心理視覺冗余心理視覺冗余與實際的視覺信息相聯(lián)系,只有對正常視感覺過程不必要的信息才可能被去除掉,該過程能導致定量信息的損失,因此也稱為量化,屬不可逆操作,用于數(shù)據(jù)壓縮導致有損壓縮。心理視覺冗余的存在與人觀察圖像的方式有關(guān),人在觀察圖像時會尋找某些比較明顯的目標,而不是定量的考慮圖像中每一個像素的亮度,通過在大腦中分析這些特征并與先驗知識結(jié)合以完成對圖像的認知和解釋過程,因為每個人所具有的先驗知識不同,對同一幅圖的心理視覺冗余也就因人而異。2、像素間冗余圖8.1.1兩幅圖像和他們沿同一行的自相關(guān)系數(shù)曲線像素間冗余:一種與圖像像素間相關(guān)性直接聯(lián)系著的數(shù)據(jù)冗余。像素間冗余常稱為空間冗余或集合冗余。圖像(a)中各像素的值可以比較方便地由其鄰近像素的值預測出來,每個像素所攜帶的獨立信息相對較少。換句話說,單個像素對圖像的視覺貢獻有很多冗余,因為其灰度常能借助其鄰近像素的值來推斷。連續(xù)序列圖像或視頻中,考慮時間因素,像素間冗余也稱為時間冗余或幀間冗余。abcd規(guī)則

冗余大不規(guī)則冗余小3、編碼冗余編碼:建立碼本來表達數(shù)據(jù);碼本:用來表達一定量的信息或一組事件所需的一系列符號(如字母、數(shù)字等);碼字:對每個信息或事件所賦的碼符號序列;碼字的長度(碼長,字長):每個碼字里的符號個數(shù)。圖象中每個灰度值sk(對灰度編碼)出現(xiàn)的概率:

式中,L為灰度級數(shù),nk是第k個灰度級出現(xiàn)的次數(shù),N是圖像中的像素總個數(shù)。不同灰度出現(xiàn)的概率不同。每個像素所需的平均比特數(shù):

l(sk)表示sk的每個數(shù)值的比特數(shù),由上式可知,每個像素所需比特數(shù)是每個灰度的像素數(shù)與用來表示這些灰度值所需比特數(shù)的乘積的總和。所以,如能用較少的比特數(shù)來表示出現(xiàn)概率較大的灰度級,而用較多的比特數(shù)來表示出現(xiàn)概率較小的灰度級就能達到減少平均比特的效果。如果編碼所用碼本不能使上式達到最小,就說明存在編碼冗余,一般,如果編碼時沒有充分利用編碼對象的概率特性就會產(chǎn)生編碼冗余。8.1.2圖像編解碼圖8.1.2圖像編解碼過程圖像編解碼過程:圖像編解碼系統(tǒng):圖8.1.4編碼器和解碼器及其模塊8.1.3圖像保真度和質(zhì)量圖象保真度描述解碼圖象相對于原始圖象的偏離程度,是對信息損失的一種測度。主要分為兩大類:①客觀保真度(用編碼輸入圖與解碼輸出圖的某個確定函數(shù)表示損失的信息量,便于計算或測量)②主觀保真度(主觀測量圖象的質(zhì)量,因人而異,應用不方便)1、客觀保真度(用編碼輸入圖與解碼輸出圖的某個確定函數(shù)表示損失的信息量,便于計算或測量)點誤差:圖誤差:均方根誤差:均方信噪比:兩幅圖尺寸均為M×N歸一化信噪比,令:可得到峰值信噪比:用分貝(dB)表示歸一化,則有:2、主觀保真度(主觀測量圖象的質(zhì)量,因人而異,應用不方便)很多解壓圖象最終是供人看的,在這種情況下,用主觀的檢測常更合適。主觀保真度可分為3種:①損傷檢驗(觀察者對圖象根據(jù)其損傷程度打分)②質(zhì)量檢驗(觀察者對圖象根據(jù)其質(zhì)量排序)③對比測試(觀察者對圖象進行兩兩比較)8.2編碼定理{信息論是圖像編碼的基礎}8.2.1信息單位和信源描述信息量:概率為P(E)的隨機事件E的信息量:I(E)稱為E的自信息(隨概率增加而減少),特例:P(E)=1(即事件總發(fā)生),那么I(E)

=0。信息的單位:比特(log以2為底)1個比特:即2個相等可能性的事件之一發(fā)生信源:一幅圖各像素的灰度值可看作一個具有隨機輸出的信源。信源符號集:S={s1,s2,…,sj},sj稱為信源符號信源產(chǎn)生符號sj這個事件的概率是P(sj)概率矢量:u=[P(s1)P(s2)…P(sj

)]T,用(S,u)可以完全描述信源。信源平均信息H(u):H(u)稱為信源的熵,它定義了觀察到單個信源符號輸出時所獲得的平均信息量,若信源各符號概率相等則熵達到最大值,此時信源提供最大可能的每信源符號平均信息量編碼輸出:因為信源的輸出時一個離散隨機變量,所以編碼后的輸出也是一個離散隨機變量,它也是一個有限或無窮可數(shù)的符號集合中得到的。編碼輸出符號集:T={t1,t2,…,tK}概率矢量:v=[P(t1)P(t2)…P(tK

)]T,用(T,v)可以完全描述編碼輸出。編碼輸出的概率P(tk

)和信源u的概率分布:

式中,P(tksj

)是在信源符號sj產(chǎn)生條件下得到編碼輸出符號tk的概率。將條件概率放入一個K×

J的傳遞矩陣Q:編碼輸出符號集的概率分布:v=Qu互信息:對應每個tk有一個條件熵函數(shù):

H(u|tk)對所有tk的期望值:編碼輸出符號tk的條件下信源符號sj產(chǎn)生的概率

H(u)和H(u|tk)的差是獲得單個輸出符號而接收到的平均信息,也稱u,v的互信息:表明互信息是U和Q的函數(shù),當輸入和輸出符號統(tǒng)計獨立時,I(u,v)取得最小值0.8.2.2無失真編碼定理無失真編碼定理給出在沒有失真的條件下(無損壓縮),編碼表達每個信源符號時可達到的最小平均碼字長度。信源輸出一個塊(組)隨機變量,信源產(chǎn)生的概率,它與單符號概率P(sj)的關(guān)系為:信源的熵:由此可見,產(chǎn)生塊隨機變量的信源的熵是對應單符號信源的n倍。它也可看作是單符號信源的n階擴展。P(σi)=P(σj1)P(σj2)…P(σjn)概率矢量:u'

=[P(σ1)P(σ2)…P(σJn)]T用長度為的整數(shù)碼字來對編碼,滿足:取極限:各式乘以p(σi)并對所有i求和H(u)是L'avg/n的下限,所以效率可定義為:效率總是小于等于1的,所以也可以說無損信源編碼的平均碼字長度可接近信源的熵,但不能小于信源的熵。這是無損信源壓縮的極限。8.2.3率失真編碼定理

率失真編碼定理簡稱率失真定理,也稱信源編碼定理。該定理將對固定字長編碼方案的失真(重建誤差)D與編碼所用的數(shù)據(jù)率(如每象素比特數(shù))R聯(lián)系在一起。它給出由于壓縮而產(chǎn)生的平均誤差被限制在某個最大允許水平D時的最小的R。用重建的均方誤差作為失真度:重建誤差的熵有如下的上限:率失真函數(shù):因為信源是隨機的,所以失真也是一個隨機變量。失真的平均值d(Q)可表示為:當且僅當Q對應的平均失真小于或等于D時,可以說編碼解碼過程的允許失真是D。所有允許失真為D的編碼解碼過程的集合是:因而可進一步定義率失真函數(shù):上式給出了在平均失真小于或等于D時,信源可以傳送給編碼輸出的最小平均信息量為計算R(D),可通過合理選擇Q以求取I(u,v)的最小值,此過程要滿足3個約束條件:(1)Q的元素必須是正的(2)Q的任一列之和為1(3)允許最大可能的失真,就可獲得最小的數(shù)據(jù)率例8.2.3擴展編碼的率失真函數(shù)特點:R(D)總是正的,單減的在[0,Dmax]區(qū)間下凸R(D)在D<0時不存在D≥Dmax時有R(D)=08.3變長編碼

變長編碼是一種統(tǒng)計編碼壓縮方式,可減少編碼冗余。變長編碼通過非配給出現(xiàn)頻率較高的符號以較短的碼字而出現(xiàn)頻率較低的符號以較長的碼字來降低平均比特率。變長編碼是一種信息保存型編碼方式。8.3.1哥倫布編碼哥倫布編碼是一種比較簡單的變長編碼方法。考慮像素間的相關(guān)性,相鄰像素灰度值的差將會呈現(xiàn)小值出現(xiàn)多、大直出現(xiàn)少的特點,這種情況比較適合哥倫布編碼方法。給定一個非負整數(shù)n和一個正整數(shù)除數(shù)m,n相對于m的哥倫布碼記為Gm(n),它是對商

的一元碼和對余數(shù)nmodm的二值表達的組合。Gm(n)可根據(jù)以下3個步驟計算{對照例8.3.1}(1)構(gòu)建商的一元碼(整數(shù)I一元碼定義為I個1后面跟個0)(2)令c=2k

–m,r=nmodm,計算截斷的r':(3)將上兩步驟的結(jié)果拼接起來得到Gm(n)。階為k的指數(shù)哥倫布碼Gk

exp(n)采用以下3個步驟{對照例8.3.2}:(1)確定滿足下式的整數(shù)i≥0:并構(gòu)建i的一元碼。(2)計算下式的二值表達:并將其截斷到最低的k+i比特。(3)將上兩個步驟的結(jié)果拼接起來得到8.3.2哈夫曼編碼

哈夫曼編碼是消除編碼冗余最常用的技術(shù)。當對信源符號逐個編碼時,哈夫曼編碼能給出最短的碼字。根據(jù)無失真編碼定理,哈夫曼編碼方式對固定階數(shù)的信源是最優(yōu)的。哈夫曼編碼過程主要分為兩個步驟:縮減信源符號數(shù)量:

將信源符號按出現(xiàn)概率從大到小排列,為消減信源,先將概率最小的兩個符號結(jié)合得到一個組合符號。如果剩下的符號多余兩個,則繼續(xù)以上過程直到信源中只有兩個符號為止。(2)

對每個信源符號賦值從(消減到)最小的信源開始,逐步回到初始信源(參照圖8.3.2)圖8.3.2哈夫曼賦值過程圖解最終得到的碼字見圖中“碼字”一列所示。對一個只有兩個符號的信源,最短長度的二元碼由符號0和1組成,將他們賦予對應最右列兩個概率的符號,這里賦予0或1完全是隨機的,不影響結(jié)果,由于對應概率為0.6的符號是由左邊兩個符號結(jié)合而成,所以先將0賦給這兩個符號,然后再隨機地將0和1接在后面以區(qū)分這兩個符號。8.3.3香農(nóng)-法諾編碼

香農(nóng)-法諾編碼碼字中的0和1是獨立的,并且基本上等概率出現(xiàn)。它與哈夫曼編碼一樣都是所謂塊(組)碼,將每個信源符號映射成一組固定次序的碼符號,這樣在編碼時可以一次一個符號,也都需要知道各個信源號產(chǎn)生的概率。其主要步驟為:(1)源號依從到小列;(2)將信源符號分成概率之和相接近的兩部分;(3)分別給兩部分的信源符號組合進行賦值(分別賦予0和1,也可1和0);(4)如果兩部分均只有一個信源符號,編碼結(jié)束,否則返回(2)繼續(xù)進行。8.3.4算術(shù)編碼算術(shù)編碼是一種從整個符號序列出發(fā),采用遞推形式連續(xù)編碼的方法。將需編碼的所有符號統(tǒng)一考慮,建立整個符號序列與一個實數(shù)區(qū)間的映射關(guān)系,算術(shù)編碼的特點:1、只需用到加法和移位運算(算術(shù));2、從整個符號序列出發(fā)采用遞推形式連續(xù)編碼;3、一個算術(shù)碼字要賦給整個信源符號序列;4、碼字本身確定0和1之間的一個實數(shù)區(qū)間;5、源符號和碼字間的一一對應關(guān)系并不存在,算術(shù)碼不是塊碼編碼來自1個4-符號信源{s1,s2,s3,s4}組成的符號序列:s1s2s3s3s4(參見下圖)編碼開始時符號占據(jù)整個區(qū)間[0,1],根據(jù)各個信源符號概率分成四段,第一個符號s1對應[0,0.2],編碼時將這個區(qū)間擴展成整個高度,再將此區(qū)間根據(jù)各信源符號概率擴展成四段,然后對序列中第二個符號s2編碼,同理依次到最后一個符號編碼結(jié)束,最終得到一個區(qū)間[0.06752,0.0688],任何一個該區(qū)間的實數(shù)都可代表這個區(qū)間,從而代表對應的符號序列。圖8.3.5算術(shù)編碼過程圖解8.4位平面編碼

位平面編碼先將許多灰度值圖像分解成一系列二值圖,然后對二值圖再用二元壓縮方法進行壓縮。它不僅能消除或減少編碼冗余也能消除或減少圖象中的象素間冗余。8.4.1位平面的分解基本的位平面分解方法主要有:二值分解和灰度分解。1、二值分解對一幅用多個比特表示其灰度值的圖像來說,其中的每個比特可看作表示了一個二值的平面,也稱位平面(簡稱位面)圖8.4.1圖像的位面表示來表示具有m比特灰度級的圖像中像素的灰度值。把一幅灰度圖分解成一系列二值圖集合的一種簡單方法就是把上述多項式的m個系數(shù)分別分到m個1比特的位面中,稱為二值分解。這個分解方法的一個固有缺點是像素點灰度值的微小變化有可能對平面的復雜度產(chǎn)生明顯影響。可用如下多項式:對一幅8比特灰度級圖像,當代表一個像素灰度值字節(jié)的最高比特為1時,該像素的灰度值必定大于或等于128,而當這個像素的最高比特為0時,該像素的灰度值必定小于或等于127.2、灰度碼分解

減少小灰度值變化影響的位面分解法,先用一個m比特的灰度碼表示圖像。m比特的灰度碼可由下式計算:

其中⊕代表異或操作。按上述方式分解為灰度碼分解,其結(jié)果仍是二值的位面。這樣得到的碼的獨特性質(zhì)是相連的碼字只有一個比特的區(qū)別,像素點灰度值的小變化就不易影響所有位面。8.4.2位平面的編碼位平面分解后得到的是二值圖,即像素值只有0或1兩種。另外,像素值為0或1的兩種像素在平面上是互補的。這些特性都可用來幫助編碼。1、常數(shù)塊編碼(CAC)

用專門的碼字表達全是0或1的連通區(qū)域,將圖象分成全黑,全白或混合的m×n尺寸塊出現(xiàn)頻率最高的類賦予1bit碼字0,其它兩類分別賦予2bit碼字10和11。壓縮:原需用mn比特表示的常數(shù)塊現(xiàn)在只用1bit或2bit碼字表示當需壓縮的圖像主要由白色部分組成時,更簡單的方法是將白色區(qū)塊編為0,而將其他塊區(qū)域都用1街上該塊的位模式編碼。這種方法為跳躍白色塊(WBS).2、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論