圖像信息處理技術(shù)_第1頁
圖像信息處理技術(shù)_第2頁
圖像信息處理技術(shù)_第3頁
圖像信息處理技術(shù)_第4頁
圖像信息處理技術(shù)_第5頁
已閱讀5頁,還剩433頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

關(guān)于圖像信息處理技術(shù)第1頁,課件共438頁,創(chuàng)作于2023年2月4.1圖像信號概述

圖像是一種可視化的信息,圖像信號是圖像信息的理論描述方法,圖像信號按其內(nèi)容變化與時間的關(guān)系來分,主要包括靜態(tài)圖像和動態(tài)圖像兩種。靜態(tài)圖像其信息密度隨空間分布,且相對時間為常量;動態(tài)圖像也稱時變圖像,其空間密度特性是隨時間而變化的。人們經(jīng)常用靜態(tài)圖像的一個時間序列來表示一個動態(tài)圖像。第2頁,課件共438頁,創(chuàng)作于2023年2月

圖像分類還可以按其他方式進(jìn)行:如按其亮度等級的不同可分為二值圖像和灰度圖像;按其色調(diào)的不同可分為黑白圖像和彩色圖像;按其所占空間的維數(shù)不同可分為平面的二維圖像和立體的三維圖像等等。圖像信號的記錄、存儲和傳輸可以采用模擬方式或數(shù)字方式。傳統(tǒng)的方式為模擬方式,例如,目前我們在電視上所見到的圖像就是以一種模擬電信號的形式來記錄,并依靠模擬調(diào)幅的手段在空間傳播的。將模擬圖像信號經(jīng)A/D變換后就得到數(shù)字圖像信號,數(shù)字圖像信號便于進(jìn)行各種處理,例如最常見的壓縮編碼處理就是在此基礎(chǔ)上完成的。本書介紹的圖像信息處理技術(shù)就是針對數(shù)字圖像信號的。第3頁,課件共438頁,創(chuàng)作于2023年2月1.彩色圖像信號的分量表示對于黑白圖像信號,每個像素點(diǎn)用灰度級來表示,若用數(shù)字表示一個像素點(diǎn)的灰度,有8比特就夠了,因?yàn)槿搜蹖叶鹊淖畲蠓直媪?6。對于彩色視頻信號(例如常見的彩色電視信號)均基于三基色原理,每個像素點(diǎn)由紅(R)、綠(G)、藍(lán)(B)三基色混合而成。若三個基色均用8比特來表示,則每個像素點(diǎn)就需要24比特,由于構(gòu)成一幅彩色圖像需要大量的像素點(diǎn),因此,圖像信號采樣、量化后的數(shù)據(jù)量就相當(dāng)大,不便于傳輸和存儲。第4頁,課件共438頁,創(chuàng)作于2023年2月

為了解決此問題,人們找到了相應(yīng)的解決方法:利用人的視覺特性降低彩色圖像的數(shù)據(jù)量,這種方法往往把RGB空間表示的彩色圖像變換到其他彩色空間,每一種彩色空間都產(chǎn)生一種亮度分量和兩種色度分量信號。常用的彩色空間表示法有YUV、YIQ和YCbCr等。第5頁,課件共438頁,創(chuàng)作于2023年2月

(1)YUV彩色空間。通常我們用彩色攝像機(jī)來獲取圖像信息,攝像機(jī)把彩色圖像信號經(jīng)過分色棱鏡分成R0、G0、B0三個分量信號,分別經(jīng)過放大和r校正得到RGB,再經(jīng)過矩陣變換電路得到亮度信號Y和色差信號U、V,其中亮度信號表示了單位面積上反射光線的強(qiáng)度,而色差信號(所謂色差信號,就是指基色信號中的三個分量信號R、G、B與亮度信號之差)決定了彩色圖像信號的色調(diào)。最后發(fā)送端將Y、U、V三個信號進(jìn)行編碼,用同一信道發(fā)送出去,這就是在PAL彩色電視制式中使用的YUV彩色空間。YUV與RGB彩色空間變換的對應(yīng)關(guān)系如式(4.1-1)所示。第6頁,課件共438頁,創(chuàng)作于2023年2月YUV彩色空間的一個優(yōu)點(diǎn)是,它的亮度信號Y和色差信號U、V是相互獨(dú)立的,即Y信號分量構(gòu)成的黑白灰度圖與用U、V兩個色彩分量信號構(gòu)成的兩幅單色圖是相互獨(dú)立的。因?yàn)閅UV是獨(dú)立的,所以可以對這些單色圖分別進(jìn)行編碼。此外,利用YUV之間的獨(dú)立性解決了彩色電視機(jī)與黑白電視機(jī)的兼容問題。

(4.1-1)第7頁,課件共438頁,創(chuàng)作于2023年2月YUV表示法的另一個優(yōu)點(diǎn)是,可以利用人眼的視覺特性來降低數(shù)字彩色圖像的數(shù)據(jù)量。人眼對彩色圖像細(xì)節(jié)的分辨能力比對黑白圖像細(xì)節(jié)的分辨能力低得多,因此就可以降低彩色分量的分辨率而不會明顯影響圖像質(zhì)量,即可以把幾個相同像素不同的色彩值當(dāng)做相同的色彩值來處理(即大面積著色原理),從而減少了所需的數(shù)據(jù)量。在PAL彩色電視制式中,亮度信號的帶寬為4.43MHz,用以保證足夠的清晰度,而把色差信號的帶寬壓縮為1.3MHz,達(dá)到了減少帶寬的目的。第8頁,課件共438頁,創(chuàng)作于2023年2月

在數(shù)字圖像處理的實(shí)際操作中,就是對亮度信號Y和色差信號U、V分別采用不同的采樣頻率。目前常用的Y、U、V采樣頻率的比例有4∶2∶2和4∶1∶1,當(dāng)然,根據(jù)要求的不同,還可以采用其他比例。例如要存儲R∶G∶B=8∶8∶8的彩色圖像,即R、G、B分量都用8比特表示,圖像的大小為640×480像素,那么所需要的存儲容量為640×480×3×8/8=921600字節(jié);如果用Y∶U∶V=4∶1∶1來表示同一幅彩色圖像,對于亮度信號Y,每個像素仍用8比特表示,而對于色差信號U、V,每4個像素用8比特表示,則存儲量變?yōu)?40×480×(8+4)/8=460800字節(jié)。盡管數(shù)據(jù)量減少了一半,但人眼察覺不出有明顯變化。第9頁,課件共438頁,創(chuàng)作于2023年2月

(2)YIQ彩色空間。在NTSC彩色電視制式中選用YIQ彩色空間,其中Y表示亮度,I、Q是兩個彩色分量。I、Q與U、V是不相同的。人眼的彩色視覺特性表明,人眼對紅、黃之間顏色變化的分辨能力最強(qiáng);而對藍(lán)、紫之間顏色變化的分辨能力最弱。在YIQ彩色空間中,色彩信號I表示人眼最敏感的色軸,Q表示人眼最不敏感的色軸。在NTSC制式中,傳送人眼分辨能力較強(qiáng)的I信號時,用較寬的頻帶(1.3~1.5MHz);而傳送人眼分辨能力較弱的Q信號時,用較窄的頻帶(0.5MHz)。YIQ與RGB彩色空間變換的對應(yīng)關(guān)系如式(4.1-2)所示。第10頁,課件共438頁,創(chuàng)作于2023年2月(4.1-2)第11頁,課件共438頁,創(chuàng)作于2023年2月

(3)YCbCr彩色空間。YCbCr彩色空間是由ITU-R(國際電聯(lián)無線標(biāo)準(zhǔn)部,原國際無線電咨詢委員會CCIR)制定的彩色空間。按照CCIR601-2標(biāo)準(zhǔn),將非線性的RGB信號編碼成YCbCr,編碼過程開始是先采用符合SMPTE-CRGB(它定義了三種熒光粉,即一種參考白光,應(yīng)用于演播室監(jiān)視器及電視接收機(jī)標(biāo)準(zhǔn)的RGB)的基色作為r校正信號。第12頁,課件共438頁,創(chuàng)作于2023年2月

非線性RGB信號很容易與一個常量矩陣相乘而得到亮度信號Y和兩個色差信號Cb、Cr。YCbCr通常在圖像壓縮時作為彩色空間,而在通信中是一種非正式標(biāo)準(zhǔn)。YCbCr與RGB彩色空間變換的對應(yīng)關(guān)系如式(4.1-3)所示,可以看到:數(shù)字域中的彩色空間變換與模擬域中的彩色空間變換是不同的。(4.1-3)第13頁,課件共438頁,創(chuàng)作于2023年2月2.彩色圖像信號的分量編碼通過圖像信號的表示方法的討論可以看到:對于彩色圖像信號數(shù)字壓縮編碼,可以采用兩種不同的編解碼方案。一種是復(fù)合編碼,它直接對復(fù)合圖像信號進(jìn)行采樣、編碼和傳輸;另一種是分量編碼,它首先把復(fù)合圖像中的亮度和色度信號分離出來,然后分別進(jìn)行取樣、編碼和傳輸。目前分量編碼已經(jīng)成為圖像信號壓縮的主流,在20世紀(jì)90年代以來頒布的一系列圖像壓縮國際標(biāo)準(zhǔn)中均采用分量編碼方案。以YUV彩色空間為例,分量編碼系統(tǒng)的基本框圖如圖4.1-1所示,其中對亮度信號Y使用較高的采樣頻率,對色差信號U、V則使用較低的采樣頻率。

第14頁,課件共438頁,創(chuàng)作于2023年2月圖4.1-1彩色圖像信號分量編碼系統(tǒng)的基本框圖第15頁,課件共438頁,創(chuàng)作于2023年2月4.2圖像信號數(shù)字化

圖像信號數(shù)字化與音頻數(shù)字化一樣主要包括兩方面的內(nèi)容:取樣和量化。圖像在空間上的離散化稱為取樣,即使空間上連續(xù)變化的圖像離散化,也就是用空間上部分點(diǎn)的灰度值來表示圖像,這些點(diǎn)稱為樣點(diǎn)(或像素,像元,樣本)。一幅圖像應(yīng)取多少樣點(diǎn)呢?其約束條件是:由這些樣點(diǎn)采用某種方法能夠正確重建原圖像。第16頁,課件共438頁,創(chuàng)作于2023年2月

取樣的方法有兩類:一類是直接對表示圖像的二維函數(shù)值進(jìn)行取樣,即讀取各離散點(diǎn)上的信號值,所得結(jié)果就是一個樣點(diǎn)值陣列,所以也稱為點(diǎn)陣取樣;另一類是先將圖像函數(shù)進(jìn)行正交變換,用其變換系數(shù)作為取樣值,故稱為正交系數(shù)取樣。對樣點(diǎn)灰度級值的離散化過程稱為量化,也就是對每個樣點(diǎn)值數(shù)字化,使其和有限個可能電平數(shù)中的一個對應(yīng),即使圖像的灰度級值離散化。量化也可分為兩種:一種是將樣點(diǎn)灰度級值等間隔分檔取整,稱為均勻量化;另一種是將樣點(diǎn)灰度級值不等間隔分檔取整,稱為非均勻量化。第17頁,課件共438頁,創(chuàng)作于2023年2月4.2.1取樣點(diǎn)數(shù)和量化級數(shù)的選取假定一幅圖像取M×N個樣點(diǎn),對樣點(diǎn)值進(jìn)行Q級分檔取整。那么對M,N和Q如何取值呢?首先,M,N,Q一般總是取2的整數(shù)次冪,如Q=2b,b為正整數(shù),通常稱為對圖像進(jìn)行b比特量化,M、N可以相等,也可以不相等。若取相等,則圖像距陣為方陣,分析運(yùn)算方便一些。其次,關(guān)于M、N和b(或Q)數(shù)值大小的確定。對b來講,取值越大,重建圖像失真越小。若要完全不失真地重建原圖像,則b必須取無窮大,否則一定存在失真,即所謂的量化誤差。第18頁,課件共438頁,創(chuàng)作于2023年2月

一般供人眼觀察的圖像,由于人眼對灰度分辨能力有限,用5~8比特量化即可。對M×N的取值主要依據(jù)取樣的約束條件。也就是在M×N大到滿足取樣定理的情況下,重建圖像就不會產(chǎn)生失真,否則就會因取樣點(diǎn)數(shù)不夠而產(chǎn)生所謂混淆失真。為了減少表示圖像的比特?cái)?shù),應(yīng)取M×N點(diǎn)數(shù)剛好滿足取樣定理。這種狀態(tài)的取樣即為奈奎斯特取樣。M×N常用的尺寸有512×512,256×256,64×64,32×32等。第19頁,課件共438頁,創(chuàng)作于2023年2月

再次,在實(shí)際應(yīng)用中,如果允許表示圖像的總比特?cái)?shù)M×N×b給定,對M×N和b的分配往往是根據(jù)圖像的內(nèi)容和應(yīng)用要求以及系統(tǒng)本身的技術(shù)指標(biāo)來選定的。例如,若圖像中有大面積灰度變化緩慢的平滑區(qū)域如人圖像的特寫照片等,則M×N取樣點(diǎn)可以少些,而量化比特?cái)?shù)b多些,這樣可使重建圖像灰度層次多些。若b太少,在圖像平滑區(qū)往往會出現(xiàn)“假輪廓”。第20頁,課件共438頁,創(chuàng)作于2023年2月

反之,對于復(fù)雜景物圖像,如群眾場面的照片等,量化比特?cái)?shù)b可以少些,而取樣點(diǎn)數(shù)M×N要多些,這樣就不會丟失圖像的細(xì)節(jié)。究竟M×N和b如何組合才能獲得滿意的結(jié)果很難講出一個統(tǒng)一的方案,但是有一點(diǎn)是可以肯定的:不同的取樣點(diǎn)數(shù)和量化比特?cái)?shù)組合可以獲得相同的主觀質(zhì)量評價。第21頁,課件共438頁,創(chuàng)作于2023年2月*4.2.2點(diǎn)陣取樣在分析取樣和重建圖像時,往往認(rèn)為取樣系統(tǒng)的輸入圖像是一個確定的圖像場,即為確知函數(shù),如一幅照片或膠片。但是在某些情況下,如電視圖像由于噪聲影響和取樣方式變化,把這種取樣看成是二維隨機(jī)過程的取樣更為有益,當(dāng)然實(shí)際取樣還有一些問題要注意。第22頁,課件共438頁,創(chuàng)作于2023年2月1.確定圖像場的點(diǎn)陣取樣原理對理想取樣而言,其取樣函數(shù)為空間抽樣函數(shù)

S(x,y),離散形式可表示為(4.2-1)δ函數(shù)的取樣陣列如圖4.2-1所示。第23頁,課件共438頁,創(chuàng)作于2023年2月圖4.2-1δ函數(shù)的取樣陣列第24頁,課件共438頁,創(chuàng)作于2023年2月

令fI(x,y)代表一理想的無限大連續(xù)圖像場,其點(diǎn)陣取樣方法就是用空間抽樣函數(shù)S(x,y)和連續(xù)圖像函數(shù)fI(x,y)相乘。設(shè)fS(x,y)表示取樣后的圖像,理想取樣數(shù)學(xué)模型如圖4.2-2所示。圖4.2-2理想取樣數(shù)學(xué)模型第25頁,課件共438頁,創(chuàng)作于2023年2月由此可以得到(4.2-2)第26頁,課件共438頁,創(chuàng)作于2023年2月

式中,連續(xù)函數(shù)fI(x,y)移入求和式內(nèi)變?yōu)殡x散形式fI(iΔx,jΔy),表明只是在取樣點(diǎn)(iΔx,jΔy)上計(jì)值。根據(jù)二維傅立葉變換卷積定理,可以得到頻域關(guān)系式為

(4.2-3)式中第27頁,課件共438頁,創(chuàng)作于2023年2月

假定理想圖像的頻譜是有限的,截止頻率為uc和vc,根據(jù)δ函數(shù)的篩選性質(zhì)對式(4.2-3)進(jìn)一步運(yùn)算可以得式(4.2-4)和如圖4.2-3所示的取樣圖像頻譜示意圖。

(4.2-4)第28頁,課件共438頁,創(chuàng)作于2023年2月圖4.2-3取樣圖像頻譜示意圖第29頁,課件共438頁,創(chuàng)作于2023年2月

由式(4.2-4)和圖4.2-3可以看出,取樣圖像頻譜是原圖像頻譜在頻域中的無窮多個重復(fù)。重復(fù)頻譜之間間隔Δu和Δv取決于取樣間隔Δx和Δy的大小,只要選取合適的Δx、Δy,就能保證Δu、Δv等于或大于原圖像截止頻率2uc、2vc,那么各個重復(fù)頻譜之間就不會重疊。在這種情況下,選用合適的二維重建濾波器,就可以取出一個完整的原圖像頻譜(即除所有i,j≠0的頻譜成分),再由二維傅立葉反變換獲得和原圖像一樣的重建圖像

。第30頁,課件共438頁,創(chuàng)作于2023年2月

取樣正確與否的原則是能否由取樣圖像不失真地重建原圖像,而正確取樣的關(guān)鍵是取樣間隔Δx、Δy的選擇,因此保證正確取樣的條件是因?yàn)椋?.2-5)第31頁,課件共438頁,創(chuàng)作于2023年2月所以則(4.2-6)第32頁,課件共438頁,創(chuàng)作于2023年2月

滿足式(4.2-5)和式(4.2-6)中“等于”條件的取樣稱為奈奎斯特取樣。滿足兩式中大于條件的取樣稱為過取樣,而不滿足上述兩條件的取樣稱為欠取樣。在欠取樣情況下,會產(chǎn)生混淆失真?;煜д媸侨又袘?yīng)注意的一個重要問題。防止出現(xiàn)混淆失真的辦法,從理論上講,若已知原圖像頻譜的最高頻率成分,則使用過取樣或奈奎斯特取樣,而不要使用欠取樣;第33頁,課件共438頁,創(chuàng)作于2023年2月

但若不知道原圖像頻譜的最高頻率成分,則應(yīng)先采用已知截止頻率的低通濾波器預(yù)先過濾圖像,限制其高頻率成分,再針對低通濾波器截止頻率進(jìn)行過取樣或奈奎斯特取樣。在實(shí)際取樣系統(tǒng)中,取樣脈沖寬帶效應(yīng)相當(dāng)于一個低通濾波器,另外光學(xué)系統(tǒng)的透鏡散焦,孔闌衍射也都可以等效為低通濾波器的作用,盡管會引起圖像模糊降質(zhì),但對防止混淆失真卻是有好處的。第34頁,課件共438頁,創(chuàng)作于2023年2月2.隨機(jī)圖像場取樣實(shí)際圖像往往有噪聲,這種附加有噪聲的確定圖像場可以認(rèn)為是隨機(jī)圖像場,因此這里簡單介紹一下隨機(jī)圖像場的取樣。式中,τx=x1-x2;τy=y1-y2。第35頁,課件共438頁,創(chuàng)作于2023年2月

用狄拉克取樣函數(shù)S(x,y)對這個隨機(jī)過程進(jìn)行取樣所獲得的取樣場為(4.2-8)因而取樣場的自相關(guān)函數(shù)為

(4.2-9)第36頁,課件共438頁,創(chuàng)作于2023年2月

根據(jù)狄拉克函數(shù)性質(zhì):兩個狄拉克函數(shù)相乘還是一個狄拉克函數(shù),即S(x1,y1)S(x2,y2)=S(x1-x2,y1-y2)=S(τx,τy)

(4.2-10)將式(4.2-7)和式(4.2-10)代入式(4.2-9)即可得第37頁,課件共438頁,創(chuàng)作于2023年2月對上式兩邊取二維傅立葉變換,根據(jù)傅氏變換定理得(4.2-11)(4.2-12)第38頁,課件共438頁,創(chuàng)作于2023年2月圖4.2-4有噪聲圖像的取樣(一維示意圖)第39頁,課件共438頁,創(chuàng)作于2023年2月4.2.3圖像信號量化經(jīng)過取樣的圖像只是在空間上被離散為像素(樣本)的陣列,而每一個樣本灰度值還是一個有無窮多個取值的連續(xù)變化量,必須將其轉(zhuǎn)化為有限個離散值,賦予不同碼字才能真正成為數(shù)字圖像,再由計(jì)算機(jī)或其他數(shù)字設(shè)備進(jìn)行處理運(yùn)算,這樣的轉(zhuǎn)化過程稱為量化。將樣本連續(xù)灰度等間隔分層量化方式稱為均勻量化,不等間隔分層量化方式稱為非均勻量化。量化既然以有限個離散值來近似表示無限多個連續(xù)量,就一定會產(chǎn)生誤差,這就是所謂的量化誤差。第40頁,課件共438頁,創(chuàng)作于2023年2月

由此產(chǎn)生的失真叫量化失真或量化噪聲,對均勻量化來講,量化分層越多,量化誤差越小,但編碼時占用比特?cái)?shù)就越多。在一定比特?cái)?shù)下,為了減少量化誤差,往往要用非均勻量化,如按圖像灰度值出現(xiàn)的概率大小不同進(jìn)行非均勻量化,即對灰度值經(jīng)常出現(xiàn)的區(qū)域進(jìn)行細(xì)量化,反之進(jìn)行粗量化。在實(shí)際圖像系統(tǒng)中,由于存在著成像系統(tǒng)引入的噪聲及圖像本身的噪聲,因此量化等級取得太多(量化間隔太?。┦菦]有必要的,因?yàn)槿绻肼暦戎荡笥诹炕g隔,量化器輸出的量化值就會產(chǎn)生錯誤,得到不正確的量化。第41頁,課件共438頁,創(chuàng)作于2023年2月

在應(yīng)用屏幕顯示其輸出圖像時,灰度鄰近區(qū)域邊界會出現(xiàn)“忙動”現(xiàn)象。假設(shè)噪聲是高斯分布,均值為0,方差為σ2,在有噪聲情況下,最佳量化層選取有兩種方法,一是令正確量化的概率大于某一個值,二是使量化誤差的方差等于噪聲方差。針對輸出圖像是專供人觀察評價的應(yīng)用,研究出了一些按人的視覺特性進(jìn)行非均勻量化方式,如圖像灰度變化緩慢部分細(xì)量化,而圖像灰度變化快的細(xì)節(jié)部分粗量化,這是由于視覺掩蓋效應(yīng)被發(fā)現(xiàn)而產(chǎn)生的。再如按人的視覺靈敏度特征進(jìn)行對數(shù)形式量化分層等。第42頁,課件共438頁,創(chuàng)作于2023年2月4.3數(shù)字圖像壓縮方法的分類

圖像壓縮的基本目標(biāo)就是減小數(shù)據(jù)量,但最好不要引起圖像質(zhì)量的明顯下降,在大多數(shù)實(shí)際應(yīng)用中,為了取得較低的比特率,輕微的質(zhì)量下降是允許的。至于圖像壓縮到什么程度而沒有明顯的失真,則取決于圖像數(shù)據(jù)的冗余度。較高的冗余度形成較大的壓縮,而典型的圖像信號都具有很高的冗余度,正是這些冗余度的存在允許我們對圖像進(jìn)行壓縮。第43頁,課件共438頁,創(chuàng)作于2023年2月

例如,我們在第2章介紹的空間冗余和時間冗余是圖像信號最常見的冗余,所有的這些冗余度都可以被除去而不會引起顯著的信息損失,但壓縮編碼無法減少冗余度。不同的出發(fā)點(diǎn)有不同的分類,按照信息論的角度,數(shù)字圖像壓縮方法一般可分為:(1)可逆編碼(ReversibleCoding或InformationPreservingCoding),也稱為無損壓縮。這種方法的解碼圖像與原始圖像嚴(yán)格相同,壓縮是完全可恢復(fù)的或無偏差的,無損壓縮不能提供較高的壓縮比。第44頁,課件共438頁,創(chuàng)作于2023年2月

(2)不可逆編碼(Non-ReversibleCoding),也稱為有損壓縮。用這種方法恢復(fù)的圖像較原始圖像存在一定的誤差,但視覺效果一般是可接受的,它可提供較高的壓縮比。第45頁,課件共438頁,創(chuàng)作于2023年2月

按照壓縮方法的原理,數(shù)字圖像壓縮方法可分為:

(1)預(yù)測編碼(PredictiveCoding)。預(yù)測編碼是一種針對統(tǒng)計(jì)冗余進(jìn)行壓縮的方法,它主要是減少數(shù)據(jù)在空間和時間上的相關(guān)性,達(dá)到對數(shù)據(jù)的壓縮,是一種有失真的壓縮方法。預(yù)測編碼中典型的壓縮方法有DPCM和ADPCM等,它們比較適合于圖像數(shù)據(jù)的壓縮。第46頁,課件共438頁,創(chuàng)作于2023年2月

(2)變換編碼(TransformCoding)。變換編碼也是一種針對統(tǒng)計(jì)冗余進(jìn)行壓縮的方法。這種方法將圖像光強(qiáng)矩陣(時域信號)變換到系數(shù)空間(頻域)上進(jìn)行處理。常用的正交變換有DFT(離散傅氏變換)、DCT(離散余弦變換)、DST(離散正弦變換)、哈達(dá)碼變換和Karhunen-Loeve變換。第47頁,課件共438頁,創(chuàng)作于2023年2月

(3)量化和矢量量化編碼(VectorQuantization)。量化和矢量量化編碼本質(zhì)上也還是一種針對統(tǒng)計(jì)冗余進(jìn)行壓縮的方法。當(dāng)我們對模擬量進(jìn)行數(shù)字化時,必然要經(jīng)歷一個量化的過程。在這里量化器的設(shè)計(jì)是一個很關(guān)鍵的步驟,量化器設(shè)計(jì)的好壞對于量化誤差的大小有直接的影響。矢量量化是相對于標(biāo)量量化而提出的,如果我們一次量化多個點(diǎn),則稱為矢量量化。第48頁,課件共438頁,創(chuàng)作于2023年2月

(4)信息熵編碼(EntropyCoding)。根據(jù)信息熵原理,用短的碼字表示出現(xiàn)概率大的信息,用長的碼字表示出現(xiàn)概率小的信息。常見的方法有哈夫曼編碼、游程編碼以及算術(shù)編碼。

(5)子帶編碼(Sub-bandCoding)。子帶編碼將圖像數(shù)據(jù)變換到頻域后,按頻率分帶,然后用不同的量化器進(jìn)行量化,從而達(dá)到最優(yōu)的組合?;蛘呤欠植綕u近編碼,在初始時對某一頻帶的信號進(jìn)行解碼,然后逐漸擴(kuò)展到所有頻帶,隨著解碼數(shù)據(jù)的增加,解碼圖像也逐漸地清晰起來。此方法對于遠(yuǎn)程圖像模糊查詢與檢索的應(yīng)用比較有效。第49頁,課件共438頁,創(chuàng)作于2023年2月

(6)結(jié)構(gòu)編碼(StructureCoding),也稱為第二代編碼(SecondGenerationCoding)。編碼時首先求出圖像中的邊界、輪廓、紋理等結(jié)構(gòu)特征參數(shù),然后保存這些參數(shù)信息。解碼時根據(jù)結(jié)構(gòu)和參數(shù)信息進(jìn)行合成,從而恢復(fù)出原圖像。(7)基于知識的編碼(Knowledge-BasedCoding)。對于人臉等可用規(guī)則描述圖像,利用人們對其的知識形成一個規(guī)則庫,據(jù)此將人臉的變化等特征用一些參數(shù)進(jìn)行描述,從而用參數(shù)加上模型就可以實(shí)現(xiàn)人臉的圖像編碼與解碼。圖像壓縮算法的總體框圖如圖4.3-1所示。第50頁,課件共438頁,創(chuàng)作于2023年2月圖4.3-1圖像壓縮算法的總體框圖第51頁,課件共438頁,創(chuàng)作于2023年2月

下面幾節(jié)主要介紹幾種常見的壓縮編碼方法:信息熵編碼方法(如哈夫曼編碼、游程編碼和算術(shù)編碼)、預(yù)測編碼和變換編碼,并介紹新一代編碼方法(如知識基編碼和分形編碼)等以及相關(guān)知識。由于矢量量化編碼和子帶編碼方法在上一章中結(jié)合音頻編碼已經(jīng)介紹,它們在應(yīng)用于圖像時原理基本相同,這里不再贅述。

第52頁,課件共438頁,創(chuàng)作于2023年2月4.4典型的熵編碼方法4.4.1基本概念

1.圖像熵和平均碼字長度

1)圖像熵(Entropy)設(shè)數(shù)字圖像像素灰度級集合為(W1,W2,…,Wk,…,WM),其對應(yīng)的概率分別為P1,P2,…,Pk,…,PM。按信息論中信源信息熵定義,數(shù)字圖像的熵H為第53頁,課件共438頁,創(chuàng)作于2023年2月

由此可見,一幅圖像的熵就是這幅圖像的平均信息量度,也是表示圖像中各個灰度級比特?cái)?shù)的統(tǒng)計(jì)平均值。式(4.4-1)所表示的熵值是在假定圖像信源無記憶(即圖像的各個灰度級不相關(guān))的前提下獲得的,這樣的熵值常稱為無記憶信源熵值,記為H0(·)。對于有記憶信源,假如某一像素灰度級與前一像素灰度級相關(guān),那么公式(4.4-1)中的概率要換成條件概率P(Wi/Wi-1)和聯(lián)合概率P(Wi,Wi-1),則圖像信息熵公式變?yōu)椋?.4-1)第54頁,課件共438頁,創(chuàng)作于2023年2月

式中,P(Wi,Wi-1)=P(Wi)P(Wi/Wi-1),則稱H(Wi/Wi-1)為條件熵。因?yàn)橹慌c前面一個符號相關(guān),故稱為一階熵H1(·)。如果與前面兩個符號相關(guān),求得的熵值就稱為二階熵H2(·)。依此類推可以得到三階和四階等高階熵,并且可以證明

H0(·)>H1(·)>H2(·)>H3(·)>…(4.4-2)第55頁,課件共438頁,創(chuàng)作于2023年2月

香農(nóng)信息論已證明:信源熵是進(jìn)行無失真編碼的理論極限。低于此極限的無失真編碼方法是不存在的,這是熵編碼的理論基礎(chǔ)。而且可以證明,如果考慮像素間的相關(guān)性,使用高階熵一定可以獲得更高的壓縮比。第56頁,課件共438頁,創(chuàng)作于2023年2月

2)平均碼字長度設(shè)βk為數(shù)字圖像第k個碼字Ck的長度(二進(jìn)制代數(shù)的位數(shù)),其相應(yīng)出現(xiàn)的概率為Pk,則該數(shù)字圖像所賦予的碼字平均長度R為(4.4-3)第57頁,課件共438頁,創(chuàng)作于2023年2月3)編碼效率在一般情況下,編碼效率往往用下列簡單公式表示(4.4-4)式中,H為信源熵,R為平均碼字長度。第58頁,課件共438頁,創(chuàng)作于2023年2月

根據(jù)信息論中信源編碼理論,可以證明在R≥H條件下總可以設(shè)計(jì)出某種無失真編碼方法。若編碼結(jié)果使R遠(yuǎn)大于H,表明這種編碼方法效率很低,占用比特?cái)?shù)太多。例如對圖像樣本量化值直接采用PCM編碼,其結(jié)果平均碼字長度R就遠(yuǎn)比圖像熵H大。若編碼結(jié)果使R等于或很接近于H,這種狀態(tài)的編碼方法稱為最佳編碼。它既不丟失信息而引起圖像失真,又占用最少的比特?cái)?shù),例如下面要介紹的哈夫曼編碼即屬于最佳編碼方法。第59頁,課件共438頁,創(chuàng)作于2023年2月

若要求編碼結(jié)果R<H,則必然丟失信息而引起圖像失真。這就是在允許失真條件下的一些失真編碼方法。熵編碼的目的就是要使編碼后的圖像平均比特?cái)?shù)R盡可能接近圖像熵H。一般是根據(jù)圖像灰度級數(shù)出現(xiàn)的概率大小賦予不同長度的碼字,概率大的灰度級用短碼字,反之,用長碼字??梢宰C明,這樣的編碼結(jié)果所獲得的平均碼字長度最短。這就是下面要介紹的變長最佳編碼定理。第60頁,課件共438頁,創(chuàng)作于2023年2月2.變長最佳編碼定理

【定理】在變長編碼中,對出現(xiàn)概率大的信息符號賦予短碼字,而對于出現(xiàn)概率小的信息符號賦予長碼字。如果碼字長度嚴(yán)格按照所對應(yīng)符號出現(xiàn)概率大小逆序排列,則編碼結(jié)果平均碼字長度一定小于任何其他排列方式。這個定理就是下面要介紹的哈夫曼編碼方法的理論基礎(chǔ)。設(shè)圖像灰度級為W1,W2,…,Wi…,WN;各灰度級出現(xiàn)的概率分別為P1,P2,…,Pi,…,PN;第61頁,課件共438頁,創(chuàng)作于2023年2月

編碼所賦予的碼字長度分別為t1,

t2,…,ti,…,

tN;則編碼后圖像平均碼字長度R應(yīng)為第62頁,課件共438頁,創(chuàng)作于2023年2月

再令嚴(yán)格按照定理規(guī)則進(jìn)行編碼,其結(jié)果平均碼字長度為R1;R2為將其中任兩個灰度級不按定理規(guī)則編碼(即概率大的灰度級賦予長碼字。反之,用短碼字),而其他所有灰度級仍按定理規(guī)則編碼所得的圖像平均碼字長度,那么R2應(yīng)等于R1加上“不按定理規(guī)則編碼所增加的平均碼字長度”ΔR。只要證明ΔR大于0,即可以證明上述定理。第63頁,課件共438頁,創(chuàng)作于2023年2月3.可變長最佳編碼的平均碼字長度設(shè)可變長編碼所用碼元進(jìn)制為D,被編碼的信息符號總數(shù)為N,第i個符號出現(xiàn)的概率為Pi,與其對應(yīng)的碼字長度為ti,則可以證明這種編碼結(jié)果平均碼字長度R落在下列區(qū)間內(nèi)第64頁,課件共438頁,創(chuàng)作于2023年2月

式中,,由此可以引導(dǎo)出對某一信息符號存在下式(4.4-5)對二進(jìn)制碼進(jìn)一步簡化為-lbPi≤ti<-lbPi+1(4.4-6)第65頁,課件共438頁,創(chuàng)作于2023年2月4.惟一可譯編碼有些情況下,為了減少表示圖像的平均碼字長度,往往對碼字之間不加同步碼。但是,這樣就要求所編碼字序列能被惟一地譯出來。滿足這個條件的編碼稱為惟一可譯編碼,也常稱為單義可譯碼。單義可譯碼往往是采用非續(xù)長代碼。第66頁,課件共438頁,創(chuàng)作于2023年2月1)續(xù)長代碼和非續(xù)長代碼若代碼中任何一個碼字都不是另一個碼字的續(xù)長,也就是不能在某一碼字后面添加一些碼元而構(gòu)成另一個碼字,稱其為非續(xù)長代碼。反之,稱其為續(xù)長代碼。如二進(jìn)制代碼[0,10,11]即為非續(xù)長代碼,而[0,01,11]則為續(xù)長代碼。因?yàn)榇a字01可由碼字“0”后加上一個碼元“1”構(gòu)成。第67頁,課件共438頁,創(chuàng)作于2023年2月2)單義代碼在介紹單義代碼前,先簡單介紹一下克勞夫特(Kraft)不等式:若信源符號有m種取值,其碼字長度分別為li(i=1,2,…,m);又設(shè)最長的碼字長度為L,碼元種類(即多少進(jìn)制碼)為D,長度為li的碼字占用了

個長度為L的碼字,也就是必須有對于二進(jìn)制,則有。第68頁,課件共438頁,創(chuàng)作于2023年2月

任意有限長的碼字序列,只能被惟一地分割成一個個碼字,則這樣的碼字序列稱為單義代碼。單義代碼的充要條件是滿足克勞夫特(Kraft)不等式(4.4-7)

式中,D為代碼中碼元種類,對于二進(jìn)制D=2;n為代碼中碼字個數(shù);ti為代碼中第i個碼字的長度(即碼元個數(shù))。第69頁,課件共438頁,創(chuàng)作于2023年2月

如代碼C=[00,10,001,101],因?yàn)槭嵌M(jìn)制碼,則D=2,共有4個碼字C1=00、C2=10、

C3=001、C4=101,其相應(yīng)的長度為t1=2、t2=2、t3=3、t4=3,代入式(4.4-7)可得第70頁,課件共438頁,創(chuàng)作于2023年2月4.4.2哈夫曼(Huffman)編碼方法哈夫曼編碼是根據(jù)可變長度最佳編碼定理,應(yīng)用哈夫曼算法而產(chǎn)生的一種編碼方法。在具有相同輸入概率集合的前提下,它的平均碼字長度比其他任何一種惟一可譯碼都小,因此,也常稱其為緊湊碼。下面以一個具體的例子來說明其編碼方法,如圖4.4-1所示。第71頁,課件共438頁,創(chuàng)作于2023年2月圖4.4-1哈夫曼(Huffman)編碼的示例第72頁,課件共438頁,創(chuàng)作于2023年2月1.編碼步驟

(1)先將輸入灰度級按出現(xiàn)的概率由大到小順序排列(對概率相同的灰度級可以任意顛倒排列位置)。(2)將最小兩個概率相加,形成一個新的概率集合。再按第(1)步方法重排(此時概率集合中概率個數(shù)已減少一個)。如此重復(fù)進(jìn)行,直到只有兩個概率為止。第73頁,課件共438頁,創(chuàng)作于2023年2月

(3)分配碼字。碼字分配從最后一步開始反向進(jìn)行,對最后兩個概率一個賦予“1”碼,一個賦予“0”碼。如概率0.60賦予“0”碼,0.40賦予“1”碼(也可以將0.60賦予“1”碼,0.40賦予“0”碼)。如此反向進(jìn)行到開始的概率排列。在此過程中,若概率不變,則仍用原碼字。如圖4.4-1中第六步中概率0.40到第五步中仍用“1”碼。若概率分裂為兩個,其碼字前幾位碼元仍用原來的。碼字的最后一位碼元一個賦予“0”碼元,另一個賦予“1”碼元。如圖中第六步中概率0.60到第五步中分裂為0.37和0.23,則所得碼字分別為“00”和“01”。第74頁,課件共438頁,創(chuàng)作于2023年2月2.前例哈夫曼編碼的編碼效率計(jì)算根據(jù)式(4.4-1)求出前例信源熵為根據(jù)式(4.4-3)求出平均碼字長度為第75頁,課件共438頁,創(chuàng)作于2023年2月根據(jù)式(4.4-4)求出編碼效率η為可見哈夫曼編碼效率很高。第76頁,課件共438頁,創(chuàng)作于2023年2月*4.4.3游程編碼在圖像中,尤其是一些不太復(fù)雜的圖像和計(jì)算機(jī)生成的圖像中,往往存在著灰度或顏色相同的圖像塊,對這樣的圖像進(jìn)行掃描時,對應(yīng)這些相同灰度和顏色的圖像塊就會有連續(xù)多行掃描行數(shù)據(jù)具有相同的數(shù)值,而且在同一行上會有許多連續(xù)的像素點(diǎn)具有同樣的數(shù)值。只保留連續(xù)相同像素值中的一個值及具有相同數(shù)值的像素點(diǎn)數(shù)目,這種方法就是人們常說的行程編碼或游程編碼(RLC,RunLengthCoding),而且這種方法可以用少的數(shù)據(jù)量來表示圖像信息。第77頁,課件共438頁,創(chuàng)作于2023年2月

在二元序列中,只有兩種符號,即“0”和“1”;這些符號可連續(xù)出現(xiàn),連“0”這一段稱為“0”游程,連“1”這一段稱為“1”游程。它們的長度分別為L(0)和L(1)?!?”游程和“1”游程總是交替出現(xiàn)的。倘若規(guī)定二元序列是以“0”開始,第一個游程是“0”游程,第二個必為“1”游程,第三個又是“0”游程等等。對于隨機(jī)的二元序列,各游程長度將是隨機(jī)變量;其取值可為1,2,3,…,直到無限。第78頁,課件共438頁,創(chuàng)作于2023年2月

定義了游程和游程長度,就可把任何二元序列變換成游程長度的序列,或簡稱游程序列。這種變換是一一對應(yīng)的,也就是可逆的。例如有一二元序列

000101110010001…

可變換成下列游程序列

3113213…第79頁,課件共438頁,創(chuàng)作于2023年2月*4.4.4算術(shù)編碼哈夫曼編碼、游程編碼等無損編碼都是建立在符號和碼字相對應(yīng)的基礎(chǔ)上的,這種編碼通常叫做塊碼或分組碼。此時,信源符號應(yīng)是多元的,而且不考慮符號相關(guān)性。要用于最常見的二元序列,須采用游程編碼、分幀編碼或合并符號等方法,轉(zhuǎn)換成多值符號,而這些符號間的相關(guān)性也不予考慮。這就使信源編碼的匹配原則不能充分滿足,編碼效率就有所損失。倘若要較好的解除相關(guān)性,常需在序列中取很長一段,而這將遇到采用等長碼時的那種困難。第80頁,課件共438頁,創(chuàng)作于2023年2月

為了克服這種局限性,就需跳出塊碼的范疇,研究非塊碼的編碼方法。這就是從全序列出發(fā),采用遞推形式的連續(xù)編碼。其實(shí)香農(nóng)早就提出信源序列的積累概率的概念,把這個概率映射到[0,1)區(qū)間上,使每個序列對應(yīng)區(qū)間內(nèi)的一點(diǎn),這就是一個二進(jìn)位的小數(shù)。這些點(diǎn)把[0,1)區(qū)間分成許多小段,每段的長度等于某一序列的概率。再在段內(nèi)取一個二進(jìn)位小數(shù),其長度可與該序列的概率匹配,達(dá)到高效編碼的目的。這也就是算術(shù)編碼的基本概念。在這里將著重討論積累概率的意義以及遞推計(jì)算等,以說明算術(shù)編碼的基本原理。再通過實(shí)例介紹獨(dú)立二元序列的編碼過程。第81頁,課件共438頁,創(chuàng)作于2023年2月1.積累概率的遞推計(jì)算我們先從信源符號的積累概率開始,再討論序列的積累概率。設(shè)信源符號集為A={a0,a1,a2,…,am-1}

相應(yīng)的概率為Pr,r=0,1,2,…,m-1。定義各符號的積累概率為(4.4-8)第82頁,課件共438頁,創(chuàng)作于2023年2月

顯然,由上式可得P0=0,P1=p0,P2=p0+p1,…

而且pr=Pr+1-Pr由于Pr和Pr+1都是小于1的正數(shù),可用[0,1)區(qū)間內(nèi)的兩個點(diǎn)來表示,則pr就是這兩點(diǎn)間的小區(qū)間的長度。不同的符號有不同的小區(qū)間,它們互不重疊,這種小區(qū)間內(nèi)任一個點(diǎn)可作為該符號的代碼。第83頁,課件共438頁,創(chuàng)作于2023年2月

現(xiàn)在來計(jì)算序列的積累概率。為了簡單起見,先以獨(dú)立二元序列為例來計(jì)算,所得的結(jié)果很容易推廣到一般情況。設(shè)有一序列S=011,這種三個二元符號的序列可按自然二進(jìn)數(shù)排列,000,001,010,…,則S的積累概率為P(S)=p(000)+p(001)+p(010)(4.4-9)倘若S后面接一個“0”,積累概率就成為P(S0)=p(0000)+p(0001)+p(0010)+p(0011)+p(0100)+p(0101)=p(000)+p(001)+p(010)=P(S)第84頁,課件共438頁,創(chuàng)作于2023年2月

因?yàn)閮蓚€四元符號的最后一位是“0”和“1”時,根據(jù)歸一律,它們的概率和應(yīng)等于前三位的概率,即p(0000)+p(0001)=p(000)等。第85頁,課件共438頁,創(chuàng)作于2023年2月

倘若S后面接一個“1”,則其積累概率是P(S1)=p(0000)+p(0001)+p(0010)+p(0011)+p(0100)+p(0101)+p(0110)

=P(S)+p(0110)=P(S)+p(S)p0

由于二元集的積累概率為P0=0,P1=p0,所以上面兩式可統(tǒng)一寫成P(Sr)=P(S)+p(S)Pr

r=0,1(4.4-10)第86頁,課件共438頁,創(chuàng)作于2023年2月

這樣寫的式子很容易推廣到多元序列,即可得到一般的積累概率遞推公式P(Sar)=P(S)+p(S)Pr

(4.4-11)

以及序列的概率公式p(Sar)=p(S)pr(4.4-12)

對于有相關(guān)性的序列,上面的兩個遞推公式也是適用的,只是上式中的單符號概率應(yīng)換成條件概率。第87頁,課件共438頁,創(chuàng)作于2023年2月

用遞推公式可逐位計(jì)算序列的積累概率,而不用像式(4.4-9)那樣列舉所有排在前面的那些序列概率。實(shí)際上,可用兩個存儲器把p(S)和P(S)存下來,然后根據(jù)輸入符號和式(4.4-11)、式(4.4-12),更新兩個存儲器中的值。在起始時可令P(φ)=0,p(φ)=1其中φ代表空集,只有一個符號ar的序列就是φar。第88頁,課件共438頁,創(chuàng)作于2023年2月2.代碼長度從以上關(guān)于積累概率P(S)的計(jì)算中可看出,P(S)把區(qū)間[0,1)分割成許多小區(qū)間,每個小區(qū)間的長度等于各序列的概率p(S),而這些小區(qū)間內(nèi)的任一點(diǎn)可用來代表這些序列,現(xiàn)在來討論如何選擇這個點(diǎn)。令

(4.4-13)第89頁,課件共438頁,創(chuàng)作于2023年2月

其中[X]代表大于或等于X的最小整數(shù),把積累概率P(S)寫成二進(jìn)位的小數(shù),取其前L位,若有尾數(shù),就進(jìn)位到第L位,這樣得到一個數(shù)C。例如,P(S)=0.10110001,p(S)=1/7,則L=3,得C=0.110。這個C就可以作為S的碼字。可以證明這C點(diǎn)必然在長度為p(S)的小區(qū)間內(nèi),因而是可以惟一解碼的。第90頁,課件共438頁,創(chuàng)作于2023年2月

這樣構(gòu)成的碼字,編碼效率是很高的,因?yàn)橐呀?jīng)達(dá)到概率匹配,尤其是當(dāng)序列很長時。由式(4.4-13)可見,對于長序列,p(S)必然很小,L與概率倒數(shù)的對數(shù)已幾乎相等。也就是取整數(shù)所造成的差別很小,平均代碼長度將接近S的熵值。第91頁,課件共438頁,創(chuàng)作于2023年2月

實(shí)際編碼過程是這樣的??上仍O(shè)定兩個存儲器,起始時一個為“0”,另一個為“1”,分別代表空集的積累概率和概率。每輸入一個信源符號,更新一次,得到P(S)值后,按前述方法得到碼字C,暫存起來,C值也隨輸入符號而更新。直至序列結(jié)束,就可作為該序列的碼字輸出。由于P(S)是遞增的,而增量隨著序列的增長而減小。因?yàn)樵隽渴切蛄械母怕逝c信源符號的積累概率的乘積,所以C的前幾位一般已固定,在以后的計(jì)算中不會被更新,因而可以輸出。第92頁,課件共438頁,創(chuàng)作于2023年2月

解碼也逐位進(jìn)行。由于P(S)的遞增性,第一個符號的積累概率不會小于以后的C值,所以從C值就可譯出第一個信源符號。由該符號按編碼方法算得的P(S)與C比較就可判斷下一個信源符號,依次下去就可譯出全序列。其實(shí),在算術(shù)編碼中,解碼過程與編碼過程是相似的。第93頁,課件共438頁,創(chuàng)作于2023年2月3.實(shí)現(xiàn)算術(shù)編碼的一些問題以上從理論上簡單討論了算術(shù)編碼的編譯方法以及它的編碼效率,可以看出它有許多優(yōu)點(diǎn),尤其它的漸近最佳性,亦即當(dāng)序列無限增長時,平均碼長將漸近地等于序列的熵值。但在實(shí)際實(shí)現(xiàn)時,尚有一些必須解決的問題。第94頁,課件共438頁,創(chuàng)作于2023年2月

(1)復(fù)雜性問題。每次遞推運(yùn)算中都有乘法,當(dāng)序列概率和符號的積累概率展開成二進(jìn)位小數(shù)后的位數(shù)較多且要求精度較高時,就有一定的運(yùn)算量。這種運(yùn)算必須在輸入一個信源符號的時間內(nèi)完成,以保證實(shí)時編解碼,有時會造成困難。要消除乘法,只有一種情況,這就是編碼序列是二元序列,而且其符號概率較小的一個是2-k的形式,其中k是正整數(shù)。此時乘以2-k等于移位,乘以1-2-k等于移位和相減。這樣就完全沒有乘法運(yùn)算,可加快運(yùn)算速度。這就是為什么算術(shù)編碼一般只用于二元序列的編碼,而且符號概率常用2-k去近似。第95頁,課件共438頁,創(chuàng)作于2023年2月(2)計(jì)算精度問題。即使在二元序列的情況下,精度問題仍存在。隨著遞推運(yùn)算的延續(xù),P(S)和p(S)(即積累概率和序列的概率)的小數(shù)位數(shù)也將逐步增加,若不能隨時輸出和加以截?cái)啵\(yùn)算器將難于容納,但有所截?cái)啾厝唤档途?。而精度不夠會影響編解碼的正確性。這是因?yàn)殡S著序列長度增大,小區(qū)間數(shù)目越來越多,長度越來越短。計(jì)算精度不夠會使有些小區(qū)間互相重疊或消失(即長度為零),前者使惟一性喪失,后者使無碼字可編。這些會造成差錯,就不是無損編碼,而且這些差錯還會擴(kuò)散。所以最初提出的算術(shù)編碼要求無限精度,這是不現(xiàn)實(shí)的。有限精度是可能的,只是編碼效率會有所下降。第96頁,課件共438頁,創(chuàng)作于2023年2月

(3)存儲量問題。碼字C的長度也隨序列S長度的增加而不斷增長。若不及時輸出,存儲量將非常大。但若輸出過早,運(yùn)算過程中可能還需調(diào)整已輸出的部分,就會影響結(jié)果。當(dāng)未輸出部分的前面各位都是“1”時,后面在計(jì)算時略有增加,就可能進(jìn)位到已輸出部分,尤其是連“1”很長時,原以為保留許多位已經(jīng)夠了,但仍會影響已輸出部分。從理論上說,這種連“1”的長度可以達(dá)到無限,當(dāng)然出現(xiàn)這種情況的概率也將接近于零。這類問題常稱為進(jìn)位問題,在實(shí)際應(yīng)用時也必須設(shè)法解決。第97頁,課件共438頁,創(chuàng)作于2023年2月4.二元獨(dú)立序列的算術(shù)編碼示例設(shè)有二元獨(dú)立序列:

S=11111100已知其符號概率p0=1/4,p1=3/4,則第98頁,課件共438頁,創(chuàng)作于2023年2月用前面的公式和編碼規(guī)則,可得P(S)

=p(00000000)+p(00000001)+p(00000010)+…+p(11111011)

=1-p(11111111)-p(11111110)-p(11111101)-p(11111100)

=1-p(111111)

=1-(3/4)6=0.110100100111C=0.1101010

第99頁,課件共438頁,創(chuàng)作于2023年2月

該碼字C在P(11111100)和P(11111101)之間,必可惟一譯出序列S。這樣編碼的效率為

η=熵/平均碼字長度==92.7%

隨著S的增長,編碼效率一般還可提高。但是這種按全序列的編碼,計(jì)算量和存儲量將隨S的增長而不斷增加,因而幾乎不可能實(shí)現(xiàn)?,F(xiàn)在用遞推公式式(4.4-11)和式(4.4-12)來計(jì)算上面的序列的碼字。這種編碼過程如圖4.4-2所示。第100頁,課件共438頁,創(chuàng)作于2023年2月圖4.4-2算術(shù)編碼過程示例第101頁,課件共438頁,創(chuàng)作于2023年2月

由式(4.4-10)以及二元集的積累概率P0=0,P1=p0可得P(S0)=P(S),P(S1)=P(S)+p(S)p0。所以,

當(dāng)輸入第一個1:P(S1)=0+1×(1/4)=1/4→0.01;輸入第二個1:P(S1)=1/4+(3/4)×(1/4)=7/16→0.0111;輸入第一個0:P(S0)=P(S),即與上一行相同,換成二進(jìn)制小數(shù)還是相同。依次類推,而計(jì)算序列概率按公式p(S0)=p(S)p0,p(S1)=p(S)p1計(jì)算即可。第102頁,課件共438頁,創(chuàng)作于2023年2月圖4.4-3算術(shù)編碼的圖解第103頁,課件共438頁,創(chuàng)作于2023年2月

4.5預(yù)測編碼4.5.1DPCM系統(tǒng)的基本原理

DPCM系統(tǒng)的基本原理是指基于圖像中相鄰像素之間具有較強(qiáng)的相關(guān)性。每個像素可以根據(jù)前幾個已知的像素值來作預(yù)測。因此在預(yù)測法編碼中,編碼與傳輸?shù)闹挡⒉皇窍袼厝又当旧恚沁@個取樣值的預(yù)測值(也稱估計(jì)值)與實(shí)際值之間的差值。DPCM系統(tǒng)的原理框圖如圖4.5-1所示。

第104頁,課件共438頁,創(chuàng)作于2023年2月

圖4.5-1DPCM系統(tǒng)的原理框圖第105頁,課件共438頁,創(chuàng)作于2023年2月

設(shè)輸入信號xn為tn時刻的取樣值。

是根據(jù)tn時刻以前已知的m個取樣值xn-m,…,xn-1對xn所作的預(yù)測值,即(4.5-1)式中,ai(i=1,…,m)稱為預(yù)測系數(shù),m為預(yù)測階數(shù)。

en為預(yù)測誤差信號,顯然(4.5-2)第106頁,課件共438頁,創(chuàng)作于2023年2月

設(shè)qn為量化器的量化誤差,e′n為量化器輸出信號,可見qn=en-e′n

(4.5-3)接收端解碼輸出為x″n,如果信號在傳輸過程中不產(chǎn)生誤差,則有e′n=e″n,x′n=x″n,

。此時發(fā)送端的輸入信號xn與接收端的輸出信息x″n之間的誤差為(4.5-4)第107頁,課件共438頁,創(chuàng)作于2023年2月4.5.2最佳線性預(yù)測在線性預(yù)測的預(yù)測表達(dá)式(4.5-1)中,預(yù)測值

是xn-m,…,xn-1的線性組合,分析可知,需選擇適當(dāng)?shù)念A(yù)測系數(shù)ai使得預(yù)測誤差最小,這是一個求解最佳線性預(yù)測的問題。一般情況下,應(yīng)用均方誤差為極小值準(zhǔn)則獲得的線性預(yù)測稱為最佳線性預(yù)測。在討論如何確定預(yù)測系數(shù)ai之前,先簡單討論一下線性預(yù)測DPCM中,對xn作最佳預(yù)測時,如何取用以前的已知像素值xn-1,xn-2,…,x1。xn與鄰近像素的關(guān)系示意圖如圖4.5-2所示。第108頁,課件共438頁,創(chuàng)作于2023年2月圖4.5-2xn與鄰近像素的關(guān)系示意圖第109頁,課件共438頁,創(chuàng)作于2023年2月

(1)若取用現(xiàn)在像素xn的同一掃描行中前面最鄰近像素x1來預(yù)測xn,即xn的預(yù)測值

,則稱為前值預(yù)測。

(2)若取用xn的同一掃描行中前幾個已知像素值,如x1,x5,…來預(yù)測xn,則稱為一維預(yù)測。(3)若取用xn的同一行和前幾行若干個已知像素值,如x1,x5,x2,x3,x4,…來預(yù)測xn,則稱為二維預(yù)測。第110頁,課件共438頁,創(chuàng)作于2023年2月(4)若取用已知像素不但是前幾行的而且還包括前幾幀的,那么相應(yīng)的稱其為三維預(yù)測。在一維預(yù)測情況下不失一般性。設(shè)xn是期望E{xn}=0的廣義平穩(wěn)隨機(jī)過程,則設(shè)(4.5-5)第111頁,課件共438頁,創(chuàng)作于2023年2月為了使最小,必定有

i=1,2,…,m

(4.5-6)

解這m個聯(lián)立方程可得ai(i=1,2,…,m)。xn的自相關(guān)函數(shù)為R(k)=E{xnxn-k}第112頁,課件共438頁,創(chuàng)作于2023年2月且R(-k)=R(k),代入式(4.5-6)得i=1,2,…,m

(4.5-7)寫成矩陣形式為第113頁,課件共438頁,創(chuàng)作于2023年2月

上式最左邊的矩陣是xn的相關(guān)矩陣,為Toeplitz矩陣,所以用Levinson算法可解出各ai

(i=1,2,…,m),從而得到在均方誤差最小意義下的最佳線性預(yù)測。式(4.5-5)也可以用自相關(guān)函數(shù)來表示,即(4.5-9)第114頁,課件共438頁,創(chuàng)作于2023年2月

因?yàn)镋{xn}=0,所以R(0)即為xn的方差,可見。因而傳送差值en比直接傳送原始信號xn更有利于數(shù)據(jù)壓縮。R(k)越大,表明xn的相關(guān)性越強(qiáng),則越小,所能達(dá)到的壓縮比就越大。當(dāng)R(k)=0(k>0)時,即相鄰點(diǎn)不相關(guān)時,,此時預(yù)測并不能提高壓縮比。第115頁,課件共438頁,創(chuàng)作于2023年2月

二維、三維線性預(yù)測的情況與一維完全類似,只不過推導(dǎo)的過程相對一維來說要復(fù)雜一些,這里不再推導(dǎo),有興趣的讀者可以參考相關(guān)書籍。應(yīng)用均方差極小準(zhǔn)則所獲得的各個預(yù)測系數(shù)ai之間有什么樣的約束關(guān)系呢?假設(shè)圖像中有一個區(qū)域亮度值是一個常數(shù),那么預(yù)測器的預(yù)測值也應(yīng)是一個與前面相同的常數(shù),即第116頁,課件共438頁,創(chuàng)作于2023年2月將此結(jié)果代入式(4.5-1)得因此第117頁,課件共438頁,創(chuàng)作于2023年2月1980年P(guān)irsch進(jìn)一步研究并修正了這個結(jié)論。他認(rèn)為,為了防止DPCM系統(tǒng)中出現(xiàn)“極限環(huán)”(LimitCircle)振蕩和減少傳輸誤碼的擴(kuò)散效應(yīng),應(yīng)滿足下列兩個條件:

(1)預(yù)測誤差e=0應(yīng)該是一個量化輸出電平,也就是量化分層的總數(shù)K應(yīng)是奇數(shù)。

(2)所有預(yù)測系數(shù)ai除滿足外,還應(yīng)滿足第118頁,課件共438頁,創(chuàng)作于2023年2月4.5.3DPCM系統(tǒng)中的圖像降質(zhì)由于預(yù)測器和量化器的設(shè)計(jì)以及數(shù)字信道傳輸誤碼的影響,在DPCM系統(tǒng)中會出現(xiàn)一些圖像降質(zhì)現(xiàn)象。經(jīng)過許多實(shí)驗(yàn)可總結(jié)為下列幾種。(1)斜率過載引起圖像中黑白邊沿模糊,分辨率降低。這主要是當(dāng)掃描到圖像中黑白邊沿時,預(yù)測誤差信號比量化器最大輸出電平還要大得多,從而引起很大的量化噪聲。

第119頁,課件共438頁,創(chuàng)作于2023年2月

(2)顆粒噪聲。顆粒噪聲主要是最小的量化輸出電平太大,而圖像中灰度緩慢變化區(qū)域輸出可能在兩個最小的輸出電平之間隨機(jī)變化,從而使畫面出現(xiàn)細(xì)斑,而人眼對灰度平坦區(qū)域的顆粒噪聲又很敏感,從而使人主觀感覺上圖像降質(zhì)嚴(yán)重。第120頁,課件共438頁,創(chuàng)作于2023年2月

(3)假輪廓圖案。假輪廓圖案主要是由于量化間隔太大,而圖像灰度緩慢變化區(qū)域的預(yù)測誤差信號太小,就會產(chǎn)生像地形圖中等高線一樣的假輪廓圖案。(4)邊沿忙亂。邊沿忙亂主要在電視圖像DPCM編碼中出現(xiàn),因?yàn)椴煌瑤谕幌袼匚恢蒙狭炕肼暩鞑幌嗤?,黑白邊沿在電視監(jiān)視上將呈現(xiàn)閃爍跳動犬齒狀邊沿。第121頁,課件共438頁,創(chuàng)作于2023年2月

(5)誤碼擴(kuò)散。任何數(shù)字信道中總是存在著誤碼。在DPCM系統(tǒng)中,即使某一位碼有差錯,對圖像一維預(yù)測來講,將使該像素以后的同一行各個像素都產(chǎn)生差錯。而對二維預(yù)測,誤碼引起的差錯還將擴(kuò)散到以下各行。這樣將使圖像質(zhì)量大大下降,其影響的程度取決于誤碼在信號代碼中的位置以及有誤碼的數(shù)碼所對應(yīng)的像素在圖像中的位置。第122頁,課件共438頁,創(chuàng)作于2023年2月

一般來說,一維預(yù)測誤碼呈水平條狀圖案,而二維預(yù)測誤碼呈“彗星狀”向右下方擴(kuò)散。二維預(yù)測比一維預(yù)測抗誤碼能力強(qiáng)得多。對電視圖像來講,要使圖像質(zhì)量達(dá)到人不能察覺的降質(zhì),實(shí)驗(yàn)表明,對DPCM要求傳輸誤碼應(yīng)優(yōu)于5×10-6,而對于一維前值預(yù)測DPCM則應(yīng)優(yōu)于10-9,二維DPCM應(yīng)優(yōu)于10-8。第123頁,課件共438頁,創(chuàng)作于2023年2月4.5.4自適應(yīng)預(yù)測編碼在討論線性預(yù)測中,我們假設(shè)輸入數(shù)據(jù)是平穩(wěn)的隨機(jī)過程。然而,實(shí)際的輸入數(shù)據(jù)并非是平穩(wěn)過程,或總體上平穩(wěn),但局部不平穩(wěn)。此時,按照量化信噪比的觀點(diǎn)來看,使用固定參數(shù)的線性預(yù)測是不合理的,這時可以采用自適應(yīng)預(yù)測的編碼方法??梢远ㄆ诘刂匦掠?jì)算協(xié)方差矩陣和相應(yīng)的加權(quán)因子,充分利用其統(tǒng)計(jì)特性及其變化,重新調(diào)整預(yù)測參數(shù),這樣就使得預(yù)測器隨著輸入數(shù)據(jù)的變化而變化,從而也得到較為理想的輸出。第124頁,課件共438頁,創(chuàng)作于2023年2月

自適應(yīng)預(yù)測又可分為線性自適應(yīng)預(yù)測和非線性自適應(yīng)預(yù)測兩種編碼方法,這里只簡單介紹一種線性自適應(yīng)預(yù)測方案,對于非線性預(yù)測則要復(fù)雜得多。

1977年Yamada提出二維DPCM的一個自適應(yīng)預(yù)測方案,所采用的xn與鄰近像素的關(guān)系如圖4.5-2所示,預(yù)測公式為(4.5-10)第125頁,課件共438頁,創(chuàng)作于2023年2月

式中,a1=0.75,a4=0.25,k是一個自適應(yīng)參數(shù),按下式定義取值:(4.5-11)第126頁,課件共438頁,創(chuàng)作于2023年2月*4.5.5運(yùn)動補(bǔ)償和運(yùn)動估值

1.運(yùn)動補(bǔ)償在幀間預(yù)測編碼中,為了達(dá)到較高的壓縮比,最關(guān)鍵的就是要得到盡可能小的幀間誤差。在普通的幀間預(yù)測中,實(shí)際上僅在背景區(qū)進(jìn)行預(yù)測時可以獲得較小的幀間差。如果要對運(yùn)動區(qū)域進(jìn)行預(yù)測,首先要估計(jì)出運(yùn)動物體的運(yùn)動矢量V,然后再根據(jù)運(yùn)動矢量進(jìn)行補(bǔ)償,即找出物體在前一幀的區(qū)域位置,這樣求出的預(yù)測誤差才比較

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論