第五章 補充 常用壓縮編碼方法_第1頁
第五章 補充 常用壓縮編碼方法_第2頁
第五章 補充 常用壓縮編碼方法_第3頁
第五章 補充 常用壓縮編碼方法_第4頁
第五章 補充 常用壓縮編碼方法_第5頁
已閱讀5頁,還剩59頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第五章補充常用壓縮編碼方法第1頁,共64頁,2023年,2月20日,星期三統(tǒng)計編碼:屬于無失真編碼。根據(jù)信源符號出現(xiàn)概率的分布特性進行編碼,讓概率大的信源符號用短碼字表示,讓概率小的信源符號用長碼字表示,從而去除數(shù)據(jù)之間的冗余而達到壓縮的目的。預測編碼:根據(jù)離散信號之間存在一定的相關性特點,利用前面的一個或多個信號對下一個信號進行預測,然后對實際值和預測值的差值進行編碼。第2頁,共64頁,2023年,2月20日,星期三變換編碼:屬于有失真的編碼。變換編碼是將原始數(shù)據(jù)從初始空間或時間域進行數(shù)學變換,變換為更適合于壓縮的抽象域。關鍵的是要尋找一個最佳變換,使信息中最重要的部分易于識別。變換本身是可逆的無損的,為了取得更好的效果,忽略了一些編碼位數(shù)較長的系數(shù)而成為了有損編碼。變換域有一定的物理意義,其系數(shù)包含信號的某些成分,根據(jù)需要做刪除,達到壓縮目的。第3頁,共64頁,2023年,2月20日,星期三分析/合成編碼:是基于某種模型的編碼方法,這些模型可以是聲道模型、語音模型、人體模型等。通過分析模型的具體特征,確定與之匹配的編碼。第4頁,共64頁,2023年,2月20日,星期三其他編碼方法常見的有: 混合編碼(HybridCoding)、 矢量量化(VectorQuantize,VQ)、 LZW算法等。人工神經(jīng)元網(wǎng)絡(ArtificialNeuralNetwork,ANN)算法、 分形(Fractal)算法、小波(Wavelet)算法、 基于對象(Object-Based)的算法、 基于模型(Model-Based)的算法等。第5頁,共64頁,2023年,2月20日,星期三數(shù)據(jù)壓縮的性能指標

衡量一種數(shù)據(jù)壓縮技術的重要性能指標有壓縮比、壓縮速度、壓縮質量和計算量。壓縮比壓縮比是指原始數(shù)據(jù)量和壓縮后數(shù)據(jù)量的比值。例如,MPGE是一種包含音頻和圖像在內的壓縮技術,利用MPEG-1、MPEG-2、MPEG-4三個方案,對音頻的感知編碼中,MPEG-1方案的音頻壓縮比是1:4,MPEG-2方案的音頻壓縮比是1:6…1:8,MPEG-4方案的音頻壓縮比是1:10…1:12。但是MPEG對圖像的壓縮算法,所提供的壓縮比可以高達200:1。利用JPEG也可以有多種圖像的壓縮比,甚至可以減小到原圖像的百分之一(壓縮比100:1)。

第6頁,共64頁,2023年,2月20日,星期三壓縮速度壓縮速度指編碼或解碼的快慢程度。不同的應用場合,對壓縮速度要求是不同的。對于一個壓縮系統(tǒng)而言,有對稱壓縮和非對稱壓縮之分。對稱壓縮,就是壓縮和解壓縮都需要實時進行的。例如:電視會議的圖形傳輸。非對稱壓縮常常在解壓縮方面要求是實時的,但壓縮可以不是實時的。例如,多媒體CD-ROM的制作過程可以不是實時的,但解壓縮必須是實時的,否則用戶看到的就不是連續(xù)的圖像。第7頁,共64頁,2023年,2月20日,星期三壓縮質量

壓縮質量是指壓縮以后對媒體的感知效果。有損壓縮才可能影響人對媒體的感知效果。壓縮質量的好壞與壓縮算法、數(shù)據(jù)內容和壓縮比有密切的關系。

例如,使用JPEG編碼時,當壓縮比為20:1時,能看到圖像稍微有點變化,當壓縮比大于20:1時,一般圖像質量開始變壞。第8頁,共64頁,2023年,2月20日,星期三統(tǒng)計編碼

統(tǒng)計編碼屬于一種無失真的編碼,具體實現(xiàn)的方法有多種,包括行程編碼、LZW編碼、Huffman編碼、算術編碼。統(tǒng)計編碼又稱熵編碼。根據(jù)信息論的原理,我們可以找到最佳的壓縮編碼方法,數(shù)據(jù)壓縮的理論極限是信息熵。也就是說,信息中可能存在著冗余信息,要去除信息的冗余部分,使編碼后單位數(shù)據(jù)量等于其信息源的熵,就達到了壓縮極限。

信息論認為信源中存在的冗余度來自于信源本身的相關性和信源概率分布的不均勻性。熵編碼要解決的問題,是如何利用信息熵理論減少數(shù)據(jù)在存儲和傳輸中的冗余度,即要找到去除信源的相關性和概率分布的不均勻性的方法。

第9頁,共64頁,2023年,2月20日,星期三預測編碼常用的解除相關性的措施:預測和變換預測有可能完全解決序列的相關性,但必須知道序列的概率統(tǒng)計特性變換只能解除矢量內部的相關性,它可以有許多變換方式以適應不同的信源。第10頁,共64頁,2023年,2月20日,星期三預測編碼

預測編碼是一種有失真的編碼,DPCM編碼和ADPCM編碼是兩種較典型的預測編碼,它們比較適用于聲音和圖像數(shù)據(jù)的壓縮。預測編碼

預測編碼是根據(jù)離散信號之間存在一定的相關性的特點,利用前面的一個或多個信號對下一個信號進行預測,然后對實際值和預測值的差值進行編碼。預測編碼根據(jù)預測器的設計分為線性預測和非線性預測。但為了預測的效率,大多采用線性預測。第11頁,共64頁,2023年,2月20日,星期三預測編碼非常適用于聲音和圖像方面的壓縮。對于聲音來講,預測的對象是聲波的下一個幅度、下一個音色。對于圖像而言,預測的對象是下一個像點、下一條線或下一幀。聲音和圖像中通常都存在冗余的信號,而且在相鄰的音色或相鄰像點之間的相關性比較強,它們的差值比較小,這樣任何音色或像點都可以通過已知樣本值進行預測。對于連續(xù)的多幀圖像,上下幀通常具有一些相同的部分內容,如背景和靜止的物體,可以預計在一定的時間內將不會發(fā)生變化。主要對其差值進行編碼,可以達到壓縮的目的。第12頁,共64頁,2023年,2月20日,星期三預測編碼時首先要存儲的是當前內容,接著以把當前內容作為樣板,預測下一個信號,將預測所得的不同內容進行存儲或傳輸,如內容相同則是數(shù)據(jù)冗余,予以剔除。這樣數(shù)據(jù)量將會大幅度減少,達到壓縮效果。預測編碼常見的方法有DPCM、ADPCM、ΔM、Δ-∑M調制編碼。預測編碼主要采用壓縮圖像數(shù)據(jù)的空間冗余和時間冗余的方法,簡捷且易于實現(xiàn),但要求數(shù)據(jù)傳輸速度很高。另外,預測編碼方法的壓縮能力有限。為了進一步提高數(shù)據(jù)壓縮的能力,可采用其它編碼方法,例如變換編碼。第13頁,共64頁,2023年,2月20日,星期三差分脈沖編碼(DPCM)的抽樣速率通常是與PCM相同,因此在編碼器中的帶限濾波器和解碼器中的平滑濾波器基本上與PCM系統(tǒng)中的濾波器是一樣的,但是它不是對每個采樣值進行量化的,而是根據(jù)前一個樣值預測下一個樣值,并量化實際值和預測值之間的差值。差分脈沖編碼的基本原理如下,在發(fā)送端輸入的采樣信號,經(jīng)量化器后傳送到編碼器,DPCM編碼器將產(chǎn)生不同抽樣值,簡單的抽樣方法就是將前一個輸入抽樣直接存儲在抽樣保持電路中,并使用模擬減法器來測試抽樣有無變化。如果信號有變化,則差值被量化、被編碼和傳輸。差分脈沖編碼的基本原理

第14頁,共64頁,2023年,2月20日,星期三量化器預測器XnEnEn’Xn’Xnqn恰好就是發(fā)送端的量化誤差。所以,DCPM系統(tǒng)中,量化器和預測器的設計是關鍵,好的預測器編碼應能根據(jù)信號的局部特性,調整量化器的步長和預測器的參數(shù),使得許多預測值和實際值之間差值為最小。在接收端,經(jīng)過和發(fā)信端的預測完全相同的操作,可以得到量化的原信號,然后再通過低通濾波便可恢復與原信號近似的波形。第15頁,共64頁,2023年,2月20日,星期三ADPCM編碼

ADPCM自適應差分編碼,它具有自適應編碼的特性,該編碼包括自適應量化和自適應預測兩種形式。ADPCM編碼的方法是針對輸入樣值進行自適應預測,然后對預測誤差進行量化編碼。

綜合了APCM的自適應特性和DPCM系統(tǒng)的差分特性,是一種性能比較好的波形編碼。它的核心想法是:①利用自適應的思想改變量化階的大小,即使用小的量化階(step-size)去編碼小的差值,使用大的量化階去編碼大的差值,②使用過去的樣本值估算下一個輸入樣本的預測值,使實際樣本值和預測值之間的差值總是最小。第16頁,共64頁,2023年,2月20日,星期三ADPCM主要用于對中等質量的音頻信號進行高效率壓縮。例如語音的壓縮、調幅廣播音質的信號壓縮等。CCITT的32kbit/s語音編碼標準G.721采用ADPCM編碼方式,每個語音樣值相當于用4個二進制位進行編碼。第17頁,共64頁,2023年,2月20日,星期三變換編碼

變換編碼是一種有失真編碼,所謂變換主要是將原始數(shù)據(jù)的原來的時間或空間域進行數(shù)學變換,使得通過變換后能夠突出原始數(shù)據(jù)中的重要部分,以便重點處理。變換編碼中的較為典型的是最佳變換(K-L變換)編碼和離散余弦變換(DCT)編碼,其中K-L變換是在均方誤差最小意義下導出的,其基向量是輸入數(shù)據(jù)向量協(xié)方差矩陣的特征向量,這種變換矩陣將隨著輸入數(shù)據(jù)的不同而不同,因此難于實現(xiàn)。第18頁,共64頁,2023年,2月20日,星期三圖像變換編碼不是直接對空間域圖像信號編碼,而是首先將當前所表達的空間域圖像信號經(jīng)過變換映射到另一個正交矢量空間,將得到一系列變換系數(shù),然后對這些變換系數(shù)進行編碼處理。結果是重要的系數(shù)在變換到其他空間域后,其編碼的精確度高于次重要的系數(shù)。變換本身是一種無損且可逆的技術,為了能獲得更好的編碼效果,忽略了一些不重要的系數(shù),由此成為了有損的技術。第19頁,共64頁,2023年,2月20日,星期三變換編碼原理如下。圖中,輸入信號經(jīng)過適當?shù)恼蛔儞Q到另一個頻域空間,相關性就會明顯減少,能量集中在頻域的少數(shù)低頻系數(shù)上,這樣就達到了數(shù)據(jù)壓縮的效果。如果保留頻域中系數(shù)大的元素,忽略小的系數(shù),然后輔以非線性量化來提高壓縮程度,最后進行編碼,可獲得很高的壓縮比。第20頁,共64頁,2023年,2月20日,星期三圖像傅立葉變換原圖像幅度譜相位譜第21頁,共64頁,2023年,2月20日,星期三圖像傅立葉變換原圖像幅度譜相位譜第22頁,共64頁,2023年,2月20日,星期三圖像傅立葉變換幅度譜告訴我們圖像中某種頻率的成份有多少相位譜告訴我們頻率成份位于圖像的什么位置通常我們只關心幅度譜下面兩個圖對應的幅度

譜是一樣(這里只顯示

了其幅度譜,當然相位

譜是不一樣的)第23頁,共64頁,2023年,2月20日,星期三圖像傅立葉變換從幅度譜中我們

可以看出明亮線

反映出原始圖像

的灰度級變化,

這正是圖像的輪

廓邊第24頁,共64頁,2023年,2月20日,星期三圖像傅立葉變換從幅度譜中我們

可以看出明亮線

和原始圖像中對

應的輪廓線是垂

直的。如果原始

圖像中有圓形區(qū)

域那么幅度譜中

也呈圓形分布第25頁,共64頁,2023年,2月20日,星期三圖像傅立葉變換圖像中的顆粒狀對

應的幅度譜呈環(huán)狀,

但即使只有一顆顆

粒,其幅度譜的模

式還是這樣。第26頁,共64頁,2023年,2月20日,星期三圖像傅立葉變換這些圖像沒有特定

的結構,左上角到

右下角有一條斜線,

它可能是由帽子和

頭發(fā)之間的邊線產(chǎn)

生的兩個圖像都存在一

些小邊界第27頁,共64頁,2023年,2月20日,星期三圖像傅立葉變換圖像發(fā)生旋轉時,幅度譜也相應的進行了旋轉第28頁,共64頁,2023年,2月20日,星期三圖像的K-L變換K-L變換也叫霍特林(Hotelling)變換,是一種基于圖像統(tǒng)計特性的變換K-L變換的協(xié)方差矩陣除對角線以外的元素都是零,消除了數(shù)據(jù)之間的相關性,從而在信息壓縮方面起著重要作用。K-L變換也稱分量分析(PrimaryComponentAnalysis,PCA)是圖像特征提取一種最優(yōu)正交線性變換,可以有效去掉一個隨機向量中各元素間的相關性。第29頁,共64頁,2023年,2月20日,星期三K-L變換編碼第30頁,共64頁,2023年,2月20日,星期三K-L變換編碼第31頁,共64頁,2023年,2月20日,星期三1.PCA(主分量分析/K-L)變換均值:偏差:協(xié)方差矩陣:第32頁,共64頁,2023年,2月20日,星期三PCA變換:PCA反變換:變換后均值為0,方差為:第33頁,共64頁,2023年,2月20日,星期三

ASIPP基于PCA方法特征臉空間的構建人臉識別就是將已檢測到的待識別人臉與數(shù)據(jù)庫中的已知人臉進行比較匹配,得出相關信息,來鑒別該人是誰。這一過程的核心是選擇恰當?shù)娜四槺碚鞣绞脚c匹配策略,即選擇合適的人臉模式的特征,根據(jù)所提取的特征進行匹配。人臉特征表述

第34頁,共64頁,2023年,2月20日,星期三

ASIPP基于PCA方法特征臉空間的構建ORL標準人臉庫由40人,每人10幅112×92圖像組成。這些圖像是拍攝于不同時期的;人的臉部表情和臉部細節(jié)有著不同程度的變化,比如,笑或不笑,眼睛或睜或閉,戴或不戴眼鏡;人臉姿態(tài)也有相當程度的變化,深度旋轉和平面旋轉可達20度;人臉的尺度也有多達10%的變化。ORL人臉庫(英國劍橋大學)

第35頁,共64頁,2023年,2月20日,星期三

ASIPPPCA介紹基于PCA構建特征臉空間是對圖像進行K-L變換,以去除樣本間的相關性,然后根據(jù)特征值的大小選擇特征向量。這種方法首先將人臉圖像映射為高維空間的向量,然后應用基于統(tǒng)計的離散K-L變換方法,構造一個各分量互不相關的特征空間,即特征臉空間,再將人臉圖像在高維空間中的向量映射到特征臉空間,得到特征系數(shù)?;赑CA方法特征臉空間的構建第36頁,共64頁,2023年,2月20日,星期三

ASIPP特征值與特征圖像

特征值ORL20人10幅×特征臉空間110201140PCA構建特征臉空間第37頁,共64頁,2023年,2月20日,星期三K-L變換的應用-人臉識別第38頁,共64頁,2023年,2月20日,星期三圖像的離散余弦變換DCT矩陣的左上角代表低頻分量,右下角代表高頻分量由DCT域圖像我們能夠了解圖像主要包含低頻成份DCT域圖像空間域圖像第39頁,共64頁,2023年,2月20日,星期三DCT變換編碼第40頁,共64頁,2023年,2月20日,星期三DCT變換編碼第41頁,共64頁,2023年,2月20日,星期三DCT變換編碼第42頁,共64頁,2023年,2月20日,星期三DCT變換編碼第43頁,共64頁,2023年,2月20日,星期三DCT變換編碼第44頁,共64頁,2023年,2月20日,星期三DCT變換編碼第45頁,共64頁,2023年,2月20日,星期三DCT變換編碼第46頁,共64頁,2023年,2月20日,星期三DCT與PCA的關系其特征值為:第47頁,共64頁,2023年,2月20日,星期三其特征向量為:其根為:第48頁,共64頁,2023年,2月20日,星期三小波變換發(fā)展1822年Fourier變換,在頻域的定位最準確,無任何時域定位能力。函數(shù),時域定位完全準確,頻域無任何定位能力1946年Gabor變換,STFT,窗函數(shù)的大小和形狀與時間和頻率無關而保持固定不變。不構成正交基。1980年Harr提出規(guī)范正交基。1984年,Morlet提出了連續(xù)小波1985年,Meyer,Grossmann,Daubecies提出離散的小波基1986年,Meyer證明了不可能存在時域頻域同時具有正則性的正交小波基,證明了小波的自正交性。1987年,Mallat統(tǒng)一了多分辨率分析和小波變換,給出了快速算法。1988年,Daubecies在NSF的小波專題研討會進行了講座。第49頁,共64頁,2023年,2月20日,星期三STFT與Wavelet第50頁,共64頁,2023年,2月20日,星期三

應用:將小波用于地震信號的分析與處理;將二進小波變換用于圖像的邊緣檢測、圖像壓縮與重構;將連續(xù)小波變換用于渦流的研究;將小波變換用于噪聲中的未知瞬態(tài)信號;將小波變換用于語音信號的分析、變換和綜合;將正交小波變換用于算子及擬微分算子的化簡;將小波變換的自適應性用于解微分方程;將小波變換用于電磁場領域的若干問題研究等,都取得了初步成果。第51頁,共64頁,2023年,2月20日,星期三波和小波(Wavelet)第52頁,共64頁,2023年,2月20日,星期三第53頁,共64頁,2023年,2月20日,星期三2.連續(xù)小波變換(CWT)小波變換的定義設函數(shù)f(t)∈L2(R),則小波變換的定義如下:其中,積分核為的函數(shù)族。a>0為尺度參數(shù)(伸縮參數(shù)),b為定位參數(shù)(平移參數(shù)),該函數(shù)稱為小波。若a>1函數(shù)ψ(t)具有伸展作用,若a<1函數(shù)ψ(t)具有收縮作用。伸縮參數(shù)a對ψ(t)的影響如下圖:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論