數(shù)據(jù)壓縮預測編碼_第1頁
數(shù)據(jù)壓縮預測編碼_第2頁
數(shù)據(jù)壓縮預測編碼_第3頁
數(shù)據(jù)壓縮預測編碼_第4頁
數(shù)據(jù)壓縮預測編碼_第5頁
已閱讀5頁,還剩30頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、1第第5章章 預測編碼 具有具有M 種取值的符號序列種取值的符號序列 ,第,第L 符號的熵滿足:符號的熵滿足: kx預測預測 HxxxxHxxxHxxHxHMLLLLLLLLL),|(),|()|()(log12121122第第5章章 預測編碼 5.1 DPCM基本原理基本原理工作過程:工作過程:1)先發(fā)送)先發(fā)送 2)在)在 基礎上進行預測,得到預測值;基礎上進行預測,得到預測值; 3)差分,量化和編碼)差分,量化和編碼 4)重復一樣的過程,預測器必須相同)重復一樣的過程,預測器必須相同 10Nxx10Nxx35.2 最佳線性預測最佳線性預測非時變線性預測非時變線性預測:預測誤差預測誤差:一

2、、一、MMSE線性預測線性預測預測誤差的均方值預測誤差的均方值MSE最小的必要條件最小的必要條件)(22kkexxENiikikkkkxaxxxe1Niikikxax10)(ikkkxxxE0)(22ikkkieaxxxEaikkikkxxExxE45.2 最佳線性預測最佳線性預測定義自相關函數(shù)得到由于自相關函數(shù)滿足當 廣義平穩(wěn)時有),(jixxEjiRkx),(1ikNjjkiikkxxaExxEikkRNjiikjkRa1),(),(),(jkikRikjkR)()(),(ijRjiRjkikR55.2 最佳線性預測最佳線性預測得到 實對稱的 Toeplitz矩陣,正定,可逆。 如果 各態(tài)

3、歷經(jīng)的且N 足夠大由上述方法求出的最佳預測系數(shù)得到的最小均方誤差)()2() 1 ( )0( )2( ) 1( )2( )0( ) 1 () 1( ) 1 ( )0(21NRRRaaaRNRNRNRRRNRRRNkxkiNiixxNkR11)(NiiiRaR12min)()0(65.2 最佳線性預測最佳線性預測二、預測階數(shù)的選擇二、預測階數(shù)的選擇l當當N 足夠大使預測誤差不相關足夠大使預測誤差不相關 再增大再增大N 不會使均方誤差在減小。不會使均方誤差在減小。l若若 為為N 階馬爾克夫過程,則用階馬爾克夫過程,則用N 階預測。階預測。例5-2 設 為一階馬爾克夫序列,其相關系數(shù)求解 的公式若N

4、 =1,則ia)0(0jeeEjkkkxkx75.2 最佳線性預測最佳線性預測誤差:有若加大N =2,與N =1時的預測表達式完全相等。2mine85.3 音頻信號與聽覺感知音頻信號與聽覺感知人耳可聽到的聲音頻率范圍:人耳可聽到的聲音頻率范圍:20Hz20KHz一、語音信號的時域冗余度一、語音信號的時域冗余度1、幅度非均勻分布、幅度非均勻分布2、樣本間的相關性、樣本間的相關性3、基音之間的相關性、基音之間的相關性語音語音 濁音(嗓音)濁音(嗓音) 清音(非嗓音)清音(非嗓音)4、話音間隔、話音間隔5、長時自相關函數(shù)、長時自相關函數(shù)95.3 音頻信號與聽覺感知音頻信號與聽覺感知二、語音信號的頻域

5、冗余度二、語音信號的頻域冗余度1、非均勻的長時功率譜密度、非均勻的長時功率譜密度2、語音特有的短時功率譜密度、語音特有的短時功率譜密度105.3 音頻信號與聽覺感知音頻信號與聽覺感知三、單音的聽覺感知三、單音的聽覺感知 人類聽覺系統(tǒng)(人類聽覺系統(tǒng)(HAS,Human Auditory System) 帶通濾波器組,帶通濾波器組,一系列帶寬遞增的帶通濾波器組成一系列帶寬遞增的帶通濾波器組成 可聞閾(聽覺閾):人耳剛能聽見的聲壓級可聞閾(聽覺閾):人耳剛能聽見的聲壓級 疼痛閾:使人耳有痛感的聲壓級疼痛閾:使人耳有痛感的聲壓級 聽覺范圍:疼痛閾和可聞閾之差聽覺范圍:疼痛閾和可聞閾之差HAS表現(xiàn)特性(

6、純音)表現(xiàn)特性(純音) 1)響度:與頻率有關)響度:與頻率有關 1kHz/10dB 200Hz/30dB 2)頻率:可聞閾與頻率有關)頻率:可聞閾與頻率有關 24kHZ 低低 16kHz高高 3)相位:對相位感知不敏感)相位:對相位感知不敏感115.3 音頻信號與聽覺感知音頻信號與聽覺感知三、多音的掩蔽效應三、多音的掩蔽效應 掩蔽效應:一個聲音的存在會影響人耳對另一掩蔽效應:一個聲音的存在會影響人耳對另一 個聲音的聽覺能力。個聲音的聽覺能力。 掩蔽閾:單音都有一個掩蔽閾掩蔽閾:單音都有一個掩蔽閾 其聲壓級越高,對其周圍頻率聲音的其聲壓級越高,對其周圍頻率聲音的 掩蔽效應越強。掩蔽效應越強。 1

7、25.4 語音信號的預測編碼語音信號的預測編碼一、基于預測的語音壓縮技術一、基于預測的語音壓縮技術 波形編碼波形編碼:被編碼的語音信號與重建信號波形基 本相同。 語聲編碼語聲編碼:重建信號聽起來與原始聲音基本一樣 混合編碼混合編碼:綜合兩種方法 。幾個階段:幾個階段:1)增量調(diào)制)增量調(diào)制 DM, Delta modulation 1kkkkkxxxxe135.4 語音信號的預測編碼語音信號的預測編碼2)DPCM3)ADPCM 預測器或量化器中引入自適應調(diào)節(jié) 1986-1990 ITU-T 制定的語音編碼標準技術基礎4)LPC聲碼器:聲碼器: 不傳送預測誤差,傳送參數(shù) 波形編碼 參數(shù)編碼145

8、.4 語音信號的預測編碼語音信號的預測編碼5)混合編碼)混合編碼 RELP: 殘差激勵線性預測 CELP:碼激勵線性預測(1984 提出) LD-CELP:低時延的碼激勵線性預測(G.728建議,1992) ACELP:代數(shù)碼激勵線性預測(G.723.1建議,1996) CS-ACELP:共軛結構代數(shù)碼激勵線性預測(G.729建議,1996)155.5 靜止圖像的預測編碼靜止圖像的預測編碼一、預測器設計一、預測器設計 1、預測器 一維預測: 二維預測: 三維預測:2、相關性的強弱3、階數(shù)選擇4、預測器實現(xiàn)5、系數(shù)確定165.5 靜止圖像的預測編碼靜止圖像的預測編碼二、二、JPEG無損壓縮模式無

9、損壓縮模式 空間域無量化DPCM,Huffman或算術編碼175.5 靜止圖像的預測編碼靜止圖像的預測編碼三、三、JPEG-LS壓縮標準壓縮標準l近無損、無損壓縮標準,1998正式公布lJPEG-LS編碼系統(tǒng)1)基于上下文的建模 計算其鄰域點變化量 判斷進入預測還是游程185.5 靜止圖像的預測編碼靜止圖像的預測編碼2)預測 自適應非線性預測 =3)常規(guī)模式的誤差編碼 4)游程模式195.6 視頻信號與視覺感知視頻信號與視覺感知一、電視信號概述一、電視信號概述 PAL 25幀/s 625行 視頻帶寬6M 205.6 視頻信號與視覺感知視頻信號與視覺感知二、數(shù)字化格式二、數(shù)字化格式CCIT601

10、:對彩色電視信號的亮度和色差采樣編碼采樣頻率:13.5MHz(亮度)215.6 視頻信號與視覺感知視頻信號與視覺感知采樣頻率:13.5MHz(亮度)l采樣定理l行頻的整數(shù)倍l兼容三種國際標準制式取樣結構:4:4:4 4:2:2 4:1:1數(shù)碼率:r=(13.5+6.75+6.75)*8=216Mb/s r=3*13.5*8=324Mb/s225.6 視頻信號與視覺感知視頻信號與視覺感知三、電視信號的冗余度三、電視信號的冗余度空間冗余:時間冗余(幀間冗余):l 幀間差值 l 對相鄰兩幀圖像進行測試 黑白圖像:幀間差值超過3的像素不到4% 變化劇烈的彩色序列:亮度6 只有7.5% 色度 只有千分之

11、7.5l 可視電話,電視會議 ),(),(),(1nmxnmxnmd235.6 視頻信號與視覺感知視頻信號與視覺感知四、人的視覺感知特性四、人的視覺感知特性彩色電視信號的數(shù)碼率彩色電視信號的數(shù)碼率人類視覺系統(tǒng)人類視覺系統(tǒng) (HVS,human visual system)1)亮度掩蔽特性:背景較明或較暗時,人眼對亮度分辨)亮度掩蔽特性:背景較明或較暗時,人眼對亮度分辨能力下降。能力下降。2)空間掩蔽特性:隨著空間變化頻率的提高,人眼對亮)空間掩蔽特性:隨著空間變化頻率的提高,人眼對亮度(灰度)分辨能力下降度(灰度)分辨能力下降3)時間掩蔽特性:隨著時間變化頻率的提高,人眼對細)時間掩蔽特性:隨

12、著時間變化頻率的提高,人眼對細節(jié)和亮度分辨能力下降節(jié)和亮度分辨能力下降 ( )()()srBZrf RP YP CP CfR245.7 活動圖像的預測編碼活動圖像的預測編碼一、幀間預測編碼一、幀間預測編碼1、發(fā)展、發(fā)展2、編碼方法、編碼方法1)條件幀修補法)條件幀修補法2)運動補償預測)運動補償預測電視圖像特點(可視電話、電視會議和電視等)l背景區(qū):l運動物體區(qū):l暴露區(qū):),(),(),(1nmxnmxnmd255.7 活動圖像的預測編碼活動圖像的預測編碼3、運動補償預測組成運動補償預測組成1)圖像分割:把圖像分為)圖像分割:把圖像分為靜止和運動兩部分靜止和運動兩部分.2)運動估值:估計物體

13、的)運動估值:估計物體的位移量,得到運動矢位移量,得到運動矢量量.3)運動補償:用運動矢量)運動補償:用運動矢量補償物體的運動效果,補償物體的運動效果,再預測再預測.4)編碼:幀間運動誤差和)編碼:幀間運動誤差和運動矢量運動矢量.265.7 活動圖像的預測編碼活動圖像的預測編碼二、快匹配運動估值二、快匹配運動估值l對當前幀的每一個子塊,對當前幀的每一個子塊,在上一幀某一搜索范圍在上一幀某一搜索范圍內(nèi)尋找最優(yōu)匹配,該子內(nèi)尋找最優(yōu)匹配,該子塊和最優(yōu)匹配塊之間的塊和最優(yōu)匹配塊之間的位移就是運動矢量。位移就是運動矢量。當前幀搜索窗當前宏塊匹配宏塊運動矢量參考幀275.7 活動圖像的預測編碼活動圖像的預

14、測編碼1)判斷準則)判斷準則歸一化互相關函數(shù)歸一化互相關函數(shù)(NCCF)均方誤差均方誤差(MSE)最小絕對差最小絕對差(MAD) , ( | ),(),(|1),(maxmaxmaxmax111dxjdxdyidyjnimxnmxMNjiMADMmNn ),(),(),(),(),(2/11010212/11010210101MmNnkMmNnkMmNnkkjnimxnmxjnimxnmxjiNCCF( , )( , )(,)MNkkmnMSE i jx m nxmi nj MN1121001285.7 活動圖像的預測編碼活動圖像的預測編碼2)搜索策略)搜索策略全局搜索法(Full Searc

15、h Method,F(xiàn)S) 二維對數(shù)搜索法(Two-Dimensional Logarithmic,TDL基本思想:從原點開始,以“十”字形分布的五個點構成每次搜索的點群,通過快速搜索跟蹤最小塊誤差MAD點。Step 1:從原點開始,選取一定的步長,以十字形分布的五個點處進行MAD值的計算并比較。Step 2:若MBD點在邊緣四個點處,則以該點為中心點,保持步長不變,重新搜索十字形分布的五個點; 若MBD點位于中心點,則保持中心點位置不變,將十字點群的步長減半,并在五個點處計算。Step 3:若步長為1,在中心及周圍8個點處找出MBD點,該點所在位置即對應最佳匹配點,算法結束;否則重復Step

16、2。295.7 活動圖像的預測編碼活動圖像的預測編碼 0,-4、+4,-4、+6,-4是每個搜索階段的最小塊誤差點若+5,-4是8個點中的最小MBD, 則運動矢量為+5,-4, 305.7 活動圖像的預測編碼活動圖像的預測編碼2)搜索策略)搜索策略三步搜索法(Three Step Search,TSS) 四步搜索法(Four Step Search,F(xiàn)SS) 基于塊的梯度下降搜索法 (Block-Based Gradient Descent Search,BBGDS) 菱形搜索法(Diamond Search) 基本思想:兩種搜索模板,5個檢測點的小模板SDSM 和9個檢測點的大模板LDSM。

17、搜索時先用大模板計算,當最小塊誤差MAD點出現(xiàn)在中心點處時,將大模板LDSM換為SDSM,再進行匹配計算,這時5個點中的MAD即為最優(yōu)匹配點。315.7 活動圖像的預測編碼活動圖像的預測編碼菱形搜索法SDSM LDSM 325.7 活動圖像的預測編碼活動圖像的預測編碼3)塊的劃分)塊的劃分H261,MPEG1,2 16*16H263 16*16 高級預測模式 4個8*8 H264 7種模式335.8 高光譜遙感圖像的預測編碼高光譜遙感圖像的預測編碼 對同一對象(區(qū)域或目標)對同一對象(區(qū)域或目標) 在多個窄光譜波段范圍上獲在多個窄光譜波段范圍上獲 得的圖像得的圖像 。一、特點一、特點1)三維)

18、三維 空間冗余空間冗余 譜間冗余譜間冗余2)豐富紋理信息,空間相關性較弱)豐富紋理信息,空間相關性較弱 各波段的成像對象是同一地物,在結構上具有相似性各波段的成像對象是同一地物,在結構上具有相似性3)預測、變換和矢量量化等方法去除兩種冗余)預測、變換和矢量量化等方法去除兩種冗余4)無損壓縮、近無損壓縮。)無損壓縮、近無損壓縮。二、二、DPCM預測預測345.8 高光譜遙感圖像的預測編碼高光譜遙感圖像的預測編碼三、最小絕對權值(三、最小絕對權值(MAW)預測樹方法)預測樹方法1、原理、原理把一幅圖像看作一個加權圖把一幅圖像看作一個加權圖每個像素為圖中的一個頂點,四鄰域像素之間的連線每個像素為圖中的一個頂點,四鄰域像素之間的連線為圖中的邊,邊的兩端像素之差為邊的權值為圖中的邊,邊的兩端像素之差為邊的權值

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論