自適應差分脈碼調(diào)制_第1頁
自適應差分脈碼調(diào)制_第2頁
自適應差分脈碼調(diào)制_第3頁
自適應差分脈碼調(diào)制_第4頁
自適應差分脈碼調(diào)制_第5頁
已閱讀5頁,還剩50頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

自適應差分脈碼調(diào)制第1頁,共55頁,2023年,2月20日,星期六4.2.1概述幾十年來,人們一直致力于壓縮數(shù)字化語音占用頻帶的工作,也就是在相同質(zhì)量指標下,努力降低數(shù)字化語音比特率,以提高數(shù)字通信系統(tǒng)的頻帶利用率語音壓縮方法有DPCM

SBCATCCELPMPLPCVQADPCMADPCM在更低的碼率下(16-8kbps),質(zhì)量明顯下降第2頁,共55頁,2023年,2月20日,星期六4.2.2DPCM基本原理第3頁,共55頁,2023年,2月20日,星期六4.2.3ADPCM基本原理極點預測器預測誤差濾波器重建濾波器第4頁,共55頁,2023年,2月20日,星期六4.2.4語音壓縮編碼原理框圖第5頁,共55頁,2023年,2月20日,星期六語音編碼技術(shù)概述語音編碼:移動通信數(shù)字化的基礎(chǔ)第1/2代蜂窩系統(tǒng)根本區(qū)別語音編碼的意義:提高通話質(zhì)量(數(shù)字化+信道編碼糾錯)提高頻譜利用率(低碼率編碼)提高系統(tǒng)容量(低碼率,語音激活技術(shù))第6頁,共55頁,2023年,2月20日,星期六語音編碼分類語音編碼器波形編碼器參量編碼器頻域時域非差分子帶編碼自適應變換域編碼差分PCMDPCMM連續(xù)可變斜率MADPCMAPC線性預測編碼聲碼器信道聲碼器共振峰聲碼器倒頻譜聲碼器語音激勵聲碼器多脈沖激勵LPC碼本激勵LPC矢量和激勵LPC第7頁,共55頁,2023年,2月20日,星期六語音編碼分類波形編碼:將時域模擬話音的波形信號進過采樣、量化和編碼形成數(shù)字語音信號---《現(xiàn)代通信原理》編碼速率較高,16k~64k包括:PCM,ADPCM,M,CVSDM,APC等占用較高帶寬,適合有線參量編碼:基于人類語音的產(chǎn)生機理建立數(shù)學模型,根據(jù)輸入語音得出模型參數(shù)并傳輸,在收端恢復。編碼速率較低,1.2~4.8kbps包括各種線形預測編碼(LPC)方法和余弦聲碼器語音質(zhì)量中等,不滿足商用要求混合編碼:波形編碼+參量編碼(LPAS)包括GSM的RPE-LPC編碼和VSELP編碼第8頁,共55頁,2023年,2月20日,星期六語音編碼的標準G.711PCM(64kbps)G.721ADPCM(32kbps)G.7227kHz帶寬64kbps速率內(nèi)的音頻編碼G.7236.3k/5.6k雙速率多媒體語音編碼G.72816kbps語音編碼LD-CELPG.7298kbps多媒體語音編碼第9頁,共55頁,2023年,2月20日,星期六語音編碼的發(fā)展極低速率語音編碼,600bps高保真語音編碼自適應多速率語音編碼新的編碼分析技術(shù):非線形預測多精度時頻分析技術(shù)(子波分析技術(shù))高階統(tǒng)計分析技術(shù)第10頁,共55頁,2023年,2月20日,星期六線形預測編碼的原理原理:模型化人類語音信號產(chǎn)生的機制,提取模型參數(shù),并且只傳輸模型的參數(shù)。語音信號的產(chǎn)生模型:語音的產(chǎn)生,聲帶和聲道不同語音產(chǎn)生的原因:聲音激勵源和聲道不同聲音分類:濁音和清音發(fā)聲過程口腔和鼻腔形成時變?yōu)V波器第11頁,共55頁,2023年,2月20日,星期六清音和濁音清濁音頻譜清濁音信號第12頁,共55頁,2023年,2月20日,星期六語音產(chǎn)生模型語音模型的建立:1.產(chǎn)生激勵,2.響應模型參數(shù):基音,共振峰頻率及強度,清濁音判決低碼率編碼碼率降低有限合成的語音波形失去了自然度和音質(zhì)周期脈沖發(fā)生器隨機噪聲發(fā)生器G時變數(shù)字濾波器清/濁音開關(guān)聲道參數(shù)基音周期第13頁,共55頁,2023年,2月20日,星期六LPC語音編碼使誤差均方最小,可求得一組預測系數(shù){ak},傳送:預測系數(shù),基音周期合增益,清濁音判決第14頁,共55頁,2023年,2月20日,星期六4.2.5圖像編碼變換:編碼第15頁,共55頁,2023年,2月20日,星期六圖像壓縮標準可壓縮的原因已有的標準第16頁,共55頁,2023年,2月20日,星期六為什么要變換和量化變換量化熵編碼具有優(yōu)良頻率特性的濾波器作變換工具,有利于得到平穩(wěn)的能量分布,有利于進一步的量化處理原始信號的信息損失主要發(fā)生在量化階段,好的量化能以盡可能少的量化誤差換取最小的碼率+=高質(zhì)量編碼器編碼與變換、量化第17頁,共55頁,2023年,2月20日,星期六4.2.6DFT與DCTDFT變換結(jié)果有虛部和實部對DFT變換系數(shù)量化后,吉布斯效應明顯把x(n)對稱延拓,可以消除其中的虛部,得到DCT變換第18頁,共55頁,2023年,2月20日,星期六正交變換的一個例子假設(shè)圖象的大小只有一個4×4的塊,即一共16個點,其中每個象素點都有一定的值,我們把這個值叫灰度值。對圖象而言,這些值為0~255之間的整數(shù)。假設(shè)一幅4×4的圖象,它的灰度值如下:

第19頁,共55頁,2023年,2月20日,星期六下面我們對這個4×4的圖象做變換,變換矩陣我們選:一般我們希望它是正交矩陣,即變換矩陣和它的逆矩陣的乘積,為單位矩陣,即:第20頁,共55頁,2023年,2月20日,星期六對上述圖像作變換,可以驗證:我們希望這個過程是可逆的,即可以驗證:

=

第21頁,共55頁,2023年,2月20日,星期六二維4×4DCT變換若

表示矩陣對應元素相乘,d=b/c,那么上式可以表示為時,為最優(yōu)變換矩陣第22頁,共55頁,2023年,2月20日,星期六在這里,d取5/2,非常接近最優(yōu)值此時,,得到整數(shù)變換矩陣的正變換為:

二維4×4DCT整數(shù)變換第23頁,共55頁,2023年,2月20日,星期六二維4×4DCT變換與量化對于9比特的預測誤差數(shù)據(jù)做變換,變換矩陣每一行絕對值之和的最大值為14,因此對于變換后的矩陣元素需要位來表示?,F(xiàn)在大多數(shù)處理裝置(如CPU,DSP)為32位寬,用上述變換進行處理就沒有數(shù)據(jù)溢出的危險。

一旦得到變換后的系數(shù),我們就可以對變換系數(shù)進行量化操作。對于某個量化步長QStep,對應一個量化參數(shù)Q,量化參數(shù)Q的取值范圍為0到44整數(shù),量化就是把變換得到的結(jié)果都除以QStep:

第24頁,共55頁,2023年,2月20日,星期六可以得到:其中,,floor表示向負無窮取整。量化參數(shù)Q與量化步長QStep的對應關(guān)系如表1。從表1中可以看出,量化參數(shù)Q每增加5時,量化步長QStep就隨之翻倍增加??梢缘玫降?5頁,共55頁,2023年,2月20日,星期六Q01234567891011…QStep

0.6250.68750.81250.87511.251.3751.6251.7522.52.75…Q…14…19…24…29…34…39…QStep

…4…8…16…32…64…128…表1量化參數(shù)Q與量化步長QStep的對應關(guān)系

第26頁,共55頁,2023年,2月20日,星期六Moret首先提出了小波的概念(Moret小波函數(shù)是Grossmann和Morlet在1984年提出的),在很多學者的共同努力下,小波理論得到了完善和發(fā)展。特別是Mallat,他提出的多分辨率分析(Multiresolutionanalysis,MRA)理論,對小波構(gòu)造理論起到了十分重要的作用。

1976年,Crochiere等人首先把子帶編碼應用于語音編碼。在語音編碼中,用作頻譜QMF(Quadraturemirrorfilter)濾波器能夠很好地解決過度帶頻率混疊問題,而且很自然地,人們把QMF引入二維信號處理。子帶就是小波分解后,得到不同的頻帶分量的時域或者空域表現(xiàn)。子帶編碼的基本思想是,把信號分成多個子帶,然后對各個子帶進行編碼。4.2.7小波變換與QMF第27頁,共55頁,2023年,2月20日,星期六QMF濾波器混疊問題(aliasing)從信號處理角度看:QMF濾波器能夠很好地解決過度帶頻率混疊問題。假設(shè):得到:同理:第28頁,共55頁,2023年,2月20日,星期六小波分解從函數(shù)正交分解角度看:小波分解能夠很好地解決信號的重構(gòu)問題。Meyer于1985-1986年度在Boubaki研討會上提出了二進小波概念,完善了QMF濾波器的理論,為QMF把頻譜以二分分解提供了理論依據(jù)。對于具有緊支的標準正交函數(shù)系,任何連續(xù)可積函數(shù)的取樣值為:

那么,x(t)可以寫成:

由于(t-n)對不同的n正交,對x(t)的小波分解算法可以寫成:

可以證明,(t-n)對不同的n正交,等價于:

第29頁,共55頁,2023年,2月20日,星期六Mallat提出了多分辨率分析(Multiresolutionanalysis,MRA)理論,希望得到圖象3個方向的紋理特征,以便機器識別第30頁,共55頁,2023年,2月20日,星期六小波和QMF的比較完備性概念具有相同的信號完全重構(gòu)的條件具有相同的信號分解和重構(gòu)的算法小波分解采用的是L2空間中完備的正交基小波理論,能構(gòu)造出相同抽頭(Taps)下,不同性能的濾波器小波分析有更廣泛的應用,除了編碼,還能用在信號檢測、微分方程、曲面擬合等領(lǐng)域。第31頁,共55頁,2023年,2月20日,星期六正交小波的構(gòu)造第32頁,共55頁,2023年,2月20日,星期六根據(jù)MRA的思想,Daubechies設(shè)計了正交性能良好的高低通濾波器組,但是它們不對稱即不滿足線性相位,因此不能完全重構(gòu)圖象的邊界第33頁,共55頁,2023年,2月20日,星期六雙正交小波的構(gòu)造

第34頁,共55頁,2023年,2月20日,星期六3/5雙正交小波

???-1/8???-1/8第35頁,共55頁,2023年,2月20日,星期六3/5小波分解與重構(gòu)中的對齊問題

x2x1x0

x1x2……xn-4xn-3xn-2xn-1xn-2ck-1/81/43/41/4-1/8…………-1/81/43/41/4-1/8

dk(-1)n1/41/21/4…………1/41/21/40c00c10c2…….cn-20cn-10cn-11/41/21/4……………..1/41/21/40d00d00d1…….dn-20dn-10dn-2(-1)n-1/81/43/41/4-1/8-1/81/43/41/4-1/8分解取偶數(shù)點,重構(gòu)時補0在奇數(shù)點,分解時在奇數(shù)點,補0在偶數(shù)點。然后以邊界點為中心對稱延拓,分解和重構(gòu)時延拓方式是一樣的。第36頁,共55頁,2023年,2月20日,星期六矢量小波(Multiwavelets)第37頁,共55頁,2023年,2月20日,星期六SOM多重小波具有很好的低通、帶通和高通特性,具有提高編碼質(zhì)量的潛力第38頁,共55頁,2023年,2月20日,星期六零樹量化(EZWSPIHT)第39頁,共55頁,2023年,2月20日,星期六Wavelet與DCT的比較(Y)第40頁,共55頁,2023年,2月20日,星期六Wavelet與DCT的比較(UV)第41頁,共55頁,2023年,2月20日,星期六DCT變換編碼,17.95dBWavelet變換編碼,20.98dB小波變換可以有效的克服塊效應第42頁,共55頁,2023年,2月20日,星期六(a)

Lenna原圖(b)

0.005bpp,PSNR=20.76dB

(c)0.01bpp,PSNR=22.72dB

(d)0.02bpp,PSNR=24.21dB(e)0.05bpp,PSNR=27.30dB(f)

0.1bpp,PSNR=28.81dB

小波編碼在高碼率和低碼率情況下都取得很很好的實驗結(jié)果第43頁,共55頁,2023年,2月20日,星期六編碼的尺寸可伸縮性編碼的質(zhì)量可伸縮性小波變換編碼具有可伸縮性第44頁,共55頁,2023年,2月20日,星期六小波編碼的數(shù)據(jù)結(jié)構(gòu)的量化手段十分有利于可伸縮性編碼和解碼

第45頁,共55頁,2023年,2月20日,星期六4.2.8視頻編碼與H.264隨著數(shù)字技術(shù)的發(fā)展,欣賞數(shù)字影視成為大眾娛樂生活的重要內(nèi)容。數(shù)字影視以數(shù)字信號形式,或者說以bit的形式在各種介質(zhì)(或者叫存儲器)存儲和傳輸。我們希望在容量有限的存儲器內(nèi)存放更多的電影數(shù)量,或者希望在網(wǎng)絡點播中看到更流暢的電影作品。然而存儲器的容量或者網(wǎng)絡能提供的帶寬總是不能滿足人們不斷增長的需要,這就推動了視頻壓縮編碼技術(shù)的發(fā)展。第46頁,共55頁,2023年,2月20日,星期六對于CIF格式的視頻流,它的畫面大小是352×288個象素,每個象素點用8個bit來表示,對于黑白的畫面來說,一幅畫面需要352×288×8=811,008bit,如果是彩色畫面,則需要1,216,512。為了欣賞到連續(xù)的畫面,根據(jù)人類的視覺特性,每秒差不多要播放25個這樣的畫面(或者叫幀),才不會有快鏡頭的感覺(比如象卓別林的老電影)。那么,對于一部60分鐘長的電影,它需要的存儲量為1,216,512×25×60×60=109,486,080,000,約為13,685,760,000個字節(jié),即13個G的存儲空間。市場上的硬盤目前流行的一般為150個G,也就是說,這么一個硬盤里面只能放10部電影,這遠遠不能滿足我們實際的需要

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論