版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
7.1概述7.2語(yǔ)音信號(hào)壓縮編碼原理和系統(tǒng)壓縮評(píng)價(jià)7.3語(yǔ)音信號(hào)的波形編碼7.4語(yǔ)音信號(hào)的參數(shù)編碼7.5語(yǔ)音信號(hào)的混合編碼第七章語(yǔ)音編碼7.1概述語(yǔ)音編碼(SpeechCoding)從信息論角度看,信源編碼是要以最少的數(shù)碼表示信源所發(fā)的信號(hào),語(yǔ)音編碼屬于信源編碼的范疇。語(yǔ)音編碼通過(guò)減少傳輸碼率(或存儲(chǔ)量),來(lái)達(dá)到提高傳輸(或存儲(chǔ))效率的目的。語(yǔ)音編碼分為三類:*波形編碼:重建后的語(yǔ)音時(shí)域信號(hào)的波形與原語(yǔ)音信號(hào)保持一致。*參數(shù)編碼:通過(guò)建立語(yǔ)音信號(hào)的產(chǎn)生模型,提取其特征參數(shù)來(lái)編碼,波形上不要求與原信號(hào)匹配,又稱聲碼器技術(shù)。*混合編碼:有機(jī)結(jié)合以上兩種編碼方式,基于語(yǔ)音產(chǎn)生模型的假定并采用分析合并技術(shù)。三種編碼方式的比較波形編碼參數(shù)編碼混合編碼編碼信息波形模型參數(shù)綜合比特率9.6~64Kbps2.4~9.6Kbps16~24Kbps優(yōu)點(diǎn)適應(yīng)能力強(qiáng),語(yǔ)音質(zhì)量好有效降低了編碼比特率語(yǔ)音質(zhì)量明顯提高缺點(diǎn)隨著量化粗糙語(yǔ)音質(zhì)量下降合成語(yǔ)音質(zhì)量低,處理復(fù)雜度高編碼速率明顯上升典型代表自適應(yīng)差分編碼調(diào)制(ADPCM)LPC-10、LPC-10E多脈沖激勵(lì)線性預(yù)測(cè)編碼(MPLPC)規(guī)則脈沖激勵(lì)線性預(yù)測(cè)編碼(RPE-LPC)7.2語(yǔ)音信號(hào)壓縮編碼原理和系統(tǒng)壓縮評(píng)價(jià)
語(yǔ)音信號(hào)中存在著冗余度(包括時(shí)域與頻域),人的聽(tīng)覺(jué)感知機(jī)理也有很多可以利用的特點(diǎn)。語(yǔ)音信號(hào)壓縮編碼之所以可行,正是因?yàn)檫@兩種情況的存在。
語(yǔ)音編碼依據(jù)之一:語(yǔ)音信號(hào)冗余度基本時(shí)域冗余:語(yǔ)音信號(hào)幅度非均勻分布性語(yǔ)音信號(hào)樣本間的強(qiáng)相關(guān)性濁音語(yǔ)音段具有的準(zhǔn)周期性聲道形狀及其變化的緩慢性靜止系數(shù)(即語(yǔ)音間隙性)
基本頻域冗余:從長(zhǎng)時(shí)間的功率譜密度來(lái)看,語(yǔ)音信號(hào)具有強(qiáng)烈的非平坦性,存在著固定的冗余度。而且高頻能量通常較低,恰好對(duì)應(yīng)于時(shí)域上的相鄰樣本相關(guān)性。從短時(shí)功率譜密度來(lái)看,語(yǔ)音信號(hào)在不同頻率交替出現(xiàn)峰值(共振峰)與谷值。整個(gè)功率譜的細(xì)節(jié)基于基音頻率形成高次諧波結(jié)構(gòu)。
語(yǔ)音編碼依據(jù)之二:人的聽(tīng)覺(jué)特點(diǎn)人類聽(tīng)覺(jué)系統(tǒng)存在著掩蔽效應(yīng),即高聲級(jí)單音會(huì)明顯掩蔽臨近頻率聲音。對(duì)于不同頻段的聲音,人耳的敏感程度不盡相同。人類對(duì)于語(yǔ)音信號(hào)的周期性(即音調(diào))極為敏感,但對(duì)信號(hào)的相位卻充耳不聞。語(yǔ)音編碼中的幾項(xiàng)關(guān)鍵技術(shù)線性預(yù)測(cè)
線性預(yù)測(cè)傳送整個(gè)反應(yīng)過(guò)程變化的參數(shù),其出發(fā)點(diǎn)在于跟蹤波形的產(chǎn)生過(guò)程而非波形本身?;谌珮O點(diǎn)模型假設(shè),使得語(yǔ)音信號(hào)編碼的比特率得到有效的降低。語(yǔ)音信號(hào)中存在的兩點(diǎn)相關(guān)性樣點(diǎn)間的短時(shí)相關(guān)性相鄰基音周期之間的長(zhǎng)時(shí)相關(guān)性
激勵(lì)發(fā)生器1
————P(z)1
————A(z)合成語(yǔ)音語(yǔ)音信號(hào)合成模型圖示其中信號(hào)源為預(yù)測(cè)余量信號(hào),1/P(z)為長(zhǎng)時(shí)預(yù)測(cè)濾波器,1/A(z)為短時(shí)預(yù)測(cè)濾波器。語(yǔ)音信號(hào)的短時(shí)相關(guān)性可用一個(gè)全極點(diǎn)模型來(lái)描述,其傳輸函數(shù)H(z)為:短時(shí)預(yù)測(cè)系數(shù)濾波器階數(shù)而濾波器是語(yǔ)音信號(hào)長(zhǎng)時(shí)相關(guān)性的模型,其一般形式為:延時(shí)參數(shù)(基音周期)長(zhǎng)時(shí)預(yù)測(cè)系數(shù)合成分析合成分析原理
合成分析在編碼器中加入綜合器,并將其與分析器結(jié)合從而產(chǎn)生與譯碼器端相同的語(yǔ)音,而后根據(jù)誤差原理調(diào)整使得誤差最小化。合成分析背景
16Kbps以下的高質(zhì)量語(yǔ)音編碼在當(dāng)今得到極大關(guān)注,使得傳統(tǒng)的量化方法對(duì)誤差最小化已無(wú)能為力。因此,合成分析的方法被引入。感覺(jué)加權(quán)濾波器產(chǎn)生背景:理論與現(xiàn)實(shí)的出入
對(duì)于低碼率(4~16Kbps)的語(yǔ)音編碼,理論上的最小均方誤差(MMSE)在實(shí)際應(yīng)用時(shí)卻因?yàn)槿说穆?tīng)覺(jué)特點(diǎn)而障礙重重。在這種背景下,根據(jù)人耳的掩蔽效應(yīng)設(shè)計(jì)的感覺(jué)加權(quán)濾波器得到了廣泛的應(yīng)用。在實(shí)際應(yīng)用中,共振峰處的噪聲相對(duì)于能量較低處的頻段更加不易被察覺(jué),故高能量段處的誤差要求不高。因此,感覺(jué)加權(quán)濾波器被提出,用以衡量語(yǔ)音間的誤差。
此時(shí),只需在高頻段處較大,低頻段處較小,就可以升高不敏感的高頻段的誤差,同時(shí)降低較敏感的低頻段的誤差,從而達(dá)到目的。抽樣頻率重建語(yǔ)音傅立葉變換原始語(yǔ)音傅立葉變換誤差表示其傳遞函數(shù)為:
的作用就是使實(shí)際信號(hào)誤差的譜呈現(xiàn)與語(yǔ)音信號(hào)類似的包絡(luò)形狀,從而在掩蔽效應(yīng)的作用下在主觀聽(tīng)覺(jué)上產(chǎn)生較好的效果。加權(quán)因子預(yù)測(cè)系數(shù)語(yǔ)音壓縮系統(tǒng)的性能評(píng)判指標(biāo)較為重要的性能評(píng)價(jià)準(zhǔn)則編碼速率(比特率),決定了編碼器工作時(shí)占用的信道帶寬,要求盡可能降低。編碼器的頑健性,要求良好。編碼器的時(shí)延,要求最小化。誤碼容限,要求保持較高值。算法復(fù)雜度(包括運(yùn)算復(fù)雜度與內(nèi)存要求),影響硬件成本,盡可能降低。算法可擴(kuò)展性,越高越好。適用于低比特率語(yǔ)音編碼質(zhì)量的評(píng)價(jià)
計(jì)算較簡(jiǎn)單,但沒(méi)有考慮實(shí)際情況,故適用于高比特率語(yǔ)音編碼質(zhì)量的評(píng)價(jià)7.3語(yǔ)音信號(hào)的波形編碼波形編碼波形編碼是語(yǔ)音編碼系統(tǒng)在早期所廣泛采用的方法,它把語(yǔ)音信號(hào)當(dāng)成普通的波形信號(hào)來(lái)處理從而保持原波形形狀。波形編碼適應(yīng)能力強(qiáng),合成語(yǔ)音質(zhì)量好,但比特率過(guò)高,編碼的效率也不盡如人意。幾種典型的波形編碼:脈沖編碼調(diào)制(PCM)自適應(yīng)預(yù)測(cè)編碼自適應(yīng)增量調(diào)制(ADM)自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)子帶編碼(SBC)脈沖編碼調(diào)制形式一:均勻PCM
最簡(jiǎn)單最原始的波形編碼方式,沒(méi)有運(yùn)用壓縮技術(shù),產(chǎn)生的比特率也極高,故在當(dāng)今運(yùn)用極少。形式二:非均勻PCM將信號(hào)進(jìn)行非線性變換后再均勻量化,變換后信號(hào)具有均勻概率密度分布。編碼時(shí)常采用對(duì)數(shù)變換壓縮(譯碼時(shí)指數(shù)擴(kuò)展)。非線性壓縮均勻量化編碼解碼非線性擴(kuò)張非線性壓縮擴(kuò)張的非均勻量化器A律壓縮擴(kuò)張技術(shù)(中國(guó)標(biāo)準(zhǔn))
μ律壓縮擴(kuò)張技術(shù)(北美及日本標(biāo)準(zhǔn))
形式三:自適應(yīng)PCM
無(wú)論是均勻或是非均勻PCM,量化間隔總是隨著量化器的確定而固定。而自適應(yīng)PCM引入的自適應(yīng)幅值變化概念使得量化間隔Δ可以匹配于輸入信號(hào)方差,或是量化器增益G可以隨著幅值而變化,從而使信號(hào)能量在量化前恒定。Q【·】編碼器解碼器匹配自適應(yīng)編碼器Q【·】X解碼器+匹配自適應(yīng)兩種自適應(yīng)方法的原理
按照自適應(yīng)參數(shù)的來(lái)源劃分Q【·】編碼器解碼器自適應(yīng)系統(tǒng)Q【·】編碼器自適應(yīng)系統(tǒng)解碼器自適應(yīng)系統(tǒng)反饋?zhàn)赃m應(yīng)前饋?zhàn)赃m應(yīng)前饋?zhàn)赃m應(yīng)是計(jì)算信號(hào)有效值并決定最合適的量化間隔,用此間隔控制量化器,并將量化間隔信息發(fā)送給接收端。反饋?zhàn)赃m應(yīng)是由編碼器輸出來(lái)決定量化間隔,而在接收端由量化傳輸來(lái)的幅度信息自動(dòng)生成量化間隔。無(wú)須將量化間隔傳送到信道中去,但對(duì)誤差的靈敏度要求較高。自適應(yīng)預(yù)測(cè)編碼LPC計(jì)算-預(yù)測(cè)器系數(shù)發(fā)端收端自適應(yīng)預(yù)測(cè)編碼器(APC)利用線性預(yù)測(cè)來(lái)改進(jìn)編碼中的量化器性能根據(jù)信號(hào)量化噪聲比的定義:信號(hào)平均能量預(yù)測(cè)誤差平均能量量化噪聲平均能量
由此可知引入線性預(yù)測(cè)后,SNR可得到改善。預(yù)測(cè)增益自適應(yīng)增量調(diào)制(ADM)
增量調(diào)制的基本方案:
增量調(diào)制方式將下一個(gè)語(yǔ)音信號(hào)與當(dāng)前語(yǔ)音信號(hào)比較,如果高于當(dāng)前值則系統(tǒng)編碼1,否則系統(tǒng)編碼0.
自適應(yīng)增量調(diào)制的工作方式:自適應(yīng)增量調(diào)制隨輸入波形自適應(yīng)的改變量化階梯的大小,在信號(hào)平均斜率大時(shí)自動(dòng)增大量化階梯,反之減小。
自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)
差分脈沖編碼調(diào)制(DPCM):
不同于DM的一位編碼,DPCM多位量化對(duì)兩個(gè)采樣點(diǎn)之間的差分信號(hào)利用多位量化進(jìn)行編碼,使信息量得到壓縮的同時(shí)降低了信道負(fù)載。
+量化+預(yù)測(cè)發(fā)送端+預(yù)測(cè)接收端+
但采用固定的高階預(yù)測(cè),改善效果并不明顯,于是,高階自適應(yīng)預(yù)測(cè)作為相應(yīng)的解決方式被提出,自適應(yīng)預(yù)測(cè)器隨著語(yǔ)音特征變化不斷更新預(yù)測(cè)系數(shù),從而獲得更高的預(yù)測(cè)增益。-量化預(yù)測(cè)系數(shù)自適應(yīng)+預(yù)測(cè)后向自適應(yīng)預(yù)測(cè)編碼結(jié)構(gòu)框圖:子帶編碼(SBC)子帶編碼原理:
子帶編碼屬于頻域編碼,它首先將語(yǔ)音信號(hào)通過(guò)帶通濾波器分割為若干頻帶(子帶),而后對(duì)子帶信號(hào)進(jìn)行頻譜平移變?yōu)榛鶐盘?hào),再利用奈奎斯特速率抽樣,最后進(jìn)行編碼處理。
子帶編碼優(yōu)點(diǎn):分帶后可去除信號(hào)相關(guān)性,獲得與時(shí)域一樣的效果。不同子帶擁有不同比特?cái)?shù),可獲得更佳主觀聽(tīng)音質(zhì)量。各子帶間量化噪音相互獨(dú)立互不干擾。
自適應(yīng)變換編碼(ATC)
編碼原理:
自適應(yīng)變換編碼利用正交變換將信號(hào)由時(shí)域變換到另外一個(gè)域,使變換域系數(shù)密集化,從而使信號(hào)相鄰樣本間冗余度得到降低。
正交變換DCT的優(yōu)點(diǎn):頻域變換明顯,較易控制量化噪聲頻率范圍。兼顧性能與計(jì)算量,不需要傳輸特征矢量。變換效率高于DFT,且在頻域區(qū)的畸變更小。
7.4語(yǔ)音信號(hào)的參數(shù)編碼參數(shù)編碼針對(duì)語(yǔ)音信號(hào)的特征參數(shù)來(lái)編碼,只適用于語(yǔ)音信號(hào)。實(shí)際應(yīng)用中一般采用的實(shí)現(xiàn)設(shè)備是線性預(yù)測(cè)聲碼器。線性預(yù)測(cè)分析器編碼器音調(diào)檢測(cè)器線性預(yù)測(cè)合成器解碼器信道LPC聲碼器框圖LPC參數(shù)的變換與量化①反射系數(shù):
對(duì)反射系數(shù)的值在【-1,1】區(qū)間一般進(jìn)行非線性量化,另外比特?cái)?shù)分配應(yīng)遞減。②對(duì)數(shù)面積比:針對(duì)對(duì)數(shù)面積比的方式是最為有效的編碼方式,很適合數(shù)字編碼與傳輸:其中Ai為面積函數(shù),通過(guò)上式可知幅度均勻分布,可以采用均勻量化。
變幀率LPC聲碼器
為降低LPC聲碼器的速率,應(yīng)用了變幀速率編碼(VFR)技術(shù)的變幀率LPC聲碼器應(yīng)運(yùn)產(chǎn)生。通過(guò)付出編解碼復(fù)雜化與時(shí)延的代價(jià),變幀率LPC聲碼器可明顯降低傳輸數(shù)碼率同時(shí)保持音質(zhì)。LPC-10編碼器
LPC-10利用簡(jiǎn)單的二元激勵(lì)取代余量信號(hào),在2.4kbps的速率上得到了清晰的合成語(yǔ)音,在當(dāng)代長(zhǎng)期被作為標(biāo)準(zhǔn)算法使用。但因?yàn)榧?lì)信號(hào)選取的影響,抗噪能力與自然度仍不盡如人意。7.5語(yǔ)音信號(hào)的混合編碼20世紀(jì)80年代后期,綜合了參數(shù)編碼低比特率與波形編碼高語(yǔ)音質(zhì)量?jī)?yōu)點(diǎn)的混合編碼得到廣泛的使用。它在假定語(yǔ)音產(chǎn)生模型的同時(shí)將模型參數(shù)編碼,吸收了兩者的優(yōu)點(diǎn)。合成編碼方法(LPAS)是目前最廣泛研究的語(yǔ)音編碼算法,它通過(guò)線性預(yù)測(cè)確定
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 智能家居設(shè)備遠(yuǎn)程升級(jí)技術(shù)-深度研究
- 二零二四年度咨詢服務(wù)合同(市場(chǎng)調(diào)研及戰(zhàn)略規(guī)劃)
- 2025年廣東司法警官職業(yè)學(xué)院高職單招數(shù)學(xué)歷年(2016-2024)頻考點(diǎn)試題含答案解析
- 棗莊2025年度碎石環(huán)保處理合同3篇
- 2025年常州工業(yè)職業(yè)技術(shù)學(xué)院高職單招高職單招英語(yǔ)2016-2024歷年頻考點(diǎn)試題含答案解析
- 2025年山西老區(qū)職業(yè)技術(shù)學(xué)院高職單招職業(yè)技能測(cè)試近5年??及鎱⒖碱}庫(kù)含答案解析
- 2025年山東鋁業(yè)職業(yè)學(xué)院高職單招語(yǔ)文2018-2024歷年參考題庫(kù)頻考點(diǎn)含答案解析
- 2025年度存量房屋買(mǎi)賣(mài)合同(含房產(chǎn)交易糾紛解決機(jī)制)4篇
- 2025年度地質(zhì)災(zāi)害沉降觀測(cè)與防治工程合同范本4篇
- BZCY質(zhì)子導(dǎo)體電解質(zhì)制備及性能研究
- 小兒甲型流感護(hù)理查房
- 霧化吸入療法合理用藥專家共識(shí)(2024版)解讀
- 2021年全國(guó)高考物理真題試卷及解析(全國(guó)已卷)
- 拆遷評(píng)估機(jī)構(gòu)選定方案
- 趣味知識(shí)問(wèn)答100道
- 鋼管豎向承載力表
- 2024年新北師大版八年級(jí)上冊(cè)物理全冊(cè)教學(xué)課件(新版教材)
- 人教版數(shù)學(xué)四年級(jí)下冊(cè)核心素養(yǎng)目標(biāo)全冊(cè)教學(xué)設(shè)計(jì)
- JJG 692-2010無(wú)創(chuàng)自動(dòng)測(cè)量血壓計(jì)
- 三年級(jí)下冊(cè)口算天天100題(A4打印版)
- CSSD職業(yè)暴露與防護(hù)
評(píng)論
0/150
提交評(píng)論