




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
7.1概述7.2語(yǔ)音信號(hào)壓縮編碼原理和系統(tǒng)壓縮評(píng)價(jià)7.3語(yǔ)音信號(hào)的波形編碼7.4語(yǔ)音信號(hào)的參數(shù)編碼7.5語(yǔ)音信號(hào)的混合編碼第七章語(yǔ)音編碼7.1概述語(yǔ)音編碼(SpeechCoding)從信息論角度看,信源編碼是要以最少的數(shù)碼表示信源所發(fā)的信號(hào),語(yǔ)音編碼屬于信源編碼的范疇。語(yǔ)音編碼通過(guò)減少傳輸碼率(或存儲(chǔ)量),來(lái)達(dá)到提高傳輸(或存儲(chǔ))效率的目的。語(yǔ)音編碼分為三類:*波形編碼:重建后的語(yǔ)音時(shí)域信號(hào)的波形與原語(yǔ)音信號(hào)保持一致。*參數(shù)編碼:通過(guò)建立語(yǔ)音信號(hào)的產(chǎn)生模型,提取其特征參數(shù)來(lái)編碼,波形上不要求與原信號(hào)匹配,又稱聲碼器技術(shù)。*混合編碼:有機(jī)結(jié)合以上兩種編碼方式,基于語(yǔ)音產(chǎn)生模型的假定并采用分析合并技術(shù)。三種編碼方式的比較波形編碼參數(shù)編碼混合編碼編碼信息波形模型參數(shù)綜合比特率9.6~64Kbps2.4~9.6Kbps16~24Kbps優(yōu)點(diǎn)適應(yīng)能力強(qiáng),語(yǔ)音質(zhì)量好有效降低了編碼比特率語(yǔ)音質(zhì)量明顯提高缺點(diǎn)隨著量化粗糙語(yǔ)音質(zhì)量下降合成語(yǔ)音質(zhì)量低,處理復(fù)雜度高編碼速率明顯上升典型代表自適應(yīng)差分編碼調(diào)制(ADPCM)LPC-10、LPC-10E多脈沖激勵(lì)線性預(yù)測(cè)編碼(MPLPC)規(guī)則脈沖激勵(lì)線性預(yù)測(cè)編碼(RPE-LPC)7.2語(yǔ)音信號(hào)壓縮編碼原理和系統(tǒng)壓縮評(píng)價(jià)
語(yǔ)音信號(hào)中存在著冗余度(包括時(shí)域與頻域),人的聽(tīng)覺(jué)感知機(jī)理也有很多可以利用的特點(diǎn)。語(yǔ)音信號(hào)壓縮編碼之所以可行,正是因?yàn)檫@兩種情況的存在。
語(yǔ)音編碼依據(jù)之一:語(yǔ)音信號(hào)冗余度基本時(shí)域冗余:語(yǔ)音信號(hào)幅度非均勻分布性語(yǔ)音信號(hào)樣本間的強(qiáng)相關(guān)性濁音語(yǔ)音段具有的準(zhǔn)周期性聲道形狀及其變化的緩慢性靜止系數(shù)(即語(yǔ)音間隙性)
基本頻域冗余:從長(zhǎng)時(shí)間的功率譜密度來(lái)看,語(yǔ)音信號(hào)具有強(qiáng)烈的非平坦性,存在著固定的冗余度。而且高頻能量通常較低,恰好對(duì)應(yīng)于時(shí)域上的相鄰樣本相關(guān)性。從短時(shí)功率譜密度來(lái)看,語(yǔ)音信號(hào)在不同頻率交替出現(xiàn)峰值(共振峰)與谷值。整個(gè)功率譜的細(xì)節(jié)基于基音頻率形成高次諧波結(jié)構(gòu)。
語(yǔ)音編碼依據(jù)之二:人的聽(tīng)覺(jué)特點(diǎn)人類聽(tīng)覺(jué)系統(tǒng)存在著掩蔽效應(yīng),即高聲級(jí)單音會(huì)明顯掩蔽臨近頻率聲音。對(duì)于不同頻段的聲音,人耳的敏感程度不盡相同。人類對(duì)于語(yǔ)音信號(hào)的周期性(即音調(diào))極為敏感,但對(duì)信號(hào)的相位卻充耳不聞。語(yǔ)音編碼中的幾項(xiàng)關(guān)鍵技術(shù)線性預(yù)測(cè)
線性預(yù)測(cè)傳送整個(gè)反應(yīng)過(guò)程變化的參數(shù),其出發(fā)點(diǎn)在于跟蹤波形的產(chǎn)生過(guò)程而非波形本身?;谌珮O點(diǎn)模型假設(shè),使得語(yǔ)音信號(hào)編碼的比特率得到有效的降低。語(yǔ)音信號(hào)中存在的兩點(diǎn)相關(guān)性樣點(diǎn)間的短時(shí)相關(guān)性相鄰基音周期之間的長(zhǎng)時(shí)相關(guān)性
激勵(lì)發(fā)生器1
————P(z)1
————A(z)合成語(yǔ)音語(yǔ)音信號(hào)合成模型圖示其中信號(hào)源為預(yù)測(cè)余量信號(hào),1/P(z)為長(zhǎng)時(shí)預(yù)測(cè)濾波器,1/A(z)為短時(shí)預(yù)測(cè)濾波器。語(yǔ)音信號(hào)的短時(shí)相關(guān)性可用一個(gè)全極點(diǎn)模型來(lái)描述,其傳輸函數(shù)H(z)為:短時(shí)預(yù)測(cè)系數(shù)濾波器階數(shù)而濾波器是語(yǔ)音信號(hào)長(zhǎng)時(shí)相關(guān)性的模型,其一般形式為:延時(shí)參數(shù)(基音周期)長(zhǎng)時(shí)預(yù)測(cè)系數(shù)合成分析合成分析原理
合成分析在編碼器中加入綜合器,并將其與分析器結(jié)合從而產(chǎn)生與譯碼器端相同的語(yǔ)音,而后根據(jù)誤差原理調(diào)整使得誤差最小化。合成分析背景
16Kbps以下的高質(zhì)量語(yǔ)音編碼在當(dāng)今得到極大關(guān)注,使得傳統(tǒng)的量化方法對(duì)誤差最小化已無(wú)能為力。因此,合成分析的方法被引入。感覺(jué)加權(quán)濾波器產(chǎn)生背景:理論與現(xiàn)實(shí)的出入
對(duì)于低碼率(4~16Kbps)的語(yǔ)音編碼,理論上的最小均方誤差(MMSE)在實(shí)際應(yīng)用時(shí)卻因?yàn)槿说穆?tīng)覺(jué)特點(diǎn)而障礙重重。在這種背景下,根據(jù)人耳的掩蔽效應(yīng)設(shè)計(jì)的感覺(jué)加權(quán)濾波器得到了廣泛的應(yīng)用。在實(shí)際應(yīng)用中,共振峰處的噪聲相對(duì)于能量較低處的頻段更加不易被察覺(jué),故高能量段處的誤差要求不高。因此,感覺(jué)加權(quán)濾波器被提出,用以衡量語(yǔ)音間的誤差。
此時(shí),只需在高頻段處較大,低頻段處較小,就可以升高不敏感的高頻段的誤差,同時(shí)降低較敏感的低頻段的誤差,從而達(dá)到目的。抽樣頻率重建語(yǔ)音傅立葉變換原始語(yǔ)音傅立葉變換誤差表示其傳遞函數(shù)為:
的作用就是使實(shí)際信號(hào)誤差的譜呈現(xiàn)與語(yǔ)音信號(hào)類似的包絡(luò)形狀,從而在掩蔽效應(yīng)的作用下在主觀聽(tīng)覺(jué)上產(chǎn)生較好的效果。加權(quán)因子預(yù)測(cè)系數(shù)語(yǔ)音壓縮系統(tǒng)的性能評(píng)判指標(biāo)較為重要的性能評(píng)價(jià)準(zhǔn)則編碼速率(比特率),決定了編碼器工作時(shí)占用的信道帶寬,要求盡可能降低。編碼器的頑健性,要求良好。編碼器的時(shí)延,要求最小化。誤碼容限,要求保持較高值。算法復(fù)雜度(包括運(yùn)算復(fù)雜度與內(nèi)存要求),影響硬件成本,盡可能降低。算法可擴(kuò)展性,越高越好。適用于低比特率語(yǔ)音編碼質(zhì)量的評(píng)價(jià)
計(jì)算較簡(jiǎn)單,但沒(méi)有考慮實(shí)際情況,故適用于高比特率語(yǔ)音編碼質(zhì)量的評(píng)價(jià)7.3語(yǔ)音信號(hào)的波形編碼波形編碼波形編碼是語(yǔ)音編碼系統(tǒng)在早期所廣泛采用的方法,它把語(yǔ)音信號(hào)當(dāng)成普通的波形信號(hào)來(lái)處理從而保持原波形形狀。波形編碼適應(yīng)能力強(qiáng),合成語(yǔ)音質(zhì)量好,但比特率過(guò)高,編碼的效率也不盡如人意。幾種典型的波形編碼:脈沖編碼調(diào)制(PCM)自適應(yīng)預(yù)測(cè)編碼自適應(yīng)增量調(diào)制(ADM)自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)子帶編碼(SBC)脈沖編碼調(diào)制形式一:均勻PCM
最簡(jiǎn)單最原始的波形編碼方式,沒(méi)有運(yùn)用壓縮技術(shù),產(chǎn)生的比特率也極高,故在當(dāng)今運(yùn)用極少。形式二:非均勻PCM將信號(hào)進(jìn)行非線性變換后再均勻量化,變換后信號(hào)具有均勻概率密度分布。編碼時(shí)常采用對(duì)數(shù)變換壓縮(譯碼時(shí)指數(shù)擴(kuò)展)。非線性壓縮均勻量化編碼解碼非線性擴(kuò)張非線性壓縮擴(kuò)張的非均勻量化器A律壓縮擴(kuò)張技術(shù)(中國(guó)標(biāo)準(zhǔn))
μ律壓縮擴(kuò)張技術(shù)(北美及日本標(biāo)準(zhǔn))
形式三:自適應(yīng)PCM
無(wú)論是均勻或是非均勻PCM,量化間隔總是隨著量化器的確定而固定。而自適應(yīng)PCM引入的自適應(yīng)幅值變化概念使得量化間隔Δ可以匹配于輸入信號(hào)方差,或是量化器增益G可以隨著幅值而變化,從而使信號(hào)能量在量化前恒定。Q【·】編碼器解碼器匹配自適應(yīng)編碼器Q【·】X解碼器+匹配自適應(yīng)兩種自適應(yīng)方法的原理
按照自適應(yīng)參數(shù)的來(lái)源劃分Q【·】編碼器解碼器自適應(yīng)系統(tǒng)Q【·】編碼器自適應(yīng)系統(tǒng)解碼器自適應(yīng)系統(tǒng)反饋?zhàn)赃m應(yīng)前饋?zhàn)赃m應(yīng)前饋?zhàn)赃m應(yīng)是計(jì)算信號(hào)有效值并決定最合適的量化間隔,用此間隔控制量化器,并將量化間隔信息發(fā)送給接收端。反饋?zhàn)赃m應(yīng)是由編碼器輸出來(lái)決定量化間隔,而在接收端由量化傳輸來(lái)的幅度信息自動(dòng)生成量化間隔。無(wú)須將量化間隔傳送到信道中去,但對(duì)誤差的靈敏度要求較高。自適應(yīng)預(yù)測(cè)編碼LPC計(jì)算-預(yù)測(cè)器系數(shù)發(fā)端收端自適應(yīng)預(yù)測(cè)編碼器(APC)利用線性預(yù)測(cè)來(lái)改進(jìn)編碼中的量化器性能根據(jù)信號(hào)量化噪聲比的定義:信號(hào)平均能量預(yù)測(cè)誤差平均能量量化噪聲平均能量
由此可知引入線性預(yù)測(cè)后,SNR可得到改善。預(yù)測(cè)增益自適應(yīng)增量調(diào)制(ADM)
增量調(diào)制的基本方案:
增量調(diào)制方式將下一個(gè)語(yǔ)音信號(hào)與當(dāng)前語(yǔ)音信號(hào)比較,如果高于當(dāng)前值則系統(tǒng)編碼1,否則系統(tǒng)編碼0.
自適應(yīng)增量調(diào)制的工作方式:自適應(yīng)增量調(diào)制隨輸入波形自適應(yīng)的改變量化階梯的大小,在信號(hào)平均斜率大時(shí)自動(dòng)增大量化階梯,反之減小。
自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)
差分脈沖編碼調(diào)制(DPCM):
不同于DM的一位編碼,DPCM多位量化對(duì)兩個(gè)采樣點(diǎn)之間的差分信號(hào)利用多位量化進(jìn)行編碼,使信息量得到壓縮的同時(shí)降低了信道負(fù)載。
+量化+預(yù)測(cè)發(fā)送端+預(yù)測(cè)接收端+
但采用固定的高階預(yù)測(cè),改善效果并不明顯,于是,高階自適應(yīng)預(yù)測(cè)作為相應(yīng)的解決方式被提出,自適應(yīng)預(yù)測(cè)器隨著語(yǔ)音特征變化不斷更新預(yù)測(cè)系數(shù),從而獲得更高的預(yù)測(cè)增益。-量化預(yù)測(cè)系數(shù)自適應(yīng)+預(yù)測(cè)后向自適應(yīng)預(yù)測(cè)編碼結(jié)構(gòu)框圖:子帶編碼(SBC)子帶編碼原理:
子帶編碼屬于頻域編碼,它首先將語(yǔ)音信號(hào)通過(guò)帶通濾波器分割為若干頻帶(子帶),而后對(duì)子帶信號(hào)進(jìn)行頻譜平移變?yōu)榛鶐盘?hào),再利用奈奎斯特速率抽樣,最后進(jìn)行編碼處理。
子帶編碼優(yōu)點(diǎn):分帶后可去除信號(hào)相關(guān)性,獲得與時(shí)域一樣的效果。不同子帶擁有不同比特?cái)?shù),可獲得更佳主觀聽(tīng)音質(zhì)量。各子帶間量化噪音相互獨(dú)立互不干擾。
自適應(yīng)變換編碼(ATC)
編碼原理:
自適應(yīng)變換編碼利用正交變換將信號(hào)由時(shí)域變換到另外一個(gè)域,使變換域系數(shù)密集化,從而使信號(hào)相鄰樣本間冗余度得到降低。
正交變換DCT的優(yōu)點(diǎn):頻域變換明顯,較易控制量化噪聲頻率范圍。兼顧性能與計(jì)算量,不需要傳輸特征矢量。變換效率高于DFT,且在頻域區(qū)的畸變更小。
7.4語(yǔ)音信號(hào)的參數(shù)編碼參數(shù)編碼針對(duì)語(yǔ)音信號(hào)的特征參數(shù)來(lái)編碼,只適用于語(yǔ)音信號(hào)。實(shí)際應(yīng)用中一般采用的實(shí)現(xiàn)設(shè)備是線性預(yù)測(cè)聲碼器。線性預(yù)測(cè)分析器編碼器音調(diào)檢測(cè)器線性預(yù)測(cè)合成器解碼器信道LPC聲碼器框圖LPC參數(shù)的變換與量化①反射系數(shù):
對(duì)反射系數(shù)的值在【-1,1】區(qū)間一般進(jìn)行非線性量化,另外比特?cái)?shù)分配應(yīng)遞減。②對(duì)數(shù)面積比:針對(duì)對(duì)數(shù)面積比的方式是最為有效的編碼方式,很適合數(shù)字編碼與傳輸:其中Ai為面積函數(shù),通過(guò)上式可知幅度均勻分布,可以采用均勻量化。
變幀率LPC聲碼器
為降低LPC聲碼器的速率,應(yīng)用了變幀速率編碼(VFR)技術(shù)的變幀率LPC聲碼器應(yīng)運(yùn)產(chǎn)生。通過(guò)付出編解碼復(fù)雜化與時(shí)延的代價(jià),變幀率LPC聲碼器可明顯降低傳輸數(shù)碼率同時(shí)保持音質(zhì)。LPC-10編碼器
LPC-10利用簡(jiǎn)單的二元激勵(lì)取代余量信號(hào),在2.4kbps的速率上得到了清晰的合成語(yǔ)音,在當(dāng)代長(zhǎng)期被作為標(biāo)準(zhǔn)算法使用。但因?yàn)榧?lì)信號(hào)選取的影響,抗噪能力與自然度仍不盡如人意。7.5語(yǔ)音信號(hào)的混合編碼20世紀(jì)80年代后期,綜合了參數(shù)編碼低比特率與波形編碼高語(yǔ)音質(zhì)量?jī)?yōu)點(diǎn)的混合編碼得到廣泛的使用。它在假定語(yǔ)音產(chǎn)生模型的同時(shí)將模型參數(shù)編碼,吸收了兩者的優(yōu)點(diǎn)。合成編碼方法(LPAS)是目前最廣泛研究的語(yǔ)音編碼算法,它通過(guò)線性預(yù)測(cè)確定
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 私人住宿出租合同及條款
- 7 媽媽睡了(教學(xué)設(shè)計(jì))2024-2025學(xué)年統(tǒng)編版語(yǔ)文二年級(jí)上冊(cè)
- 度合同型車輛生產(chǎn)及裝配特許協(xié)議
- 不動(dòng)產(chǎn)權(quán)與動(dòng)產(chǎn)汽車交換合同
- 重型貨車運(yùn)輸合同協(xié)議
- 12《尋找生活中的標(biāo)志》(教學(xué)設(shè)計(jì))-2023-2024學(xué)年二年級(jí)上冊(cè)綜合實(shí)踐活動(dòng)魯科版
- 5 走近科學(xué)家 教學(xué)設(shè)計(jì)-2024-2025學(xué)年道德與法治三年級(jí)上冊(cè)統(tǒng)編版
- 2 學(xué)會(huì)溝通交流第1課時(shí)正確對(duì)待不同看法 教學(xué)設(shè)計(jì)-2024-2025學(xué)年道德與法治五年級(jí)上冊(cè)統(tǒng)編版
- 1《清平樂(lè) 清平樂(lè)》 (教學(xué)設(shè)計(jì))2023-2024學(xué)年統(tǒng)編版六年級(jí)語(yǔ)文下冊(cè)
- 油罐保溫合同范本
- CB/T 102-1996錫基合金軸瓦鑄造技術(shù)條件
- 羅森便利店QSC標(biāo)準(zhǔn)課件講義
- 售后服務(wù)的流程圖
- 讀《讀懂孩子》讀書心得體會(huì)
- 《勞動(dòng)合同法》普法宣傳資料
- 二年級(jí)下冊(cè)科學(xué)教案-2.3科技產(chǎn)品體驗(yàn)會(huì) 大象版
- 退役軍人優(yōu)待證申領(lǐng)表
- Q∕SY 19001-2017 風(fēng)險(xiǎn)分類分級(jí)規(guī)范
- 勞務(wù)分包項(xiàng)目經(jīng)理崗位職責(zé)
- 幼兒繪本故事:奇怪的雨傘店
- 鋼琴基礎(chǔ)教程教案
評(píng)論
0/150
提交評(píng)論