實(shí)驗(yàn)4 基于MATLAB的語(yǔ)音信號(hào)LPC分析_第1頁(yè)
實(shí)驗(yàn)4 基于MATLAB的語(yǔ)音信號(hào)LPC分析_第2頁(yè)
實(shí)驗(yàn)4 基于MATLAB的語(yǔ)音信號(hào)LPC分析_第3頁(yè)
實(shí)驗(yàn)4 基于MATLAB的語(yǔ)音信號(hào)LPC分析_第4頁(yè)
實(shí)驗(yàn)4 基于MATLAB的語(yǔ)音信號(hào)LPC分析_第5頁(yè)
已閱讀5頁(yè),還剩15頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

實(shí)驗(yàn)四基于MATLAB的語(yǔ)音信號(hào)LPC分析

一、實(shí)驗(yàn)?zāi)康恼莆誏PC原理,會(huì)利用已學(xué)的知識(shí),編寫(xiě)程序估計(jì)線(xiàn)性預(yù)測(cè)系數(shù)以及LPC的推演參數(shù)。能利用所求的相關(guān)參數(shù)估計(jì)語(yǔ)音的端點(diǎn)、清濁音判斷、基因周期、共振峰等。二、實(shí)驗(yàn)原理LPC分析基本原理LPC分析為線(xiàn)性時(shí)不變因果穩(wěn)定系統(tǒng)V(z)建立一個(gè)全極點(diǎn)模型,并利用均方誤差準(zhǔn)則,對(duì)已知的語(yǔ)音信號(hào)s(n)進(jìn)行模型參數(shù)估計(jì)。如果利用P個(gè)取樣值來(lái)進(jìn)行預(yù)測(cè),則稱(chēng)為P階線(xiàn)性預(yù)測(cè)。假設(shè)用過(guò)去P個(gè)取樣值的加權(quán)之和來(lái)預(yù)測(cè)信號(hào)當(dāng)前取樣值,則預(yù)測(cè)信號(hào)為:(1)其中加權(quán)系數(shù)用表示,稱(chēng)為預(yù)測(cè)系數(shù),則預(yù)測(cè)誤差為:

(2)要使預(yù)測(cè)最佳,則要使短時(shí)平均預(yù)測(cè)誤差最小有:

(3)(4)令

(5)

最小的可表示成:(6)

顯然,誤差越接近于零,線(xiàn)性預(yù)測(cè)的準(zhǔn)確度在均方誤差最小的意義上為最佳,由此可以計(jì)算出預(yù)測(cè)系數(shù)。通過(guò)LPC分析,由若干幀語(yǔ)音可以得到若干組LPC參數(shù),每組參數(shù)形成一個(gè)描繪該幀語(yǔ)音特征的矢量,即LPC特征矢量。由LPC特征矢量可以進(jìn)一步得到很多種派生特征矢量,例如線(xiàn)性預(yù)測(cè)倒譜系數(shù)、線(xiàn)譜對(duì)特征、部分相關(guān)系數(shù)、對(duì)數(shù)面積比等等。不同的特征矢量具有不同的特點(diǎn),它們?cè)谡Z(yǔ)音編碼和識(shí)別領(lǐng)域有著不同的應(yīng)用價(jià)值。自相關(guān)法在最佳線(xiàn)性預(yù)測(cè)中,若用下式定義的時(shí)間平均最小均方準(zhǔn)則代替(3)式的集合平均最小均方準(zhǔn)則,即令(7)事實(shí)上就是短時(shí)自相關(guān)函數(shù),因而(8)(9)根據(jù)平穩(wěn)隨機(jī)信號(hào)的自相關(guān)性質(zhì),可得(10)由(6)式,可得:(11)綜上所述,可以得到如下矩陣形式:(12)協(xié)方差法

如果在最佳線(xiàn)性預(yù)測(cè)中,用下式定義的時(shí)間平均最小均方準(zhǔn)則代替(3)式的集合平均最小均方準(zhǔn)則,則可得到類(lèi)似的方程:(13)

可以看出,這里的數(shù)據(jù)段兩端不需要添加零取樣值。在理論上,協(xié)方差法計(jì)算出來(lái)的預(yù)測(cè)系數(shù)有可能造成預(yù)測(cè)誤差濾波器的不穩(wěn)定,但在實(shí)際上當(dāng)每幀信號(hào)取樣足夠多時(shí),其計(jì)算結(jié)果將與自相關(guān)法的結(jié)果很接近,因而穩(wěn)定性一般是能夠保證的(當(dāng)然這種方法也有量化效應(yīng)可能引起不穩(wěn)定的缺點(diǎn))。協(xié)方差解法的最大優(yōu)點(diǎn)在于不存在自相關(guān)法中兩端出現(xiàn)很大預(yù)測(cè)誤差的情況,在N和P相差不大時(shí),其參數(shù)估值比自相關(guān)法要精確的多。但是在語(yǔ)音信號(hào)處理時(shí),往往取N在200左右。此時(shí),自相關(guān)法具有較大誤差的段落在整個(gè)語(yǔ)音段中所占的比例很小,參數(shù)估值也是比較準(zhǔn)確的。在這種情況下,協(xié)方差法誤差較小的優(yōu)點(diǎn)就不再突出,其缺乏高效遞推算法的缺點(diǎn)成為了制約因素。所以,在語(yǔ)音信號(hào)處理中往往使用高效的自相關(guān)法。全極點(diǎn)聲道模型

能量分析是基于語(yǔ)音信號(hào)能量隨時(shí)間有相當(dāng)大的變化,將線(xiàn)性預(yù)測(cè)分析應(yīng)用于語(yǔ)音信號(hào)處理,不僅是為了利用其預(yù)測(cè)功能,更因?yàn)樗峁┝艘粋€(gè)非常好的聲道模型。將式(2)所示的方程看成是濾波器在語(yǔ)音信號(hào)激勵(lì)下的輸入輸出方程,則該濾波器稱(chēng)為預(yù)測(cè)誤差濾波器,其e(n)是輸出誤差。變換到z域,P階預(yù)測(cè)誤差濾波器的系統(tǒng)函數(shù)為(14)

可以看出,如果將預(yù)測(cè)誤差e(n)作為激勵(lì)信號(hào),使其通過(guò)預(yù)測(cè)誤差濾波器的逆濾波器H(Z),即(15)

則H(Z)的輸出為語(yǔ)音信號(hào)s(n),也就是說(shuō),H(Z)在預(yù)測(cè)誤差e(n)的激勵(lì)下可以合成語(yǔ)音。因此,H(Z)被稱(chēng)為語(yǔ)音信號(hào)的全極點(diǎn)模型,也稱(chēng)為語(yǔ)音合成器。該模型的參數(shù)就是P階線(xiàn)性預(yù)測(cè)的預(yù)測(cè)系數(shù)。因?yàn)轭A(yù)測(cè)誤差含有語(yǔ)音信號(hào)的基音信息,所以對(duì)于濁音,模型的激勵(lì)信號(hào)源是以基音周期重復(fù)的單位脈沖;對(duì)于清音,激勵(lì)信號(hào)源e(n)是自噪聲。

LPC如果聲道特性H(Z)用式(14)所示的全極點(diǎn)模型表示,有(16)

式中,S(z)和I(z)分別為語(yǔ)音信號(hào)和激勵(lì)源的Z變換。對(duì)人的聽(tīng)覺(jué)來(lái)說(shuō),濁音是最重要的語(yǔ)音信號(hào)。對(duì)于濁音,模型的激勵(lì)信號(hào)源e(n)是以基音周期重復(fù)的單位脈沖,此時(shí)有可得的Z變換S(z)為(17)

式中,為P階線(xiàn)性預(yù)測(cè)系數(shù)。根據(jù)倒譜的定義,對(duì)具有最小相位特征的語(yǔ)音信號(hào),有。式中,為語(yǔ)音信號(hào)的倒譜。將式(16)代入式(17),并對(duì)兩邊求導(dǎo),得(18)(19)

根據(jù)上式即可由線(xiàn)性預(yù)測(cè)系數(shù)通過(guò)遞推得到倒譜系數(shù),將這樣得到的倒譜稱(chēng)為線(xiàn)性預(yù)測(cè)倒譜系數(shù)。結(jié)合語(yǔ)音幀能量構(gòu)成LPC組合參數(shù)實(shí)驗(yàn)證明,組合參數(shù)可以提高系統(tǒng)的識(shí)別性能。組合參數(shù)雖然可以提高系統(tǒng)的性能,但很顯然,無(wú)論是在特征參數(shù)提取環(huán)節(jié),還是在模型訓(xùn)練和模型匹配環(huán)節(jié)都使運(yùn)算量有所增加。在特征參數(shù)提取環(huán)節(jié),要計(jì)算一種以上的特征參數(shù)。在模型訓(xùn)練和模型匹配環(huán)節(jié),由于組合參數(shù)特征矢量的維數(shù)較多,使運(yùn)算復(fù)雜度有所增加。運(yùn)算量的增加會(huì)使系統(tǒng)的識(shí)別速度受到影響。為使運(yùn)算量問(wèn)題得到較好的解決,所以可以由LPC參數(shù)與語(yǔ)音幀能量構(gòu)成組合參數(shù),能夠在運(yùn)算量增加不明顯的情況下改進(jìn)系統(tǒng)的性能。語(yǔ)音幀能量是指一幀語(yǔ)音信號(hào)的能量,它等于該幀語(yǔ)音樣值的平方和。選取與語(yǔ)音幀能量構(gòu)成組合參數(shù)主要有以下考慮:1)語(yǔ)音幀能量是語(yǔ)音信號(hào)最基本的短時(shí)參數(shù)之一,它表征一幀語(yǔ)音信號(hào)能量的大小,是語(yǔ)音信號(hào)一個(gè)重要的時(shí)域特征;2)由一幀語(yǔ)音求出的語(yǔ)音幀能量是一個(gè)標(biāo)量值,與其它參量構(gòu)成組合參數(shù)不會(huì)使原特征矢量的維數(shù)明顯增加,特征矢量的維數(shù)越少,則需要的運(yùn)算復(fù)雜度越小,另外,獲取語(yǔ)音幀能量的運(yùn)算并不復(fù)雜;3)語(yǔ)音幀能量與LPC參數(shù)之間的相關(guān)性不大,它們反映的是語(yǔ)音信號(hào)的不同特征,應(yīng)該有較好的效果。

模型增益G模型的激勵(lì)信號(hào)表示為:(20)

預(yù)測(cè)誤差e(n)如式(2),這樣當(dāng)實(shí)際的預(yù)測(cè)系數(shù)與模型系數(shù)相等時(shí),有(21)

這說(shuō)明激勵(lì)信號(hào)正比于誤差信號(hào),其比例常數(shù)等于模型增益G。通常假設(shè)誤差信號(hào)的能量等于輸入激勵(lì)信號(hào)的能量,因此可以得到:(22)

對(duì)于式中的激勵(lì)信號(hào)額e(n

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論