版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、語音信號的模型2.6.2語音信號的無損聲管模型 2.6.1 聲在聲管中的傳播特性 2.6.4無損聲管模型的傳輸函數(shù)2.6.3級聯(lián)無損聲管與數(shù)字濾波器的關(guān)系2.7語音信號的數(shù)字模型2.8語音信號的共振峰模型語音信號的模型語音模型化,便于數(shù)字處理。對模型的要求:精確描述語音產(chǎn)生過程、盡可能地簡單, 便于處理和實現(xiàn)。 已提出許多種不同的語音信號模型。線性模型:廣泛使用級聯(lián)無損聲管模型和共振峰模型。理論基礎(chǔ):發(fā)音過程中聲道處于運動狀態(tài),這種運動與語音信號相比變化緩慢,故可用時變的線性系統(tǒng)來模擬。更精細(xì)分析時,發(fā)現(xiàn)語音中也存在較大的非線性現(xiàn)象, 某些應(yīng)用需考慮這些因素對所研究問題的影響。非線性模型:有多
2、種,調(diào)頻-調(diào)幅模型受到廣泛關(guān)注。 本章討論:級聯(lián)無損聲管模型、共振峰模型、調(diào)頻-調(diào)幅模型第2章數(shù)字語音處理基礎(chǔ) - 2語音信號的模型2.6.1 聲在聲管中的傳播特性 物理學(xué)的定律是描述聲道中聲音的產(chǎn)生和傳播的基礎(chǔ)。 包括:質(zhì)量守恒、動量守恒、能量守恒的基本定律, 熱力學(xué)、流體力學(xué)的定律等。空氣是一種流體,也是聲音賴以傳播的介質(zhì)。應(yīng)用物理原理,可得描述發(fā)音系統(tǒng)中空氣運動偏微分方程組。精確的方程表達(dá)和求解都是極端困難的,需簡化假設(shè)條件。因周密的聲學(xué)理論必須考慮以下各種影響: (1)聲道形狀的時變性質(zhì);(2)聲道壁的熱傳導(dǎo)和粘滯摩擦損耗; (3)聲音在嘴唇處的輻射;(4)聲道壁的柔度; (5)鼻腔的
3、耦合; (6)聲道中的激勵。目前,沒有全面考慮各因素影響的聲學(xué)理論,應(yīng)用中對這些因素給出適當(dāng)?shù)恼f明或者給出定性的討論。 第2章數(shù)字語音處理基礎(chǔ) 2.6.1 聲在聲管中的傳播特性 圖2.6.1:語音產(chǎn)生過程的最簡單的物理模型。 假設(shè):聲道被看成是不均勻截面的聲管; 沿管軸傳播的聲波是平面波; 在流體中或管壁上不存在熱傳導(dǎo)和粘滯損耗。根據(jù)假設(shè)及守恒定律,Portnoff證明聲波滿足偏微分方程組:式中,p, u 為聲管內(nèi) x 位置處 t 時刻的 聲壓和體積速度,p=p(x,t),u=u(x,t) ; A 為聲管內(nèi) x 位置處 t 時刻的管的橫截面面積,A=A(x,t) ; 為聲管內(nèi)空氣的密度; c為
4、聲的傳播速度(空氣中聲速340m/s)。第2章數(shù)字語音處理基礎(chǔ) 2.6.1 聲在聲管中的傳播特性 - 圖2.6.1語音生成過程的物理模型 A(x)聲門 嘴唇(a) A(x) 0 l x(b)0 l x(c)給定聲管的邊界條件和面積函數(shù)后,可求得方程組的閉式解。 解的表達(dá)式非常復(fù)雜,但可以采用數(shù)值解。應(yīng)用中,某一特定時刻,面積函數(shù)可看成不隨時間變化。可借助于各種合理的近似和簡化來使方程的求解成為可能。 并由此得到語音信號的模型(后續(xù)討論該問題)。聲管中聲傳播特性與傳輸線中電流傳播特性有很強的類比關(guān)系。表2.6.1:聲學(xué)量與電學(xué)量之間的類比關(guān)系。 第2章數(shù)字語音處理基礎(chǔ) 2.6.1聲在聲管中的傳播
5、特性 表2.6.1聲學(xué)量與電學(xué)量之間物理量的類比聲學(xué)量電學(xué)量聲學(xué)量電學(xué)量壓力 p電壓 v特性聲阻抗 Z0= c/A特性電阻抗 Z0體積速度 u電流 i聲激勵角頻率電激勵角頻率聲感 /A電感 L單位長度聲阻抗粹Z=j/A復(fù)阻抗 Z聲容A/(c2)電容 C單位長度聲導(dǎo)納 Y=jA /(c2)復(fù)導(dǎo)納 Y語音信號的模型2.6.2語音信號的無損聲管模型 無損聲管模型(行波型模型):由多個不同截面積的無損耗 管子串聯(lián)而成的系統(tǒng)。是最簡單的聲道模型。圖2.6.2:10級的無損聲管級聯(lián)模型。語音信號的某一“短時”期間,聲道可表示為形狀穩(wěn)定的管道。該“短時”期間,管截面 A 是常數(shù)。偏微分方程以寫成:若第 m
6、段管子處,A(x,t)=Am,u(x,t)=um, p(x,t)=pm,上式可以寫成 第2章數(shù)字語音處理基礎(chǔ) 2.6.2語音信號的無損聲管模型 圖2.6.210級無損聲管級聯(lián)聲門 嘴唇A1l1A2 l2A3l3A4l4A5l5A6l6A7l7A8l8A9l9A10l10解偏微分方程組,得: 式中, lm第 m 節(jié)聲管的長度; 和 第 m 節(jié)聲管中的正向行波和反向行波。在兩個不同截面積的聲管聯(lián)接處,行波表達(dá)如圖2.6.3。連續(xù)條件:第 m 和 m+1 節(jié)聲管 聯(lián)接處的聲壓和體積速度連續(xù)。設(shè)第m節(jié)聲管左端點為坐標(biāo)0點, 右端點為lm ,則有 第2章數(shù)字語音處理基礎(chǔ) 2.6.2語音信號的無損聲管模型
7、 圖2.6.3兩個無損聲管之間的節(jié)點lmAmlm+1Am+1結(jié)合兩式,可進(jìn)一步求解,見下頁重要表達(dá)式,后續(xù)求解要用到!令聲波通過長為 lm 的第 m 節(jié)聲管需要的時間為 , 由上頁兩式,得:解得: 式中km第m節(jié)節(jié)點的反射系數(shù); km是 在節(jié)點處 反射回波 的倍數(shù)。圖2.6.4:兩級聲管的流圖。 第2章數(shù)字語音處理基礎(chǔ) 2.6.2語音信號的無損聲管模型 圖2.6.4兩個無損聲管節(jié)點信號流圖點 1+ km-km km 1kmmm+1mm+12.6.2.1嘴唇端N 段無損聲管,聲門處為第一段,嘴唇處為第 N 段。聲學(xué)理論:嘴唇處的聲壓和體積速度間存在正弦穩(wěn)態(tài)關(guān)系,即 式中,ZL嘴唇處的輻射阻抗,或
8、輻射負(fù)載。 假定ZL()=ZL是實數(shù),令N=LN/c,聯(lián)立上式和8頁偏微分方程 組的解,得: 即: 式中,kL嘴唇處的反射系數(shù), 嘴唇處的體積速度為:圖2.6.5:級聯(lián)無損聲管在嘴唇處的流圖。 第2章數(shù)字語音處理基礎(chǔ) 2.6.2語音信號的無損聲管模型 該式與電學(xué)的歐姆定律相對應(yīng)(聲壓對應(yīng)電壓,體積速度對應(yīng)電流)圖2.6.5級聯(lián)無損聲管在嘴唇處的流圖1+ kLkL NN2.6.2.2聲門端聲門可以看成是控制送入聲道氣流的阻礙。電模擬:聲門處存在一個內(nèi)阻抗(感性阻抗), 阻抗值為聲門處聲壓與氣流體積速度之比, 即:ZG=RG+j LG, RG和LG是常數(shù)。圖2.6.6:聲門端的電模擬圖。由圖得:
9、式中,U1(0,) 聲門處的體積速度u1(0,t)的Laplace變換; P1(0,) 聲門處的聲壓p1(0,t)的Laplace變換; UG () 等效體積速度源uG(t)的Laplace變換。第2章數(shù)字語音處理基礎(chǔ) 2.6.2語音信號的無損聲管模型 圖2.6.6聲門對應(yīng)等效電路圖 I1 ZG IG U1如果ZG是實數(shù),令m=1, x=0, 則由上頁式和 8 頁偏微分方程組的解,有: 解得: 式中 kG聲門處的反射系數(shù),圖2.6.7:聲門端級聯(lián)無損聲管的流圖。第2章數(shù)字語音處理基礎(chǔ) 2.6.2語音信號的無損聲管模型 圖2.6.7級聯(lián)無損聲管在聲門處的流圖kG11將兩級聲管級聯(lián)、聲門端和嘴唇端
10、與聲管級聯(lián)的結(jié)果合成, 可以畫出基于聲管理論的整個流圖。圖2.6.8:無損聲管模型圖。 圖2.6.8是無損條件下的結(jié)果;若考慮空氣與管壁間的摩擦、穿過管壁的熱傳導(dǎo)以及管壁振動等損耗,也可以解出前述方程式(結(jié)果復(fù)雜,不再贅述)。 管壁振動的影響最大,使低頻端諧振頻率提高; 其它兩種損耗的影響較少;兩者的凈影響只是使低端的 諧振頻率比剛性無損聲管壁模型的情況稍有增大。圖2.6.8無損聲管模型圖1122 1+ k1k1 k1 1k1 1+ kN-1kN-1 kN-1 1kN-1 1+ kLkL第2章數(shù)字語音處理基礎(chǔ) 2.6.2語音信號的無損聲管模型 例:圖2.6.9的兩級無損聲管的流圖, 在嘴唇處的
11、體積速度為 uL(t) = uL(lL,t) , 系統(tǒng)的頻率響應(yīng)為 令 s=j ,代入上式得該系統(tǒng)的系統(tǒng)函數(shù)為:第2章數(shù)字語音處理基礎(chǔ) 2.6.2語音信號的無損聲管模型 圖2.6.9兩級無損聲管流圖 1+ k1k1 k1 1k1 1+ kLkL1212語音信號的模型2.6.3級聯(lián)無損聲管與數(shù)字濾波器的關(guān)系 工程上常將聲道用 10 級等長無損聲管的級聯(lián)模型來表征。 每節(jié)聲管長度均為x,x =c=l/N l 10 級聲管總長度, 一節(jié)聲管中聲傳播時間。聲門處加單位沖激序列uG=(t),沖激沿聲管傳播, 在節(jié)點處,一部分被反射,另一部分繼續(xù)傳播。分析傳播過程: (1) 聲波無反射,直接到達(dá)嘴唇的幅度
12、疊加為0,時延為N, 則嘴唇處的單位沖激為:0(t -N) ; (2) 一次反射的沖激到達(dá)嘴唇處多延遲2,幅度疊加為1, 則嘴唇處的單位沖激為:1(t -N -2) ; (3) 某一節(jié)兩次反射,或某兩節(jié)各一次反射,延遲為22, 幅度疊加為2,則嘴唇處的單位沖激為:2(t -N -22) 。第2章數(shù)字語音處理基礎(chǔ) 2.6.3級聯(lián)無損聲管與數(shù)字濾波器的關(guān)系依此分析,無損聲管級聯(lián)系統(tǒng)的沖激響應(yīng)及Laplace變換為: 式中,e-Ns傳播 N 段管子所需的延遲時間, 如果設(shè): 其頻率響應(yīng)為:于是:由上式看出,若系統(tǒng)輸入是頻帶有限信號,即/T , 且取樣周期T=2 ,則上述系統(tǒng)和下面的離散系統(tǒng)等效: 式
13、中,n 0,zk 1。 即:離散時域模型的極點必在單位圓內(nèi),由穩(wěn)定性所要求。第2章數(shù)字語音處理基礎(chǔ) 2.7語音信號的數(shù)字模型圖2.7.1聲道諧振在s和z平面的表示圖 j /T 2Fkk 0 2Fk /T s 平面 |zk| k Rez 平面圖2.7.3全極點V(z)的級聯(lián)式實現(xiàn)G1z-1z-1G2z-1z-1GMz-1z-1利用數(shù)字濾波器的各種實現(xiàn)方法可以實現(xiàn)聲道的時變?yōu)V波器。 時變數(shù)字濾波器的系數(shù)是隨時間緩變,10 20 ms內(nèi)不變。 例:用直接形式來實現(xiàn),如圖2.7.2。也可以用二階系統(tǒng)的級聯(lián)來實現(xiàn) V(z),即: ,其中, 式中,M 為 (N+1)/2的整數(shù)部分。圖2.7.3:上式的實現(xiàn)
14、級聯(lián)流圖(特點是硬件可時分復(fù)用,對參數(shù)變化較 敏感,沒有并聯(lián)形式好)。第2章數(shù)字語音處理基礎(chǔ) 2.7語音信號的數(shù)字模型圖2.7.2 全極點V(z)直接式實現(xiàn)Gz-1a1z-1a2aN1z-1aN以上討論了聲道的數(shù)字模型, 下面分別討論在嘴唇和聲門處的數(shù)字模型。嘴唇處的數(shù)字模型:根據(jù)式 , 嘴唇處的聲壓、體積速度與輻射阻抗的關(guān)系式及 z 變換為: 由于的實部隨頻率增高而增高,故上式是一種高通濾波運算, 可以證明嘴唇輻射的影響可表示為: 第2章數(shù)字語音處理基礎(chǔ) 2.7語音信號的數(shù)字模型聲門處激勵的數(shù)字模型:語音分成清音和濁音,清音由隨機噪聲激勵產(chǎn)生 濁音由準(zhǔn)周期脈沖串激勵產(chǎn)生,其周期稱為基音周期。
15、圖2.7.4:濁音情況下,激勵信號的產(chǎn)生示意圖。沖激串發(fā)生器輸出的單位沖激序列(沖激間隔為基音周期)。線性激勵系統(tǒng)函數(shù)為G(z),經(jīng)幅度控制后輸出為濁音激勵。G(z) 的反變換 g(n) 可以用Rosenberg函數(shù)近似表示: 式中,N1 斜三角波上升部分的時間,約占基音周期的50; N2 斜三角波下降部分的時間,約占基音周期的35。第2章數(shù)字語音處理基礎(chǔ) 2.7語音信號的數(shù)字模型圖2.7.4濁音信號激勵的產(chǎn)生基音周期增益控制Av沖激串發(fā)生器G(z)斜三角波的占時比例關(guān)系與聲帶開啟面積的與時間關(guān)系對應(yīng)。圖2.7.5:單斜三角波波形及頻譜。 是低通濾波器。 其 z 變換的全極點(二極點)模型:
16、式中,C 是一個常數(shù)。斜三角波串可看成加權(quán)單位脈沖 激勵單斜三角波模型的結(jié)果。 Av是單位脈沖串的幅度因子; 單位脈沖串的z 變換為: 完整的激勵模型為:第2章數(shù)字語音處理基礎(chǔ) 3.5語音信號的數(shù)字模型圖2.7.5單個斜三角波及其頻譜1.00.80.60.40.20 5 10 15 20 t/msg(n) 20 lg G(ej) 30 20 10 01020301 2 3 f /kHz清音情況下,發(fā)塞音或摩擦音,聲道被阻形成湍流。 激勵可模擬成隨機白噪聲, 用均值為0、方差為1,時間或/和幅值為白色分布的序列。 圖2.7.6:考慮所有的激勵因素,語音產(chǎn)生的數(shù)字模型。 特點:二元激勵,濁音、清音
17、激勵交替進(jìn)行。 聲道可以用多種濾波器來模擬, 通常,把輻射和聲道等因素全部結(jié)合,表示為全極點函數(shù):第2章數(shù)字語音處理基礎(chǔ) 2.7語音信號的數(shù)字模型圖2.7.6語音產(chǎn)生的數(shù)學(xué)模型基音周期增益控制Avam, GPL(n)增益控制AN沖激串發(fā)生器G(z)白噪聲發(fā)生器V(z)R(z)結(jié)論: 優(yōu)點:該模型對大多數(shù)語音是一個好模型, 能合成出較滿意的語音,是分析語音最重要的基礎(chǔ)。 缺點:二元激勵模型有局限性。 模型建立“短時”平衡為前提,不完全符合實際; 理論上鼻音和擦音需有零點, 濁擦音不是簡單的濁音和清音的疊加。 該模型不能給出模擬。第2章數(shù)字語音處理基礎(chǔ) 3.5語音信號的數(shù)字模型語音信號的模型2.8
18、語音信號的共振峰模型將聲道看成為諧振腔,共振峰是該腔體的諧振頻率。 柯蒂氏器官的纖毛細(xì)胞按頻率感受排列,故共振峰模型有效。實踐證明:元音用前 3 個共振峰。 輔音或鼻音,用到 5 個以上的共振峰。應(yīng)用物理學(xué),易推導(dǎo)出均勻斷面聲管的共振峰頻率。例:成人聲道約為17.5 cm, 可計算出:f1 = 500 Hz,f2 = 1500 Hz,f3 = 2500 Hz。 發(fā)e時聲道最接近均勻斷面,其共振峰最接近上述值。從語音信號求出共振峰頻率、帶寬和幅度的方法是重要的。三種實用的共振峰模型:級聯(lián)型、并聯(lián)型、混合型。第2章數(shù)字語音處理基礎(chǔ) 2.8 語音信號的共振峰模型2.8.1級聯(lián)型共振峰模型級聯(lián)型共振峰模型認(rèn)為聲道是一組串聯(lián)的二階諧振器。 聲道有多個諧振頻率和反諧振頻率,可模擬為零極點模型。 一般元音,使用全極點模型,其傳輸函數(shù)如下: 式中,N 極點個數(shù); , G 幅值因子; ak 多項式系數(shù)。 可將傳輸函數(shù)分解為多個二階極點的網(wǎng)絡(luò)的串聯(lián),即: 式中, M 是 (N+1)/2 的整數(shù)部分。第2章數(shù)字語音處理基礎(chǔ) 2.8 語音信號的共振峰模型第 k 個極點zk為 ,T 是取樣周期,是帶寬的 1/2。取上式中的某一級,設(shè)為:則其幅頻特性及
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度家庭保姆雇傭與技能提升服務(wù)合同4篇
- 2025年度門窗安裝與室外照明一體化工程合同范本3篇
- 2025年度個人精裝修房屋租賃合同示范文本2篇
- 2025年度茶館店鋪轉(zhuǎn)讓及文化傳承合同3篇
- 2025版寧波共有產(chǎn)權(quán)房租賃合同模板4篇
- 2025年度車輛購置擔(dān)保合同模板2篇
- 二零二五年度充電樁充電服務(wù)市場分析合同4篇
- 2025版木地板產(chǎn)業(yè)鏈整合與戰(zhàn)略投資合同4篇
- 2025年度酒店樓頂花園租賃與維護(hù)合同3篇
- 年薪制勞動合同范本2025:新能源汽車行業(yè)人才激勵方案3篇
- 幼兒園學(xué)習(xí)使用人民幣教案教案
- 2023年浙江省紹興市中考科學(xué)真題(解析版)
- 語言學(xué)概論全套教學(xué)課件
- 大數(shù)據(jù)與人工智能概論
- 《史記》上冊注音版
- 2018年湖北省武漢市中考數(shù)學(xué)試卷含解析
- 測繪工程產(chǎn)品價格表匯編
- 《腎臟的結(jié)構(gòu)和功能》課件
- 裝飾圖案設(shè)計-裝飾圖案的形式課件
- 護(hù)理學(xué)基礎(chǔ)教案導(dǎo)尿術(shù)catheterization
- ICU護(hù)理工作流程
評論
0/150
提交評論