版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第3章語音信號的模型 語音模型化,便于數(shù)字處理。 對模型的要求:精確描述語音產(chǎn)生過程、盡可能地簡單, 便于處理和實現(xiàn)。 已提出許多種不同的語音信號模型。 線性模型:廣泛使用級聯(lián)無損聲管模型和共振峰模型。 理論基礎(chǔ):發(fā)音過程中聲道處于運動狀態(tài),這種運動與語音信號相比變化緩慢,故可用時變的線性系統(tǒng)來模擬。 更精細分析時,發(fā)現(xiàn)語音中也存在較大的非線性現(xiàn)象, 某些應(yīng)用需考慮這些因素對所研究問題的影響。 非線性模型:有多種,調(diào)頻-調(diào)幅模型受到廣泛關(guān)注。 本章討論:級聯(lián)無損聲管模型、共振峰模型、調(diào)頻-調(diào)幅模型,第3章語音信號的模型 3.1 聲在聲管中的傳播特性 物理學(xué)的定律是描述聲道中聲音的產(chǎn)生和傳播的基
2、礎(chǔ)。 包括:質(zhì)量守恒、動量守恒、能量守恒的基本定律, 熱力學(xué)、流體力學(xué)的定律等。 空氣是一種流體,也是聲音賴以傳播的介質(zhì)。 應(yīng)用物理原理,可得描述發(fā)音系統(tǒng)中空氣運動偏微分方程組。 精確的方程表達和求解都是極端困難的,需簡化假設(shè)條件。 因周密的聲學(xué)理論必須考慮以下各種影響: (1)聲道形狀的時變性質(zhì);(2)聲道壁的熱傳導(dǎo)和粘滯摩擦損耗; (3)聲音在嘴唇處的輻射;(4)聲道壁的柔度; (5)鼻腔的耦合; (6)聲道中的激勵。 目前,沒有全面考慮各因素影響的聲學(xué)理論, 應(yīng)用中對這些因素給出適當(dāng)?shù)恼f明或者給出定性的討論,圖3.1:語音產(chǎn)生過程的最簡單的物理模型。 假設(shè):聲道被看成是不均勻截面的聲管;
3、 沿管軸傳播的聲波是平面波; 在流體中或管壁上不存在熱傳導(dǎo)和粘滯損耗。 根據(jù)假設(shè)及守恒定律,Portnoff證明聲波滿足偏微分方程組: 式中,p, u 為聲管內(nèi) x 位置處 t 時刻的 聲壓和體積速度,p=p(x,t),u=u(x,t) ; A 為聲管內(nèi) x 位置處 t 時刻的管的橫截面面積,A=A(x,t) ; 為聲管內(nèi)空氣的密度; c為聲的傳播速度(空氣中聲速340m/s,給定聲管的邊界條件和面積函數(shù)后,可求得方程組的閉式解。 解的表達式非常復(fù)雜,但可以采用數(shù)值解。 應(yīng)用中,某一特定時刻,面積函數(shù)可看成不隨時間變化。 可借助于各種合理的近似和簡化來使方程的求解成為可能。 并由此得到語音信號
4、的模型(后續(xù)討論該問題)。 聲管中聲傳播特性與傳輸線中電流傳播特性有很強的類比關(guān)系。 表3.1:聲學(xué)量與電學(xué)量之間的類比關(guān)系,第3章語音信號的模型 3.2語音信號的無損聲管模型 無損聲管模型(行波型模型):由多個不同截面積的無損耗 管子串聯(lián)而成的系統(tǒng)。是最簡單的聲道模型。 圖3.2:10級的無損聲管級聯(lián)模型。 語音信號的某一“短時”期間,聲道可表示為形狀穩(wěn)定的管道。 該“短時”期間,管截面 A 是常數(shù)。偏微分方程以寫成: 若第 m 段管子處,A(x,t)=Am,u(x,t)=um, p(x,t)=pm,上式可以寫成,解偏微分方程組,得: 式中, lm第 m 節(jié)聲管的長度; 和 第 m 節(jié)聲管中
5、的正向行波和反向行波。 在兩個不同截面積的聲管聯(lián)接處,行波表達如圖3.3。 連續(xù)條件:第 m 和 m+1 節(jié)聲管 聯(lián)接處的聲壓和體積速度連續(xù)。 設(shè)第m節(jié)聲管左端點為坐標(biāo)0點, 右端點為lm ,則有,重要表達式,后續(xù)求解要用到,令聲波通過長為 lm 的第 m 節(jié)聲管需要的時間為 , 由上頁兩式,得: 解得: 式中km第m節(jié)節(jié)點的反射系數(shù); km是 在節(jié)點處 反射回波 的倍數(shù)。 圖3.4:兩級聲管的流圖,3.2.1嘴唇端 N 段無損聲管,聲門處為第一段,嘴唇處為第 N 段。 聲學(xué)理論:嘴唇處的聲壓和體積速度間存在正弦穩(wěn)態(tài)關(guān)系,即 式中,ZL嘴唇處的輻射阻抗,或輻射負載。 假定ZL()=ZL是實數(shù),
6、令N=LN/c,聯(lián)立上式和8頁偏微分方程 組的解,得: 即: 式中,kL嘴唇處的反射系數(shù), 嘴唇處的體積速度為: 圖3.5:級聯(lián)無損聲管在嘴唇處的流圖,該式與電學(xué)的歐姆定律相對應(yīng) (聲壓對應(yīng)電壓,體積速度對應(yīng)電流,3.2.2聲門端 聲門可以看成是控制送入聲道氣流的阻礙。 電模擬:聲門處存在一個內(nèi)阻抗(感性阻抗), 阻抗值為聲門處聲壓與氣流體積速度之比, 即:ZG=RG+j LG, RG和LG是常數(shù)。 圖3.6:聲門端的電模擬圖。由圖得: 式中,U1(0,) 聲門處的體積速度u1(0,t)的Laplace變換; P1(0,) 聲門處的聲壓p1(0,t)的Laplace變換; UG () 等效體積
7、速度源uG(t)的Laplace變換,如果ZG是實數(shù),令m=1, x=0, 則由上頁式和 8 頁偏微分方程組的解,有: 解得: 式中 kG聲門處的反射系數(shù), 圖3.7:聲門端級聯(lián)無損聲管的流圖,將兩級聲管級聯(lián)、聲門端和嘴唇端與聲管級聯(lián)的結(jié)果合成, 可以畫出基于聲管理論的整個流圖。 圖3.8:無損聲管模型圖。 圖3.8是無損條件下的結(jié)果; 若考慮空氣與管壁間的摩擦、穿過管壁的熱傳導(dǎo)以及管壁振動等損耗,也可以解出前述方程式(結(jié)果復(fù)雜,不再贅述)。 管壁振動的影響最大,使低頻端諧振頻率提高; 其它兩種損耗的影響較少;兩者的凈影響只是使低端的 諧振頻率比剛性無損聲管壁模型的情況稍有上移,例:圖3.9的
8、兩級無損聲管的流圖, 在嘴唇處的體積速度為 uL(t) = uL(lL,t) , 系統(tǒng)的頻率響應(yīng)為 令 s=j ,代入上式得該系統(tǒng)的系統(tǒng)函數(shù)為,第3章語音信號的模型 3.3級聯(lián)無損聲管與數(shù)字濾波器的關(guān)系 工程上常將聲道用 10 級等長無損聲管的級聯(lián)模型來表征。 每節(jié)聲管長度均為x,x =c=l/N l 10 級聲管總長度, 一節(jié)聲管中聲傳播時間。 聲門處加單位沖激序列uG=(t),沖激沿聲管傳播, 在節(jié)點處,一部分被反射,另一部分繼續(xù)傳播。 分析傳播過程: (1) 聲波無反射,直接到達嘴唇的幅度疊加為0,時延為N, 則嘴唇處的單位沖激為:0(t -N) ; (2) 一次反射的沖激到達嘴唇處多延
9、遲2,幅度疊加為1, 則嘴唇處的單位沖激為:1(t -N -2) ; (3) 某一節(jié)兩次反射,或某兩節(jié)各一次反射,延遲為22, 幅度疊加為2,則嘴唇處的單位沖激為:2(t -N -22),依此分析,無損聲管級聯(lián)系統(tǒng)的沖激響應(yīng)及Laplace變換為: 式中,e-Ns傳播 N 段管子所需的延遲時間, 如果設(shè): 其頻率響應(yīng)為: 于是: 由上式看出,若系統(tǒng)輸入是頻帶有限信號,即/T , 且取樣周期T=2 ,則上述系統(tǒng)和下面的離散系統(tǒng)等效: 式中,n1, n 0,n 取正整數(shù),對式 作 z 變換: 令 z=esT,s=j,T=2,則 與 等價, 即: 此時,n = m, 即等長無損聲管級聯(lián)系統(tǒng)完全可以用
10、一個取樣間隔為2, 系數(shù)為m的FIR濾波器非遞歸的方法實現(xiàn)(應(yīng)取有限項), 理論上證明聲道可以用數(shù)字濾波器模擬,延遲N 相當(dāng)于N /T= N /2 =N/2的取樣, 延遲 相當(dāng)于位移 /T= /2 = 1/2 個樣本。 圖3.9兩級無損聲管節(jié)點信號流 圖畫成兩級等長無損聲管流圖 (圖3.10); 每個延遲 用z-1/2代替,可得到 等效的離散系統(tǒng)流圖(圖3.11)。 將圖3.11中的4個z-1/2用z-1代替, 輸出端再乘以z就構(gòu)成等效的 數(shù)字濾波器流圖(圖3.12,分析:每個節(jié)點處都需要計算圖3.13(a)的流圖。計算式為 計算量:4次乘法,3次加法。 將上式改寫為(流圖為圖3.13(b))
11、 : 計算量:2次乘法,4次加法。 將上式改寫為(流圖為圖3.13(c)) : 計算量:1次乘法,3次加法。 結(jié)論:改變算法結(jié)構(gòu),計算量不同,第3章語音信號的模型 3.4無損聲管模型的傳輸函數(shù) 推導(dǎo)無損聲管模型的傳輸函數(shù)V(z) : 式中,UL(z)和UG(z)嘴唇處uL(n)和聲門處uG(n)的 z 變換。 考慮無損聲管模型一個節(jié)點處的 z 變換關(guān)系,如圖3.14所示, 其 z 變換方程為(m = 1,2,N-1): 解得,定義, , , 上頁解改寫成: 為簡化結(jié)果,把嘴唇處的邊界條件表示成統(tǒng)一的形式。 令UN+1(z)為假想的第 N+1 節(jié)聲管輸入的 z 變換。 設(shè)想這個聲管無限長,因此第
12、 N+1 節(jié)管子中無反向波, 或者等效地看成第 N+1 個聲管的終端接有特性阻抗, 可得 : 或,重要的解表達式,后續(xù)推導(dǎo)要用到。遞推使用可得出聲管模型的完整解,該式要代入遞推式 中,以求出完整解,如果 AN+1=c/ZL,AN=ZL,由嘴唇端的方程式,得 利用上頁兩式,則第一節(jié)聲管輸入處的變量可表示為: 按照圖3.7,可得聲門處的解為: 結(jié)合以上兩式和上頁最后一式,推導(dǎo)出下式,由上式可導(dǎo)出,N 級聲管傳輸函數(shù)為: 其中, 展開上式,用多項式表示為: 由此看出,無損聲管模型的傳輸函數(shù)只有極點沒有零點。 極點對應(yīng)于無損聲管的共振峰。 假定在聲門處,kG=1,zG=,可以導(dǎo)出計算 D(z) 的遞推
13、公式。 (見下頁,先定義: 其中, 。 同理,按照定義: 其中, 。 利用歸納法,得: 其中,,最后可得: 于是,計算 D(z) 的遞推公式如下: 無損聲管節(jié)數(shù)的選擇:取決于語音信號的取樣頻率。 推導(dǎo)關(guān)系式:由前面知,取樣周期 T =2, 是一段聲管中聲波單向傳播所需要的時間。 若聲管為 N 節(jié),而總長為 l ,且每段長度相同, 則=l/Nc,解得 N = l/c=2l/Tc。 例:當(dāng)1/T = 10 kHz,l = 17 cm,c = 340 m/s,則 N = 10, 即需要10節(jié)無損聲管級聯(lián),第3章語音信號的模型 3.5語音信號的數(shù)字模型 語音信號的數(shù)字模型:利用數(shù)字技術(shù)來模擬語音信號的
14、產(chǎn)生。 一種實現(xiàn)發(fā)音器官的模擬的技術(shù)。 數(shù)字模型應(yīng)能產(chǎn)生與語音聲波相對應(yīng)的信號序列。 通常,這種模型是一種線性系統(tǒng),用一組模型參數(shù)可表征語音,并可使模型系統(tǒng)的輸出所希望的語音。 系統(tǒng)的模型參數(shù)與語音產(chǎn)生過程有關(guān),常采用離散時間模型。 激勵與聲道的面積函數(shù)在10 20 ms的時間范圍內(nèi)近似不變。 濁音為準(zhǔn)周期脈沖激勵;清音為隨機噪聲激勵。 因此,語音信號的數(shù)字模型是一個緩變的線性系統(tǒng), 線性系統(tǒng)的參數(shù)在10 20 ms時間范圍內(nèi)近似不變,利用 N 節(jié)無損聲管來模擬聲道,已證明其傳輸函數(shù)為: 其中, 聲道系統(tǒng)用一組面積函數(shù) A(x) 或一組反射系數(shù) km 來表示。 在一幀內(nèi),A(x) 或 km 近
15、似不變。 另外,若有一數(shù)字系統(tǒng),其系統(tǒng)函數(shù)表示為 : 若取 ,(1)(2)兩式性質(zhì)相當(dāng); 注意,此處省略了固定延遲 z-0.5N。 上述系統(tǒng)函數(shù)僅有極點,沒有零點,稱為全極點模型。 除聲道響應(yīng)以外,完整模型還包括激勵函數(shù)和聲輻射的影響,系統(tǒng)函數(shù) V(z) 的極點對應(yīng)于語音的共振峰。 對于大多數(shù)語音,全極點模型能很好地模擬聲道的特性。 聲學(xué)理論表明鼻音和摩擦音有諧振和反諧振特性, 需要用零極點模型才能更好地模擬聲道效應(yīng)。 零點較難處理,常用全極點模型代替零極點模型。 逼近零點:用多個極點。 原理: V(z) 的分母多項式的根是實數(shù)或復(fù)共軛; 聲道的典型復(fù)諧振頻率為: 復(fù)共軛極點相應(yīng)的時域離散表示
16、為: 復(fù)共軛極點的幅值和相角為,圖3.15:聲道諧振點的平面圖。 聲道諧振的帶寬近似為 2k , 中心頻率為 2Fk 。 z 平面原極點的距離 決定帶寬; 相角2FkT決定中心頻率。 結(jié)論:將 V(z) 的分母進行因式分解, 相應(yīng)的模擬共振峰頻率和帶寬可以利用下式求出。 人類聲道的復(fù)自然頻率都在s平面的左半平面。 因系統(tǒng)是穩(wěn)定的,所以,k 0,zk 1。 即:離散時域模型的極點必在單位圓內(nèi),由穩(wěn)定性所要求,利用數(shù)字濾波器的各種實現(xiàn)方法可以實現(xiàn)聲道的時變?yōu)V波器。 時變數(shù)字濾波器的系數(shù)是隨時間緩變,10 20 ms內(nèi)不變。 例:用直接形式來實現(xiàn),如圖3.16。 也可以用二階系統(tǒng)的級聯(lián)來實現(xiàn) V(z
17、),即: ,其中, 式中,M 為 (N+1)/2的整數(shù)部分。 圖3.17:上式的實現(xiàn)級聯(lián)流圖(特點是硬件可時分復(fù)用,對參數(shù)變化較 敏感,沒有并聯(lián)形式好,以上討論了聲道的數(shù)字模型, 下面分別討論在嘴唇和聲門處的數(shù)字模型。 嘴唇處的數(shù)字模型: 根據(jù)式 , 嘴唇處的聲壓、體積速度與輻射阻抗的關(guān)系式及 z 變換為: 由于的實部隨頻率增高而增高,故上式是一種高通濾波運算, 可以證明嘴唇輻射的影響可表示為,聲門處激勵的數(shù)字模型: 語音分成清音和濁音,清音由隨機噪聲激勵產(chǎn)生 濁音由準(zhǔn)周期脈沖串激勵產(chǎn)生,其周期稱為基音周期。 圖3.18:濁音情況下,激勵信號的產(chǎn)生示意圖。 沖激串發(fā)生器輸出的單位沖激序列(沖激
18、間隔為基音周期)。 線性激勵系統(tǒng)函數(shù)為G(z),經(jīng)幅度控制后輸出為濁音激勵。 G(z) 的反變換 g(n) 可以用Rosenberg函數(shù)近似表示: 式中,N1 斜三角波上升部分的時間,約占基音周期的50; N2 斜三角波下降部分的時間,約占基音周期的35,斜三角波的占時比例關(guān)系與聲帶開啟面積的與時間關(guān)系對應(yīng)。 圖3.19:單斜三角波波形及頻譜。 是低通濾波器。 其 z 變換的全極點(二極點)模型: 式中,C 是一個常數(shù)。 斜三角波串可看成加權(quán)單位脈沖 激勵單斜三角波模型的結(jié)果。 Av是單位脈沖串的幅度因子; 單位脈沖串的z 變換為: 完整的激勵模型為,清音情況下,發(fā)塞音或摩擦音,聲道被阻形成湍
19、流。 激勵可模擬成隨機白噪聲, 用均值為0、方差為1,時間或/和幅值為白色分布的序列。 圖3.20:考慮所有的激勵因素,語音產(chǎn)生的數(shù)字模型。 特點:二元激勵,濁音、清音激勵交替進行。 聲道可以用多種濾波器來模擬, 通常,把輻射和聲道等因素全部結(jié)合,表示為全極點函數(shù),結(jié)論: 優(yōu)點:該模型對大多數(shù)語音是一個好模型, 能合成出較滿意的語音,是分析語音最重要的基礎(chǔ)。 缺點:二元激勵模型有局限性。 模型建立“短時”平衡為前提,不完全符合實際; 理論上鼻音和擦音需有零點, 濁擦音不是簡單的濁音和清音的疊加。 該模型不能給出模擬,第3章語音信號的模型 3.6語音信號的共振峰模型 將聲道看成為諧振腔,共振峰是該腔體的諧振頻率。 柯蒂氏器官的纖毛細胞按頻率感受排列,故共振峰模型有效。 實踐證明:元音用前 3 個共振峰。 輔音或鼻音,用到 5 個以上的共振峰。 應(yīng)用物理學(xué),易推導(dǎo)出均勻斷面聲管的共振峰頻率。 例:成人聲道約為17.5 cm, 可計算出:f1 = 500 Hz,f2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《跳蹦蹦床的大象》少兒美術(shù)教育繪畫課件創(chuàng)意教程教案
- 蒲公英課件文庫
- 西南林業(yè)大學(xué)《產(chǎn)品攝影》2023-2024學(xué)年第一學(xué)期期末試卷
- 西京學(xué)院《設(shè)計模式》2023-2024學(xué)年第一學(xué)期期末試卷
- 2023年1月福建省普通高中學(xué)業(yè)水平合格性考試歷史試題(原卷版)
- 陀螺課件 圖文
- 西京學(xué)院《面向?qū)ο蟪绦蛟O(shè)計》2022-2023學(xué)年期末試卷
- 西華師范大學(xué)《小學(xué)數(shù)學(xué)課程與教學(xué)》2022-2023學(xué)年第一學(xué)期期末試卷
- 西華師范大學(xué)《運動技能學(xué)習(xí)與控制》2022-2023學(xué)年期末試卷
- 臺兒莊介紹課件
- 2024-2030年中國干細胞醫(yī)療行業(yè)趨勢分析及投資戰(zhàn)略研究報告
- 消防安全培訓(xùn)內(nèi)容
- 2024-2030年鋁型材行業(yè)市場深度調(diào)研及前景趨勢與投資戰(zhàn)略研究報告
- 2024-2030年辣椒種植行業(yè)市場深度分析及發(fā)展策略研究報告
- 變電站綠化維護施工方案
- 校園展美 課件 2024-2025學(xué)年人美版(2024)初中美術(shù)七年級上冊
- 初中英語研修方案
- 解碼國家安全知到章節(jié)答案智慧樹2023年國際關(guān)系學(xué)院
- 典范英語7-4中英文對照翻譯Oh,otto!Oh,otto
- 混凝土早強劑檢驗報告(出廠)
- 超聲引導(dǎo)下腰椎部位的穿刺ppt課件
評論
0/150
提交評論