




下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第一語(yǔ)本章中將基于數(shù)字濾波器和 z 變換等基礎(chǔ)知識(shí),應(yīng)用第一篇講授編程術(shù),在第一語(yǔ)本章中將基于數(shù)字濾波器和 z 變換等基礎(chǔ)知識(shí),應(yīng)用第一篇講授編程術(shù),在語(yǔ)音分領(lǐng)域做一些練習(xí)。通過本章的練習(xí),可以增進(jìn)對(duì) z 變換和濾波器的理知識(shí),第二部分給出詳細(xì)的練習(xí)內(nèi)容和編程步驟。相信讀者對(duì)此會(huì)產(chǎn)生強(qiáng)。機(jī)從物理原理來看,語(yǔ)音信號(hào)是由肺擠壓出的空氣激振動(dòng)產(chǎn)生的包括喉、聲道和嘴。喉位于氣管的上端,實(shí)際上是由氣管末端的一圈軟的一個(gè)框架喉中有兩片肌肉,它們和周圍的韌帶稱為聲帶。聲帶張開時(shí)空氣可地流過喉和氣管,如正常呼吸時(shí);聲帶閉合,將喉封住,所以吃東西時(shí)食物不會(huì)落入氣管。兩片聲帶之間的空隙稱為聲門。說話時(shí)聲帶相互靠攏
2、但不完全封閉,這樣聲門變成一條窄縫,當(dāng)氣流通過時(shí)其間壓力減小,從而聲帶完全合攏使氣流不能通過;在氣流被阻斷時(shí)壓力恢復(fù)正常,因聲帶間形成空隙,氣流再次通過。這一過程周而復(fù)始,就形成了一串周期性的脈沖氣流送入聲道。如圖 1.1 所示。這個(gè)脈沖串的周期稱為“基音周期”,其倒數(shù)是“基音頻率”說 氣流從喉向上經(jīng)過口腔或者鼻腔后向外輻射,經(jīng)過的傳輸通道稱為聲道。氣流流過聲1 1.1: 道猶如通過一個(gè)具有某種諧振特性的腔體。如所示。輸出氣流的頻率特性既取 1.1: 道猶如通過一個(gè)具有某種諧振特性的腔體。如所示。輸出氣流的頻率特性既取聲門脈沖串的特性,又取決于聲道特性。聲道包括口腔和鼻腔兩部分,對(duì)成腔段約 1
3、7cm ,鼻腔段約 13cm ,氣流在軟腭的控制下分別流向這兩個(gè)通道。所以聲道的截面積是變化的,而聲道的頻率特性主要取決于聲道截面的最小值(收緊點(diǎn))出現(xiàn)的位置,了軟腭控制一些外,收緊點(diǎn)主要由舌頭的位置來決定1.2: 1.3: 語(yǔ)音的另一種產(chǎn)生方式是聲門完全閉合,此時(shí)聲道不是受聲門周期脈沖氣流而是利用口腔內(nèi)存有的空出來。該氣流在口腔中形成湍流,因而表現(xiàn)為隨機(jī)噪聲。這種方式發(fā)出的音就(男生如果把手放在脖子前面喉結(jié)上部的倒三角位置,發(fā)濁音“啊”的音時(shí)可以感覺到,發(fā)清音“是的音時(shí)就語(yǔ)音信號(hào)的時(shí)一段女聲發(fā)音”的波形如所示,可以看出語(yǔ)音能量的起伏從而大1.5 部分,可以看出語(yǔ)音的濁音段能量較大(右上圖有明
4、顯的周期特征,而清音段能量很小(右下圖于噪聲化2322010.155 0.165 0.17 0201.4: 女聲發(fā)音”1.5: 女聲發(fā)音語(yǔ)音模語(yǔ)音生成模通過對(duì)聲管的研究,發(fā)現(xiàn)它可以用若干段截面積不等的均勻管道級(jí)聯(lián)起來描述,如,一般稱作級(jí)聯(lián)無損聲管模型。采用流體力學(xué)的方法322010.155 0.165 0.17 0201.4: 女聲發(fā)音”1.5: 女聲發(fā)音語(yǔ)音模語(yǔ)音生成模通過對(duì)聲管的研究,發(fā)現(xiàn)它可以用若干段截面積不等的均勻管道級(jí)聯(lián)起來描述,如,一般稱作級(jí)聯(lián)無損聲管模型。采用流體力學(xué)的方法可以證明每一截均勻管道能夠用一個(gè)單極點(diǎn)模型來近 N 段管道組成的聲管就可以用一N 階全極點(diǎn)濾波器表述,GP=
5、V(z)= NN1(1k=1 對(duì)于典型的男聲,N = 10 再綜合考慮清音信號(hào),就可以得到語(yǔ)音信號(hào)產(chǎn)生的離散語(yǔ)音模型,如圖 所示準(zhǔn)確的清遠(yuǎn)遠(yuǎn)超出了本書的范疇,因?qū)ι鲜瞿P瓦M(jìn)行充分簡(jiǎn)化。首先去掉隨機(jī)信號(hào)激勵(lì)部分認(rèn)為激勵(lì)信號(hào)是一個(gè)脈沖序列,不考慮有無周期。其次去掉聲門脈沖模型和口唇的輻射模型,從而得到圖 1.7 所示最簡(jiǎn)單的語(yǔ)音模型,現(xiàn)用 變換的知識(shí)就可以應(yīng)對(duì)了e(ns(ns(n) aks(nk)+從可以用聲管模型對(duì)激勵(lì)信號(hào)進(jìn)行濾波得到語(yǔ)音信號(hào)3乥 乥 1.6: 1.7: 語(yǔ)??傻秸Z(yǔ)音信號(hào) s(n) ,也已經(jīng)知道了它的生成模型如1.7 所示,但不e(nV(zai7.7 問題,而且它是更復(fù)雜的盲解卷
6、,因?yàn)榧?lì)和濾波器系數(shù)兩者都不知道。如果進(jìn)一步做些合理的假設(shè),這個(gè)問題還是可以解決的,比如約束 是一個(gè)周期脈沖序列和一白噪聲序列之和就可以用一些信號(hào)處理方法,如自相關(guān)法和自協(xié)方差法求出系Durbin遞推算法和Schurai1.7測(cè)模型即語(yǔ)音信號(hào)s(n) 送濾波器得e(n) e(n) = s(n) aks(n 這模型在通信中用來增加每個(gè)信道上傳輸語(yǔ)音信號(hào)的通道數(shù)。假設(shè)信號(hào)的發(fā)端ai e(n) ) ) e(n是輸出。事實(shí)上,ai4V ,ai 因而采技術(shù)后,總是可以大幅度地降低語(yǔ)音的帶寬。這種通過線方法壓縮語(yǔ)音數(shù)據(jù)量的技術(shù)叫做線編碼(Linear Prediction Coding, LPC)技 ,
7、ai 因而采技術(shù)后,總是可以大幅度地降低語(yǔ)音的帶寬。這種通過線方法壓縮語(yǔ)音數(shù)據(jù)量的技術(shù)叫做線編碼(Linear Prediction Coding, LPC)技術(shù)語(yǔ)音重建模 用語(yǔ)音生成模型重建語(yǔ)音(n) (n(n) x(n) e(n) s(n) ai1020就會(huì)發(fā)生一些變化以產(chǎn)生不同的音節(jié)。在這種情況下,濾波過程也要分段進(jìn)行,即每次用不同的濾波器系數(shù),但相鄰兩次濾波必須要保持濾波器的狀態(tài)不發(fā)生變化諧振語(yǔ)音生成模型的每一對(duì)共軛極點(diǎn)都對(duì)應(yīng)一個(gè)衰減的正弦信號(hào)的特征響應(yīng)。例如一對(duì)共| pi | ej A | 度,幅角決定振蕩頻率cos(n對(duì)語(yǔ),用數(shù)字的正弦信號(hào)表示抽樣后的連續(xù)正弦信號(hào)。在這種情況下T
8、,T 表示抽樣間隔, 表示模擬頻率(弧度f(wàn) /2稱(N 10)5分析語(yǔ)的分系統(tǒng)如圖 1.8 所示們就可以用適當(dāng)?shù)妮斎胝Z(yǔ)音。對(duì)于濁音信號(hào),一種可取的激勵(lì)模型就是以特定頻率重復(fù)樣值序列,這個(gè)頻率就是基音頻率。對(duì)清音,最好選擇隨機(jī)噪聲或白噪聲作為5 ex1.8: 分析語(yǔ)音的系統(tǒng)框圖輸入。但在不做清的情況下,全部采用周期激勵(lì)質(zhì)量也是可以接受的(們就是這么做的分析過程 ex1.8: 分析語(yǔ)音的系統(tǒng)框圖輸入。但在不做清的情況下,全部采用周期激勵(lì)質(zhì)量也是可以接受的(們就是這么做的分析過程是:先將語(yǔ)音采樣信號(hào)以 10 毫秒進(jìn)行分段,然后對(duì)得到的每段數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析并計(jì)算相鄰樣點(diǎn)的相關(guān)性,最終求得最系數(shù)過程就是
9、利用系數(shù),以及周期樣值序列作為輸入,依次得到每語(yǔ)音變速不變速不變調(diào)技術(shù)廣泛應(yīng)用于消費(fèi)類電子產(chǎn)品,如英語(yǔ)復(fù)讀機(jī)等。所謂變速不變調(diào),是指聲時(shí),速度的改變不會(huì)導(dǎo)致音調(diào)的變化。一般來說,用隨身聽聽音樂,快和慢,其音調(diào)是不一致的,如快,頻率會(huì)變高,男聲聽起來會(huì)感(T ,如T 卻減小了 會(huì)怎樣?)為了實(shí)現(xiàn)變速不因是什么兩個(gè)部分,一峰頻率模型的參數(shù);二是基音周期,即激勵(lì)信號(hào)的參數(shù)。下面了。即將對(duì)應(yīng)的工作就是在不改變這兩種參數(shù)的前提下改變數(shù)據(jù)長(zhǎng)個(gè)樣點(diǎn)的激勵(lì)變成對(duì)應(yīng)于 毫秒個(gè)樣點(diǎn)(注意保20 毫秒毫秒內(nèi)保模型系數(shù)不變,不就語(yǔ)音了么?新語(yǔ)音的變調(diào)不前,最簡(jiǎn)單的男聲變女聲只要讓隨身聽就可以了。但快改變的不僅是聲調(diào),
10、語(yǔ)速也會(huì)發(fā)生很大變化,快得讓人聽不清楚。為了解決這個(gè)問題,就需要調(diào)不變速的技術(shù)。同上分析過程一樣,還是需峰頻率和基音周期上做改變。女和男聲的最大區(qū)別是頻率高,一方面表現(xiàn)在基音頻率高,另一方峰對(duì)應(yīng)的諧振頻率也更高一些,所可以考慮將激勵(lì)信號(hào)的頻率增加(注意不改變信號(hào)長(zhǎng)度6振峰頻率也相應(yīng)增大一些(即極點(diǎn)的幅角絕對(duì)值增大,或者說上半平面的極點(diǎn)逆時(shí)針旋轉(zhuǎn),下半平面的順時(shí)針旋轉(zhuǎn),但注意兩者都要旋轉(zhuǎn)同樣角度而且不要轉(zhuǎn)過負(fù)實(shí)軸。這振峰頻率也相應(yīng)增大一些(即極點(diǎn)的幅角絕對(duì)值增大,或者說上半平面的極點(diǎn)逆時(shí)針旋轉(zhuǎn),下半平面的順時(shí)針旋轉(zhuǎn),但注意兩者都要旋轉(zhuǎn)同樣角度而且不要轉(zhuǎn)過負(fù)實(shí)軸。這樣得語(yǔ)音會(huì)更“女聲”一些后兩項(xiàng)技
11、術(shù)是典型的語(yǔ)音信號(hào)數(shù)字處理技術(shù)。它們的基礎(chǔ)z變換和線用傳統(tǒng)的模擬信號(hào)處理方法不可能實(shí)現(xiàn),這正體現(xiàn)了數(shù)字信號(hào)處理的優(yōu)點(diǎn)。最后還,這兩項(xiàng)技術(shù)并,事實(shí)上,它們可以完美地結(jié)合在一起,你能做出一種速度和音調(diào)都發(fā)生變化語(yǔ)音算法來么語(yǔ)模(1)給e(n)=s(n)a1s(n1)a2s(ne(n是輸入信號(hào),s(n) = = 0.9506 上模型 樣值響應(yīng)。用 filter 繪 impz 的是否相同極點(diǎn)率響應(yīng)(2)閱讀 speechproc.m 程序,理解基本流程。程序中已經(jīng)完成了語(yǔ)音分幀、加窗、和基音周期提取等功能。注意:不要求掌握線和基音周期提取的算法原理function % 定義常FL = % % %WL
12、= P=% 載入語(yǔ)音% 讀入語(yǔ)s=L=7計(jì)算FN = floor(L/FL)-%和重建濾%誤差exc = %濾波zi_pre = %重建s_rec = %zi_rec = %的激勵(lì)信號(hào)(脈沖串exc_syn = %語(yǔ)s_syn = % 變調(diào)不變速濾%的激勵(lì)信號(hào)(脈沖串計(jì)算FN = floor(L/FL)-%和重建濾%誤差exc = %濾波zi_pre = %重建s_rec = %zi_rec = %的激勵(lì)信號(hào)(脈沖串exc_syn = %語(yǔ)s_syn = % 變調(diào)不變速濾%的激勵(lì)信號(hào)(脈沖串exc_syn_t = %語(yǔ)%s_syn_t = 變速不變調(diào)濾波器(假設(shè)速度減慢一倍的激勵(lì)信號(hào)(脈沖串e
13、xc_syn_v = %語(yǔ)s_syn_v = %漢明hw = % 依次處理每幀%n = % 計(jì)系數(shù)(不需要掌握s_w = %漢明激勵(lì)的能量后的% A系數(shù),E會(huì)被用來計(jì)%用線法計(jì)算P系A(chǔ) E lpc(s_w, if n = % (3) 在此位置寫程序系統(tǒng)的零% 本幀語(yǔ)音,下面就要對(duì)它做s_f = s(n-% (4) 在此位置寫程序,用filter函數(shù)和s_f計(jì)算激勵(lì),注意保持濾波將你計(jì)算得到的激勵(lì)寫在% exc(n-1)*FL+1:n*FL) = 8 ( 將你計(jì)算得到的重建語(yǔ)音寫% s_rec(n-1)*FL+1:n*FL)=注意下面只有在得到exc后才會(huì)計(jì)算s_Pitch = exc(n*FL
14、-PT = % 計(jì)算基音周期PT(不要求掌握% 計(jì)激勵(lì)的能量G(不 ( 將你計(jì)算得到的重建語(yǔ)音寫% s_rec(n-1)*FL+1:n*FL)=注意下面只有在得到exc后才會(huì)計(jì)算s_Pitch = exc(n*FL-PT = % 計(jì)算基音周期PT(不要求掌握% 計(jì)激勵(lì)的能量G(不要求掌握G= % exc_syn(n-激勵(lì),并用激勵(lì)和filter函數(shù)產(chǎn)將你計(jì)算得到激勵(lì)寫%將你計(jì)算得到語(yǔ)音寫%s_syn(n-1)*FL+1:n*FL) = %的輸入得到新語(yǔ)音,聽一聽是不是速度變慢了,而且音調(diào)沒有變%將你計(jì)算得到的加語(yǔ)音寫在%(13) %=%將你計(jì)算得到的變語(yǔ)音寫在=% %后面聽語(yǔ)音的題目也都可以在
15、這里寫,不再做特別注明% 保存所有9% 從PCM文件讀入function s = fid = fopen(filename, s = fread(fid, L, % 從PCM文件讀入function s = fid = fopen(filename, s = fread(fid, L, % 把語(yǔ)音寫入PCMfunction fid = fwrite(fid, s, % 計(jì)算一段語(yǔ)音的基音周期,不要求掌握function PT = A = butter(5, s R R(k) = s(144:223)*s(144-k:223-R1,T1 = T1 = T1 + R1/(norm(s(144-T1
16、:223-R2,T2 = T2 = T2 + R2/(norm(s(144-T2:223-R3,T3 = T3 = T3 + R3 R3/(norm(s(144-T3:223-Top Rop if = Rop Top end if Rop Top T3 = T3 + R3 R3/(norm(s(144-T3:223-Top Rop if = Rop Top end if Rop Top PT = (3)運(yùn)行該程序到 27 幀時(shí)停住,用(1)中的方法觀察零極點(diǎn)圖(4)在循環(huán)中添加程序:對(duì)每幀語(yǔ)音信號(hào) s(nfilter 激勵(lì)信。注意:在系數(shù)變化的情況下連續(xù)濾波,需維持濾波器的狀態(tài)不變,要利用filterzizf(5)speechproc.m e(n) 和 (n) 語(yǔ)模(7)生成一8kHz 抽樣的持1 秒鐘的數(shù)字信號(hào),該信號(hào)是一個(gè)頻率200Hz 的x(n)(n位樣值“串”并試聽,有何區(qū)別?事實(shí)上,這個(gè)信號(hào)將是后面要用到的以基音為周期的人工位樣值“串”并試聽,有何區(qū)別?事實(shí)上,這個(gè)信號(hào)將是后面要用到的以基音為周期的人工e(n) (8)真實(shí)語(yǔ)音信號(hào)的基音周期總是隨著時(shí)間變化的首先將信號(hào)分成若毫秒長(zhǎng)的段,假設(shè)每個(gè)段內(nèi)基音周期固定不變,但段和段之間則不同,具體PT =80+5mod(m,其中 PT 表示基音周期,m 表示段序號(hào)。生成 1 秒鐘的上述信號(hào)(提示:用段實(shí)現(xiàn),
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- T/CCMA 0125-2022旋轉(zhuǎn)多工位靜壓式混凝土制品成型機(jī)
- T/CATS 009-2024研學(xué)旅游(中小學(xué))課程設(shè)計(jì)指南
- T/CAQI 94-2019家用和類似用途前置過濾裝置
- T/CAQI 61-2018污(廢)水生物處理好氧循環(huán)生物膨脹床反應(yīng)器
- T/CAQI 210-2021果蔬清洗裝置
- T/CAPE 10001-2017設(shè)備管理體系要求
- 擺攤賣菜面試題及答案
- 優(yōu)酷土豆java面試題及答案
- 法務(wù)人員考試題及答案
- 德州保姆面試題及答案
- 綠色算力基礎(chǔ)設(shè)施的能源與算力協(xié)同優(yōu)化
- 中小學(xué)學(xué)生規(guī)范漢字書寫比賽硬筆格式
- 商品房買賣合同(示范文本)GF-2000-0171
- 手機(jī)制造行業(yè)未來五至十年行業(yè)分析
- 2024版社工(初級(jí))《社會(huì)工作實(shí)務(wù)(初級(jí))》考試題庫(kù)(含答案)
- 腰痛中醫(yī)診療規(guī)范診療指南2023版
- 溫州樂陽(yáng)金屬表面處理有限公司改建項(xiàng)目環(huán)境影響報(bào)告
- 綠盟全線產(chǎn)品簡(jiǎn)介
- 混凝土采購(gòu)組織供應(yīng)、運(yùn)輸、售后服務(wù)方案
- 軟件開發(fā)外包合同范本
- 古代文言文與現(xiàn)代漢語(yǔ)的語(yǔ)法對(duì)比研究
評(píng)論
0/150
提交評(píng)論