第三章 語音信號分析_第1頁
第三章 語音信號分析_第2頁
第三章 語音信號分析_第3頁
第三章 語音信號分析_第4頁
第三章 語音信號分析_第5頁
已閱讀5頁,還剩61頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、 第三章 語音信號分析 3.2 語音信號的數(shù)字化和預(yù)處理 3.3 語音信號的時域分析 3.4 語音信號的頻域分析 3.5 語音信號的倒譜分析 3.6 語音信號的線性預(yù)測分析 A Av v 沖激序列沖激序列 發(fā)生器發(fā)生器 聲門脈沖聲門脈沖 模型模型G(z)G(z) 隨機(jī)噪聲隨機(jī)噪聲 發(fā)生器發(fā)生器 基音周期基音周期T TP P A AN N 線性系統(tǒng)線性系統(tǒng) 聲道聲道V V( (z z) ) 輻射模型輻射模型 R R( (z z) ) 清清/ /濁音濁音 開關(guān)開關(guān) )()()()(zRzVzGzH 語音信號的分析,就是找出語音產(chǎn)生模型的各種語音信號的分析,就是找出語音產(chǎn)生模型的各種 參數(shù)(語音的特

2、征參數(shù)),應(yīng)用于語音的編碼、識參數(shù)(語音的特征參數(shù)),應(yīng)用于語音的編碼、識 別和合成等。別和合成等。 3.2 語音信號的數(shù)字化和預(yù)處理 一、預(yù)濾波、采樣和A/D轉(zhuǎn)換 二、預(yù)處理 1.預(yù)濾波的作用:抑制輸入信號中頻率超出抑制輸入信號中頻率超出f fs s/2/2的的 所有分量,防止混疊;抑制所有分量,防止混疊;抑制50Hz50Hz的電源工頻干擾。的電源工頻干擾。 預(yù)濾波器是一個帶通濾波器,一般情況下,上、預(yù)濾波器是一個帶通濾波器,一般情況下,上、 下截止頻率為:下截止頻率為: f fH H=3400Hz=3400Hz, f fL L=60=60100Hz100Hz。 一、預(yù)濾波、采樣和A/D轉(zhuǎn)換

3、 t n xa(nT) xa(t) 2.采樣: 將時間連續(xù)信號將時間連續(xù)信號 變成時間離散信號。變成時間離散信號。 采樣頻率通常為采樣頻率通常為 f fs s8kHz8kHz。 Ideal sampling and real sampling 對離散時間信號進(jìn)行量化,在每一時刻對對離散時間信號進(jìn)行量化,在每一時刻對x xa a(nT)(nT) 獨立進(jìn)行量化,把給定的幅度連續(xù)的信號變成為有獨立進(jìn)行量化,把給定的幅度連續(xù)的信號變成為有 限多個幅度的集合中某個幅度值的過程。限多個幅度的集合中某個幅度值的過程。 3. A/D轉(zhuǎn)換 采樣采樣量化量化 x xa a(t)(t) x xa a(nT)(nT)

4、 x(n)x(n) x xa1 a1 x x1 1x xk k x xak ak x xak+1 ak+1 x xk+1 k+1 x xL L x xaL aL x xaL+1 aL+1 x(n)=Qxx(n)=Qxa a(nT)(nT) 000 001 010 011 111 110 101 100 /2/2 量化誤差量化誤差( (噪聲噪聲) ) e(n)=x(n)- xe(n)=x(n)- xa a(nT) (nT) - - /2/2 e(n) e(n) /2/2 2 m=0 0 其他其他 (1 1)假設(shè)量化噪聲是平穩(wěn)的白噪聲過程,有)假設(shè)量化噪聲是平穩(wěn)的白噪聲過程,有 Ee(n)e(n+

5、m)=Ee(n)e(n+m)= (2 2)假設(shè)量化噪聲與輸入信號不相關(guān),有)假設(shè)量化噪聲與輸入信號不相關(guān),有 Ee(n)x(n+m)=0 mEe(n)x(n+m)=0 m為任意值為任意值 (3 3)在每個量化間隔上,量化噪聲均勻分布,有)在每個量化間隔上,量化噪聲均勻分布,有 P Pe e(e(n)=(e(n)= 1 |e(n)| 1 |e(n)| /2/2 0 其他其他 量化信噪比量化信噪比 量化噪聲的信噪比:量化噪聲的信噪比:SNR=SNR= x x2 2/ / e e2 2 x x2 2語音信號序列的方差,語音信號序列的方差, e e2 2噪聲序列的方差,噪聲序列的方差, 用分貝表示,用

6、分貝表示,SNR=10log(SNR=10log( x x2 2/ / e e2 2) SNR = signals energy / noises energy SNR=6.02B+4.77SNR=6.02B+4.7720log(X20log(Xmax max/ / x x) ) 6.02B6.02B7.277.27 X Xmax max表示其峰值 表示其峰值 B B為量化的比特數(shù)為量化的比特數(shù) 當(dāng)語音信號的幅度服從拉普拉斯分布時,當(dāng)語音信號的幅度服從拉普拉斯分布時,X Xmax max 4 4 x x 量化器每增加一個比特,量化器每增加一個比特,SNRSNR提高約提高約6dB6dB。當(dāng)。當(dāng)

7、B=8,SNR=40dBB=8,SNR=40dB,滿足一般通信系統(tǒng)的要求。當(dāng)量化,滿足一般通信系統(tǒng)的要求。當(dāng)量化 噪聲的信噪比達(dá)到噪聲的信噪比達(dá)到 606070dB70dB,才能保障有高水平,才能保障有高水平 通話質(zhì)量,這時要求量化為通話質(zhì)量,這時要求量化為 111113bits13bits。一般的。一般的 音頻音頻A/DA/D、D/AD/A轉(zhuǎn)換芯片,量化為轉(zhuǎn)換芯片,量化為12bits12bits。 A/D of some common audio signals Frequency Frequency scopescope Sampling Sampling frequencyfrequen

8、cy QuantizatiQuantizati on bitson bits TelephoneTelephone200-3400200-34008 khz8 khz8 bits8 bits Wide bandWide band50-700050-700016 khz16 khz16 bits16 bits BroadcastiBroadcasti ngng 20-15khz20-15khz37.8 khz37.8 khz16 bits16 bits CDCD20-20khz20-20khz44.1 khz44.1 khz16 bits16 bits 1.存儲方式: 已量化好的語音信號序列按已

9、量化好的語音信號序列按 先入先出的順序存入數(shù)據(jù)區(qū)。先入先出的順序存入數(shù)據(jù)區(qū)。 以便一個有限容量的數(shù)據(jù)區(qū)來以便一個有限容量的數(shù)據(jù)區(qū)來 應(yīng)付數(shù)量極大的語音數(shù)據(jù)。應(yīng)付數(shù)量極大的語音數(shù)據(jù)。 二、預(yù)處理 2.預(yù)加重: 在求語音信號頻譜時,頻率越高,相應(yīng)的成在求語音信號頻譜時,頻率越高,相應(yīng)的成 分越小。預(yù)加重的目的是提升高頻部分,使信號分越小。預(yù)加重的目的是提升高頻部分,使信號 的頻譜變得平坦。以便于頻譜分析和聲道參數(shù)分的頻譜變得平坦。以便于頻譜分析和聲道參數(shù)分 析。析。 一般在語音信號數(shù)字化后,通過一個一階一般在語音信號數(shù)字化后,通過一個一階 數(shù)字濾波器:數(shù)字濾波器:H(z)=1-H(z)=1- z

10、z-1 -1, , 接近 接近1 1。 x(n)x(n)x x (n)(n) H(z)=1-H(z)=1- z z-1 -1 2. 加窗分幀處理: 第第n n幀幀 第第n+1n+1幀幀 第第n+2n+2幀幀 t 第n幀第n+1幀第n+2幀第n+3幀 第n+4幀 幀長幀長N N幀移幀移T T otherwise Nn N n nw otherwise Nn N n nw otherwise Nn nw 10 0 ) 1 2cos(46. 054. 0 )( 10 0 ) 1 2cos(5 . 05 . 0 )( 0 101 )( 漢寧窗漢寧窗 hanning 海明窗海明窗 hamming 矩形窗

11、矩形窗(rectangular) Window shapes T T為幀移為幀移 長度長度 N N為幀長為幀長 ,.,T2 ,T1 , 0 0 101 )( 10)()()( n others Nm mw Nmmnxmwmxn x0(m) 0N-1 x1(m) TT+N-1 第第1 1幀幀 第第2 2幀幀 0 0N-1N-1N N2N-12N-1 第第1 1幀幀 第第2 2幀幀 0 0N-1N-1 N/2N/2N+(N/2)-1N+(N/2)-1 x x0 0(m)(m)x x1 1(m)(m) x x0 0(m)(m) x x1 1(m)(m) 幀移幀移T=0 幀移幀移T= N/2 5125

12、12點的點的 Long window: frequency resolution Long window: frequency resolution time resolution time resolution Short window: frequency resolutionShort window: frequency resolution time resolution time resolution 基音頻率為基音頻率為200Hz200Hz,采樣頻率為,采樣頻率為8kHz, 8kHz, 窗長:窗長: 80008000 (1/200)(1/200) 7=2567=256 Window

13、ing (frame) In short-term, non-stationary-stationary Non-linear-linear (10ms-25ms) 經(jīng)過處理,語音信號就已經(jīng)被分割成一幀一經(jīng)過處理,語音信號就已經(jīng)被分割成一幀一 幀的加過窗函數(shù)的短時信號,然后再把每一個短幀的加過窗函數(shù)的短時信號,然后再把每一個短 時語音幀看成平穩(wěn)的隨機(jī)信號,利用數(shù)字信號處時語音幀看成平穩(wěn)的隨機(jī)信號,利用數(shù)字信號處 理技術(shù)來提取語音特征參數(shù)。在進(jìn)行處理時,按理技術(shù)來提取語音特征參數(shù)。在進(jìn)行處理時,按 幀從數(shù)據(jù)區(qū)中取出數(shù)據(jù),處理完后再取下一幀。幀從數(shù)據(jù)區(qū)中取出數(shù)據(jù),處理完后再取下一幀。 最后得到由每

14、一幀參數(shù)組成的語音特征參數(shù)的時最后得到由每一幀參數(shù)組成的語音特征參數(shù)的時 間序列。間序列。 x0(m) 0N-1 x1(m) TT+N-1 y0(m) 0N-1 y1(m) TT+N-1 3.3 語音信號的時域分析 一、短時能量及短時平均幅度分析 二、短時過零率分析 三、短時相關(guān)分析 四、短時平均幅度差函數(shù) 1.1.幅度分析的依據(jù)幅度分析的依據(jù):是基于語音信號幅度隨時間:是基于語音信號幅度隨時間 變化。清音段幅度小,其能量集中于高頻段;濁變化。清音段幅度小,其能量集中于高頻段;濁 音段幅度較大,其能量集中于低頻段。音段幅度較大,其能量集中于低頻段。 2.2.短時能量函數(shù)和短時平均幅度函數(shù)短時能

15、量函數(shù)和短時平均幅度函數(shù) 一、短時能量及短時平均幅度分析 1 0 2 )( N m nn mxE 1 0 )( N m nn mxM T T為幀移長度為幀移長度 N N為幀長為幀長 ,.,T2 ,T1 , 0 0 101 )( 10)()()( n others Nm mw Nmmnxmwmxn 男聲男聲“深圳深圳 廣州廣州 珠海珠海”的短時幅度統(tǒng)的短時幅度統(tǒng) 計。在采樣頻率為計。在采樣頻率為22050Hz22050Hz的情況下,取的情況下,取20ms20ms作作 為一幀,幀長為為一幀,幀長為441441點,一共統(tǒng)計了點,一共統(tǒng)計了180180幀。幀。 短時平均幅度短時平均幅度 原始原始 語音

16、語音 3.短時平均幅度函數(shù)和能量函數(shù)的作用短時平均幅度函數(shù)和能量函數(shù)的作用 (1)(1)區(qū)分清區(qū)分清/ /濁音:濁音: E En n、M Mn n大,對應(yīng)濁音;大,對應(yīng)濁音; E En n、M Mn n小,對應(yīng)清音。小,對應(yīng)清音。 (2)(2)在信噪比高的情況下,能進(jìn)行有聲在信噪比高的情況下,能進(jìn)行有聲/ /無聲判決無聲判決 無聲時,背景噪聲的無聲時,背景噪聲的E En n、M Mn n?。恍。?有聲時,有聲時,E En n、M Mn n顯著增大。判決時可設(shè)置一個門限。顯著增大。判決時可設(shè)置一個門限。 (3)(3)大致能定出濁音變?yōu)榍逡舻臅r刻,或反之。大致能定出濁音變?yōu)榍逡舻臅r刻,或反之。 0

17、50100150200250300350400450 -1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 女聲漢語拼音女聲漢語拼音a a的一幀信號(在采樣頻的一幀信號(在采樣頻 率為率為22050Hz22050Hz的情況下,取的情況下,取20ms20ms作為一幀),作為一幀), 濁音的短時能量濁音的短時能量78.6178.61 050100150200250300350400450 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 男聲漢語拼音男聲漢語拼音s s的一幀信號(在采樣頻率為的一幀信號(在采樣頻率為 22050Hz22050Hz的情

18、況下,取的情況下,取20ms20ms作為一幀),清音的作為一幀),清音的 短時能量短時能量3.883.88。 靜音檢測(靜音檢測(VADVAD)和舒適噪聲)和舒適噪聲(CNG)(CNG)的生成的生成 VAD: Voice Activity DetectionVAD: Voice Activity Detection CNG: Comfort Noise Generator CNG: Comfort Noise Generator 測試表明,人在正常談話時,有測試表明,人在正常談話時,有5050左右是靜左右是靜 音。音。VADVAD是用來檢測輸入的信號是實際語音還是背是用來檢測輸入的信號是實際語

19、音還是背 景噪聲,若檢測是實際語音信號進(jìn)行固定編碼;如景噪聲,若檢測是實際語音信號進(jìn)行固定編碼;如 果是背景噪聲,則采用更低的速率進(jìn)行編碼。果是背景噪聲,則采用更低的速率進(jìn)行編碼。VADVAD 檢測的結(jié)果傳送給檢測的結(jié)果傳送給CNGCNG則是接收端,重構(gòu)背景噪聲。則是接收端,重構(gòu)背景噪聲。 VADVAD可通過能量檢測來實現(xiàn)??赏ㄟ^能量檢測來實現(xiàn)。 短時能量函數(shù)一個主要的問題是短時能量函數(shù)一個主要的問題是E En n對信號電平對信號電平 值過于敏感。由于需要計算信號樣值的平方和,在值過于敏感。由于需要計算信號樣值的平方和,在 實際應(yīng)用中(如定點設(shè)備)很容易溢出。因此,一實際應(yīng)用中(如定點設(shè)備)很

20、容易溢出。因此,一 般用平均幅度函數(shù)般用平均幅度函數(shù)M Mn n來代替來代替E En n。但這時,清音和濁。但這時,清音和濁 音、有聲和無聲的幅度差不如短時能量明顯。音、有聲和無聲的幅度差不如短時能量明顯。 存在的問題存在的問題 1.1.過零率定義過零率定義:信號跨越橫軸的情況。:信號跨越橫軸的情況。 對于連續(xù)信號,觀察語音時域波形通過橫軸的情況;對于連續(xù)信號,觀察語音時域波形通過橫軸的情況; 對于離散信號,相鄰的采樣值具有不同的代數(shù)符號,對于離散信號,相鄰的采樣值具有不同的代數(shù)符號, 也就是樣點改變符號的次數(shù)。也就是樣點改變符號的次數(shù)。 t tn n 二、短時過零率分析 ZCR 對于語音信號

21、,是寬帶非平穩(wěn)信號,應(yīng)考察其對于語音信號,是寬帶非平穩(wěn)信號,應(yīng)考察其 短時平均過零率。短時平均過零率。 1 0 )1(sgn)(sgn 2 1 N m nnn mxmxZ sgn(sgn(x x( (n n)=1 )=1 x x( (n n) ) 0 0 sgn(sgn(x x( (n n)= -1 )= -1 x x( (n n)0)0 sgn.sgn.為符號函數(shù)為符號函數(shù) 3 3、短時平均過零的作用、短時平均過零的作用 1.1.區(qū)分清區(qū)分清/ /濁音:濁音: 濁音平均過零率低,集中在低頻端;濁音平均過零率低,集中在低頻端; 清音平均過零率高,集中在高頻端。清音平均過零率高,集中在高頻端。

22、2.2.從背景噪聲中找出是否有語音,以及語音從背景噪聲中找出是否有語音,以及語音 的起點。的起點。 050100150200250300350400450 -1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1 女聲漢語拼音女聲漢語拼音a a的一幀信號(在采樣頻的一幀信號(在采樣頻 率為率為22050Hz22050Hz的情況下,取的情況下,取20ms20ms作為一幀),作為一幀), 短時過零率為短時過零率為4646。 男聲漢語拼音男聲漢語拼音s s的一幀信號(在采樣頻的一幀信號(在采樣頻 率為率為22050Hz22050Hz的情況下,取的情況下,取20ms20ms

23、作為一幀),作為一幀), 短時過零率為短時過零率為183183。 050100150200250300350400450 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 在實際應(yīng)用中,短時平均過零率容易受到在實際應(yīng)用中,短時平均過零率容易受到A/DA/D轉(zhuǎn)轉(zhuǎn) 換是的直流偏移、換是的直流偏移、50Hz50Hz交流電源的干擾以及噪聲的影交流電源的干擾以及噪聲的影 響。響。 減少這些干擾可以有兩種方法:一種是采用帶通減少這些干擾可以有兩種方法:一種是采用帶通 濾波器消除信號中的直流和濾波器消除信號中的直流和50Hz50Hz低頻分量;低頻分量; Bandpass filte Hb

24、w Hb(ejw) x(n)x(n)y(n)y(n) 另一種是用過門限率來修改過零率,減少隨機(jī)噪另一種是用過門限率來修改過零率,減少隨機(jī)噪 聲的影響。聲的影響。 過門限率反映了穿過正負(fù)門限的次數(shù),如果存在過門限率反映了穿過正負(fù)門限的次數(shù),如果存在 隨機(jī)噪聲,只要信號沒有超過隨機(jī)噪聲,只要信號沒有超過-T,T-T,T的范圍,就沒有的范圍,就沒有 有過零率產(chǎn)生。有過零率產(chǎn)生。 T -T 三、短時相關(guān)分析 1.相關(guān)分析的依據(jù): 用于確定兩個信號在時域內(nèi)的相似性。常用的用于確定兩個信號在時域內(nèi)的相似性。常用的 物理量為自相關(guān)函數(shù)和互相關(guān)函數(shù)。當(dāng)兩個信號物理量為自相關(guān)函數(shù)和互相關(guān)函數(shù)。當(dāng)兩個信號 的互相

25、關(guān)函數(shù)大時,則說明一個信號可能是另一的互相關(guān)函數(shù)大時,則說明一個信號可能是另一 個信號的時間滯后或提前;當(dāng)互相關(guān)函數(shù)為個信號的時間滯后或提前;當(dāng)互相關(guān)函數(shù)為0 0時,時, 則兩個信號完全不同。則兩個信號完全不同。 自相關(guān)函數(shù)用于研究信號本身,如波形的同步自相關(guān)函數(shù)用于研究信號本身,如波形的同步 性和周期性。性和周期性。 主信號主信號s+n0s+n0,為有用信號,為有用信號s s(來自信號源)和一(來自信號源)和一 個與它不相關(guān)的噪聲信號的混合而成。個與它不相關(guān)的噪聲信號的混合而成。 n1n1為另外拾取的噪聲參考信號,與為另外拾取的噪聲參考信號,與n0n0相關(guān)。相關(guān)。 主輸入信號主輸入信號x=s

26、+n0 + x=s+n0 + 輸出輸出ss 參考輸入?yún)⒖驾斎雗1n1自適應(yīng)自適應(yīng) 濾波器濾波器 + + nn - - 利用信號的相關(guān)性達(dá)到消除噪聲的目的利用信號的相關(guān)性達(dá)到消除噪聲的目的 2.2.短時自相關(guān)函數(shù)的定義短時自相關(guān)函數(shù)的定義 KkkmxmxkR kN m nnn 0)()()( 1 0 (1)(1)說明當(dāng)時域信號為周期信號時,自相關(guān)函數(shù)說明當(dāng)時域信號為周期信號時,自相關(guān)函數(shù) 也是周期性函數(shù),兩者具有同樣的周期。也是周期性函數(shù),兩者具有同樣的周期。 (2)R(2)Rn n(k)(k)為偶函數(shù),為偶函數(shù), R Rn n(k)(k)R Rn n( (k)k) (3)R(3)Rn n(0)

27、(0)最大,最大, R Rn n(0)(0) |R |Rn n(k)|, R(k)|, Rn n(0)=E(0)=En n, ,對于對于 確定信號,確定信號, R Rn n(0)(0)是信號能量;對于隨機(jī)信號或是信號能量;對于隨機(jī)信號或 周期信號,周期信號, R Rn n(0)(0)是平均功率。是平均功率。 0100020003000400050006000 -1 -0.5 0 0.5 1 0100020003000400050006000 -3000 -2000 -1000 0 1000 2000 3000 正弦波周期信號正弦波周期信號 正弦波周期信號的自相關(guān)函數(shù)波形正弦波周期信號的自相關(guān)函

28、數(shù)波形 0100020003000400050006000 -3000 -2000 -1000 0 1000 2000 3000 正弦波周期信號和其自相關(guān)函數(shù)疊加正弦波周期信號和其自相關(guān)函數(shù)疊加 3 3、相關(guān)函數(shù)的作用、相關(guān)函數(shù)的作用 1.1.區(qū)分清區(qū)分清/ /濁音。濁音。 濁音語音的自相關(guān)函數(shù)具有一定的周期性。濁音語音的自相關(guān)函數(shù)具有一定的周期性。 清音語音的自相關(guān)函數(shù)不具有周期性,類似噪聲,清音語音的自相關(guān)函數(shù)不具有周期性,類似噪聲, 有點如語音信號本身。有點如語音信號本身。 2.2.估計濁音語音信號的周期,即估計基音周期。估計濁音語音信號的周期,即估計基音周期。 女聲漢語拼音女聲漢語拼音

29、a a的一幀信號(在采樣頻率為的一幀信號(在采樣頻率為 22050Hz22050Hz的情況下,取的情況下,取20ms20ms作為一幀),自相關(guān)作為一幀),自相關(guān) 波形圖。說明濁音的自相關(guān)函數(shù)具有一定的周期波形圖。說明濁音的自相關(guān)函數(shù)具有一定的周期 性。性。 050100150200250300350400450 -1 -0.5 0 0.5 1 050100150200250300350400450 -100 -50 0 50 100 原始語音信號原始語音信號 自相關(guān)函數(shù)波形自相關(guān)函數(shù)波形 050100150200250300350400450500 -60 -40 -20 0 20 40 60

30、 80 原始語音信號和其自相關(guān)函數(shù)波形原始語音信號和其自相關(guān)函數(shù)波形 Auto-correlation peaks 050100150200250300350400450 -0.4 -0.2 0 0.2 0.4 050100150200250300350400450 -2 -1 0 1 2 3 男聲漢語拼音男聲漢語拼音s s的一幀信號(在采樣頻率為的一幀信號(在采樣頻率為 22050Hz的情況下,取的情況下,取20ms作為一幀),自相關(guān)作為一幀),自相關(guān) 波形圖。波形圖。 原始語音信號原始語音信號 自相關(guān)函數(shù)波形自相關(guān)函數(shù)波形 男聲漢語拼音男聲漢語拼音s s的一幀信號(在采樣頻率為的一幀信號(

31、在采樣頻率為 22050Hz的情況下,取的情況下,取10ms作為一幀),自相作為一幀),自相 關(guān)波形圖。關(guān)波形圖。 原始語音信號原始語音信號 修改坐標(biāo)的自相關(guān)函數(shù)波形修改坐標(biāo)的自相關(guān)函數(shù)波形 用用MATLABMATLAB的函數(shù)的函數(shù)randnrandn,產(chǎn)生一幀高斯白,產(chǎn)生一幀高斯白 噪聲,其自相關(guān)函數(shù)圖。說明清音是噪聲激勵噪聲,其自相關(guān)函數(shù)圖。說明清音是噪聲激勵 的正確性。的正確性。 白噪聲信號白噪聲信號 修改坐標(biāo)的自相關(guān)函數(shù)波形修改坐標(biāo)的自相關(guān)函數(shù)波形 聲道的共振峰特性對基音周期的估計造成干擾,聲道的共振峰特性對基音周期的估計造成干擾, 這是因為語音信號包含豐富的諧波分量。基音頻率的這是因

32、為語音信號包含豐富的諧波分量。基音頻率的 范圍分布在范圍分布在5050450Hz450Hz左右。同時,第一共振峰通常左右。同時,第一共振峰通常 在在2002001000Hz1000Hz的范圍內(nèi),這樣可能導(dǎo)致語音的諧波的范圍內(nèi),這樣可能導(dǎo)致語音的諧波 分量高于基頻分量,對基音周期的估計造成錯誤。分量高于基頻分量,對基音周期的估計造成錯誤。 采用中心削波法:采用中心削波法: Tnx TnxTnx TnxTnx ncny | )(|0 )()( )()( )()( KkkmymykR kN m nnn 0)()()( 1 0 Center-clipping technique Cn 三、短時平均幅度

33、差函數(shù)(AMDF) 1.短時平均幅度差函數(shù)的意義: 短時自相關(guān)函數(shù)是語音信號時域分析的重要參短時自相關(guān)函數(shù)是語音信號時域分析的重要參 量,但由于乘法運(yùn)算所需要的時間長。為了避免量,但由于乘法運(yùn)算所需要的時間長。為了避免 乘法,一個簡單的方法就是利用差值,為此常常乘法,一個簡單的方法就是利用差值,為此常常 采用另一種與自相關(guān)函數(shù)有類似作用的參量,短采用另一種與自相關(guān)函數(shù)有類似作用的參量,短 時平均幅度差函數(shù)。時平均幅度差函數(shù)。 短時平均幅度差函數(shù)能夠代替自相關(guān)函數(shù)的短時平均幅度差函數(shù)能夠代替自相關(guān)函數(shù)的 原理是:如果信號是完全的周期信號(設(shè)周期為原理是:如果信號是完全的周期信號(設(shè)周期為 N Np p), ,則相距為周期的整數(shù)倍的樣點上的幅值相等,則相距為周期的整數(shù)倍的樣點上的幅值相等, 差值為零:差值為零:d(n)=x(n)-x(n-k)=0d(n)=x(n)-x(n-k)=0,短時平均幅度,短時平均幅度 差函數(shù)定義為:差函數(shù)定義為: KkkmxmxkF kN m nnn 0| )()(|)( 1 0 對于周期性的對于周期性的x(n)x(n),F(xiàn) Fn n(k)(k)也呈周期性,也呈周期性, 與與R Rn n

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論