




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、 第三章 語(yǔ)音信號(hào)分析3.2 語(yǔ)音信號(hào)的數(shù)字化和預(yù)處理 3.3 語(yǔ)音信號(hào)的時(shí)域分析3.4 語(yǔ)音信號(hào)的頻域分析3.5 語(yǔ)音信號(hào)的倒譜分析3.6 語(yǔ)音信號(hào)的線性預(yù)測(cè)分析A Av v沖激序列沖激序列發(fā)生器發(fā)生器聲門(mén)脈沖聲門(mén)脈沖模型模型G(z)G(z)隨機(jī)噪聲隨機(jī)噪聲發(fā)生器發(fā)生器基音周期基音周期T TP PA AN N線性系統(tǒng)線性系統(tǒng)聲道聲道V V( (z z) )輻射模型輻射模型R R( (z z) )清清/ /濁音濁音開(kāi)關(guān)開(kāi)關(guān))()()()(zRzVzGzH 語(yǔ)音信號(hào)的分析,就是找出語(yǔ)音產(chǎn)生模型的各種語(yǔ)音信號(hào)的分析,就是找出語(yǔ)音產(chǎn)生模型的各種參數(shù)(語(yǔ)音的特征參數(shù)),應(yīng)用于語(yǔ)音的編碼、識(shí)參數(shù)(語(yǔ)音的
2、特征參數(shù)),應(yīng)用于語(yǔ)音的編碼、識(shí)別和合成等。別和合成等。3.2 語(yǔ)音信號(hào)的數(shù)字化和預(yù)處理一、預(yù)濾波、采樣和A/D轉(zhuǎn)換二、預(yù)處理 1.預(yù)濾波的作用:抑制輸入信號(hào)中頻率超出抑制輸入信號(hào)中頻率超出f fs s/2/2的的所有分量,防止混疊;抑制所有分量,防止混疊;抑制50Hz50Hz的電源工頻干擾。的電源工頻干擾。 預(yù)濾波器是一個(gè)帶通濾波器,一般情況下,上、預(yù)濾波器是一個(gè)帶通濾波器,一般情況下,上、下截止頻率為:下截止頻率為: f fH H=3400Hz=3400Hz, f fL L=60=60100Hz100Hz。一、預(yù)濾波、采樣和A/D轉(zhuǎn)換tnxa(nT)xa(t) 2.采樣: 將時(shí)間連續(xù)信號(hào)將
3、時(shí)間連續(xù)信號(hào)變成時(shí)間離散信號(hào)。變成時(shí)間離散信號(hào)。 采樣頻率通常為采樣頻率通常為f fs s8kHz8kHz。 Ideal sampling and real sampling 對(duì)離散時(shí)間信號(hào)進(jìn)行量化,在每一時(shí)刻對(duì)對(duì)離散時(shí)間信號(hào)進(jìn)行量化,在每一時(shí)刻對(duì)x xa a(nT)(nT)獨(dú)立進(jìn)行量化,把給定的幅度連續(xù)的信號(hào)變成為有獨(dú)立進(jìn)行量化,把給定的幅度連續(xù)的信號(hào)變成為有限多個(gè)幅度的集合中某個(gè)幅度值的過(guò)程。限多個(gè)幅度的集合中某個(gè)幅度值的過(guò)程。3. A/D轉(zhuǎn)換采樣采樣量化量化x xa a(t)(t)x xa a(nT)(nT)x(n)x(n)x xa1a1x x1 1x xk kx xakakx xak+
4、1ak+1x xk+1k+1x xL Lx xaLaLx xaL+1aL+1x(n)=Qxx(n)=Qxa a(nT)(nT) 000001010011111110101100 /2/2量化誤差量化誤差( (噪聲噪聲) ) e(n)=x(n)- xe(n)=x(n)- xa a(nT) (nT) - - /2/2 e(n) e(n) /2/22 m=00 其他其他(1 1)假設(shè)量化噪聲是平穩(wěn)的白噪聲過(guò)程,有)假設(shè)量化噪聲是平穩(wěn)的白噪聲過(guò)程,有 Ee(n)e(n+m)=Ee(n)e(n+m)=(2 2)假設(shè)量化噪聲與輸入信號(hào)不相關(guān),有)假設(shè)量化噪聲與輸入信號(hào)不相關(guān),有 Ee(n)x(n+m)=0
5、 mEe(n)x(n+m)=0 m為任意值為任意值(3 3)在每個(gè)量化間隔上,量化噪聲均勻分布,有)在每個(gè)量化間隔上,量化噪聲均勻分布,有 P Pe e(e(n)=(e(n)=1 |e(n)| 1 |e(n)| /2/2 0 其他其他量化信噪比量化信噪比量化噪聲的信噪比:量化噪聲的信噪比:SNR=SNR= x x2 2/ / e e2 2 x x2 2語(yǔ)音信號(hào)序列的方差,語(yǔ)音信號(hào)序列的方差, e e2 2噪聲序列的方差,噪聲序列的方差, 用分貝表示,用分貝表示,SNR=10log(SNR=10log( x x2 2/ / e e2 2) SNR = signals energy / noise
6、s energySNR=6.02B+4.77SNR=6.02B+4.7720log(X20log(Xmaxmax/ / x x) )6.02B6.02B7.277.27 X Xmaxmax表示其峰值表示其峰值 B B為量化的比特?cái)?shù)為量化的比特?cái)?shù)當(dāng)語(yǔ)音信號(hào)的幅度服從拉普拉斯分布時(shí),當(dāng)語(yǔ)音信號(hào)的幅度服從拉普拉斯分布時(shí),X Xmaxmax4 4 x x 量化器每增加一個(gè)比特,量化器每增加一個(gè)比特,SNRSNR提高約提高約6dB6dB。當(dāng)。當(dāng)B=8,SNR=40dBB=8,SNR=40dB,滿(mǎn)足一般通信系統(tǒng)的要求。當(dāng)量化,滿(mǎn)足一般通信系統(tǒng)的要求。當(dāng)量化噪聲的信噪比達(dá)到噪聲的信噪比達(dá)到 606070dB
7、70dB,才能保障有高水平,才能保障有高水平通話(huà)質(zhì)量,這時(shí)要求量化為通話(huà)質(zhì)量,這時(shí)要求量化為 111113bits13bits。一般的。一般的音頻音頻A/DA/D、D/AD/A轉(zhuǎn)換芯片,量化為轉(zhuǎn)換芯片,量化為12bits12bits。 A/D of some common audio signals Frequency Frequency scopescopeSampling Sampling frequencyfrequencyQuantizatiQuantization bitson bitsTelephoneTelephone200-3400200-34008 khz8 khz8 bit
8、s8 bitsWide bandWide band50-700050-700016 khz16 khz16 bits16 bitsBroadcastiBroadcastingng20-15khz20-15khz37.8 khz37.8 khz16 bits16 bitsCDCD20-20khz20-20khz44.1 khz44.1 khz16 bits16 bits1.存儲(chǔ)方式: 已量化好的語(yǔ)音信號(hào)序列按已量化好的語(yǔ)音信號(hào)序列按先入先出的順序存入數(shù)據(jù)區(qū)。先入先出的順序存入數(shù)據(jù)區(qū)。以便一個(gè)有限容量的數(shù)據(jù)區(qū)來(lái)以便一個(gè)有限容量的數(shù)據(jù)區(qū)來(lái)應(yīng)付數(shù)量極大的語(yǔ)音數(shù)據(jù)。應(yīng)付數(shù)量極大的語(yǔ)音數(shù)據(jù)。二、預(yù)處理2.
9、預(yù)加重: 在求語(yǔ)音信號(hào)頻譜時(shí),頻率越高,相應(yīng)的成在求語(yǔ)音信號(hào)頻譜時(shí),頻率越高,相應(yīng)的成分越小。預(yù)加重的目的是提升高頻部分,使信號(hào)分越小。預(yù)加重的目的是提升高頻部分,使信號(hào)的頻譜變得平坦。以便于頻譜分析和聲道參數(shù)分的頻譜變得平坦。以便于頻譜分析和聲道參數(shù)分析。析。 一般在語(yǔ)音信號(hào)數(shù)字化后,通過(guò)一個(gè)一階一般在語(yǔ)音信號(hào)數(shù)字化后,通過(guò)一個(gè)一階數(shù)字濾波器:數(shù)字濾波器:H(z)=1-H(z)=1- z z-1-1, , 接近接近1 1。x(n)x(n)x x (n)(n)H(z)=1-H(z)=1- z z-1-12. 加窗分幀處理: 第第n n幀幀第第n+1n+1幀幀第第n+2n+2幀幀t第n幀第n+1
10、幀第n+2幀第n+3幀 第n+4幀 幀長(zhǎng)幀長(zhǎng)N N幀移幀移T TotherwiseNnNnnwotherwiseNnNnnwotherwiseNnnw100)12cos(46. 054. 0)(100)12cos(5 . 05 . 0)(0101)(漢寧窗漢寧窗 hanning海明窗海明窗 hamming矩形窗矩形窗(rectangular)Window shapesT T為幀移為幀移長(zhǎng)度長(zhǎng)度N N為幀長(zhǎng)為幀長(zhǎng),.,T2 ,T1 , 00101)(10)()()(nothersNmmwNmmnxmwmxnx0(m)0N-1x1(m)TT+N-1第第1 1幀幀第第2 2幀幀0 0N-1N-1N
11、N2N-12N-1 第第1 1幀幀第第2 2幀幀0 0N-1N-1N/2N/2N+(N/2)-1N+(N/2)-1x x0 0(m)(m)x x1 1(m)(m)x x0 0(m)(m)x x1 1(m)(m)幀移幀移T=0幀移幀移T= N/2512512點(diǎn)的點(diǎn)的Long window: frequency resolution Long window: frequency resolution time resolution time resolutionShort window: frequency resolutionShort window: frequency resolution
12、time resolution time resolution 基音頻率為基音頻率為200Hz200Hz,采樣頻率為,采樣頻率為8kHz, 8kHz, 窗長(zhǎng):窗長(zhǎng): 80008000 (1/200)(1/200) 7=2567=256Windowing (frame) In short-term, non-stationary-stationary Non-linear-linear (10ms-25ms) 經(jīng)過(guò)處理,語(yǔ)音信號(hào)就已經(jīng)被分割成一幀一經(jīng)過(guò)處理,語(yǔ)音信號(hào)就已經(jīng)被分割成一幀一幀的加過(guò)窗函數(shù)的短時(shí)信號(hào),然后再把每一個(gè)短幀的加過(guò)窗函數(shù)的短時(shí)信號(hào),然后再把每一個(gè)短時(shí)語(yǔ)音幀看成平穩(wěn)的隨機(jī)信號(hào),
13、利用數(shù)字信號(hào)處時(shí)語(yǔ)音幀看成平穩(wěn)的隨機(jī)信號(hào),利用數(shù)字信號(hào)處理技術(shù)來(lái)提取語(yǔ)音特征參數(shù)。在進(jìn)行處理時(shí),按理技術(shù)來(lái)提取語(yǔ)音特征參數(shù)。在進(jìn)行處理時(shí),按幀從數(shù)據(jù)區(qū)中取出數(shù)據(jù),處理完后再取下一幀。幀從數(shù)據(jù)區(qū)中取出數(shù)據(jù),處理完后再取下一幀。最后得到由每一幀參數(shù)組成的語(yǔ)音特征參數(shù)的時(shí)最后得到由每一幀參數(shù)組成的語(yǔ)音特征參數(shù)的時(shí)間序列。間序列。x0(m)0N-1x1(m)TT+N-1y0(m)0N-1y1(m)TT+N-13.3 語(yǔ)音信號(hào)的時(shí)域分析一、短時(shí)能量及短時(shí)平均幅度分析二、短時(shí)過(guò)零率分析三、短時(shí)相關(guān)分析四、短時(shí)平均幅度差函數(shù)1.1.幅度分析的依據(jù)幅度分析的依據(jù):是基于語(yǔ)音信號(hào)幅度隨時(shí)間:是基于語(yǔ)音信號(hào)幅度隨
14、時(shí)間變化。清音段幅度小,其能量集中于高頻段;濁變化。清音段幅度小,其能量集中于高頻段;濁音段幅度較大,其能量集中于低頻段。音段幅度較大,其能量集中于低頻段。2.2.短時(shí)能量函數(shù)和短時(shí)平均幅度函數(shù)短時(shí)能量函數(shù)和短時(shí)平均幅度函數(shù)一、短時(shí)能量及短時(shí)平均幅度分析102)(NmnnmxE10)(NmnnmxMT T為幀移長(zhǎng)度為幀移長(zhǎng)度N N為幀長(zhǎng)為幀長(zhǎng),.,T2 ,T1 , 00101)(10)()()(nothersNmmwNmmnxmwmxn 男聲男聲“深圳深圳 廣州廣州 珠海珠?!钡亩虝r(shí)幅度統(tǒng)的短時(shí)幅度統(tǒng)計(jì)。在采樣頻率為計(jì)。在采樣頻率為22050Hz22050Hz的情況下,取的情況下,取20ms2
15、0ms作作為一幀,幀長(zhǎng)為為一幀,幀長(zhǎng)為441441點(diǎn),一共統(tǒng)計(jì)了點(diǎn),一共統(tǒng)計(jì)了180180幀。幀。短時(shí)平均幅度短時(shí)平均幅度原始原始語(yǔ)音語(yǔ)音3.短時(shí)平均幅度函數(shù)和能量函數(shù)的作用短時(shí)平均幅度函數(shù)和能量函數(shù)的作用(1)(1)區(qū)分清區(qū)分清/ /濁音:濁音: E En n、M Mn n大,對(duì)應(yīng)濁音;大,對(duì)應(yīng)濁音; E En n、M Mn n小,對(duì)應(yīng)清音。小,對(duì)應(yīng)清音。(2)(2)在信噪比高的情況下,能進(jìn)行有聲在信噪比高的情況下,能進(jìn)行有聲/ /無(wú)聲判決無(wú)聲判決 無(wú)聲時(shí),背景噪聲的無(wú)聲時(shí),背景噪聲的E En n、M Mn n??;??; 有聲時(shí),有聲時(shí),E En n、M Mn n顯著增大。判決時(shí)可設(shè)置一個(gè)門(mén)限
16、。顯著增大。判決時(shí)可設(shè)置一個(gè)門(mén)限。(3)(3)大致能定出濁音變?yōu)榍逡舻臅r(shí)刻,或反之。大致能定出濁音變?yōu)榍逡舻臅r(shí)刻,或反之。050100150200250300350400450-1-0.8-0.6-0.4-0.200.20.40.60.81 女聲漢語(yǔ)拼音女聲漢語(yǔ)拼音a a的一幀信號(hào)(在采樣頻的一幀信號(hào)(在采樣頻率為率為22050Hz22050Hz的情況下,取的情況下,取20ms20ms作為一幀),作為一幀),濁音的短時(shí)能量濁音的短時(shí)能量78.6178.61050100150200250300350400450-0.4-0.3-0.2-0.100.10.20.3 男聲漢語(yǔ)拼音男聲漢語(yǔ)拼音s s的
17、一幀信號(hào)(在采樣頻率為的一幀信號(hào)(在采樣頻率為22050Hz22050Hz的情況下,取的情況下,取20ms20ms作為一幀),清音的作為一幀),清音的短時(shí)能量短時(shí)能量3.883.88。靜音檢測(cè)(靜音檢測(cè)(VADVAD)和舒適噪聲)和舒適噪聲(CNG)(CNG)的生成的生成VAD: Voice Activity DetectionVAD: Voice Activity DetectionCNG: Comfort Noise Generator CNG: Comfort Noise Generator 測(cè)試表明,人在正常談話(huà)時(shí),有測(cè)試表明,人在正常談話(huà)時(shí),有5050左右是靜左右是靜音。音。VADV
18、AD是用來(lái)檢測(cè)輸入的信號(hào)是實(shí)際語(yǔ)音還是背是用來(lái)檢測(cè)輸入的信號(hào)是實(shí)際語(yǔ)音還是背景噪聲,若檢測(cè)是實(shí)際語(yǔ)音信號(hào)進(jìn)行固定編碼;如景噪聲,若檢測(cè)是實(shí)際語(yǔ)音信號(hào)進(jìn)行固定編碼;如果是背景噪聲,則采用更低的速率進(jìn)行編碼。果是背景噪聲,則采用更低的速率進(jìn)行編碼。VADVAD檢測(cè)的結(jié)果傳送給檢測(cè)的結(jié)果傳送給CNGCNG則是接收端,重構(gòu)背景噪聲。則是接收端,重構(gòu)背景噪聲。VADVAD可通過(guò)能量檢測(cè)來(lái)實(shí)現(xiàn)??赏ㄟ^(guò)能量檢測(cè)來(lái)實(shí)現(xiàn)。 短時(shí)能量函數(shù)一個(gè)主要的問(wèn)題是短時(shí)能量函數(shù)一個(gè)主要的問(wèn)題是E En n對(duì)信號(hào)電平對(duì)信號(hào)電平值過(guò)于敏感。由于需要計(jì)算信號(hào)樣值的平方和,在值過(guò)于敏感。由于需要計(jì)算信號(hào)樣值的平方和,在實(shí)際應(yīng)用中(如
19、定點(diǎn)設(shè)備)很容易溢出。因此,一實(shí)際應(yīng)用中(如定點(diǎn)設(shè)備)很容易溢出。因此,一般用平均幅度函數(shù)般用平均幅度函數(shù)M Mn n來(lái)代替來(lái)代替E En n。但這時(shí),清音和濁。但這時(shí),清音和濁音、有聲和無(wú)聲的幅度差不如短時(shí)能量明顯。音、有聲和無(wú)聲的幅度差不如短時(shí)能量明顯。存在的問(wèn)題存在的問(wèn)題1.1.過(guò)零率定義過(guò)零率定義:信號(hào)跨越橫軸的情況。:信號(hào)跨越橫軸的情況。對(duì)于連續(xù)信號(hào),觀察語(yǔ)音時(shí)域波形通過(guò)橫軸的情況;對(duì)于連續(xù)信號(hào),觀察語(yǔ)音時(shí)域波形通過(guò)橫軸的情況;對(duì)于離散信號(hào),相鄰的采樣值具有不同的代數(shù)符號(hào),對(duì)于離散信號(hào),相鄰的采樣值具有不同的代數(shù)符號(hào),也就是樣點(diǎn)改變符號(hào)的次數(shù)。也就是樣點(diǎn)改變符號(hào)的次數(shù)。t tn n二
20、、短時(shí)過(guò)零率分析 ZCR 對(duì)于語(yǔ)音信號(hào),是寬帶非平穩(wěn)信號(hào),應(yīng)考察其對(duì)于語(yǔ)音信號(hào),是寬帶非平穩(wěn)信號(hào),應(yīng)考察其短時(shí)平均過(guò)零率。短時(shí)平均過(guò)零率。10)1(sgn)(sgn21NmnnnmxmxZsgn(sgn(x x( (n n)=1 )=1 x x( (n n) ) 0 0 sgn(sgn(x x( (n n)= -1 )= -1 x x( (n n)0)0 sgn.sgn.為符號(hào)函數(shù)為符號(hào)函數(shù)3 3、短時(shí)平均過(guò)零的作用、短時(shí)平均過(guò)零的作用1.1.區(qū)分清區(qū)分清/ /濁音:濁音: 濁音平均過(guò)零率低,集中在低頻端;濁音平均過(guò)零率低,集中在低頻端; 清音平均過(guò)零率高,集中在高頻端。清音平均過(guò)零率高,集中
21、在高頻端。2.2.從背景噪聲中找出是否有語(yǔ)音,以及語(yǔ)音從背景噪聲中找出是否有語(yǔ)音,以及語(yǔ)音的起點(diǎn)。的起點(diǎn)。050100150200250300350400450-1-0.8-0.6-0.4-0.200.20.40.60.81 女聲漢語(yǔ)拼音女聲漢語(yǔ)拼音a a的一幀信號(hào)(在采樣頻的一幀信號(hào)(在采樣頻率為率為22050Hz22050Hz的情況下,取的情況下,取20ms20ms作為一幀),作為一幀),短時(shí)過(guò)零率為短時(shí)過(guò)零率為4646。 男聲漢語(yǔ)拼音男聲漢語(yǔ)拼音s s的一幀信號(hào)(在采樣頻的一幀信號(hào)(在采樣頻率為率為22050Hz22050Hz的情況下,取的情況下,取20ms20ms作為一幀),作為一幀)
22、,短時(shí)過(guò)零率為短時(shí)過(guò)零率為183183。050100150200250300350400450-0.4-0.3-0.2-0.100.10.20.3 在實(shí)際應(yīng)用中,短時(shí)平均過(guò)零率容易受到在實(shí)際應(yīng)用中,短時(shí)平均過(guò)零率容易受到A/DA/D轉(zhuǎn)轉(zhuǎn)換是的直流偏移、換是的直流偏移、50Hz50Hz交流電源的干擾以及噪聲的影交流電源的干擾以及噪聲的影響。響。 減少這些干擾可以有兩種方法:一種是采用帶通減少這些干擾可以有兩種方法:一種是采用帶通濾波器消除信號(hào)中的直流和濾波器消除信號(hào)中的直流和50Hz50Hz低頻分量;低頻分量;Bandpass filte HbwHb(ejw)x(n)x(n)y(n)y(n) 另
23、一種是用過(guò)門(mén)限率來(lái)修改過(guò)零率,減少隨機(jī)噪另一種是用過(guò)門(mén)限率來(lái)修改過(guò)零率,減少隨機(jī)噪聲的影響。聲的影響。 過(guò)門(mén)限率反映了穿過(guò)正負(fù)門(mén)限的次數(shù),如果存在過(guò)門(mén)限率反映了穿過(guò)正負(fù)門(mén)限的次數(shù),如果存在隨機(jī)噪聲,只要信號(hào)沒(méi)有超過(guò)隨機(jī)噪聲,只要信號(hào)沒(méi)有超過(guò)-T,T-T,T的范圍,就沒(méi)有的范圍,就沒(méi)有有過(guò)零率產(chǎn)生。有過(guò)零率產(chǎn)生。T-T三、短時(shí)相關(guān)分析1.相關(guān)分析的依據(jù): 用于確定兩個(gè)信號(hào)在時(shí)域內(nèi)的相似性。常用的用于確定兩個(gè)信號(hào)在時(shí)域內(nèi)的相似性。常用的物理量為自相關(guān)函數(shù)和互相關(guān)函數(shù)。當(dāng)兩個(gè)信號(hào)物理量為自相關(guān)函數(shù)和互相關(guān)函數(shù)。當(dāng)兩個(gè)信號(hào)的互相關(guān)函數(shù)大時(shí),則說(shuō)明一個(gè)信號(hào)可能是另一的互相關(guān)函數(shù)大時(shí),則說(shuō)明一個(gè)信號(hào)可能是
24、另一個(gè)信號(hào)的時(shí)間滯后或提前;當(dāng)互相關(guān)函數(shù)為個(gè)信號(hào)的時(shí)間滯后或提前;當(dāng)互相關(guān)函數(shù)為0 0時(shí),時(shí),則兩個(gè)信號(hào)完全不同。則兩個(gè)信號(hào)完全不同。 自相關(guān)函數(shù)用于研究信號(hào)本身,如波形的同步自相關(guān)函數(shù)用于研究信號(hào)本身,如波形的同步性和周期性。性和周期性。 主信號(hào)主信號(hào)s+n0s+n0,為有用信號(hào),為有用信號(hào)s s(來(lái)自信號(hào)源)和一(來(lái)自信號(hào)源)和一個(gè)與它不相關(guān)的噪聲信號(hào)的混合而成。個(gè)與它不相關(guān)的噪聲信號(hào)的混合而成。 n1n1為另外拾取的噪聲參考信號(hào),與為另外拾取的噪聲參考信號(hào),與n0n0相關(guān)。相關(guān)。主輸入信號(hào)主輸入信號(hào)x=s+n0 + x=s+n0 + 輸出輸出ss參考輸入?yún)⒖驾斎雗1n1自適應(yīng)自適應(yīng)濾波器
25、濾波器+ +nn- -利用信號(hào)的相關(guān)性達(dá)到消除噪聲的目的利用信號(hào)的相關(guān)性達(dá)到消除噪聲的目的2.2.短時(shí)自相關(guān)函數(shù)的定義短時(shí)自相關(guān)函數(shù)的定義KkkmxmxkRkNmnnn0)()()(10(1)(1)說(shuō)明當(dāng)時(shí)域信號(hào)為周期信號(hào)時(shí),自相關(guān)函數(shù)說(shuō)明當(dāng)時(shí)域信號(hào)為周期信號(hào)時(shí),自相關(guān)函數(shù)也是周期性函數(shù),兩者具有同樣的周期。也是周期性函數(shù),兩者具有同樣的周期。(2)R(2)Rn n(k)(k)為偶函數(shù),為偶函數(shù), R Rn n(k)(k)R Rn n( (k)k)(3)R(3)Rn n(0)(0)最大,最大, R Rn n(0)(0) |R |Rn n(k)|, R(k)|, Rn n(0)=E(0)=En
26、n, ,對(duì)于對(duì)于確定信號(hào),確定信號(hào), R Rn n(0)(0)是信號(hào)能量;對(duì)于隨機(jī)信號(hào)或是信號(hào)能量;對(duì)于隨機(jī)信號(hào)或周期信號(hào),周期信號(hào), R Rn n(0)(0)是平均功率。是平均功率。0100020003000400050006000-1-0.500.510100020003000400050006000-3000-2000-10000100020003000正弦波周期信號(hào)正弦波周期信號(hào) 正弦波周期信號(hào)的自相關(guān)函數(shù)波形正弦波周期信號(hào)的自相關(guān)函數(shù)波形0100020003000400050006000-3000-2000-10000100020003000 正弦波周期信號(hào)和其自相關(guān)函數(shù)疊加正弦波周
27、期信號(hào)和其自相關(guān)函數(shù)疊加3 3、相關(guān)函數(shù)的作用、相關(guān)函數(shù)的作用1.1.區(qū)分清區(qū)分清/ /濁音。濁音。 濁音語(yǔ)音的自相關(guān)函數(shù)具有一定的周期性。濁音語(yǔ)音的自相關(guān)函數(shù)具有一定的周期性。 清音語(yǔ)音的自相關(guān)函數(shù)不具有周期性,類(lèi)似噪聲,清音語(yǔ)音的自相關(guān)函數(shù)不具有周期性,類(lèi)似噪聲,有點(diǎn)如語(yǔ)音信號(hào)本身。有點(diǎn)如語(yǔ)音信號(hào)本身。2.2.估計(jì)濁音語(yǔ)音信號(hào)的周期,即估計(jì)基音周期。估計(jì)濁音語(yǔ)音信號(hào)的周期,即估計(jì)基音周期。 女聲漢語(yǔ)拼音女聲漢語(yǔ)拼音a a的一幀信號(hào)(在采樣頻率為的一幀信號(hào)(在采樣頻率為22050Hz22050Hz的情況下,取的情況下,取20ms20ms作為一幀),自相關(guān)作為一幀),自相關(guān)波形圖。說(shuō)明濁音的自
28、相關(guān)函數(shù)具有一定的周期波形圖。說(shuō)明濁音的自相關(guān)函數(shù)具有一定的周期性。性。050100150200250300350400450-1-0.500.51050100150200250300350400450-100-50050100原始語(yǔ)音信號(hào)原始語(yǔ)音信號(hào)自相關(guān)函數(shù)波形自相關(guān)函數(shù)波形050100150200250300350400450500-60-40-20020406080 原始語(yǔ)音信號(hào)和其自相關(guān)函數(shù)波形原始語(yǔ)音信號(hào)和其自相關(guān)函數(shù)波形 Auto-correlation peaks050100150200250300350400450-0.4-0.200.20.40501001502002503
29、00350400450-2-10123 男聲漢語(yǔ)拼音男聲漢語(yǔ)拼音s s的一幀信號(hào)(在采樣頻率為的一幀信號(hào)(在采樣頻率為22050Hz的情況下,取的情況下,取20ms作為一幀),自相關(guān)作為一幀),自相關(guān)波形圖。波形圖。原始語(yǔ)音信號(hào)原始語(yǔ)音信號(hào)自相關(guān)函數(shù)波形自相關(guān)函數(shù)波形 男聲漢語(yǔ)拼音男聲漢語(yǔ)拼音s s的一幀信號(hào)(在采樣頻率為的一幀信號(hào)(在采樣頻率為22050Hz的情況下,取的情況下,取10ms作為一幀),自相作為一幀),自相關(guān)波形圖。關(guān)波形圖。原始語(yǔ)音信號(hào)原始語(yǔ)音信號(hào)修改坐標(biāo)的自相關(guān)函數(shù)波形修改坐標(biāo)的自相關(guān)函數(shù)波形 用用MATLABMATLAB的函數(shù)的函數(shù)randnrandn,產(chǎn)生一幀高斯白,產(chǎn)
30、生一幀高斯白噪聲,其自相關(guān)函數(shù)圖。說(shuō)明清音是噪聲激勵(lì)噪聲,其自相關(guān)函數(shù)圖。說(shuō)明清音是噪聲激勵(lì)的正確性。的正確性。白噪聲信號(hào)白噪聲信號(hào)修改坐標(biāo)的自相關(guān)函數(shù)波形修改坐標(biāo)的自相關(guān)函數(shù)波形 聲道的共振峰特性對(duì)基音周期的估計(jì)造成干擾,聲道的共振峰特性對(duì)基音周期的估計(jì)造成干擾,這是因?yàn)檎Z(yǔ)音信號(hào)包含豐富的諧波分量?;纛l率的這是因?yàn)檎Z(yǔ)音信號(hào)包含豐富的諧波分量。基音頻率的范圍分布在范圍分布在5050450Hz450Hz左右。同時(shí),第一共振峰通常左右。同時(shí),第一共振峰通常在在2002001000Hz1000Hz的范圍內(nèi),這樣可能導(dǎo)致語(yǔ)音的諧波的范圍內(nèi),這樣可能導(dǎo)致語(yǔ)音的諧波分量高于基頻分量,對(duì)基音周期的估計(jì)造成
31、錯(cuò)誤。分量高于基頻分量,對(duì)基音周期的估計(jì)造成錯(cuò)誤。 采用中心削波法:采用中心削波法: TnxTnxTnxTnxTnxncny| )(|0)()()()()()(KkkmymykRkNmnnn0)()()(10Center-clipping techniqueCn三、短時(shí)平均幅度差函數(shù)(AMDF)1.短時(shí)平均幅度差函數(shù)的意義: 短時(shí)自相關(guān)函數(shù)是語(yǔ)音信號(hào)時(shí)域分析的重要參短時(shí)自相關(guān)函數(shù)是語(yǔ)音信號(hào)時(shí)域分析的重要參量,但由于乘法運(yùn)算所需要的時(shí)間長(zhǎng)。為了避免量,但由于乘法運(yùn)算所需要的時(shí)間長(zhǎng)。為了避免乘法,一個(gè)簡(jiǎn)單的方法就是利用差值,為此常常乘法,一個(gè)簡(jiǎn)單的方法就是利用差值,為此常常采用另一種與自相關(guān)函數(shù)有
32、類(lèi)似作用的參量,短采用另一種與自相關(guān)函數(shù)有類(lèi)似作用的參量,短時(shí)平均幅度差函數(shù)。時(shí)平均幅度差函數(shù)。 短時(shí)平均幅度差函數(shù)能夠代替自相關(guān)函數(shù)的短時(shí)平均幅度差函數(shù)能夠代替自相關(guān)函數(shù)的原理是:如果信號(hào)是完全的周期信號(hào)(設(shè)周期為原理是:如果信號(hào)是完全的周期信號(hào)(設(shè)周期為N Np p), ,則相距為周期的整數(shù)倍的樣點(diǎn)上的幅值相等,則相距為周期的整數(shù)倍的樣點(diǎn)上的幅值相等,差值為零:差值為零:d(n)=x(n)-x(n-k)=0d(n)=x(n)-x(n-k)=0,短時(shí)平均幅度,短時(shí)平均幅度差函數(shù)定義為:差函數(shù)定義為:KkkmxmxkFkNmnnn0| )()(|)(10 對(duì)于周期性的對(duì)于周期性的x(n)x(n),F(xiàn) Fn n(k)(
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 工程款支付申請(qǐng)表的填寫(xiě)規(guī)范與標(biāo)準(zhǔn)
- 采暖散熱器施工方案
- 星級(jí)酒店關(guān)系質(zhì)量研究調(diào)查
- 2025年液堿行業(yè)現(xiàn)狀分析:我國(guó)燒堿產(chǎn)量為3980.5萬(wàn)噸
- 江西省部分學(xué)校2024-2025學(xué)年高三上學(xué)期1月期末英語(yǔ)試題【含答案】
- 2024年普通?等學(xué)校招?全國(guó)統(tǒng)?考試上海語(yǔ)?試卷
- 裝修成品保護(hù)施工方案
- 上海市安全員-C3證考試題及答案
- 清除路肩雜草施工方案
- 新風(fēng)機(jī)組施工方案
- 專(zhuān)題02 光現(xiàn)象(5大模塊知識(shí)清單+5個(gè)易混易錯(cuò)+2種方法技巧+典例真題解析)
- 支氣管封堵器在胸科手術(shù)中的應(yīng)用
- 北京市東城區(qū)2021-2022學(xué)年第一學(xué)期四年級(jí)期末考試語(yǔ)文試卷(含答案)
- 《STP市場(chǎng)營(yíng)銷(xiāo)戰(zhàn)略》課件
- 心理健康教育課件教學(xué)
- 河南省勞動(dòng)關(guān)系協(xié)調(diào)員職業(yè)技能大賽技術(shù)工作文件
- 成都實(shí)驗(yàn)中學(xué)2025屆高三最后一模英語(yǔ)試題含解析
- 2024年新《反洗錢(qián)法》修訂要點(diǎn)解讀
- 如何變廢為寶課件
- 中華人民共和國(guó)學(xué)前教育法
- 辯論英文課件教學(xué)課件
評(píng)論
0/150
提交評(píng)論