第三講 語音信號處理第3.1~3.4章_第1頁
第三講 語音信號處理第3.1~3.4章_第2頁
第三講 語音信號處理第3.1~3.4章_第3頁
第三講 語音信號處理第3.1~3.4章_第4頁
第三講 語音信號處理第3.1~3.4章_第5頁
已閱讀5頁,還剩70頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、3.13.1概述概述3.23.2語音信號的數(shù)字化和預(yù)處理語音信號的數(shù)字化和預(yù)處理3.33.3語音信號的時域分析語音信號的時域分析3.43.4語音信號的頻域分析語音信號的頻域分析3.53.5語音信號的倒譜分析語音信號的倒譜分析3.63.6語音信號的線性預(yù)測分析語音信號的線性預(yù)測分析3.7 3.7 語音信號的小波分析語音信號的小波分析3.8 3.8 基音周期估計基音周期估計3.93.9共振峰估計共振峰估計3.13.1概述概述3.23.2語音信號的數(shù)字化和預(yù)處理語音信號的數(shù)字化和預(yù)處理3.33.3語音信號的時域分析語音信號的時域分析3.43.4語音信號的頻域分析語音信號的頻域分析3.53.5語音信號

2、的倒譜分析語音信號的倒譜分析3.1 3.1 概述概述v語音信號分析語音信號分析 分析出可表示語音信號特征參數(shù)分析出可表示語音信號特征參數(shù)進行高效的語音通信、語音合成和語音識別的基礎(chǔ)進行高效的語音通信、語音合成和語音識別的基礎(chǔ)時域特征時域特征頻率特征頻率特征v貫穿于語音分析全過程的是貫穿于語音分析全過程的是“短時分析技術(shù)短時分析技術(shù)” 語音信號從整體來看其特征及表征其本質(zhì)特征的參數(shù)均語音信號從整體來看其特征及表征其本質(zhì)特征的參數(shù)均是隨時間而變化的,所以它是一個是隨時間而變化的,所以它是一個非平衡態(tài)過程非平衡態(tài)過程,不能用處,不能用處理平衡信號的數(shù)字信號處理技術(shù)對其進行分析處理。理平衡信號的數(shù)字信

3、號處理技術(shù)對其進行分析處理。 但是在一個短時間范圍內(nèi)(一般認為在但是在一個短時間范圍內(nèi)(一般認為在10-30ms10-30ms的短時的短時間內(nèi)),其特性基本保持不變即相對穩(wěn)定,因而可以將其看間內(nèi)),其特性基本保持不變即相對穩(wěn)定,因而可以將其看作是一個準穩(wěn)態(tài)過程,即語音信號具有作是一個準穩(wěn)態(tài)過程,即語音信號具有短時平穩(wěn)性短時平穩(wěn)性。 3.1 3.1 概述概述v分析方法:模型分析方法和非模型分析方法分析方法:模型分析方法和非模型分析方法v不論是分析怎么樣的參數(shù)以及彩什么分析方法,在不論是分析怎么樣的參數(shù)以及彩什么分析方法,在按幀進行語音分析,提取語音參數(shù)之前,有一些經(jīng)按幀進行語音分析,提取語音參數(shù)

4、之前,有一些經(jīng)常使用的、共同的短時分析技術(shù)必須預(yù)先進行,如常使用的、共同的短時分析技術(shù)必須預(yù)先進行,如語音信號的數(shù)字化、語音信號的端點檢測、預(yù)加重、語音信號的數(shù)字化、語音信號的端點檢測、預(yù)加重、加窗和分幀加窗和分幀等,這些也是不可忽視的語音信號分析等,這些也是不可忽視的語音信號分析的關(guān)鍵技術(shù)。的關(guān)鍵技術(shù)。 3.2 3.2 語音信號的數(shù)字化和預(yù)處理語音信號的數(shù)字化和預(yù)處理v語音信號的語音信號的數(shù)字化數(shù)字化一般包括放大及增益控制、反混一般包括放大及增益控制、反混疊濾波、采樣、疊濾波、采樣、A/DA/D變換及編碼(一般就是變換及編碼(一般就是PCMPCM碼)碼)v預(yù)處理預(yù)處理一般包括預(yù)加重、加窗和分

5、幀等一般包括預(yù)加重、加窗和分幀等。帶通濾波器自 動 增 益 控 制(AGC)模 / 數(shù) 轉(zhuǎn) 換(A/D)脈沖編碼調(diào)制(PCM)語音信號存入計算機 預(yù)濾波預(yù)濾波、采樣、采樣、A/DA/D變換變換預(yù)濾波的目的有兩個:預(yù)濾波的目的有兩個:v抑制輸入信號各頻域分量中頻率超出抑制輸入信號各頻域分量中頻率超出f fs s/2/2的所有分量,以防的所有分量,以防止止混疊干擾混疊干擾。v抑制抑制50Hz50Hz的的電源工頻干擾電源工頻干擾。v這樣,預(yù)濾波器必須是一個這樣,預(yù)濾波器必須是一個帶通濾波器帶通濾波器,設(shè)其上、下截止頻,設(shè)其上、下截止頻率分別是率分別是f fH H和和f fL L: 絕大多數(shù)語音編譯碼

6、器:絕大多數(shù)語音編譯碼器: f fH H=3400Hz=3400Hz,f fL L=60-100Hz=60-100Hz,f fS S=8kHz=8kHz 預(yù)濾波、預(yù)濾波、采樣、采樣、A/DA/D變換變換v量化不可避免地會產(chǎn)生誤差。量化后的信號值與原信號值之量化不可避免地會產(chǎn)生誤差。量化后的信號值與原信號值之間的差值稱為間的差值稱為量化誤差量化誤差,又稱為,又稱為量化噪聲量化噪聲。v若信號波形的變化足夠大,或量化間隔若信號波形的變化足夠大,或量化間隔足夠小時,可以證足夠小時,可以證明量化噪聲符合具有下列特征的統(tǒng)計模型:明量化噪聲符合具有下列特征的統(tǒng)計模型: 它是平穩(wěn)的白噪聲過程它是平穩(wěn)的白噪聲過

7、程 量化噪聲與輸入信號不相關(guān)量化噪聲與輸入信號不相關(guān) 量化噪聲在量化間隔內(nèi)均勻分布,即具有等概率密度分量化噪聲在量化間隔內(nèi)均勻分布,即具有等概率密度分布布 預(yù)濾波、預(yù)濾波、采樣、采樣、A/DA/D變換變換v若用若用x x2 2表示輸入語音信號的方差表示輸入語音信號的方差,2X,2Xmaxmax表示信號的峰值表示信號的峰值,B,B表表示量化字長示量化字長, , e e2 2表示噪聲序列的方差表示噪聲序列的方差, ,可以證明量化信噪比可以證明量化信噪比SNRSNR(信號與量化噪聲的功率比)為:(信號與量化噪聲的功率比)為:v假設(shè)語音信號的幅度符合假設(shè)語音信號的幅度符合LaplacianLaplac

8、ian分布分布, ,此時信號幅度超過此時信號幅度超過44x x的概率很小,只有的概率很小,只有0.35%0.35%,因而可取,因而可取X Xmaxmax=4=4x x,則則v上式表明量化器中的每上式表明量化器中的每bitbit字長對字長對SNRSNR的貢獻為的貢獻為6dB6dB。xexXBdBSNRmax22lg2077. 402. 6lg10)(2 . 702. 6)(BdBSNR預(yù)加重(預(yù)加重(PreemphasisPreemphasis)處理)處理v語音信號的平均功率譜受聲門激勵和口鼻輻語音信號的平均功率譜受聲門激勵和口鼻輻射影響,射影響,800Hz800Hz以上按以上按6dB/6dB/

9、倍頻程跌落倍頻程跌落v目的是提升高頻部分,使信號的頻譜變得平目的是提升高頻部分,使信號的頻譜變得平坦,保持在低頻到高頻的整個頻帶中,能用坦,保持在低頻到高頻的整個頻帶中,能用同樣的信噪比求頻譜,以便于頻譜分析或聲同樣的信噪比求頻譜,以便于頻譜分析或聲道參數(shù)分析道參數(shù)分析 11zzH 預(yù)處理:分幀預(yù)處理:分幀v進行過預(yù)加重數(shù)字濾波處理后,接下來就要進行進行過預(yù)加重數(shù)字濾波處理后,接下來就要進行加加窗分幀處理窗分幀處理。一般每秒的幀數(shù)約為。一般每秒的幀數(shù)約為33-10033-100幀,視實幀,視實際情況而定。際情況而定。v分幀雖然可以采用連續(xù)分段的方法,但一般要采用分幀雖然可以采用連續(xù)分段的方法,

10、但一般要采用如圖如圖3-23-2所示的交疊分段的方法,這是為了使幀與所示的交疊分段的方法,這是為了使幀與幀之間平滑過渡,保持其連續(xù)性。幀之間平滑過渡,保持其連續(xù)性。v幀移:前一幀和后一幀的非交疊部分。幀移與幀長幀移:前一幀和后一幀的非交疊部分。幀移與幀長的比值一般取為的比值一般取為1/3-1/21/3-1/2 預(yù)處理預(yù)處理: :分幀示意圖分幀示意圖 預(yù)處理:加窗預(yù)處理:加窗v分幀是用可移動的有限長度窗口進行加權(quán)的方法來實現(xiàn)的,分幀是用可移動的有限長度窗口進行加權(quán)的方法來實現(xiàn)的,這就是用一定的這就是用一定的窗函數(shù)窗函數(shù)(n(n) )來乘來乘s(ns(n) ),v加窗語音信號加窗語音信號s s(n

11、(n)=)=s(ns(n) )* * (n(n) )。v在語音信號數(shù)字處理中常用的窗函數(shù)是矩形窗和漢明窗等,在語音信號數(shù)字處理中常用的窗函數(shù)是矩形窗和漢明窗等,它們的表達式如下(其中它們的表達式如下(其中N N為幀長):為幀長):v矩形窗:矩形窗:v漢明窗:漢明窗:elsenNnn, 0) 1(0, 1)(elsenNnNnn, 0) 1(0),1/(2cos46. 054. 0)( 預(yù)處理預(yù)處理: :窗口的形狀窗口的形狀v不同的短時分析方法不同的短時分析方法( (時域、頻域、倒頻域分時域、頻域、倒頻域分析析) ) 對窗函數(shù)的要求不盡一樣對窗函數(shù)的要求不盡一樣v選擇窗的標準選擇窗的標準在在時域

12、時域要減小時間窗兩端的坡度,使窗口邊緣兩要減小時間窗兩端的坡度,使窗口邊緣兩端不引起急劇變化而平滑過渡到零,這樣可以使端不引起急劇變化而平滑過渡到零,這樣可以使截取出的語音波形緩慢降為零,減小語音幀的截截取出的語音波形緩慢降為零,減小語音幀的截斷效應(yīng);斷效應(yīng);在在頻域頻域要有較寬的要有較寬的3dB3dB帶寬以及較小的邊帶最大帶寬以及較小的邊帶最大值值矩形窗與漢明窗的比較矩形窗與漢明窗的比較窗類型旁瓣峰值主瓣寬度最小阻帶衰減矩形窗-134/N-21漢明窗-418/N-53漢明窗的主瓣寬度比矩形窗大一倍,即帶寬漢明窗的主瓣寬度比矩形窗大一倍,即帶寬約增加一倍,同時其帶外衰減也比矩形窗大約增加一倍,

13、同時其帶外衰減也比矩形窗大一倍多。矩形窗的譜平滑性能較好,但損失一倍多。矩形窗的譜平滑性能較好,但損失了高頻成分,使波形細節(jié)丟失;而漢明窗則了高頻成分,使波形細節(jié)丟失;而漢明窗則相反,從這一方面來看,漢明窗比矩形窗更相反,從這一方面來看,漢明窗比矩形窗更為合適。為合適。窗頻譜響應(yīng)00.10.20.30.40.50.60.70.80.91-400-300-200-1000100Normalized Frequency ( rad/sample)Phase (degrees)00.10.20.30.40.50.60.70.80.91-150-100-50050Normalized Frequenc

14、y ( rad/sample)Magnitude (dB)00.10.20.30.40.50.60.70.80.91-400-300-200-1000Normalized Frequency ( rad/sample)Phase (degrees)00.10.20.30.40.50.60.70.80.91-150-100-50050Normalized Frequency ( rad/sample)Magnitude (dB)02040608010012014000.10.20.30.40.50.60.70.80.9102040608010012014000.10.20.30.40.50.60

15、.70.80.91漢明窗的時域、頻域的幅度響應(yīng)特性漢寧窗的時域、頻域的幅度響應(yīng)特性 預(yù)處理:預(yù)處理:窗口的長度窗口的長度v采樣周期采樣周期T Ts s=1/f=1/fs s,窗口長度,窗口長度N N和頻率分辨率和頻率分辨率ff之間存在下列之間存在下列關(guān)系:關(guān)系:ff=1/NT=1/NTs sv可見,采樣周期一定時,可見,采樣周期一定時,ff隨窗口寬度隨窗口寬度N N的增加而減小,即的增加而減小,即頻率分辨率相應(yīng)得到提高,但同時時間分辨率降低;如果窗頻率分辨率相應(yīng)得到提高,但同時時間分辨率降低;如果窗口取短,頻率分辨率下降,而時間分辨率提高,因而二者是口取短,頻率分辨率下降,而時間分辨率提高,因

16、而二者是矛盾的。應(yīng)該根據(jù)不同的需要選擇合適的窗口長度。矛盾的。應(yīng)該根據(jù)不同的需要選擇合適的窗口長度。 預(yù)處理:窗長預(yù)處理:窗長v有時窗口長度的選擇,更重要的是要考慮語音信號的有時窗口長度的選擇,更重要的是要考慮語音信號的基音周基音周期期。通常認為在一個語音幀內(nèi)應(yīng)包含。通常認為在一個語音幀內(nèi)應(yīng)包含1 17 7個基音周期。然而個基音周期。然而不同人的基音周期變化很大,從女性和兒童的不同人的基音周期變化很大,從女性和兒童的2ms2ms到老年男到老年男子的子的14ms(14ms(即基音頻率的變化范圍為即基音頻率的變化范圍為50050070Hz)70Hz),所以,所以N N的選的選擇比較困難。通常在擇比

17、較困難。通常在10kHz10kHz取樣頻率下,取樣頻率下,N N折中選擇為折中選擇為100100200200點為宜點為宜( (即即101020ms20ms持續(xù)時間持續(xù)時間) )。v這樣,經(jīng)過上面介紹的處理過程,語音信號就已經(jīng)被分割成這樣,經(jīng)過上面介紹的處理過程,語音信號就已經(jīng)被分割成一幀一幀的加過窗函數(shù)的短時信號,然后再把每一個短時語一幀一幀的加過窗函數(shù)的短時信號,然后再把每一個短時語音幀看成平穩(wěn)的隨機信號,利用數(shù)字信號處理技術(shù)來提取語音幀看成平穩(wěn)的隨機信號,利用數(shù)字信號處理技術(shù)來提取語音特征參數(shù)。在進行處理時,按幀從數(shù)據(jù)區(qū)中取出數(shù)據(jù),處音特征參數(shù)。在進行處理時,按幀從數(shù)據(jù)區(qū)中取出數(shù)據(jù),處理完

18、成后再取下一幀,等等,最后得到由每一幀參數(shù)組成的理完成后再取下一幀,等等,最后得到由每一幀參數(shù)組成的語音特征參數(shù)的時間序列。語音特征參數(shù)的時間序列。3.3 3.3 語音信號的時域分析語音信號的時域分析v語音信號的語音信號的時域分析時域分析就是分析和提取語音信號的時域參數(shù)。就是分析和提取語音信號的時域參數(shù)。進行語音分析時,最先接觸到并且也是最直觀的是它的時域進行語音分析時,最先接觸到并且也是最直觀的是它的時域波形。語音信號本身就是時域信號,因而時域分析是最早使波形。語音信號本身就是時域信號,因而時域分析是最早使用,也是應(yīng)用最廣泛的一種分析方法,這種方法直接利用語用,也是應(yīng)用最廣泛的一種分析方法,

19、這種方法直接利用語音信號的時域波形。時域分析通常用于最基本的參數(shù)分析及音信號的時域波形。時域分析通常用于最基本的參數(shù)分析及應(yīng)用,如語音的分割、預(yù)處理、大分類等。這種分析方法的應(yīng)用,如語音的分割、預(yù)處理、大分類等。這種分析方法的特點是:特點是:表示語音信號比較直觀、物理意義明確。表示語音信號比較直觀、物理意義明確。實現(xiàn)起來比較簡單、運算量少。實現(xiàn)起來比較簡單、運算量少??梢缘玫秸Z音的一些重要的參數(shù)。可以得到語音的一些重要的參數(shù)。只使用示波器等通用設(shè)備,使用較為簡單等。只使用示波器等通用設(shè)備,使用較為簡單等。 短時能量及短時平均幅度分析短時能量及短時平均幅度分析v 如圖如圖3-23-2所示,設(shè)語音

20、波形時域信號為所示,設(shè)語音波形時域信號為x(tx(t) )、加窗分幀處理、加窗分幀處理后得到的第后得到的第n n幀語音信號為幀語音信號為x xn n(m(m),),則則x xn n(m(m) )滿足下式:滿足下式:x xn n(m(m)=)=(m)x(n+m(m)x(n+m) )v其中,其中,n=0,1T,2T,n=0,1T,2T,并且并且N N為幀長,為幀長,T T為幀移長度。為幀移長度。v設(shè)第設(shè)第n n幀語音信號幀語音信號x xn n(m(m) )的的短時能量短時能量用用E En n表示,則其計算公式表示,則其計算公式如下:如下:其它值mNmm, 0) 1(0, 1)(102)(Nmnnm

21、xE 短時能量及短時平均幅度分析短時能量及短時平均幅度分析vE En n是一個度量語音信號幅度值變化的函數(shù),但它有一個缺陷,是一個度量語音信號幅度值變化的函數(shù),但它有一個缺陷,即它對高電平非常敏感(因為它計算時用的是信號的平方即它對高電平非常敏感(因為它計算時用的是信號的平方) )。為此,可采用另一個度量語音信號幅度值變化的函數(shù),即為此,可采用另一個度量語音信號幅度值變化的函數(shù),即短短時平均幅度函數(shù)時平均幅度函數(shù)M Mn n,它定義為:,它定義為:vM Mn n也是一幀語音信號能量大小的表征,它與也是一幀語音信號能量大小的表征,它與E En n的區(qū)別在于計的區(qū)別在于計算時小取樣值和大取樣值不會

22、因取平方而造成較大差異,在算時小取樣值和大取樣值不會因取平方而造成較大差異,在某些應(yīng)用領(lǐng)域中會帶來一些好處。某些應(yīng)用領(lǐng)域中會帶來一些好處。10)(NmnnmxM 短時過零率分析短時過零率分析v短時過零率表示一幀語音中語音信號波形穿過橫軸短時過零率表示一幀語音中語音信號波形穿過橫軸( (零電平零電平) )的次數(shù)。過零分析是語音時域分析中最簡單的一種。對于連的次數(shù)。過零分析是語音時域分析中最簡單的一種。對于連續(xù)語音信號,過零即意味著時域波形通過時間軸;而對于離續(xù)語音信號,過零即意味著時域波形通過時間軸;而對于離散信號,如果相鄰的取樣值改變符號則稱為過零。過零率就散信號,如果相鄰的取樣值改變符號則稱

23、為過零。過零率就是樣本改變符號的次數(shù)。是樣本改變符號的次數(shù)。v定義語音信號定義語音信號x xn n(m(m) )的的短時過零率短時過零率Z Zn n為:為:v式中,式中,sgnsgn是符號函數(shù),即是符號函數(shù),即10)1(sgn)(sgn21NmnnnmxmxZ) 0(, 1) 0(, 1sgnxxx短時過零率分析由定義可以看出,短時過零率對噪音噪音的存在非常敏感敏感,如果背景中有反復(fù)穿越坐標軸的隨機噪聲,那么會產(chǎn)生大量的“虛假”的過零,影響計算結(jié)果。門限過零率為了提高過零率計算的魯棒魯棒性性(Robustness),除了對原始信號進行帶通濾波,一種有效的方法是修正過零率的定義,加入門限門限的定

24、義如圖所示。6.門限過零率設(shè)一個門限值T,將過零的定義修正為穿越正負門限穿越正負門限,帶門限的過零率計算公式為這樣噪音信號的振蕩只要不超過門限間的區(qū)域,就不會對真實的過零率產(chǎn)生影響。一般說來,短時過零率的最主要用處是分辨清音清音和濁音濁音、有聲有聲與無無聲聲。101sgn( )sgn(1)sgn( )sgn(1)2NnnnnnmZx mTx mTx mTx mT7.端點檢測背景背景噪音噪音輔音輔音元音元音如何區(qū)分?能量?過零率?語音語音“三三”的波形圖的波形圖背景背景噪音噪音輔音輔音7.端點檢測如何區(qū)分?能量?過零率? 短時相關(guān)分析短時相關(guān)分析v相關(guān)分析是一種常用的時域波形分析方法,并有自相關(guān)

25、分析是一種常用的時域波形分析方法,并有自相關(guān)和互相關(guān)之分。這里主要討論自相關(guān)函數(shù)。相關(guān)和互相關(guān)之分。這里主要討論自相關(guān)函數(shù)。v自相關(guān)函數(shù)的自相關(guān)函數(shù)的性質(zhì):偶函數(shù);性質(zhì):偶函數(shù);v假設(shè)序列具有周期性,則其自相關(guān)函數(shù)也是同周期假設(shè)序列具有周期性,則其自相關(guān)函數(shù)也是同周期的周期函數(shù)等。我們可以把自相關(guān)函數(shù)的這些性質(zhì)的周期函數(shù)等。我們可以把自相關(guān)函數(shù)的這些性質(zhì)應(yīng)用于語音信號的時域分析中。例如,對濁音語音應(yīng)用于語音信號的時域分析中。例如,對濁音語音可以用自相關(guān)函數(shù)求出語音波形序列的基音周期??梢杂米韵嚓P(guān)函數(shù)求出語音波形序列的基音周期。此外,在進行語信號的線性預(yù)測分析時,也要用到此外,在進行語信號的線性

26、預(yù)測分析時,也要用到自相關(guān)函數(shù)。和其他語音參數(shù)一樣,在語音信號分自相關(guān)函數(shù)。和其他語音參數(shù)一樣,在語音信號分析中,我們分析的是析中,我們分析的是短時自相關(guān)函數(shù)短時自相關(guān)函數(shù)。 1 1短時自相關(guān)函數(shù)短時自相關(guān)函數(shù)v定義語音信號定義語音信號x xn n(m(m) )的的短時自相關(guān)函數(shù)短時自相關(guān)函數(shù)R Rn n(k(k) )的計算式如下:的計算式如下:v這里這里K K是最大的延遲點數(shù)。是最大的延遲點數(shù)。v短時自相關(guān)函數(shù)具有以下短時自相關(guān)函數(shù)具有以下性質(zhì)性質(zhì):(1)(1)如果如果x xn n(m(m) )是周期的是周期的( (設(shè)周期為設(shè)周期為N)N),則自相關(guān)函數(shù)是同,則自相關(guān)函數(shù)是同周期的周期函數(shù),

27、即周期的周期函數(shù),即R Rn n(k(k)=)=R Rn n(k+N(k+Np p) )。(2)R(2)Rn n(k)(k)是偶函數(shù),即是偶函數(shù),即R Rn n(k(k)=)=R Rn n(-k(-k) )。(3)(3)當(dāng)當(dāng)k=0k=0時,自相關(guān)函數(shù)具有最大值,即時,自相關(guān)函數(shù)具有最大值,即R Rn n(0)|R(0)|Rn n(k)|(k)|,并且并且R Rn n(0)(0)等于確定性信號序列的能量或隨機性序列的平等于確定性信號序列的能量或隨機性序列的平均功率。均功率。KkkmxmxkRkNmnnn0 , )()()(10 2.2.修正的短時自相關(guān)函數(shù)修正的短時自相關(guān)函數(shù)v修正的短時自相關(guān)函

28、數(shù)是用兩個長度不同的窗口,截取兩個修正的短時自相關(guān)函數(shù)是用兩個長度不同的窗口,截取兩個不等長的序列進行乘積和,兩個窗口的長度相差最大的延遲不等長的序列進行乘積和,兩個窗口的長度相差最大的延遲點數(shù)點數(shù)K K。這樣就能始終保持乘積和的項數(shù)不變,即始終為短。這樣就能始終保持乘積和的項數(shù)不變,即始終為短窗的長度。窗的長度。修正的短時自相關(guān)函數(shù)修正的短時自相關(guān)函數(shù)定義為:定義為: 其中,其中,KkkmxmxkRNmnnn0 , )()()(10其它值mNmm, 0) 1(0, 1)()0(),()()(Kkmnxmmxn)10(),()( )(KNkmnxmmxn其它值mKNmm, 0)1(0, 1)(

29、 2 2修正的短時自相關(guān)函數(shù)修正的短時自相關(guān)函數(shù)圖3-7 修正短時自相關(guān)函數(shù)計算中窗口長度的說明 短時平均幅度差函數(shù)短時平均幅度差函數(shù)v計算自相關(guān)函數(shù)的運算量很大,其原因是乘法運算所需要的計算自相關(guān)函數(shù)的運算量很大,其原因是乘法運算所需要的時間較長。利用快速傅里葉變換時間較長。利用快速傅里葉變換(FFT)(FFT)等簡化計算方法都無等簡化計算方法都無法避免乘法運算。為了避免乘法,一個簡單的方法就是利用法避免乘法運算。為了避免乘法,一個簡單的方法就是利用差值。為此常常采用另一種與自相關(guān)函數(shù)有類似作用的參量,差值。為此常常采用另一種與自相關(guān)函數(shù)有類似作用的參量,即即短時平均幅度差函數(shù)短時平均幅度差

30、函數(shù)(AMDF)(AMDF)。v平均幅度差函數(shù)能夠代替自相關(guān)函數(shù)進行語音分析,是基于平均幅度差函數(shù)能夠代替自相關(guān)函數(shù)進行語音分析,是基于這樣一個事實:如果信號是這樣一個事實:如果信號是完全的周期信號完全的周期信號( (設(shè)周期為設(shè)周期為N Np p) ),則相距為周期的整數(shù)倍的樣點上的幅值是相等的,則相距為周期的整數(shù)倍的樣點上的幅值是相等的,差值為零差值為零。,.)2, 0( , 0)()()(ppNNkknxnxnd 短時平均幅度差函數(shù)短時平均幅度差函數(shù)v對于實際的語音信號,對于實際的語音信號,d(nd(n) )雖不為零,但其值很小。這些極雖不為零,但其值很小。這些極小值將出現(xiàn)在整數(shù)倍周期的位

31、置上。為此,可定義小值將出現(xiàn)在整數(shù)倍周期的位置上。為此,可定義短時平均短時平均幅度差函數(shù)幅度差函數(shù):v可以證明平均幅度差函數(shù)和自相關(guān)函數(shù)有密切的關(guān)系,兩者可以證明平均幅度差函數(shù)和自相關(guān)函數(shù)有密切的關(guān)系,兩者之間的關(guān)系可由下式表達:之間的關(guān)系可由下式表達:kNmnnnkmxmxkF10)()()(2/1)()0()(2)(kRRkkFnnn 短時平均幅度差函數(shù)短時平均幅度差函數(shù)圖3-9 AMDF 的例子3.4 3.4 語音信號的頻域分析語音信號的頻域分析v從廣義上講,語音信號的頻域分析包括語音信號的頻譜、功從廣義上講,語音信號的頻域分析包括語音信號的頻譜、功率譜、倒頻譜、頻譜包絡(luò)分析等,常用的頻

32、域分析方法有率譜、倒頻譜、頻譜包絡(luò)分析等,常用的頻域分析方法有帶通濾波器組法帶通濾波器組法傅里葉變換法傅里葉變換法線性預(yù)測法線性預(yù)測法v本節(jié)介紹本節(jié)介紹傅里葉分析法傅里葉分析法。因為語音波是一個非平穩(wěn)過程,因。因為語音波是一個非平穩(wěn)過程,因此適用于周期、瞬變或平穩(wěn)隨機信號的標準傅里葉變換不能此適用于周期、瞬變或平穩(wěn)隨機信號的標準傅里葉變換不能用來直接表示語音信號,而應(yīng)該用短時傅里葉變換對語音信用來直接表示語音信號,而應(yīng)該用短時傅里葉變換對語音信號的頻譜進行分析,相應(yīng)的頻譜稱為號的頻譜進行分析,相應(yīng)的頻譜稱為“短時譜短時譜”。 利用語音的短時傅里葉變換求語音的短時譜利用語音的短時傅里葉變換求語音

33、的短時譜v對第對第n n幀語音信號幀語音信號x xn n(m(m) )進行傅里葉變換進行傅里葉變換( (離散時域傅里葉變離散時域傅里葉變換,換,DTFT)DTFT),可得到,可得到短時傅里葉變換短時傅里葉變換,其定義如下:,其定義如下:v由定義可知,短時傅里葉變換實際就是窗選語音信號的標準由定義可知,短時傅里葉變換實際就是窗選語音信號的標準傅里葉變換。這里,窗傅里葉變換。這里,窗(n(n) )是一個是一個“滑動的滑動的”窗口,它隨窗口,它隨n n的變化而沿著序列的變化而沿著序列x(mx(m) )滑動。由于窗口是有限長度的,滿足滑動。由于窗口是有限長度的,滿足絕對可和條件,所以這個變換是存在的。

34、當(dāng)然窗口函數(shù)不同,絕對可和條件,所以這個變換是存在的。當(dāng)然窗口函數(shù)不同,傅里葉變換的結(jié)果也將不同。傅里葉變換的結(jié)果也將不同。10)()(NmmjnjnemxeXv我們還可以將式我們還可以將式(3-27)(3-27)寫成另一種形式。設(shè)語音信號序列和寫成另一種形式。設(shè)語音信號序列和窗口序列的標準傅里葉變換均存在。當(dāng)窗口序列的標準傅里葉變換均存在。當(dāng)n n取固定值時,取固定值時,(n-(n-m m) )的傅里葉變換為:的傅里葉變換為:v根據(jù)卷積定理有根據(jù)卷積定理有:v因為上式右邊兩個卷積項均為關(guān)于角頻率因為上式右邊兩個卷積項均為關(guān)于角頻率的以的以22為周期為周期的連續(xù)函數(shù),所以也可將其寫成以下的卷積

35、積分形式:的連續(xù)函數(shù),所以也可將其寫成以下的卷積積分形式:v即,假設(shè)即,假設(shè)x(mx(m) )的的DTFTDTFT是是X(eX(ejj) ),且且(m(m) )的的DTFTDTFT是是X(eX(ejj) ),那么那么X Xn n(e(ejj)是是X(eX(ejj) )和和W(eW(ejj) )的周期卷積。的周期卷積。)()(jmjmmjeWeemn)()()(jnjjjneWeeXeXdeXeeWeXjjnjjn)()(21)()(v功率譜:根據(jù)功率譜定義,可以寫出短時功率譜與短時傅里功率譜:根據(jù)功率譜定義,可以寫出短時功率譜與短時傅里葉變換之間的關(guān)系:葉變換之間的關(guān)系:v或者或者:v功率譜功

36、率譜S Sn n(e(ejj) )是短時自相關(guān)函數(shù)是短時自相關(guān)函數(shù)R Rn n(k(k) )的傅里葉變的傅里葉變換。換。2*)()()()(jnjnjnjneXeXeXeS2*)()()()(kXkXkXkSnnnn112)()()(NNkkjnjnjnekReXeS3.5 3.5 語音信號的倒譜分析語音信號的倒譜分析v語音信號的語音信號的倒譜倒譜分析就是求取語音倒譜特征參數(shù)的分析就是求取語音倒譜特征參數(shù)的過程,它可以通過同態(tài)處理來實現(xiàn)。過程,它可以通過同態(tài)處理來實現(xiàn)。v同態(tài)信號處理也稱為同態(tài)濾波,它實現(xiàn)了將卷積關(guān)同態(tài)信號處理也稱為同態(tài)濾波,它實現(xiàn)了將卷積關(guān)系變換為求和關(guān)系的分離處理,即解卷。

37、系變換為求和關(guān)系的分離處理,即解卷。v對語音信號進行解卷,可將語音信號的聲門激勵信對語音信號進行解卷,可將語音信號的聲門激勵信息及聲道響應(yīng)信息分離開來,從而求得聲道共振特息及聲道響應(yīng)信息分離開來,從而求得聲道共振特征和基音周期,用于語音編碼、合成、識別等。征和基音周期,用于語音編碼、合成、識別等。v求倒譜特征參數(shù)的方法有兩種,一種是線性預(yù)測分求倒譜特征參數(shù)的方法有兩種,一種是線性預(yù)測分析,一種是同態(tài)分析處理。析,一種是同態(tài)分析處理。 同態(tài)信號處理的基本原理同態(tài)信號處理的基本原理v我們?nèi)粘I钪杏龅降脑S多信號,它們并不是加性我們?nèi)粘I钪杏龅降脑S多信號,它們并不是加性信號信號( (即組成各分量按

38、加法原則組合起來即組成各分量按加法原則組合起來) )而是乘積而是乘積性信號或卷積性信號,如語音信號、圖像信號、通性信號或卷積性信號,如語音信號、圖像信號、通信中的衰落信號、調(diào)制信號等。這些信號要用非線信中的衰落信號、調(diào)制信號等。這些信號要用非線性系統(tǒng)來處理。性系統(tǒng)來處理。v同態(tài)信號處理同態(tài)信號處理就是將非線性問題轉(zhuǎn)化為線性問題的就是將非線性問題轉(zhuǎn)化為線性問題的處理方法。按被處理的信號來分類,大體分為乘積處理方法。按被處理的信號來分類,大體分為乘積同態(tài)處理和卷積同態(tài)處理兩種。由于語音信號可視同態(tài)處理和卷積同態(tài)處理兩種。由于語音信號可視為聲門激勵信號和聲道沖擊響應(yīng)的卷積,所以這里為聲門激勵信號和聲

39、道沖擊響應(yīng)的卷積,所以這里僅討論卷積同態(tài)信號處理。僅討論卷積同態(tài)信號處理。 同態(tài)信號處理的基本原理同態(tài)信號處理的基本原理v卷積同態(tài)系統(tǒng)的模型(圖卷積同態(tài)系統(tǒng)的模型(圖3-10a3-10a),該系統(tǒng)的輸人卷積信號),該系統(tǒng)的輸人卷積信號經(jīng)過系統(tǒng)變換后的輸出是一個處理過的卷積信號。經(jīng)過系統(tǒng)變換后的輸出是一個處理過的卷積信號。v同態(tài)系統(tǒng)可分解為三個子系統(tǒng),如圖同態(tài)系統(tǒng)可分解為三個子系統(tǒng),如圖3-10b3-10b所示,即兩個特所示,即兩個特征子系統(tǒng)征子系統(tǒng)( (它們只取決于信號的組合規(guī)則它們只取決于信號的組合規(guī)則) )和一個線性子系統(tǒng)和一個線性子系統(tǒng)( (它僅取決于處理的要求它僅取決于處理的要求) )

40、。v第一個子系統(tǒng),如圖第一個子系統(tǒng),如圖3-10c3-10c所示,它完成將卷積性信號轉(zhuǎn)化所示,它完成將卷積性信號轉(zhuǎn)化為加性信號的運算;第二個子系統(tǒng)是一個普通線性系統(tǒng),滿為加性信號的運算;第二個子系統(tǒng)是一個普通線性系統(tǒng),滿足線性疊加原理,用于對加性信號進行線性變換;第三個子足線性疊加原理,用于對加性信號進行線性變換;第三個子系統(tǒng)是第一個子系統(tǒng)的逆變換,它將加性信號反變換為卷積系統(tǒng)是第一個子系統(tǒng)的逆變換,它將加性信號反變換為卷積性信號,如圖性信號,如圖3-10d3-10d所示。所示。 同態(tài)信號處理的基本原理同態(tài)信號處理的基本原理 同態(tài)信號處理的基本原理同態(tài)信號處理的基本原理v第一個子系統(tǒng)第一個子系

41、統(tǒng)D D* * 完成將卷積性信號轉(zhuǎn)化為加性信號的完成將卷積性信號轉(zhuǎn)化為加性信號的運算,即對于信號運算,即對于信號x(nx(n)=)=x xl l(n(n) )* *x x2 2(n)(n)進行了如下運算處理:進行了如下運算處理:)()()()() 1 (21zXzXzXnxZ)()()()(ln)(ln)(ln)2(2121zXzXzXzXzXzX)( )()()()()()3(212111nxnxnxzXzXZzXZ 同態(tài)信號處理的基本原理同態(tài)信號處理的基本原理v由于由于x x (n(n) )為加性信號,所以第二個子系統(tǒng)可對其進行需要為加性信號,所以第二個子系統(tǒng)可對其進行需要的線性處理得到的

42、線性處理得到y(tǒng) y (n(n) )。第三個子系統(tǒng)是逆特征系統(tǒng)。第三個子系統(tǒng)是逆特征系統(tǒng)D D* *-1-1 ,它對它對y y (n(n)=)= y y1 1 (n)+y(n)+y2 2 (n)(n)進行逆變換,使其恢復(fù)為卷積性進行逆變換,使其恢復(fù)為卷積性v信號,即進行了如下處理:信號,即進行了如下處理:v從而得到卷積性的恢復(fù)信號。從而得到卷積性的恢復(fù)信號。)()()()( ) 1 (21zYzYzYnyZ)()()()(exp)2(21zYzYzYzY)(*)()()()()3(21211nynyzYzYZny 復(fù)倒譜和倒譜復(fù)倒譜和倒譜v雖然雖然D D* * 與與D D* *-1-1 系統(tǒng)中的

43、系統(tǒng)中的x x (n(n) )和和y y (n(n) )信號也信號也均是時域序列,但它們所處的離散時域顯然不同于均是時域序列,但它們所處的離散時域顯然不同于x(nx(n) )和和y(ny(n) )所處的離散時域,所以我們把它稱之為所處的離散時域,所以我們把它稱之為“復(fù)倒頻譜域復(fù)倒頻譜域”。 x x (n(n) )是是x(nx(n) )的的“復(fù)倒頻譜復(fù)倒頻譜”,簡稱為簡稱為“復(fù)倒譜復(fù)倒譜”,有時也稱作對數(shù)復(fù)倒譜。其英,有時也稱作對數(shù)復(fù)倒譜。其英文原文為文原文為“Complex Complex CepstrumCepstrum”,CepstrumCepstrum是一個是一個新造的英文詞,它是由新造

44、的英文詞,它是由SpectrumSpectrum這個詞的前四個字這個詞的前四個字母倒置而構(gòu)成的。同樣,序列母倒置而構(gòu)成的。同樣,序列y y (n(n) )也是也是y(ny(n) )的復(fù)倒的復(fù)倒譜。譜。 復(fù)倒譜和倒譜復(fù)倒譜和倒譜v在絕大多數(shù)數(shù)字信號處理中,在絕大多數(shù)數(shù)字信號處理中,X(zX(z) ),X X (z(z) ),Y(zY(z) ),Y Y (z(z) )的的收斂域均包含單位圓,因而收斂域均包含單位圓,因而D D* * 與與D D* *-1-1 系統(tǒng)有如下形系統(tǒng)有如下形式:式:vD D* * = =vD D* *-1-1 = =)()(jneXxF)(ln)(jjeXeX)()( 1j

45、eXFnx)()(nyFeYj)(exp)(jjeYeY)()(1jeYFnyv設(shè)設(shè): :v則取其對數(shù)得則取其對數(shù)得: :v即復(fù)數(shù)的對數(shù)仍是復(fù)數(shù),它包含實部和虛部。注意,這時對即復(fù)數(shù)的對數(shù)仍是復(fù)數(shù),它包含實部和虛部。注意,這時對數(shù)的虛部數(shù)的虛部argX(eargX(ejj)由于是由于是X(eX(ejj) )的相位的相位, ,所以將產(chǎn)生不一所以將產(chǎn)生不一致性。如果,我們只考慮致性。如果,我們只考慮X X (e(ejj) )的實部,令:的實部,令:v顯然顯然c(nc(n) )是序列是序列x(nx(n) )對數(shù)幅度譜的傅里葉逆變換。對數(shù)幅度譜的傅里葉逆變換。c(nc(n) )稱為稱為“倒頻譜倒頻譜”

46、或簡稱為或簡稱為“倒譜倒譜”,有時也稱,有時也稱“對數(shù)倒頻譜對數(shù)倒頻譜”。倒譜對應(yīng)的量綱是倒譜對應(yīng)的量綱是“QuefrencyQuefrency”,它也是一個新造的英文,它也是一個新造的英文詞,是由詞,是由“Frequency”Frequency”轉(zhuǎn)變而來的,因此也稱為轉(zhuǎn)變而來的,因此也稱為“倒頻倒頻”,它的量綱是時間。它的量綱是時間。c(nc(n) )實際上就是我們要求取的語音信號倒實際上就是我們要求取的語音信號倒譜特征。譜特征。)(arg)(ln)(jjjeXjeXeX)(arg)()(jeXjjjeeXeX)(ln)(1jeXFncv下面我們根據(jù)上面的討論來分析一下下面我們根據(jù)上面的討論

47、來分析一下復(fù)倒譜和倒譜特點和關(guān)復(fù)倒譜和倒譜特點和關(guān)系系。v(1)(1)復(fù)倒譜要進行復(fù)對數(shù)運算,而倒譜只進行實對數(shù)運算。復(fù)倒譜要進行復(fù)對數(shù)運算,而倒譜只進行實對數(shù)運算。v(2)(2)在倒譜情況下一個序列經(jīng)過正逆兩個特征系統(tǒng)變換后,在倒譜情況下一個序列經(jīng)過正逆兩個特征系統(tǒng)變換后,不能還原成自身,因為在計算倒譜的過程中將序列的相位信不能還原成自身,因為在計算倒譜的過程中將序列的相位信息丟失了。息丟失了。v(3)(3)與復(fù)倒譜類似,如果與復(fù)倒譜類似,如果c c1 1(n)(n)和和c c2 2(n)(n)分別是分別是x x1 1(n)(n)和和x x2 2(n)(n)的的倒譜,并且倒譜,并且x(n)=

48、 xx(n)= x1 1(n)(n)* *x x2 2(n)(n),則,則x(n)x(n)的倒譜的倒譜c(n)= c(n)= c c1 1(n)+c(n)+c2 2(n) (n) 。v(4)(4)已知一個實數(shù)序列已知一個實數(shù)序列x(n)x(n)的復(fù)倒譜的復(fù)倒譜x x (n)(n),可以由,可以由x x (n)(n)求出求出它的倒譜它的倒譜c(n)c(n)。v(5)(5)已知一個實數(shù)序列已知一個實數(shù)序列x(n)x(n)的倒譜的倒譜c(n)c(n),能否用它來求出復(fù),能否用它來求出復(fù)倒譜倒譜x x (n)?(n)? 語音信號兩個卷積分量的復(fù)倒譜語音信號兩個卷積分量的復(fù)倒譜v語音信號可看做是語音信號

49、可看做是聲門激勵信號聲門激勵信號和和聲道沖激響應(yīng)聲道沖激響應(yīng)兩兩信號的卷積,因此下面將分別討論這兩個信號的復(fù)信號的卷積,因此下面將分別討論這兩個信號的復(fù)倒譜的性質(zhì)。倒譜的性質(zhì)。1.1.聲門激勵信號聲門激勵信號v 我們知道,發(fā)我們知道,發(fā)清音清音時,聲門激勵是能量較小,頻譜均勻分時,聲門激勵是能量較小,頻譜均勻分布的白噪聲;發(fā)布的白噪聲;發(fā)濁音濁音時,聲門激勵是以基音為周期的沖激序時,聲門激勵是以基音為周期的沖激序列:列:v其中,其中,M M、r r均為正整數(shù),且均為正整數(shù),且0r0rM M,r r為幅度因子,為幅度因子,N Np p為為用樣點數(shù)表示的基音周期。用樣點數(shù)表示的基音周期。v由上面的

50、分析我們可得以下結(jié)論:一個有限長度的周期沖激由上面的分析我們可得以下結(jié)論:一個有限長度的周期沖激序列,其復(fù)倒譜也是一個周期沖激序列,且周期不變,只是序列,其復(fù)倒譜也是一個周期沖激序列,且周期不變,只是序列變?yōu)闊o限長序列。同時其振幅隨著序列變?yōu)闊o限長序列。同時其振幅隨著k k的增大而衰減,衰的增大而衰減,衰減速度比原序列要快。把這種性質(zhì)應(yīng)用于語音信號分析中,減速度比原序列要快。把這種性質(zhì)應(yīng)用于語音信號分析中,就意味著除原點外,可以用就意味著除原點外,可以用“高時窗高時窗”從語音信號的頻譜中從語音信號的頻譜中提取濁音激勵信號的倒譜,從而提取出基音信號。提取濁音激勵信號的倒譜,從而提取出基音信號。M

51、rprrNnnx0)()(010)()()(ln)( kpkkpkrNnrNnnnx2.2.聲道沖激響應(yīng)序列聲道沖激響應(yīng)序列v如果用最嚴格如果用最嚴格( (也是最普遍的也是最普遍的) )極零點模型來描述聲道響應(yīng)極零點模型來描述聲道響應(yīng)x(nx(n) ),則有:,則有:v求對數(shù)可得:求對數(shù)可得:00111111)1 ()1 ()1 ()1 ()(pkkpkkmkkmkkzdzczbzaAzXii000ln)( 001111nndnbnnancnAnxmkpknknkpkmknknkii2.2.聲道沖激響應(yīng)序列聲道沖激響應(yīng)序列由此可得由此可得聲道響應(yīng)序列復(fù)倒譜的性質(zhì)聲道響應(yīng)序列復(fù)倒譜的性質(zhì)為:為:

52、(1)x(1)x (n)(n)是雙邊序列。是雙邊序列。(2)(2)由于由于| |a ak k| |、| |b bk k| |、|c|ck k| |、| |d dk k| |均小于均小于1 1,所以,所以x x (n)(n)是衰減序是衰減序列,即列,即|x|x (n)|(n)|隨隨|n|n|的增大而減小。的增大而減小。(3)|x(3)|x (n)|(n)|隨隨|n|n|增大而衰減的速度至少比增大而衰減的速度至少比1/|n|1/|n|快???。(4)(4)如果如果x(n)x(n)是最小相位序列(極零點均在是最小相位序列(極零點均在z z平面單位圓內(nèi)),平面單位圓內(nèi)),即即b bk k=0=0、d d

53、k k=0=0,則則x x (n)(n)只在只在n n0 0時有值,且由時有值,且由X X (z)(z)的表達的表達示可知示可知x x (n)(n)是穩(wěn)定的,即是穩(wěn)定的,即x x (n)(n)為穩(wěn)定因果序列。也就是說,為穩(wěn)定因果序列。也就是說,最小相位信號序列的復(fù)倒譜是穩(wěn)定因果序列。最小相位信號序列的復(fù)倒譜是穩(wěn)定因果序列。(5)(5)與與(4)(4)相反,最大相位信號序列相反,最大相位信號序列( (極零點均在極零點均在z z平面單位圓外平面單位圓外) )的復(fù)倒譜是穩(wěn)定反因果序列。的復(fù)倒譜是穩(wěn)定反因果序列。 復(fù)倒譜分析中的相位卷繞及避免相位卷繞的復(fù)倒譜分析中的相位卷繞及避免相位卷繞的方法方法v在

54、復(fù)倒譜分析中,在復(fù)倒譜分析中,z z變換后得到的是復(fù)數(shù),所以取對數(shù)時進變換后得到的是復(fù)數(shù),所以取對數(shù)時進行的是復(fù)對數(shù)運算。這時存在相位多值性問題,稱為行的是復(fù)對數(shù)運算。這時存在相位多值性問題,稱為“相位相位卷繞卷繞”。相位卷繞使得求語音的復(fù)倒譜,以及從復(fù)倒譜中恢。相位卷繞使得求語音的復(fù)倒譜,以及從復(fù)倒譜中恢復(fù)語音等運算都會由于不確定性而產(chǎn)生錯誤。下面來分析復(fù)復(fù)語音等運算都會由于不確定性而產(chǎn)生錯誤。下面來分析復(fù)倒譜分析中相位卷繞是怎樣產(chǎn)生的。倒譜分析中相位卷繞是怎樣產(chǎn)生的。)(ln)(ln)(ln21jjjeXeXeX)(arg)(arg)(arg21jjjeXeXeXv上式的相位也可表示為:上

55、式的相位也可表示為:v式中,雖然式中,雖然l l() )和和2 2()()的范圍均在的范圍均在(0(0,2)2)內(nèi),但內(nèi),但 ()()的值可能不在的值可能不在(0(0,2)2)之內(nèi),而計算機處理時總相位值之內(nèi),而計算機處理時總相位值只能用主值只能用主值()()(在在(0(0,2)2)內(nèi)內(nèi)) )來表示。所以可能存在下來表示。所以可能存在下面的情況:面的情況: (k k為整數(shù))為整數(shù))v 此時即產(chǎn)生了此時即產(chǎn)生了相位卷繞相位卷繞。顯然,相位卷繞的產(chǎn)生是由于。顯然,相位卷繞的產(chǎn)生是由于相位的多值性問題。它會使后面求復(fù)倒譜以及由復(fù)倒譜恢復(fù)相位的多值性問題。它會使后面求復(fù)倒譜以及由復(fù)倒譜恢復(fù)語音等運算存

56、在不確定性而產(chǎn)生錯誤。求復(fù)倒譜時避免相位語音等運算存在不確定性而產(chǎn)生錯誤。求復(fù)倒譜時避免相位卷繞的方法有限制法、微分法、最小相位信號法等。其中,卷繞的方法有限制法、微分法、最小相位信號法等。其中,限制法的思想是將復(fù)倒譜的相位限制在限制法的思想是將復(fù)倒譜的相位限制在- () ) 的的范圍內(nèi),從而有范圍內(nèi),從而有()=)=() )。但對于語音信號來講,由。但對于語音信號來講,由于語音信號是隨機的,所以這種限制是不科學(xué)的。下面介紹于語音信號是隨機的,所以這種限制是不科學(xué)的。下面介紹其他兩種求復(fù)倒譜時避免相位卷繞的方法。其他兩種求復(fù)倒譜時避免相位卷繞的方法。k2)()()()()(211.1.微分法微

57、分法v這是一種利用傅里葉變換的微分特性和對數(shù)微分特性來避開這是一種利用傅里葉變換的微分特性和對數(shù)微分特性來避開求復(fù)對數(shù)而又可求出復(fù)倒譜的方法。求復(fù)對數(shù)而又可求出復(fù)倒譜的方法。v雖然,這種方法避免了求復(fù)倒譜的問題,但其缺點是會產(chǎn)生雖然,這種方法避免了求復(fù)倒譜的問題,但其缺點是會產(chǎn)生嚴重的混疊。這是因為嚴重的混疊。這是因為nx(nnx(n) )的頻譜中的高頻分量比的頻譜中的高頻分量比x(nx(n) )多,多,所以仍使用所以仍使用x(nx(n) )原來的取樣率將引起混疊。因而這不是一種原來的取樣率將引起混疊。因而這不是一種理想方法。理想方法。2.2.最小相位信號法最小相位信號法v這就是上面介紹的由倒

58、譜這就是上面介紹的由倒譜c(nc(n) )求復(fù)倒譜求復(fù)倒譜x x (n(n) )的方法。最小的方法。最小相位信號法是由最小相位信號序列的復(fù)倒譜性質(zhì)及相位信號法是由最小相位信號序列的復(fù)倒譜性質(zhì)及HilbertHilbert變換的性質(zhì)推導(dǎo)出來的。這是一種較好的解決相位卷繞的方變換的性質(zhì)推導(dǎo)出來的。這是一種較好的解決相位卷繞的方法。但它僅適用于最小相位信號序列。法。但它僅適用于最小相位信號序列。 語音信號倒譜分析實例語音信號倒譜分析實例1 1由同態(tài)分析求出的語音信號倒譜實例由同態(tài)分析求出的語音信號倒譜實例v一個信號的倒譜定義為信號頻譜模的自然對數(shù)的逆傅里葉變一個信號的倒譜定義為信號頻譜模的自然對數(shù)的

59、逆傅里葉變換換( (即設(shè)相位恒定為零即設(shè)相位恒定為零) )。設(shè)信號為。設(shè)信號為s(ns(n) ),則其倒譜為:則其倒譜為:v根據(jù)語音信號產(chǎn)生模型,語音信號根據(jù)語音信號產(chǎn)生模型,語音信號s(ns(n) )是由聲門脈沖激勵是由聲門脈沖激勵e(ne(n) )經(jīng)聲道響應(yīng)經(jīng)聲道響應(yīng)v(nv(n) )濾波而得到,即:濾波而得到,即:v設(shè)三者的倒譜分別為設(shè)三者的倒譜分別為s s (n(n) )、e e (n(n) )及及v v (n(n) ),則有:,則有:)(ln)( nsDFTIDFTns)(*)()(nvnens)( )( )( nvnens 語音信號倒譜分析實例語音信號倒譜分析實例 語音信號倒譜分析

60、實例語音信號倒譜分析實例倒譜分析實例:倒譜分析實例:MELMEL頻率倒譜參數(shù)頻率倒譜參數(shù)(MFCCMFCC)vMFCCMFCC(MelMel-Frequency -Frequency CepstralCepstral CoefficentsCoefficents MFCCMFCC)v分析著眼于人耳的聽覺特性,因為,人耳所聽到的分析著眼于人耳的聽覺特性,因為,人耳所聽到的聲音的高低與聲音的頻率并不成線性正比關(guān)系,而聲音的高低與聲音的頻率并不成線性正比關(guān)系,而用用MelMel頻率尺度則更符合人耳的聽覺特性。所謂頻率尺度則更符合人耳的聽覺特性。所謂MelMel頻率尺度,它的值大體上對應(yīng)于實際頻率的對

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論