華南理工大學(xué)語音信號實(shí)驗(yàn)二基音周期估計_第1頁
華南理工大學(xué)語音信號實(shí)驗(yàn)二基音周期估計_第2頁
華南理工大學(xué)語音信號實(shí)驗(yàn)二基音周期估計_第3頁
華南理工大學(xué)語音信號實(shí)驗(yàn)二基音周期估計_第4頁
華南理工大學(xué)語音信號實(shí)驗(yàn)二基音周期估計_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、word華南理工大學(xué)   語音信號處理 實(shí)驗(yàn)報告實(shí)驗(yàn)名稱:基音周期估計 姓名: 學(xué)號:班級:11級電信6班 日期:2022年3 月     1.實(shí)驗(yàn)?zāi)康?#160;本次試驗(yàn)的目的是通過matlab編程,驗(yàn)證課本中基音周期估計的方法,本實(shí)驗(yàn)采用的方法是自相關(guān)法。 2. 實(shí)驗(yàn)原理 1、基音周期 基音是發(fā)濁音時聲帶震動所引起的周期性,而基音周期是指聲帶震動頻率的倒數(shù)。基音周期是語音信號的重要的參數(shù)之一,它描述語音鼓勵源的一個重要特征,基音周期信息在多個領(lǐng)域有著廣

2、泛的應(yīng)用,如語音識別、說話人識別、語音分析與綜合以及低碼率語音編碼,發(fā)音系統(tǒng)疾病診斷、聽覺殘障者的語音指導(dǎo)等。因?yàn)闈h語是一種有調(diào)語言,基音的變化模式稱為聲調(diào),它攜帶著非常重要的具有辨意作用的信息,有區(qū)別意義的功能,所以,基音的提取和估計對漢語更是一個十分重要的問題。      由于人的聲道的易變性及其聲道持征的因人而異,而基音周期的范圍又很寬,而同個人在不同情態(tài)下發(fā)音的基音周期也不同,加之基音周期還受到單詞發(fā)音音調(diào)的影響,因而基音周期的精確檢測實(shí)際上是一件比擬困難的事情。基音提取的主要困難反映在:聲門鼓勵信號并不是一個完全周期的序列,在語音的頭

3、、尾部并不具有聲帶振動那樣的周期性,有些清音和濁音的過渡幀是很難準(zhǔn)確地判斷是周期性還是非周期性的。聲道共振峰有時會嚴(yán)重影響鼓勵信號的諧波結(jié)構(gòu),所以,從語音信號中直接取出僅和聲帶振動有關(guān)的鼓勵信號的信息并不容 易。語音信號本身是準(zhǔn)周期性的(即音調(diào)是有變化的),而且其波形的峰值點(diǎn)或過零點(diǎn)受共振峰的結(jié)構(gòu)、噪聲等的影響。基音周期變化范圍大,從老年男性的50Hz到兒童和女性的450Hz,接近三個倍頻程,給基音檢測帶來了一定的困難。由于這些困難,所以迄今為止尚未找到一個完善的方法可以對于各類人群(包括男、女、兒童及不向語種)、各類應(yīng)用領(lǐng)域和各種環(huán)境條件情況下都能獲得滿意的檢測結(jié)果。 盡

4、管基音檢測有許多困難,但因?yàn)樗闹匾裕舻臋z測提取一直是一個研究的課題,為此提出了各種各樣的基音檢測算法,如自相關(guān)函數(shù)(ACF)法、峰值提取算法(PPA)、平均幅度差函數(shù)(AMDF)法、并行處理技術(shù)、倒譜法、SIFT、譜圖法、小波法等等。 2、自相關(guān)函數(shù) 對于離散的語音信號x(n),它的自相關(guān)函數(shù)定義為:  R(k)=x(n)x(n-k), 如果信號x(n)具有周期性,那么它的自相關(guān)函數(shù)也具有周期性,而且周期與信號x(n)的周期性相同。自相關(guān)函數(shù)提供了一種獲取周期信號周期的方法。在周期信號周期的整數(shù)倍上,它的自相關(guān)函數(shù)可以到達(dá)最大值,因此可

5、以不考慮起始時間,而從自相關(guān)函數(shù)的第一個最大值的位置估計出信號的基音周期,這使自相關(guān)函數(shù)成為信號基音周期估計的一種工具。 3、短時自相關(guān)函數(shù) 語音信號是非平穩(wěn)的信號,所以對信號的處理都使用短時自相關(guān)函數(shù)。短時自相關(guān)函數(shù)是在信號的第N個樣本點(diǎn)附近用短時窗截取一段信號,做自相關(guān)計算所得的結(jié)果    Rm(k)=x(n)x(n-k) 式中,n表示窗函數(shù)是從第n點(diǎn)開始參加。  3. 實(shí)驗(yàn)數(shù)據(jù)及平臺 本實(shí)驗(yàn)所采用的數(shù)據(jù)語音文件isolated word.WAV,平臺是MATLAB2022。

6、60;4. 實(shí)驗(yàn)過程步驟 1、讀取wav文件; 2、利用自相關(guān)法進(jìn)行基音周期估計;3、去除野點(diǎn)。              5. 實(shí)驗(yàn)結(jié)果及討論 1、讀取wav文件 function pitch x=wavread('E:yuuyinisolated word.WAV'); %讀取聲音文件  figure(1); stem

7、(x,'.');                    %顯示聲音信號的波形 得到的波形如下:  2、利用自相關(guān)法進(jìn)行基音周期估計   n=160;               

8、60;         %取20ms的聲音片段,即160個點(diǎn)  for m=1:length(x)/n;           %對每一幀求短時自相關(guān)數(shù)       for k=1:n;         

9、;   Rm(k)=0;            for i=(k+1):n;                Rm(k)=Rm(k)+x(i+(m-1)*n)*x(i-k+(m-1)*n);          &

10、#160;end       end        p=Rm(10:n);     %防止誤判,去掉前邊10個數(shù)值較大的點(diǎn)             Rmax,N(m)=max(p);       %讀取第一個自相關(guān)函數(shù)的最點(diǎn) &#

11、160;end                            %補(bǔ)回前邊去掉的10個點(diǎn)  N=N+10;  T=N/8;            

12、0;            %算出對應(yīng)的周期       figure(2);stem(T,'.');axis(0 length(T) 0 11);  xlabel('幀數(shù)(n)');ylabel('周期(ms)');title('各幀基音周期');  結(jié)果如下列圖:

13、0; 由圖中可以看出基音周期大約為10ms,但是圖中存在太多的野點(diǎn),為此,需要對此進(jìn)行進(jìn)一步的處理,即去除野點(diǎn)。  3、去除野點(diǎn)   T1= medfilt1(T,5);             %去除野點(diǎn) figure(3);stem(T1,'.');axis(0 length(T1) 0 11);  xlabel(&#

14、39;幀數(shù)(n)');ylabel('周期(ms)');title('各幀基音周期');  得到的結(jié)果如下: 6. 實(shí)驗(yàn)總結(jié) 短時自相關(guān)函數(shù)法基音檢測的主要原理是通過比擬原始信號和它移位后的信號之間的類似性來確定基音周期,如果移位距離等于基音周期,那么兩個信號具有最大類似性?;谧韵嚓P(guān)函數(shù)的算法是基音周期估計的常用方法,特別適用于噪聲環(huán)境下的基音提取。自相關(guān)函數(shù)在基音周期處表現(xiàn)為峰值,相鄰兩個峰值之間的間隔即為一個基音周期。 但是計算自相關(guān)函數(shù)的運(yùn)算量是很大的,其原因是計算機(jī)進(jìn)行乘法運(yùn)算非常費(fèi)時

15、。為此可以對中心削波函數(shù)進(jìn)行修正,采用三電平中心削波的方法。三電平削波的自相關(guān)函數(shù)的計算很簡單,因?yàn)橄鞑ê蟮男盘柕娜≈抵挥?1、0、1三種情況,因而不需作乘法運(yùn)算而只需要簡單的組合邏輯便可以。  7. 實(shí)驗(yàn)代碼  function pitch  x=wavread('E:yuuyinisolated word.WAV');%讀取聲音文件  figure(1);  stem(x,'.');    

16、               %顯示聲音信號的波形   n=160;                         %取20ms的聲音片段,即160個樣點(diǎn) &

17、#160;for m=1:length(x)/n;           %對每一幀求短時自相關(guān)數(shù)     for k=1:n;           Rm(k)=0;            for

18、60;i=(k+1):n;               Rm(k)=Rm(k)+x(i+(m-1)*n)*x(i-k+(m-1)*n);           end       end       p

19、=Rm(10:n);         %防止誤判,去掉前邊10個數(shù)值較大的點(diǎn)               Rmax,N(m)=max(p);  %讀取第一個自相關(guān)函數(shù)的最大點(diǎn)  end                            %補(bǔ)回前邊去掉的10個點(diǎn)  N=N+10;  T=N/8;  

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論