用Matlab編程實(shí)現(xiàn)語(yǔ)音信號(hào)的短時(shí)分析_第1頁(yè)
用Matlab編程實(shí)現(xiàn)語(yǔ)音信號(hào)的短時(shí)分析_第2頁(yè)
用Matlab編程實(shí)現(xiàn)語(yǔ)音信號(hào)的短時(shí)分析_第3頁(yè)
用Matlab編程實(shí)現(xiàn)語(yǔ)音信號(hào)的短時(shí)分析_第4頁(yè)
用Matlab編程實(shí)現(xiàn)語(yǔ)音信號(hào)的短時(shí)分析_第5頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、用Matlab編程實(shí)現(xiàn)語(yǔ)音信號(hào)的短時(shí)分析課程設(shè)計(jì)目錄一、目的2二、原理及方法2三、實(shí)驗(yàn)步驟2四、實(shí)驗(yàn)結(jié)論與分析2五、心得體會(huì)4六、附錄4用Matlab編程實(shí)現(xiàn)語(yǔ)音信號(hào)的短時(shí)分析一、目的1.在理論學(xué)習(xí)的基礎(chǔ)上,進(jìn)一步地理解和掌握語(yǔ)音信號(hào)短時(shí)分析的意義,短時(shí)時(shí)域分析的基本方法。2.進(jìn)一步理解和掌握語(yǔ)音信號(hào)短時(shí)平均能量函數(shù)及短時(shí)平均過(guò)零數(shù)的計(jì)算方法和重要意義。二、原理及方法一定時(shí)寬的語(yǔ)音信號(hào),其能量的大小隨時(shí)間有明顯的變化。其中清音段(以清音為主要成份的語(yǔ)音段),其能量比濁音段小得多。短時(shí)過(guò)零數(shù)也可用于語(yǔ)音信號(hào)分析中,發(fā)濁音時(shí),其語(yǔ)音能量約集中于3kHz以下,而發(fā)清音時(shí),多數(shù)能量出現(xiàn)在較高頻率上,可

2、認(rèn)為濁音時(shí)具有較低的平均過(guò)零數(shù),而清音時(shí)具有較高的平均過(guò)零數(shù),因而,對(duì)一短時(shí)語(yǔ)音段計(jì)算其短時(shí)平均能量及短時(shí)平均過(guò)零數(shù),就可以較好地區(qū)分其中的清音段和濁音段,從而可判別句中清、濁音轉(zhuǎn)變時(shí)刻,聲母韻母的分界以及無(wú)聲與有聲的分界。這在語(yǔ)音識(shí)別中有重要意義。三、實(shí)驗(yàn)步驟(1)從網(wǎng)上找了一段錄音,采樣率為8KHZ,量化精度為16比特線性碼。(2)利用設(shè)計(jì)方案中給定的公式分別編程計(jì)算這段語(yǔ)音信號(hào)的短時(shí)能量、短時(shí)平均幅度、短時(shí)過(guò)零率,然后分別畫出它們的曲線;(3)然后畫出短時(shí)零能比曲線。(4)根據(jù)上述結(jié)果判斷找出其中的一幀濁音信號(hào)和一幀清音信號(hào)。判斷依據(jù)是,濁音:短時(shí)能量大、短時(shí)平均幅度大、短時(shí)過(guò)零率低;清

3、音:短時(shí)能量小、短時(shí)平均幅度小、短時(shí)過(guò)零率高。濁音,取13270-13510個(gè)點(diǎn),清音,取12120-12360個(gè)點(diǎn)。分別計(jì)算他們的短時(shí)自相關(guān)函數(shù)和平均幅度差函數(shù);(5)根據(jù)圖形,分析濁音段語(yǔ)音的基音周期。四、實(shí)驗(yàn)結(jié)論與分析(1)從圖中明顯可以看出,濁音信號(hào)的具有明顯的周期性,其自相關(guān)函數(shù)和平均幅度差函數(shù)也表現(xiàn)出周期性。清音信號(hào)稍微差一點(diǎn),但不是很明顯,主要是由于清音信號(hào)的位置找的不是很好。(2)濁音:短時(shí)能量大、短時(shí)平均幅度大、短時(shí)過(guò)零率低;清音:短時(shí)能量小、短時(shí)平均幅度小、短時(shí)過(guò)零率高。(3)基音提取消除共振峰的影響。從畫出的圖形中間可以看出,沒(méi)有加濾波器的聲音信號(hào)處理后共振峰的影響很大。

4、但是加一個(gè)60500Hz的帶通濾波器,利用濾波后的信號(hào)進(jìn)行基因估計(jì),這樣可除去大部分共振峰的影響,自相關(guān)函數(shù)和短時(shí)平均幅度差函數(shù)具有更尖銳地峰值,有利于判決地準(zhǔn)確性。(4)畫出的波形如下所示:圖1為沒(méi)有加窗nowindow.wav,無(wú)濾波,圖2為加窗后的語(yǔ)音信號(hào)為 havewindow.wav,有濾波。圖1沒(méi)有濾波的第一列的圖形從上到下分別表示:短時(shí)能量、短時(shí)平均幅度、短時(shí)過(guò)零率和零能比曲線,第二列從上到下分別為濁音的短時(shí)自相關(guān)函數(shù)、短時(shí)平均幅度差函數(shù)和輕清音的短時(shí)自相關(guān)函數(shù)、短時(shí)平均幅度差函數(shù)。圖1 圖2五、心得體會(huì)在本次的課程設(shè)計(jì)中,通過(guò)自己查找資料,修改程序,最后得出了基音頻率。這種以實(shí)

5、驗(yàn)方式學(xué)習(xí)的過(guò)程,加深了我對(duì)語(yǔ)音信號(hào)理論知識(shí)的理解,在設(shè)計(jì)中,也使我獲得了很多新的知識(shí),熟練對(duì)matlab的使用,對(duì)MATLAB的應(yīng)用也更加熟練了??偟恼f(shuō)來(lái),這個(gè)實(shí)驗(yàn)在周老師的指導(dǎo)下完成,感謝周老師在這個(gè)課程教會(huì)了我們很多關(guān)于語(yǔ)音處理的知識(shí)。六、附錄8 / 8源程序:% 沒(méi)有加窗nowindow.wavN=240Y=WAVREAD('nowindow',1 18000);L=length(Y)%30秒,每秒8000個(gè)點(diǎn),一共240000個(gè)點(diǎn)LL=length(Y)/N %一共 1000幀figure(1)set(1,'Position',10,35,350,65

6、0)%短時(shí)能量 Em=zeros(1,(LL-1)*240);for ii=1:(LL-1)*240, temp=Y(ii:ii+240); Em(ii)=sum(temp.*temp);endsubplot(4,1,1)jj=1:(LL-1)*240; plot(jj, Em,'b');grid% axis(12000,16000,0.15,0.4) %短時(shí)平均幅度Mn=sum(abs(Y)/NMn=zeros(1,(LL-1)*240);for ii=1:(LL-1)*240, temp=Y(ii:ii+240); Mn(ii)=sum(abs(temp)/N;endfig

7、ure(1) subplot(4,1,2)jj=1:(LL-1)*240; plot(jj, Mn,'b');grid% axis(12000,16000,0.02,0.04) %短時(shí)過(guò)零率 Zn=zeros(1,(LL-1)*240);for ii=2:(LL-1)*240, temp1=sign(Y(ii:ii+240); temp=sign(Y(ii-1:ii+240-1); Zn(ii)=sum(abs(temp1-temp);endfigure(1) subplot(4,1,3)jj=1:(LL-1)*240; plot(jj, Zn,'b');gri

8、d% axis(12000,16000,0,20)%零能比曲線figure(1)subplot(4,1,4)jj=1:(LL-1)*240; plot(jj, Zn./Em,'b');grid% axis(12000,16000,0,100)% % Wn=60/8000 ,500/8000% n=1:240;% B = FIR1(239,Wn,'bandpass');%濁音,取13270-13510個(gè)點(diǎn) %短時(shí)自相關(guān)函數(shù) temp=Y(13271:13510);% % wc1 = 0.0075; wc2 = 0.9625; % wn = wc1/pi,wc2/p

9、i;% h = fir1(239,wn,blackman(240);% h=reshape(h,240,1);% temp= temp.*abs(h);% % %temp2=reshape(temp,1,240); %temp=temp2.*B;Rn1=zeros(1,240); for nn=1:240, for ii=1:240-nn, Rn1(nn) =Rn1(nn)+ temp(ii)*temp(nn+ii); endend figure(2)set(2,'Position',400,35,350,650) subplot(4,1,1)jj=1:240;plot(jj,

10、 Rn1,'b');grid%axis(9,50,-0.01,0.02)%短時(shí)平均幅度差函數(shù)Yn1=zeros(1,240); for nn=1:240, for ii=1:240-nn, Yn1(nn) =Yn1(nn)+ abs(temp(ii)-temp(nn+ii); endend figure(2) subplot(4,1,2)jj=1:240;plot(jj, Yn1,'b');grid%清音,取12120-12360個(gè)點(diǎn) %短時(shí)自相關(guān)函數(shù) temp=Y(12121:12360); % %temp2=reshape(temp,1,240); %tem

11、p=temp2.*B;Rn2=zeros(1,240); for nn=1:240, for ii=1:240-nn, Rn2(nn) =Rn2(nn)+ temp(ii)*temp(nn+ii); endend figure(2) subplot(4,1,3)jj=1:240;plot(jj, Rn2,'b');grid%axis(9,50,-0.01,0.02)%短時(shí)平均幅度差函數(shù)Yn2=zeros(1,240); for nn=1:240, for ii=1:240-nn, Yn2(nn) =Yn2(nn)+ abs(temp(ii)-temp(nn+ii); enden

12、d figure(2) subplot(4,1,4)jj=1:240;plot(jj, Yn2,'b');grid%加窗后的語(yǔ)音信號(hào)為 havewindow.wavN=240Y=WAVREAD('havewindow',1 18000);L=length(Y)%30秒,每秒8000個(gè)點(diǎn),一共240000個(gè)點(diǎn)LL=length(Y)/N %一共 1000幀figure(1)set(1,'Position',10,35,350,650)%短時(shí)能量 Em=zeros(1,(LL-1)*240);for ii=1:(LL-1)*240, temp=Y(i

13、i:ii+240); Em(ii)=sum(temp.*temp);endsubplot(4,1,1)jj=1:(LL-1)*240; plot(jj, Em,'b');grid% axis(0,(LL-1)*240,0,0.6)% axis(12000,16000,0,0.06) %短時(shí)平均幅度Mn=sum(abs(Y)/NMn=zeros(1,(LL-1)*240);for ii=1:(LL-1)*240, temp=Y(ii:ii+240); Mn(ii)=sum(abs(temp)/N;endfigure(1) subplot(4,1,2)jj=1:(LL-1)*240

14、; plot(jj, Mn,'b');grid% axis(12000,16000,0,0.015) %短時(shí)過(guò)零率 Zn=zeros(1,(LL-1)*240);for ii=2:(LL-1)*240, temp1=sign(Y(ii:ii+240); temp=sign(Y(ii-1:ii+240-1); Zn(ii)=sum(abs(temp1-temp);endfigure(1) subplot(4,1,3)jj=1:(LL-1)*240; plot(jj, Zn,'b');grid% axis(12000,16000,0,60)%零能比曲線figure(

15、1)subplot(4,1,4)jj=1:(LL-1)*240; plot(jj, Zn./Em,'b');grid%axis(12000,16000,0,3*107)% % Wn=60/8000 ,500/8000% n=1:240;% B = FIR1(239,Wn,'bandpass');%濁音,取13270-13510個(gè)點(diǎn) %短時(shí)自相關(guān)函數(shù) temp=Y(13271:13510); % %temp2=reshape(temp,1,240); %temp=temp2.*B;Rn1=zeros(1,240); for nn=1:240, for ii=1:2

16、40-nn, Rn1(nn) =Rn1(nn)+ temp(ii)*temp(nn+ii); endend figure(2)set(2,'Position',400,35,350,650) subplot(4,1,1)jj=1:240;plot(jj, Rn1,'b');grid%axis(9,50,-0.01,0.02)%短時(shí)平均幅度差函數(shù)Yn1=zeros(1,240); for nn=1:240, for ii=1:240-nn, Yn1(nn) =Yn1(nn)+ abs(temp(ii)-temp(nn+ii); endend figure(2) subplot(4,1,2)jj=1:240;plot(jj, Yn1,'b');grid%清音,取12120-12360個(gè)點(diǎn) %短時(shí)自相關(guān)函數(shù) temp=Y(12121:12360); % %temp2=reshape(temp,1,240); %temp=temp2.*B;Rn2=zeros(1,240); for nn=1:240, for ii=1:240-nn, Rn2(nn) =Rn2(nn)+ temp(ii)*temp(nn+ii);

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論