語(yǔ)音信號(hào)處理實(shí)驗(yàn)報(bào)告_第1頁(yè)
語(yǔ)音信號(hào)處理實(shí)驗(yàn)報(bào)告_第2頁(yè)
語(yǔ)音信號(hào)處理實(shí)驗(yàn)報(bào)告_第3頁(yè)
語(yǔ)音信號(hào)處理實(shí)驗(yàn)報(bào)告_第4頁(yè)
語(yǔ)音信號(hào)處理實(shí)驗(yàn)報(bào)告_第5頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、語(yǔ)音信號(hào)處理實(shí)驗(yàn)報(bào)告實(shí)驗(yàn)一:語(yǔ)音信號(hào)的端點(diǎn)檢測(cè)學(xué)院:電子與信息學(xué)院專(zhuān)業(yè):11級(jí)信息工程姓名:學(xué)號(hào):提交日期:2014.4.23實(shí)驗(yàn)一:語(yǔ)音信號(hào)的端點(diǎn)檢測(cè)1、 實(shí)驗(yàn)內(nèi)容語(yǔ)音信號(hào)端點(diǎn)檢測(cè)技術(shù)其目的就是從包含語(yǔ)音的一段信號(hào)中準(zhǔn)確地確定語(yǔ)音的起始點(diǎn)和終止點(diǎn),區(qū)分語(yǔ)音和非語(yǔ)音信號(hào),它是語(yǔ)音處理技術(shù)中的一個(gè)重要方面。本實(shí)驗(yàn)的目的就是要掌握基于matlab編程實(shí)現(xiàn)帶噪語(yǔ)音信號(hào)端點(diǎn)檢測(cè),利用matlab對(duì)信號(hào)進(jìn)行分析和處理,學(xué)會(huì)利用短時(shí)過(guò)零率和短時(shí)能量,對(duì)語(yǔ)音信號(hào)的端點(diǎn)進(jìn)行檢測(cè)。2、 實(shí)驗(yàn)方法本實(shí)驗(yàn)中,端點(diǎn)檢測(cè)的方法有兩種:短時(shí)能量和短時(shí)過(guò)零率。2.1.1、短時(shí)能量語(yǔ)音和噪聲的區(qū)別可以體現(xiàn)在它們的能量上,語(yǔ)音

2、段的能量比噪聲段能量大,語(yǔ)音段的能量是噪聲段能量疊加語(yǔ)音聲波能量的和。在信噪比很高時(shí),那么只要計(jì)算輸入信號(hào)的短時(shí)能量或短時(shí)平均幅度就能夠把語(yǔ)音段和噪聲背景區(qū)分開(kāi)。這是僅基于短時(shí)能量的端點(diǎn)檢測(cè)方法。信號(hào)x(n)的短時(shí)能量定義為:2.1.2、短時(shí)平均過(guò)零率短時(shí)過(guò)零表示一幀語(yǔ)音信號(hào)波形穿過(guò)橫軸(零電平)的次數(shù)。過(guò)零分析是語(yǔ)音時(shí)域分析中最簡(jiǎn)單的一種。對(duì)于連續(xù)語(yǔ)音信號(hào),過(guò)零意味著時(shí)域波形通過(guò)時(shí)間軸;而對(duì)于離散信號(hào),如果相鄰的取樣值的改變符號(hào)稱(chēng)為過(guò)零。過(guò)零率就是樣本改變符號(hào)次數(shù)。信號(hào)x(n)的短時(shí)平均過(guò)零率定義為:2.2、檢測(cè)方法利用過(guò)零率檢測(cè)清音,用短時(shí)能量檢測(cè)濁音,兩者配合。首先為短時(shí)能量和過(guò)零率分別

3、確定兩個(gè)門(mén)限,一個(gè)是較低的門(mén)限數(shù)值較小,對(duì)信號(hào)的變化比較敏感,很容易超過(guò);另一個(gè)是比較高的門(mén)限,數(shù)值較大。低門(mén)限被超過(guò)未必是語(yǔ)音的開(kāi)始,有可能是很短的噪聲引起的,高門(mén)限被超過(guò)并且接下來(lái)的自定義時(shí)間段內(nèi)的語(yǔ)音超過(guò)低門(mén)限,意味著信號(hào)開(kāi)始。此時(shí)整個(gè)端點(diǎn)檢測(cè)可分為四段:靜音段、過(guò)渡段、語(yǔ)音段、結(jié)束。實(shí)驗(yàn)時(shí)使用一個(gè)變量表示當(dāng)前狀態(tài)。靜音段,如果能量或過(guò)零率超過(guò)低門(mén)限,就開(kāi)始標(biāo)記起始點(diǎn),進(jìn)入過(guò)渡段。過(guò)渡段當(dāng)兩個(gè)參數(shù)值都回落到低門(mén)限以下,就將當(dāng)前狀態(tài)恢復(fù)到靜音狀態(tài)。而如果過(guò)渡段中兩個(gè)參數(shù)中的任一個(gè)超過(guò)高門(mén)限,即被認(rèn)為進(jìn)入語(yǔ)音段。處于語(yǔ)音段時(shí),如果兩參數(shù)降低到門(mén)限以下,而且總的計(jì)時(shí)長(zhǎng)度小于最短時(shí)間門(mén)限,則認(rèn)為

4、是一段噪音,繼續(xù)掃描以后的語(yǔ)音數(shù)據(jù),否則標(biāo)一記結(jié)束端點(diǎn)。2.3、實(shí)驗(yàn)過(guò)程1、錄取一段錄音,采樣率8k,單聲道2、用matlab的wavread函數(shù)把錄音都進(jìn)來(lái)并進(jìn)行歸一化處理3、對(duì)語(yǔ)音信號(hào)進(jìn)行預(yù)加重,分幀處理4、對(duì)每幀分別計(jì)算短時(shí)能量和短時(shí)門(mén)限過(guò)零率5、進(jìn)行短時(shí)能量閾值、過(guò)零率閾值等參數(shù)6、編寫(xiě)程序?qū)崿F(xiàn)語(yǔ)音檢測(cè)端點(diǎn)并繪出檢測(cè)圖3、實(shí)驗(yàn)結(jié)果4、實(shí)驗(yàn)分析4.1結(jié)果分析從結(jié)果圖可知,本次實(shí)驗(yàn)是成功的,語(yǔ)音信號(hào)的端點(diǎn)基本都檢測(cè)出來(lái)了。短時(shí)能量和短時(shí)過(guò)零率的檢測(cè)結(jié)果和信號(hào)的端點(diǎn)分布一致。語(yǔ)音段的能量值比過(guò)渡段和靜音段的能量都大,語(yǔ)音的過(guò)零率比過(guò)渡段和靜音段的也都大。4.2實(shí)驗(yàn)總結(jié)這次實(shí)驗(yàn)利用matlab

5、對(duì)信號(hào)進(jìn)行分析和處理,利用短時(shí)過(guò)零率和短時(shí)能量,對(duì)語(yǔ)音信號(hào)的端點(diǎn)進(jìn)行檢測(cè)。由于知識(shí)儲(chǔ)備的不足,在實(shí)驗(yàn)過(guò)程中還是遇到比較大的困難,端點(diǎn)檢測(cè)代碼是參考網(wǎng)上的,在理解的基礎(chǔ)上加以修改和改進(jìn)。但是預(yù)處理、加窗分幀、短時(shí)能量、短時(shí)過(guò)零率的代碼都是我自己根據(jù)原理編寫(xiě)的,所有總的來(lái)說(shuō)收獲還是很大的。代碼如下:function point_check()s1=wavread(1_1.wav);s=s1/max(abs(s1);s=filter(1 -0.9375,1,s);%預(yù)加重plot(s);len=length(s);round=160;%幀長(zhǎng)repeat=80;%幀移inc=round-repeat;

6、%b_len-2*repeat;ka=ceil(len-round)/(round-repeat)+1;%總幀數(shù)s=s;zeros(round-repeat)*(ka-1)+round-len,1);len=length(s);%以下進(jìn)行分針操作w=zeros(round,ka); for i=1:ka for k=1:round w(k,i)=s(k+(i-1)*(round-repeat),1); end end%計(jì)算過(guò)零率st=0.01;%過(guò)零門(mén)限f=zeros(ka,1);%計(jì)算短時(shí)能量幅度差f=zeros(ka,round);for i=1:ka for k=0:round-1 fo

7、r j=1:round-k f(ka,k+1)=f(ka,k+1)+abs(w(j,i)-w(j+k,i);%計(jì)算短時(shí)能量幅度差 end if(k0&w(k+2,i)0) z=sign(w(k+1,i)-st)-sign(w(k+2,i)+st);%計(jì)算過(guò)零率 elseif(w(k+1,i)0) z=sign(w(k+2,i)-st)-sign(w(k+1,i)+st);%計(jì)算過(guò)零率 end if(z=2) f(i,1)=f(i,1)+1;%計(jì)算過(guò)零率 end end endendamp=sum(abs(w).2,1);%計(jì)算端點(diǎn)amp1=10;%短時(shí)能量閾值?amp2=2;zcr1=10;%

8、過(guò)零率閾值?zcr2=6;minsilence=6;%用無(wú)聲的長(zhǎng)度來(lái)判斷語(yǔ)音是否結(jié)束?minlen=15;%判斷是語(yǔ)音的最小長(zhǎng)度?status=0;%記錄語(yǔ)音段的狀態(tài)?count=0;%語(yǔ)音序列的長(zhǎng)度?silence=0;%無(wú)聲的長(zhǎng)度xpoint=;amp1=min(amp1,max(amp)/4);amp2=min(amp2,max(amp)/8);%一下開(kāi)始斷點(diǎn)檢測(cè)for n=1:ka %goto =0; switch status case 0,1;%?0?=?靜音,?1?=?可能開(kāi)始 if amp(n) amp1 %?確信進(jìn)入語(yǔ)音段? x1=max(n-count-1,1);%?記錄語(yǔ)

9、音段的起始點(diǎn)? xpoint=xpoint,x1; status = 2; silence = 0; count = count + 1; elseif amp(n) amp2 | f(n) zcr2 % 可能處于語(yǔ)音段 status = 1; count = count + 1; else % 靜音狀態(tài) status = 0; count = 0; end case 2, % 2 = 語(yǔ)音段 if amp(n) amp2 |f(n) zcr2 % 保持在語(yǔ)音段 count = count + 1; else % 語(yǔ)音將結(jié)束 silence = silence+1; if silence mi

10、nsilence % 靜音還不夠長(zhǎng),尚未結(jié)束 count = count + 1; elseif count minlen % 語(yǔ)音長(zhǎng)度太短,認(rèn)為是噪聲 status = 0; silence = 0; count = 0; else % 語(yǔ)音結(jié)束 status = 3; end end case 3, status=0; count = count-silence/2; x2 = x1 + count -1; %記錄語(yǔ)音段結(jié)束點(diǎn) xpoint=xpoint,x2; count=0; silence=0; endend subplot(3,1,1)plot(s)axis(1 length(s) -1 1)ylabel(speech);for i=1:length(xpoint) line(xpoint(i)*inc xpoint(i)*inc, -1 1, color, red);endsubplot(3,1,2)plot(amp);axis(1 length(amp) 0 max(amp)ylabel(energy);for i=1:length(xpoint) line(xpoint(i) xpoint(i),min(am

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論