實驗一語音信號端點檢測最終報告_第1頁
實驗一語音信號端點檢測最終報告_第2頁
實驗一語音信號端點檢測最終報告_第3頁
實驗一語音信號端點檢測最終報告_第4頁
實驗一語音信號端點檢測最終報告_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、實驗一語音信號端點檢測一、實驗目的學會MATLAB的使用,掌握MATLAB勺程序設計方法;掌握語音處理的基本概念、基本理論和基本方法;.掌握基于MATLAB編程實現(xiàn)帶噪語音信號端點檢測;.學會用MATLAB寸信號進行分析和處理。5.學會利用短時過零率和短時能量,對語音信號的端點進行檢測。二、實驗儀器設備及軟件HPD538、MATLAB三、實驗原理端點檢測是語音信號處理過程中非常重要的一步,它的準確性直接影響到語音信號處理的速度和結果。本次實驗利用短時過零率和短時能量相結合的語音端點檢測算法利用短時過零率來檢測清音,用短時能量來檢測濁音,兩者相配合便實現(xiàn)了信號信噪比較大情況下的端點檢測。算法對于

2、輸入信號的檢測過程可分為短時能量檢測和短時過零率檢測兩個部分。算法以短時能量檢測為主,短時過零率檢測為輔。根據(jù)語音的統(tǒng)計特性,可以把語音段分為清音、濁音以及靜音(包括背景噪聲)三種。在本算法中,短時能量檢測可以較好地區(qū)分出濁音和靜音。對于清音,由于其能量較小,在短時能量檢測中會因為低于能量門限而被誤判為靜音;短時過零率則可以從語音中區(qū)分出靜音和清音。將兩種檢測結合起來,就可以檢測出語音段(清音和濁音)及靜音段1、短時能量計算定義n時刻某語言信號的短時平均能量En為::n-2-2En=x(m)w(n_m)x(m)w(n_m)二:m.(N-1)式中N為窗長,可見短時平均能量為一幀樣點值的平方和。特

3、殊地,當窗函數(shù)為n矩形窗時,有En=7x2(m)m.(N)2、短時過零率過零就是指信號通過零值。過零率就是每秒內(nèi)信號值通過零值的次數(shù)。對于離散時間序列,過零則是指序列取樣值改變符號,過零率則是每個樣本的改變符號的次數(shù)。對于語音信號,則是指在一幀語音中語音信號波形穿過橫軸(零電平)的次數(shù)??梢杂孟噜弮蓚€取樣改變符號的次數(shù)來計算。如果窗的起點是n=0,短時過零率Z為波形穿過橫軸(零電平)的次數(shù)N丄Zo|Sgn(Sw(n)-Sgn(Sw(n-1)|n-0sgn(x)1,x_0-1,x:0短時過零可以看作信號頻率的簡單度量濁音的短時平均幅度最大,無聲的短時平均幅度最小,清音的短時過零率最大,無聲居中,

4、濁音的短時過零率最小。3、短時自相關函數(shù)N上Rw(k)-sw(n)sw(nk)nz0是偶函數(shù);s(n)是周期的,那么R(k)也是周期的;可用于基音周期估計和線性預測分析4、判斷語音信號的起點和終點利用短時平均幅度和短時過零率可以判斷語音信號的起點和終點。語音端點檢測方法可采用測試信號的短時能量或短時對數(shù)能量、聯(lián)合過零率等特征參數(shù),并采用雙門限判定法來檢測語音端點,即利用過零率檢測清音,用短時能量檢測濁音,兩者配合。首先為短時能量和過零率分別確定兩個門限,一個是較低的門限數(shù)值較小,對信號的變化比較敏感,很容易超過;另一個是比較高的門限,數(shù)值較大。低門限被超過未必是語音的開始,有可能是很短的噪聲引

5、起的,高門限被超過并且接下來的自定義時間段內(nèi)的語音。四、實驗步驟及程序實驗步驟:1、取一段錄音作為音頻樣本。2、利用公式分別編程計算這段語音信號的短時能量和短時過零率,然后分別畫出它們的曲線。3、調(diào)整能量門限。4、進行幅度歸一化并設置幀長、短時能量閾值、過零率閾值等參數(shù)。5、編寫程序實現(xiàn)語音端點檢測。6、最后得到語音端點檢測圖像。語音信號的端點檢測程序流程圖:輸入語音信號幅度歸一化輸出樣本端點檢測圖像x,fs,nbits=wavread(x=x/max(abs(x);%參數(shù)設置%幀長%未重疊部分圖1.1語音信號的端點檢測程序流程圖語音信號的端點檢測實驗源程序:1.wav);%語音信號的端點檢測

6、matlab實現(xiàn)%幅度歸一化到-1,1FrameLen=256;inc=90;amp1=10;amp2=2;zcr1=10;%短時能量閾值%過零率閾值zcr2=5;else%語音將結束minsilenee=6;minlen=15;status=0;count=0;silenee=0;%用無聲的長度來判斷語音是否結束%判斷是語音的最小長度%記錄語音段的狀態(tài)%語音序列的長度%無聲的長度%計算過零率tmpl=enframe(x(1:end-1),FrameLen,inc);tmp2=enframe(x(2:end),FrameLen,inc);signs=(tmp1.*tmp2)0.02;zcr=s

7、um(signs.*diffs,2);else%語音將結束else%語音將結束%計算短時能量amp=sum(abs(enframe(filter(12);%調(diào)整能量門限amp1=min(amp1,max(amp)/4);amp2=min(amp2,max(amp)/8);%開始端點檢測forn=1:length(zcr)goto=0;switchstatuscase0,1ifamp(n)amp1x1=max(n-count-1,1);status=2;silenee=0;-0.9375,1,x),FrameLen,%0=靜音,1=可能開始%確信進入語音段%記錄語音段的起始點count=coun

8、t+1;elseifamp(n)amp2|zcr(n)zcr2%可能處于語音status=1;count=count+1;else%靜音狀態(tài)inc).A2,status=0;count=0;endcase2,ifamp(n)amp2|zcr(n)zcr2%2=語音段%保持在語音段count=count+1;silenee=silence+1;ifsileneeminsileneecount=count+1;elseifcountminlenstatus=0;silenee=0;count=0;elsestatus=3;endendcase3,break;endendcount=count-si

9、lence/2;x2=x1+count-1;subplot(3,1,1)plot(x)axis(1length(x)-11)xlabel(幀數(shù));ylabel(Speechline(x1*incx1*inc,-11,line(x2*incx2*inc,-11,subplot(3,1,2)plot(amp);axis(1length(amp)0max(amp)xlabel(幀數(shù));ylabel(Energyline(x1x1,min(amp),max(amp),line(x2x2,min(amp),max(amp),subplot(3,1,3)plot(zcr);axis(1length(zcr

10、)0max(zcr)xlabel(幀數(shù));ylabel(ZCR);line(x1x1,min(zcr),max(zcr),line(x2x2,min(zcr),max(zcr),%靜音還不夠長,尚未結束%語音長度太短,認為是噪聲%語音結束%記錄語音段結束點);Color,red);Color,red););Color,red);Color,red);Color,red);Color,red);五、實驗結果與分析圖1.2語音信號的端點檢測實驗結果輸出圖像(1)從圖中可以明顯看出,濁音的短時能量大、短時過零率低。清音的短時能量小、短時過零率高。(2)門限的選取對語音檢測結果有很大影響。(3)僅僅根據(jù)能量判斷是比較粗糙的,還需要根據(jù)過零率進行判斷。因為清音和噪聲的短時平均過零率比背景噪聲的平均過零率要高出好幾倍。六

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論