語音處理時域分析實驗_第1頁
語音處理時域分析實驗_第2頁
語音處理時域分析實驗_第3頁
語音處理時域分析實驗_第4頁
語音處理時域分析實驗_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、1喩哥技累#universrty of science 2nd technology beijing音信號處理報告(實驗一)學院:計算機與通信工程學院班級:電信10學號:41050204姓名:陳小慧指導教師: 包宏2013年11月25日一.實驗目的 理解和掌握語音信號的數(shù)字化和預處埋方法。 理解短時能量分析、短時過零分析、短時相關分析。 語音信號的短時傅里葉分析方法。二.實驗原理語音信號分析可分為時域、頻域、倒譜域等方法。貫穿于語音分析全過程的是“短時分析技 術”。語音信號特性是隨時間而變化的,是一個非平穩(wěn)的隨機過程。但從另一方面,在一個相對 短時間范圍內莫特性基本保持不變。対于這種特點是語音

2、信號處理的一個重要出發(fā)點。因為我們 可以采用平穩(wěn)過程的分析處理方法來處理語音。時域分析時域分析是語音分析中最早使用,應用范圍最管得一種方法。其特點:(1) 表示語音信號比較宜觀。(語音信號本身就是時域信號)(2) 實現(xiàn)簡單、運算量小。(3) 可以得到語音的一些重要參數(shù)。常用短時分析技術冇:短時能量、短時平均幅度、短時過零率、短時自和關函數(shù)、短時平均 幅度差函數(shù)、短時頻譜、短時功率譜。短時能量分析能量分析是妹于語音信號能量隨時間冇相當大的變化,特別是清音段的能量-般比濁音段的 小得多。短時分析將語音流分為一段一段來處理,每一段稱為幀。用有限長窗函數(shù)進行加權來實 現(xiàn)。00en =wm)vv(n-m

3、)2-oo不同的窗11選擇(形狀、長度),將決定短時能量的特性。窗口的形狀:窗口有多種形狀, 他們都是屮心對稱的。窗口的長度:無論什么形狀的窗口,窗口序列的長度n將起決定性的作 用。n太大,能量隨時間變化很小,不能反映語音信號的幅度變化,波形的變化細節(jié)就看不出來。 n太小,濾波器的通帶變寬,短時能量隨時間有劇烈變化,不能得到平滑的能量函數(shù)。窗ii的選 擇(長度的確定)又需相對不同的基音周期來確定。通常情況下,一個語音幀內應含有17個 基音周期。然而不同的人其基音周期變化范圍很大,因此窗口寬度(n)的選擇有一個折屮選擇 為100200 (即1020ms持續(xù)吋間)。短時過零分析過零就是信號通過零值

4、??疾爝B續(xù)語音信號其時域波形通過時間軸的情況。通過相鄰取值改 變符號判斷是否過零,從而計算過零數(shù)。單位時間的過零率稱為平均過零數(shù)。對于窄帶信號,平 均過零數(shù)計算比較簡單。對于語音信號序列是寬帶信號,所以不能簡單地用上面的公式計算頻率。 但是,可借助短時平均過零數(shù)來得到其頻譜的粗略估計。語音信號的短時平均過零數(shù)定義為:00zn =工i sgnx(m)j - sgnx(m - 1)j i w(n -m) =1 sgnx(/?)j - sgnx(m - 1)j i *vv(n)-oo式子中sgnx(n)是符號函數(shù)sgnx(/?)=x(n) >= 0x(n) < 0w(n)為窗口序列,其作

5、用丁短時平均能量一樣。短時平均過零數(shù)的實現(xiàn)首先對語音信號序列進行成對采樣地查對采樣以確定是否發(fā)生過零,若發(fā)生符號變化,則表 示又一次過零,前后進行一階差分計算,再求取絕對值,最后進行低通濾波。三.matlab程序清單及結果圖形1、繪制該語音信號短時平均能量。程序清單:%讀入聲音文件y,fs=wavread(lc:usersacetdesktopmatlabtest 1 .wav1);%截取聲音片段x=zeros( 1,20000);i=l;while i<20001x(i)=y(120000+i);i=i+l;end%常數(shù)設置framelen=240;frameinc=80;%計算短時能

6、量amp=sum(abs(enframe(filter( 1 -0.9375, 1 ,x),framelen,frameinc),2); subplot(l ,2,1 );plot(x);titlec 原波形圖');subplot(l,2,2);plot(amp);title('短時平均能量圖');結果如圖1_1:x 10圖112、選擇不同長度的窗時的短時能量。程序清單:%讀入聲音文件y,fs=wavread('c:usersacetdesktopmatlabtest 1 .wav');%截取聲音片段x=zeros( 1,20000);i=l;while

7、 i<20001x(i)=y(120()00+i);i=i+l;end%常數(shù)設置framelen 1=51;framelen2=101;framelen3=201;framelen4=401;frameinc=80;%原始語音信號subplot(5,1,1 );plot(x);title('fontsize 15原波形');%計算短時能量n=51amp 1 =sum(abs(cnframc(filtcr( 1 -0.9375,1 ,x),framelen 1,frameinc),2); subplot(5,1,2);plot(amp 1 );title('font

8、size15短時平均能量圖 n=51');%計算短時能量n=101amp2=sum(abs(enframe(filter( 1 -0.9375, 1 ,x),framelen2,frameinc),2); subplot(5,l ,3);plot(amp2);title('fontsize 15短時平均能量圖 n=101'); %計算短時能量n=201amp3=sum(abs(enframe(filter( 1 -0.9375, l,x),framelen3,frameinc),2); subplot(5j ,4);plot(amp3);title('fonts

9、ize 15短時平均能量圖 n=20t); %計算短時能最n=401amp4=sum(abs(enframe(filter( 1 -0.9375,1 ,x),framelen4,frameinc),2); subplot(5,l ,5);plot(amp4);title(rfontsize 15短時平均能量圖 n=401'); 結果如圖1-2:wwsbiol053ico1502co250swwffln=401圖1-2四.實驗結果分析rh圖ii可知,短時平均能量的變化圖ii2與原語音信號波形圖iii的曲線輪廓與振幅 變化情況髙度吻合,即短時能量平均能量能的變化反映語音信號的振幅變化情況。圖12是選擇 相同矩形窗函數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論