語音信號(hào)處理實(shí)驗(yàn)指導(dǎo)書_第1頁
語音信號(hào)處理實(shí)驗(yàn)指導(dǎo)書_第2頁
語音信號(hào)處理實(shí)驗(yàn)指導(dǎo)書_第3頁
語音信號(hào)處理實(shí)驗(yàn)指導(dǎo)書_第4頁
語音信號(hào)處理實(shí)驗(yàn)指導(dǎo)書_第5頁
已閱讀5頁,還剩30頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、實(shí)驗(yàn)一語音信號(hào)的時(shí)域分析一、實(shí)驗(yàn)?zāi)康?、理解和掌握語音信號(hào)的數(shù)字化。2、理解語音信號(hào)短時(shí)時(shí)域分析。3、熟悉常用短時(shí)時(shí)域分析方法及MATLAB實(shí)現(xiàn)。二、實(shí)驗(yàn)原理語音信號(hào)特性是隨時(shí)間而變化的,是一個(gè)非平穩(wěn)的隨機(jī)過程。但從另一方面,在一個(gè)相對(duì)短時(shí)間范圍內(nèi)其特性基本保持不變。對(duì)于這種特點(diǎn)是語音信號(hào)處理的一個(gè)重要出發(fā)點(diǎn)。因此我們可以采用平穩(wěn)過程的分析處理方法來處理語音。貫穿于語音分析全過程的是“短時(shí)分析技術(shù)”。語音信號(hào)分析可分為時(shí)域、頻域、倒譜域等方法。時(shí)域分析是語音分析中最簡單、最直觀的一種方法。特點(diǎn):1 、表示語音信號(hào)比較直觀。(語音信號(hào)本身就是時(shí)域信號(hào))2 、實(shí)現(xiàn)簡單、運(yùn)算量小。3、可以得到語音的

2、一些重要參數(shù)。常用短時(shí)時(shí)域分析技術(shù)1、短時(shí)平均能量2、短時(shí)平均幅度3、短時(shí)平均過零率4、短時(shí)自相關(guān)函數(shù)短時(shí)平均能量分析能量分析是基于語音信號(hào)能量隨時(shí)間有相當(dāng)大的變化,特別是清音段的能量一般比濁音段的小得多。短時(shí)分析將語音流分為一段一段來處理,每一段稱為一“幀”。用有限長窗函數(shù)進(jìn)行加權(quán)來實(shí)現(xiàn)。2n2E n x ( m ) w ( n m ) 2 x ( m ) w ( n m )m n ( N 1)n2Enx (m)m n (N 1)若令 h(n)=w2(n)則短時(shí)平均能量可以寫成:22En x (m)h(n m) x (n)* h(n)mEn特點(diǎn):En反映語音信號(hào)的幅度或能量隨時(shí)間緩慢變化的規(guī)

3、律。窗的長短對(duì)于能否由短時(shí)能量反映語音信號(hào)的幅度變化,起著決定性影響。N 太大,能量隨時(shí)間變化很小,不能反映語音信號(hào)的幅度變化,波形的變化細(xì)節(jié)就看不出來;N 太小,濾波器的通帶變寬,短時(shí)能量隨時(shí)間有劇烈變化,不能得到平滑的能量函數(shù)。通常情況下,當(dāng)取樣頻率為10kHz 時(shí),選擇窗寬度N=100200是比較合適的。短時(shí)平均能量的主要用途如下:1)可以作為區(qū)分清音和濁音的特征參數(shù)。2)在信噪比較高的情況下,短時(shí)能量還可以作為區(qū)分有聲和無聲的依據(jù)。3)可以作為輔助的特征參數(shù)用于語音識(shí)別中。短時(shí)平均幅度函數(shù)為了克服短時(shí)能量函數(shù)計(jì)算x2(m)的缺點(diǎn),定義了短時(shí)平均幅度函數(shù):Mn | x(m) |w(n m

4、)mMn與 En的比較:1. Mn 能較好地反映清音范圍內(nèi)的幅度變化;2. Mn所能反映幅度變化的動(dòng)態(tài)范圍比En 好;3. Mn 反映清音和濁音之間的電平差次于En。短時(shí)平均過零率過零就是信號(hào)通過零值。考察連續(xù)語音信號(hào)其時(shí)域波形通過時(shí)間軸的情況。通過相鄰取值改變符號(hào)判斷是否過零,從而計(jì)算過零數(shù)。單位時(shí)間內(nèi)的過零數(shù)稱為平均過零數(shù)。對(duì)于窄帶信號(hào),平均過零數(shù)計(jì)算比較簡單。例:有一頻率為f0 的正弦信號(hào),以取樣頻率fs 進(jìn)行取樣,則每個(gè)正弦周期內(nèi)有fs/f0個(gè)取樣,另外,每個(gè)正弦周期有二次過零,所以平均過零數(shù)為所以不能借助平均過零數(shù)及取樣頻率可精確算出頻率。對(duì)于語音信號(hào)序列是寬帶信號(hào),簡單地用上面的公

5、式計(jì)算頻率。但是, 可借助短時(shí)平均過零數(shù)來得到其頻譜的粗略估計(jì)。語音信號(hào)的短時(shí)平均過零數(shù)定義為Zn|sgnx(m) sgnx(m 1)|w(n m)|sgnx(m) sgnx(m 1)|*w(n)x(n) 0x(n) 0短時(shí)平均過零數(shù)的實(shí)現(xiàn)首先對(duì)語音信號(hào)序列式子中 sgnx(m) 是符號(hào)函數(shù),1,sgnx(n)1W(n)為窗口序列,其作用于短時(shí)平均能量一樣。進(jìn)行成對(duì)采樣地查對(duì)采樣以確定是否發(fā)生過零,若發(fā)生符號(hào)變化,則表示有一次過零,而后進(jìn)行一階差分計(jì)算,再求取絕對(duì)值,最后進(jìn)行低通濾波。清音過零率高,濁音過零率低。局限性:濁音和清音重疊區(qū)域只根據(jù)短時(shí)平均過零率不可能明確地判別清、濁音。短時(shí)自相關(guān)

6、分析1、時(shí)域離散確定信號(hào)的自相關(guān)函數(shù)定義為:R(k) x(m)x(m k) m時(shí)域離散隨機(jī)信號(hào)的自相關(guān)函數(shù)定義為:R(k)lim 1N 2N 1x(m)x(m k)mN周期為 P 的周期信號(hào)滿足:R(k)=R(K+P)自相關(guān)函數(shù)具有下述性質(zhì):(1)對(duì)稱性 R(k)= R(-k)(2)在 k = 0 處為最大值,即對(duì)于所有k 來說,|R(k)| R(0)(3)對(duì)于確定信號(hào),R(0)對(duì)應(yīng)于能量;對(duì)于隨機(jī)信號(hào),R(0)對(duì)應(yīng)于平均功率2、語音信號(hào)的短時(shí)自相關(guān)函數(shù)采用短時(shí)分析方法,定義語音信號(hào)短時(shí)自相關(guān)函數(shù)為Rn(k)x(m)w(n m)x(m k) w(n k m)m因?yàn)椋?Rn(-k)=Rn(k)

7、所以:Rn(k) Rn ( k) x(m)x(m k) w(n m)w(n m k) m定義hk (n)=w(n)w(n+k)那么短時(shí)自相關(guān)函數(shù)可以寫成Rn(k)x(m) x(m k)hk(n m)m上式表明,序列x(n)x(n-k) 經(jīng)過一個(gè)沖激響應(yīng)為hk(n)的數(shù)字濾波器濾波即得到短時(shí)自相關(guān)函數(shù) Rn(k) 。濁音和清音的短時(shí)自相關(guān)函數(shù)有如下幾個(gè)特點(diǎn):1)短時(shí)自相關(guān)函數(shù)可以很明顯的反映出濁音信號(hào)的周期性。2) 清音的短時(shí)自相關(guān)函數(shù)沒有周期性,也不具有明顯突出的峰值,其性質(zhì)類似于噪聲。3)不同的窗對(duì)短時(shí)自相關(guān)函數(shù)結(jié)果有一定的影響。三、實(shí)驗(yàn)用函數(shù)1、讀取語音函數(shù):audioread ( 早期版

8、本wavread)格式:y,fs=audioread ( 文件名, sample,datatype)用于讀取語音, 采樣值放在向量y 中 ,fs 表示采樣頻率。samples 指讀取文件的區(qū)域:如果文件有100個(gè)數(shù)據(jù)那么長,如果讀取前一半的數(shù)據(jù),此處應(yīng)為1,50datatype 指讀取后文件的數(shù)據(jù)格式:如double 和 native2、語音信號(hào)重采樣函數(shù):resample格式:s=resample(s1,fs,fs1),將采樣率為fs1 的 s1 的信號(hào)變成采樣率為fs 的 s 信號(hào),而信號(hào)的大致形狀不變。3、分幀函數(shù):enframe格式:y=enframe(x,framelength,st

9、ep)framelength幀長step幀移(幀移與幀長的比值一般取為0 1/2 )分得的幀數(shù)是:nf=fix(nx-framelength+step)/step)(其中 nx 是 x 的長度)該函數(shù)需要?jiǎng)?chuàng)建:function f=enframe(x,win,inc)nx=length(x);nwin=length(win);if (nwin = 1)len = win;elselen = nwin;endif (nargin 1)w = win(:);f = f .* w(ones(nf,1),:);end4、求過零率函數(shù)zcrofunction f=zcro(x)f=zeros(size(

10、x,1),1); %生成全零矩陣for i=1:size(x,1)z=x(i,:);%提取一行數(shù)據(jù)for j=1:(length(z)-1);if z(j)*z(j+1)0.08&indLFa= fs/(LF+ind);elsea=0;endpitch=a% 畫圖figure(1);subplot(3,1,1);plot(time1, y);title( 語音波形);axis tightylim=get(gca, ylim);line(time1(startIndex),time1(startIndex),ylim,color,r);line(time1(endIndex), time1(en

11、dIndex),ylim,color,r);xlabel( 樣點(diǎn)數(shù) );ylabel( 幅度 );subplot(3,1,2);plot(frame);axis(0,400,-0.5,0.5)title( 一幀語音);xlabel( 樣點(diǎn)數(shù) );ylabel( 幅度 )subplot(3,1,3);time2=-199:1:-1,0:1:200;plot(time2,cepstrum1);axis(-200,200,-0.5,0.5)title( 一幀語音的倒譜);xlabel( 樣點(diǎn)數(shù) );ylabel( 幅度 );五、實(shí)驗(yàn)要求用錄音軟件錄制一段帶真實(shí)語音,然后借助給出的參考例程用MATLA

12、B編程計(jì)算這段語音的短時(shí)頻域分析,繪制清、濁音的頻譜圖、繪制語音信號(hào)對(duì)應(yīng)的語譜圖、以及語音信號(hào)的倒譜圖。實(shí)驗(yàn)三語音信號(hào)濾波設(shè)計(jì)與實(shí)現(xiàn)一、實(shí)驗(yàn)?zāi)康?、本次實(shí)驗(yàn)是設(shè)計(jì)性實(shí)驗(yàn),鼓勵(lì)學(xué)生充分發(fā)揮自己的創(chuàng)造性,靈活利用所學(xué)的理論知識(shí),設(shè)計(jì)出自己的解決方案。2、熟悉并掌握語音端點(diǎn)檢測(cè)技術(shù)。二、實(shí)驗(yàn)原理數(shù)字濾波器的作用是利用離散時(shí)間系統(tǒng)的特性,對(duì)輸入信號(hào)波形( 或頻譜 ) 進(jìn)行加工與處理,或者說利用數(shù)字方法,按預(yù)定的要求對(duì)信號(hào)進(jìn)行變換??梢詫?shù)字濾波器理解為一個(gè)算法或者程序,將代表輸入信號(hào)的數(shù)字時(shí)間序列,轉(zhuǎn)化為代表輸出信號(hào)的數(shù)字時(shí)間序列,并在轉(zhuǎn)化過程中,使信號(hào)按預(yù)定的形式變化。數(shù)字濾波器有多種,根據(jù)數(shù)字濾波

13、器沖激響應(yīng)的時(shí)域特征,可將數(shù)字濾波器分為兩種,一種是無限長沖激響應(yīng)(IIR) 濾波器, 另外一種則是有限長沖激響應(yīng)(FIR) 濾波器。 從性能上說, IIR 濾波器傳輸函數(shù)的極點(diǎn)可位于單位圓內(nèi)的任何地方,因此可用于較低的階數(shù),以獲得高的選擇性,所用的存貯單元少,所以經(jīng)濟(jì)且效率較高。但是這個(gè)高效率是以犧牲相位的非線性為代價(jià)的。若選擇性越好,則相位非線性失真會(huì)越嚴(yán)重。相反,F(xiàn)IR 濾波器卻可以得到嚴(yán)格的線性相位輸出,但由于 FIR 濾波器傳輸函數(shù)的極點(diǎn)固定在原點(diǎn),因而只能用較高的階數(shù)以達(dá)到高的選擇性;對(duì)于同樣的濾波器設(shè)計(jì)指標(biāo),F(xiàn)IR 濾波器所要求的階數(shù)可以比IIR濾波器高510 倍,但是成本較高,

14、信號(hào)延時(shí)也較大;所以如若按相同的選擇性和相同的線性要求來說的話,則 IIR 濾波器就必須加全通網(wǎng)絡(luò)以進(jìn)行相位較正,同時(shí)要增加濾波器的節(jié)數(shù)和復(fù)雜性。整體來看,IIR 與 FIR 各有優(yōu)缺點(diǎn)。IIR 濾波器能達(dá)到同樣效果,且階數(shù)少,延遲也較低,但是會(huì)有穩(wěn)定性和非線性相位問題;FIR 濾波器雖然沒有穩(wěn)定性問題,且線性相位,但階數(shù)多,延遲大。三、實(shí)驗(yàn)要求1 、首先錄制好一段自己的語音。2 、對(duì)獲得的語音添加噪聲。3、用 Matlab 分別設(shè)計(jì)2 種類型的濾波器(指標(biāo)自己確定): IIR 、 FIR,對(duì)加噪信號(hào)進(jìn)行濾波處理,比較濾波前后時(shí)域與頻域的變化情況。4、 用 Matlab 自帶的語音回放函數(shù)收聽

15、濾波后的語音信號(hào),分析并比較其與原語音信號(hào)的差異。四、參考函數(shù)(1) 函數(shù)sound函數(shù)sound可以對(duì)聲音進(jìn)行回放。其調(diào)用格式為:sound(x,fs,bits) 。(2)函數(shù)filter函數(shù)filter 的調(diào)用格式為:y=filter(b,a,x) 。該格式采用的是用數(shù)字濾波器對(duì)數(shù)據(jù)進(jìn)行濾波,既可以用于IIR 濾波器,同樣,也可以用于 FIR 濾波器。其中,向量 b 和 a分別表示的是系統(tǒng)函數(shù)的分子、分母多項(xiàng)式的系數(shù)。若a=1,則表示的是FIR 濾波器,否則就是IIR 濾波器。該函數(shù)是利用給出的向量b 和a,對(duì)x中的數(shù)據(jù)進(jìn)行濾波,結(jié)果放入向量y。(3)函數(shù)rand( randn)Rand 函數(shù)產(chǎn)生的是0, 1上的均勻分布的隨機(jī)序列,randn 產(chǎn)生均值為0,方差為1 的高斯隨機(jī)序列,也就是白噪聲序列。也就是說,可以直接使用下面兩個(gè)函數(shù)對(duì)原始信號(hào)添加噪聲。調(diào)用格式為: y=x+rand(length(x),1), 或者

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論