基于子空間語音增強(qiáng)方法的研究_第1頁
基于子空間語音增強(qiáng)方法的研究_第2頁
基于子空間語音增強(qiáng)方法的研究_第3頁
基于子空間語音增強(qiáng)方法的研究_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、基于子空間語音增強(qiáng)方法的研究        【摘要】  目的: 研究基于信號(hào)子空間的語音增強(qiáng)方法。方法: 利用Cool Edit Pro2.0軟件錄制語音,加入各種噪聲,利用 Matlab軟件進(jìn)行分析、處理。結(jié)果:觀察語音信號(hào)波形圖和語譜圖,利用信號(hào)子空間的分解方法,可使信噪比大大增加。結(jié)論: 基于子空間的語音增強(qiáng)方法在主觀聽覺與客觀指標(biāo)上均得到了令人滿意的效果。 【關(guān)鍵詞】  子空間; 語音增強(qiáng); 語譜圖Abstract  Objective: To study speech enh

2、ancement method based on the signal sub-spaceMethods: Speeches to which various noises were added was recorded by Cool Edit Pro2.0,and analyzed and then dealt with by MatlabResults: The ratio of noise and signal can be improved a lot by reading speech waveform and speech spectrum and using the sub-s

3、pace decompositionConclusion: The method of speech enhancement based on signal sub-space has achieved satisfying effects in both subjective hearing and objective quota    Key words   sub-space enhancement;speech enhancement;speech spectrum    語音識(shí)別研究已經(jīng)取得重大,但距離機(jī)

4、器與人自由交流的目標(biāo)還相當(dāng)遙遠(yuǎn)。目前的識(shí)別系統(tǒng)大都是局限在安靜環(huán)境中使用的,在噪聲環(huán)境中,尤其是強(qiáng)噪聲環(huán)境,語音識(shí)別系統(tǒng)的識(shí)別性能將受到嚴(yán)重影響。如何提高強(qiáng)噪聲環(huán)境下語音識(shí)別的準(zhǔn)確率是當(dāng)前語音識(shí)別的難題之一。從帶噪語音信號(hào)中提取盡可能純凈的原始語音的過程稱為語音增強(qiáng)。污染語音的噪聲包括窄帶噪聲和寬帶噪聲兩類。對(duì)于低頻干擾、串音等窄帶噪聲,一般用線性濾波器便可有效抑制,而寬帶噪聲無論從時(shí)域還是從頻域看均與語音信號(hào)重疊在一起,傳統(tǒng)的線性濾波無能為力。消除噪聲的難點(diǎn)在于寬帶噪聲的消除。1  材料和方法1.1   材料    在實(shí)驗(yàn)室環(huán)境下利

5、用Cool Edit Pro2.0軟件錄制一段語音,再利用matlab軟件生成一段白噪聲,合成不同信噪比(-10dB10dB)的帶噪語音。1.2  方法    子空間語音增強(qiáng)算法主要是利用數(shù)據(jù)協(xié)方差矩陣的特征值分解,利用特征值的大小,將協(xié)方差矩陣的特征子空間分為信號(hào)子空間和噪聲子空間兩部分,并將含噪聲語音投影到語音子空間中,以該投影作為語音信號(hào)的估計(jì)值。    語音增強(qiáng)的問題可以描述為從一被污染信號(hào)中,恢復(fù)出原始語音信號(hào)的過程。設(shè)語音幀長為M,則每一幀信號(hào)都可看成是一個(gè)M維的矢量。M維的矢量信號(hào)可張成維數(shù)為M的空間CM。&#

6、160;   假設(shè)語音信號(hào)位于K維子空間中,并且KM。原始純凈語音信號(hào)可以用以下的線性模型表示:    s=VX=K   i=1xivi       KM(1)V =v1,v2,vK是一個(gè)K×M的矩陣,它的秩是K,且各個(gè)矢量之間相互正交1;    X = x1,x2,xKT是一個(gè)M×1的矢量,是零均值的復(fù)隨機(jī)變量。    帶噪語音信號(hào)可寫成:    y=V&

7、#183;X+n(2)    y的協(xié)方差矩陣為:    Ry=E(yyH)=Rs+Rn=VRxVH+Rn(3)    其中Rs表示純凈語音信號(hào)s的協(xié)方差矩陣,Rx表示向量X的協(xié)方差矩陣,Rn為噪聲的協(xié)方差矩陣:     Rn=2nI (4)    通過KL展開2將含噪語音信號(hào)所張成的空間分解成信號(hào)子空間和噪聲子空間。先不考慮噪聲的存在,只考慮純凈語音的情況下,對(duì)信號(hào)s的協(xié)方差矩陣Rs進(jìn)行特征值分解,可以得到:  &#

8、160; Rs=QQH=Q1Q2s1   00   0Q1HQ2H  (5)式中,s1=diag(s1,sk)是信號(hào)子空間的特征值,因?yàn)镽s是半正定陣,所以sk0 ,1kK 。因?yàn)檎Z音信號(hào)在K維空間內(nèi),因此非零特征的個(gè)數(shù)為K。特征值向量矩陣Q分解為2個(gè)子矩陣Q1和Q2。Q1矩陣包含非零特征值所對(duì)應(yīng)的特征向量,定義這些特征向量為構(gòu)成信號(hào)子空間的基本向量;Q2包含的特征向量張成空間定義為噪聲子空間。1             線性估計(jì)子的濾

9、波矩陣表示為H,則語音信號(hào)的向量可由下式估計(jì):s=H·y(6)則估計(jì)的語音值與真實(shí)的語音信號(hào)值的誤差由下式給出:e=s-s=(H-I)·s+H·n=es+en(7)這里es=(H-I)·s 表示語音信號(hào)的失真,en=H·n 表示殘余噪聲。    定義語音信號(hào)失真能量   e2s=tr(EeseHs)=tr((H-I)Rs(H-I)H) 和殘留噪聲能量   e2n=tr(EeneHn)=tr((H-I)Rn(H-I)H) ,Rs和Rn分別是純凈語音信號(hào)和噪聲信號(hào)的協(xié)方差矩陣。&

10、#160;   頻域約束估計(jì)子在把噪聲約束在一門限值下的同時(shí),盡量減少語音信號(hào)的失真3。純凈語音的最優(yōu)估計(jì)矩陣可以通過求解下面的約束優(yōu)化問題得到:Hopt=argminH   e2s約束條件:1   M   e2n2 (8)    增強(qiáng)系統(tǒng)的輸出為:  sopt=U1GUH1y(9)其中  G=(1)s(1)s+2N I)-12  結(jié)果    圖1是噪聲為白噪聲、信噪比為0dB的一段帶噪語音用子空間法增強(qiáng)后的語音信號(hào)波形及語譜圖4。結(jié)果表明基于信號(hào)子空間分解的語音增強(qiáng)方法能夠有效的濾除背景寬帶噪聲。    本研究還給出背景為汽車噪聲的增強(qiáng)結(jié)果。圖2是背景為汽車噪聲和白噪聲信噪比分別在-10dB10dB的子空間增強(qiáng)結(jié)果的對(duì)比圖。    從圖2可以看出,對(duì)于白噪聲的增強(qiáng)后的信噪比要高于對(duì)汽車噪聲的增強(qiáng)結(jié)果。這是因?yàn)樵趯?duì)噪聲的估計(jì)中白噪聲的估計(jì)比有色噪聲的估計(jì)更接近于真實(shí)噪聲。3  討論    本研究中的增強(qiáng)方法盡管也利用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論