基于子空間語音增強方法的研究_第1頁
基于子空間語音增強方法的研究_第2頁
基于子空間語音增強方法的研究_第3頁
基于子空間語音增強方法的研究_第4頁
全文預覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、基于子空間語音增強方法的研究        【摘要】  目的: 研究基于信號子空間的語音增強方法。方法: 利用Cool Edit Pro2.0軟件錄制語音,加入各種噪聲,利用 Matlab軟件進行分析、處理。結(jié)果:觀察語音信號波形圖和語譜圖,利用信號子空間的分解方法,可使信噪比大大增加。結(jié)論: 基于子空間的語音增強方法在主觀聽覺與客觀指標上均得到了令人滿意的效果。 【關(guān)鍵詞】  子空間; 語音增強; 語譜圖Abstract  Objective: To study speech enh

2、ancement method based on the signal sub-spaceMethods: Speeches to which various noises were added was recorded by Cool Edit Pro2.0,and analyzed and then dealt with by MatlabResults: The ratio of noise and signal can be improved a lot by reading speech waveform and speech spectrum and using the sub-s

3、pace decompositionConclusion: The method of speech enhancement based on signal sub-space has achieved satisfying effects in both subjective hearing and objective quota    Key words   sub-space enhancement;speech enhancement;speech spectrum    語音識別研究已經(jīng)取得重大,但距離機

4、器與人自由交流的目標還相當遙遠。目前的識別系統(tǒng)大都是局限在安靜環(huán)境中使用的,在噪聲環(huán)境中,尤其是強噪聲環(huán)境,語音識別系統(tǒng)的識別性能將受到嚴重影響。如何提高強噪聲環(huán)境下語音識別的準確率是當前語音識別的難題之一。從帶噪語音信號中提取盡可能純凈的原始語音的過程稱為語音增強。污染語音的噪聲包括窄帶噪聲和寬帶噪聲兩類。對于低頻干擾、串音等窄帶噪聲,一般用線性濾波器便可有效抑制,而寬帶噪聲無論從時域還是從頻域看均與語音信號重疊在一起,傳統(tǒng)的線性濾波無能為力。消除噪聲的難點在于寬帶噪聲的消除。1  材料和方法1.1   材料    在實驗室環(huán)境下利

5、用Cool Edit Pro2.0軟件錄制一段語音,再利用matlab軟件生成一段白噪聲,合成不同信噪比(-10dB10dB)的帶噪語音。1.2  方法    子空間語音增強算法主要是利用數(shù)據(jù)協(xié)方差矩陣的特征值分解,利用特征值的大小,將協(xié)方差矩陣的特征子空間分為信號子空間和噪聲子空間兩部分,并將含噪聲語音投影到語音子空間中,以該投影作為語音信號的估計值。    語音增強的問題可以描述為從一被污染信號中,恢復出原始語音信號的過程。設(shè)語音幀長為M,則每一幀信號都可看成是一個M維的矢量。M維的矢量信號可張成維數(shù)為M的空間CM。&#

6、160;   假設(shè)語音信號位于K維子空間中,并且KM。原始純凈語音信號可以用以下的線性模型表示:    s=VX=K   i=1xivi       KM(1)V =v1,v2,vK是一個K×M的矩陣,它的秩是K,且各個矢量之間相互正交1;    X = x1,x2,xKT是一個M×1的矢量,是零均值的復隨機變量。    帶噪語音信號可寫成:    y=V&

7、#183;X+n(2)    y的協(xié)方差矩陣為:    Ry=E(yyH)=Rs+Rn=VRxVH+Rn(3)    其中Rs表示純凈語音信號s的協(xié)方差矩陣,Rx表示向量X的協(xié)方差矩陣,Rn為噪聲的協(xié)方差矩陣:     Rn=2nI (4)    通過KL展開2將含噪語音信號所張成的空間分解成信號子空間和噪聲子空間。先不考慮噪聲的存在,只考慮純凈語音的情況下,對信號s的協(xié)方差矩陣Rs進行特征值分解,可以得到:  &#

8、160; Rs=QQH=Q1Q2s1   00   0Q1HQ2H  (5)式中,s1=diag(s1,sk)是信號子空間的特征值,因為Rs是半正定陣,所以sk0 ,1kK 。因為語音信號在K維空間內(nèi),因此非零特征的個數(shù)為K。特征值向量矩陣Q分解為2個子矩陣Q1和Q2。Q1矩陣包含非零特征值所對應(yīng)的特征向量,定義這些特征向量為構(gòu)成信號子空間的基本向量;Q2包含的特征向量張成空間定義為噪聲子空間。1             線性估計子的濾

9、波矩陣表示為H,則語音信號的向量可由下式估計:s=H·y(6)則估計的語音值與真實的語音信號值的誤差由下式給出:e=s-s=(H-I)·s+H·n=es+en(7)這里es=(H-I)·s 表示語音信號的失真,en=H·n 表示殘余噪聲。    定義語音信號失真能量   e2s=tr(EeseHs)=tr((H-I)Rs(H-I)H) 和殘留噪聲能量   e2n=tr(EeneHn)=tr((H-I)Rn(H-I)H) ,Rs和Rn分別是純凈語音信號和噪聲信號的協(xié)方差矩陣。&

10、#160;   頻域約束估計子在把噪聲約束在一門限值下的同時,盡量減少語音信號的失真3。純凈語音的最優(yōu)估計矩陣可以通過求解下面的約束優(yōu)化問題得到:Hopt=argminH   e2s約束條件:1   M   e2n2 (8)    增強系統(tǒng)的輸出為:  sopt=U1GUH1y(9)其中  G=(1)s(1)s+2N I)-12  結(jié)果    圖1是噪聲為白噪聲、信噪比為0dB的一段帶噪語音用子空間法增強后的語音信號波形及語譜圖4。結(jié)果表明基于信號子空間分解的語音增強方法能夠有效的濾除背景寬帶噪聲。    本研究還給出背景為汽車噪聲的增強結(jié)果。圖2是背景為汽車噪聲和白噪聲信噪比分別在-10dB10dB的子空間增強結(jié)果的對比圖。    從圖2可以看出,對于白噪聲的增強后的信噪比要高于對汽車噪聲的增強結(jié)果。這是因為在對噪聲的估計中白噪聲的估計比有色噪聲的估計更接近于真實噪聲。3  討論    本研究中的增強方法盡管也利用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論