基于子空間語(yǔ)音增強(qiáng)方法的研究

上傳人：7*** IP屬地：湖北上傳時(shí)間：2022-03-05 格式：DOC 頁(yè)數(shù)：4 大?。?7KB 積分：15 舉報(bào) 版權(quán)申訴

全文預(yù)覽已結(jié)束

 下載本文檔

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、基于子空間語(yǔ)音增強(qiáng)方法的研究【摘要】目的：研究基于信號(hào)子空間的語(yǔ)音增強(qiáng)方法。方法：利用Cool Edit Pro2.0軟件錄制語(yǔ)音，加入各種噪聲，利用 Matlab軟件進(jìn)行分析、處理。結(jié)果：觀察語(yǔ)音信號(hào)波形圖和語(yǔ)譜圖，利用信號(hào)子空間的分解方法，可使信噪比大大增加。結(jié)論：基于子空間的語(yǔ)音增強(qiáng)方法在主觀聽(tīng)覺(jué)與客觀指標(biāo)上均得到了令人滿意的效果。【關(guān)鍵詞】子空間；語(yǔ)音增強(qiáng)；語(yǔ)譜圖Abstract Objective： To study speech enh

2、ancement method based on the signal sub-spaceMethods： Speeches to which various noises were added was recorded by Cool Edit Pro2.0，and analyzed and then dealt with by MatlabResults： The ratio of noise and signal can be improved a lot by reading speech waveform and speech spectrum and using the sub-s

3、pace decompositionConclusion： The method of speech enhancement based on signal sub-space has achieved satisfying effects in both subjective hearing and objective quota Key words sub-space enhancement；speech enhancement；speech spectrum 語(yǔ)音識(shí)別研究已經(jīng)取得重大，但距離機(jī)

4、器與人自由交流的目標(biāo)還相當(dāng)遙遠(yuǎn)。目前的識(shí)別系統(tǒng)大都是局限在安靜環(huán)境中使用的，在噪聲環(huán)境中，尤其是強(qiáng)噪聲環(huán)境，語(yǔ)音識(shí)別系統(tǒng)的識(shí)別性能將受到嚴(yán)重影響。如何提高強(qiáng)噪聲環(huán)境下語(yǔ)音識(shí)別的準(zhǔn)確率是當(dāng)前語(yǔ)音識(shí)別的難題之一。從帶噪語(yǔ)音信號(hào)中提取盡可能純凈的原始語(yǔ)音的過(guò)程稱為語(yǔ)音增強(qiáng)。污染語(yǔ)音的噪聲包括窄帶噪聲和寬帶噪聲兩類。對(duì)于低頻干擾、串音等窄帶噪聲，一般用線性濾波器便可有效抑制，而寬帶噪聲無(wú)論從時(shí)域還是從頻域看均與語(yǔ)音信號(hào)重疊在一起，傳統(tǒng)的線性濾波無(wú)能為力。消除噪聲的難點(diǎn)在于寬帶噪聲的消除。1 材料和方法1.1 材料在實(shí)驗(yàn)室環(huán)境下利

5、用Cool Edit Pro2.0軟件錄制一段語(yǔ)音，再利用matlab軟件生成一段白噪聲，合成不同信噪比（-10dB10dB）的帶噪語(yǔ)音。1.2 方法子空間語(yǔ)音增強(qiáng)算法主要是利用數(shù)據(jù)協(xié)方差矩陣的特征值分解，利用特征值的大小，將協(xié)方差矩陣的特征子空間分為信號(hào)子空間和噪聲子空間兩部分，并將含噪聲語(yǔ)音投影到語(yǔ)音子空間中，以該投影作為語(yǔ)音信號(hào)的估計(jì)值。語(yǔ)音增強(qiáng)的問(wèn)題可以描述為從一被污染信號(hào)中，恢復(fù)出原始語(yǔ)音信號(hào)的過(guò)程。設(shè)語(yǔ)音幀長(zhǎng)為M，則每一幀信號(hào)都可看成是一個(gè)M維的矢量。M維的矢量信號(hào)可張成維數(shù)為M的空間CM。&#

6、160; 假設(shè)語(yǔ)音信號(hào)位于K維子空間中，并且KM。原始純凈語(yǔ)音信號(hào)可以用以下的線性模型表示： s=VX=K i=1xivi KM（1）V =v1，v2，vK是一個(gè)K×M的矩陣，它的秩是K,且各個(gè)矢量之間相互正交1； X = x1，x2，xKT是一個(gè)M×1的矢量,是零均值的復(fù)隨機(jī)變量。帶噪語(yǔ)音信號(hào)可寫(xiě)成： y=V&

7、#183;X+n（2） y的協(xié)方差矩陣為： Ry=E(yyH)=Rs+Rn=VRxVH+Rn（3）其中Rs表示純凈語(yǔ)音信號(hào)s的協(xié)方差矩陣，Rx表示向量X的協(xié)方差矩陣，Rn為噪聲的協(xié)方差矩陣: Rn=2nI （4）通過(guò)KL展開(kāi)2將含噪語(yǔ)音信號(hào)所張成的空間分解成信號(hào)子空間和噪聲子空間。先不考慮噪聲的存在，只考慮純凈語(yǔ)音的情況下，對(duì)信號(hào)s的協(xié)方差矩陣Rs進(jìn)行特征值分解，可以得到： &#

8、160; Rs=QQH=Q1Q2s1 00 0Q1HQ2H (5)式中，s1=diag(s1,sk)是信號(hào)子空間的特征值，因?yàn)镽s是半正定陣，所以sk0 ，1kK 。因?yàn)檎Z(yǔ)音信號(hào)在K維空間內(nèi)，因此非零特征的個(gè)數(shù)為K。特征值向量矩陣Q分解為2個(gè)子矩陣Q1和Q2。Q1矩陣包含非零特征值所對(duì)應(yīng)的特征向量，定義這些特征向量為構(gòu)成信號(hào)子空間的基本向量；Q2包含的特征向量張成空間定義為噪聲子空間。1 線性估計(jì)子的濾

9、波矩陣表示為H，則語(yǔ)音信號(hào)的向量可由下式估計(jì):s=H·y(6)則估計(jì)的語(yǔ)音值與真實(shí)的語(yǔ)音信號(hào)值的誤差由下式給出：e=s-s=(H-I)·s+H·n=es+en(7)這里es=(H-I)·s 表示語(yǔ)音信號(hào)的失真，en=H·n 表示殘余噪聲。定義語(yǔ)音信號(hào)失真能量 e2s=tr(EeseHs)=tr（(H-I)Rs(H-I)H) 和殘留噪聲能量 e2n=tr(EeneHn)=tr（(H-I)Rn(H-I)H) ，Rs和Rn分別是純凈語(yǔ)音信號(hào)和噪聲信號(hào)的協(xié)方差矩陣。&

10、#160; 頻域約束估計(jì)子在把噪聲約束在一門限值下的同時(shí)，盡量減少語(yǔ)音信號(hào)的失真3。純凈語(yǔ)音的最優(yōu)估計(jì)矩陣可以通過(guò)求解下面的約束優(yōu)化問(wèn)題得到：Hopt=argminH e2s約束條件：1 M e2n2 （8）增強(qiáng)系統(tǒng)的輸出為： sopt=U1GUH1y（9）其中 G=(1)s(1)s+2N I)-12 結(jié)果圖1是噪聲為白噪聲、信噪比為0dB的一段帶噪語(yǔ)音用子空間法增強(qiáng)后的語(yǔ)音信號(hào)波形及語(yǔ)譜圖4。結(jié)果表明基于信號(hào)子空間分解的語(yǔ)音增強(qiáng)方法能夠有效的濾除背景寬帶噪聲。本研究還給出背景為汽車噪聲的增強(qiáng)結(jié)果。圖2是背景為汽車噪聲和白噪聲信噪比分別在-10dB10dB的子空間增強(qiáng)結(jié)果的對(duì)比圖。從圖2可以看出，對(duì)于白噪聲的增強(qiáng)后的信噪比要高于對(duì)汽車噪聲的增強(qiáng)結(jié)果。這是因?yàn)樵趯?duì)噪聲的估計(jì)中白噪聲的估計(jì)比有色噪聲的估計(jì)更接近于真實(shí)噪聲。3 討論本研究中的增強(qiáng)方法盡管也利用

人人文庫(kù)> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

基于子空間語(yǔ)音增強(qiáng)方法的研究

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

基于子空間語(yǔ)音增強(qiáng)方法的研究

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔