基本語(yǔ)音增強(qiáng)方法_第1頁(yè)
基本語(yǔ)音增強(qiáng)方法_第2頁(yè)
基本語(yǔ)音增強(qiáng)方法_第3頁(yè)
基本語(yǔ)音增強(qiáng)方法_第4頁(yè)
基本語(yǔ)音增強(qiáng)方法_第5頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

基本語(yǔ)音增強(qiáng)方法概述匹

1=1摘要:語(yǔ)音增強(qiáng)是當(dāng)今語(yǔ)音處理的一個(gè)非常重要的領(lǐng)域,本文主要介紹當(dāng)今比較普遍的幾種基于人耳掩蔽閾值的語(yǔ)音增強(qiáng)方法:譜減法,維納濾波法,子空間方法等,并對(duì)它們的優(yōu)缺點(diǎn)作簡(jiǎn)要論述。關(guān)鍵詞:語(yǔ)音增強(qiáng)、人耳掩蔽、譜減法、維納濾波、子空間現(xiàn)今時(shí)代的主流步伐將我們帶向自動(dòng)化方向,語(yǔ)音識(shí)別在這一背景下顯得尤為重要。目前已經(jīng)開(kāi)發(fā)出好幾款語(yǔ)音識(shí)別軟件,但是如何較為精確地實(shí)現(xiàn)人耳的掩蔽效應(yīng)下的語(yǔ)音增強(qiáng),仍是大家著重解決的問(wèn)題。它的首要目標(biāo)就是在接收端盡可能從帶噪語(yǔ)音信號(hào)中提取純凈的語(yǔ)音信號(hào),改善其質(zhì)量。目前已經(jīng)出現(xiàn)了譜減法等一系列較為普遍的方法。本文將對(duì)這幾種方法進(jìn)行簡(jiǎn)要介紹。一、 語(yǔ)音的特性語(yǔ)音信號(hào)是一種非平穩(wěn)、時(shí)變的隨機(jī)過(guò)程,其產(chǎn)生過(guò)程與發(fā)聲器官的運(yùn)動(dòng)緊密相關(guān)。而發(fā)聲器官的狀態(tài)變化速度比聲音振動(dòng)的速度要緩慢得多,因此語(yǔ)音信號(hào)可以認(rèn)為是短時(shí)平穩(wěn)的。在一段短時(shí)間內(nèi)其特性基本保持不變即相對(duì)穩(wěn)定,從而可以應(yīng)用平穩(wěn)隨機(jī)過(guò)程的分析方法來(lái)處理語(yǔ)音信號(hào),并可以在語(yǔ)音增強(qiáng)中利用短時(shí)頻譜的平穩(wěn)特性。人耳在嘈雜的環(huán)境中,仍然能夠清晰地聽(tīng)到自己想聽(tīng)的內(nèi)容,一個(gè)較弱的聲音(被掩蔽音)的聽(tīng)覺(jué)感受被另一個(gè)較強(qiáng)的聲音(掩蔽音)影響的現(xiàn)象稱(chēng)為人耳的“掩蔽效應(yīng)”。被掩蔽音單獨(dú)存在時(shí)的聽(tīng)閾分貝值,或者說(shuō)在安靜環(huán)境中能被人耳聽(tīng)到的純音的最小值稱(chēng)為絕對(duì)聞閾。在進(jìn)行機(jī)器語(yǔ)音識(shí)別的時(shí)候,由于干擾信號(hào)和目標(biāo)信號(hào)的強(qiáng)度差別不大,導(dǎo)致機(jī)器無(wú)法識(shí)別。這時(shí)語(yǔ)音增強(qiáng)就顯得特別重要了。二、 時(shí)域方法此類(lèi)方法主要依賴(lài)于語(yǔ)音生成模型(例如AR模型)的使用,需要提取模型參數(shù)(如基音周期、LPC系數(shù)等),經(jīng)常使用迭代方法。這種方法的最大缺點(diǎn)就是如果實(shí)際噪聲或語(yǔ)音與模型有較大的差別,或者由于某些原因使得提取語(yǔ)音參數(shù)較困難,則這方法較容易失敗。這類(lèi)方法常用到一些濾波器,如梳狀濾波器、維納濾波器、卡爾曼濾波器等。(1)經(jīng)典的維納濾波法是根據(jù)Winer-Hopf積分方程求出純語(yǔ)音和混合音的傳遞函數(shù)來(lái)實(shí)現(xiàn)語(yǔ)音增強(qiáng)目的的。經(jīng)典的算法常常只通過(guò)計(jì)算無(wú)聲期間的統(tǒng)計(jì)平均來(lái)估計(jì)噪聲功率譜,這是假設(shè)噪聲的功率譜在發(fā)聲前和發(fā)聲期間基本沒(méi)有變化前提下的,這樣的估計(jì)和假設(shè)顯然是不夠全面的。另外,經(jīng)典的算法能有效地抑制變化范圍不大或是穩(wěn)定的噪聲,但是對(duì)實(shí)際中的變化范圍很廣的噪聲效果不是很好。當(dāng)然,也有很多改進(jìn)的維納濾波法,比如:計(jì)算無(wú)聲段的統(tǒng)計(jì)平均得到初始噪聲功率譜功率譜、計(jì)算語(yǔ)音段間帶噪語(yǔ)音功率譜,并平滑處理初始噪聲功率譜和帶噪語(yǔ)音功率譜,更新噪聲功率譜。也可以將維納濾波擴(kuò)展為卡爾曼濾波,適用于非平穩(wěn)過(guò)程。子空間增強(qiáng)算法是將語(yǔ)音信號(hào)看成K維向量空間,并將帶噪信號(hào)分解為不相關(guān)的信號(hào)空間和噪聲空間,以此消除噪聲。這種方法主要利用基于特征值分解的KL變換對(duì)語(yǔ)音信號(hào)進(jìn)行分解,通過(guò)對(duì)信號(hào)失真誤差和殘留噪聲兩種判別函數(shù)的控制以平衡語(yǔ)音質(zhì)量和可懂度。也可以將子空間增強(qiáng)算法與人耳的掩蔽閾值結(jié)合,基于掩蔽特性的子空間增強(qiáng)算法在主客觀上作了良好的折衷,去噪效果明顯,且語(yǔ)音出現(xiàn)的同時(shí)保留了一定的平滑背景噪聲而非突兀噪聲,主觀感覺(jué)較舒適。三、頻域方法這類(lèi)方法的重點(diǎn)是將估計(jì)的對(duì)象放在語(yǔ)音信號(hào)的短時(shí)譜幅度上。非參數(shù)方法主要包括譜減法、自適應(yīng)濾波法等。(1)譜減法(SS:SpectralSubtraction)是在假定加性噪聲與短時(shí)平穩(wěn)的語(yǔ)音信號(hào)相互獨(dú)立的條件下,從帶噪語(yǔ)音的功率譜中減去噪聲功率譜,從而得到較為純凈的語(yǔ)音頻譜。設(shè)s(t)為純凈語(yǔ)音信號(hào),n(t)為噪聲信號(hào),y(t)為帶噪語(yǔ)音信號(hào),則有:y(t)=s(t)+n(t)傅里葉變換后可得功率譜密度,假定語(yǔ)音信號(hào)與加性噪聲是相互獨(dú)立的,則可以由發(fā)聲前只有噪聲時(shí)的功率譜得出語(yǔ)音的功率譜,而最后IFFT變換中需要借助相位譜來(lái)恢復(fù)降噪后的語(yǔ)音時(shí)域信號(hào)。由于人耳對(duì)于相位變化不敏感,且EphraimY和MalahD證明在一定條件下語(yǔ)音相位的最小均方誤差(MMSE)估計(jì)值就是帶噪語(yǔ)音相位本身,因此,基于STSA估計(jì)的語(yǔ)音增強(qiáng)方法一般都直接采用帶噪語(yǔ)音的相位作為增強(qiáng)語(yǔ)音的相位。但是,語(yǔ)音和噪聲的非平穩(wěn)性會(huì)造成譜估計(jì)的不完全準(zhǔn)確,所產(chǎn)生的音樂(lè)噪聲嚴(yán)重影響了語(yǔ)音的可懂度,如在進(jìn)行譜減時(shí),若該幀某頻點(diǎn)噪聲分量較大,就會(huì)有很大一部分噪聲殘留,在頻譜上呈現(xiàn)隨機(jī)的尖峰,在聽(tīng)覺(jué)上形成有節(jié)奏性起伏的類(lèi)似音樂(lè)的殘留噪聲,俗稱(chēng)為音樂(lè)噪聲。大多語(yǔ)音增強(qiáng)算法在追求減小噪聲的同時(shí),也導(dǎo)致較嚴(yán)重的語(yǔ)音畸變度,盡管噪聲去除的效果很有效,但語(yǔ)音畸變度很大。采用平滑系數(shù)來(lái)改進(jìn)譜減法的做法十分普遍。先驗(yàn)信噪比估計(jì)中平滑系數(shù)和噪聲譜估計(jì)中平滑系數(shù)較小時(shí),語(yǔ)音畸變和噪聲殘留都較少,但殘留的音樂(lè)噪聲顯著;反之,語(yǔ)音畸變和噪聲殘留較多,但殘留的音樂(lè)噪聲較少。所以,對(duì)于純?cè)肼晭蛶г胝Z(yǔ)音幀的平滑系數(shù)取值應(yīng)該是不一樣的,同濟(jì)大學(xué)研究出來(lái)的SAP參數(shù),則是根據(jù)人耳掩蔽效應(yīng)將帶噪語(yǔ)音狀態(tài)繼續(xù)分化為噪聲被掩蔽的狀態(tài)和噪聲未被掩蔽的狀態(tài)來(lái)改進(jìn)SAP參數(shù),再利用改進(jìn)的SAP參數(shù)自適應(yīng)調(diào)節(jié)語(yǔ)音平滑系數(shù)。這樣更符合語(yǔ)音和噪聲的特性,可以在去噪度、殘留“音樂(lè)噪聲”和語(yǔ)音畸變度之間取得很好的均衡。(2)自適應(yīng)抵消法自適應(yīng)抵銷(xiāo)法以噪聲干擾為處理對(duì)象,將其抑制掉或進(jìn)行非常大的衰減,以提高信號(hào)傳遞和接受的信噪比質(zhì)量。利用由自適應(yīng)濾波器所構(gòu)成的自適應(yīng)噪聲干抵消系統(tǒng),可以獲得自動(dòng)跟蹤捕捉噪聲干擾源和高信噪比的優(yōu)異性能。但是需要一個(gè)在實(shí)際環(huán)境中很難獲得的參考噪聲源,且伴隨一定的音樂(lè)噪聲,實(shí)際中并不很實(shí)用。F1造牌咤用觸消暮自適應(yīng)噪聲對(duì)消原理(3)隱馬爾可夫模型法可以采用基于狀態(tài)空間的變換方法,對(duì)不同類(lèi)別的語(yǔ)音和噪聲信號(hào)建立不同的模型。HMM的各個(gè)狀態(tài)可以對(duì)帶噪信號(hào)、噪聲信號(hào)所有不同的區(qū)域進(jìn)行充分的建模,將帶噪信號(hào)中的噪聲信號(hào)部分去除就可得到語(yǔ)音的增強(qiáng),甚至于在只有帶噪信號(hào)的情況下,利用HMM對(duì)狀態(tài)轉(zhuǎn)移概率進(jìn)行建模,將可能為噪聲的信號(hào)部分濾除就可以做到語(yǔ)音增強(qiáng)。短時(shí)幅度譜估計(jì)法基于短時(shí)幅度譜估計(jì)的語(yǔ)音增強(qiáng)算法中,采用了最小均方誤差準(zhǔn)則或者最大似然準(zhǔn)則估計(jì)原始語(yǔ)音信號(hào)的幅度譜,使得語(yǔ)音信號(hào)的時(shí)域波形或者頻譜在某種準(zhǔn)則下失真最小。四、 統(tǒng)計(jì)方法統(tǒng)計(jì)法較充分地利用了語(yǔ)音和噪聲的統(tǒng)計(jì)特性,一般要建立模型庫(kù),通過(guò)訓(xùn)練過(guò)程獲得初始統(tǒng)計(jì)參數(shù),并且在后續(xù)的工作過(guò)程中要根據(jù)實(shí)際的數(shù)據(jù)實(shí)時(shí)的更新這些統(tǒng)計(jì)參數(shù),以使模型能更好的符合實(shí)際情況。這類(lèi)方法里面主要包括最小均方誤差估計(jì)(MMSE,MinimumMeanSquareError)、對(duì)數(shù)譜估計(jì)的最小均方誤差(MMSE-LSA,MinimumMean-SquareErrorLog-SpectralAmplitude)、聽(tīng)覺(jué)掩蔽效應(yīng)(MaskingEffect)等五、 其他方法(1)小波變換小波變換在時(shí)域和頻域同時(shí)具有良好的局部化特性,信號(hào)和噪聲的小波系數(shù)在不同尺度上有不同的性質(zhì),所以,我們可以構(gòu)造相應(yīng)的規(guī)則,減小由噪聲產(chǎn)生的系數(shù),同時(shí)最大限度地保留真實(shí)信號(hào)的系數(shù),最后經(jīng)過(guò)小波系數(shù)重構(gòu),得到真實(shí)的信號(hào)。這幾種語(yǔ)音增強(qiáng)算法并不是獨(dú)立的,它們可以互相融合,取長(zhǎng)補(bǔ)短,但是目前為止還沒(méi)有找到一種可以與人耳的靈敏度想媲美的、舒適的語(yǔ)音識(shí)別方法。參考文獻(xiàn):1、 《改進(jìn)的基于人耳掩蔽效應(yīng)譜減語(yǔ)音增強(qiáng)算法》趙曉群,黃小珊2、 《基于人耳掩蔽效應(yīng)的語(yǔ)音增強(qiáng)算法研究》 陳國(guó)明,鄒采榮3、 《基于人耳掩蔽效應(yīng)的子空間語(yǔ)音增強(qiáng)算法實(shí)現(xiàn)》 夏菽蘭,章明,趙力4、《一種基于短時(shí)譜估計(jì)和

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論