基于語音增強(qiáng)的噪聲功率譜改進(jìn)算法

上傳人：1*** IP屬地：廣東上傳時間：2023-11-27 格式：DOCX 頁數(shù)：4 大?。?9.38KB 積分：12 舉報 版權(quán)申訴

全文預(yù)覽已結(jié)束

 下載本文檔

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

基于語音增強(qiáng)的噪聲功率譜改進(jìn)算法

1不同增強(qiáng)方法的對比隨著計算機(jī)通信技術(shù)的快速發(fā)展，語音處理技術(shù)的重要性日益突出。它已廣泛應(yīng)用于網(wǎng)絡(luò)、通信、智能設(shè)備和工業(yè)控制領(lǐng)域，是現(xiàn)代工業(yè)發(fā)展的必要基礎(chǔ)技術(shù)?；谡Z音短時譜估計的方法具有適用信噪比范圍大、方法簡單、易于實時處理等優(yōu)點,盡管研究比較早,但仍有很強(qiáng)的生命力,已成為應(yīng)用最廣泛的語音增強(qiáng)方法。基于語音短時譜估計的增強(qiáng)方法種類繁多,如譜減法、維納濾波法、最小均方誤差法等。傳統(tǒng)的基于語音短時譜估計的方法均不同程度存在著殘留噪聲大的問題。Ephriam和Malah提出的方法可以有效地抑制殘留噪聲。OlivierCappé在文獻(xiàn)中分析了上述方法能有效抑制殘留噪聲,是因為在計算增益函數(shù)時引入了先驗信噪比,并采用了“直接判決”法對先驗信噪比進(jìn)行估計。Scalart和IsraelCohen對Ephriam和Malah提出的方法進(jìn)行了改進(jìn)。在上述方法中,需要估計當(dāng)前幀的噪聲功率譜,常常只通過計算無聲期間的統(tǒng)計平均來估計噪聲。但是僅僅依靠無聲段來估計噪聲,這樣的估計過程顯然是不夠全面的。另外,雖然上述的方法能有效地抑制變化范圍不大或是穩(wěn)定的噪聲,但是對實際中的變化范圍很廣的噪聲效果不是很理想。首先描述了維納濾波語音增強(qiáng)算法的基本思想,然后對先驗信噪比和后驗信噪比的計算進(jìn)行了簡單推導(dǎo),最后提出了一種改進(jìn)的算法。通過計算機(jī)仿真實驗,將提出的算法與最常見的譜減法進(jìn)行了比較。實驗結(jié)果表明該改進(jìn)算法有效地提高了增強(qiáng)效果,更好的抑制了噪聲,提高了語音質(zhì)量。2噪聲信號的估計先驗信噪比是語音增強(qiáng)算法中非常重要的參數(shù)。通過Ephraim和Malah提出的“直接判決”估計來計算先驗信噪比的方法是最有效的和最容易計算的。對于第k幀帶噪語音信號:其中sk(t)為第k幀純凈語音信號,nk(t)為第k幀加性噪聲信號,假設(shè)sk(t)和nk(t)都是短時平穩(wěn)隨機(jī)信號,且二者互不相關(guān)。對上式進(jìn)行傅里葉變換,得到:根據(jù)文獻(xiàn),得到對純凈語音信號頻譜的估計:式中Yk(ω)和分別表示第k幀帶噪語音和純凈語音傅里葉變換的估計,G(ξk，γk)表示譜增益函數(shù),其中ξk，γk分別表示先驗信噪比和后驗信噪比。的相位譜用的相位譜來近似代替,最后由反傅里葉變換得到降噪以后的語音信號的時域表示:由此,可以看出,在維納濾波算法中,關(guān)鍵是對G(ξ，γ)的求解。基于最小均方誤差的判別方法,維納濾波的譜增益函數(shù)為:根據(jù)“直接判決”的方法計算先驗信噪比和后驗信噪比:式中為第k-1幀純凈語音信號的功率譜估計,|Yk(ω)|2為第k幀帶噪語音信號的功率譜,為對第k幀的噪聲功率譜估計。3改進(jìn)的噪聲功率譜在基于先驗信噪比估計的維納濾波語音增強(qiáng)算法中,需要估計當(dāng)前幀的噪聲功率譜,經(jīng)典的算法常常只通過計算無聲期間的統(tǒng)計平均來估計噪聲功率譜,這是假設(shè)噪聲的功率譜在發(fā)聲前和發(fā)聲期間基本沒有變化前提下的,這樣的估計和假設(shè)顯然是不夠全面的。另外,經(jīng)典的算法能有效地抑制變化范圍不大或是穩(wěn)定的噪聲,但是對實際中的變化范圍很廣的噪聲效果不是很好。為了解決上述問題,在基于先驗信噪比估計的維納濾波算法基礎(chǔ)上,提出了一種改進(jìn)的算法。本算法對傳統(tǒng)的估計噪聲功率譜的方法做出了改進(jìn),首先在計算無聲段信號統(tǒng)計平均得到初始噪聲功率譜的基礎(chǔ)上,通過平滑處理初始噪聲功率譜和帶噪語音功率譜得到新的噪聲功率譜,彌補(bǔ)了經(jīng)典算法中僅依靠無聲段估計噪聲功率譜的不足。其次,通過計算帶噪語音功率譜與噪聲功率譜的比值,更新噪聲功率譜,一定程度上改善了經(jīng)典算法僅適用于穩(wěn)定或變化不大的噪聲的不足。首先,對帶噪語音進(jìn)行端點檢測確定語音起始幀,并通過無聲期間統(tǒng)計平均的噪聲方差作為噪聲功率譜的初值。式中表示噪聲功率譜的初值,S表示第S幀為語音起始幀,L表示幀長。其次,從起始幀開始,判斷當(dāng)前幀為語音信號還是噪聲信號,更新對噪聲功率譜的估計,以便通過式(6)計算先驗信噪比和后驗信噪比。若是噪聲信號,則通過對與當(dāng)前幀的功率譜做平滑處理,更新對噪聲功率譜的估計。其中|Nk(ω)|2new表示通過平滑處理后對當(dāng)前幀的噪聲功率譜估計。β為噪聲平滑因子。|Yk|2為第k幀帶噪語音信號的功率譜。如果是語音信號,通過計算各個頻率點帶噪語音功率譜與噪聲功率譜的比值再次調(diào)整噪聲功率譜,依次處理當(dāng)前幀的每個點,更新對噪聲功率譜的估計:上式中的|Nki(ω)|2,|Yki(ω)|2分別表示第k幀第i個頻率點的噪聲譜功率譜和帶噪語音信號的功率譜。通過這樣的調(diào)整,在一定程度上濾除了變化較大的噪聲。依據(jù)改進(jìn)的算法,具體的實施步驟為:(1)對分幀后的信號進(jìn)行端點檢測,得到語音信號的起止點NIS;通過無聲期間統(tǒng)計平均的噪聲方差來估計噪聲的功率譜;(2)從語音信號起始幀NIS開始,判斷當(dāng)前幀為語音信號還是噪聲信號。若是噪聲信號,通過式(8)對與當(dāng)前幀的功率譜做平滑處理,更新對噪聲功率譜的估計|Nk(ω)|2new;若是語音信號,進(jìn)行下一步計算;(4)根據(jù)式(6)計算當(dāng)前幀的先驗信噪比SNRprio和后驗信噪比SNRpost;(5)根據(jù)式(5)得到當(dāng)前幀的G(ξk，γk);(7)對進(jìn)行IDFT變換,并取其實部作為濾波后的語音信號;(8)通過對濾波后的語音信號進(jìn)行連續(xù)幀之間的重疊相加,得到重構(gòu)的純凈語音信號。4信噪比lr對輸出語音質(zhì)量的評價采用客觀評價結(jié)合主觀評價的方法?？陀^評價方法中,信噪比和分幀信噪比都屬于時域客觀測度,這類測度僅適用于波形編碼系統(tǒng)。因此,本文采用的客觀評價方法為坂倉距離(Itakura-SaitoDistortion,ISD)測度和LLR。主觀評價采用平均意見得分(MeanOpinionScore,MOS)法。4.1語音失真實驗實驗中首先使用NTT語音庫中的語音樣本進(jìn)行客觀評價實驗,比較了加噪語音,通過譜減法增強(qiáng)后的語音,通過MMSE法增強(qiáng)后的語音和通過本文提出的算法增強(qiáng)后的語音與純凈語音的坂倉距離和對數(shù)似然比測度(Log-LikelihoodRatio,LLR)。實驗結(jié)果見表1和表2。語音失真越小,坂倉距離和對數(shù)似然比測度的數(shù)值越小。從表1和表2的幾種算法增強(qiáng)后語音對比中可以看出:傳統(tǒng)的語音增強(qiáng)方法與本文提出的算法都能有效抑制殘留噪聲。但是與傳統(tǒng)方法相比,本文提出的方法效果更加明顯,語音失真也較小。4.2語音信號的平均意見得分為了確定客觀性能評估,進(jìn)行了主觀評價。語音信號為數(shù)字0~9以及實驗室普通話四川方言語音庫中的6個句子,分別經(jīng)過加噪、譜減法增強(qiáng)、MMSE法增強(qiáng)和本文提出的算法增強(qiáng)。在MOS測試中選用20位試聽者,要求試聽者根據(jù)自己的認(rèn)可度從1~5給出每種測試語音的印象得分,從而得到4種語音信號的平均意見得分。實驗結(jié)果如表3所示。由于殘留的“音樂噪聲”對主觀測聽影響較大,殘留噪聲越大,MOS得分越低。從表3所示的MOS測試結(jié)果中可以看出,相對與傳統(tǒng)的譜減法和MMSE法,本文算法的MOS有了較大提高。5帶噪語音的matlab仿真實驗本文首先介紹了基于先驗信噪比估計的維納濾波語音增強(qiáng)方法,并在此基礎(chǔ)上提出了一種改進(jìn)的算法。該算法首先通過計算無聲段的統(tǒng)計平均得到初始噪聲功率譜;其次,計算語音段間帶噪語音功率譜,并平滑處理初始噪聲功率譜和帶噪語音功率譜,更新了噪聲功率譜;最后,考慮了某頻率點處噪聲急劇增大的情況,通過計算帶噪語音功率譜與噪聲功率譜的比值,自適應(yīng)地調(diào)整噪聲功率譜,彌補(bǔ)了經(jīng)典算法中僅依靠無聲段估計噪聲功率譜的不足,并在一定程度上改善了經(jīng)典算法僅適用于穩(wěn)定或變化不大的噪聲的不足。在仿真實驗中,采用客觀評價結(jié)合主觀評價的方法對算法性能加以了驗證。實驗結(jié)果表明,該算法能有效地減少語音畸變,提高語音可懂度。(3)通過式(9)依次更新當(dāng)前

人人文庫> 全部分類> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

基于語音增強(qiáng)的噪聲功率譜改進(jìn)算法

文檔簡介

溫馨提示

最新文檔

評論

基于語音增強(qiáng)的噪聲功率譜改進(jìn)算法

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔