基于自適應(yīng)語音增強的算法研究DOC

上傳人：s*** IP屬地：天津上傳時間：2022-01-22 格式：DOCX 頁數(shù)：28 大?。?03.51KB 積分：25 舉報 版權(quán)申訴

已閱讀5頁，還剩23頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、OVtnLUIQjC)CocH姓名學(xué)號班級院系題目a尤德軍20121003482 075124機電學(xué)院基干自適應(yīng)語音信號增強算法研究一、主要參考書及參考資料1 Sambur M . Adaptive noise cancelling for speech signalS IEEE Transactions onAcoustics， Speech and Signal Processing 1978，26(5): 419 432 B Widrow，S D Stearns千永德、龍憲惠譯，自適應(yīng)信號處理，成都四川大學(xué)出版社，1989.3 T w Parsons文成義、常國岑、王化周等譯，語

2、音處理，北京國防工業(yè)出版社，1990.4 姚天任，數(shù)字語音處理，武漢華中科技大學(xué)出版社，1992.鄒國良，自適應(yīng)濾波理論及應(yīng)用M，河北大學(xué)出版社，1997.6胡廣傳，數(shù)字信號處理理論、算法與實現(xiàn)，北京清華大學(xué)出版社，1997.7葛良、陶智，基于自適應(yīng)濾波的語音增強算法.江蘇：蘇州大學(xué)學(xué)報，2002.8何振亞，自適應(yīng)信號處理M，北京科學(xué)出版社，2002.IIL.、八刖言第一章緒論1.1語音增強的應(yīng)用背景1.2語音增強的研究歷史1.3本課題的研究內(nèi)容.摘要語音增強的基礎(chǔ)知識第二章，錯誤！未定義書簽。錯誤！未定義書簽。，錯誤！未定義書簽。.錯誤！未定義書簽。2.1語音和人耳的感知特性2.2噪聲特性2

3、.2.1噪聲的種類、度量2.2.2噪聲的測量和評價2.3語音增強的方法2.3.1線性濾波法2.3.2梳狀濾波法2.3.3自相關(guān)法2.3.4卡爾曼濾波法IVI.VVIV.IV.IIIX.X.X.XJ235自適應(yīng)噪聲抵消法XJI第三章自適應(yīng)濾波器基本概念XII3.1自適應(yīng)濾波XJI3.2自適應(yīng)濾波器的組成X.III3.3基本自適應(yīng)濾波器的模塊結(jié)構(gòu)XIV第四章基于自適應(yīng)濾波器的語音增強X IV4.1基本維納濾波器X.V4.2最陡下降法XVII4.3RLS算法XVII4.4LMS算法XVIII4.5基于自適應(yīng)濾波器的噪聲抵消法4.5.1自適應(yīng)噪聲抵消法的原理4.5.2自適應(yīng)噪聲抵消法的應(yīng)用.XXI第五

4、章MATLAB仿真實現(xiàn)錯誤！未定義書簽。5. 1 MATLAB仿真軟件介紹.錯誤！未定義書簽。5.1.1 MATLAB的發(fā)展歷程及應(yīng)用錯誤！未定義書簽。5.1.2 MATLAB的特點及優(yōu)勢，錯誤！未定義書簽。，錯誤！未定義書簽。.錯誤！未定義書簽。5.2 MATLAB仿真結(jié)果分析5.3小結(jié)人們在語音通信過程中不可避免的會受到來自周圍環(huán)境和傳輸媒介引入的噪聲、通信設(shè)備內(nèi)部電噪聲、乃至其他講話者的干擾。這些干擾使接收者收到的語音為受噪聲污染的帶噪語音信號。語音增強的一個主要目的就是從帶噪語音信號中提取盡可能純凈的原始語音。目前應(yīng)用的語音增強方法大體上分為：諧波增強法、基于參數(shù)估計的語音再

5、合成法和基于自適應(yīng)的噪聲抵消法。自適應(yīng)濾波器實際是一種能夠自動調(diào)節(jié)本身參數(shù)的特殊維納濾波器，在設(shè)計時不需要事先知道關(guān)于輸入信號和噪聲的統(tǒng)計特性，它能夠在自己的工作過程中逐漸“了解”或估計出所需要的統(tǒng)計特性，并自動調(diào)整自己的參數(shù)，以達(dá)到最佳濾波效果。而基于自適應(yīng)濾波器的自適應(yīng)噪聲抵消法對含噪語音的增強效果最好。因為這種方法比其他方法多用了一個參考噪聲作為輔助輸入，從而獲得了比較全面的關(guān)于噪聲的信息，從而能得到更好的降噪效果。關(guān)鍵詞：語音增強，噪聲，自適應(yīng)濾波器，自適應(yīng)噪聲抵消法第一章緒論1.語音增強的應(yīng)用背景語音增強技術(shù)是指當(dāng)語音信號被各種各樣的噪聲（包括語音）干擾、甚至淹沒28降低噪聲干

6、擾的技術(shù)。語或者對語音信號處理技術(shù)本后，從噪聲背景中提取、增強有用的語音信號，抑制、音增強技術(shù)無論在日常生活中，還是在其它的領(lǐng)域, 身來說都很有應(yīng)用價值。在日常生活中，我們經(jīng)常會遇到在噪聲干擾下進(jìn)行語音通信的問題。如：使用設(shè)置在嘈雜的馬路旁或市場內(nèi)的公用電話，或在奔馳的汽車、火車?yán)锸褂靡苿?電話時，旁人的喧鬧聲、汽車和火車的轟鳴聲等背景噪聲都會干擾語音通訊的質(zhì) 量。對受話人來說，收聽夾雜著各種干擾噪聲的語音，至少會引起聽覺疲勞，嚴(yán) 重一點就會錯誤地識別或根本無法聽清對方的語音。對電話來說，干擾主要來自電話信道的回波干擾。再有一類需要用到語音增強技術(shù)的方面就是處理舊的錄音磁帶。由于早年錄音

7、技術(shù)不完善，磁帶質(zhì)量不高, 加上長久存放，使磁帶發(fā)生霉變、機械損傷、磁粉脫落、磁化等問題，使得重放語音產(chǎn)生噪聲。對于那些極具研究或收藏價值的寶貴錄音資料來說，語音增強技術(shù)是一個較好的恢復(fù)手段。在通信過程中，語音質(zhì)量的好壞顯得格外重要。如語音質(zhì)量很差，接收方難以聽清對方的語音信息，輕者可能延誤時間、貽誤時機，重者可能錯誤地識別對方的語音，因而錯誤地下達(dá)或執(zhí)行命令，導(dǎo)致對工作造成不可估量的損失。因此, 隨著現(xiàn)代科學(xué)的蓬勃發(fā)展，人類社會愈來愈顯示出信息社會的特點。通信或信息交換已成為人類社會存在的必要條件，正如衣食住行對人類是必要的一樣。語音作為語言的聲學(xué)體現(xiàn)，是人類交流信息最自然、最有效、

8、最方便的手段之一。但目前語音識別系統(tǒng)大多都是在安靜環(huán)境中工作的，在噪聲環(huán)境中尤其是強噪聲環(huán)境，語音識別系統(tǒng)的識別率將受到嚴(yán)重影響。在上述情況下，必須加入語音增強系統(tǒng)，或者抑制背景噪聲,以提高語音通信質(zhì)量，或者作為預(yù)處理器，以提高語音處理系統(tǒng)的抗干擾能力, 因此，語音增強技術(shù)在實際中有重要價值。維持系統(tǒng)性能。第二章語音增強的基礎(chǔ)知識2. 1語音和人耳的感知特性語音信號是一種非平穩(wěn)的隨機信號。語音的生成過程與發(fā)音器官的運動過程密切相關(guān)，考慮到人類發(fā)聲器官在發(fā)聲過程中的變化速度具有一定的限度而且遠(yuǎn)小于語音信號的變化速度，因此可以假定語音信號是短時平穩(wěn)的，即在（10ms30ms）的時間段內(nèi)其某些物理

9、特性和頻譜特性可以近似的看作是不變的，從而可以應(yīng)用平穩(wěn)隨機過程的分析方法來處理語音信號，并可以在語音增強中利用短時頻譜的平穩(wěn)特性。任何語言的語音都有元音和輔音兩種音素。根據(jù)發(fā)聲的機理不同，輔音又分為清輔音和濁輔音。從時域波形上可以看出濁音（包括元音）具有明顯的準(zhǔn)周期性和較強的振幅，它們的周期所對應(yīng)的頻率就是基音頻率；清輔音的波形類似于白噪聲并具有較弱的振幅。在語音增強中可以利用濁音具有的明顯的準(zhǔn)周期性來區(qū) 別和抑制非語音噪聲，而清輔音的特性則使其和寬帶噪聲區(qū)分困難。人耳對于聲波頻率高低的感覺與實際頻率的高低不成線性關(guān)系，而近似為對數(shù)關(guān)系；對聲強的感覺很靈敏且有很大的動態(tài)范圍，對于頻率

10、的分辨能力受聲強的影響，過強或者太弱的聲音都會導(dǎo)致對頻率的分辨力降低。人耳對語音信號的幅度譜較為敏感，對相位不敏感。這一點對語音信號的恢復(fù)很有幫助。人耳除了可以感受聲音的強度、音調(diào)、音色和空間方位外，還可以在兩人以上的講話環(huán)境中分辨出所需要的聲音，這種分辨能力是人體內(nèi)部語音理解機制具有的一種感知能力。語音增強的最終效果度量是人耳的主觀感覺，所以在語音增強中可以利用人耳感知特性來減少運算代價。2. 2噪聲特性2. 2. 1噪聲的種類、度量 1.噪聲的分類根據(jù)與輸入語音的關(guān)系，噪聲可分為加性噪聲和非加性噪聲兩類。對某些非加性噪聲而言，可以通過一定的變換轉(zhuǎn)換成加性噪聲。因此，為簡化討論

11、，下面主要分析加性噪聲的干擾。語音處理中的加性噪聲大體上可以分為周期性噪聲、脈沖噪聲、寬帶噪聲、同聲道語音干擾噪聲、背景噪聲、單頻噪聲等。(1)周期性噪聲周期性噪聲主要來源于發(fā)動機等周期性運轉(zhuǎn)的機械，電氣干擾也會引起周期性噪聲。其特點是頻譜上有許多離散的線譜。實際信號受多種因素的影響，線譜分量通常轉(zhuǎn)變?yōu)檎瓗ёV結(jié)構(gòu)，而且通常這些窄帶譜都是時變的，位置也不固定。必須采用自適應(yīng)濾波的方法才能有效地區(qū)分這些噪聲分量。(2) 脈沖噪聲脈沖噪聲主要來源于爆炸、撞擊、放電及突發(fā)性干擾等。其特征是時間上的寬度很窄。消除脈沖噪聲通?？梢栽跁r域內(nèi)進(jìn)行，其過程如下：根據(jù)帶噪語音信然后對號幅度的平均值確定閾

12、值，當(dāng)信號幅度超出這一閾值時判別為脈沖噪聲，信號進(jìn)行適當(dāng)?shù)乃p，就可以完全消除噪聲分量，也可以使用內(nèi)插方法將脈沖噪聲在時域上進(jìn)行平滑。(3) 寬帶噪聲寬帶噪聲來源很多，熱噪聲、氣流(如風(fēng)、呼吸)噪聲及各種隨機噪聲源、量化噪聲也可視為寬帶噪聲。寬帶噪聲與語音信號在時域和頻域上基本上重疊，只有在無話期間，噪聲分量才單獨存在。因此消除這種噪聲比較困難。對于平穩(wěn)的寬帶噪聲，通?？梢哉J(rèn)為是高斯白噪聲。(4) 同聲道語音干擾噪聲在實際生活中經(jīng)常遇到很多人同時說話的情況，此時不需要的語音就形成了同聲道干擾。人耳可以根據(jù)需要分辨出其中某個人的聲音，這種能力來源于人的雙耳輸入效應(yīng)和人類語音中包的“

13、聲紋” 特征，這是人體內(nèi)部語音理解機理的一種感知能力表現(xiàn)。通常情況下語音經(jīng)雙耳輸入，人們根據(jù)兩路輸入的不同時延特性進(jìn)行分離。同時由于人的發(fā)聲器官生理結(jié)構(gòu)的差異，每個人都有自身獨特的“聲紋”因此即使雙耳效應(yīng)不顯著(例如單聲道傳輸時)人耳也可以借助聲紋對信號進(jìn)行分離。(5)背景噪聲背景噪聲破壞了信號原有的聲學(xué)特征及模型參數(shù)，因此減弱了不同語音間的差別，使語音質(zhì)量下降，可懂度降低。強噪聲會使人產(chǎn)生聽覺疲勞，從而影響人耳的聽覺特性。同時，較強的背景噪聲也會使講話人的發(fā)音方式發(fā)生變化，即使發(fā)相同的語音，其語音的特征參數(shù)也會與安靜環(huán)境下的發(fā)音有所不同。(6)單頻噪聲它主要源于無線電干擾。因為電臺發(fā)

14、射的頻譜集中在比較窄的頻率范圍內(nèi)，因此可以近似地看作是單頻性質(zhì)的。另外，像電源交流電，反饋系統(tǒng)自激振蕩等也都屬于單頻干擾。它的特點是一種連續(xù)干擾，并且其頻率是可以通過實測來確定的，因此在采取適當(dāng)?shù)拇胧┖缶陀锌赡芊乐埂?.噪聲的度量:聲音的基本度量有聲壓、聲強、聲功率等。聲壓級Lp (dB)或SPL的定義為:Lp = 20lg 上P0(2.1)其中P0=20Apa, Pa為基準(zhǔn)聲壓(空氣中)。聲強級Li (dB)或SIL定義為Li =20lg II 0(2.2)其中1。=1012W/ m2為基準(zhǔn)聲強。聲功率Lw (dB)或SWL的定義為:WLwW|gW(2.3)_L2O其中Wo=1O w/ m

15、2為基準(zhǔn)功率。正常人耳剛能聽到的聽閾聲壓為 204 Pa,所以Po、Io分別是1000Hz的聽閾聲壓及其相應(yīng)的聲強。使人耳產(chǎn)生疼痛的聲壓稱為痛閾聲壓，此值約為100 Pa。聲壓級與聲強級的關(guān)系如下式所表示:(2.4)400LL p10lg其中Po = 1.293kg/ m3為標(biāo)準(zhǔn)大氣壓下的空氣介質(zhì)密度，C為聲速(m/s)。3.噪聲的特性：噪聲是一個隨時間變化的過程。一般的時域周期信號可用振幅、頻率、相位來表征。但是噪聲的時域特性不是很明顯，噪聲的時域波形稱為噪聲信號，將其進(jìn)行頻域變換，得到噪聲信號的頻域特性頻譜。噪聲的頻率特性可用功率譜密度分布來描述。設(shè)頻率在f (f +占f)間的噪聲功

16、率為PN(f,f +Af)，則功率譜密度Gxx(f)定義為單位頻率間隔內(nèi)所含的噪聲功率，即有:dPNGXX(f)=2nPN(f,f+Af) / Af = df(2.5)f2Pn = f GXX(f)dff1(2.6)噪聲還具有統(tǒng)計特性。噪聲的時域波形好象是雜亂無章的,但是無論哪種噪聲都不是完全無規(guī)律的，它們具有統(tǒng)計的規(guī)律的一個系統(tǒng)的噪聲,每次測得的值,是隨意且不可預(yù)料的，即具有隨機性；但大量多次測量的噪聲值，其分布是有規(guī) 律的。測量噪聲的概率是確定的，因此可用概率來描述噪聲的統(tǒng)計規(guī)律。隨機過程的統(tǒng)計特性可用定量值平均值已和標(biāo)準(zhǔn)偏差b表示。平均值或期望值氣是X的平均值，表示測量一次可期望的值，并

17、用大量測量的平均值表示，即:巴=E(x) = (xp (x)dx(2.7)標(biāo)準(zhǔn)偏差b是X的分散程度或變化部分的表示，即:(2.8)b 2稱為均方差。= 2b2 =(X - x)2 = X2 - X在一般交變量中，平均值卩1為零，則標(biāo)準(zhǔn)偏差就是有效值,2. 2. 2噪聲的測量和評價噪聲的聲級是噪聲的主觀評價?？稍诼晫W(xué)測量儀上將接收的聲音按不同程度濾波，在聲級計上直接讀出噪聲評價的主觀量。近年來的研究發(fā)現(xiàn)，不管多大聲級的聲音，用A聲級測量低于55dB的聲音，測得結(jié)果都與人耳對聲音的響度感覺相近。因此，人們就把A聲級作為評價噪聲的主要標(biāo)志。另外，噪聲測量中還有一個問題是分段測量。參照人耳對

18、聲音頻率變化的反應(yīng)，把可聽聲音的頻率分成幾段，再對各段內(nèi)的聲音強度進(jìn)行測量。而每段的高端頻率比低端頻率高1倍，所以稱倍頻程。每段以其中心頻率命名。表2-1為部分倍頻中心頻率及其頻率范圍。倍頻程中心頻率及其頻率范圍中心頻率/Hz631252505001000頻率范圍/Hz45 9090 1801803553557107101400表2-1聲壓級的測量用聲級計，它有二個擋讀數(shù)，快擋讀數(shù)指示真實聲壓級，慢擋讀數(shù)則為在較長時間內(nèi)的平均聲壓級。根據(jù)現(xiàn)場情況還需扣除背景噪聲、風(fēng)噪聲等影響。噪聲功率是描述噪聲源輻射強度的量。通常，噪聲功率級是把頻帶功率級按照能量相加求出。聲功率的測量方法有混響

19、室法和標(biāo)準(zhǔn)聲源法等。另外根據(jù)測量精度要求、噪聲源的特性、測量環(huán)境條件和測量項目內(nèi)容等因素來選擇采用哪種測量方法。聲強度是每個單位面積通過的能量流，如能測得設(shè)備表面上的聲強度，后者在整個設(shè)備表面上的面積分就是它的聲功率。表面上聲強為:(2.9)1 TI =-.0 P Pndt式中，P是瞬時聲壓，叫是瞬時質(zhì)量速度在表面法線方向的分量，T是周期或比周期長得多的時間。語音增強的質(zhì)量好壞需要進(jìn)行評價?，F(xiàn)采用語音聲學(xué)的語言傳遞系統(tǒng)工作質(zhì) 量的評價方法，它又分為分析法和實用法兩大類。分析法在于搜索影響語言傳遞質(zhì)量的各種因素及其作用，多采用心理度量的因素分析法。實用法則力求取得單一的尺度來表示

20、語言傳遞的質(zhì)量。國際標(biāo)準(zhǔn)組織公布一組噪聲評價曲線（NR曲線），亦稱噪聲評價數(shù)。它表示不同噪聲的聲級和不同頻率的噪聲對人造成的聽力損失、語言干擾和煩惱的程度。它的噪聲級范圍是 0130dB,頻率范圍是31. 58000Hz9個倍頻程。在NR曲線上，1000Hz的倍頻程聲壓級即為噪聲評價數(shù) NR。倍頻程聲壓級Lp與噪聲評價數(shù)NR的關(guān)系如下：Lp = a + b N R(2.10)式中，a、b為常數(shù)。噪聲評價數(shù)NR與A聲級有較大的相關(guān)性。一般有下述關(guān)系:La = NR+5(2.11 )為了評價噪聲對語音會話的干擾，考慮到聲音能量主要集中在500Hz、1000Hz、2000Hz的3個倍頻程內(nèi)，因此定

21、義語音干擾級為：1SIL = (L P500 + Lp 1000 + Lp 2000 )dB3(2.12)這是3個倍頻程中心頻率的聲壓級的算術(shù)平均值。由語音分析得知，影響語音識別的是其前3個共振峰，它對聽懂語言是最重要的。而大多數(shù)語音的前3個共振峰就是在這3個倍頻程中心頻率范圍內(nèi)。因此，這個SIL也稱為優(yōu)先語言干擾級(P SIL)。它已成為語音干擾評價使用最廣泛的評價指標(biāo)。2. 3語音增強的方法現(xiàn)階段已有許多語音增強的方法，最常見的有線性濾波法、梳狀濾波法、自相關(guān)法、卡爾曼濾波法以及自適應(yīng)噪聲抵消法。2. 3. 1線性濾波法線性濾波法主要是利用了語音的產(chǎn)生模型。對于加性穩(wěn)態(tài)白噪聲干擾的語音

22、信號來說，語音的頻譜可以根據(jù)語音的產(chǎn)生模型近似地用含噪語音來預(yù)測得到。而噪聲頻譜則用其期望值來近似。這樣得到了語音和噪聲近似的頻譜后就可得到濾波器，即:AH®) =S®)+N®)(2.21)由此濾波器可使語音得到增強。線性濾波法不僅用到了噪聲的統(tǒng)計知識，用到了部分語音知識，但顯然這些知識都是一種近似的代替。因此這種方法對提高語音信噪比和可懂度效果十分有限。特別是當(dāng)信噪比較低時，對語音參數(shù)的預(yù)測誤差明顯增大，從而增強效果就不明顯，并且當(dāng)噪聲不是白噪聲時，按照語音的產(chǎn)生模型就很難準(zhǔn)確預(yù)測語音參數(shù)。因此對有色噪聲線性濾波方法就難以實現(xiàn)。2. 3. 2梳狀濾波法

23、梳狀濾波法是利用了語音的頻譜特征，即諧波性。從眾多語音的頻譜結(jié)構(gòu)可以看出：語音頻譜特別是元音部分具有明顯的諧波特征。當(dāng)語音受到寬帶噪聲干擾時，各諧波的間隙之間則基本上都是噪聲成分。只要知道基頻就可以把諧波之間的噪聲成分完全濾掉，這時濾波器只要設(shè)計成一組諧波頻率處的帶通濾波器即可。這個方法的主要缺點是必須己知通信語音的基頻，而當(dāng)信噪比較低時,基頻的確定變得十分困難。2. 3. 3自相關(guān)法自相關(guān)法是利用語音時域小型特征，即相關(guān)性來增強語音信號的。在語音信號中，元音和濁音都具有明顯的周期性，它的相關(guān)函數(shù)也具有周期性。而噪聲一般是無規(guī)則的，它的自相關(guān)函數(shù)自R(0)開始很快地衰減，因此含噪語音的相關(guān)

24、函數(shù)基本上就是噪聲中語音的相關(guān)函數(shù)。由于語音的相關(guān)函數(shù)與語音信號本身具有相同的頻率成分，只是其幅度近似為語音信號幅度的平方值，因此只要對含噪語音的自相關(guān)值作適當(dāng)?shù)奶幚砭涂蓮脑肼曋刑崛〕稣Z音信息。自相關(guān)法的主要缺點是對語音信息的損傷較大。一方面語音信號畢竟與其自相關(guān)信號有很大的不同，雖然能用數(shù)學(xué)的方法加以校準(zhǔn)，但這種校準(zhǔn)也是有限的。另一方面，輔音的持續(xù)時間較短，且周期性又很差，進(jìn)一步加深了語音的失真度。2. 3. 4卡爾曼濾波法為了獲得較好的語音增強效果，必須盡可能的了解噪聲和語音的信息,以卡爾曼濾波器為主體的語音增強方法正是建立在噪聲模型和語音模型的基礎(chǔ)上。聲和語音都可以認(rèn)為是一個由高斯白噪聲

25、驅(qū)動的、具有適當(dāng)階數(shù)的自回歸AR模型。估計語音模型參數(shù)時，可把噪聲的影響排除，從而較準(zhǔn)確地估計出語音模型參數(shù)，由此參數(shù)就可以估計語音值。一般看來，這種方法似乎是一個較好的語音增強方法，但實際也存在不少問題。(1) 語音和非語音的判別問題，當(dāng)信噪比很低時判別非常困難。(2) 噪聲必然會對語音參數(shù)的估計產(chǎn)生影響，特別是在信噪比較低時，語音估計參數(shù)就難以保證有足夠的精確度。(3)整個過程的計算復(fù)雜性也較大，難以實時實現(xiàn)。2. 3. 5自適應(yīng)噪聲抵消法自適應(yīng)噪聲抵消法比其它方法多用了一個參考噪聲作為輔助輸入，從而獲得了比較全面的關(guān)于噪聲的信息，因而能得到更好的降噪效果。特別是在輔助輸入噪聲與語音

26、中的噪聲完全相關(guān)的情況下，自適應(yīng)噪聲抵消法能完全排除噪聲的隨機性，徹底地抵消語音中的噪聲成分，從而無論在信噪比(SNR, Signal to NoiseRatio)方面還是在語音可懂度方面都能獲得較大的提高。其工作原理實質(zhì)上以均方誤差E e( n)或方差e2( n)為最小準(zhǔn)則，對噪聲n(n)進(jìn)行最優(yōu)估計y(n)=n(n).然后從含噪聲的語音中減去噪聲 n(n)達(dá)到降噪，提高信噪比，增強語音。本文主要采用自適應(yīng)噪聲抵消法對含噪語音信號去噪。第三章自適應(yīng)濾波器基本概念3.1自適應(yīng)濾波從連續(xù)的(或離散的)輸入信號中濾除噪聲和干擾以提取有用信號的過程稱為濾波。相應(yīng)的裝置稱為濾波器。當(dāng)濾波器的輸出為

27、輸入的線性函數(shù)時，該濾波器稱為線性濾波器，否則就稱為非線性濾波器。根據(jù)濾波器的參數(shù)是隨時間變化的，又可以將濾波器分為時變和非時變?yōu)V波器兩種。濾波器研究的一個基本課題就是：如何設(shè)計和制造最佳的或者是最優(yōu)的濾波假定線性濾維納根據(jù)最小，求得了最佳器。所謂最佳濾波器是指能夠根據(jù)某一最佳準(zhǔn)則進(jìn)行濾波的濾波器。波器的輸入為有用信號和噪聲之和，兩者均為廣義平穩(wěn)隨機過程。均方誤差準(zhǔn)則(濾波器的輸出信號與需要信號之差的均方值最小) 線性濾波器的參數(shù)，這種濾波器被成為維納濾波器。要實現(xiàn)維納濾波，就要求：1、輸入過程是廣義平穩(wěn)的；2、輸入過程的統(tǒng)計特性是已知的。然而，由于輸入過程取決于外界的信號、干擾環(huán)境，這

28、種環(huán)境的統(tǒng)計特性常常是未知的、變化的，因而不能滿足上述兩個要求。這就促使人們研究自適應(yīng)濾波器。自適應(yīng)濾波器在輸入過程的統(tǒng)計特性位置時，或輸入過程的統(tǒng)計特性變化時，能夠調(diào)整自己的參數(shù)，以滿足某種最佳準(zhǔn)則的要求。當(dāng)輸入過程的統(tǒng)計特性未知時，自適應(yīng)濾波器調(diào)整自己參數(shù)的過程稱為學(xué)習(xí)過程”而當(dāng)輸入過程的統(tǒng)計特性變化時，自適應(yīng)濾波器調(diào)整自己參數(shù)的過程為跟蹤過程”自適應(yīng)濾波器包括自適應(yīng)時域濾波器和自適應(yīng)空域濾波器，它和信息論、檢測與估計理論等密切相關(guān)，是近二十多年來發(fā)展起來的信息科學(xué)的一個重要分支。3.2自適應(yīng)濾波器的組成自適應(yīng)濾波器的組成如圖3-1所示。它可分為可編程濾波器(濾波部分)及

29、自適應(yīng)算法(控制部分)兩部分。可編程濾波器即參數(shù)可變的濾波器，自適應(yīng)算法對其參數(shù)進(jìn)行控制以實現(xiàn)最佳工作。(a)開環(huán)算法(b)閉環(huán)算法圖3-1自適應(yīng)濾波器的組成自適應(yīng)算法主要根據(jù)濾波器輸入統(tǒng)計特性進(jìn)行處理。它可能還與濾波器輸出和其他參數(shù)有關(guān)。根據(jù)自適應(yīng)算法是否與濾波器輸出有關(guān)，可以將其分為開環(huán)算法和閉環(huán)算法兩類。開環(huán)算法的控制輸出僅取決于濾波器的輸入和某些其他數(shù)據(jù)，但是不取決于濾波器的輸出，如圖3-1( a)所示。閉環(huán)算法的控制輸出則是濾波器輸入、濾波器輸出以及某些其他輸入的函數(shù)，如圖3-1 (b)所示。閉環(huán)算法利用了輸出反饋，它不但能在濾波器輸入變化時保持最佳的輸出,而且還能在某種程

30、度上補償濾波器元件參數(shù)的變化和誤差以及運算誤差。它的缺點是存在穩(wěn)定性問題以及收斂速度不高。開環(huán)算法的優(yōu)點是調(diào)整速度快，一般不存在穩(wěn)定性問題。但是通常要求的計算量大且不能補償元件參數(shù)誤差及運算誤差。因此，多數(shù)采用閉環(huán)算法。3.3基本自適應(yīng)濾波器的模塊結(jié)構(gòu)自適應(yīng)濾波器通常由兩部分構(gòu)成，其一是濾波子系統(tǒng)，根據(jù)它所要處理的功能而往往有不同的結(jié)構(gòu)形式。另一是自適應(yīng)算法部分，用來調(diào)整濾波子系統(tǒng)結(jié)構(gòu)的參數(shù)，或濾波系數(shù)。在自適應(yīng)調(diào)整濾波系數(shù)的過程中，有不同的準(zhǔn)則和算法。自適應(yīng)濾波器含有兩個過程，即自適應(yīng)過程和濾波過程。前一過程的基本目標(biāo)是調(diào)節(jié)濾波系數(shù)W(k)，使得有意義的目標(biāo)函數(shù)或代價函數(shù)s(.)最小化，濾

31、波器輸出信號y(k)逐步逼近所期望的參考信號d(k)，由兩者之間的誤差信號e(k)驅(qū)動某種算法對濾波系數(shù)進(jìn)行調(diào)整，使得濾波器處于最佳工作狀態(tài)以實現(xiàn)濾波過程。所以自適應(yīng)過程是一個閉合的反饋環(huán)，算法決定了這個閉合環(huán)路的自適應(yīng)過程所需要的時間。但是，由于目標(biāo)函數(shù)8(.)是輸入信號x(k),參考信號d(k)及輸出信號y(k)的函數(shù),即e(.) =ex(k) , d(k) , y(k)因此目標(biāo)函數(shù)必須具有以下兩個性質(zhì):非負(fù)性幷)=Ex(k),d(k),y(k) >0,/x(kd(ky ,(k)(3.1)最佳性欽.)=£x(k),d(k),y(k) =0 ,when y(k) =d(k)

32、(3.2)在自適應(yīng)過程中，自適應(yīng)算法逐步使目標(biāo)函數(shù)叭.)最小化，最終使y(k)逼近于d(k)，濾波參數(shù)或權(quán)系數(shù)Wi(k)收斂于Wopt,這里wopt是自適應(yīng)濾波系數(shù)的最優(yōu)解即維納解。因此，自適應(yīng)過程也是自適應(yīng)濾波器的最佳線性估計的過程，既要估計濾波器能實現(xiàn)期望信號d(k)的整個過程，又要估計濾波權(quán)系數(shù)以進(jìn)行有利于主要目標(biāo)方向的調(diào)整。這些估計過程是以連續(xù)的時變形式進(jìn)行的，這就是自適應(yīng)濾波器需要有的自適應(yīng)收斂過程。如何縮短自適應(yīng)收斂過程所需要的收斂時間, 這個與算法和結(jié)構(gòu)有關(guān)的問題是人們一直重視研究的問題之一。第四章基于自適應(yīng)濾波器的語音增強4. 1基本維納濾波器基本維納濾波就是用來解決從噪聲

33、中提取信號問題的一種濾波方法。它的解是以均方誤差最小條件下所得到的系統(tǒng)的傳遞函數(shù)H或單位樣本響應(yīng)h(k)的形式給出的，因此更常稱這種系統(tǒng)為最佳線性過濾器或濾波器。設(shè)計維納濾波器的過程就是尋求在最小均方誤差下濾波器的單位樣本響應(yīng) h(k)或傳遞函數(shù)H (z) 的表達(dá)式，其實質(zhì)是解維納-霍夫(Wiener-Hopf)方程。如圖4-1所示，有兩個信號x(k)和y(k)同時加在濾波器上。典型地y(k)包含一個與x(k)相關(guān)地分量和另一個與x(k)不相關(guān)地分量。維納濾波器則產(chǎn)生y(k)中與x(k)相關(guān)分量地最優(yōu)估計，再從y(k)中減去它就得到e(k)o圖4-1基本維納濾波器假定一個N個系數(shù)(權(quán)

34、值)的FIR濾波器的結(jié)構(gòu)，維納濾波和原始信號y(k) 之間的差信號e(k)為：ATNV(4.1)Q =yk-nk=yk wXk=yk送w(i)Xk_ii=0其中Xk和w分別為輸入信號矢量和權(quán)矢量，由下式確定:xk|X<4Xk =:WO)1W1)W=(4.2)LXk-eN4),WN-1)e2 =y2-2ykXkTw+wTXkXTw誤差平方為:(4.3)對(4.3)式兩邊取期望得到均方誤差(MSE)，若輸入x(k)與輸出y(k)是聯(lián)合平穩(wěn)的，則:名=Eek22TT T(4.4)= Eyk 2EykXk w + Ew XkXk w2TT=CT + 2P w + w Rw其中e代表期望，c&qu

35、ot;2 =Eyk2是y(k)的方差，P = Eykxk是長度為N的互相關(guān)矢量，R=EXkXT是NXN的自相關(guān)矩陣。一個MSE濾波系數(shù)的圖形是碗形地, 且只有唯一地底部，這個圖稱為性能曲面，它是非負(fù)的。性能曲面的梯度可由下式給出:ds(4.5)可=-2 P+2RW dw0,濾波(4.6)每組系數(shù)w(i)(i=1,2,-!)對應(yīng)曲面是一點，在曲面矢地最小點梯度為權(quán)矢量達(dá)到最優(yōu)wWopt 二 RP即著名的維納一霍夫曼方程的解。自適應(yīng)濾波的任務(wù)是采用合適的算法來調(diào)節(jié)濾波權(quán)重Wi(0),Wi(1),，Wi(N-1)，從而找到性能曲面地最優(yōu)點 Wo pt。維納濾波的實際用途有限，若信號為非平穩(wěn)的，

36、則R和P是時變的，必需重復(fù)計算Wo pt。對于實際的應(yīng)用需要能夠依次加入抽樣點而得到 Wo pt的算法。自適應(yīng)算法就是用于達(dá)到這個目的，而且不需顯式計算R和P或進(jìn)行矩陣求逆。4. 2最陡下降法最陡下降法構(gòu)成了不少算法，是 LMS算法的基礎(chǔ)。均方誤差性能函數(shù)為jEd2(n)-2wTrxd + WT FW(4.7)對W求梯度為:J 匕=2RxxW - 2rxd(4.8)由式(4.7)可見，均方誤差匕是權(quán)系數(shù)W1，Wm的二次函數(shù)。當(dāng)權(quán)矢量W =Wopt時，E達(dá)到最小值Emin，幾何上這相當(dāng)于超拋物面的碗底"。在一般情況，濾波器在迭代過程中或當(dāng)輸入過程統(tǒng)計特性發(fā)生變化時，權(quán)矢量W并不正好等

37、于最佳值Wopt上。為了減小誤差，一個顯然的方法是找出該工作點處使均方誤差匕減小速率最大的方向，亦即梯度 "的負(fù)方向，然后令權(quán)矢量 W(n)沿著梯度的負(fù)方向修正。換句話說，如果在第n次迭代上權(quán)矢量取為W(n)，則第 n+1次迭代時，加權(quán)系數(shù) W( n+1)應(yīng)取為:W(n +1) =W(n) - WWE(4.9)其中可wE為E的梯度，而卩為常數(shù)并稱為步長因子或收斂因子。J©的表達(dá)式為:W(n +1) =W(n) -卩2RxxW(n) -2(4.10)或:W(n +1) =(I -2PRxx)W(n)+24rxd(4.11)4. 3 RLS算法RLS算法也是一種對正規(guī)方程的求解

38、方法。RLS算法采用的準(zhǔn)則是：求出濾波器在第N時刻最佳抽頭系數(shù)，使得該抽頭系數(shù)對于n時刻及之前的n-1,n-2,n-3,.,n-N +1時刻的輸入數(shù)據(jù)而言，誤差加權(quán)平方和最小。RLS算法中需要的參數(shù)定義如下:誤差的加權(quán)平方和為:列n)=£ Aq(i)-xN(i)CN(n)F(4.12)式中，A為遺忘因子，表示前后數(shù)據(jù)之間的關(guān)聯(lián)性，取值范圍為0v)v1。對RLS算法收斂速度影響不大，但增大 A的值后，可以減小剩余誤差。樣本自相關(guān)陣nRnn(n) =5： XN(i)xN(i)y(4.13)互相關(guān)樣本陣nPN(n)=送 Ad(i)XN(i)i 4(4.14)對上式求導(dǎo)，可得CNopr (n

39、) = RNN (n)PN (n)(4.15)式(4.15)為RLS算法下的正規(guī)方程，可以用直接法求出，但這種方法計算量大,當(dāng)濾波器階數(shù)為 N時，完成一次迭代計算，共需要乘法4N2+4N次，加法3N2 +2N次，除法2次。4. 4 LMS算法為了采取最陡下降法，需要知道均方誤差性能函數(shù)的梯度的精度值，這就要求輸入信號X(n)和需要信號d(n)平穩(wěn)且其二階統(tǒng)計特性為已知。這時可以根據(jù)輸入信號X(n)和需要信號d(n)的采樣值估計Rxx和rxd，從而采用最陡下降法尋求W4pt。但當(dāng)上述條件不具備時，我們只能把隨機的平方誤差e2(n)當(dāng)成是均方誤差Ee2(n)。對前者進(jìn)行求梯度的運算，所得到的結(jié)果

40、就取為關(guān)于后者的真實梯度W©的估計We。這就是由Widrow等人提出的最小均方算法，即LMS算法。下面推導(dǎo)一下它的公式。在最陡下降法的式中，用梯度的估計可Wr代替梯度可即得:W( n+ 1 F W (卅曲(4.16)LMS算法采用如下的梯度估計值:A A22(4.17)y =g Ee (n) ='we (n)即它用瞬時輸出誤差功率的梯度Vwe2(n)作為均方誤差梯度wEe2(n)的估計值。換句話說，它用瞬時平方誤差性能函數(shù)e2(n)代替了均方誤差性能函數(shù)匕=Ee2( n)。得:W(n+1) =W(n) -Wwe2(n)(4.18)(4.19)e (n) =d(n) - y(n

41、) =d(n) -WT (n)X(n)可得:Je2(n) = -2e( n)X(n)(4.20)將式(4.20)代入式(4.16)得:LMS(4.21)W(n +1) =W( n) + 2Pe2(n)X( n)算法的遞推式的最大優(yōu)點是它沒有交叉項，因而可以方便地寫成純量方程組:Wi(n +1)=W( n)+24e(n)Xj( n) ,i=1,2,M(4.22)W(n +1) =W(n) +円2rxd 2RxxW(n)。F面，我們對LMS算法加權(quán)矢量的平均值的變化規(guī)律和加權(quán)矢量的隨機起伏所形成的影響進(jìn)行討論。1 LMS算法加權(quán)矢量平均值的收斂條件為當(dāng)且僅當(dāng)(4.23)愎EW(n)譏 pt因為實用時很少能夠知道 Rxx的各個特征值，實際上，我們有(4.24)'max <Tr Rxx(4.25)其中TrRxx為Rxx的跡，且mmTrRxx =送=£ Ex2(n-i +1) =MPimi ztiT(4.26)式中Rm為輸入信號x(n)的功率。這樣，我們可以寫出下列

人人文庫> 全部分類> 應(yīng)用文書 > 作業(yè)報告

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

基于自適應(yīng)語音增強的算法研究DOC

文檔簡介

溫馨提示

最新文檔

評論

基于自適應(yīng)語音增強的算法研究DOC

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔