基于自適應(yīng)語音增強(qiáng)的算法研究DOC_第1頁
基于自適應(yīng)語音增強(qiáng)的算法研究DOC_第2頁
基于自適應(yīng)語音增強(qiáng)的算法研究DOC_第3頁
基于自適應(yīng)語音增強(qiáng)的算法研究DOC_第4頁
基于自適應(yīng)語音增強(qiáng)的算法研究DOC_第5頁
已閱讀5頁,還剩23頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、OVtnLUIQjC)CocH姓名 學(xué)號 班級 院系 題目a尤德軍20121003482 075124機(jī)電學(xué)院基干自適應(yīng)語音信號增強(qiáng)算法研究一、主要參考書及參考資料1 Sambur M . Adaptive noise cancelling for speech signalS IEEE Transactions onAcoustics, Speech and Signal Processing 1978,26(5): 419 432 B Widrow,S D Stearns千永德、龍憲惠譯,自適應(yīng)信號處理,成都四川大學(xué)出版社,1989.3 T w Parsons文成義、常國岑、王化周等譯,語

2、音處理,北京國防工業(yè)出版社,1990.4 姚天任,數(shù)字語音處理,武漢華中科技大學(xué)出版社,1992.鄒國良,自適應(yīng)濾波理論及應(yīng)用M,河北大學(xué)出版社,1997.6胡廣傳,數(shù)字信號處理理論、算法與實現(xiàn),北京清華大學(xué)出版社,1997.7葛良、陶智,基于自適應(yīng)濾波的語音增強(qiáng)算法.江蘇:蘇州大學(xué)學(xué)報,2002.8何振亞,自適應(yīng)信號處理M,北京科學(xué)出版社,2002.IIL.、八刖言第一章緒論1.1語音增強(qiáng)的應(yīng)用背景1.2語音增強(qiáng)的研究歷史1.3本課題的研究內(nèi)容.摘要語音增強(qiáng)的基礎(chǔ)知識第二章,錯誤!未定義書簽。錯誤!未定義書簽。,錯誤!未定義書簽。.錯誤!未定義書簽。2.1語音和人耳的感知特性2.2噪聲特性2

3、.2.1噪聲的種類、度量2.2.2噪聲的測量和評價2.3語音增強(qiáng)的方法2.3.1線性濾波法2.3.2梳狀濾波法2.3.3自相關(guān)法2.3.4卡爾曼濾波法IVI.VVIV.IV.IIIX.X.X.XJ235自適應(yīng)噪聲抵消法XJI第三章自適應(yīng)濾波器基本概念XII3.1自適應(yīng)濾波XJI3.2自適應(yīng)濾波器的組成X.III3.3基本自適應(yīng)濾波器的模塊結(jié)構(gòu)XIV第四章基于自適應(yīng)濾波器的語音增強(qiáng)X IV4.1基本維納濾波器X.V4.2最陡下降法XVII4.3RLS算法XVII4.4LMS算法XVIII4.5基于自適應(yīng)濾波器的噪聲抵消法4.5.1自適應(yīng)噪聲抵消法的原理4.5.2自適應(yīng)噪聲抵消法的應(yīng)用.XXI第五

4、章MATLAB仿真實現(xiàn)錯誤!未定義書簽。5. 1 MATLAB仿真軟件介紹.錯誤!未定義書簽。5.1.1 MATLAB的發(fā)展歷程及應(yīng)用錯誤!未定義書簽。5.1.2 MATLAB的特點(diǎn)及優(yōu)勢,錯誤!未定義書簽。,錯誤!未定義書簽。.錯誤!未定義書簽。5.2 MATLAB仿真結(jié)果分析5.3小結(jié)人們在語音通信過程中不可避免的會受到來自周圍環(huán)境和傳輸媒介引入的 噪聲、通信設(shè)備內(nèi)部電噪聲、乃至其他講話者的干擾。這些干擾使接收者收到的 語音為受噪聲污染的帶噪語音信號。語音增強(qiáng)的一個主要目的就是從帶噪語音信號中提取盡可能純凈的原始語 音。目前應(yīng)用的語音增強(qiáng)方法大體上分為: 諧波增強(qiáng)法、基于參數(shù)估計的語音再

5、合成法和基于自適應(yīng)的噪聲抵消法。自適應(yīng)濾波器實際是一種能夠自動調(diào)節(jié)本身參數(shù)的特殊維納濾波器,在設(shè)計時不需要事先知道關(guān)于輸入信號和噪聲的統(tǒng)計特性,它能夠在自己的工作過程中逐漸“了解”或估計出所需要的統(tǒng)計特性, 并自動調(diào)整自己的參數(shù),以達(dá)到最佳 濾波效果。而基于自適應(yīng)濾波器的自適應(yīng)噪聲抵消法對含噪語音的增強(qiáng)效果最好。因為這種方法比其他方法多用了一個參考噪聲作為輔助輸入,從而獲得了比 較全面的關(guān)于噪聲的信息,從而能得到更好的降噪效果。關(guān)鍵詞:語音增強(qiáng),噪聲,自適應(yīng)濾波器,自適應(yīng)噪聲抵消法第一章緒論1.語音增強(qiáng)的應(yīng)用背景語音增強(qiáng)技術(shù)是指當(dāng)語音信號被各種各樣的噪聲(包括語音)干擾、甚至淹沒28降低噪聲干

6、擾的技術(shù)。語或者對語音信號處理技術(shù)本后,從噪聲背景中提取、增強(qiáng)有用的語音信號,抑制、音增強(qiáng)技術(shù)無論在日常生活中,還是在其它的領(lǐng)域, 身來說都很有應(yīng)用價值。在日常生活中,我們經(jīng)常會遇到在噪聲干擾下進(jìn)行語音通信的問題。如:使用設(shè)置在嘈雜的馬路旁或市場內(nèi)的公用電話, 或在奔馳的汽車、火車?yán)锸褂靡苿?電話時,旁人的喧鬧聲、汽車和火車的轟鳴聲等背景噪聲都會干擾語音通訊的質(zhì) 量。對受話人來說,收聽夾雜著各種干擾噪聲的語音,至少會引起聽覺疲勞,嚴(yán) 重一點(diǎn)就會錯誤地識別或根本無法聽清對方的語音。對電話來說,干擾主要來自電話信道的回波干擾。 再有一類需要用到語音增 強(qiáng)技術(shù)的方面就是處理舊的錄音磁帶。由于早年錄音

7、技術(shù)不完善,磁帶質(zhì)量不高, 加上長久存放,使磁帶發(fā)生霉變、機(jī)械損傷、磁粉脫落、磁化等問題,使得重放 語音產(chǎn)生噪聲。對于那些極具研究或收藏價值的寶貴錄音資料來說,語音增強(qiáng)技 術(shù)是一個較好的恢復(fù)手段。在通信過程中,語音質(zhì)量的好壞顯得格外重要。如語音質(zhì)量很差,接收方難 以聽清對方的語音信息,輕者可能延誤時間、 貽誤時機(jī),重者可能錯誤地識別對方的語音,因而錯誤地下達(dá)或執(zhí)行命令,導(dǎo)致對工作造成不可估量的損失。因此, 隨著現(xiàn)代科學(xué)的蓬勃發(fā)展,人類社會愈來愈顯示出信息社會的特點(diǎn)。通信或信息交換已成為人類社會存在的必要條件,正如衣食住行對人類是必要的一樣。語音作為語言的聲學(xué)體現(xiàn),是人類交流信息最自然、最有效、

8、最方便 的手段之一。但目前語音識別系統(tǒng)大多都是在安靜環(huán)境中工作的,在噪聲環(huán)境中尤其是強(qiáng)噪聲環(huán)境,語音識別系統(tǒng)的識別率將受到嚴(yán)重影響。在上述情況下,必須加入語音增強(qiáng)系統(tǒng),或者抑制背景噪聲,以提高語音通信質(zhì)量,或者作為預(yù)處理器,以提高語音處理系統(tǒng)的抗干擾能力, 因此,語音增強(qiáng)技術(shù)在實際中有重要價值。維持系統(tǒng)性能。第二章語音增強(qiáng)的基礎(chǔ)知識2. 1語音和人耳的感知特性語音信號是一種非平穩(wěn)的隨機(jī)信號。語音的生成過程與發(fā)音器官的運(yùn)動過程密切相關(guān),考慮到人類發(fā)聲器官在發(fā)聲過程中的變化速度具有一定的限度而且遠(yuǎn)小于語音信號的變化速度,因此可以假定語音信號是短時平穩(wěn)的,即在(10ms30ms)的時間段內(nèi)其某些物理

9、特性和頻譜特性可以近似的看作是不變的,從而可 以應(yīng)用平穩(wěn)隨機(jī)過程的分析方法來處理語音信號,并可以在語音增強(qiáng)中利用短時頻譜的平穩(wěn)特性。任何語言的語音都有元音和輔音兩種音素。根據(jù)發(fā)聲的機(jī)理不同,輔音又分為清輔音和濁輔音。從時域波形上可以看出濁音(包括元音)具有明顯的準(zhǔn)周期性和較強(qiáng)的振幅,它們的周期所對應(yīng)的頻率就是基音頻率; 清輔音的波形類似于白 噪聲并具有較弱的振幅。在語音增強(qiáng)中可以利用濁音具有的明顯的準(zhǔn)周期性來區(qū) 別和抑制非語音噪聲,而清輔音的特性則使其和寬帶噪聲區(qū)分困難。人耳對于聲波頻率高低的感覺與實際頻率的高低不成線性關(guān)系,而近似為對 數(shù)關(guān)系;對聲強(qiáng)的感覺很靈敏且有很大的動態(tài)范圍, 對于頻率

10、的分辨能力受聲強(qiáng) 的影響,過強(qiáng)或者太弱的聲音都會導(dǎo)致對頻率的分辨力降低。人耳對語音信號的 幅度譜較為敏感,對相位不敏感。這一點(diǎn)對語音信號的恢復(fù)很有幫助。人耳除了可以感受聲音的強(qiáng)度、 音調(diào)、音色和空間方位外,還可以在兩人以 上的講話環(huán)境中分辨出所需要的聲音,這種分辨能力是人體內(nèi)部語音理解機(jī)制具 有的一種感知能力。語音增強(qiáng)的最終效果度量是人耳的主觀感覺,所以在語音增 強(qiáng)中可以利用人耳感知特性來減少運(yùn)算代價。2. 2噪聲特性2. 2. 1噪聲的種類、度量 1.噪聲的分類根據(jù)與輸入語音的關(guān)系,噪聲可分為加性噪聲和非加性噪聲兩類。對某些非 加性噪聲而言,可以通過一定的變換轉(zhuǎn)換成加性噪聲。因此,為簡化討論

11、,下面 主要分析加性噪聲的干擾。語音處理中的加性噪聲大體上可以分為周期性噪聲、 脈沖噪聲、寬帶噪聲、同聲道語音干擾噪聲、背景噪聲、單頻噪聲等。(1)周期性噪聲周期性噪聲主要來源于發(fā)動機(jī)等周期性運(yùn)轉(zhuǎn)的機(jī)械,電氣干擾也會引起周期 性噪聲。其特點(diǎn)是頻譜上有許多離散的線譜。 實際信號受多種因素的影響,線譜 分量通常轉(zhuǎn)變?yōu)檎瓗ёV結(jié)構(gòu),而且通常這些窄帶譜都是時變的,位置也不固定。必須采用自適應(yīng)濾波的方法才能有效地區(qū)分這些噪聲分量。(2) 脈沖噪聲脈沖噪聲主要來源于爆炸、撞擊、放電及突發(fā)性干擾等。其特征是時間上的寬度很窄。消除脈沖噪聲通??梢栽跁r域內(nèi)進(jìn)行,其過程如下:根據(jù)帶噪語音信然后對號幅度的平均值確定閾

12、值,當(dāng)信號幅度超出這一閾值時判別為脈沖噪聲,信號進(jìn)行適當(dāng)?shù)乃p,就可以完全消除噪聲分量,也可以使用內(nèi)插方法將脈沖噪 聲在時域上進(jìn)行平滑。(3) 寬帶噪聲寬帶噪聲來源很多,熱噪聲、氣流(如風(fēng)、呼吸)噪聲及各種隨機(jī)噪聲源、量化噪聲也可視為寬帶噪聲。寬帶噪聲與語音信號在時域和頻域上基本上重疊,只 有在無話期間,噪聲分量才單獨(dú)存在。 因此消除這種噪聲比較困難。對于平穩(wěn)的 寬帶噪聲,通??梢哉J(rèn)為是高斯白噪聲。(4) 同聲道語音干擾噪聲在實際生活中經(jīng)常遇到很多人同時說話的情況, 此時不需要的語音就形成了同聲道干擾。人耳可以根據(jù)需要分辨出其中某個人的聲音, 這種能力來源于人的 雙耳輸入效應(yīng)和人類語音中包的“

13、聲紋” 特征,這是人體內(nèi)部語音理解機(jī)理的一 種感知能力表現(xiàn)。通常情況下語音經(jīng)雙耳輸入,人們根據(jù)兩路輸入的不同時延特 性進(jìn)行分離。同時由于人的發(fā)聲器官生理結(jié)構(gòu)的差異,每個人都有自身獨(dú)特的“聲紋”因此即使雙耳效應(yīng)不顯著(例如單聲道傳輸時)人耳也可以借助聲紋對信號 進(jìn)行分離。(5)背景噪聲背景噪聲破壞了信號原有的聲學(xué)特征及模型參數(shù),因此減弱了不同語音間的差別,使語音質(zhì)量下降,可懂度降低。強(qiáng)噪聲會使人產(chǎn)生聽覺疲勞,從而影響人 耳的聽覺特性。同時,較強(qiáng)的背景噪聲也會使講話人的發(fā)音方式發(fā)生變化,即使發(fā)相同的語音,其語音的特征參數(shù)也會與安靜環(huán)境下的發(fā)音有所不同。(6)單頻噪聲它主要源于無線電干擾。因為電臺發(fā)

14、射的頻譜集中在比較窄的頻率范圍內(nèi),因此可以近似地看作是單頻性質(zhì)的。另外, 像電源交流電,反饋系統(tǒng)自激振蕩等也都屬于單頻干擾。它的特點(diǎn)是一種連續(xù)干擾,并且其頻率是可以通過實測來確定的,因此在采取適當(dāng)?shù)拇胧┖缶陀锌赡芊乐埂?.噪聲的度量:聲音的基本度量有聲壓、聲強(qiáng)、聲功率等。聲壓級Lp (dB)或SPL的定義為:Lp = 20lg 上P0(2.1)其中P0=20Apa, Pa為基準(zhǔn)聲壓(空氣中)。聲強(qiáng)級Li (dB)或SIL定義為Li =20lg II 0(2.2)其中1。=1012W/ m2為基準(zhǔn)聲強(qiáng)。聲功率Lw (dB)或SWL的定義為:WLwW|gW(2.3)_L2O其中Wo=1O w/ m

15、2為基準(zhǔn)功率。正常人耳剛能聽到的聽閾聲壓為 204 Pa,所以Po、Io分別是1000Hz的聽閾聲壓及其相應(yīng)的聲強(qiáng)。使人耳產(chǎn)生疼痛的聲壓稱為痛閾聲壓,此值約為100 Pa。聲壓級與聲強(qiáng)級的關(guān)系如下式所表示:(2.4)400LL p10lg其中Po = 1.293kg/ m3為標(biāo)準(zhǔn)大氣壓下的空氣介質(zhì)密度,C為聲速(m/s)。3.噪聲的特性:噪聲是一個隨時間變化的過程。 一般的時域周期信號可用振幅、頻率、相位來表征。但是噪聲的時域特性不是很明顯, 噪聲的時域波形稱為噪聲信號,將其進(jìn)行頻域變換,得到噪聲信號的頻域特性頻譜。噪聲的頻率特性可用功率譜密度分布來描述。設(shè)頻率在f (f +占f)間的噪 聲功

16、率為PN(f,f +Af),則功率譜密度Gxx(f)定義為單位頻率間隔內(nèi)所含的噪聲功率,即有:dPNGXX(f)=2nPN(f,f+Af) / Af = df(2.5)f2Pn = f GXX(f)dff1(2.6)噪聲還具有統(tǒng)計特性。噪聲的時域波形好象是雜亂無章的,但是無論哪種噪聲都不是完全無規(guī)律的,它們具有統(tǒng)計的規(guī)律的一個系統(tǒng)的噪聲,每次測得的值,是隨意且不可預(yù)料的,即具有隨機(jī)性;但大量多次測量的噪聲值,其分布是有規(guī) 律的。測量噪聲的概率是確定的,因此可用概率來描述噪聲的統(tǒng)計規(guī)律。隨機(jī)過程的統(tǒng)計特性可用定量值平均值已和標(biāo)準(zhǔn)偏差b表示。平均值或期望值氣是X的平均值,表示測量一次可期望的值,并

17、用大量測量的平均值表示,即:巴=E(x) = (xp (x)dx(2.7)標(biāo)準(zhǔn)偏差b是X的分散程度或變化部分的表示,即:(2.8)b 2稱為均方差。= 2b2 =(X - x)2 = X2 - X在一般交變量中,平均值 卩1為零,則標(biāo)準(zhǔn)偏差就是有效值,2. 2. 2噪聲的測量和評價噪聲的聲級是噪聲的主觀評價。可在聲學(xué)測量儀上將接收的聲音按不同程度 濾波,在聲級計上直接讀出噪聲評價的主觀量。 近年來的研究發(fā)現(xiàn),不管多大聲 級的聲音,用A聲級測量低于55dB的聲音,測得結(jié)果都與人耳對聲音的響度感覺相近。因此,人們就把A聲級作為評價噪聲的主要標(biāo)志。另外,噪聲測量中還有一個問題是分段測量。 參照人耳對

18、聲音頻率變化的反 應(yīng),把可聽聲音的頻率分成幾段,再對各段內(nèi)的聲音強(qiáng)度進(jìn)行測量。 而每段的高端頻率比低端頻率高1倍,所以稱倍頻程。每段以其中心頻率命名。表2-1為部分倍頻中心頻率及其頻率范圍。倍頻程中心頻率及其頻率范圍中心頻率/Hz631252505001000頻率范圍/Hz45 9090 1801803553557107101400表2-1聲壓級的測量用聲級計,它有二個擋讀數(shù),快擋讀數(shù)指示真實聲壓級,慢擋 讀數(shù)則為在較長時間內(nèi)的平均聲壓級。 根據(jù)現(xiàn)場情況還需扣除背景噪聲、 風(fēng)噪聲 等影響。噪聲功率是描述噪聲源輻射強(qiáng)度的量。通常,噪聲功率級是把頻帶功率級按 照能量相加求出。聲功率的測量方法有混響

19、室法和標(biāo)準(zhǔn)聲源法等。另外根據(jù)測量 精度要求、噪聲源的特性、測量環(huán)境條件和測量項目內(nèi)容等因素來選擇采用哪種 測量方法。聲強(qiáng)度是每個單位面積通過的能量流, 如能測得設(shè)備表面上的聲強(qiáng)度,后者 在整個設(shè)備表面上的面積分就是它的聲功率。表面上聲強(qiáng)為:(2.9)1 TI =-.0 P Pndt式中,P是瞬時聲壓,叫是瞬時質(zhì)量速度在表面法線方向的分量,T是周期或比 周期長得多的時間。語音增強(qiáng)的質(zhì)量好壞需要進(jìn)行評價?,F(xiàn)采用語音聲學(xué)的語言傳遞系統(tǒng)工作質(zhì) 量的評價方法,它又分為分析法和實用法兩大類。 分析法在于搜索影響語言傳遞 質(zhì)量的各種因素及其作用,多采用心理度量的因素分析法。實用法則力求取得單 一的尺度來表示

20、語言傳遞的質(zhì)量。國際標(biāo)準(zhǔn)組織公布一組噪聲評價曲線(NR曲線),亦稱噪聲評價數(shù)。它表示 不同噪聲的聲級和不同頻率的噪聲對人造成的聽力損失、語言干擾和煩惱的程度。它的噪聲級范圍是 0130dB,頻率范圍是31. 58000Hz9個倍頻程。在NR曲線上,1000Hz的倍頻程聲壓級即為噪聲評價數(shù) NR。倍頻程聲壓級Lp與噪聲評價數(shù)NR的關(guān)系如下:Lp = a + b N R(2.10)式中,a、b為常數(shù)。噪聲評價數(shù)NR與A聲級有較大的相關(guān)性。一般有下述關(guān)系:La = NR+5(2.11 )為了評價噪聲對語音會話的干擾,考慮到聲音能量主要集中在500Hz、1000Hz、2000Hz的3個倍頻程內(nèi),因此定

21、義語音干擾級為:1SIL = (L P500 + Lp 1000 + Lp 2000 )dB3(2.12)這是3個倍頻程中心頻率的聲壓級的算術(shù)平均值。 由語音分析得知,影響語音識別的是其前3個共振峰,它對聽懂語言是最重要的。而大多數(shù)語音的前3個共振峰就是在這3個倍頻程中心頻率范圍內(nèi)。因此,這個SIL也稱為優(yōu)先語言干擾級(P SIL)。它已成為語音干擾評價使用最廣泛的評價指標(biāo)。2. 3語音增強(qiáng)的方法現(xiàn)階段已有許多語音增強(qiáng)的方法,最常見的有線性濾波法、梳狀濾波法、自相關(guān)法、卡爾曼濾波法以及自適應(yīng)噪聲抵消法。2. 3. 1線性濾波法線性濾波法主要是利用了語音的產(chǎn)生模型。 對于加性穩(wěn)態(tài)白噪聲干擾的語音

22、信號來說,語音的頻譜可以根據(jù)語音的產(chǎn)生模型近似地用含噪語音來預(yù)測得到。 而噪聲頻譜則用其期望值來近似。這樣得到了語音和噪聲近似的頻譜后就可得到濾波器,即:AH®) =S®)+N®)(2.21)由此濾波器可使語音得到增強(qiáng)。 線性濾波法不僅用到了噪聲的統(tǒng)計知識,用到了部分語音知識,但顯然這些知識都是一種近似的代替。 因此這種方法對提高語音信噪比和可懂度效果十分有限。 特別是當(dāng)信噪比較低時,對語音參數(shù)的預(yù)測誤差明顯增大,從而增強(qiáng)效果就不明顯, 并且當(dāng)噪聲不是白噪聲時,按照語音的產(chǎn)生模型就很難準(zhǔn)確預(yù)測語音參數(shù)。因此對有色噪聲線性濾波方法就難以實現(xiàn)。2. 3. 2梳狀濾波法

23、梳狀濾波法是利用了語音的頻譜特征,即諧波性。從眾多語音的頻譜結(jié)構(gòu)可以看出:語音頻譜特別是元音部分具有明顯的諧波特征。當(dāng)語音受到寬帶噪聲干擾時,各諧波的間隙之間則基本上都是噪聲成分。 只要知道基頻就可以把諧波之間的噪聲成分完全濾掉,這時濾波器只要設(shè)計成一組諧波頻率處的帶通濾波器即可。這個方法的主要缺點(diǎn)是必須己知通信語音的基頻,而當(dāng)信噪比較低時,基頻的確定變得十分困難。2. 3. 3自相關(guān)法自相關(guān)法是利用語音時域小型特征,即相關(guān)性來增強(qiáng)語音信號的。在語音信號中,元音和濁音都具有明顯的周期性, 它的相關(guān)函數(shù)也具有周期性。而噪聲一般是無規(guī)則的,它的自相關(guān)函數(shù)自R(0)開始很快地衰減,因此含噪語音的相關(guān)

24、函數(shù)基本上就是噪聲中語音的相關(guān)函數(shù)。由于語音的相關(guān)函數(shù)與語音信號本身具有相同的頻率成分,只是其幅度近似為語音信號幅度的平方值,因此只要對含噪語音的自相關(guān)值作適當(dāng)?shù)奶幚砭涂蓮脑肼曋刑崛〕稣Z音信息。自相關(guān)法的主要缺點(diǎn)是對語音信息的損傷較大。一方面語音信號畢竟與其自相關(guān)信號有很大的不同,雖然能用數(shù)學(xué)的方法加以校準(zhǔn),但這種校準(zhǔn)也是有限的。另一方面,輔音的持續(xù)時間較短,且周期性又很差,進(jìn)一步加深了語音的失真度。2. 3. 4卡爾曼濾波法為了獲得較好的語音增強(qiáng)效果,必須盡可能的了解噪聲和語音的信息,以卡爾曼濾波器為主體的語音增強(qiáng)方法正是建立在噪聲模型和語音模型的基礎(chǔ)上。聲和語音都可以認(rèn)為是一個由高斯白噪聲

25、驅(qū)動的、具有適當(dāng)階數(shù)的自回歸AR模型。估計語音模型參數(shù)時,可把噪聲的影響排除,從而較準(zhǔn)確地估計出語音模型參數(shù),由此參數(shù)就可以估計語音值。一般看來,這種方法似乎是一個較好的語音增強(qiáng)方法,但實際也存在不少問題。(1) 語音和非語音的判別問題,當(dāng)信噪比很低時判別非常困難。(2) 噪聲必然會對語音參數(shù)的估計產(chǎn)生影響,特別是在信噪比較低時,語音估計 參數(shù)就難以保證有足夠的精確度。(3)整個過程的計算復(fù)雜性也較大,難以實時實現(xiàn)。2. 3. 5自適應(yīng)噪聲抵消法自適應(yīng)噪聲抵消法比其它方法多用了一個參考噪聲作為輔助輸入,從而獲得 了比較全面的關(guān)于噪聲的信息,因而能得到更好的降噪效果。特別是在輔助輸入 噪聲與語音

26、中的噪聲完全相關(guān)的情況下,自適應(yīng)噪聲抵消法能完全排除噪聲的隨機(jī)性,徹底地抵消語音中的噪聲成分,從而無論在信噪比(SNR, Signal to NoiseRatio)方面還是在語音可懂度方面都能獲得較大的提高。其工作原理實質(zhì)上以均方誤差E e( n)或方差e2( n)為最小準(zhǔn)則,對噪聲n(n)進(jìn)行最優(yōu)估計y(n)=n(n).然后從含噪聲的語音中減去噪聲 n(n)達(dá)到降噪,提高信噪比,增強(qiáng)語音。本文主 要采用自適應(yīng)噪聲抵消法對含噪語音信號去噪。第三章自適應(yīng)濾波器基本概念3.1自適應(yīng)濾波從連續(xù)的(或離散的)輸入信號中濾除噪聲和干擾以提取有用信號的過程稱 為濾波。相應(yīng)的裝置稱為濾波器。當(dāng)濾波器的輸出為

27、輸入的線性函數(shù)時,該濾波 器稱為線性濾波器,否則就稱為非線性濾波器。根據(jù)濾波器的參數(shù)是隨時間變化 的,又可以將濾波器分為時變和非時變?yōu)V波器兩種。濾波器研究的一個基本課題就是:如何設(shè)計和制造最佳的或者是最優(yōu)的濾波假定線性濾維納根據(jù)最小,求得了最佳器。所謂最佳濾波器是指能夠根據(jù)某一最佳準(zhǔn)則進(jìn)行濾波的濾波器。波器的輸入為有用信號和噪聲之和,兩者均為廣義平穩(wěn)隨機(jī)過程。均方誤差準(zhǔn)則(濾波器的輸出信號與需要信號之差的均方值最小) 線性濾波器的參數(shù),這種濾波器被成為維納濾波器。要實現(xiàn)維納濾波,就要求:1、輸入過程是廣義平穩(wěn)的;2、輸入過程的統(tǒng)計 特性是已知的。然而,由于輸入過程取決于外界的信號、干擾環(huán)境,這

28、種環(huán)境的 統(tǒng)計特性常常是未知的、變化的,因而不能滿足上述兩個要求。 這就促使人們研 究自適應(yīng)濾波器。自適應(yīng)濾波器在輸入過程的統(tǒng)計特性位置時,或輸入過程的統(tǒng)計特性變化 時,能夠調(diào)整自己的參數(shù),以滿足某種最佳準(zhǔn)則的要求。當(dāng)輸入過程的統(tǒng)計特性 未知時,自適應(yīng)濾波器調(diào)整自己參數(shù)的過程稱為 學(xué)習(xí)過程”而當(dāng)輸入過程的統(tǒng)計特性變化時,自適應(yīng)濾波器調(diào)整自己參數(shù)的過程為跟蹤過程”自適應(yīng)濾波器包括自適應(yīng)時域濾波器和自適應(yīng)空域濾波器,它和信息論、檢 測與估計理論等密切相關(guān),是近二十多年來發(fā)展起來的信息科學(xué)的一個重要分 支。3.2自適應(yīng)濾波器的組成自適應(yīng)濾波器的組成如圖3-1所示。它可分為可編程濾波器(濾波部分)及

29、自適應(yīng)算法(控制部分)兩部分??删幊虨V波器即參數(shù)可變的濾波器,自適應(yīng)算 法對其參數(shù)進(jìn)行控制以實現(xiàn)最佳工作。(a)開環(huán)算法(b)閉環(huán)算法圖3-1自適應(yīng)濾波器的組成自適應(yīng)算法主要根據(jù)濾波器輸入統(tǒng)計特性進(jìn)行處理。 它可能還與濾波器輸出 和其他參數(shù)有關(guān)。根據(jù)自適應(yīng)算法是否與濾波器輸出有關(guān), 可以將其分為開環(huán)算 法和閉環(huán)算法兩類。開環(huán)算法的控制輸出僅取決于濾波器的輸入和某些其他數(shù)據(jù),但是不取決于濾波器的輸出,如圖3-1( a)所示。閉環(huán)算法的控制輸出則是濾波器輸入、濾波器輸出以及某些其他輸入的函數(shù),如圖3-1 (b)所示。閉環(huán)算法利用了輸出反饋,它不但能在濾波器輸入變化時保持最佳的輸出,而且還能在某種程

30、度上補(bǔ)償濾波器元件參數(shù)的變化和誤差以及運(yùn)算誤差。它的缺 點(diǎn)是存在穩(wěn)定性問題以及收斂速度不高。開環(huán)算法的優(yōu)點(diǎn)是調(diào)整速度快,一般不存在穩(wěn)定性問題。但是通常要求的計算量大且不能補(bǔ)償元件參數(shù)誤差及運(yùn)算誤差。因此,多數(shù)采用閉環(huán)算法。3.3基本自適應(yīng)濾波器的模塊結(jié)構(gòu)自適應(yīng)濾波器通常由兩部分構(gòu)成,其一是濾波子系統(tǒng),根據(jù)它所要處理的功能而往往有不同的結(jié)構(gòu)形式。另一是自適應(yīng)算法部分,用來調(diào)整濾波子系統(tǒng)結(jié)構(gòu)的參數(shù),或濾波系數(shù)。在自適應(yīng)調(diào)整濾波系數(shù)的過程中,有不同的準(zhǔn)則和算法。自適應(yīng)濾波器含有兩個過程,即自適應(yīng)過程和濾波過程。前一過程的基本目標(biāo)是調(diào)節(jié)濾波系數(shù)W(k),使得有意義的目標(biāo)函數(shù)或代價函數(shù)s(.)最小化,濾

31、波器輸出信號y(k)逐步逼近所期望的參考信號d(k),由兩者之間的誤差信號e(k)驅(qū)動某種算法對濾波系數(shù)進(jìn)行調(diào)整,使得濾波器處于最佳工作狀態(tài)以實現(xiàn)濾波過程。 所以自適應(yīng)過程是一個閉合的反饋環(huán),算法決定了這個閉合環(huán)路的自適應(yīng)過程所需要的時間。但是,由于目標(biāo)函數(shù)8(.)是輸入信號x(k),參考信號d(k)及輸出信號y(k)的函數(shù),即e(.) =ex(k) , d(k) , y(k)因此目標(biāo)函數(shù)必須具有以下兩個性質(zhì):非負(fù)性幷)=Ex(k),d(k),y(k) >0,/x(kd(ky ,(k)(3.1)最佳性欽.)=£x(k),d(k),y(k) =0 ,when y(k) =d(k)

32、(3.2)在自適應(yīng)過程中,自適應(yīng)算法逐步使目標(biāo)函數(shù)叭.)最小化,最終使y(k)逼近于d(k),濾波參數(shù)或權(quán)系數(shù)Wi(k)收斂于Wopt,這里wopt是自適應(yīng)濾波系數(shù)的最優(yōu)解即維納解。因此,自適應(yīng)過程也是自適應(yīng)濾波器的最佳線性估計的過程,既要估計濾波器能實現(xiàn)期望信號d(k)的整個過程,又要估計濾波權(quán)系數(shù)以進(jìn)行有利于主要目標(biāo)方向的調(diào)整。這些估計過程是以連續(xù)的時變形式進(jìn)行的, 這就是自適應(yīng)濾波器需要有的自適應(yīng)收斂過程。如何縮短自適應(yīng)收斂過程所需要的收斂時間, 這個與算法和結(jié)構(gòu)有關(guān)的問題是人們一直重視研究的問題之一。第四章 基于自適應(yīng)濾波器的語音增強(qiáng)4. 1基本維納濾波器基本維納濾波就是用來解決從噪聲

33、中提取信號問題的一種濾波方法。它的解是以均方誤差最小條件下所得到的系統(tǒng)的傳遞函數(shù)H或單位樣本響應(yīng)h(k)的 形式給出的,因此更常稱這種系統(tǒng)為最佳線性過濾器或濾波器。 設(shè)計維納濾波器 的過程就是尋求在最小均方誤差下濾波器的單位樣本響應(yīng) h(k)或傳遞函數(shù)H (z) 的表達(dá)式,其實質(zhì)是解維納-霍夫(Wiener-Hopf)方程。如圖4-1所示,有兩個信號x(k)和y(k)同時加在濾波器上。典型地y(k)包含 一個與x(k)相關(guān)地分量和另一個與x(k)不相關(guān)地分量。維納濾波器則產(chǎn)生y(k)中 與x(k)相關(guān)分量地最優(yōu)估計,再從y(k)中減去它就得到e(k)o圖4-1基本維納濾波器假定一個N個系數(shù)(權(quán)

34、值)的FIR濾波器的結(jié)構(gòu),維納濾波和原始信號y(k) 之間的差信號e(k)為:ATNV(4.1)Q =yk-nk=yk wXk=yk送w(i)Xk_ii=0其中Xk和w分別為輸入信號矢量和權(quán)矢量,由下式確定:xk|X<4Xk =:WO)1W1)W=(4.2)LXk-eN4),WN-1)e2 =y2-2ykXkTw+wTXkXTw誤差平方為:(4.3)對(4.3)式兩邊取期望得到均方誤差(MSE),若輸入x(k)與輸出y(k)是聯(lián)合平穩(wěn)的,則:名=Eek22TT T(4.4)= Eyk 2EykXk w + Ew XkXk w2TT=CT + 2P w + w Rw其中e代表期望,c&qu

35、ot;2 =Eyk2是y(k)的方差,P = Eykxk是長度為N的互相關(guān)矢量,R=EXkXT是NXN的自相關(guān)矩陣。一個MSE濾波系數(shù)的圖形是碗形地, 且只有唯一地底部,這個圖稱為性能曲面, 它是非負(fù)的。性能曲面的梯度可由下 式給出:ds(4.5)可=-2 P+2RW dw0,濾波(4.6)每組系數(shù)w(i)(i=1,2,-!)對應(yīng)曲面是一點(diǎn),在曲面矢地最小點(diǎn)梯度為權(quán)矢量達(dá)到最優(yōu)wWopt 二 RP即著名的維納一霍夫曼方程的解。自適應(yīng)濾波的任務(wù)是采用合適的算法來調(diào)節(jié)濾 波權(quán)重Wi(0),Wi(1),,Wi(N-1),從而找到性能曲面地最優(yōu)點(diǎn) Wo pt。維納濾波的實際用途有限,若信號為非平穩(wěn)的,

36、則R和P是時變的,必需重復(fù)計算Wo pt。對于實際的應(yīng)用需要能夠依次加入抽樣點(diǎn)而得到 Wo pt的算法。自適應(yīng)算法就是用于達(dá)到這個目的,而且不需顯式計算R和P或進(jìn)行矩陣求逆。4. 2最陡下降法最陡下降法構(gòu)成了不少算法,是 LMS算法的基礎(chǔ)。均方誤差性能函數(shù)為jEd2(n)-2wTrxd + WT FW(4.7)對W求梯度為:J 匕=2RxxW - 2rxd(4.8)由式(4.7)可見,均方誤差 匕是權(quán)系數(shù)W1,Wm的二次函數(shù)。當(dāng)權(quán)矢量W =Wopt時,E達(dá)到最小值Emin,幾何上這相當(dāng)于超拋物面的碗底"。在一般情況,濾波器在迭代過程中或當(dāng)輸入過程統(tǒng)計特性發(fā)生變化時,權(quán)矢量W并不正好等

37、于最佳值Wopt上。為了減小誤差,一個顯然的方法是找出該工作點(diǎn)處使均方誤差匕減小速率最大的方向,亦即梯度 "的負(fù)方向,然后令權(quán)矢量 W(n)沿著梯度的負(fù)方向修正。換句話說,如果在第n次迭代上權(quán)矢量取為W(n),則第 n+1次迭代時,加權(quán)系數(shù) W( n+1)應(yīng)取為:W(n +1) =W(n) - WWE(4.9)其中可wE為E的梯度,而卩為常數(shù)并稱為步長因子或收斂因子。J©的表達(dá)式為:W(n +1) =W(n) -卩2RxxW(n) -2(4.10)或:W(n +1) =(I -2PRxx)W(n)+24rxd(4.11)4. 3 RLS算法RLS算法也是一種對正規(guī)方程的求解

38、方法。RLS算法采用的準(zhǔn)則是:求出濾波器在第N時刻最佳抽頭系數(shù),使得該抽頭系數(shù)對于n時刻及之前的n-1,n-2,n-3,.,n-N +1時刻的輸入數(shù)據(jù)而言,誤差加權(quán)平方和最小。RLS算法中需要的參數(shù)定義如下:誤差的加權(quán)平方和為:列n)=£ Aq(i)-xN(i)CN(n)F(4.12)式中,A為遺忘因子,表示前后數(shù)據(jù)之間的關(guān)聯(lián)性,取值范圍為0v)v1。對RLS算法收斂速度影響不大,但增大 A的值后,可以減小剩余誤差。樣本自相關(guān)陣nRnn(n) =5: XN(i)xN(i)y(4.13)互相關(guān)樣本陣nPN(n)=送 Ad(i)XN(i)i 4(4.14)對上式求導(dǎo),可得CNopr (n

39、) = RNN (n)PN (n)(4.15)式(4.15)為RLS算法下的正規(guī)方程,可以用直接法求出,但這種方法計算量大,當(dāng)濾波器階數(shù)為 N時,完成一次迭代計算,共需要乘法4N2+4N次,加法3N2 +2N次,除法2次。4. 4 LMS算法為了采取最陡下降法,需要知道均方誤差性能函數(shù)的梯度的精度值, 這就要求輸入信號X(n)和需要信號d(n)平穩(wěn)且其二階統(tǒng)計特性為已知。這時可以根據(jù)輸入信號X(n)和需要信號d(n)的采樣值估計Rxx和rxd,從而采用最陡下降法尋求W4pt。但當(dāng)上述條件不具備時,我們只能把隨機(jī)的平方誤差e2(n)當(dāng)成是均方誤差Ee2(n)。對前者進(jìn)行求梯度的運(yùn)算,所得到的結(jié)果

40、就取為關(guān)于后者的真實梯度W©的估計We。這就是由Widrow等人提出的最小均方算法,即LMS算法。下面推導(dǎo)一下它的公式。在最陡下降法的式中,用梯度的估計可Wr代替梯度可即得:W( n+ 1 F W (卅曲(4.16)LMS算法采用如下的梯度估計值:A A22(4.17)y =g Ee (n) ='we (n)即它用瞬時輸出誤差功率的梯度Vwe2(n)作為均方誤差梯度wEe2(n)的估計值。換句話說,它用瞬時平方誤差性能函數(shù)e2(n)代替了均方誤差性能函數(shù)匕=Ee2( n)。得:W(n+1) =W(n) -Wwe2(n)(4.18)(4.19)e (n) =d(n) - y(n

41、) =d(n) -WT (n)X(n)可得:Je2(n) = -2e( n)X(n)(4.20)將式(4.20)代入式(4.16)得:LMS(4.21)W(n +1) =W( n) + 2Pe2(n)X( n)算法的遞推式的最大優(yōu)點(diǎn)是它沒有交叉項,因而可以方便地寫成純量方程組:Wi(n +1)=W( n)+24e(n)Xj( n) ,i=1,2,M(4.22)W(n +1) =W(n) +円2rxd 2RxxW(n)。F面,我們對LMS算法加權(quán)矢量的平均值的變化規(guī)律和加權(quán)矢量的隨機(jī)起伏所形成的影響進(jìn)行討論。1 LMS算法加權(quán)矢量平均值的收斂條件為當(dāng)且僅當(dāng)(4.23)愎EW(n)譏 pt因為實用時很少能夠知道 Rxx的各個特征值,實際上,我們有(4.24)'max <Tr Rxx(4.25)其中TrRxx為Rxx的跡,且mmTrRxx =送=£ Ex2(n-i +1) =MPimi ztiT(4.26)式中Rm為輸入信號x(n)的功率。這樣,我們可以寫出下列

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論