第四章小波變換_第1頁
第四章小波變換_第2頁
第四章小波變換_第3頁
第四章小波變換_第4頁
第四章小波變換_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、.語音增強(qiáng)算法研究p584.1小波理論小波變換的定義4.1. 2小波去噪原理.4.2小波包變換語音增強(qiáng)方法 小波包變換語音增強(qiáng)方法原理4 2. 2 Bark尺度小波包分解閩值函數(shù) 實驗仿真4.3小波包變換和聽覺掩蔽效應(yīng)的語音增強(qiáng)方法4.3. 1小波包變換和聽覺掩蔽效應(yīng)的語音增強(qiáng)方法原理4.3. 2實驗仿真第四章 小波包語音增強(qiáng)算法 小波(Wavelets)分析的起源可以追溯到20世紀(jì)初,在20世紀(jì)80年代后期開始形成一個新興的數(shù)學(xué)分支。小波變換是調(diào)和分析這一數(shù)學(xué)領(lǐng)域半個世紀(jì)以來的工作結(jié)晶,是傅里葉變換發(fā)展史上的里程碑式的進(jìn)展,近些年來成為國外眾多學(xué)者共同關(guān)注的熱點。它在傅里葉變換的基礎(chǔ)上發(fā)展而

2、來,但又有極大不同。傳統(tǒng)的信號處理方法是建立在傅立葉變換的基礎(chǔ)上,而傅立葉分析使用的是一種全局的變換,要么完全在時域,要么完全在頻域,因此無法表達(dá)信號的時頻局域性質(zhì),而這種性質(zhì)恰恰是非平穩(wěn)信號(如語音信號)最根本和最關(guān)鍵的性質(zhì)。小波分析是建立在泛函分析、傅立葉分析、樣條分析及調(diào)和分析基礎(chǔ)上的新的分析處理工具它又稱為多分辨分析,在時域和頻域同時具有良好配局部化特性,常被譽(yù)為信號分析的“數(shù)學(xué)顯微鏡”。小波變換在時頻兩域都具有表征信號局部特征的能力,它克服了短時傅立葉變換固定分辨率的缺點,在信號的高頻部分,可以獲得較好的時間分辨率,在信號的低頻部分可以獲得較高的頻率分辨率,這就使指小波變換具有對信號

3、的自適應(yīng)性。它能有效地從信號中提取信息,通過伸縮和平移等運算功能對信號進(jìn)行多尺度細(xì)化分析。小波分析是目前國際上公認(rèn)的信號信息獲取與處班領(lǐng)域的高新技術(shù),是信號處理的前沿課題,其中小波去噪也是小波分析的主要應(yīng)用之一,對語音增強(qiáng)的研究不可避免的要利用小波這一有效工具。 小波包變換理論是20世紀(jì)80年代中后期逐漸成熟并發(fā)展起來的,由于可同時進(jìn)行時域和頻域分析,具有時頻局部化和變分辨特征,而且小波函數(shù)的選取也很靈活,因此在語音增強(qiáng)中得到了廣泛的應(yīng)用。這就使得小波包變換在信號處理方面有許多獨到的優(yōu)點,特別適用于像信號處理,圖象處理,量子場論,地震探測,話音識別與增強(qiáng),雷達(dá),機(jī)器視覺以及數(shù)字電視等科技領(lǐng)域3

4、1-354.1小波理論4.1.1小波變換的定義其中,為給定的一個基本函數(shù),式中a,b均為常數(shù),且a>0。給定平方可積的信號x(t , ,則的小波變換(wavelet transform,WT)定義為:式中,a,b和t均是連續(xù)變量。因此此式又稱為連續(xù)小波變換(CWT)。信號的小波變換 (a,b)是a和b的函數(shù),b是時移,a是尺度因子。又稱為基本小波,或母小波。是母小波經(jīng)移位和伸縮所產(chǎn)生的一組函數(shù),稱之為小波基函數(shù),或簡稱小波基。母小波可以是實函數(shù),也可以是復(fù)函數(shù)。若是實信號,也是實信號,則也是實函數(shù),反之,為復(fù)函數(shù)。在(5-l)式中,時移b的作用是確定對分析的時間位置,也即時間中心。尺度因

5、子a的作用是把基本小波作伸縮。由變成,當(dāng)a>1時,a越大,則的時域支撐范圍(即時域?qū)挾?較之變得越大;反之,當(dāng)a<1時,a越小,則的寬度越窄。這樣,a和b聯(lián)合起來確定了對分析的中心位置及分析的時間寬度。這樣,(5-2)式的小波變換可以理解為用一組分析寬度不斷變化的基函數(shù)對作分析,這一變化正好適應(yīng)了對信號分析時在不同頻率范圍需要不同的分辨率這一基本要求。(5-2)式中的因子是為了保證在不同的尺度a時,始終能和母函數(shù)有蓍相同的能量,即:令,則dt=adt',這樣,上式右邊的積分即等于。令的傅里葉變換為 , 的傅里葉變換為,由傅里葉變換的性質(zhì):的傅里葉變換為:由Parseval定

6、理,(5-2)式可重新表達(dá)為:此式即為小波變換的頻域表達(dá)式36。小波去噪原理假設(shè)觀察信號式中,是純凈語音信號,是噪聲序列。假定是零均值且服從高斯分布的隨機(jī)序列,對(5-5)式兩邊做小波變換,根據(jù)小波變換的性質(zhì),有:即兩個信號和的小波變換等于各個信號小波變換的和。再令u (t)是零均值、獨立同分布的平穩(wěn)隨機(jī)信號,記。顯然:是的協(xié)方差矩陣。令是小波變換矩陣,對于正交小波變換,它是正交陣。分別令x和s是對應(yīng)s(t)和u(t)的向量,向量X, S和U分別是x(t) , s(t)和u(t)的小波變換,即:由于X =S+U。令P是U的協(xié)方差矩陣,由于:所以:因為W是正交陣,且。 由此,可得到一個重要的結(jié)論

7、:平穩(wěn)白噪聲的正交小波變換仍然是平穩(wěn)的白噪聲。由此結(jié)論可知,對于加法性噪聲模型,經(jīng)正交小波變換后,最大程度地去除了的相關(guān)性,其能量將集中在少數(shù)的小波系數(shù)上,這些系數(shù)即是信號經(jīng)小波變換后在各個尺度下的模極大值。但是,噪聲經(jīng)正交小波變換后仍然是白噪聲,因此,其小波系數(shù)仍然是不相關(guān)的,它們將分布在各個尺度下的所有時間軸上。這一結(jié)論即為抑制噪聲提供了理論依據(jù),即在小波變換的各個尺度下保留那些模極大值點,而將其他點置零,或是最大程度地減小,然后利用處理后的小波系數(shù)做小波反變換,即可達(dá)到抑制噪聲的目的。5.2小波包變換語音增強(qiáng)方法5.2.1小波包變換語音增強(qiáng)方法原理 在小波變換中,由于多分辨分析只是對低頻

8、部分作進(jìn)一步分解,高頻部分則不再分解。小波包分析能將頻帶進(jìn)行多層次劃分,對多分辨分析沒有細(xì)分的高頻部分進(jìn)一步分解,并能夠根據(jù)被分析信號的特征,自適應(yīng)地選擇相應(yīng)頻帶,使之與信號頻譜相匹配,從而提高了時一頻分辨率37。假設(shè)帶噪語音信號可以表示為:其中,是含有噪聲的語音信號,是沒有疊加噪聲的語音信號,是方差為的高斯白噪聲。 對信號進(jìn)行N層離散小波包分解,得到一組小波包分解系數(shù),由兩部分組成:一部分是對應(yīng)的小波包系數(shù),記為,另一部分是對應(yīng)的小波包系數(shù),記為對于每一個小波包分解系數(shù),選擇一個當(dāng)?shù)拈撝担ο禂?shù)進(jìn)行閾值量化,得出估計小波系數(shù),使得盡量小。5.2.2 Bark尺度小波包分解Barkhause

9、n等學(xué)者依據(jù)人耳的掩蔽效應(yīng)的實驗結(jié)果,提出了頻率群的概念。即將基底膜分解為許多的小段,每一小段稱為一個頻率群。在20-16000Hz范圍內(nèi)共有24個頻率群。同一頻率群的聲音在大腦中是疊加在一起進(jìn)行評價的,具有一致的心理聲學(xué)特征。按頻率由低到高,將頻率群順序編號,將編號定義為32新的頻率單位Bark。若記Bark域的頻率變量為z,赫茲(Hertz)域頻率變量為,則有:Bark域的頻率描述充分反映了人耳的聽覺特性,因此在語音處理方面得到了大量應(yīng)用。根據(jù)小波包的函數(shù)空間正交剖分理論,可以構(gòu)造與人耳Bark域頻率描述相似的小波包分解結(jié)構(gòu),稱之為“Bark尺度小波包分解”。常規(guī)方法是模擬人耳的24個頻率

10、群,對于8kHz采樣的語音信號,選取1至17個頻率群,得到的每個子帶的中心頻率相差1Bark。試驗證實,如果對Bark域進(jìn)行進(jìn)一步分解,使每個子帶的中心頻率相差減至,對語音的描述會更加細(xì)致,也不會導(dǎo)致較大的計算量。因此,本論文采用的小波包分解樹結(jié)構(gòu)如圖5-1所示,共68個子頻帶38-41。5.2.3閾值函數(shù) 在小波閾值去噪理論中42-44,閾值函數(shù)的選取和閾值的確定是兩個最基本的問題。目前存在的閾值函數(shù)主要是硬閾值函數(shù)和軟閾值函數(shù)。但由于硬閾值函數(shù)整體不連續(xù),直接導(dǎo)致了會在去噪后的信號中出現(xiàn)突變的震蕩點,當(dāng)噪聲水平較高時,這種現(xiàn)象尤為明顯。軟閾值函數(shù)雖然整體連續(xù)性好,但是由于當(dāng)小波系數(shù)較大時,

11、處理過的系數(shù)與原系數(shù)之間總存在恒定的偏差,這將直接影響重構(gòu)信號與真實信號的逼近程度,給重構(gòu)信號帶來不可避免的誤差??紤]到軟、硬閾值函數(shù)存在的缺陷,人們提出了各種基于這兩種基本閾值函數(shù)的改進(jìn)的閾值函數(shù)。 小波閾值在去噪過程中起到了決定性的作用。如果太小,那么,施加閾值以后的小波系數(shù)中將包含過多的噪聲分量,達(dá)不到去噪的目的;反之,如果太大,那么將去除一部分信號的分量,從而使由小波系數(shù)重將后的信號產(chǎn)生過大的失真。因此,在實際工作中,估計閾值的大小尤為關(guān)鍵。常用的估計閥值的閥值函數(shù)為硬閾值函數(shù)45和軟閾值函數(shù)46: 但是,由于硬閾值函數(shù)整體不連續(xù),直接導(dǎo)致了會在去噪后的信號中出現(xiàn)突變的震蕩點,當(dāng)噪聲水

12、平較高時尤為明顯。軟閾值函數(shù)雖然整體連續(xù)性好,但是由于當(dāng)小波系數(shù)較大時,處理過的系數(shù)與原系數(shù)之間總存在恒定的偏差,這將直接影響重構(gòu)信號與真實信號的逼近程度。文獻(xiàn)36提出了一種改進(jìn)的閥值函數(shù)能夠有效減少失真,其閥值函數(shù):一種改進(jìn)的閥值函數(shù)公式為:小波包變換語音增強(qiáng)方法原理圖:小波包變換的語音增強(qiáng)算法的具體步驟為:步驟1:對帶噪語音分幀。步驟2:采用5階Daubechies小波進(jìn)行Bark尺度小波包分解,得到每一級的小波包分解系數(shù)。步驟3:用小波系數(shù)在各尺度下絕對值的中值估算噪聲方差。步驟4:利用通用閥值計算每一級的節(jié)點閥值,并對該節(jié)點的小波包分解系數(shù)進(jìn)行采用公式(5-15)的處理,更新小波包系數(shù)

13、。步驟5:進(jìn)行小波包重建,重疊相加恢復(fù)原始數(shù)據(jù)幀長度的增強(qiáng)語音。5.2.4實驗仿真用MATLAB對Bark尺度小波包變換語音增強(qiáng)方法進(jìn)行實驗仿真:1. 實驗所用數(shù)據(jù):語音取自863語音庫,噪聲為NOISEX. 92數(shù)據(jù)庫的高斯白噪聲和火車噪聲,語音信號的采樣率為8kHz,幀長K為256個采樣點,幀疊為50%。2.仿真所選標(biāo)準(zhǔn):波形圖,語譜圖。3.仿真結(jié)果如下:5.3小波包變換和聽覺掩蔽效應(yīng)的語音增強(qiáng)方法5.3.1小波包變換和聽覺掩蔽效應(yīng)的語音增強(qiáng)方法原理 小波包變換理論是20世紀(jì)80年代中后期逐漸成熟并發(fā)展起來的,由于可同時進(jìn)行時域和頻域分析,具有時頻局部化和變分辨特征,而且小波函數(shù)的選取也很

14、靈活,因此在語音增強(qiáng)中得到了廣泛的應(yīng)用。但是,增強(qiáng)后不可避免地伴有一定程度的音樂噪聲,影響了增強(qiáng)效果。掩蔽效應(yīng)通過模擬人耳的感知,能夠掩蔽同時進(jìn)入聽覺系統(tǒng)的較小噪聲信號。優(yōu)點是可以有效地抑制音樂噪聲,缺點是性能受限于對背景噪聲功率譜估計的準(zhǔn)確性,且計算量較大,運行速度較慢。為了抑制音樂噪聲和提高運算速度,本文提出一種基于小波包變換和聽覺掩蔽效應(yīng)的語音增強(qiáng)算法,同時具備了小波包變換和掩蔽效應(yīng)兩種方法的優(yōu)點。仿真結(jié)果表明,該算法在信噪比和聽覺舒適度上都取得了較好的效果。小波包變換和聽覺掩蔽效應(yīng)的語音增強(qiáng)方法原理圖:感知濾波器的作用是在信號頻譜失真最小的情況下使殘差噪聲的頻譜能量小于掩蔽閾值。感知濾

15、波器應(yīng)滿足:其中,為背景噪聲功率譜密度,為噪聲掩蔽閾值。的具體形式為:基于小波包變換和聽覺掩蔽效應(yīng)的語音增強(qiáng)算法的步驟為:步驟1:對帶噪語音信號用小波包分解的方法進(jìn)行去噪處理,得到增強(qiáng)后的語音信號,并進(jìn)行分幀得到。步驟2:用Johnston掩蔽模型計算掩蔽閥值T。步驟3:使增強(qiáng)語音和掩蔽閥值T經(jīng)過感知濾波器進(jìn)行濾波,得到步驟4:經(jīng)過幀重疊相加得到增強(qiáng)語音。5.3.2實驗仿真 用MATLAB對小波包變換和聽覺掩蔽效應(yīng)的語音增強(qiáng)方法進(jìn)行實驗仿真:1.實驗所用數(shù)據(jù): 語音取自863語音庫,噪聲為NOISEX. 92數(shù)據(jù)庫的高斯白噪聲和火車噪聲,語音信號的采樣率為8kHz,幀長K為256個采樣點,幀疊

16、為50%。2.仿真所選標(biāo)準(zhǔn):波形圖,語譜圖,信噪比,PESQ值,坂倉距離。3.仿真結(jié)果如下: 首先,在純凈語音中加入5dB高斯白噪聲作為帶噪語音,采用基于小波包變換和聽覺掩蔽效應(yīng)的語音增強(qiáng)算法(本文算法),比較傳統(tǒng)的小波包變換增強(qiáng)算法,增強(qiáng)后仿真結(jié)果如下:4.結(jié)果分析 圖5-6和圖5-7分別為增強(qiáng)后的波形圖和語譜圖。其中,(a)為純凈語音;(b)為添加5dB白噪聲后的帶噪語音;(c)為采用小波包變換語音增強(qiáng)方法后的增強(qiáng)語音。(d)為采用小波包變換和掩蔽效應(yīng)語音增強(qiáng)方法后的增強(qiáng)語音。從時域波形圖及頻域語譜圖的比較結(jié)果可以發(fā)現(xiàn),帶噪語音采用本文算法增強(qiáng)后,增強(qiáng)語音和原始語音在波形圖和語譜圖上非常接

17、近,噪聲得到了明顯的抑制,增強(qiáng)效果明顯優(yōu)于傳統(tǒng)小波包變換的增強(qiáng)算法。其次,采用在純凈語音中分別加入高斯白噪聲,全局信噪比為OdB,5dB,10dB的帶噪語音作為測試對象。比較小波包變換和聽覺掩蔽效應(yīng)的語音增強(qiáng)方法和傳統(tǒng)小波包變換的增強(qiáng)算法,增強(qiáng)后語音質(zhì)量性能的評估采用信噪比SNR和語音質(zhì)量感知評估PESQ,PESQ是ITU-T的P.862標(biāo)準(zhǔn),用來評價增強(qiáng)后語音的試聽效果。PESQ得分在4.5到-0.5之間,得分越高表示語音質(zhì)量越好。實驗結(jié)果如表5-1示:從實驗結(jié)果可以看出,在各種信噪比下采用小波包變換和聽覺掩蔽效應(yīng)的語音增強(qiáng)方法比傳統(tǒng)小波包方法,在信噪比和PESQ上都有很大提高,并且在信噪比

18、較小的情況下,增強(qiáng)效果更加明顯。通過主觀聽測表明:采用傳統(tǒng)小波包方法增強(qiáng)后伴有明顯的音樂噪聲,而采用該方法增強(qiáng)后音樂噪聲得到了明顯地抑制,取得了較好的增強(qiáng)效果。5.4子空間和小波包變換的語音增強(qiáng)方法5.4.1子空間與小波包變換的語音增強(qiáng)方法原理子空間與小波包變換的語音增強(qiáng)方法原理圖為:子空間與小波包變換的語音增強(qiáng)方法具體步驟為:步驟1:帶噪語音進(jìn)行KL,變換,得到子空間域中的帶噪語音的特征向量U和特征值。步驟2:采用最小值跟蹤算法更新帶噪語音特征值,得到估計噪聲特征值。步驟3:采用小波包變換方法更新帶噪語音特征值得到。步驟4:帶噪語音特征值減去噪聲特征值,得到純凈語音特征值估計值,可以得到時域約束估計器(TDC)增益G。步驟5:由KL逆變換可得最優(yōu)估計器。由式可得純凈語音的估計。實驗仿真 用MATLAB對子空間與小波包變換的語音增強(qiáng)方法進(jìn)行實驗仿真:1.實驗所用數(shù)據(jù): 語音取自863語音庫,噪聲為NOISEX. 92數(shù)據(jù)庫的高斯白噪聲和火車噪聲,語音信號的采樣率為8kHz,幀長K為256個采樣點,幀疊為50%。2.仿真所選標(biāo)準(zhǔn):波形圖,語譜圖,信噪比,PESQ值,GUI語音增強(qiáng)性能測試界面。3.仿真結(jié)果如下: 首先在純凈語音中加入SdB高斯白噪聲作為帶噪語音,采用子空間與小波包變換的語音增強(qiáng)方法

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論