第9章抗噪聲語音處理技術(shù)課件_第1頁
第9章抗噪聲語音處理技術(shù)課件_第2頁
第9章抗噪聲語音處理技術(shù)課件_第3頁
第9章抗噪聲語音處理技術(shù)課件_第4頁
第9章抗噪聲語音處理技術(shù)課件_第5頁
已閱讀5頁,還剩37頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

9.1概述語音信號作為信息的最普遍最直接的表達(dá)方式,在許多領(lǐng)域具有廣泛的應(yīng)用前景?,F(xiàn)實(shí)生活中的語音不可避免的要受到環(huán)境的影響。噪聲分類:

按類別:可分為環(huán)境噪聲等的加性噪聲和殘響及電器線路干擾等的乘法性噪聲

按性質(zhì):平穩(wěn)噪聲和非平穩(wěn)噪聲LomBard現(xiàn)象:在噪聲環(huán)境下,說話者情緒會發(fā)生變化,從而引起聲帶的變化(對語音處理系統(tǒng)的影響相對較?。﹪鴥?nèi)外語音信號處理研究成果

目前國內(nèi)外的研究成果從增強(qiáng)思想上主要分為以下三類:1)采用語音增強(qiáng)算法,提高語音識別系統(tǒng)前端預(yù)處理的抗噪聲能力,提高輸入信號的信噪比。(與后端應(yīng)用無關(guān))2)第二類方法是尋找穩(wěn)健的耐噪聲的語音特征參數(shù)。如采用短時修正的相干系數(shù)(Short-TimeModifiedCoherenceCoefficient,簡稱為SMC)作為語音特征參數(shù)。3)第三類方法是基于模型參數(shù)適應(yīng)化的噪聲補(bǔ)償算法,如針對加法性噪聲的HMM合成法,和針對乘法性噪聲的StochasticMatching法等。通常只考慮到噪聲環(huán)境是平穩(wěn)的,在低信噪比語音以及非平穩(wěn)噪聲環(huán)境中的效果并不理想。9.1概述9.2語音特性、人耳感知特性及噪聲特性9.3語音增強(qiáng)技術(shù)9.4特征補(bǔ)償技術(shù)9.5模型補(bǔ)償技術(shù)第九章抗噪聲語音處理技術(shù)9.2語音特性、人耳感知特性及噪聲特性語音特性語音信號是一種非平穩(wěn)的隨機(jī)信號任何語言的語音都有元音和輔音兩種音素,根據(jù)發(fā)音機(jī)理的不同,輔音又可以分為清輔音和濁輔音。語音信號,作為非平穩(wěn)、非遍歷隨機(jī)過程的樣本函數(shù),其短時譜的統(tǒng)計(jì)特性在語音增強(qiáng)中又著舉足輕重的作用。(據(jù)中心極限定理,語音的短時譜的統(tǒng)計(jì)特性服從高斯分布。)人耳感知特性:對于聲波頻率高低的感覺與實(shí)際頻率的高低不呈線性關(guān)系,而近似為對數(shù)關(guān)系;對頻率的分辨能力受聲強(qiáng)的影響;對語音信號的幅度譜較為敏感,對相位不敏感。人耳掩蔽效應(yīng):產(chǎn)生一個聲音由于另外一個聲音的出現(xiàn)而導(dǎo)致該聲音能被感知的閥值提高的現(xiàn)象。

語音增強(qiáng)的最終效果度量是人耳的主觀感覺,所以在語音增強(qiáng)中可以利用人耳感知特性來減少運(yùn)算代價。

噪聲特性對噪聲進(jìn)行劃分的標(biāo)準(zhǔn)很多各種分類方法分析角度不同,介紹一下下面兩種分類方法:1).根據(jù)噪聲統(tǒng)計(jì)特性隨時間變化的程度可以將噪聲分為平穩(wěn)噪聲,緩變噪聲和沖激噪聲。2)根據(jù)噪聲對語音頻譜的干擾方式可以把噪聲主要分為加性噪聲和乘性噪聲。

乘性噪聲:乘性噪聲是指噪聲和語音在頻譜是相乘的關(guān)系在時域和語音則是卷積的關(guān)系。例殘響及傳輸網(wǎng)絡(luò)的電路噪聲(非加性噪聲往往可以通過某種變換,如同態(tài)濾波,轉(zhuǎn)為加性噪聲)

加性噪聲:當(dāng)噪聲對語音的干擾表現(xiàn)為兩者信號在時域進(jìn)行相加時該噪聲被稱為加性噪聲顯然噪聲和語音在頻域也為相加關(guān)系。例:沖激噪聲、周期噪聲、寬帶噪聲、語音干擾

(1)沖激噪聲:例如放電,打火,爆炸都會引起沖激噪聲,它的時域波形是類似于沖激函數(shù)的窄脈沖。消除沖激噪聲影響的方法通常有兩種:對帶噪語音信號的幅度求均值,將該均值做為判斷閾,凡是超過該閾值的均判為沖激噪聲,在時域中將其濾除;當(dāng)沖激脈沖不太密集時,也可以通過某些點(diǎn)內(nèi)插的方法避開或者平滑掉沖激點(diǎn),從而能在重建語音信號去掉沖激噪聲。(2)周期噪聲:最常見的有電動機(jī),風(fēng)扇之類周期運(yùn)轉(zhuǎn)的機(jī)械所發(fā)出的周期噪聲,50Hz交流電源哼哼聲也是周期噪聲。通??梢圆捎孟莶ㄆ鞣椒ㄓ枰詾V除。3)寬帶噪聲:說話時同時伴隨著呼吸引起的噪聲,隨機(jī)噪聲源產(chǎn)生的噪聲,以及量化噪聲等都可以視為寬帶噪聲,應(yīng)用中常近似為Gauss噪聲或白噪聲。其顯著特點(diǎn)是噪聲頻譜遍布于語音信號頻譜之中,導(dǎo)致消除噪聲較為困難。一般需要采取非線性處理方法。(4)語音干擾:干擾語音信號和待傳語音信號同時在一個信道中傳輸所造成語音干擾稱為語音干擾。區(qū)別有用語音和干擾語音的基本方法是利用它們的基音差別。考慮到一般情況下兩種語音的基音不同,也不成整數(shù)倍,這樣可以用梳狀濾波器提取基音和各次諧波,再恢復(fù)出有用語音信號。(5)傳輸噪聲:這是傳輸系統(tǒng)的電路噪聲。與背景噪聲不同,它在時間域里是語音和噪聲的卷積。處理這種噪聲可以采用同態(tài)處理的方法,把非加性噪聲變換為加性噪聲來處理語音信號和噪聲信號的區(qū)別通過語音降噪技術(shù)來改善語音質(zhì)量的過程如圖14-1所示9.1概述9.2語音特性、人耳感知特性及噪聲特性9.3語音增強(qiáng)技術(shù)9.4特征補(bǔ)償技術(shù)9.5模型補(bǔ)償技術(shù)第九章抗噪聲語音處理技術(shù)通過語音增強(qiáng)技術(shù)來改善語音質(zhì)量的過程:語音增強(qiáng)語音增強(qiáng)的主要目的是從帶噪的語音信號中盡可能地恢復(fù)出純凈的語音信號語音增強(qiáng)的主要目的是從帶噪的語音信號中盡可能地恢復(fù)出純凈的語音信號。主要介紹下面兩種增強(qiáng)方法:

減譜法Weiner濾波法減譜法(SS)語音增強(qiáng)技術(shù)

基本原理

減譜法是處理寬帶噪聲較為傳統(tǒng)和有效的方法,其基本思想是在假定加性噪聲與短時平穩(wěn)的語音信號相互獨(dú)立的條件下,從帶噪語音的功率譜中減去噪聲功率譜,從而得到較為純凈的語音功率譜。

如果設(shè)為純凈語音信號,為噪聲信號,為帶噪語音信號,則有:用分別表示的傅里葉變換,可得下式:由于假定語音信號與加性噪聲是相互獨(dú)立的,因此有:因此,如果用分別表示的功率譜,則有:而由于平穩(wěn)噪聲的功率譜在發(fā)聲前和發(fā)聲期間可以認(rèn)為基本沒有變化,這樣可以通過發(fā)聲前的所謂的“寂靜段”(認(rèn)為在這一段里沒有語音只有噪聲)來估計(jì)噪聲的功率譜,從而有:

這樣減出來的功率譜可以認(rèn)為是較為純凈的語音功率譜,然后,從這個功率譜可以恢復(fù)降噪后的語音時域信號。

在具體計(jì)算時,為防止出現(xiàn)負(fù)功率譜的情況,減譜時當(dāng)

時,令,即完整的減譜公式如下:

減譜法語音增強(qiáng)技術(shù)的基本原理圖如圖14-10所示。圖中處理頻域過程只考慮了功率譜的變換,而最后IFFT變換中需要借助相位譜來恢復(fù)降噪后的語音時域信號。依據(jù)人耳對相位不敏感之一特點(diǎn),這時可用原帶噪語音的相位譜來代替估計(jì)之后的語音信號的相位譜來恢復(fù)降噪后的語音時域信號。利用Weiner濾波法語音增強(qiáng)技術(shù)

本節(jié)主要討論在最小均方準(zhǔn)則下用Weiner濾波器實(shí)現(xiàn)對語音信號的估計(jì),即對于帶噪語音信號(其中為純凈語音信號,為噪聲信號),確定濾波器的沖擊響應(yīng),使得帶噪語音信號經(jīng)過該濾波器的輸出能夠滿足

最?。闉V波器輸出)。1)基本原理

假定和都是短時平穩(wěn)隨機(jī)過程,則由Winer-Hopf積分方程為:

兩邊取傅里葉變換有:從而得到:

再由于:

并且考慮到由于和相互獨(dú)立,所以有:

將式(14-32)和式(14-33)代入式(14-31),則有下式成立:

以上推到過程是在短時平穩(wěn)的前提下進(jìn)行的,所以語音信號必須是加窗后的短時幀信號。可以由類似于減譜法中討論的方法得到;可以用帶噪語音功率譜減去噪聲功率譜得到。

還有其他的一些Weiner濾波器的形式,如有理分式結(jié)構(gòu)的Weiner濾波器、隱含Weiner濾波器等等。采用Weiner濾波器的最大好處是增強(qiáng)后的殘留噪聲類似于高斯白噪聲,而不是有節(jié)奏起伏的音樂噪聲。9.1概述9.2語音特性、人耳感知特性及噪聲特性9.3語音增強(qiáng)技術(shù)9.4特征補(bǔ)償技術(shù)9.5模型補(bǔ)償技術(shù)第九章抗噪聲語音處理技術(shù)特征補(bǔ)償技術(shù)主要通過信號的統(tǒng)計(jì)特性將帶噪語音特征參數(shù)中的噪聲部分去除,消除噪聲影響,得到干凈的語音特征參數(shù)以進(jìn)行語音系統(tǒng)處理。該方法包括CDCN、SDCN、SPLICE和VTS等方法。CDCN(Code-DependentCepstralNormalization)

CDCN是早期的特征增強(qiáng)的方法之一,可以聯(lián)合補(bǔ)償加性噪聲和信道畸變。其基本思想是對加性噪聲和信道進(jìn)行估計(jì),從而使輸入幀的聲學(xué)空間與當(dāng)前環(huán)境的聲學(xué)空間達(dá)到最好的匹配。CDCN方法假設(shè)語音特征分布滿足高斯混合模型(GaussianMixtureModel,GMM)分布,其實(shí)現(xiàn)過程可以分為以下兩步:1)用EM算法對式(2.3)中的n和h進(jìn)行估計(jì),并求出代表式中g(shù)(n?x?h)的修正矢量r,迭代公式如下:特征補(bǔ)償技術(shù)在很多情況下,背景噪聲和失真的變化相對于語音信號的變化來說要緩慢得多,并且語音信號的動態(tài)部分在語音的感知中具有很大作用。在語音特征的提取過程中,如果去除其慢變部分,則既可以去除穩(wěn)定和變化緩慢的噪聲,同時也保留了語音中對感知重要的動態(tài)部分,因此可以提高識別系統(tǒng)在噪聲環(huán)境中的識別率。這種方法在抗噪聲語音特征的提取中得到廣泛的應(yīng)用,通常可以應(yīng)用在功率譜域、LOG能量譜域、倒譜域或自相關(guān)等域中。9.1概述9.2語音特性、人耳感知特性及噪聲特性9.3語音增強(qiáng)技術(shù)9.4特征補(bǔ)償技術(shù)9.5模型補(bǔ)償技術(shù)第九章抗噪聲語音處理技術(shù)語音增強(qiáng)特征補(bǔ)償技術(shù)模型補(bǔ)償技術(shù)模型補(bǔ)償技術(shù)與抗噪聲語音特征和語音增強(qiáng)技術(shù)相比,模型補(bǔ)償技術(shù)不是通過減小噪聲對語音信號或語音特征的影響來提高識別系統(tǒng)在噪聲環(huán)境中的識別率,而是通過修改語音模型的參數(shù),使其能更準(zhǔn)確地描述噪聲環(huán)境中語音信號的統(tǒng)計(jì)特性來提高處理系統(tǒng)的性能。模型補(bǔ)償技術(shù)優(yōu)點(diǎn):由于這種方法充分地考慮了環(huán)境噪聲的特性,因此通常能取得很好的效果。缺點(diǎn):是補(bǔ)償后的語音模型只能適應(yīng)于特定的工作環(huán)境,并且所需計(jì)算量一般比較大。方法:PMC模型補(bǔ)償方法、環(huán)境模型自適應(yīng)方法和VTS模型補(bǔ)償方法等。PMC是

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論