基于matlab譜減法音頻降噪處理...doc_第1頁(yè)
基于matlab譜減法音頻降噪處理...doc_第2頁(yè)
基于matlab譜減法音頻降噪處理...doc_第3頁(yè)
基于matlab譜減法音頻降噪處理...doc_第4頁(yè)
基于matlab譜減法音頻降噪處理...doc_第5頁(yè)
已閱讀5頁(yè),還剩14頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

精品文檔題目 基于matlab譜減法音頻降噪處理 班級(jí) 學(xué)號(hào) 姓名 指導(dǎo) 時(shí)間 景德鎮(zhèn)陶瓷學(xué)院數(shù)字信號(hào)處理課程設(shè)計(jì)任務(wù)書姓名 _ 班級(jí) _ _ _ 指導(dǎo)老師 設(shè)計(jì)課題: 基于matlab譜減法音頻降噪處理設(shè)計(jì)任務(wù)與要求1、題目選擇:根據(jù)自己掌握的情況選擇合適的題目,要求IIR濾波器的設(shè)計(jì)中,模擬濾波器的設(shè)計(jì)選擇一個(gè),數(shù)字濾波器的設(shè)計(jì)選擇一個(gè),F(xiàn)IR濾波器的設(shè)計(jì)中,窗函數(shù)選擇一個(gè)(可參考選題另有附件);2、掌握Matlab軟件的基本應(yīng)用;設(shè)計(jì)步驟1、選擇適當(dāng)?shù)念}目,查閱相關(guān)資料;2、技術(shù)參數(shù)設(shè)定,選定所要設(shè)計(jì)的某種類型的濾波器后,設(shè)定相應(yīng)的技術(shù)參數(shù);3、Matlab程序設(shè)計(jì);4、得出結(jié)果和仿真波形;5、總結(jié),對(duì)以上各步驟寫出詳細(xì)的設(shè)計(jì)報(bào)告,存在什么問題,如何解決。正文字?jǐn)?shù)不得少于3000字。參考文獻(xiàn)(1) 程佩青 數(shù)字信號(hào)處理教程 清華大學(xué)出版社(2) 吳鎮(zhèn)揚(yáng) 數(shù)字信號(hào)處理 高等教育出版社(3) 胡廣書 數(shù)字信號(hào)處理導(dǎo)論 清華大學(xué)出版社(4) (5) (6)目 錄1、 設(shè)計(jì)要求. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .12、 設(shè)計(jì)原理. . . . . . . . . . . . . . . . . . .23、 源程序清單. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .74、 設(shè)計(jì)結(jié)果和仿真波形 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .115、 參考文獻(xiàn). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15.6、 設(shè)計(jì)心得體會(huì). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163歡迎下載。1、設(shè)計(jì)要求語言是人類最重要、直接、有效和便捷的交換信息的方式。隨著近些年科學(xué)技術(shù)的飛速發(fā)展,人們也不滿足于和計(jì)算機(jī)的信息交換方式,希望能夠甩掉鍵盤和鼠標(biāo)而實(shí)現(xiàn)用語言來對(duì)計(jì)算機(jī)進(jìn)行控制。因此,語音信號(hào)處理技術(shù)便應(yīng)運(yùn)而生。語音信號(hào)處理是一門新興的學(xué)科,同時(shí)也是綜合多種學(xué)科和涉及面非常廣泛的交叉學(xué)科?,F(xiàn)在在一些職能系統(tǒng)中嵌入有語音處理系統(tǒng),但它們只能在安靜的環(huán)境中才能使用。然而,在語音信息的采集過程中難免會(huì)有各種噪聲的干擾。噪聲不僅降低了語音的可懂度和語音質(zhì)量,還嚴(yán)重的影響語音處理的準(zhǔn)確性,甚至使系統(tǒng)不能正常工作。本文將就對(duì)語音增強(qiáng)技術(shù)的原理和方法進(jìn)行討論,重點(diǎn)介紹語音增強(qiáng)的一種方法譜減法及其改進(jìn)算法。該方法能夠有效消除平穩(wěn)的加性噪聲,其改進(jìn)算法能夠有效消除普通方法產(chǎn)生的“音樂噪聲”,在很大程度上提高語音信號(hào)的信噪比。目前,語言識(shí)別技術(shù)已經(jīng)取得了重大進(jìn)展,并開始進(jìn)入實(shí)用階段。但語音識(shí)別系統(tǒng)必須在相對(duì)比較安靜的環(huán)境下運(yùn)行,然而,在語言信息的采集中難免會(huì)有各種噪聲的干擾,在較強(qiáng)的噪聲背景下,語音識(shí)別系統(tǒng)的準(zhǔn)確性會(huì)受到較大影響,甚至沒法正常工作。所以在語音識(shí)別系統(tǒng)對(duì)語音信息處理前,應(yīng)該對(duì)語音信息進(jìn)行預(yù)處理,即背景噪聲消除。語音背景噪聲消除技術(shù)的出現(xiàn)使得語音識(shí)別技術(shù)更加穩(wěn)定和精確,也使得語音信息的可懂度大大提高,使人們能夠從較復(fù)雜的語音信息中提取到更多的有用信息。2、設(shè)計(jì)原理噪聲的生成原理及分類噪聲的來源取決于實(shí)際應(yīng)用,不同情形下產(chǎn)生的噪聲其特性也是千變?nèi)f化,所以沒有一種通用的語音增強(qiáng)算法能對(duì)每一種噪聲起到有效的消除。下面我們來簡(jiǎn)單分析噪聲的生成原理及分類情況。噪聲可以分為兩大類:加性噪聲和非加性噪聲,加性噪聲一般是指熱噪聲、散彈噪聲等,其特點(diǎn)是噪聲信號(hào)與語音信號(hào)是加性的,噪聲不隨信號(hào)而改變,即使信號(hào)不存在噪聲也會(huì)存在。非加性噪聲如乘性噪聲,他們與信號(hào)成乘性關(guān)系,信號(hào)存在噪聲就存在,信號(hào)改變?cè)肼曇搽S之改變。一般通信中我們把加性隨機(jī)性看成背景噪聲,而乘性隨機(jī)性則是由系統(tǒng)時(shí)變性和非線性造成的。這里我們僅介紹加性噪聲,加性噪聲一般分為一下幾類:人為噪聲,自然噪聲和內(nèi)部噪聲。人為噪聲是指信號(hào)之外人為的噪聲,如外臺(tái)信號(hào)、開關(guān)接觸噪聲、工業(yè)的點(diǎn)火輻射等;自然噪聲則是由于自然界的各種電磁波源如閃電、大氣中電暴和宇宙輻射等造成的噪聲;內(nèi)部噪聲是信號(hào)采集時(shí)系統(tǒng)設(shè)備自身產(chǎn)生的各種噪聲,如熱噪聲和散彈噪聲等8。以上噪聲中確定類型的噪聲因?yàn)橹榔洚a(chǎn)生機(jī)制,所以理論上是能夠消除或者基本消除。但是有一類隨機(jī)噪聲因?yàn)椴荒茴A(yù)測(cè)其波形而比較難以消除,這種不能預(yù)測(cè)的噪聲系統(tǒng)成為隨機(jī)噪聲。隨機(jī)噪聲可分為三類:(1)周期性噪聲是由于發(fā)動(dòng)機(jī)等機(jī)械、電氣干擾特別是交流電等造成的周期性的干擾噪聲。(2)脈沖噪聲是突發(fā)的幅度高且持續(xù)時(shí)間短的離散脈沖。它的來源是由于爆炸、點(diǎn)擊和撞擊等,其特點(diǎn)就是脈沖幅度大,持續(xù)時(shí)間短,兩個(gè)脈沖之間時(shí)間長(zhǎng)等。這類噪聲通常在時(shí)域情況下消除,根據(jù)信號(hào)的幅度平均值來確定信號(hào)幅度的閉值。當(dāng)信號(hào)超過這一閉值時(shí),系統(tǒng)則認(rèn)為是脈沖噪聲,再對(duì)脈沖噪聲進(jìn)行衰減。(3)寬帶噪聲的來源很多,熱噪聲、氣流(如風(fēng)、呼吸)噪聲及各種隨機(jī)噪聲源,量化噪聲也可視為寬帶噪聲。由于寬帶噪聲與語音信號(hào)在時(shí)域和頻域上完全重疊,因而消除它最為困難。這種噪聲只有在語音間歇期才單獨(dú)存在。對(duì)于平穩(wěn)的寬帶噪聲通常可以認(rèn)為是白色高斯噪聲。不具有白色頻譜的噪聲,可以先進(jìn)行白化處理。對(duì)于非平穩(wěn)的寬帶噪聲,情況就更為復(fù)雜一些。噪聲破壞了語音信號(hào)原有的聲學(xué)特征和模型參數(shù),使語音質(zhì)量下降,也使人產(chǎn)生聽覺疲勞。不僅如此,強(qiáng)噪聲環(huán)境還會(huì)對(duì)說話的人產(chǎn)生影響,使人改變?cè)诎察o環(huán)境或者低噪聲環(huán)境中的發(fā)音,從而改變了說話人的語音特征參數(shù),它對(duì)語音識(shí)別系統(tǒng)有很大影響?;咀V減法消除噪聲的原理在諸多語音增強(qiáng)方法中,譜減法因其計(jì)算量小,容易實(shí)現(xiàn)和增強(qiáng)效果好等特點(diǎn)而備受關(guān)注,是諸多方法中比較有效的語音增強(qiáng)算法。譜相減方法是居于人的感覺特性,即語音信號(hào)的短時(shí)幅度比短時(shí)相位更容易對(duì)人的聽覺系統(tǒng)產(chǎn)生影響,從而估計(jì)語音的短時(shí)幅度譜,比較適用于消除帶加性噪聲的語音。譜減法在20世紀(jì)八十年代后用來與其它方法相結(jié)合來獲得更為有效的語音增強(qiáng)算法。并且成為其它語音增強(qiáng)算法的比較標(biāo)準(zhǔn)。下面我們來詳細(xì)了解譜減法的原理。在基本譜減法中,假定語音為平穩(wěn)信號(hào),且噪聲為加性噪聲,與語音信號(hào)彼此不相關(guān)。此時(shí)帶噪語音信號(hào)可表示為: (1)式(1)中,y(t)為含噪語音信號(hào),s(t)為純凈語音信號(hào),n(t)為噪聲信號(hào)。用Y(w),S(w)和N(w)來分別表示y(t),s(t)和n(t)的傅里葉變換,則有下列關(guān)系: (2)由公式(2)可得: (3)根據(jù)(3)可得: (4)由于基本假定是噪聲信號(hào)與語音信號(hào)是加性的,s(t) 和n(t)獨(dú)立,所以S(w)和N(w)也獨(dú)立。故=0。所以對(duì)一個(gè)分析幀內(nèi)得短時(shí)平穩(wěn)過程,有: (5)因?yàn)樵肼暿蔷植科椒€(wěn)的,故可以認(rèn)為沒有語音信息是的噪聲與有語音信息時(shí)的噪聲功率譜是相同的,因而可以利用發(fā)語音前的“寂靜幀”來估計(jì)噪聲。由式(5)可以得到原始語音的估計(jì)值: (6)式(6)中,下標(biāo)表示加窗信號(hào),表示估值,則表示無語音信號(hào)時(shí)的均值。如果式(6)中結(jié)果出現(xiàn)負(fù)值,則將其改為0或改變符號(hào),因?yàn)楣β首V不能為負(fù)數(shù)。由式(6)可得原始語音估值: (7)根據(jù)人耳對(duì)語音的相位變化不敏感這一特點(diǎn),我們可以用原帶噪語音信號(hào)y(t)的相位來代替估計(jì)之后的語音信號(hào)的相位,將估計(jì)后的頻域信號(hào)進(jìn)行逆傅里葉變換得到降噪后的語音時(shí)域信號(hào)。基本譜減法的原理圖如圖2.1所示:圖2.1 基本譜減法的原理示意圖改進(jìn)譜減法消除噪聲的原理傳統(tǒng)的噪聲估計(jì)方法是基于最優(yōu)平滑和最小統(tǒng)計(jì)的噪聲估計(jì),還有一種采用改進(jìn)的算法基于語音活性檢測(cè)的噪聲估計(jì)算法。語音激活檢測(cè)指從一段包含語音信號(hào)中確定出語音的起始點(diǎn)和終點(diǎn),又稱端點(diǎn)檢測(cè)。語音端點(diǎn)檢測(cè)的目的就是從連續(xù)記錄的帶噪語音信號(hào)中分離出有用的語音信號(hào)。語音激活檢測(cè)是各種語音處理中必需的一個(gè)重要環(huán)節(jié),精確地確定輸入語音的起點(diǎn)和終點(diǎn)將保證語音處理系統(tǒng)良好的性能。對(duì)于語音激活檢測(cè)在語音增強(qiáng)中的應(yīng)用,為了得到更多的關(guān)于背景噪聲特性,語音端點(diǎn)檢測(cè)更注重于如何準(zhǔn)確的檢測(cè)出無音段。一般的語音激活檢測(cè)是根據(jù)語音幀來進(jìn)行的,語音幀的長(zhǎng)度在1030ms不等。語音端點(diǎn)檢測(cè)的方法可以綜述為:從輸入信號(hào)中提取一個(gè)或一系列的對(duì)比特征參數(shù),然后將其和一個(gè)或一系列的門限閾值進(jìn)行比較,如圖4-7所示。如果超過門限則表示當(dāng)前為有音段,否則就表示當(dāng)前為無音段。帶噪語音加窗分幀特征提取與閥值比較判斷有無語音圖4-7語音激活檢測(cè)框圖目前語音端點(diǎn)檢測(cè)所采取的方法大體可以分為兩類:第一類是噪聲環(huán)境下基于 HMM 模型的語音信號(hào)端點(diǎn)檢測(cè)的方法,該方法要求背景噪聲保持平穩(wěn)且信噪比較高。第二類方法是基于信號(hào)的短時(shí)能量進(jìn)行檢測(cè)的算法,它通過對(duì)背景噪聲能量的統(tǒng)計(jì),定出能量門限,利用能量門限來確定語音信號(hào)起始點(diǎn)。在這里運(yùn)用語音端點(diǎn)檢測(cè)采用了第二類方法,即基于信號(hào)的短時(shí)能量進(jìn)行檢測(cè)的算法?;谛盘?hào)的短時(shí)能量檢測(cè)具體算法如下:1) 計(jì)算每一幀的語音能量: (4-1)式中為幀長(zhǎng),為幀的編號(hào),m為每一幀中的各點(diǎn),為幀數(shù);然而它有一個(gè)缺陷,即它對(duì)高電平非常敏感(信號(hào)的二次方計(jì)算)。為此,定義短時(shí)平均幅度函數(shù)來表征一幀語音信號(hào)的能量大小,定義: (4-2)2) 計(jì)算前20幀平均噪聲能量;3) 求能量最大值和能量最小值,;4) 根據(jù)式(4-2)確定門限 (4-3)應(yīng)用譜相減法實(shí)現(xiàn)語音增強(qiáng)基本原理是通過對(duì)帶噪語音譜減去噪聲譜得到語音譜,因此,語音激活檢測(cè)這一環(huán)節(jié)非常重要,準(zhǔn)確地確定語音的起始點(diǎn)和終止點(diǎn)對(duì)噪聲譜估計(jì)有著重要的作用。改進(jìn)型語音降噪處理運(yùn)用端點(diǎn)檢測(cè)技術(shù),用MATLAB仿真,可明顯顯示出其優(yōu)越性。用MATLAB仿真的流程如下:1)對(duì)輸入的語音信號(hào)進(jìn)行預(yù)濾波;2)對(duì)濾波后的語音信號(hào)進(jìn)行預(yù)加重;3)將語音信號(hào)按每幀128個(gè)信號(hào)點(diǎn)進(jìn)行分幀,幀移為64;4)對(duì)信號(hào)幀加漢明窗(Haming);5)對(duì)加窗后的信號(hào)幀進(jìn)行FFT變換;6)對(duì)各幀語音信號(hào)求功率譜;7)根據(jù)前20幀求取平均噪聲功率;8)利用VAD進(jìn)行噪聲估計(jì)檢測(cè)寂靜段,進(jìn)而組合遞歸平滑,更新噪聲譜;9)進(jìn)行譜減運(yùn)算,得到估計(jì)出的語音信號(hào)功率譜;10)插入相位譜,計(jì)算出語音譜;11)進(jìn)行IFFT變換,得到還原的語音幀;12)根據(jù)各個(gè)語音幀組合為語音信號(hào);13)對(duì)語音信號(hào)進(jìn)行去加重處理,得到最終信號(hào)。3、源程序清單下面是一段無噪聲純凈的音頻1.wav,用matlab仿真的源程序代碼:x,fs,bits=wavread(D:1.wav);x1=x(1:end,1);%因錄音時(shí)是立體聲,故取其中的第一通道的音頻數(shù)據(jù) sound(x1,fs,bits); X1=fft(x1,4096);%對(duì)x1進(jìn)行4096點(diǎn)傅里葉變換magX1=abs(X1);angX1=angle(X1);subplot(221);plot(x1);title(原始信號(hào)波形);subplot(222);plot(X1); title(原始信號(hào)頻譜);subplot(223);plot(magX1);title(原始信號(hào)幅值);subplot(224);plot(angX1);title(原始信號(hào)相位);其仿真圖如圖一所示。前面MATLAB讀取的語音信號(hào)聲音比較清晰,信噪比較高,用這樣的信號(hào)實(shí)驗(yàn)對(duì)比效果不太明顯。因此在進(jìn)行消除噪聲實(shí)驗(yàn)之前我們要人為的給原始信號(hào)添加隨機(jī)白高斯噪聲,降低語音信號(hào)的信噪比。下面是matlab加入噪聲的源代碼:clearx,fs,bits=wavread(D:1.wav);N=size(x,1);x1=x(1:N,1);%因錄音時(shí)是立體聲,故取其中的第一通道的音頻數(shù)據(jù) fn=1000; %設(shè)定噪聲的頻率為1000Hzt=1:length(x1); %設(shè)置噪聲的長(zhǎng)度跟原語音信一樣長(zhǎng),x2=0.5*sin(2*pi*fn/fs*t);%產(chǎn)生幅度為0.5頻率為fn的正弦波作為噪聲.y=x1+x2; %將原語音信號(hào)跟噪聲相加,x為帶有噪聲的語音信號(hào).wavwrite(y,fs,D:2.wav);%將帶有噪聲的語音信號(hào)轉(zhuǎn)換為聲音,2.wav中將有噪聲下面是加噪后音頻的matlab仿真源代碼:x,fs,bits=wavread(D:1.wav);x1=x(1:end,1);%因錄音時(shí)是立體聲,故取其中的第一通道的音頻數(shù)據(jù) sound(x1,fs,bits); X1=fft(x1,4096);%對(duì)x1進(jìn)行4096點(diǎn)傅里葉變換magX1=abs(X1);angX1=angle(X1);subplot(221);plot(x1);title(加噪后信號(hào)波形);subplot(222);plot(X1); title(加噪后信號(hào)頻譜);subplot(223);plot(magX1);title(加噪后信號(hào)幅值);subplot(224);plot(angX1);title(加噪后信號(hào)相位);其仿真圖如圖二所示。下面是噪聲的matlab仿真的源代碼:clearx,fs,bits=wavread(D:2.wav);%讀取2.wav文件并返回fs和bits的值。y=x(1:4096,1);%截取語音信息前4096點(diǎn)作為噪聲信號(hào)Y=fft(y);%對(duì)噪聲信號(hào)進(jìn)行傅里葉變換magY=abs(Y);%取噪聲功率譜絕對(duì)值angY=angle(Y);%取噪聲相位subplot(221);plot(y);title(噪聲信號(hào)波形);subplot(222);plot(Y); title(噪聲信號(hào)頻譜);subplot(223);plot(magY);title(噪聲信號(hào)幅值);subplot(224);plot(angY);title(噪聲信號(hào)相位);其仿真的圖形如圖三所示。下面是利用基本譜減法降噪處理matlab源代碼:clear;x,fs,bits=wavread(D:2.wav);y=x(1:4096,1);Y=fft(y);magY=abs(Y);b=;for i=0:126;n=4096;x1=x(1+n*i:n+n*i);X1=fft(x1);magX=abs(X1);S=(magX.2-magY.2);S1=abs(S).0.5;s1=ifft(S1);m=mean(s1)*300;for j=1:4096;if abs(s1(j)m;s1(j)=s1(j)/4;endenda=s1;b=b a;endx2=b;plot(x2);sound(x2,fs,bits);下面是利用改進(jìn)的譜減法降噪處理的matlab源代碼:clear;x,fs,bits=wavread(D:2.wav);y=x(1:4096,1);Y=fft(y);magY=abs(Y);b1=;a=1.3;b=1.3;%設(shè)定和的值for i=0:126;n=4096;x1=x(1+n*i:n+n*i);X1=fft(x1);magX=abs(X1);S=(magX.a-magY.a);S1=abs(S).(1/b);s1=ifft(S1);m=mean(s1)*300;for j=1:4096;if abs(s1(j)m;s1(j)=s1(j)/4;endenda1=s1;b1=b1 a1;endx2=b1;plot(x2);sound(x2,fs,bits);wavwrite(x2,fs,D:4.wav)%增強(qiáng)后語音以4.wav為文件名保存其降噪后的matlab仿真圖形如圖四所示。4、設(shè)計(jì)結(jié)果和仿真波形圖一圖二圖三圖四5、參考文獻(xiàn)【1】程佩青 數(shù)字信號(hào)處理教程 清華大學(xué)出版社【2】吳鎮(zhèn)揚(yáng) 數(shù)字信號(hào)處理 高等教育出版社【3】胡廣書 數(shù)字信號(hào)處理導(dǎo)論 清華大學(xué)出版社【4】易

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論