語(yǔ)音增強(qiáng)報(bào)告譜減法和維納濾波_第1頁(yè)
語(yǔ)音增強(qiáng)報(bào)告譜減法和維納濾波_第2頁(yè)
語(yǔ)音增強(qiáng)報(bào)告譜減法和維納濾波_第3頁(yè)
語(yǔ)音增強(qiáng)報(bào)告譜減法和維納濾波_第4頁(yè)
語(yǔ)音增強(qiáng)報(bào)告譜減法和維納濾波_第5頁(yè)
已閱讀5頁(yè),還剩17頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、Speech Enhancement一、語(yǔ)音增強(qiáng)方法的理論分析21. 引言22. 語(yǔ)音增強(qiáng)算法22.1譜減法22.2 Wiener 濾波法3二、譜減法51. 算法實(shí)現(xiàn)52. 改善算法,減少音樂(lè)噪聲9三、Wiener濾波法111. 算法實(shí)現(xiàn)112. 迭代Wiener濾波的算法實(shí)現(xiàn)14五、參考文獻(xiàn)17一、語(yǔ)音增強(qiáng)方法的理論分析1 .引言語(yǔ)音增強(qiáng)的目標(biāo)是從含有噪聲的語(yǔ)音信號(hào)中提取盡可能純凈的原始語(yǔ)音。然 而,由于干擾通常都是隨機(jī)的,從帶噪語(yǔ)音中提取完全純凈的語(yǔ)音幾乎不可能。 在這種情況下,語(yǔ)音增強(qiáng)的目的主要有兩個(gè):一是改進(jìn)語(yǔ)音質(zhì)量,消除背景噪音, 使聽(tīng)者樂(lè)于接受,不感覺(jué)疲勞,這是一種主觀(guān)度量:二是提

2、高語(yǔ)音可懂度,這是 一種客觀(guān)度量。這兩個(gè)目的往往不能兼得,所以實(shí)際應(yīng)用中總是視具體情況而有 所側(cè)重的。帶噪語(yǔ)音的噪聲類(lèi)型可以分為加性噪聲和非加性噪聲。加性噪聲有寬帶的, 窄帶的,平穩(wěn)的,非平穩(wěn)的,白噪聲,有色噪聲,等:非加性噪聲如乘性噪聲, 卷積噪聲等。一般,語(yǔ)音增強(qiáng)處理的噪聲指環(huán)境中的噪聲,而這些噪聲主要是高 斯白噪聲,這種噪聲一般符合如下的假設(shè):(1) 噪聲是加性的。(2) 噪聲是局部平穩(wěn)的。局部平穩(wěn)是指一段加噪語(yǔ)音中的噪聲,具有和語(yǔ)音 段開(kāi)始前那段噪聲相同的統(tǒng)計(jì)特性,且在整個(gè)語(yǔ)音段中保持不變。也就是說(shuō),可 以根據(jù)語(yǔ)音開(kāi)始前那段噪聲來(lái)估計(jì)語(yǔ)音中所疊加的噪聲統(tǒng)計(jì)特性。(3) 噪聲與語(yǔ)音統(tǒng)計(jì)獨(dú)

3、立或不相關(guān)。2 .語(yǔ)音增強(qiáng)算法根據(jù)語(yǔ)音和噪聲的特點(diǎn),出現(xiàn)了很多種語(yǔ)音增強(qiáng)算法。比較常用的有噪聲對(duì)消法、 譜相減法、維納濾波法、卡爾曼濾波法、FIR自適應(yīng)濾波法等。此外,隨著科學(xué) 技術(shù)的發(fā)展乂出現(xiàn)了一些新的增強(qiáng)技術(shù),如基丁神經(jīng)網(wǎng)絡(luò)的語(yǔ)音增強(qiáng)、基于HMM 的語(yǔ)音增強(qiáng)、基于聽(tīng)覺(jué)感知的語(yǔ)音增強(qiáng)、基于多分辨率分析的語(yǔ)音增強(qiáng)、基于語(yǔ) 音產(chǎn)生模型的線(xiàn)性濾波法、基于小波變換的語(yǔ)音增強(qiáng)方法、梳狀濾波法、相關(guān) 法、基于語(yǔ)音模型的語(yǔ)音增強(qiáng)方法等。此處主要介紹譜減法和wiener '濾波法。2.1譜減法使用譜減法是假設(shè): 噪聲疊加; 聲與語(yǔ)音不相關(guān); 對(duì)純凈語(yǔ)音無(wú)先驗(yàn)知識(shí):對(duì)統(tǒng)計(jì)噪聲有先驗(yàn)知識(shí)。帶噪語(yǔ)音模型為

4、:y(n)=x(n)+v(n)式中,y(n)是帶噪語(yǔ)音,s(n)是純凈語(yǔ)音,v(n)是噪聲。對(duì)式子兩邊進(jìn)行傅立葉變 換,得Y(k)=X(k)+N(k)由于對(duì)噪聲的統(tǒng)計(jì)參數(shù)的未知,所以在實(shí)際應(yīng)用中,通常使用非語(yǔ)音段噪聲譜的 均值來(lái)作為對(duì)噪聲譜N(k)的估計(jì), 1m=£伽啊|蘭網(wǎng)坷)| =亍£ Im(坷)|則對(duì)純凈語(yǔ)音幅度譜的估量表示為衣的_ Ji】快)| - M幻I如I擇)1一麗以> °0otherwise把帶噪語(yǔ)音的相位Gy(e>)當(dāng)作是純凈語(yǔ)音的相位,那么純凈語(yǔ)音頻譜的估量為X(eJIB)=|;c,-> x(n) = IFTJB)2.2 wie

5、ner濾波法一個(gè)線(xiàn)性系統(tǒng),如果它的單位樣本響應(yīng)為h(n),當(dāng)輸入一個(gè)隨機(jī)信號(hào)x(n), 且x(n) = s(n) + u(n)其中s(n)表示信號(hào),Mn)表示噪聲,則輸出y(n)為y(n) = £h(m)x(n_m)m我們希望x(n)通過(guò)線(xiàn)性系統(tǒng)h(n)后得到的y(n)盡景接近于s(n),因此稱(chēng)y(n)為s(n) 的估計(jì)值,用§(n)表示,即y(n) = S(n)維納濾波器的輸入一輸出關(guān)系為:川)=§(%x(n) = s(n) + Mn) I如上圖所示。這個(gè)線(xiàn)性系統(tǒng)h(n)稱(chēng)為對(duì)于s(n)的一種估計(jì)器。如果我們以s與谷分別表示信號(hào)的真值與估計(jì)值,而用e(n)表示它

6、們之間的 誤差,即e(n) = s(n) s(n)顯然,e(n)可能是正的,也可能是負(fù)的,并且它是一個(gè)隨機(jī)變量。因此,用 它的均方值來(lái)表達(dá)誤差是合理的,所謂均方誤差最小即它的平方的統(tǒng)計(jì)平均值最 ?。篍e2(n)=E(s-s)2最小已知希望輸出為:-3 -N-ly(n) = s(n) = V h(m)x(n-m)nx=O誤差為:N-le(n) = s(n) 一 s(n) = s(n) 一 > h(m)x(n-m)xn-0均方誤差為:N-lEe2(n) = E (S(n)-h(m)x(n-m)2m=O上式對(duì)h(m) m=O,l,N1求導(dǎo)得到:NT2E (s(n)-(m)x(n-m)x(n-

7、j) =0 j =O,1,2 N-1nO進(jìn)一步得:N-lEs(n)x(n- j) = £瞄(m)Ex(n-m)x(n-j)j =0,1, - N-lm=0從而有:N-l說(shuō)(j)= £lt(n】)K(jT】)j =0,1,2,.,N-l m=0于是就得到N個(gè)線(xiàn)性方程;j=0說(shuō)(0) = h(O)IMO)+ hQ)(l) + + h(N -1)(N -1)j=l玖=1】(0)(1) + h JU。) + +h(N-l)Rto(N -2)j = N-1 Rte(N-l) = h(O) RSk(N-1) + hQR (N - 2) + . . + h(N -1)(0)寫(xiě)成矩陣形式為

8、: %。)(1)電3-1)h(0) 5)-5電(0)5-2)Ml)5.冬(NT). .'(N-2).%0) _.h(N-l).R(N-l)其中:H=h(O) h(l) h(N-l)r是濾波器的系數(shù)* =丁(0),玫(1),.玫3-1),是互相關(guān)序列改(。)心).5T)5(0).0N 2)'(N-1)5一2)是自相關(guān)矩陣 (0)由上可見(jiàn),設(shè)計(jì)維納濾波器的過(guò)程就是尋求在最小均方誤差下濾波器的單位脈沖響應(yīng)或傳遞函數(shù)的表達(dá)式,其實(shí)質(zhì)就是解維納一霍夫(Wiener-Hopf)方程。 另外,設(shè)計(jì)維納濾波器要求己知信號(hào)與噪聲的相關(guān)函數(shù)。二、譜減法1 .算法實(shí)現(xiàn)%Spectral Subtra

9、ction Algorithm winsize=256; %窗長(zhǎng) n=0.05; %噪聲電平speech, fs, nbits =wavread (T speech_clean. wav1) ; % 讀入數(shù)據(jù) size=length (speech);numofv?in=floor (size/winsize) ; % 幀數(shù) %加窗 ham=hamming(winsize)T; %Generates Hamming Window hamwin=zeros(lr size); %Vector for window gain enhanced=zeros(lr size) ; %Vector fo

10、r enhanced speGch *產(chǎn)生帶噪聲信號(hào) x=speechf + n*randn(lr size); "Contaminates signal with white noise %噪聲估計(jì) noise=n*randn(lr winsize) ; %Sampie of noise N = fft (noise);nmag= abs(N); %Estimated noise magnitude spectrum for q=l:2*numofwin-lf rame=x (1+ (q-1) *winsize/2: vzinsize+ (q-1) *winsize/2) ; %5

11、0 percent overlap hamwin(1+(q-1)*winsize/2:winsize+(q-1)*winsize/2)=hamwin(1+(q-1)fins ize/2:winsizef (q-1)*winsize/2)+ham; %Window gain%對(duì)帶噪聲語(yǔ)音進(jìn)行DFT y=fft(frame.*ham); mag = abs (y) ; %Magnitude Specrt rum phase = angle(y); %Phase Spectrum $幅度譜減 for i=l:v/insizeif mag (i) -nmag (i) >05clean (i) =

12、 mag (i) -nmag (i);elseclean (i)=0;endend,在頻域中重新合成語(yǔ)音spectral= clean.*exp(j*phase);%IDFT并重疊想加enhanced(1+(q-1)*winsize/2:winsize+(q-1)*winsize/2)=enhanced(1+(q-1) winsize/2:winsize+(q-1)*winsize/2)+real (ifft(spectral);end割除去漢寧窗引起的增益for i=l:sizeifhamwin(i)=0enhanced(i)=0;elseenhanced(i)=enhanced(i)/ha

13、mwin(i);endendSNR1 = 10*logl0 (var (speech1) / var (noise) ) ; %加噪詁音信噪比SNR2 = 10*logl0 (var (speechT) / var (enhanced-speech1) ; *增強(qiáng)i吾音信噪t匕wavwrite (xf fsf nbitsr T noise. wavf) ; %輸出帶噪信號(hào)wavwrite (enhanced, fs, nbits, f enhanced. wavf) ; %輸出增強(qiáng)信 t=l:size;figure (1) , subplot (3, 1, 1) ;piot (t/fsr sp

14、eech1) ; %原始1 吾音波形xlabel(1time(s)1);title(1 Original Voice (n=T tnumZstr(n)r 1;figure (2) , specgram (speech1) ; *原始訂;語(yǔ) 譜title ( Original Voice (n=T r numZstr (n), f) f ;figure(1),subplot (3,1,2); plot(t/fs,x);xlabel(1time(s)f);title (fNoise Added (SNR=f,numZstr (SNR1), 1dB) 1);figure (3) , specgram

15、 (x) ; *加噪語(yǔ)音語(yǔ)譜title(1Noise Added (SNR=1,numZstr(SNR1)r 1dB)1);figure(1) , subplot(3flr 3);plot(t/fsr enhanced);xlabel(1 time(s)f);title (improved Voice (SNR=f r numZst r (SNR2) r f dB) f );figure (4) 9 specgram (enhanced) ; 抵雖i":i告i*title(1Improved Voice (SNR=,numZstr (SNR2)r 1dB) 1);-# -File E

16、dit View Insert Tools Desktop Window Help MMMM|7曰日的mi、的!更房”1口1口國(guó)i回Original Voice (n=0 05)20004000600080001000012000Time9 87E 5 40.O0.O.OO.Aou-nbalLl.3 2 10 _ o o oQ Figure 3File Edit View Insert Tools Desktop Window Helpdb aIBINoise Added (SNR=10 9187dB)9876543210 oooooooooWuenb/UL§ iaMI I I -1

17、 .20004000600080001000012000TimeFile Edit View Insert Tools Desktop Window Help MMMMMMMHBfMHMB|7 6 5 4 . . . . o o o oAouanbalu.s 口匡11 回Improved Voice (SNR=14 86dB)20004000600080001000012000Time-11 -2.改善算法、減少音樂(lè)噪聲白噪聲的短時(shí)功率譜上既有波峰,乂有波谷。在一幀里,它們的頻率分布是 隨機(jī)的;在幀與幀之間,它們的頻率和幅度也是隨機(jī)變化的。當(dāng)我們從帶噪語(yǔ)音 的頻譜中減去我們估計(jì)的噪聲譜,所有的

18、帶噪語(yǔ)音頻譜峰值都會(huì)變小,而谷值由 于小于估計(jì)的噪聲值被置零。因此,進(jìn)行譜減法之后,在頻譜上只留下波峰。在 這些留下的波峰中,頻帶較寬的部分被視為時(shí)變寬帶噪聲,頻帶較窄的部分則被 當(dāng)成時(shí)變音調(diào),也就是所謂的音樂(lè)噪聲。我們改善的算法為:let D(w) = P$(w)-oPn(w) p(w), if D(w) >BPn(w) = 18Fn(w), otherwise|with a > 19 and 0 < B « 1其中,P's(w)是所求的語(yǔ)音幅度譜,是帶噪語(yǔ)音幅度譜,玲(W)是估計(jì)的噪 聲幅度譜。當(dāng)a>l,改善的算法通過(guò)消除那些寬波峰,去除所有的寬頻

19、帶噪聲。 然后,提高頻譜下限FR(w),使得波峰與波峰間的波谷不會(huì)那么深。兩者結(jié)合, 使噪聲波峰間的頻譜偏移不再那么大,從而減少了音樂(lè)噪聲。程序如下:% 幅度諾減 for i=l:vzinsized(i)=mag(i)-2.5*nmag(i);f (i)=0.01*nmag(i);if d(i)>f (i)clean (i)=d (i);elseclean (i)=f (i);endend-IO-File Edit View Insert Tools Desktop Window HelpImproved Voice (SNR=12 419dB)200040006000800010000

20、12000Time6 5 4 o o o Aouonbsu.3 2 10 o o o三、wiener濾波法1 .算法實(shí)現(xiàn)function y =mut (x, y,m, L) %計(jì)算| 相關(guān)知陣的函數(shù)tep=0;for i=l:L-abs(m)tep=tep+x(i)*y(i+abs(m);endy=l/(L-abs(m)tep;%產(chǎn)生原始信號(hào)s (n)和帶噪信號(hào)x (n)clear;a=0.95;L=input (,輸入信號(hào)樣本個(gè)數(shù)L: n*)N=input (* 輸入wiener泄波 2,忻;、數(shù)N: n1)temp=rand(lr L);templ=rand(lr L);v=12(0.5

21、) .* (temp-0.5) f讓噪聲信 vv (n)變成均 4 JO,$-0.5, 0.5間均勻分布的隨機(jī)信號(hào)w=(l-a/s2)*12)/ (0.5) . * (templ-0.5);s=zeros(1, L);s(l, l)=w(l, 1);for i=2:Ls (1, i) =a*s (lr i-1) +w(lr i);endx=s+v;*顯示原始信號(hào)S (n)和帶噪信號(hào)x (n) elf;figure(1);i=L-100:L;%只顯示后1。個(gè)樣值plot(i,s(L-100:L), f rT r i/x (L-100:L), T b:T);title (,原始信號(hào)s(n)和帶噪信

22、號(hào)x(n),);legend(1s(n)f f f x(n)1);xlabel(1nf);ylabei(1x(n) & s(n)1);$求乂 (n)的白相關(guān)矩陣,以及x (n)與s (n)的互相關(guān)矩陣Rxx=zeros(N,N);for i=l:Nfor j=l:NRxx(i# j)=mut (x,x,i-jr L);endendfor i=l:Nrxs (1, i) =mut (x, s, i-lr L);endrxs=rxs1;h=inv(Rxx)*rxs;%繪出Wiener濾波器的N個(gè)系數(shù)h (n)figure (2);i=l:N;plot(i,h, f r: o1);title

23、 ( fWieneril|波器的系數(shù)h (n) 1;legend (fh(n)');"求帶噪信號(hào)x (n)經(jīng)Wiener濾波器的輸出序列SR (n) SR=zeros(lf L);h=h'for i=l: Lfor m=0:N-lif i>mSR (1, i) =SR (1, i) +h (1, m+1) *x (i-m);endendend七比較SR (n)和原始信號(hào)s (n)figure (3);i=L-100:L;plot(irSR(L-100:L)t 1r: ', i, s(L-100:L)r f bf);title (riener濾波的信 SR

24、 (n)和原始信"(n),);legend (f SR (n) 1 r fs(n) T);L=500, N=10-15 -132.迭代wiener濾波的算法實(shí)現(xiàn)function y =mut (x,y,m, L) *計(jì)算H相關(guān)矩陣的函數(shù) tep=0;for i=l:L-abs (m)tep=tep+x (i) *y (i+abs (m);endy=l/(L-abs(m)*tep;%產(chǎn)生原始信號(hào)S (n)和帶噪信號(hào)x (n) clear;a=0.S5;L=i nput (*輸入信號(hào)樣本個(gè)數(shù)L: n *)N=input (,命入wiener泄波2;階數(shù)N: nf)temp=rand(1,

25、L);templ=rand(1, L);v=12A(0.5).(temp-0.5);w=(l-a/s2)*12)/s (0.5) . * (templ-0.5);s=zeros(1,L);s(l, l)=w(l, 1);for i=2:Ls (lr i) =a*s (lr i-1) +w(lr i);endx=s+v;'顯示原始信號(hào)S (n)和帶噪信號(hào)x (n)elf;figure(1);i=L-100:L;%只顯示后10。個(gè)樣值plot (i,s(L-100:L), 1 rf rir x(L-100:L)f Tb: T);title (,原始信號(hào)s(n)和帶噪信號(hào)x(n) »

26、; );legend(1s(n)f f T x (n)f);xlabel(1nf);ylabei(1x(n) & s (n)1);%計(jì)算迭代wiener濾波器的N個(gè)系數(shù)reh (n)for i=l:Nreh(ir 1)=0.238* (0.724) (i-1);end*繪出迭代Wiener濾波器的N個(gè)系數(shù)reh (n)figure (2);i=l:N;plot(i,reh,'b-+');title (,迭代貿(mào)iener濾波器的系數(shù)reh (n) * );legend('reh (n)');SI (1, l)=0.238*x(lr 1);for i=2:LSI (lri)=0.724*SI(lri-l)+0.238*x(lri);end%比較SI (n)和原始信號(hào)s (n)figure (3);-# -i=L-100:L;plot (i,SI (L-100:L), 1r: ',i,s (L-100:L)r 1bf);title (,經(jīng)迭代Wiener濾波的信vSI (n)和原始信vs (n) T );legend(SR(n)f r fs (n)1);L=600, N=10File Edit View Insert Too

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論