實(shí)驗(yàn)二 語(yǔ)音信號(hào)的頻域分析_第1頁(yè)
實(shí)驗(yàn)二 語(yǔ)音信號(hào)的頻域分析_第2頁(yè)
實(shí)驗(yàn)二 語(yǔ)音信號(hào)的頻域分析_第3頁(yè)
實(shí)驗(yàn)二 語(yǔ)音信號(hào)的頻域分析_第4頁(yè)
實(shí)驗(yàn)二 語(yǔ)音信號(hào)的頻域分析_第5頁(yè)
已閱讀5頁(yè),還剩18頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

實(shí)驗(yàn)二語(yǔ)音信號(hào)的頻域分析2021/5/91一、實(shí)驗(yàn)?zāi)康睦斫庹Z(yǔ)音信號(hào)的頻譜特點(diǎn);理解語(yǔ)音信號(hào)的頻譜分析方法;

MATLAB實(shí)現(xiàn)語(yǔ)音信號(hào)的頻域分析。2021/5/92二、實(shí)驗(yàn)原理

語(yǔ)音信號(hào)本質(zhì)上是非平穩(wěn)信號(hào)。但我們可以假設(shè)語(yǔ)音信號(hào)在一個(gè)短時(shí)間內(nèi)是平穩(wěn)的,這樣我們用穩(wěn)態(tài)分析方法處理非平穩(wěn)信號(hào)。應(yīng)用在傅立葉分析就是短時(shí)傅立葉變換。語(yǔ)音的頻域分析:包括語(yǔ)音信號(hào)的頻譜、功率譜、倒頻譜、頻譜包絡(luò)等.常用頻域分析方法:帶通濾波器組法、Fourier變換法、同態(tài)分析、線性預(yù)測(cè)法等。

2021/5/93短時(shí)傅立葉變換定義式:式中,w(n-m)是窗函數(shù),n為離散時(shí)間,w連續(xù)頻率。令,則可得到離散的短時(shí)傅立葉變換由上式可以看出:當(dāng)n固定,就是序列的傅立葉變換;當(dāng)w或k固定,就是一個(gè)卷積,相當(dāng)于濾波器的運(yùn)算。2021/5/94語(yǔ)譜圖語(yǔ)譜圖反映了語(yǔ)音信號(hào)的動(dòng)態(tài)頻率特性,在語(yǔ)音分析中具有重要的實(shí)用價(jià)值。語(yǔ)譜圖的時(shí)間分辨率和頻率分辨率是由窗函數(shù)的特性決定的。時(shí)間分辨率高,可以看出時(shí)間波形的每個(gè)周期及共振峰隨時(shí)間的變化,但頻率分辨率低,不足以分辨由于激勵(lì)所形成的細(xì)微結(jié)構(gòu),稱為寬帶語(yǔ)譜圖,而窄帶語(yǔ)譜圖正好與之相反。寬帶語(yǔ)譜圖可以獲得較高的時(shí)間分辨率,反映頻譜的快速時(shí)變過(guò)程;窄帶語(yǔ)譜圖可以獲得較高的頻率分辨率,反映頻譜的精細(xì)結(jié)構(gòu)。兩者相結(jié)合,可以提供兩種語(yǔ)音特性相關(guān)的信息。語(yǔ)譜圖上因其不同的灰度,形成不同的紋路,稱之為“聲紋”。2021/5/95倒譜分析語(yǔ)音信號(hào)同態(tài)處理方法是一種設(shè)法將非線性問(wèn)題轉(zhuǎn)化為線性問(wèn)題來(lái)進(jìn)行處理的方法。它能將兩個(gè)信號(hào)通過(guò)乘法合成的信號(hào),或通過(guò)卷積合成的信號(hào)分開(kāi)。目的是要從聲道激勵(lì)響應(yīng)分量與激勵(lì)分量的卷積中分開(kāi)各原始分量。這種由卷積結(jié)果求得參與卷積的各信號(hào)分量—解卷。對(duì)語(yǔ)音信號(hào)進(jìn)行同態(tài)分析后,將得到語(yǔ)音信號(hào)的倒譜參數(shù),因此同態(tài)分析也稱為倒譜分析。2021/5/96同態(tài)信號(hào)處理的基本原理

語(yǔ)音信號(hào)不是加性信號(hào),而是乘積性或卷積性信號(hào),它不能用線性系統(tǒng),而必須用滿足其相應(yīng)組合原則的非線性系統(tǒng)來(lái)處理。同態(tài)信號(hào)處理就是將非線性問(wèn)題轉(zhuǎn)化為線性問(wèn)題來(lái)處理。乘積同態(tài)處理卷積同態(tài)處理2021/5/97卷積同態(tài)處理

同態(tài)處理理論的一個(gè)重要是任何同態(tài)系統(tǒng)都能表示為三個(gè)同態(tài)系統(tǒng)的級(jí)聯(lián),即同態(tài)系統(tǒng)可分解為兩個(gè)特征系統(tǒng)和一個(gè)線性系統(tǒng)。第一個(gè)系統(tǒng)以若干信號(hào)的卷積組合作為其輸入,并將它變換成對(duì)應(yīng)輸出的相加性組合。第二個(gè)系統(tǒng)是一個(gè)普通線性系統(tǒng),它服從疊加原理。第三個(gè)系統(tǒng)是第一個(gè)系統(tǒng)的逆變換,即將信號(hào)的相加性組合反變換為卷積組合。2021/5/98語(yǔ)音倒譜的應(yīng)用基音周期估計(jì)濁音信號(hào)的倒譜中存在峰值,它的出現(xiàn)位置等于該語(yǔ)音段的基音周期,而清音的倒譜中不存在峰值。利用倒譜的這個(gè)特點(diǎn),我們可以進(jìn)行語(yǔ)音的清濁音判決,并且可以估計(jì)濁音的基音周期。首先計(jì)算語(yǔ)音的倒譜,然后再可能出現(xiàn)的基音周期附近尋找峰值。如果倒譜峰值超過(guò)了預(yù)先設(shè)置的門限,則輸入語(yǔ)音判斷為濁音,其峰值位置就是基音周期的估計(jì)值;反之,如果沒(méi)有超出門限的峰值的話,則輸入語(yǔ)音為清音。2021/5/99共振峰估計(jì)對(duì)倒譜進(jìn)行濾波,取出低時(shí)間部分進(jìn)行逆特征系統(tǒng)處理,可以得到一個(gè)平滑的對(duì)數(shù)譜函數(shù),這個(gè)對(duì)數(shù)譜函數(shù)顯示了輸入語(yǔ)音段的共振峰結(jié)構(gòu),同時(shí)譜的峰值對(duì)應(yīng)于共振峰頻率。通過(guò)此對(duì)數(shù)譜進(jìn)行峰值檢測(cè),就可以估計(jì)出前幾個(gè)共振峰的頻率和強(qiáng)度。對(duì)于濁音的聲道特性,可以采用前三個(gè)共振峰來(lái)描述;清音不具備共振峰特點(diǎn)。2021/5/910三實(shí)驗(yàn)用函數(shù)快速傅立葉變換函數(shù)

fft(x)fft(x,N)ifft(x)ifft(x,N)x是語(yǔ)音信號(hào)N是正整數(shù),函數(shù)執(zhí)行N點(diǎn)FFT2021/5/911三實(shí)驗(yàn)用函數(shù)語(yǔ)譜圖繪制函數(shù)specgram調(diào)用格式:specgram(data,nfft,Fs,window,numoverlap)Data是語(yǔ)音信號(hào)nfft是fft的長(zhǎng)度,一般取1024或者512。

fs就是采樣率。

window是指窗的長(zhǎng)度,一般和nfft相同即可。

numoverlap是幀重疊的長(zhǎng)度,取1/4*nff就可以了。2021/5/912三實(shí)驗(yàn)用函數(shù)復(fù)倒譜:cceps實(shí)倒譜:rceps調(diào)用格式

y=cceps(x)y=rceps(x)2021/5/913四參考例程短時(shí)譜cleara=wavread('beijing1.wav');a=a(34000:105000);subplot(2,1,1)plot(a);title('originalsignal');grid;N=256;h=hamming(N);form=1:Nb(m)=a(m)*h(m);endy=20*log(abs(fft(b)));subplot(2,1,2)plot(y);title('短時(shí)譜');grid2021/5/914語(yǔ)譜圖clear[x,fs,n,bits]=wavread('beijing1.wav');subplot(2,1,1)plot(x)subplot(2,1,2)specgram(x,512,fs,100);xlabel('時(shí)間(s)')ylabel('頻率(Hz)')title('語(yǔ)譜圖')2021/5/915倒譜和復(fù)倒譜cleara=wavread('beijing1.wav');a=a(39000:39999);N=1000;h=hamming(N);form=1:Nb(m)=a(m)*h(m);endc=cceps(b);c=fftshift(c);d=rceps(b);d=fftshift(d);subplot(3,1,1)plot(a);title('截取的語(yǔ)音信號(hào)')subplot(3,1,2)plot(d);title('加漢明窗時(shí)的倒譜')subplot(3,1,3)plot(c);title('加漢明窗時(shí)的復(fù)倒譜')2021/5/9162021/5/917基音檢測(cè)clear[y,fs,nbits]=wavread(‘china.wav');time1=1:length(y);time=(1:length(y))/fs;framesize=floor(50*fs/1000);%幀長(zhǎng)startindex=round(19000);%起始序號(hào)endindex=startindex+framesize-1;%結(jié)束序號(hào)frame=y(startindex:endindex);%取得該幀framesize=length(frame);frame2=frame.*hamming(length(frame));%加漢明窗rwy=rceps(frame2);%求倒譜ylen=length(rwy);cepstrum=rwy(1:ylen/2);2021/5/918fori=1:ylen/2cepstrum1(i)=rwy(ylen/2+1-i);endfori=(ylen/2+1):ylencepstrum1(i)=rwy(i+1-ylen/2);end%基音檢測(cè)lf=floor(fs/500);hf=floor(fs/70);cn=cepstrum(lf:hf);[mx_cepind]=max(cn);ifmx_cep>0.08&ind>lfa=fs/(lf+ind)elsea=0;endpitch=a;2021/5/919%畫(huà)圖figuresubplot(3,1,1);plot(time1,y)subplot(3,1,2);plot(frame)time2=[-199:1:-1,0:1:200];subplot(3,1,3);plot(time2,cepstrum1)

2021/5/920

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論