實(shí)驗(yàn)二 語音信號的頻域分析_第1頁
實(shí)驗(yàn)二 語音信號的頻域分析_第2頁
實(shí)驗(yàn)二 語音信號的頻域分析_第3頁
實(shí)驗(yàn)二 語音信號的頻域分析_第4頁
實(shí)驗(yàn)二 語音信號的頻域分析_第5頁
已閱讀5頁,還剩18頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

實(shí)驗(yàn)二語音信號的頻域分析2021/5/91一、實(shí)驗(yàn)?zāi)康睦斫庹Z音信號的頻譜特點(diǎn);理解語音信號的頻譜分析方法;

MATLAB實(shí)現(xiàn)語音信號的頻域分析。2021/5/92二、實(shí)驗(yàn)原理

語音信號本質(zhì)上是非平穩(wěn)信號。但我們可以假設(shè)語音信號在一個短時間內(nèi)是平穩(wěn)的,這樣我們用穩(wěn)態(tài)分析方法處理非平穩(wěn)信號。應(yīng)用在傅立葉分析就是短時傅立葉變換。語音的頻域分析:包括語音信號的頻譜、功率譜、倒頻譜、頻譜包絡(luò)等.常用頻域分析方法:帶通濾波器組法、Fourier變換法、同態(tài)分析、線性預(yù)測法等。

2021/5/93短時傅立葉變換定義式:式中,w(n-m)是窗函數(shù),n為離散時間,w連續(xù)頻率。令,則可得到離散的短時傅立葉變換由上式可以看出:當(dāng)n固定,就是序列的傅立葉變換;當(dāng)w或k固定,就是一個卷積,相當(dāng)于濾波器的運(yùn)算。2021/5/94語譜圖語譜圖反映了語音信號的動態(tài)頻率特性,在語音分析中具有重要的實(shí)用價值。語譜圖的時間分辨率和頻率分辨率是由窗函數(shù)的特性決定的。時間分辨率高,可以看出時間波形的每個周期及共振峰隨時間的變化,但頻率分辨率低,不足以分辨由于激勵所形成的細(xì)微結(jié)構(gòu),稱為寬帶語譜圖,而窄帶語譜圖正好與之相反。寬帶語譜圖可以獲得較高的時間分辨率,反映頻譜的快速時變過程;窄帶語譜圖可以獲得較高的頻率分辨率,反映頻譜的精細(xì)結(jié)構(gòu)。兩者相結(jié)合,可以提供兩種語音特性相關(guān)的信息。語譜圖上因其不同的灰度,形成不同的紋路,稱之為“聲紋”。2021/5/95倒譜分析語音信號同態(tài)處理方法是一種設(shè)法將非線性問題轉(zhuǎn)化為線性問題來進(jìn)行處理的方法。它能將兩個信號通過乘法合成的信號,或通過卷積合成的信號分開。目的是要從聲道激勵響應(yīng)分量與激勵分量的卷積中分開各原始分量。這種由卷積結(jié)果求得參與卷積的各信號分量—解卷。對語音信號進(jìn)行同態(tài)分析后,將得到語音信號的倒譜參數(shù),因此同態(tài)分析也稱為倒譜分析。2021/5/96同態(tài)信號處理的基本原理

語音信號不是加性信號,而是乘積性或卷積性信號,它不能用線性系統(tǒng),而必須用滿足其相應(yīng)組合原則的非線性系統(tǒng)來處理。同態(tài)信號處理就是將非線性問題轉(zhuǎn)化為線性問題來處理。乘積同態(tài)處理卷積同態(tài)處理2021/5/97卷積同態(tài)處理

同態(tài)處理理論的一個重要是任何同態(tài)系統(tǒng)都能表示為三個同態(tài)系統(tǒng)的級聯(lián),即同態(tài)系統(tǒng)可分解為兩個特征系統(tǒng)和一個線性系統(tǒng)。第一個系統(tǒng)以若干信號的卷積組合作為其輸入,并將它變換成對應(yīng)輸出的相加性組合。第二個系統(tǒng)是一個普通線性系統(tǒng),它服從疊加原理。第三個系統(tǒng)是第一個系統(tǒng)的逆變換,即將信號的相加性組合反變換為卷積組合。2021/5/98語音倒譜的應(yīng)用基音周期估計濁音信號的倒譜中存在峰值,它的出現(xiàn)位置等于該語音段的基音周期,而清音的倒譜中不存在峰值。利用倒譜的這個特點(diǎn),我們可以進(jìn)行語音的清濁音判決,并且可以估計濁音的基音周期。首先計算語音的倒譜,然后再可能出現(xiàn)的基音周期附近尋找峰值。如果倒譜峰值超過了預(yù)先設(shè)置的門限,則輸入語音判斷為濁音,其峰值位置就是基音周期的估計值;反之,如果沒有超出門限的峰值的話,則輸入語音為清音。2021/5/99共振峰估計對倒譜進(jìn)行濾波,取出低時間部分進(jìn)行逆特征系統(tǒng)處理,可以得到一個平滑的對數(shù)譜函數(shù),這個對數(shù)譜函數(shù)顯示了輸入語音段的共振峰結(jié)構(gòu),同時譜的峰值對應(yīng)于共振峰頻率。通過此對數(shù)譜進(jìn)行峰值檢測,就可以估計出前幾個共振峰的頻率和強(qiáng)度。對于濁音的聲道特性,可以采用前三個共振峰來描述;清音不具備共振峰特點(diǎn)。2021/5/910三實(shí)驗(yàn)用函數(shù)快速傅立葉變換函數(shù)

fft(x)fft(x,N)ifft(x)ifft(x,N)x是語音信號N是正整數(shù),函數(shù)執(zhí)行N點(diǎn)FFT2021/5/911三實(shí)驗(yàn)用函數(shù)語譜圖繪制函數(shù)specgram調(diào)用格式:specgram(data,nfft,Fs,window,numoverlap)Data是語音信號nfft是fft的長度,一般取1024或者512。

fs就是采樣率。

window是指窗的長度,一般和nfft相同即可。

numoverlap是幀重疊的長度,取1/4*nff就可以了。2021/5/912三實(shí)驗(yàn)用函數(shù)復(fù)倒譜:cceps實(shí)倒譜:rceps調(diào)用格式

y=cceps(x)y=rceps(x)2021/5/913四參考例程短時譜cleara=wavread('beijing1.wav');a=a(34000:105000);subplot(2,1,1)plot(a);title('originalsignal');grid;N=256;h=hamming(N);form=1:Nb(m)=a(m)*h(m);endy=20*log(abs(fft(b)));subplot(2,1,2)plot(y);title('短時譜');grid2021/5/914語譜圖clear[x,fs,n,bits]=wavread('beijing1.wav');subplot(2,1,1)plot(x)subplot(2,1,2)specgram(x,512,fs,100);xlabel('時間(s)')ylabel('頻率(Hz)')title('語譜圖')2021/5/915倒譜和復(fù)倒譜cleara=wavread('beijing1.wav');a=a(39000:39999);N=1000;h=hamming(N);form=1:Nb(m)=a(m)*h(m);endc=cceps(b);c=fftshift(c);d=rceps(b);d=fftshift(d);subplot(3,1,1)plot(a);title('截取的語音信號')subplot(3,1,2)plot(d);title('加漢明窗時的倒譜')subplot(3,1,3)plot(c);title('加漢明窗時的復(fù)倒譜')2021/5/9162021/5/917基音檢測clear[y,fs,nbits]=wavread(‘china.wav');time1=1:length(y);time=(1:length(y))/fs;framesize=floor(50*fs/1000);%幀長startindex=round(19000);%起始序號endindex=startindex+framesize-1;%結(jié)束序號frame=y(startindex:endindex);%取得該幀framesize=length(frame);frame2=frame.*hamming(length(frame));%加漢明窗rwy=rceps(frame2);%求倒譜ylen=length(rwy);cepstrum=rwy(1:ylen/2);2021/5/918fori=1:ylen/2cepstrum1(i)=rwy(ylen/2+1-i);endfori=(ylen/2+1):ylencepstrum1(i)=rwy(i+1-ylen/2);end%基音檢測lf=floor(fs/500);hf=floor(fs/70);cn=cepstrum(lf:hf);[mx_cepind]=max(cn);ifmx_cep>0.08&ind>lfa=fs/(lf+ind)elsea=0;endpitch=a;2021/5/919%畫圖figuresubplot(3,1,1);plot(time1,y)subplot(3,1,2);plot(frame)time2=[-199:1:-1,0:1:200];subplot(3,1,3);plot(time2,cepstrum1)

2021/5/920

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論