




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
實(shí)驗(yàn)二語(yǔ)音信號(hào)的頻域分析2021/5/91一、實(shí)驗(yàn)?zāi)康睦斫庹Z(yǔ)音信號(hào)的頻譜特點(diǎn);理解語(yǔ)音信號(hào)的頻譜分析方法;
MATLAB實(shí)現(xiàn)語(yǔ)音信號(hào)的頻域分析。2021/5/92二、實(shí)驗(yàn)原理
語(yǔ)音信號(hào)本質(zhì)上是非平穩(wěn)信號(hào)。但我們可以假設(shè)語(yǔ)音信號(hào)在一個(gè)短時(shí)間內(nèi)是平穩(wěn)的,這樣我們用穩(wěn)態(tài)分析方法處理非平穩(wěn)信號(hào)。應(yīng)用在傅立葉分析就是短時(shí)傅立葉變換。語(yǔ)音的頻域分析:包括語(yǔ)音信號(hào)的頻譜、功率譜、倒頻譜、頻譜包絡(luò)等.常用頻域分析方法:帶通濾波器組法、Fourier變換法、同態(tài)分析、線性預(yù)測(cè)法等。
2021/5/93短時(shí)傅立葉變換定義式:式中,w(n-m)是窗函數(shù),n為離散時(shí)間,w連續(xù)頻率。令,則可得到離散的短時(shí)傅立葉變換由上式可以看出:當(dāng)n固定,就是序列的傅立葉變換;當(dāng)w或k固定,就是一個(gè)卷積,相當(dāng)于濾波器的運(yùn)算。2021/5/94語(yǔ)譜圖語(yǔ)譜圖反映了語(yǔ)音信號(hào)的動(dòng)態(tài)頻率特性,在語(yǔ)音分析中具有重要的實(shí)用價(jià)值。語(yǔ)譜圖的時(shí)間分辨率和頻率分辨率是由窗函數(shù)的特性決定的。時(shí)間分辨率高,可以看出時(shí)間波形的每個(gè)周期及共振峰隨時(shí)間的變化,但頻率分辨率低,不足以分辨由于激勵(lì)所形成的細(xì)微結(jié)構(gòu),稱為寬帶語(yǔ)譜圖,而窄帶語(yǔ)譜圖正好與之相反。寬帶語(yǔ)譜圖可以獲得較高的時(shí)間分辨率,反映頻譜的快速時(shí)變過(guò)程;窄帶語(yǔ)譜圖可以獲得較高的頻率分辨率,反映頻譜的精細(xì)結(jié)構(gòu)。兩者相結(jié)合,可以提供兩種語(yǔ)音特性相關(guān)的信息。語(yǔ)譜圖上因其不同的灰度,形成不同的紋路,稱之為“聲紋”。2021/5/95倒譜分析語(yǔ)音信號(hào)同態(tài)處理方法是一種設(shè)法將非線性問(wèn)題轉(zhuǎn)化為線性問(wèn)題來(lái)進(jìn)行處理的方法。它能將兩個(gè)信號(hào)通過(guò)乘法合成的信號(hào),或通過(guò)卷積合成的信號(hào)分開(kāi)。目的是要從聲道激勵(lì)響應(yīng)分量與激勵(lì)分量的卷積中分開(kāi)各原始分量。這種由卷積結(jié)果求得參與卷積的各信號(hào)分量—解卷。對(duì)語(yǔ)音信號(hào)進(jìn)行同態(tài)分析后,將得到語(yǔ)音信號(hào)的倒譜參數(shù),因此同態(tài)分析也稱為倒譜分析。2021/5/96同態(tài)信號(hào)處理的基本原理
語(yǔ)音信號(hào)不是加性信號(hào),而是乘積性或卷積性信號(hào),它不能用線性系統(tǒng),而必須用滿足其相應(yīng)組合原則的非線性系統(tǒng)來(lái)處理。同態(tài)信號(hào)處理就是將非線性問(wèn)題轉(zhuǎn)化為線性問(wèn)題來(lái)處理。乘積同態(tài)處理卷積同態(tài)處理2021/5/97卷積同態(tài)處理
同態(tài)處理理論的一個(gè)重要是任何同態(tài)系統(tǒng)都能表示為三個(gè)同態(tài)系統(tǒng)的級(jí)聯(lián),即同態(tài)系統(tǒng)可分解為兩個(gè)特征系統(tǒng)和一個(gè)線性系統(tǒng)。第一個(gè)系統(tǒng)以若干信號(hào)的卷積組合作為其輸入,并將它變換成對(duì)應(yīng)輸出的相加性組合。第二個(gè)系統(tǒng)是一個(gè)普通線性系統(tǒng),它服從疊加原理。第三個(gè)系統(tǒng)是第一個(gè)系統(tǒng)的逆變換,即將信號(hào)的相加性組合反變換為卷積組合。2021/5/98語(yǔ)音倒譜的應(yīng)用基音周期估計(jì)濁音信號(hào)的倒譜中存在峰值,它的出現(xiàn)位置等于該語(yǔ)音段的基音周期,而清音的倒譜中不存在峰值。利用倒譜的這個(gè)特點(diǎn),我們可以進(jìn)行語(yǔ)音的清濁音判決,并且可以估計(jì)濁音的基音周期。首先計(jì)算語(yǔ)音的倒譜,然后再可能出現(xiàn)的基音周期附近尋找峰值。如果倒譜峰值超過(guò)了預(yù)先設(shè)置的門限,則輸入語(yǔ)音判斷為濁音,其峰值位置就是基音周期的估計(jì)值;反之,如果沒(méi)有超出門限的峰值的話,則輸入語(yǔ)音為清音。2021/5/99共振峰估計(jì)對(duì)倒譜進(jìn)行濾波,取出低時(shí)間部分進(jìn)行逆特征系統(tǒng)處理,可以得到一個(gè)平滑的對(duì)數(shù)譜函數(shù),這個(gè)對(duì)數(shù)譜函數(shù)顯示了輸入語(yǔ)音段的共振峰結(jié)構(gòu),同時(shí)譜的峰值對(duì)應(yīng)于共振峰頻率。通過(guò)此對(duì)數(shù)譜進(jìn)行峰值檢測(cè),就可以估計(jì)出前幾個(gè)共振峰的頻率和強(qiáng)度。對(duì)于濁音的聲道特性,可以采用前三個(gè)共振峰來(lái)描述;清音不具備共振峰特點(diǎn)。2021/5/910三實(shí)驗(yàn)用函數(shù)快速傅立葉變換函數(shù)
fft(x)fft(x,N)ifft(x)ifft(x,N)x是語(yǔ)音信號(hào)N是正整數(shù),函數(shù)執(zhí)行N點(diǎn)FFT2021/5/911三實(shí)驗(yàn)用函數(shù)語(yǔ)譜圖繪制函數(shù)specgram調(diào)用格式:specgram(data,nfft,Fs,window,numoverlap)Data是語(yǔ)音信號(hào)nfft是fft的長(zhǎng)度,一般取1024或者512。
fs就是采樣率。
window是指窗的長(zhǎng)度,一般和nfft相同即可。
numoverlap是幀重疊的長(zhǎng)度,取1/4*nff就可以了。2021/5/912三實(shí)驗(yàn)用函數(shù)復(fù)倒譜:cceps實(shí)倒譜:rceps調(diào)用格式
y=cceps(x)y=rceps(x)2021/5/913四參考例程短時(shí)譜cleara=wavread('beijing1.wav');a=a(34000:105000);subplot(2,1,1)plot(a);title('originalsignal');grid;N=256;h=hamming(N);form=1:Nb(m)=a(m)*h(m);endy=20*log(abs(fft(b)));subplot(2,1,2)plot(y);title('短時(shí)譜');grid2021/5/914語(yǔ)譜圖clear[x,fs,n,bits]=wavread('beijing1.wav');subplot(2,1,1)plot(x)subplot(2,1,2)specgram(x,512,fs,100);xlabel('時(shí)間(s)')ylabel('頻率(Hz)')title('語(yǔ)譜圖')2021/5/915倒譜和復(fù)倒譜cleara=wavread('beijing1.wav');a=a(39000:39999);N=1000;h=hamming(N);form=1:Nb(m)=a(m)*h(m);endc=cceps(b);c=fftshift(c);d=rceps(b);d=fftshift(d);subplot(3,1,1)plot(a);title('截取的語(yǔ)音信號(hào)')subplot(3,1,2)plot(d);title('加漢明窗時(shí)的倒譜')subplot(3,1,3)plot(c);title('加漢明窗時(shí)的復(fù)倒譜')2021/5/9162021/5/917基音檢測(cè)clear[y,fs,nbits]=wavread(‘china.wav');time1=1:length(y);time=(1:length(y))/fs;framesize=floor(50*fs/1000);%幀長(zhǎng)startindex=round(19000);%起始序號(hào)endindex=startindex+framesize-1;%結(jié)束序號(hào)frame=y(startindex:endindex);%取得該幀framesize=length(frame);frame2=frame.*hamming(length(frame));%加漢明窗rwy=rceps(frame2);%求倒譜ylen=length(rwy);cepstrum=rwy(1:ylen/2);2021/5/918fori=1:ylen/2cepstrum1(i)=rwy(ylen/2+1-i);endfori=(ylen/2+1):ylencepstrum1(i)=rwy(i+1-ylen/2);end%基音檢測(cè)lf=floor(fs/500);hf=floor(fs/70);cn=cepstrum(lf:hf);[mx_cepind]=max(cn);ifmx_cep>0.08&ind>lfa=fs/(lf+ind)elsea=0;endpitch=a;2021/5/919%畫(huà)圖figuresubplot(3,1,1);plot(time1,y)subplot(3,1,2);plot(frame)time2=[-199:1:-1,0:1:200];subplot(3,1,3);plot(time2,cepstrum1)
2021/5/920
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年水文測(cè)量?jī)x器項(xiàng)目發(fā)展計(jì)劃
- 2025年合模機(jī)項(xiàng)目合作計(jì)劃書(shū)
- 腦外傷治療指南
- 2025年網(wǎng)絡(luò)特性測(cè)試儀器項(xiàng)目合作計(jì)劃書(shū)
- 模塊化學(xué)生宿舍家具企業(yè)制定與實(shí)施新質(zhì)生產(chǎn)力戰(zhàn)略研究報(bào)告
- 西梅企業(yè)縣域市場(chǎng)拓展與下沉戰(zhàn)略研究報(bào)告
- 蒸汽機(jī)車企業(yè)ESG實(shí)踐與創(chuàng)新戰(zhàn)略研究報(bào)告
- 銅床企業(yè)數(shù)字化轉(zhuǎn)型與智慧升級(jí)戰(zhàn)略研究報(bào)告
- 膠粘相冊(cè)企業(yè)數(shù)字化轉(zhuǎn)型與智慧升級(jí)戰(zhàn)略研究報(bào)告
- 蘋果醬罐頭企業(yè)ESG實(shí)踐與創(chuàng)新戰(zhàn)略研究報(bào)告
- 中考英語(yǔ)688高頻詞大綱詞頻表
- 計(jì)算機(jī)基礎(chǔ)教程電子版
- 關(guān)于如何做好清單招標(biāo)控制價(jià)的幾點(diǎn)建議
- 2024陜西西安事業(yè)單位歷年公開(kāi)引進(jìn)高層次人才和急需緊缺人才筆試參考題庫(kù)(共500題)答案詳解版
- 2024年湖南水利水電職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫(kù)及答案解析
- 有限空間安全檢查表
- 初中生注意力訓(xùn)練注意力
- 充電設(shè)施運(yùn)營(yíng)管理制度文件范文
- 2022年成都地鐵值班員資格考前復(fù)習(xí)題庫(kù)
- 2024年山東省春季高考技能考試-汽車專業(yè)備考試題庫(kù)(濃縮500題)
- 外賣報(bào)告數(shù)據(jù)分析
評(píng)論
0/150
提交評(píng)論