信號與系統(tǒng)三級項目-基于matlab語音信號采集與分析_第1頁
信號與系統(tǒng)三級項目-基于matlab語音信號采集與分析_第2頁
信號與系統(tǒng)三級項目-基于matlab語音信號采集與分析_第3頁
信號與系統(tǒng)三級項目-基于matlab語音信號采集與分析_第4頁
信號與系統(tǒng)三級項目-基于matlab語音信號采集與分析_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

信號與系統(tǒng)三級項目姓名:班級:電子信息工程2班課程名稱:信號與系統(tǒng)指導(dǎo)教師:閆盛楠2017年6月男聲:實(shí)現(xiàn)了對語音信號進(jìn)行頻譜分析。2.4分析男聲和女生的差別2.4.1男聲和女聲的差別在生活中我們感覺男生的聲音雄渾低沉,女生的聲音尖細(xì)清脆。男、女聲在頻率方面存在很大的差別:一是男、女聲的基音頻率有差別,男聲的基音頻率大致在100—200HZ之間,而女聲的基音頻率則在200—350HZ之間;二是男聲低頻成份比較多,女聲高頻成份比較多。2.4.2定性地辨別男女聲根據(jù)2.4.1的第二點(diǎn)我們可以通過考慮觀察男女頻譜函數(shù)中地頻率成分進(jìn)行判斷。在我們的常識中,女生的聲音比較尖,音調(diào)比較高,頻率當(dāng)然會高一點(diǎn),男生的頻率會低一些。由2.3中男聲和女聲的頻域波形圖,我們可以辨別出男聲女聲頻譜中的細(xì)微不同:男聲的低頻部分的幅值較高,高頻部分的偏低;而女聲恰好相反,高頻部分的幅值較高而低頻部分的偏低。實(shí)現(xiàn)了定性的辨別男女聲。通過觀察語音信號的頻譜圖是可以辨別男女聲的這種方法的缺點(diǎn)是:需要將兩幅圖進(jìn)行比較并且人的主觀判斷會造成較高的錯誤率。。2.4.3定量地辨別男女聲我們知道,一個波形可以由無數(shù)正弦波和余弦波疊加而成,有如下公式:可將以上公式變換為:那么,當(dāng)n=0時我們可以得到一個特殊的波形,稱為基波。聲音也是一種波,也由無數(shù)正弦波和余弦波疊加而成,那么在聲音信號中n=0的波就是該聲音信號的基波,由此我們引出了基音的概念:基音,一般的聲音都是由發(fā)音體發(fā)出的一系列頻率、振幅各不相同的振動復(fù)合而成的。這些振動中有一個頻率最低的振動,由它發(fā)出的音就是基音,其余為泛音。發(fā)音體整體振動產(chǎn)生的音(振動長度越大,頻率越小),叫做基音,決定音高;發(fā)音體部分振動產(chǎn)生的音,叫做泛音,決定音色。女生的基音偏高而男生的基音偏低,因此,我們考慮利用基音頻率進(jìn)行男聲女聲的辨別。通過大量查閱網(wǎng)上的資料以及對多人聲音的測試,我們決定將250Hz定為男女聲音的分界點(diǎn),基音頻率小于250Hz的為男聲,基音頻率大于250的為女聲。通過測試,這種方法準(zhǔn)確度較高,但對于聲音偏低沉的女聲和聲音比較高的男聲仍然會出現(xiàn)識別錯誤的現(xiàn)象。實(shí)現(xiàn)提取基音頻率并辨別男女聲的代碼如下:%======基音頻率提取======[~,index]=max(t);timewin=floor(0.015*fs);xwin=t(index-timewin:index+timewin);[y,~]=xcov(xwin);ylen=length(y);halflen=(ylen+1)/2+30;yy=y(halflen:ylen);[~,maxindex]=max(yy);fmax=fs/(maxindex+30);disp([file,'基音頻率為',num2str(fmax),'Hz'])%======通過基因頻率判斷男女聲======iffmax<250;disp([file,'是男聲文件']);elsedisp([file,'是女聲文件']);end;sound(t,fs);通過這種方式的測試出來的結(jié)果:女聲的音頻文件:E:\REC003.mp3基音頻率為327.4725HzE:\REC003.mp3是女聲文件女聲的音頻文件:E:\REC005.mp3基音頻率為134.4538HzE:\REC005.mp3是男聲文件通過以上兩種方法,實(shí)現(xiàn)了分析男聲和女生的差別。2.5驗證抽樣定理抽樣定理的內(nèi)容如下:一個頻譜受限的信號f(t),如果頻譜只占據(jù)-ωm~ωm

的范圍,則信號f(t)可以用等間隔的抽樣值惟一地表示。而抽樣間隔必須不大于1/2????(其中ωm=2π????),或者說,最低抽樣頻率為2????。由于人的聲音頻率為300Hz—3400Hz,根據(jù)奈奎斯特采樣定理可知,采樣頻率必須要大于等于2倍的3400Hz,即6800Hz,向上取至8kHz,這是一個既可以保證信號抽樣準(zhǔn)確和恢復(fù)基本正確,又不會造成抽樣太多,數(shù)據(jù)量過大的采樣頻率。要實(shí)現(xiàn)音頻數(shù)據(jù)的降采樣有多種方法,通過上網(wǎng)查詢,我們采用了函數(shù)downsample(),它能夠較好地模擬直接降采樣的過程,降采樣后的變化也更容易發(fā)現(xiàn)。首先通過降采樣函數(shù)downsample降采樣處理,參數(shù)分別為原信號y和降采樣率的倍數(shù)。利用函數(shù)downsample()進(jìn)行降采樣后,矩陣的長度會大大變短,而在我們以后的頻譜分析中,為了方便比較,我們需要相同長度的數(shù)據(jù),所以就采用了interp()函數(shù)對降采樣后的數(shù)據(jù)進(jìn)行了插值處理,保證了信號的長度,然后采用了之前畫出時域和頻域圖像部分以及男女聲判別部分的代碼,畫出降采樣的后數(shù)據(jù)的時域、頻域圖像和基音頻率。我們在錄制聲音時選用的fs為48000Hz,對其進(jìn)行6倍的降采樣就是8000Hz。根據(jù)抽樣定理,如果降采樣倍數(shù)小于6,聲音信號就是可以恢復(fù)的,如果降采樣的倍數(shù)大于6,那么聲音信號就會產(chǎn)生失真。我們將原信號、降6倍信號、降20倍信號的頻譜圖放在一起進(jìn)行了對比,發(fā)現(xiàn)在頻域圖的主要頻譜的部分,降6倍的與原信號的波形幾乎沒有差別,而降20倍的波形已經(jīng)有了較為明顯的失真。原信號采樣率48000Hz降6倍采樣采樣率8000Hz降20倍采樣采樣率2400Hz

實(shí)現(xiàn)了對抽樣定理的驗證。Ⅲ總結(jié)與心得3.1總結(jié)本次三級項目我們主要進(jìn)行了語音信號的采集,并對采集的語音信號進(jìn)行時域和頻域波形顯示及仿真,然后對采集的語音信號進(jìn)行降采樣處理和男女聲的區(qū)分。我們使用的是在Matlab中編寫程序進(jìn)行采樣和波形顯示以及降采樣處理,對于男女聲區(qū)分我們使用了兩種方法:頻譜觀察法與基音頻率法。通過多組音頻信號的測試我們認(rèn)為基音頻率法的準(zhǔn)確率和客觀性比較高。在基音頻率法中,我們發(fā)現(xiàn)男聲的基頻主要集中在小于250Hz這個范圍內(nèi),女聲基頻主要集中在大于250Hz這個范圍內(nèi)。這個基頻范圍是我們根據(jù)一些樣本得出的,樣本數(shù)量較少,使得判別存在一定誤差。聲音信號的主要頻率范圍為200Hz~3400Hz,根據(jù)抽樣定理可得,采樣頻率應(yīng)不小于8000Hz。3.2心得本次三級項目中我們組分工明確,組內(nèi)成員互幫互助,最終全部實(shí)現(xiàn)了該次項目的全部內(nèi)容。在項目實(shí)施的過程中,我們也遇到了許多問題,比如不知道Matlab的函數(shù)究竟怎么使用,不知道基音頻率怎么提取等,這些問題在之后的討論與查閱資料中逐漸解決。通過本次項目,我們再次學(xué)習(xí)了信號與系統(tǒng)相關(guān)知識,對語音學(xué)也有了較為簡單的理解,加深了對抽樣定理的理解,我們收獲到了許多。參考

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論