版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、Digital Signal Process Mid-term Task Class:Dian Zi 2 Member:Li Ming 20111794Wu Xun 20111787Gao Feng 20111767Liao Feng 20111769Ren BingTao 20111768關(guān)于男女生聲音信號(hào)的采集和分析題目:關(guān)于男女生聲音信號(hào)的采集和分析一、聲音采集部分Matlab中提供了強(qiáng)大的數(shù)據(jù)采集工具箱,可以滿足控制聲卡對(duì)數(shù)據(jù)進(jìn)行采集的要求。語(yǔ)音數(shù)據(jù)采集過(guò)程如圖:在Matlab環(huán)境中,可以通過(guò)多種編程方法驅(qū)動(dòng)聲卡實(shí)現(xiàn)對(duì)語(yǔ)音信號(hào)的采集和播放。驅(qū)動(dòng)聲卡的方式共有四種:一是將聲卡作為對(duì)象處理
2、采集語(yǔ)音信號(hào);二是調(diào)用wavrecord功能函數(shù)采集語(yǔ)音信號(hào);三是通過(guò)audiorecorder對(duì)象采集語(yǔ)音信號(hào);四是可以直接用windows自帶的錄音機(jī)采集聲音信號(hào),再通過(guò)函數(shù)讀取和分析(不過(guò)這種方式并不利于參數(shù)的設(shè)置)。1、將聲卡作為處理對(duì)象采集語(yǔ)音信號(hào) Matlab將聲卡作為對(duì)象處理,其后的一切操作都不與硬件直接相關(guān),而是通過(guò)該對(duì)象的操作來(lái)作用于硬件設(shè)備(聲卡)。操作時(shí)首先要對(duì)聲卡產(chǎn)生一個(gè)模擬輸入對(duì)象(ai),給ai對(duì)象添加一個(gè)通道,設(shè)置采樣頻率后,就可以啟動(dòng)設(shè)備對(duì)象,開(kāi)始采集數(shù)據(jù),采集完成后停止對(duì)象并刪除對(duì)象,具體的程序如下:ai=analoginput(winsound); %為聲卡
3、建立一個(gè)模擬輸入設(shè)備對(duì)象addchannel(ai,1); %設(shè)置聲卡通道,1為單聲道,2為雙聲道fs=22050; %采樣頻率設(shè)置為22050Hzai.samplerate=fs; %設(shè)置采樣頻率t=2; %設(shè)置采樣時(shí)間start(ai); %啟動(dòng)并觸發(fā)聲卡設(shè)備采集數(shù)據(jù)stop(ai); %停止采集delete(ai); %去除設(shè)備對(duì)象clear ai; %清除變量2、調(diào)用wavrecord功能函數(shù)采集語(yǔ)音信號(hào)fs=22050; %樣本采集頻率y=wavrecord(5*fs,fs,int16);%fs代表樣本采集頻率,nbits代表每%個(gè)樣本的位數(shù),ch代表采集通道,1%為單聲道,2為雙聲
4、道,默認(rèn)值為1wavplay(y,fs); %播放聲音信號(hào)或sound(y,fs);3、運(yùn)用audiorecorder對(duì)象采集語(yǔ)音信號(hào)ar=audiorecorder(11025,16,2);%這里的三個(gè)參數(shù)與wavrecord的三個(gè) %參數(shù)相同ar.record; %開(kāi)始錄音ar.pause; %暫停錄音p=ar.play; %播放錄音ar.resume; %繼續(xù)錄音p=ar.play; %播放完整錄音4、通過(guò)windows自帶的錄音器采集信號(hào) 我們通過(guò)windows的內(nèi)容采集到標(biāo)準(zhǔn)的聲音信號(hào),這時(shí)將會(huì)生成一個(gè)wav文件(win7的系統(tǒng)生成的是wma文件,可以轉(zhuǎn)換格式)。我們通過(guò)下面函數(shù)播放
5、信號(hào),檢驗(yàn)采集的情況。y=wavread(C:UsersAdministratorDesktopmid-term taskliming.wav);%小括號(hào)內(nèi)的是文件路徑wavplay(y); %播放聲音信號(hào)二、聲音的分析和處理通過(guò)測(cè)試,上述四種方法均可行,我們選取wavrecord函數(shù)采集聲音信號(hào),下面進(jìn)行的討論均以此為基礎(chǔ)。下面我們對(duì)采集到的聲音信號(hào)進(jìn)行分析和討論。我們知道對(duì)聲音信號(hào)的討論一般包括數(shù)字濾波、傅里葉變換、時(shí)域和頻域分析、聲音回放以及各種分析圖的呈現(xiàn)等等。下面我們將從這些方面來(lái)分析我們采集到的聲音信號(hào)。1、采集到的聲音信號(hào)的原始圖形 我們采集的聲音信號(hào)錄入了“數(shù)字信號(hào)處理”該六個(gè)
6、字。下圖是男女生時(shí)域下的信號(hào)對(duì)比: 在這之前,我們用windows自帶的錄音器錄入了一段語(yǔ)音信號(hào),其存儲(chǔ)格式是wma,所以我們選擇了用格式工廠轉(zhuǎn)換成了wav格式,不知道是不是這樣的原因?qū)е铝诵盘?hào)的一些問(wèn)題,畫(huà)出的時(shí)域圖中間還夾雜著藍(lán)色的部分,并且雜波顯得比下圖多很多,并且在函數(shù)調(diào)用上也比較麻煩。鑒于此,我們謹(jǐn)慎的選擇了wavrecord這種方式。- 這是信號(hào)的時(shí)域信號(hào),而短時(shí)能量分析、短時(shí)過(guò)零分析和自相關(guān)法是作為語(yǔ)音信號(hào)時(shí)域分析中最基本的方法,應(yīng)用廣泛,特別是在語(yǔ)音信號(hào)端點(diǎn)檢測(cè)方面。但是針對(duì)語(yǔ)音信號(hào),我們僅能從信號(hào)的一般特性上面進(jìn)行分析。從上圖來(lái)看,我們可以看到男聲的能量較足,顯示的幅度更大。
7、2、語(yǔ)音信號(hào)在頻域上的分析 我們對(duì)信號(hào)進(jìn)行快速傅里葉變換,得到相應(yīng)的頻譜分析圖。但是,在這之前,我們必須先添加窗函數(shù),下面我們先對(duì)窗函數(shù)進(jìn)行一下簡(jiǎn)要的說(shuō)明。 窗函數(shù):數(shù)字信號(hào)處理的主要數(shù)學(xué)工具是傅里葉變換。而傅里葉變換是研究整個(gè)時(shí)間域和頻率域的關(guān)系。不過(guò),當(dāng)運(yùn)用計(jì)算機(jī)實(shí)現(xiàn)工程測(cè)試信號(hào)處理時(shí),不可能對(duì)無(wú)限長(zhǎng)的信號(hào)進(jìn)行測(cè)量和運(yùn)算,而是取其有限的時(shí)間片段進(jìn)行分析。做法是從信號(hào)中截取一個(gè)時(shí)間片段,然后用觀察的信號(hào)時(shí)間片段進(jìn)行周期延拓處理,得到虛擬的無(wú)限長(zhǎng)的信號(hào),然后就可以對(duì)信號(hào)進(jìn)行傅里葉變換、相關(guān)分析等數(shù)學(xué)處理。無(wú)限長(zhǎng)的信號(hào)被截?cái)嘁院?,其頻譜發(fā)生了畸變,原來(lái)集中在f(0)處的能量被分散到兩個(gè)較寬的頻帶
8、中去了(這種現(xiàn)象稱(chēng)之為頻譜能量泄漏)。至此,我們可以得到相應(yīng)的頻譜圖對(duì)比如下:我們都很容易注意到這兩個(gè)吸信號(hào)的相同點(diǎn),他們的頻率大約集中在幾十赫茲到5000赫茲比較密集,范圍以外的幅度十分的小,這也是人聲的基本特點(diǎn)。 通過(guò)比較,我們可以看見(jiàn)男女生聲音頻率較集中地范圍有所不同,男生主要集中在200800Hz左右,而女聲的聲音頻率較多的集中在3001800Hz左右。并且可以大致看出男女生的聲音信號(hào)在基頻上面有很大的不同。 此外,我們還可以明顯的看到男聲在高頻上的諧波幅度較小,遠(yuǎn)遠(yuǎn)的小于女聲信號(hào)。 為了更加清晰地分辨男女生在高低頻聲音上的比率,我們編寫(xiě)了一段程序來(lái)分析男女聲高低頻成分所占的大小。結(jié)果
9、發(fā)現(xiàn),在高頻部分,男聲比率為7.3497e-004,女聲比率為0.0066 ;低頻部分,男聲比率為8.8621e-007,女聲比率為7.4197e-007 。可以更加確定的知道,女聲在高頻上的頻率分量更多,男聲則在低頻上的頻率分量更多。 為了提取基頻,下面我們進(jìn)行進(jìn)一步討論這兩段聲音信號(hào)。3、聲音信號(hào)的倒頻譜分析 倒頻譜,就是對(duì)功率譜的對(duì)數(shù)值進(jìn)行傅立葉逆變換,將復(fù)雜的卷積關(guān)系變?yōu)楹?jiǎn)單的線性疊加,從而在其倒頻譜上可以較容易地識(shí)別信號(hào)的頻率組成分量,便于提取所關(guān)心的頻率成分。(在這里,我們關(guān)注信號(hào)的基頻) 通過(guò)查閱資料(1998年南京郵電學(xué)院學(xué)報(bào)第十八卷56期計(jì)算機(jī)語(yǔ)音信號(hào)處理與語(yǔ)音識(shí)別系統(tǒng)),我
10、們知道男性基音頻率分布在60200Hz左右,女性和小孩的基音頻率則集中在200450Hz左右。從倒頻譜圖的圖形示意來(lái)看,正是滿足這樣的條件。由于采集的數(shù)量有限,不能夠完全的驗(yàn)證整個(gè)頻率范圍。(這未免是一個(gè)遺憾之處)4、語(yǔ)音信號(hào)的去噪-數(shù)字濾波器的設(shè)計(jì) 采用數(shù)字濾波器來(lái)對(duì)語(yǔ)音信號(hào)進(jìn)行去噪處理,可選用窗函數(shù)法設(shè)計(jì)FIR數(shù)字濾波器(這種方法還沒(méi)有研究過(guò)),另外也可以用雙線性變換法設(shè)計(jì)巴特沃斯濾波器。在語(yǔ)音信號(hào)的濾波處理中,由于人的信號(hào)能量主要集中在低頻部分,雙線性低通濾波器的效果最好,濾波后的語(yǔ)音失真比較小。 下面我們用雙線性變換法設(shè)計(jì)濾波器,并從聲音的效果和圖像的改善程度上觀察濾波的作用。 下面的
11、波形是原始信號(hào)經(jīng)濾波作用后的時(shí)域波形對(duì)比:在聲音上,我們可以明顯感覺(jué)到聲音經(jīng)低通濾波后(15階巴特沃斯濾波器)聲音變得更加低沉,并且聲音的音量減小了(女生的聲音甚至給人男音的感覺(jué))。這是因?yàn)?,高頻的成分濾掉之后,即原聲音信號(hào)中的尖細(xì)部分給消除在外了,而高頻部分包含的能量成分也被濾除掉了。附:本次實(shí)驗(yàn)的源代碼fs=11000;y=wavrecord(5*fs,fs,int16);%設(shè)置采樣頻率wavwrite(y,fs,liming.wav);%寫(xiě)入語(yǔ)音信號(hào)(要求在這一時(shí)刻開(kāi)始錄音)y,fs=wavread(liming.wav);%讀取該聲音信號(hào)%-作原信號(hào)的時(shí)域圖t=0:1/fs:(leng
12、th(y)-1)/fs; %確定時(shí)間軸的橫軸坐標(biāo)wavplay(y);plot(t,y) %作原始語(yǔ)音信號(hào)的時(shí)域圖形%圖像格式設(shè)置title(原始語(yǔ)音信號(hào)(男聲);xlabel(時(shí)間(s);ylabel(幅度);%-作信號(hào)的頻譜圖x=fft(y.*hamming(length(y);%作加窗傅里葉變換(漢明窗)fm=5000*length(x)/fs; %限定頻率范圍f=(0:fm)*fs/length(x); %確定頻率刻度plot(f,20*log10(abs(x(1:length(f)+eps);%畫(huà)頻譜圖 %eps 叫做機(jī)器的浮點(diǎn)運(yùn)算誤差限! %PC機(jī)上eps的默認(rèn)值為2.2204*1
13、0(-16) %若某個(gè)量的絕對(duì)值小于eps,就認(rèn)為這個(gè)量為0title(頻譜圖(男聲);xlabel(頻率(Hz);ylabel(頻譜幅度(db);%-作原信號(hào)的倒頻譜c=fft(log(abs(x)+eps) %倒頻譜計(jì)算ms1=fs/1000;ms20=fs/50;q=(ms1:ms20)/fs; %確定倒頻刻度plot(q,abs(c(ms1:ms20); %畫(huà)倒頻譜圖title(倒頻譜圖(男聲);xlabel(頻率(Hz);ylabel(頻譜幅度(db);%-對(duì)原始語(yǔ)音信號(hào)進(jìn)行濾波t=0:1/fs:(length(y)-1)/fs; %確定時(shí)間軸的橫軸坐標(biāo)wavplay(y); %播放原始的聲音信號(hào)subplot(1,2,1);plot(t,y) %做原始語(yǔ)音信號(hào)的時(shí)域圖形title(原始語(yǔ)音信號(hào)(男聲);wpz=0.097;wsz=0.12rp=1;rs=15;Nd,wdc=buttord(wpz,wsz,rp,rs); %選擇濾波器
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 類(lèi)風(fēng)濕關(guān)節(jié)炎慢病管理
- 新生兒糖尿病的護(hù)理課件
- 高三化學(xué)一輪復(fù)習(xí) 第五章 《化工生產(chǎn)中的重要非金屬元素》 專(zhuān)題講解 氣體的制備、凈化和收集 課件
- 巧用繩課件教學(xué)課件
- 2-1-3 碳酸鈉與碳酸氫鈉 課件 高一上學(xué)期化學(xué)人教版(2019)必修第一冊(cè)
- 吉林省2024七年級(jí)數(shù)學(xué)上冊(cè)第1章有理數(shù)階段綜合訓(xùn)練范圍1.6~1.8課件新版華東師大版
- 低壓裝表接電安全
- 報(bào)任安書(shū)公開(kāi)課教案
- 家居建材客服合同范本
- 幼兒園衛(wèi)生清潔工勞動(dòng)合同
- 水利視頻監(jiān)控系統(tǒng)解決方案
- 警犬相關(guān)知識(shí)培訓(xùn)課件
- 高三第一次聯(lián)考英語(yǔ)試卷分析
- 幼兒園食品安全
- 家庭教育與孩子的生涯規(guī)劃
- 大學(xué)生如何遵守網(wǎng)絡(luò)生活中的道德要求
- 給小朋友科普醫(yī)學(xué)知識(shí)
- 最美老師評(píng)選述職報(bào)告
- 電氣工程及其自動(dòng)化生涯發(fā)展展示
- 2024學(xué)校所屬企業(yè)國(guó)有資產(chǎn)管理的若干意見(jiàn)全文
- 五年級(jí)上冊(cè)簡(jiǎn)易方程練習(xí)400題及答案
評(píng)論
0/150
提交評(píng)論