男女聲識(shí)別系統(tǒng)_第1頁
男女聲識(shí)別系統(tǒng)_第2頁
男女聲識(shí)別系統(tǒng)_第3頁
男女聲識(shí)別系統(tǒng)_第4頁
男女聲識(shí)別系統(tǒng)_第5頁
已閱讀5頁,還剩5頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、男女聲識(shí)別系統(tǒng)摘 要:本文通過對(duì)男性和女性聲音的語音特征的研究,發(fā)現(xiàn)男女聲的基音頻率存在較大的差異,并設(shè)計(jì)了基于基音頻率分析的男女聲識(shí)別系統(tǒng)。男女聲識(shí)別系統(tǒng)由以下三個(gè)模塊電路構(gòu)成:話筒放大器,低通濾波器,半波整流電路,單片機(jī)測(cè)量控制模塊。話筒放大器采用NE5532P音前置芯片,對(duì)語音信號(hào)進(jìn)行放大;八階低通濾波器MAX293完成基音信號(hào)的提取;單片機(jī)STC12C5410AD實(shí)現(xiàn)頻率測(cè)量和控制輸出功能。經(jīng)仿真與電路實(shí)測(cè),男女聲的識(shí)別效果良好。關(guān)鍵詞:男女聲識(shí)別、基音頻率、低通濾波器、單片機(jī)。一、引言 人類基音的范圍約為70350Hz左右,由于生理結(jié)構(gòu)的不同,男性與女性的聲音呈現(xiàn)出不同的聽覺特征,男

2、聲的基音頻率大都在100200HZ之間,而女聲則在200350HZ之間;在會(huì)話中,同一發(fā)音者的基音頻率變化的統(tǒng)計(jì)結(jié)果,如圖一所示。女聲與男聲相比,前者的平均值、標(biāo)準(zhǔn)差都為后者的兩倍左右。不同發(fā)音者的基音頻率分布如圖二所示,在對(duì)數(shù)頻率軸上男聲,女聲分別呈現(xiàn)正態(tài)分布,男聲的基音頻率的平均值和標(biāo)準(zhǔn)差分別為125HZ及其20HZ。女聲約為男聲的2倍。鑒于男女聲存在基音頻率的明顯差異,基音頻率可作為男女聲識(shí)別的依據(jù)。二、方案論證與比較基于男女聲基音頻率的差異,男女聲識(shí)別的實(shí)現(xiàn)可以通過基音頻率的測(cè)量來實(shí)現(xiàn)?;纛l率的實(shí)現(xiàn)有多種方法。如FFT分析、自相關(guān)分析等。方案一:基于FFT的短時(shí)頻譜分析。把語音信號(hào)數(shù)

3、字化,即經(jīng)AD采樣量化之后,用FFT算法處理,得到信號(hào)的頻譜,從而獲得基音頻率。這種方法由于算法較復(fù)雜,數(shù)據(jù)處理量大,如用單片機(jī)來實(shí)現(xiàn),編程復(fù)雜,運(yùn)算速度慢,難以滿足實(shí)時(shí)要求。方案二:濾波器基音提取技術(shù)。利用低通濾波器濾除多次諧波及共振峰等高頻成分,得到近似的基音信號(hào),此法可以用硬件電路構(gòu)成濾波器實(shí)現(xiàn)基音信號(hào)的粗略提取,避免了大量算法分析和數(shù)據(jù)處理,實(shí)現(xiàn)起來相當(dāng)簡(jiǎn)單。為了證明這種方法的有效性, 我們用計(jì)算機(jī)聲卡錄制了近20名男女同學(xué)的單音、詞組和句子的WAV文件,在MATLAB上編寫程序進(jìn)行仿真。1男女聲信號(hào)通過400HZ低通濾波后的仿真波形比較。我們將男女聲信號(hào)經(jīng)過八階低通濾波器,其截止頻率

4、設(shè)定為400HZ。仿真結(jié)果如圖三所示。從圖形上我們可以看到:通過400HZ的低通濾波器后,男聲輸出為約120HZ左右周期性信號(hào)(非單頻正弦波);女聲輸出約250HZ左右周期性信號(hào),其波形接近正弦波。這說明經(jīng)過400HZ低通濾波器后,女聲聲音主要由基音信號(hào)構(gòu)成,而男性聲音的非正弦性是由于其二次諧波及共振峰的存在的結(jié)果。2男女聲信號(hào)通過200HZ低通濾波后的仿真波形比較。我們將男聲、女聲輸入信號(hào)經(jīng)過八階低通數(shù)字濾波器濾波,截止頻率設(shè)定為200HZ。男聲、女聲及其通過200HZ低通濾波后的波形如圖四所示:從上邊的圖形我們看出:經(jīng)過200HZ的低通濾波器,男聲輸出為較好的正弦波(基音信號(hào)),而女聲基本

5、上沒有信號(hào)通過。從MATLAB數(shù)據(jù)處理軟件對(duì)采集信號(hào)分析的結(jié)果表明,用濾波器提取基音頻率的方法完全可行。我們?cè)谟?jì)算機(jī)上用這種方法編寫了男女聲識(shí)別軟件,對(duì)男女聲基音特征進(jìn)行提取,實(shí)現(xiàn)了識(shí)別的仿真。實(shí)驗(yàn)表明,在正常說話條件下,系統(tǒng)具有較高的識(shí)別率,仿真效果令人滿意。三、系統(tǒng)實(shí)現(xiàn)1設(shè)計(jì)思想與系統(tǒng)構(gòu)成:話筒放大200HZ低頻濾波400HZ低頻濾波單片機(jī)整流整流LED燈顯示 話筒產(chǎn)生的語音信號(hào)很微弱,大約50mV左右,必須經(jīng)過放大才能送往后級(jí)電路處理。兩個(gè)高階低通濾波器分別工作在400HZ的截止頻率和200HZ截止頻率。這主要是為了保證始終有一路信號(hào)是含諧波分量較少的近似基音信號(hào)。整形電路把正弦波轉(zhuǎn)化為

6、矩形脈沖,送往單片機(jī)STC12C5010AD測(cè)量其周期。單片機(jī)完成多次測(cè)量后,進(jìn)行統(tǒng)計(jì),作出男聲還是女聲的判斷,送輸出顯示。2主要電路的設(shè)計(jì)與說明A、話筒放大電路通過用NE5532P芯片來實(shí)現(xiàn)語音放大,把微弱的語音信號(hào)放大的50倍左右。如圖所示,采用NE5532運(yùn)算放大器作音頻前置放大電路。其優(yōu)點(diǎn)是體積小、功耗小、一致性較好。電路如下圖所示:B、低通濾波電路采用MAX293可控截止頻率8階巴特沃夫低通濾波器,如圖所示,則電路結(jié)構(gòu)簡(jiǎn)單,外圍元件少,截止頻率可由外部時(shí)鐘控制或由時(shí)鐘輸入端所接電容決定。截止頻率控制簡(jiǎn)單,且濾波效果好。調(diào)試時(shí),由外部時(shí)鐘控制截止頻率,調(diào)試完成后,可將濾波器的截止頻率固

7、定,即在時(shí)鐘輸入端(CLK)接一個(gè)一定大小的電容。比較兩個(gè)方案,方案二實(shí)現(xiàn)濾波簡(jiǎn)單方便,滿足系統(tǒng)要求。C、全整流電路 如圖所示,U5A、U6A各組成一線性半波整流電路,而U5B、U6B各組成一加法電路。U5A和U5B,U6A和U6B構(gòu)成一線性全波整流電路。D、單片機(jī)電路 把經(jīng)過整流后的兩路頻率信號(hào)輸入STC12C5410AD進(jìn)行AD轉(zhuǎn)換并采樣。再各求出兩組采樣好的數(shù)據(jù)的能量,以便來進(jìn)行比較。若求出來的兩個(gè)結(jié)果較接近就為男聲,那么男聲的那個(gè)發(fā)光二極管就會(huì)亮起來。若兩個(gè)結(jié)果相差較大就為女聲,那么女聲的那個(gè)發(fā)光二極管就會(huì)亮起。電路如下:3. 軟件設(shè)計(jì) A 程序設(shè)計(jì)流程圖:B 程序:#includes

8、fr ADC_LOW2 = 0xBE;/定義STC12C5410AD特殊功能寄存器sfr ADC_CONTR = 0xC5;sfr ADC_DATA = 0xC6;sfr p0m0 = 0x93;sfr p0m1 = 0x94;sfr p1m0 = 0x91;sfr p1m1 = 0x92;sfr p2m0 = 0x95;sfr p2m1 = 0x96;sfr p3m0 = 0xb1;sfr p3m1 = 0xb2;sbit getv = P21;/定義指示燈sbit male = P26;sbit female = P27;#define divgate 4/定義全局常量和全局變量#defi

9、ne countgate 185#define on 1#define off 0unsigned char div;unsigned char ad200,ad400;unsigned char test;unsigned char i,count;unsigned char code display_AD_channel_ID2 = 0x00,0x01;void delay100us( char Delay)/延時(shí)程序,延時(shí)時(shí)間=Delay*100us char d; for(;Delay0;Delay-) for(d=0;d0;t-) for(j=6245;j0;j-) ;unsigne

10、d char Ad_Change(unsigned char channel)/AD轉(zhuǎn)換子程序 ADC_CONTR = ADC_CONTR&0xe0; /1110,0000 清ADC_FLAG,ADC_START位和低3位 ADC_CONTR = ADC_CONTR|(display_AD_channel_IDchannel&0x07); /設(shè)置當(dāng)前通道號(hào) /延時(shí)使輸入電壓達(dá)到穩(wěn)定 ADC_DATA = 0; /清A/D轉(zhuǎn)換結(jié)果寄存器 delay100us(5); ADC_CONTR = ADC_CONTR|0x08; /0000,1000ADCS 1,啟動(dòng)轉(zhuǎn)換 do ; while(ADC_

11、CONTR & 0x10)=0); /0001,0000等待A/D轉(zhuǎn)換結(jié)束 ADC_CONTR = ADC_CONTR&0xE7; /1110,0111清ADC_FLAG位,停止A/D轉(zhuǎn)換 return ADC_DATA;void get_result()/聲音采集和處理子程序 count=0; getv=on; male=off; female=off; for(i=0;idivgate) count+; else if(ad200countgate)/判別男女并指示 female=on;male=off; else male=on;female=off;getv=off; delay50m

12、s(50);delay50ms(50);delay50ms(50);delay50ms(50);delay50ms(50);delay50ms(50);delay50ms(50);delay50ms(50);delay50ms(50);delay50ms(50);delay50ms(50);/返回等待下次測(cè)試void main() SP=0x31; IE=0x85;/開系統(tǒng)中斷 getv=0; male=1; female=0; ADC_CONTR =0xe0; /1110,0000打開A/D轉(zhuǎn)換電源。設(shè)定采樣速率為210個(gè)機(jī)器周期 p1m0 = 0x03; /0000,0011P1.0-P1

13、.1先設(shè)為開漏。斷開內(nèi)部上拉電阻 p1m1 = 0x00; delay100us(10); while(1)/循環(huán)等待聲音信號(hào)輸入 male=male; female=female; delay50ms(50); test=Ad_Change(0);/先不跟你聊了,寫好程序部分的實(shí)驗(yàn)報(bào)告好給你們 if(test0x02) test=Ad_Change(0); if(test0x02)/重復(fù)先不跟你聊了,寫好程序部分的實(shí)驗(yàn)報(bào)告好給你們 test=Ad_Change(0); if(test0x02) get_result();/對(duì)聲音進(jìn)行判別 四、系統(tǒng)電路測(cè)試與分析1帶話筒放大器的測(cè)試:調(diào)整放大增

14、益,使輸出幅度較大而不失真。2低通濾波器性能的測(cè)試:信號(hào)發(fā)生器產(chǎn)生200400HZ正弦波作為400Hz截止頻率低通濾波器的輸入信號(hào),用示波器觀察輸出信號(hào),可看到輸出為正弦波,450HZ以上正弦波輸入時(shí)基本無輸出信號(hào),可見濾波效果很好。信號(hào)發(fā)生器產(chǎn)生100300HZ正弦波作為200Hz截止頻率低通濾波器的輸入信號(hào),用示波器觀察輸出信號(hào),同樣可看到很好的濾波效果。3單片機(jī)系統(tǒng)調(diào)試:用仿真器調(diào)試測(cè)量與處理程序。4整機(jī)測(cè)試:下面是對(duì)若干位學(xué)生的測(cè)試結(jié)果。測(cè)試聲音平均基音頻率(Hz)判定結(jié)果男聲164.4男男聲164.6男男聲139.2男男聲152.2男男聲161男女聲255.8男女聲242.4男女聲2

15、79.2女女聲264.6女女聲254.4男由測(cè)試結(jié)果得到,該系統(tǒng)判斷準(zhǔn)確率為70。原因是,就一個(gè)說話者來說,基音頻率并不是固定不變的,不同聲音、不同聲調(diào)、說話者的情緒等都會(huì)影響基音頻率,另外輔音會(huì)對(duì)測(cè)試結(jié)果有一定的影響。正因?yàn)槿绱?,容易造成誤判。(如某位男同學(xué)發(fā)的某些音,用系統(tǒng)測(cè)試誤判為女聲)。五 總結(jié) 這個(gè)科技制作,我們從三月份開始著手找方案,并多次找鐘老師指導(dǎo),一開始,我們想嘗試用全軟件的ARM的開發(fā)板實(shí)現(xiàn),可是近半個(gè)月的時(shí)間,找的資料都沒能讓我們很好的了解ARM的使用,所以我們最后決定改變方案,使用硬件跟單片機(jī)軟件相結(jié)合的辦法,硬件部分,對(duì)所需的芯片不熟悉,經(jīng)過鐘老師指導(dǎo),我們應(yīng)用了MA

16、X293的濾波器,經(jīng)網(wǎng)上找資料,學(xué)會(huì)MAX293的應(yīng)用及其外圍電路的搭建,放大電路并沒有太大的問題,只是我們本來打算用一個(gè)具有自增益控制的芯片,但是在賽格找不到,所以只能單用運(yùn)放實(shí)現(xiàn),放大跟濾波的電路完成后,整流部分則參考了模擬電子線路里面的一個(gè)圖。前面硬件部分基本完成,然后就開始制板,因?yàn)橹岸紱]有接觸過,所以只能從零開始,學(xué)著用PROTEI軟件,畫原理圖并畫PCB,然后去實(shí)驗(yàn)室做板,做伴并沒有太大的問題,但是因?yàn)樾酒翘庋b,所以焊帖片是很新的嘗試,還好有同學(xué)的指導(dǎo)才能掌握其中的訣竅。第一次制板,因?yàn)闆]有經(jīng)驗(yàn),所以一口氣就把整個(gè)硬件電路做在一塊板上,結(jié)果調(diào)試的時(shí)候有問題,可是卻沒有辦法檢查哪里出問題,所以第一塊板就宣布廢掉,接下來,決定按模塊分開做,放大,濾波,整流,和單片機(jī)部分。放大部分我們用萬能板,其他三個(gè)部分都是用腐蝕板,濾波部分電路一次就完成,但是整流部分卻出現(xiàn)問題,檢查電路并沒有問題,可是就是沒有整流效果,所以最后只能重新用萬能板,最后終于完成整流部分的電路。單片機(jī)部分,主要是由另一個(gè)組員完成,所以單片機(jī)部分的程序設(shè)計(jì)我并沒有參與。這個(gè)科技制作中,我們遇到了很多很多的問題,大問題小問題都有,首先是怎么找資料,開始很茫然的在網(wǎng)上搜索,可是很多并沒有很完整,或者是沒有很規(guī)范,經(jīng)過鐘老師的推薦,我們很多資料都在的網(wǎng)頁上

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論