版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、男女聲識(shí)別系統(tǒng)摘 要:本文通過對男性和女性聲音的語音特征的研究,發(fā)現(xiàn)男女聲的基音頻率存在較大的差異,并設(shè)計(jì)了基于基音頻率分析的男女聲識(shí)別系統(tǒng)。男女聲識(shí)別系統(tǒng)由以下三個(gè)模塊電路構(gòu)成:話筒放大器,低通濾波器,半波整流電路,單片機(jī)測量控制模塊。話筒放大器采用NE5532P音前置芯片,對語音信號進(jìn)行放大;八階低通濾波器MAX293完成基音信號的提??;單片機(jī)STC12C5410AD實(shí)現(xiàn)頻率測量和控制輸出功能。經(jīng)仿真與電路實(shí)測,男女聲的識(shí)別效果良好。關(guān)鍵詞:男女聲識(shí)別、基音頻率、低通濾波器、單片機(jī)。一、引言 人類基音的范圍約為70350Hz左右,由于生理結(jié)構(gòu)的不同,男性與女性的聲音呈現(xiàn)出不同的聽覺特征,男
2、聲的基音頻率大都在100200HZ之間,而女聲則在200350HZ之間;在會(huì)話中,同一發(fā)音者的基音頻率變化的統(tǒng)計(jì)結(jié)果,如圖一所示。女聲與男聲相比,前者的平均值、標(biāo)準(zhǔn)差都為后者的兩倍左右。不同發(fā)音者的基音頻率分布如圖二所示,在對數(shù)頻率軸上男聲,女聲分別呈現(xiàn)正態(tài)分布,男聲的基音頻率的平均值和標(biāo)準(zhǔn)差分別為125HZ及其20HZ。女聲約為男聲的2倍。鑒于男女聲存在基音頻率的明顯差異,基音頻率可作為男女聲識(shí)別的依據(jù)。二、方案論證與比較基于男女聲基音頻率的差異,男女聲識(shí)別的實(shí)現(xiàn)可以通過基音頻率的測量來實(shí)現(xiàn)?;纛l率的實(shí)現(xiàn)有多種方法。如FFT分析、自相關(guān)分析等。方案一:基于FFT的短時(shí)頻譜分析。把語音信號數(shù)
3、字化,即經(jīng)AD采樣量化之后,用FFT算法處理,得到信號的頻譜,從而獲得基音頻率。這種方法由于算法較復(fù)雜,數(shù)據(jù)處理量大,如用單片機(jī)來實(shí)現(xiàn),編程復(fù)雜,運(yùn)算速度慢,難以滿足實(shí)時(shí)要求。方案二:濾波器基音提取技術(shù)。利用低通濾波器濾除多次諧波及共振峰等高頻成分,得到近似的基音信號,此法可以用硬件電路構(gòu)成濾波器實(shí)現(xiàn)基音信號的粗略提取,避免了大量算法分析和數(shù)據(jù)處理,實(shí)現(xiàn)起來相當(dāng)簡單。為了證明這種方法的有效性, 我們用計(jì)算機(jī)聲卡錄制了近20名男女同學(xué)的單音、詞組和句子的WAV文件,在MATLAB上編寫程序進(jìn)行仿真。1男女聲信號通過400HZ低通濾波后的仿真波形比較。我們將男女聲信號經(jīng)過八階低通濾波器,其截止頻率
4、設(shè)定為400HZ。仿真結(jié)果如圖三所示。從圖形上我們可以看到:通過400HZ的低通濾波器后,男聲輸出為約120HZ左右周期性信號(非單頻正弦波);女聲輸出約250HZ左右周期性信號,其波形接近正弦波。這說明經(jīng)過400HZ低通濾波器后,女聲聲音主要由基音信號構(gòu)成,而男性聲音的非正弦性是由于其二次諧波及共振峰的存在的結(jié)果。2男女聲信號通過200HZ低通濾波后的仿真波形比較。我們將男聲、女聲輸入信號經(jīng)過八階低通數(shù)字濾波器濾波,截止頻率設(shè)定為200HZ。男聲、女聲及其通過200HZ低通濾波后的波形如圖四所示:從上邊的圖形我們看出:經(jīng)過200HZ的低通濾波器,男聲輸出為較好的正弦波(基音信號),而女聲基本
5、上沒有信號通過。從MATLAB數(shù)據(jù)處理軟件對采集信號分析的結(jié)果表明,用濾波器提取基音頻率的方法完全可行。我們在計(jì)算機(jī)上用這種方法編寫了男女聲識(shí)別軟件,對男女聲基音特征進(jìn)行提取,實(shí)現(xiàn)了識(shí)別的仿真。實(shí)驗(yàn)表明,在正常說話條件下,系統(tǒng)具有較高的識(shí)別率,仿真效果令人滿意。三、系統(tǒng)實(shí)現(xiàn)1設(shè)計(jì)思想與系統(tǒng)構(gòu)成:話筒放大200HZ低頻濾波400HZ低頻濾波單片機(jī)整流整流LED燈顯示 話筒產(chǎn)生的語音信號很微弱,大約50mV左右,必須經(jīng)過放大才能送往后級電路處理。兩個(gè)高階低通濾波器分別工作在400HZ的截止頻率和200HZ截止頻率。這主要是為了保證始終有一路信號是含諧波分量較少的近似基音信號。整形電路把正弦波轉(zhuǎn)化為
6、矩形脈沖,送往單片機(jī)STC12C5010AD測量其周期。單片機(jī)完成多次測量后,進(jìn)行統(tǒng)計(jì),作出男聲還是女聲的判斷,送輸出顯示。2主要電路的設(shè)計(jì)與說明A、話筒放大電路通過用NE5532P芯片來實(shí)現(xiàn)語音放大,把微弱的語音信號放大的50倍左右。如圖所示,采用NE5532運(yùn)算放大器作音頻前置放大電路。其優(yōu)點(diǎn)是體積小、功耗小、一致性較好。電路如下圖所示:B、低通濾波電路采用MAX293可控截止頻率8階巴特沃夫低通濾波器,如圖所示,則電路結(jié)構(gòu)簡單,外圍元件少,截止頻率可由外部時(shí)鐘控制或由時(shí)鐘輸入端所接電容決定。截止頻率控制簡單,且濾波效果好。調(diào)試時(shí),由外部時(shí)鐘控制截止頻率,調(diào)試完成后,可將濾波器的截止頻率固
7、定,即在時(shí)鐘輸入端(CLK)接一個(gè)一定大小的電容。比較兩個(gè)方案,方案二實(shí)現(xiàn)濾波簡單方便,滿足系統(tǒng)要求。C、全整流電路 如圖所示,U5A、U6A各組成一線性半波整流電路,而U5B、U6B各組成一加法電路。U5A和U5B,U6A和U6B構(gòu)成一線性全波整流電路。D、單片機(jī)電路 把經(jīng)過整流后的兩路頻率信號輸入STC12C5410AD進(jìn)行AD轉(zhuǎn)換并采樣。再各求出兩組采樣好的數(shù)據(jù)的能量,以便來進(jìn)行比較。若求出來的兩個(gè)結(jié)果較接近就為男聲,那么男聲的那個(gè)發(fā)光二極管就會(huì)亮起來。若兩個(gè)結(jié)果相差較大就為女聲,那么女聲的那個(gè)發(fā)光二極管就會(huì)亮起。電路如下:3. 軟件設(shè)計(jì) A 程序設(shè)計(jì)流程圖:B 程序:#includes
8、fr ADC_LOW2 = 0xBE;/定義STC12C5410AD特殊功能寄存器sfr ADC_CONTR = 0xC5;sfr ADC_DATA = 0xC6;sfr p0m0 = 0x93;sfr p0m1 = 0x94;sfr p1m0 = 0x91;sfr p1m1 = 0x92;sfr p2m0 = 0x95;sfr p2m1 = 0x96;sfr p3m0 = 0xb1;sfr p3m1 = 0xb2;sbit getv = P21;/定義指示燈sbit male = P26;sbit female = P27;#define divgate 4/定義全局常量和全局變量#defi
9、ne countgate 185#define on 1#define off 0unsigned char div;unsigned char ad200,ad400;unsigned char test;unsigned char i,count;unsigned char code display_AD_channel_ID2 = 0x00,0x01;void delay100us( char Delay)/延時(shí)程序,延時(shí)時(shí)間=Delay*100us char d; for(;Delay0;Delay-) for(d=0;d0;t-) for(j=6245;j0;j-) ;unsigne
10、d char Ad_Change(unsigned char channel)/AD轉(zhuǎn)換子程序 ADC_CONTR = ADC_CONTR&0xe0; /1110,0000 清ADC_FLAG,ADC_START位和低3位 ADC_CONTR = ADC_CONTR|(display_AD_channel_IDchannel&0x07); /設(shè)置當(dāng)前通道號 /延時(shí)使輸入電壓達(dá)到穩(wěn)定 ADC_DATA = 0; /清A/D轉(zhuǎn)換結(jié)果寄存器 delay100us(5); ADC_CONTR = ADC_CONTR|0x08; /0000,1000ADCS 1,啟動(dòng)轉(zhuǎn)換 do ; while(ADC_
11、CONTR & 0x10)=0); /0001,0000等待A/D轉(zhuǎn)換結(jié)束 ADC_CONTR = ADC_CONTR&0xE7; /1110,0111清ADC_FLAG位,停止A/D轉(zhuǎn)換 return ADC_DATA;void get_result()/聲音采集和處理子程序 count=0; getv=on; male=off; female=off; for(i=0;idivgate) count+; else if(ad200countgate)/判別男女并指示 female=on;male=off; else male=on;female=off;getv=off; delay50m
12、s(50);delay50ms(50);delay50ms(50);delay50ms(50);delay50ms(50);delay50ms(50);delay50ms(50);delay50ms(50);delay50ms(50);delay50ms(50);delay50ms(50);/返回等待下次測試void main() SP=0x31; IE=0x85;/開系統(tǒng)中斷 getv=0; male=1; female=0; ADC_CONTR =0xe0; /1110,0000打開A/D轉(zhuǎn)換電源。設(shè)定采樣速率為210個(gè)機(jī)器周期 p1m0 = 0x03; /0000,0011P1.0-P1
13、.1先設(shè)為開漏。斷開內(nèi)部上拉電阻 p1m1 = 0x00; delay100us(10); while(1)/循環(huán)等待聲音信號輸入 male=male; female=female; delay50ms(50); test=Ad_Change(0);/先不跟你聊了,寫好程序部分的實(shí)驗(yàn)報(bào)告好給你們 if(test0x02) test=Ad_Change(0); if(test0x02)/重復(fù)先不跟你聊了,寫好程序部分的實(shí)驗(yàn)報(bào)告好給你們 test=Ad_Change(0); if(test0x02) get_result();/對聲音進(jìn)行判別 四、系統(tǒng)電路測試與分析1帶話筒放大器的測試:調(diào)整放大增
14、益,使輸出幅度較大而不失真。2低通濾波器性能的測試:信號發(fā)生器產(chǎn)生200400HZ正弦波作為400Hz截止頻率低通濾波器的輸入信號,用示波器觀察輸出信號,可看到輸出為正弦波,450HZ以上正弦波輸入時(shí)基本無輸出信號,可見濾波效果很好。信號發(fā)生器產(chǎn)生100300HZ正弦波作為200Hz截止頻率低通濾波器的輸入信號,用示波器觀察輸出信號,同樣可看到很好的濾波效果。3單片機(jī)系統(tǒng)調(diào)試:用仿真器調(diào)試測量與處理程序。4整機(jī)測試:下面是對若干位學(xué)生的測試結(jié)果。測試聲音平均基音頻率(Hz)判定結(jié)果男聲164.4男男聲164.6男男聲139.2男男聲152.2男男聲161男女聲255.8男女聲242.4男女聲2
15、79.2女女聲264.6女女聲254.4男由測試結(jié)果得到,該系統(tǒng)判斷準(zhǔn)確率為70。原因是,就一個(gè)說話者來說,基音頻率并不是固定不變的,不同聲音、不同聲調(diào)、說話者的情緒等都會(huì)影響基音頻率,另外輔音會(huì)對測試結(jié)果有一定的影響。正因?yàn)槿绱?,容易造成誤判。(如某位男同學(xué)發(fā)的某些音,用系統(tǒng)測試誤判為女聲)。五 總結(jié) 這個(gè)科技制作,我們從三月份開始著手找方案,并多次找鐘老師指導(dǎo),一開始,我們想嘗試用全軟件的ARM的開發(fā)板實(shí)現(xiàn),可是近半個(gè)月的時(shí)間,找的資料都沒能讓我們很好的了解ARM的使用,所以我們最后決定改變方案,使用硬件跟單片機(jī)軟件相結(jié)合的辦法,硬件部分,對所需的芯片不熟悉,經(jīng)過鐘老師指導(dǎo),我們應(yīng)用了MA
16、X293的濾波器,經(jīng)網(wǎng)上找資料,學(xué)會(huì)MAX293的應(yīng)用及其外圍電路的搭建,放大電路并沒有太大的問題,只是我們本來打算用一個(gè)具有自增益控制的芯片,但是在賽格找不到,所以只能單用運(yùn)放實(shí)現(xiàn),放大跟濾波的電路完成后,整流部分則參考了模擬電子線路里面的一個(gè)圖。前面硬件部分基本完成,然后就開始制板,因?yàn)橹岸紱]有接觸過,所以只能從零開始,學(xué)著用PROTEI軟件,畫原理圖并畫PCB,然后去實(shí)驗(yàn)室做板,做伴并沒有太大的問題,但是因?yàn)樾酒翘庋b,所以焊帖片是很新的嘗試,還好有同學(xué)的指導(dǎo)才能掌握其中的訣竅。第一次制板,因?yàn)闆]有經(jīng)驗(yàn),所以一口氣就把整個(gè)硬件電路做在一塊板上,結(jié)果調(diào)試的時(shí)候有問題,可是卻沒有辦法檢查哪里出問題,所以第一塊板就宣布廢掉,接下來,決定按模塊分開做,放大,濾波,整流,和單片機(jī)部分。放大部分我們用萬能板,其他三個(gè)部分都是用腐蝕板,濾波部分電路一次就完成,但是整流部分卻出現(xiàn)問題,檢查電路并沒有問題,可是就是沒有整流效果,所以最后只能重新用萬能板,最后終于完成整流部分的電路。單片機(jī)部分,主要是由另一個(gè)組員完成,所以單片機(jī)部分的程序設(shè)計(jì)我并沒有參與。這個(gè)科技制作中,我們遇到了很多很多的問題,大問題小問題都有,首先是怎么找資料,開始很茫然的在網(wǎng)上搜索,可是很多并沒有很完整,或者是沒有很規(guī)范,經(jīng)過鐘老師的推薦,我們很多資料都在的網(wǎng)頁上
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 教科版二年級上冊科學(xué)期末測試卷及完整答案1套
- 教科版二年級上冊科學(xué)期末測試卷【考試直接用】
- 創(chuàng)新數(shù)學(xué)教學(xué)方法在小學(xué)教育中的應(yīng)用
- 農(nóng)民合作社在綠色農(nóng)業(yè)發(fā)展中的作用
- 《數(shù)學(xué)廣角-優(yōu)化》教學(xué)實(shí)錄-2024-2025學(xué)年四年級上冊數(shù)學(xué)人教版
- 農(nóng)業(yè)科技在商業(yè)領(lǐng)域的應(yīng)用與前景
- 從實(shí)踐到創(chuàng)新-淺談實(shí)驗(yàn)教學(xué)對培養(yǎng)初中學(xué)生創(chuàng)新能力的作用
- 企業(yè)破產(chǎn)預(yù)警與家庭財(cái)務(wù)安全保障
- 從業(yè)務(wù)協(xié)同角度看銀私業(yè)務(wù)中的對沖投資機(jī)會(huì)與發(fā)展方向
- 以科技為引領(lǐng)打造智能化的單身公寓環(huán)境
- 期末綜合試卷(含答案)2024-2025學(xué)年蘇教版數(shù)學(xué)四年級上冊
- 2024年連云港專業(yè)技術(shù)人員繼續(xù)教育《飲食、運(yùn)動(dòng)和健康的關(guān)系》92分(試卷)
- MOOC 電磁場與電磁波理論-南京郵電大學(xué) 中國大學(xué)慕課答案
- GA 1809-2022城市供水系統(tǒng)反恐怖防范要求
- DGJ 08-70-2021 建筑物、構(gòu)筑物拆除技術(shù)標(biāo)準(zhǔn)
- 閥芯設(shè)計(jì)計(jì)算
- 百草園項(xiàng)目實(shí)施方案
- 史學(xué)概論考試復(fù)習(xí)資料(共13頁)
- 2024年義務(wù)教育國家課程設(shè)置實(shí)施方案
- 某乳業(yè)公司價(jià)格策略研究
- T∕CIAPS 0012-2021 磷酸鐵鋰電池壽命加速循環(huán)試驗(yàn)方法
評論
0/150
提交評論