版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、. 2016理工大學(xué)第二屆研究生數(shù)學(xué)建模競賽參賽承諾書我們仔細(xì)閱讀了理工大學(xué)研究生數(shù)學(xué)建模競賽的競賽規(guī)則.我們完全明白,在競賽開場后參賽隊(duì)員不能以任何方式包括、電子、網(wǎng)上咨詢等與隊(duì)外的任何人包括指導(dǎo)教師研究、討論與賽題有關(guān)的問題。我們知道,抄襲別人的成果是違反競賽規(guī)則的, 如果引用別人的成果或其他公開的資料包括網(wǎng)上查到的資料,必須按照規(guī)定的參考文獻(xiàn)的表述方式在正文引用處和參考文獻(xiàn)中明確列出。我們重承諾,嚴(yán)格遵守競賽規(guī)則,以保證競賽的公正、公平性。如有違反競賽規(guī)則的行為,我們將受到嚴(yán)肅處理。我們授權(quán)理工大學(xué)研究生數(shù)學(xué)建模競賽組委會,可將我們的論文以任何形式進(jìn)展公開展示包括進(jìn)展網(wǎng)上公示,在書籍、期
2、刊和其他媒體進(jìn)展正式或非正式發(fā)表等。我們參賽選擇的題號是從組委會提供的試題中選擇一項(xiàng)填寫:我們的參賽報(bào)名號為如果組委會設(shè)置報(bào)名號的話:所屬學(xué)校請?zhí)顚懲暾娜簠①愱?duì)員 (打印并簽名) :1. 2. 3. 指導(dǎo)教師或指導(dǎo)教師組負(fù)責(zé)人 (打印并簽名):日期:年月日評閱由組委會評閱前進(jìn)展:2016理工大學(xué)研究生數(shù)學(xué)建模競賽專用頁評閱由組委會評閱前進(jìn)展:評閱記錄可供評閱時使用:評閱人評分備注聲音識別模型的建立與評價(jià)摘要本文通過使用MATLAB軟件對聲音的時域和頻域特征進(jìn)展了提取,研究特征向量提取方法及SVM核函數(shù)和參數(shù)選取對識別結(jié)果的影響,分析特征提取算法的優(yōu)缺點(diǎn),以及不同核函數(shù)以及懲罰參數(shù)對識別性
3、能的影響。通過使用支持向量機(jī)法建模,根本到達(dá)了區(qū)分正常聲音與非正常聲音的目的。最后提出用低通濾波濾除白噪聲。關(guān)鍵詞:特征向量,支持向量機(jī),核函數(shù),低通濾波,白噪聲從物理上講,聲音是由物體振動產(chǎn)生的一種波,并通過空氣作用于人的耳鼓,使人們能夠感知。聲音的具有四種性質(zhì):1音高:振動發(fā)出的聲波有不同的頻率,稱為音高;2強(qiáng)弱:聲音的強(qiáng)弱是由振幅決定的,振幅是代表物體振動強(qiáng)度的特定單位,一般用分貝(dB)來表示。3長短:一般把聲音的開展過程分為四個階段,分別是觸發(fā)、衰減、保持和消失。這四個階段稱為包絡(luò),包絡(luò)的發(fā)生時間,也就是一個聲音的長短。4)音質(zhì):音質(zhì)好的聲音聽起來悅耳,相反則讓人不適。問題一利用ma
4、tlab中的sound函數(shù),播放出聲音信號,試聽并比擬正常和非正常開門聲音的差異,利用plot函數(shù)繪制出具體的聲音波形圖,總結(jié)差異在哪些方面?試聽:我們使用sound函數(shù)播放聲音樣本。在仔細(xì)聽了正常開門及非正常開門的聲音后,發(fā)現(xiàn)了他們之間的差異:正常開門聲音很短促,即聲音的長短度短,且其強(qiáng)弱度相對較低。相反非正常開門聲音持續(xù)時間長,強(qiáng)弱度高。畫圖:我們選取了三組正常開門及三組非正常開門的聲音,使用plot函數(shù)畫出聲音波形圖,如下列圖1所示:由圖1可以看出正常開門的聲音波形比擬疏松,所以音調(diào)就低。非正常開門的聲音波形比擬密集,所以聲調(diào)就高。我們還可以看出前者聲波比擬集中,而后者則比擬散,即跨度大
5、。這一點(diǎn)很好理解,正常用鑰匙開門所需時間肯定比盜賊撬鎖所需時間短,所以就造成了這種現(xiàn)象。程序源代碼見附錄一。圖1正常與非正常開門聲音波形圖問題二利用適宜的時域或和頻域特征表達(dá)個聲音信號,建立特征向量,寫出提取特征向量的具體方法和程序代碼。首先,我們對兩種樣本求其均值。由于正常開門的第一組數(shù)據(jù)有人聲干擾,故舍去。然后用plot函數(shù)畫出聲音波形圖,如下列圖2所示:根據(jù)所分析的參數(shù)類型,語音信號分析可以分成時域分析和變換域(頻域、倒譜域)分析。其中時域分析方法是最簡單、最直觀的方法,因?yàn)樗苯訉φZ音信號的時域波形進(jìn)展分析。接下來我們先進(jìn)展時域分析。圖2 正常開門聲與非正常開門聲均值短時平均能量:定義
6、n時刻*語音信號的短時平均能量En為:1式中,N為窗長,可見短時能量為一幀樣點(diǎn)值的平方和。一般我們認(rèn)為聲音在10-30ms之是穩(wěn)定的,取幀長也在10-30ms之,而幀移通常取5-15ms之間,所以取N=55、95、125、165。如下列圖3、4為正常開門及非正常開門N取不同值時短時能量函數(shù)隨幀數(shù)的變化曲線,其中橫坐標(biāo)為幀數(shù)。由圖3、圖4可以看出,N=55,N=95時的曲線不夠平滑,而N=165的曲線又過于平滑,應(yīng)選取N=125時的曲線。圖3 正常開門聲音的短時能量曲線圖4 非正常開門聲音的短時能量曲線通過觀察短時能量曲線,可以看出正常開門時的能量比擬集中且數(shù)值小,非正常開門時的能量比擬分散且數(shù)
7、值大。容易想到,這些現(xiàn)象與前面問題一的結(jié)論是相吻合的。短時平均過零率:短時平均過零率是指每幀信號通過零值的次數(shù)。對有時間橫軸的連續(xù)聲音信號,可以觀察到聲音的時域波形通過橫軸的情況。在離散時間聲音信號情況下,如果相鄰的采樣具有不同的代數(shù)符號就稱為發(fā)生了過零,因此可以計(jì)算過零的次數(shù)。2上式為短時平均過零率的公式,其中,sgn為符號函數(shù),即3短時平均過零率曲線如下列圖5、圖6所示:圖5 正常開門聲音的短時平均過零率圖6 非正常開門聲音的短時平均過零率由圖5、圖6可以看出前者比后者的過零率要高。短時自相關(guān)函數(shù):自相關(guān)函數(shù)用于衡量信號自身時間波形的相似性。對于聲音來說,采用短時分析方法,可以定義短時自相
8、關(guān)函數(shù)為:4短時自相關(guān)函數(shù)曲線如下列圖7、圖8所示:圖7 正常開門聲音的自相關(guān)函數(shù)曲線圖8 非正常開門聲音的自相關(guān)函數(shù)頻域特征:頻域分析主要是對聲音波形進(jìn)展傅里葉變換,如下列圖9所示:圖9 聲音波形的傅里葉變換由圖9可以看出正常開門的對數(shù)幅度要比非正常開門的對數(shù)幅度小的多。程序源代碼見附錄二。問題三建立聲音識別模型二分類模型,利用模型區(qū)分正常和非正常聲音,評價(jià)模型的好壞。問題三利用支持向量機(jī)構(gòu)建二分類器對正常與非正常敲門進(jìn)展分類預(yù)測。支持向量機(jī)是Cortes和Vapnik于1995年提出的,與傳統(tǒng)分類器比擬,它在解決小樣本、非線性及高維模式識別中表現(xiàn)出許多特有的優(yōu)勢,并能夠推廣應(yīng)用到函數(shù)擬合等
9、其他機(jī)器學(xué)習(xí)問題中。支持向量機(jī)方法是建立在統(tǒng)計(jì)學(xué)習(xí)理論的VC 維理論和構(gòu)造風(fēng)險(xiǎn)最小原理根底上的,根據(jù)有限的樣本信息在模型的復(fù)雜性和學(xué)習(xí)能力之間尋求最正確折衷,以期獲得最好的推廣能力。圖10 支持向量機(jī)分類器構(gòu)造圖采集樣本共有80組音頻信號,從中選擇60組數(shù)據(jù)做為訓(xùn)練數(shù)據(jù)訓(xùn)練網(wǎng)絡(luò),20組數(shù)據(jù)作為測試數(shù)據(jù)測試網(wǎng)絡(luò)分類能力。下面是準(zhǔn)備數(shù)據(jù)步驟:Step1: 根據(jù)給定的數(shù)據(jù),選定訓(xùn)練集和測試集;Step2: 為訓(xùn)練集與測試集選定標(biāo)簽集;Step3: 利用訓(xùn)練集進(jìn)展訓(xùn)練分類器得到model;Step4: 根據(jù)model,對測試集進(jìn)展測試集得到accuracy rate;訓(xùn)練集:trainset(); 分
10、別取正常開門與非正常開門數(shù)據(jù)的一半作為訓(xùn)練集;測試集:testset(); 分別取正常開門與非正常開門數(shù)據(jù)的另一半作為測試集;標(biāo)簽集:label(); 取bedroom的數(shù)據(jù)為正類標(biāo)簽為1;forse的數(shù)據(jù)為負(fù)類標(biāo)簽為-1.下面為svm二分類器的分類結(jié)果:圖11 基于支持向量機(jī)的分類器上圖將展示了訓(xùn)練與測試的結(jié)果,結(jié)果等于1表示正常聲音,結(jié)果為-1為非正常開門聲,通過學(xué)習(xí)訓(xùn)練得到上圖結(jié)果。程序源代碼見附件三。通過仿真,驗(yàn)證了支持向量機(jī)在解決分類問題中的優(yōu)勢,今后可以將這方法用于更深層次的語音識別中。問題四試?yán)锰卣鬟x擇或變換,對特征向量進(jìn)展優(yōu)化,并利用參數(shù)優(yōu)化技術(shù)優(yōu)化模型的參數(shù),使識別模型的準(zhǔn)
11、確率提高。問題四其中支持向量機(jī)的核函數(shù)主要有:線性核函數(shù),多項(xiàng)式核函數(shù),徑向基核函數(shù),兩層感知器核函數(shù)。不同的核函數(shù)直接影響SVM的分類能力,使用不同的核函數(shù)SVM分類的效果不同,所需要的時間也不同,下列圖是使用短時能量值和均值為特征參數(shù),選取RBF為核函數(shù)的分類效果圖:圖 12 SVMRBF分類圖圖13 分類模型錯誤率此模型相比于問題三中建立的SVM分類模型分類正確率明顯提高,到達(dá)了85.65%,可見適宜的核函數(shù)選取的重要意義。程序源代碼見附錄四。問題五白噪聲,是指功率譜密度在整個頻域均勻分布的噪聲,即其功率譜密度為 (5)式中,為常數(shù),。由于1和為一對傅里葉變換對,所以白噪聲的自相關(guān)函數(shù)為
12、 (6)由式(1)、式(2)可知,白噪聲的自相關(guān)函數(shù)僅在時才不為零,而對于其他任意的,白噪聲的自相關(guān)函數(shù)都為零,即在任意兩個不同時刻上的隨機(jī)變量都是不相關(guān)的。對于一個線性時不變系統(tǒng)(如濾波器),該系統(tǒng)是由它的沖激響應(yīng)或等效地由它的頻率響應(yīng)表征,這里的和是一對傅里葉變換對。如果令為系統(tǒng)的輸人信號,是輸出信號。系統(tǒng)的輸出可以表示成如下形式: (7)如果是平穩(wěn)隨機(jī)過程的樣本函數(shù),則就是隨機(jī)過程的樣本函數(shù)??梢郧蟪鲚敵龅淖韵嚓P(guān)函數(shù)是 (8)由于我們知道自相關(guān)函數(shù)和功率譜密度函數(shù)是一對傅里葉變換對,所以可以得到輸出過程的功率密度譜,即為相關(guān)函數(shù)的傅里葉變換: (9)由此可以看出,輸出信號的功率譜密度就是
13、輸入信號的功率譜密度乘以系統(tǒng)的頻率響應(yīng)的模的平方。當(dāng)輸入隨機(jī)過程是白噪聲時,輸出隨機(jī)過程的自相關(guān)特性和功率密度譜將完全由系統(tǒng)的頻率響應(yīng)所決定。我們設(shè)計(jì)了一個低通濾波器,對加了白噪聲的聲音信號進(jìn)展濾波,即可去除白噪聲。低通濾波(Low-pass filter) 是一種過濾方式,規(guī)則為低頻信號能正常通過,而超過設(shè)定臨界值的高頻信號則被阻隔、減弱。但是阻隔、減弱的幅度則會依據(jù)不同的頻率以及不同的濾波程序目的而改變。在數(shù)字圖像處理領(lǐng)域,從頻域看,低通濾波可以對圖像進(jìn)展平滑去噪處理。濾波器將這局部不需要的頻率濾除,就實(shí)現(xiàn)了去噪的效果。濾波前與濾波后的聲音波形比照方下列圖所示:圖14 濾波前后信號波形比照
14、實(shí)驗(yàn)說明低通濾波具有良好的去噪能力,該方法對添加的噪聲處理后,與原始信號效果幾乎擬合。證明低通濾波對信號去噪是可行的。程序源代碼見附錄五附錄附錄一:clc;clear for i=5:7 j=2*(i-4)-1; a=正 num2str(i); load(a) subplot(3,2,j); plot(y) title(正 num2str(i) *label(Time); ylabel(Amplitude); a=非 num2str(i); load(a) subplot(3,2,j+1) plot(y) title(非 num2str(i) *label(Time); ylabel(Ampl
15、itude);endsaveas(gcf,q1.jpg);附錄二:均值function fei=feipj()fei=zeros(55125,1);for i=1:40 a=非 num2str(i); load(a) fei=fei+y;endfei=fei/40;短時平均能量function energy=nengliang(y)s=fra(55,55,y) ; s2=s.2; %一幀各樣點(diǎn)的能量energy=sum(s2,2) ; %求一幀能量subplot(2,2,1) %定義畫圖數(shù)量和布局plot(energy) %畫N=55時的語音能量圖*label(幀數(shù)) %橫坐標(biāo)ylabel(短
16、時能量 E) %縱坐標(biāo)title(N=55) %曲線標(biāo)識s=fra(95,95,y) ; s2=s.2;energy=sum(s2,2) ; subplot(2,2,2) plot(energy) %畫N=95時的語音能量圖*label(幀數(shù))ylabel(短時能量 E)title(N=95)s=fra(125,125,y) ; s2=s.2;energy=sum(s2,2);subplot(2,2,3) plot(energy) %畫N=125時的語音能量圖*label(幀數(shù))ylabel(短時能量 E)title(N=125)s=fra(165,165,y) ; s2=s.2;energy
17、=sum(s2,2);subplot(2,2,4) plot(energy) %畫N=165時的語音能量圖*label(幀數(shù))ylabel(短時能量 E)title(N=165)function f=fra(len,inc,*)fh=fi*(size(*,1)-len)/inc)+1);f=zeros(fh,len);i=1;n=1;while i=fh j=1; while j=len f(i,j)=*(n); j=j+1;n=n+1; end n=n-len+inc; i=i+1;end短時平均過零率function f=zcro(*)f=zeros(size(*,1),1); %生成全零
18、矩陣for i=1:size(*,1) z=*(i,:); %提取一行數(shù)據(jù) for j=1:(length(z)-1); if z(j)*z(j+1)0; f(i)=f(i)+1; end endendfunction zcr=guoling(*)s=fra(125,125,*);%分幀,幀移110zcr=zcro(s);%求過零率figure(1);subplot(2,1,1)plot(*);title(非);*label(Time);ylabel(Amplitude);subplot(2,1,2)plot(zcr);*label(幀數(shù));ylabel(過零次數(shù));title(原始信號的過零
19、率);短時自相關(guān)函數(shù)function A1=zi*iangguan(s1)N=125;A=; %加N=125的矩形窗for k=1:125;sum=0;for m=1:N-k+1;sum=sum+s1(m)*s1(m+k-1); %計(jì)算自相關(guān)endA(k)=sum;endfor k=1:125A1(k)=A(k)/A(1); %歸一化A(k);endplot(A1);title(非正常開門的自相關(guān)函數(shù))*label(延時 k)ylabel(R(k)傅里葉變換clc;clearFs=11025;zheng=zhengpj();fei=feipj();T=1/Fs;L=55125;t=(0:L-1
20、)*T;NFFT=2ne*tpow2(L);subplot(2,1,1)Y = fft(zheng,NFFT)/L;f = Fs/2*linspace(0,1,NFFT/2+1);y1=2*abs(Y(1:NFFT/2+1);plot(f,2*abs(Y(1:NFFT/2+1) title(正常開門的傅里葉變換)subplot(2,1,2)Y = fft(fei,NFFT)/L;f = Fs/2*linspace(0,1,NFFT/2+1);y2=2*abs(Y(1:NFFT/2+1);plot(f,2*abs(Y(1:NFFT/2+1) title(非正常開門的傅里葉變換)saveas(gc
21、f,fuliye.jpg)附錄三:clc;clearzhn=zeros(40,55125);zhn(1,:)=zhengpj();for i=2:40 name=正,num2str(i); load(name) zhn(i,:)=y;endfei=zeros(40,55125);for i=1:40 name=非,num2str(i); load(name) fei(i,:)=y;endlabel=ones(1,641),-ones(1,641);trainset=zhn(1:20,:);fei(1:20,:);testset=zhn(21:40,:);fei(21:40,:);mtrain,
22、ntrain = size(trainset);mtest,ntest = size(testset);test_dataset = trainset;testset;dataset_scale,ps = mapminma*(test_dataset,0,1);dataset_scale = dataset_scale;trainset = dataset_scale(1:mtrain,:);testset = dataset_scale( (mtrain+1):(mtrain+mtest),: );train=zeros(2,55125);test=zeros(2,55125);for i=
23、1:20 train(1,:)=trainset(i,:)+train(1,:); train(2,:)=trainset(i+20,:)+train(2,:);end for i=1:20 test(1,:)=testset(i,:)+test(1,:); test(2,:)=testset(i+20,:)+test(2,:);endtrain1=zeros(2,1282);test1=zeros(2,1282);train1(1,:)=train(1,1:43:55125);train1(2,:)=train(2,1:43:55125);test1(1,:)=test(1,1:43:551
24、25);test1(2,:)=test(2,1:43:55125);train1=train1;test1=test1;p=cvpartition(label,Holdout,0.2);model = svmtrain(train1(p.training,:),label(p.training), showplot,true);C = svmclassify(model,train1(p.test,:),showplot,true);err_rate = sum(label(p.test)= C)/p.TestSizesaveas(gcf,wentisan2.jpg);附錄四:clear;clc;closeall;disp(-采用徑向基積函數(shù)的支持向量機(jī)的應(yīng)用-);disp(輸入樣本矩陣(每行表示一個測試數(shù)據(jù)):);%*=randn(1,20)-3randn(1,20)+3;randn(1,40)loadpj1.matloadpj2.matdisp(樣本所屬類別:);a1=pj1(1:100:55125);a2=pj2(1:100:55125);a3=a1a2;y=-ones(1,276)ones(1,276);nsv,alpha,bias,T=
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年新世紀(jì)版七年級科學(xué)上冊階段測試試卷
- 二零二五年度影視基地租賃與影視制作承包協(xié)議3篇
- 二零二五年度人工智能教育平臺投資合同4篇
- 二零二五年度苗木運(yùn)輸與生態(tài)建設(shè)合同樣本4篇
- 2025年度模特隱私保護(hù)與形象使用權(quán)授權(quán)合同范本4篇
- 二零二五年度風(fēng)力發(fā)電機(jī)租賃合同范本3篇
- 2025年洗衣網(wǎng)籃項(xiàng)目可行性研究報(bào)告
- 2025至2030年中國汽車助劑數(shù)據(jù)監(jiān)測研究報(bào)告
- 二零二五年度重型貨車所有權(quán)轉(zhuǎn)讓合同范本3篇
- 二零二五年度旅游紀(jì)念品畫冊設(shè)計(jì)生產(chǎn)合作協(xié)議3篇
- 帶狀皰疹護(hù)理查房課件整理
- 年月江西省南昌市某綜合樓工程造價(jià)指標(biāo)及
- 奧氏體型不銹鋼-敏化處理
- 作物栽培學(xué)課件棉花
- 交通信號控制系統(tǒng)檢驗(yàn)批質(zhì)量驗(yàn)收記錄表
- 弱電施工驗(yàn)收表模板
- 絕對成交課件
- 探究基坑PC工法組合鋼管樁關(guān)鍵施工技術(shù)
- 國名、語言、人民、首都英文-及各地區(qū)國家英文名
- API SPEC 5DP-2020鉆桿規(guī)范
- 組合式塔吊基礎(chǔ)施工專項(xiàng)方案(117頁)
評論
0/150
提交評論