數(shù)學(xué)建模聲音識別模型的建立與評價_第1頁
數(shù)學(xué)建模聲音識別模型的建立與評價_第2頁
數(shù)學(xué)建模聲音識別模型的建立與評價_第3頁
數(shù)學(xué)建模聲音識別模型的建立與評價_第4頁
數(shù)學(xué)建模聲音識別模型的建立與評價_第5頁
已閱讀5頁,還剩38頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、聲音識別模型的建立與評價【摘要】 聲音識別是研發(fā)智能防盜門的重要環(huán)節(jié),對正常和非正常開門(指盜竊開門等聲音)的聲音進(jìn)行準(zhǔn)確地識別變得尤為重要。本文對采集到的正常和非正常聲音進(jìn)行識別模型建立和評價。其主要方法是:利用80次聲音數(shù)據(jù),結(jié)合MATLAB工具及分析計算,建立正常、非正常聲音與數(shù)據(jù)y的均值、方差、短時平均能量均值、短時平均幅度均值、短時平均過零率均值和短時自相關(guān)函數(shù)均值之間的關(guān)系的BP神經(jīng)網(wǎng)絡(luò)模型。然后分析模型,確定目標(biāo)函數(shù)t,1表示正常,0表示非正常,即對聲音進(jìn)行識別;又進(jìn)行誤差分析,達(dá)到誤差要求時將80個數(shù)據(jù)代入函數(shù),即為對聲音模型進(jìn)行驗證與評價。 針對問題一,首先從80次聲音數(shù)據(jù)入

2、手,利用MATLAB的load函數(shù)載入到計算機(jī)內(nèi)存,內(nèi)存中變量有Fs和y等變量,其中Fs為采用頻率,y為采用數(shù)據(jù)。再用sound函數(shù),播放出聲音信號,從聽覺角度比較正常、非正常聲音在響度和音調(diào)兩方的差異。最后利用plot函數(shù)繪制出具體的聲音波形圖,從視覺角度比較聲音的頻率與振幅的不同效果。 針對問題二,采用合適的時域分析處理聲音信號,找出和提取了最重要的特征向量是短時能量和平均幅度、短時平均過零率、短時自相關(guān)函數(shù),并比較了它們在表達(dá)聲音時的不同優(yōu)越性和特點,用途。 針對問題三,用MATLAB計算出80個正常、非正常聲音數(shù)據(jù),y的均值、方差、短時平均能量均值、短時平均幅度均值、短時平均過零率均值

3、和短時自相關(guān)函數(shù)均值,利用這些均值作為BP神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù)p且對p進(jìn)行轉(zhuǎn)置。確定目標(biāo)函數(shù)t,1表示正常,0表示非正常。進(jìn)行多次訓(xùn)練達(dá)到誤差要求,求解和分析模型結(jié)果,并對80組樣本數(shù)據(jù)進(jìn)行檢驗。最后對BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行評價、改進(jìn)及推廣。 針對問題四,利用主成分分析(PCA)特征變換對參數(shù)進(jìn)行優(yōu)化,先在正常和非正常中分別隨機(jī)選取聲音組號,再將以上問題得到的對應(yīng)特征參數(shù)均值進(jìn)行PCA變換,獲得新的特征參數(shù)f正和f非能夠更具區(qū)分性,并用參數(shù)優(yōu)化技術(shù)包括語音包絡(luò)檢測、Delta特征的引入,獲得更好的聲音識別率。 針對問題五,對于原始信號中有疊加一定幅度的白噪聲,前期處理時為了達(dá)到優(yōu)良的消噪效果,采用

4、新興方法小波去噪原理,先用所給函數(shù)得到如11.mat的加白噪聲的聲音,運(yùn)用MATLAB中的小波工具箱對含噪信號進(jìn)行小波分解、閾值量化、小波重組,獲得的去噪結(jié)果與原始信號效果比較,驗證小波去噪的可靠性。關(guān)鍵詞:BP神經(jīng)網(wǎng)絡(luò) 時域分析 特征向量 主成分分析 小波去噪原理1 問題重述A題:聲音識別模型的建立與評價隨著家居智能化逐漸普及,智能冰箱、智能清潔機(jī)器人、智能電視等已步入平常老百姓家庭,但智能化的防盜門還處于研發(fā)階段,未進(jìn)入市場。隨著人們對家居安全意識的不斷增強(qiáng),對防盜、防搶和防砸的門禁系統(tǒng)的智能性提出更高的要求?;诖耍瑢φ:头钦i_門(指盜竊開門等聲音)的聲音進(jìn)行識別是智能防盜門的關(guān)鍵問

5、題和技術(shù),其具有廣泛的應(yīng)用前景和實用價值。 為了進(jìn)行聲音識別模型的建立,我們采集到了正常和非正常開門的聲音,附件中有正常開門聲音(如正1.mat),非正常開門聲音(如非1.mat),各40次開門,共80次開門聲音數(shù)據(jù)。該數(shù)據(jù)可利用matlab的load函數(shù)載入到計算機(jī)內(nèi)存,內(nèi)存中變量有Fs和y等變量,其中Fs為采用頻率,y為采用數(shù)據(jù)。利用這些數(shù)據(jù)要求完成以下工作:1. 利用matlab中的sound函數(shù),播放出聲音信號,試聽并比較正常和非正常開門聲音的差別,利用plot函數(shù)繪制出具體的聲音波形圖,總結(jié)差別在哪些方面?2. 利用合適的時域或(和)頻域特征表達(dá)個聲音信號,建立特征向量,寫出提取特征

6、向量的具體方法和程序代碼。3. 建立聲音識別模型(二分類模型),利用模型區(qū)分正常和非正常聲音,評價模型的好壞。4. 試?yán)锰卣鬟x擇或變換,對特征向量進(jìn)行優(yōu)化,并利用參數(shù)優(yōu)化技術(shù)優(yōu)化模型的參數(shù),使識別模型的準(zhǔn)確率提高。5. 若原始聲音信號中有環(huán)境噪聲(如白噪聲),設(shè)y中疊加了一定幅值的白噪聲(利用y1=y+(-0.15+0.3*rand(size(y)*max(y)疊加噪聲),如何對聲音進(jìn)行前期處理?2 模型假設(shè)1、 假設(shè)80組樣本的采用數(shù)據(jù)真實、有效、可靠;2、 假設(shè)每個樣本的采用數(shù)據(jù)之間相互獨立;3、 假設(shè)樣本音頻的錄音環(huán)境為同一環(huán)境且外界環(huán)境對數(shù)據(jù)無影響;4、 假設(shè)我們在網(wǎng)上查閱的資料以及

7、結(jié)論真實可靠。3 符號說明表示輸入層第j個節(jié)點的輸入,j=1,M表示隱含層第i個節(jié)點到輸入層第j個節(jié)點之間的權(quán)值表示隱含層第i個節(jié)點的閾值表示隱含層的激勵函數(shù)表示輸出層第k個節(jié)點到隱含層第i個節(jié)點之間的權(quán)值,i=1,q表示輸出層第k個節(jié)點的閾值,k=1,L表示輸出層的激勵函數(shù)表示輸出層第k個節(jié)點的輸出En短時平均能量Mn短時平均幅度Zn短時平均過零率Rn短時自相關(guān)函數(shù)4 問題的分析本文主要對正常和非正常開門的聲音的識別進(jìn)行研究,首先用matlab提取了數(shù)據(jù)y的均值、方差,然后得出短時平均能量、短時平均幅度、短時平均過零率、短時自相關(guān)函數(shù)等特征向量。通過BP神經(jīng)網(wǎng)絡(luò)建立聲音識別模型,得出結(jié)論并對

8、樣本進(jìn)行驗證。 針對問題一,由于正常聲音與非正常聲音存在差別,所以其波形圖也存在差別,我們通過觀察圖中不同聲音的頻率與振幅并比較,從而得出它們在響度和音調(diào)兩方面存在差異。 針對問題二,采用時域分析處理聲音信號,提取最基本的參數(shù)有短時能量和平均幅度、短時平均過零率、短時自相關(guān)函數(shù),并闡述了它們的用途及特點。 針對問題三,主要以80組樣本數(shù)據(jù)y的均值、方差、短時平均能量均值、短時平均幅度均值、短時平均過零率均值和短時自相關(guān)函數(shù)均值作為BP神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù)p。確定目標(biāo)函數(shù)t,1表示正常,0表示非正常。進(jìn)行多次訓(xùn)練達(dá)到誤差要求,并對80組樣本數(shù)據(jù)進(jìn)行檢驗。最后對BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行評價。針對問題四,

9、為使模型識別率提高,使用主成分分析(PCA)特征變換對參數(shù)進(jìn)行優(yōu)化,并用參數(shù)優(yōu)化技術(shù)包括語音包絡(luò)檢測、Delta特征的引入,有利于參數(shù)分類和系統(tǒng)識別率提高。 針對問題五,對于原始信號中疊加一定幅度的白噪聲,前期處理時為了達(dá)到優(yōu)良的消噪效果,采用新興方法小波去噪原理,運(yùn)用MATLAB中的小波工具箱對含噪信號進(jìn)行閾值處理,即可得到可靠地去噪信號。5模型的建立與求解5.1問題一5.1.1正常和非正常聲音的差別 正常聲音與非正常開鎖聲音的差別主要體現(xiàn)在非正常開鎖聲音的響度大且音調(diào)高,而正常開鎖聲音則恰恰相反,其響度低且音調(diào)高。這些差別在聲音波形圖上表現(xiàn)為正常聲音的頻率低(約為1000020000Hz)

10、,則其音調(diào)低,振幅?。s為0.5589左右)則其響度低,而非正常開鎖聲音的波形圖其頻率高約為(2000030000Hz),振幅大(約為0.6676),如圖為一組圖形的對比(更多圖形對比見附錄一)。 圖1.正常聲音32的波形圖 圖2.非常聲音32的波形圖 對這些差別的解釋:一般來說正常用鑰匙開門聲音比較小,聲音比較緩和,表現(xiàn)在頻率與振幅都比較小。而非正常開門的聲音則是相反,因為非正常開門的情況下,其開門速度快,而發(fā)出的聲音就比正常開門所發(fā)出的聲音大一些,聲音也較刺耳一些,這表現(xiàn)在振幅和頻率都較大,這也是為何圖中的非正常聲音波形圖與正常聲音波形圖存在差別。5.2問題二為了表達(dá)這個聲音型號,對聲音識

11、別分析,采用時域分析的方法,直接對開門聲音的時域波形進(jìn)行分析,提取特征向量主要有短時能量和平均幅度、短時平均過零率、短時自相關(guān)函數(shù)。5.2.1時域分析 在MATLAB的信號處理工具箱中函數(shù)FFT和IFFT進(jìn)行快速變換,F(xiàn)FT其調(diào)用格式為y=fft(x),其中x是序列,y是序列的FFT,x可為一向量或矩陣,若x為向量,y是x的FFT且和x相同長度;若x為矩陣,則y是對矩陣的每一列向量進(jìn)行FFT。利用上述函數(shù)畫出(如正3.mat)聲音的時域波形如圖1:再畫出(如非32.mat)聲音的時域波形如圖2:5.2.2提取特征向量短時平均能量和幅度 聲音信號的能量隨時間是變化的,正常聲音和非正常聲音差別顯著

12、,所以對短時能量和短時平均幅度進(jìn)行分析,描述它的這種特征變化情況。短時平均能量為2=2 ,式中N為窗長。它為一幀樣點值的加權(quán)平方和,w(n)為矩形窗。具體方法是:首先計算原始信號各個采樣值的平方,然后用一個移動窗h(n-m)選取出一個一個短時平方序列,并將各短段的平方值求和得到短時能量序列。我們給出了聲音在不同窗長N時的短時能量函數(shù)曲線,幀之間無交疊。以(正32.mat)為例如圖3: 圖3.正32.mat短時能量函數(shù)曲線其相應(yīng)程序代碼見附錄二。對比給出“非32.mat”的短時能量曲線如圖4:圖4.非32.mat的短時能量曲線 但是短時能量函數(shù)的平方處理對信號電平值過于敏感,容易在定點實現(xiàn)時產(chǎn)生

13、溢出。為此,用短時平均幅度來衡量聲音幅度變化:其方法就是將w(n)對|x(n)|的線性濾波運(yùn)算,用絕對值代替平方和,給出了不同矩形窗長N時的短時平均幅度函數(shù)曲線,幀之間無交疊。如圖5、6、7、8:圖5.正32.mat短時平均幅度(N=128)圖6.非32.mat短時平均幅度(N=128) 圖7.正32.mat短時平均幅度(N=256) 圖8. 非32.mat短時平均幅度(N=256)其相應(yīng)程序代碼見附錄三。 通過上述對短時能量和短時平均幅度函數(shù)曲線的對比,兩者分析的結(jié)論是一樣的,但由于平均幅度函數(shù)沒有平方運(yùn)算,故其動態(tài)范圍要比短時能量小。短時平均過零率當(dāng)離散時間信號相鄰兩個樣點的正負(fù)異號時,稱

14、為“過零”,短時平均過零率為:式中,sgn 為符號函數(shù),即有w(n)為窗函數(shù),計算時常采用矩形窗,窗長為N。 具體方法是:當(dāng)相鄰兩個樣點符號相同時,|sgnx(m)-sgnx(m-1)|=0,沒有產(chǎn)生過零;而當(dāng)相鄰兩個樣點符號相反時,|sgnx(m)-sgnx(m-1)|=2,為過零次數(shù)的兩倍。因此,在統(tǒng)計一幀(N點)的短時平均過零率時,求和后必須要除以2N。因此我們給出了一段聲音(正32.mat和非32.mat)的短時平均過零次數(shù)的變化曲線,如圖9:圖9.正32.mat短時平均過零次數(shù)的變化曲線圖10.非32.mat短時平均過零次數(shù)的變化曲線其相應(yīng)程序代碼見附錄四。大量試驗統(tǒng)計,得到每10m

15、s作為一個平均段的直方圖的分布形狀與高斯分布非常吻合。非正常聲音全部都在0.2以下,正常聲音大部分在0.2以下有突破,接近0.4的。短時自相關(guān)函數(shù) 自相關(guān)函數(shù)用于衡量信號自身時間波形的相似性。正常開門聲和非正常開門聲在波形上存在較大差異,正常的時間波形呈現(xiàn)出一定的周期性,波形之間的相似性較好;非正常的時間波形雜亂無章,樣點間的相似性較差。這樣就可以用短時自相關(guān)函數(shù)來測定聲音的相似特性。短時自相關(guān)函數(shù)的定義為具體方法是:首先用一個起點為n的窗函數(shù)w(n-m)選取一段聲音x(m)w(n-m),然后用計算該短聲音的自相關(guān)值,這樣得到就是。以下圖10、11分別給出了非正常聲音與正常聲音的短時自相關(guān)函數(shù)

16、變化,窗長為40ms。圖10.非32.mat短時自相關(guān)函數(shù)(N=320)圖11.正32.mat短時自相關(guān)函數(shù)(N=320)其相應(yīng)程序代碼見附錄五。 觀察自相關(guān)函數(shù),發(fā)現(xiàn)非正常聲音峰值出現(xiàn)在1左右,有一定的周期性,而正常聲音沒有一定周期性。不同的窗長對短時自相關(guān)函數(shù)有一定影響。5.3問題三5.3.1模型原理 BP算法采用廣義的學(xué)習(xí)規(guī)則,是一種有導(dǎo)師的學(xué)習(xí)算法。它是一種無反饋的前向網(wǎng)絡(luò), 由輸入層、輸出層、隱層構(gòu)成, 如下圖所示。它分兩個階段:正向傳播階段和反向傳播階段。正向傳播階段,將學(xué)習(xí)樣本的輸入信息輸入前饋網(wǎng)絡(luò)的輸入層,輸入層單元接受到輸入信號,計算權(quán)重合,然后根據(jù)神經(jīng)元

17、的激活函數(shù)將信息傳到隱含層(1層或2層),同樣根據(jù)隱含層的輸出計算輸出層的輸出。反向傳播階段,將網(wǎng)絡(luò)的實際輸出與期望輸出相比較,如果誤差不滿足要求,將誤差向后傳播,即從輸出層到輸入層逐層求其誤差(實際上是等效誤差),然后相應(yīng)地修改權(quán)值。信號的前向傳播過程 :隱含層第i個節(jié)點的輸入neti:隱含層第i個節(jié)點的輸出:輸出層第k個節(jié)點的輸入:輸出層第k個節(jié)點的輸出:誤差的反向傳播過程  誤差的反向傳播,即首先由輸出層開始逐層計算各層神經(jīng)元的輸出誤差,然后根據(jù)誤差梯度下降法來調(diào)節(jié)各層的權(quán)值和閾值,使修改后的網(wǎng)絡(luò)的最終輸出能接近期望值。  對于每一個樣本p的二次型

18、誤差準(zhǔn)則函數(shù)為Ep:系統(tǒng)對P個訓(xùn)練樣本的總誤差準(zhǔn)則函數(shù)為:根據(jù)誤差梯度下降法依次修正輸出層權(quán)值的修正量wki,輸出層閾值的修正量ak,隱含層權(quán)值的修正量wij,隱含層閾值的修正量輸出層權(quán)值調(diào)整公式:輸出層閾值調(diào)整公式:隱含層權(quán)值調(diào)整公式:隱含層閾值調(diào)整公式:最后得到以下公式:5.3.2模型建立與解答 第一步:從數(shù)據(jù)中導(dǎo)出40組正常聲音和40組非正常聲音的采用數(shù)據(jù)均值、采用數(shù)據(jù)方差、能量均值、平均幅度、平均過零率和自相關(guān)函數(shù)作為輸入數(shù)據(jù)p,并對p進(jìn)行轉(zhuǎn)置。具體數(shù)據(jù)見附錄七。p=5.33E-073.29E-050.00110.00150.1171.93E-08-1.48E-064.87E-061.

19、56E-045.78E-040.1261.63E-07.-1.39E-064.63E-040.01480.00870.08281.52E-06-1.41E-067.05E-040.02250.01320.08188.49E-08;p=p' 第二步:確定目標(biāo)函數(shù)t,設(shè)正常聲音為1,非正常聲音為0.t= 1 1.0 0; 第三步:設(shè)置訓(xùn)練次數(shù),達(dá)到誤差要求。net=newff(minmax(p(:,1:15),40 1,'logsig','purelin','traingdm');net.trainParam.epochs=50000;net

20、.trainParam.goal=0.001;net,tr=train(net,p,t); 第四部:對所有數(shù)據(jù)進(jìn)行檢驗。p1=5.33E-073.29E-050.00110.00150.1171.93E-08-1.48E-064.87E-061.56E-045.78E-040.1261.63E-07.-1.39E-064.63E-040.01480.00870.08281.52E-06-1.41E-067.05E-040.02250.01320.08188.49E-08;p1=p1't1=sim(net,p1)運(yùn)行程序,輸出結(jié)果如下:t1 =Columns 1 through 100.

21、9875 0.5798 0.9580 0.9030 0.7203 0.5707 0.9694 1.0066 0.8894 0.8880Columns 11 through 200.6726 0.8997 0.9960 0.8911 1.0997 0.6680 0.8159 0.9550 1.0013 0.9698Columns 21 through 301.1566 1.0206 0.9617 0.9825 1.0937 1.0138 0.9196 0.9362 0.7906 0.8207Columns 31 through 400.9587 1.0651 0.8183 0.9854 0.93

22、71 0.9900 1.0740 1.1653 0.9372 1.0600Columns 41 through 500.2671 0.2905 -0.0998 0.1440 0.1290 -0.0336 0.3472 0.0786 0.0891 0.1337Columns 51 through 60-0.0448 -0.3311 -0.2200 0.0384 0.4893 0.5723 0.1723 -0.0028 0.1215 0.1646Columns 61 through 700.1370 -0.3832 0.0673 -0.0528 0.3897 -0.0647 -0.0795 0.2

23、804 0.0720 0.1177Columns 71 through 800.0624 -0.1200 0.1119 0.0281 0.0814 -0.0035 0.0456 -0.0817 -0.1038 0.0382 結(jié)果趨近與1表示正常聲音,結(jié)果趨近與0表示非正常聲音。通過多次訓(xùn)練,減小誤差后,對樣本進(jìn)行檢驗,得出比較真確的結(jié)果。具體程序見附錄六。程序訓(xùn)練圖形見圖12 圖12.BP網(wǎng)絡(luò)訓(xùn)練過程相關(guān)圖形3.2.3模型的評價(1) BP神經(jīng)網(wǎng)絡(luò)模型考慮比較全面、準(zhǔn)確、簡單、易行、計算量小、并行性強(qiáng)。從不同的方面分別討論了正常聲音和非正常聲音的不同信息,并用來判斷其他聲音的類別。(2) 該模

24、型具有一般性,在一定的條件下適用于其他基因的類別判斷。(3) 模型對該問題的各種參量做了分析檢驗,具有良好的穩(wěn)定性。(4) BP神經(jīng)網(wǎng)絡(luò)在其局部的或者部分的神經(jīng)元受到破壞后對全局的訓(xùn)練結(jié)果不會造成很大的影響,也就是說即使系統(tǒng)在受到局部損傷時還是可以正常工作的。即BP神經(jīng)網(wǎng)絡(luò)具有一定的容錯能力。(5) 模型學(xué)習(xí)效率較低,收斂速度慢,易陷入局部極小狀態(tài)。(6) 該模型難以解決應(yīng)用問題的實例規(guī)模和網(wǎng)絡(luò)規(guī)模間的矛盾問題,其涉及到網(wǎng)絡(luò)容量的可能性與可行性的關(guān)系問題,即學(xué)習(xí)復(fù)雜性問題。5.4問題四5.4.1 PCA特征變換為了提高模型的精確度,我們采用PCA變換,它可以揭示特征變量間的模糊關(guān)系,簡化數(shù)據(jù)。

25、選取聲音正常聲音與非正常聲音各10組,取4個特征向量分別是:X1 :短時平均能量,X2:短時平均幅度,X3:短時平均過零率,X4:短時自相關(guān)函數(shù),收集數(shù)據(jù),得到數(shù)據(jù)表,然后進(jìn)行PCA特征變換:采用數(shù)據(jù)極差標(biāo)準(zhǔn)化方法;求相關(guān)系數(shù)矩陣;求相關(guān)系數(shù)矩陣的特征值和特征向量:按特征值的大小,對于正常開門聲,非正常與正常開門聲主成分分析程序見附錄八4=2.0678,3=1.4722,2=0.0120,1=0.4481;計算累計貢獻(xiàn)率,寫出各主成分:各特征值對應(yīng)主成分的信息貢獻(xiàn)率分別為:1=51.69%,2=36.8%,3=0.3%,4=11.2%,選擇1、2、4三個主成分:對1=0.4481,F(xiàn)1=0.1

26、016 X1+0.0712 X2+ 0.7169 X3+ 0.6861 X4為第一主成分,對3=1.4722,F(xiàn)3= 0.1916X1+ 0.2524 X2+ 0.6280X3-0.7108X4為第二主成分,對4=2.0678,F(xiàn)4= 0.6726X1+ 0.6590X2 -0.3024X3+ 0.1481X4為第三主成分,給出綜合評價模型:f=0.4481F1+1.4722F3+2.0678F4,再將數(shù)據(jù)代入,f正=95.5626;同理可得非正常開門聲f非=94.7705,明顯 f正 >f非 經(jīng)過參數(shù)變換,新的特征更具有區(qū)分性。 5.4.2 特征參數(shù)優(yōu)化 我們對現(xiàn)有特征進(jìn)行分析,對于特

27、征提取過程中某些可調(diào)整的地方以及特征參數(shù)進(jìn)行優(yōu)化。語音包絡(luò)檢測 去除靜音,對聲音能量和過零率的檢測,留下重要信息部分。方法現(xiàn)將聲音開始部分看作靜音,計算這期間平均幅度和過零率的統(tǒng)計特性,再和最大幅度結(jié)合計算能量,參考平均幅度輪廓找出超出很保守門限的一段時間間隔。有無包絡(luò)檢測下的識別率未使用包絡(luò)檢測使用包絡(luò)檢測識別率0.96720.9761實驗表明,包絡(luò)檢測將識別率提高了0.89%,使得特征向量有利于分類。 Delta特征的引入 聲音信號本質(zhì)上具有連續(xù)性,所以獲取語音幀特征之間的時變特性,將會提高識別的性能。對特征在語音幀序列的時序上作一次傅里葉變換,就得到了對應(yīng)于該特征的Delta特征。其中,

28、表示第t幀特征的Delta特征,表示考慮第t幀順序變化的語音幀的數(shù)量。下面來看Delta特征對于識別率的影響:引入Delta特征的識別率識別率未加入Delta特征0.9703Delta0.9826可以看出,Delta特征的引入能夠提高系統(tǒng)的識別率,達(dá)到1.23%。5.5問題五 如果在原始信號中加有一定白噪聲,在預(yù)處理時我們采用小波分析法去噪,小波分析能夠通過變換充分突出信號的時頻局部特征,小波分析是重要的信號去噪工具,我們運(yùn)用MATLAB中的小波工具箱,對一個含噪信號進(jìn)行閾值去噪,運(yùn)用實例來驗證小波分析法的可靠性。5.5.1小波去噪原理 一個含有噪聲的信號可表示為:A(i)=f(i)+k(i)

29、,i=1,n.,其中A(i)為含有噪聲的信號,f(i)為真實信號,為噪聲水平,k(i)為噪聲信號且假設(shè)為白噪聲。噪聲高頻部分影響小波分解高頻層,低頻部分影響小波最深層,為此對小波分解系數(shù)進(jìn)行處理達(dá)到分解噪聲目的。5.5.2小波去噪步驟觀測數(shù)據(jù)作小波分解變化:Y是觀測數(shù)據(jù)向量,f是真實信號向量,z是高斯隨機(jī)向量,此式是線性變換。對小波系數(shù)閾值量化,閾值處理可以表示為,閾值選取方法:小波重構(gòu):現(xiàn)將系數(shù)作逆變換得出重構(gòu)信號:即為受污染信號去噪后信號。5.5.3小波去噪實例 首先對原始信號進(jìn)行一定處理,即是利用y1=y+(-0.15+0.3*rand(size(y)*max(y)疊加噪聲,得到了含有一

30、定幅值的白噪聲信號,選取正11.mat和非11.mat如圖13、14:圖13.正13.mat白噪聲圖14.非11.mat白噪聲 利用上述步驟,對小波分解系數(shù)使用函數(shù)wthcoef進(jìn)行閾值處理,然后利用閾值處理后的小波系數(shù)進(jìn)行重構(gòu)達(dá)到去噪目的。相應(yīng)程序代碼見附錄九。小波去噪后其相應(yīng)的效果圖如圖15、16:圖15去噪后正11.mat圖16.去噪后非11.mat 實驗表明小波信號消噪具有良好的時頻分析能力,從視覺效果上看,該方法計算小,編程簡單。對原始信號添加噪聲后得到的含噪信號,利用MATLAB中的小波工具箱對含噪信號進(jìn)行閾值處理,得出的去噪結(jié)果與原始信號效果非常接近,由此說明MATLAB中的小波

31、變換工具箱對信號去噪處理時可靠的,理想的。6模型的改進(jìn)與推廣 由于在人工神經(jīng)網(wǎng)絡(luò)中,反向傳播法占據(jù)了非常主要的地位,為了加快訓(xùn)練速度,避免陷入局部極小值和改善其他能力,提出了彈性BP算法。彈性BP算法只取偏導(dǎo)數(shù)的符號,而不考慮偏導(dǎo)數(shù)的副值,偏導(dǎo)數(shù)的符號決定權(quán)值更新的方向。在彈性BP算法中,當(dāng)訓(xùn)練發(fā)生振蕩時,權(quán)值的變化量將會減小,當(dāng)在幾次迭代過程中權(quán)值都朝某個方向變化時,權(quán)值的變化量將增大。因此彈性BP算法的收斂速度較快,算法也不復(fù)雜,更不需要消耗更多的內(nèi)存。7參考文獻(xiàn)1同濟(jì)大學(xué)應(yīng)用數(shù)學(xué)系編.高等數(shù)學(xué).北京:高等教育出版社,2006年第三版.2華東師范大學(xué)數(shù)學(xué)系編.數(shù)學(xué)分析.北京:高等教育出版社

32、,2008年第三版.3韓中庚.數(shù)學(xué)建模競賽獲獎?wù)撐木x與點評.北京:科學(xué)出版社,2007.附錄附錄一正1.mat正2.mat正3.mat正4.mat正5.mat非1.mat非2.mat非3.mat附錄二:正32.mat短時能量程序代碼load('正32.mat')subplot(6,1,1),plot(y);N=32;for i=2:6 h=linspace(1,1, (i-1)*N);%形成一個矩形窗,長度為N En=conv(h,y.*y);%求卷積得其短時能量函數(shù)En subplot(6,1,i),plot(En); if(i=2) legend('N=32

33、9;); elseif(i=3) legend('N=64'); elseif(i=4) legend('N=128'); elseif(i=5) legend('N=256'); elseif(i=6) legend('N=512'); endend附錄三:短時平均幅度程序代碼load('正32.mat')subplot(6,1,1),plot(y);N=256;L=length(y)LL=length(y)/N;Mn=sum(abs(y)/NMn=zeros(1,(LL-1)*256);for ii=1:(LL

34、-1)*256; temp=y(ii:ii+256); Mn(ii)=sum(abs(temp)/N;endjj=1:(LL-1)*256;plot(jj,Mn,'b');grid附錄四:短時平均過零次數(shù)程序代碼load('正32.mat')subplot(6,1,1),plot(y);n=length(y);N=320;subplot(3,1,1),plot(y);h=linspace(1,1,N);En=conv(h,y.*y);subplot(3,1,2),plot(En);for i=1:n-1 if y(i)>=0; b(i)=1; else b

35、(i)=-1; end if y(i+1)>=0 b(i+1)=1; else b(i+1)=-1; end w(i)=abs(b(i+1)-b(i);endk=1; j=0; while (k+N-1)<n Zm(k)=0; for i=0:N-1; Zm(k)=Zm(k)+w(k+i); end j=j+1; k=k+N/2;endfor w=1:j Q(w)=Zm(160*(w-1)+1)/(2*N);endsubplot(3,1,3),plot(Q);附錄五:短時自相關(guān)函數(shù)程序代碼load('非32.mat')subplot(6,1,1),plot(y);N

36、=320;x=y(54001:54320);x=x.*rectwin(320);R=zeros(1,320);for k=1:320 for n=1:320-k R(k)=R(k)+x(n)*x(n+k); endendj=1:320;plot(j,R);grid;附錄六>> p=-5.33E-073.29E-050.00110.00150.1171.93E-08-1.48E-064.87E-061.56E-045.78E-040.1261.63E-07-7.45E-064.31E-061.38E-045.46E-040.1165-2.80E-09-1.47E-064.67E-06

37、1.49E-045.43E-040.11444.33E-08-1.56E-064.73E-061.51E-046.01E-040.11535.14E-08-1.53E-063.41E-061.09E-044.90E-040.1492-6.75E-10-1.57E-063.76E-050.00120.00150.11335.65E-07-1.46E-063.44E-061.10E-044.41E-040.11643.85E-08-1.35E-063.60E-061.15E-044.82E-040.11564.35E-08-1.31E-061.87E-065.97E-053.21E-040.129

38、8.85E-10-1.34E-062.98E-069.52E-054.66E-040.12313.59E-08-1.31E-063.37E-061.08E-044.70E-040.11811.23E-07-1.49E-061.12E-063.57E-052.58E-040.12492.28E-07-1.39E-061.25E-064.01E-052.80E-040.1354.07E-09-1.19E-061.80E-065.77E-053.21E-040.12071.46E-07-1.32E-061.26E-064.01E-053.33E-040.12154.29E-07-1.23E-062.

39、00E-066.39E-053.59E-040.1247-2.95E-09-1.28E-068.87E-072.84E-052.66E-040.1256-2.43E-09-1.47E-062.37E-067.58E-053.91E-040.1128-4.60E-07-1.28E-068.24E-072.63E-052.49E-040.1278-2.38E-09-1.27E-065.07E-071.62E-051.77E-040.12522.01E-08-1.32E-067.51E-072.40E-052.55E-040.1231.15E-08-1.54E-062.04E-066.52E-053

40、.31E-040.12591.02E-08-1.37E-067.13E-072.28E-052.46E-040.12814.39E-08-1.46E-065.44E-071.74E-052.41E-040.12096.92E-08-1.35E-061.24E-063.97E-052.63E-040.1261-4.09E-09-1.34E-061.06E-063.39E-052.64E-040.13299.90E-08-1.57E-066.27E-072.01E-052.37E-040.13765.22E-09-1.46E-061.23E-063.92E-053.30E-040.13151.05

41、E-07-1.53E-066.32E-072.02E-052.78E-040.141-1.09E-09-9.56E-071.23E-063.93E-053.65E-040.10994.13E-06-1.24E-069.84E-073.15E-052.21E-040.1273-3.57E-09-1.52E-061.44E-064.61E-053.32E-040.13011.36E-07-1.63E-069.80E-073.13E-052.71E-040.12717.68E-09-1.39E-064.65E-071.49E-052.36E-040.11613.16E-07-1.59E-067.88

42、E-072.52E-052.56E-040.12765.36E-10-1.55E-066.34E-072.03E-052.16E-040.12211.87E-07-1.22E-064.65E-071.49E-052.26E-040.1177-2.01E-09-1.34E-067.23E-072.31E-052.30E-040.13381.22E-07-1.26E-064.95E-071.58E-051.75E-040.13419.41E-09-1.26E-063.29E-061.05E-046.23E-040.11747.31E-09-1.45E-065.71E-061.82E-046.49E

43、-040.12254.39E-07-1.51E-062.24E-057.16E-040.00120.1299-4.36E-07-1.49E-061.20E-053.85E-040.0010.12141.02E-09-1.35E-067.87E-062.52E-048.22E-040.12642.38E-07-1.42E-061.50E-054.79E-040.00110.11688.69E-09-1.46E-064.32E-061.38E-046.30E-040.12143.35E-08-1.36E-063.24E-061.04E-046.49E-040.12661.35E-07-1.26E-

44、061.29E-054.14E-040.00120.11866.15E-07-1.50E-062.94E-059.39E-040.00130.12582.22E-09-1.43E-061.37E-054.38E-040.00110.12781.37E-07-1.46E-067.58E-062.42E-049.26E-040.13051.55E-07-1.35E-063.77E-061.21E-047.48E-040.13051.95E-07-1.44E-061.06E-053.39E-040.0010.11534.08E-08-1.36E-063.16E-061.01E-044.82E-040

45、.1351.89E-07-1.51E-063.30E-061.06E-044.90E-040.12983.66E-08-1.66E-063.64E-061.16E-046.26E-040.136.13E-08-2.37E-062.72E-068.69E-055.63E-040.13961.39E-06-1.39E-063.26E-061.04E-045.96E-040.1426-1.02E-08-1.41E-068.80E-062.81E-048.88E-040.13993.13E-07-1.28E-063.96E-061.27E-046.13E-040.14195.40E-08-1.33E-

46、065.41E-061.73E-048.99E-040.13212.64E-07-1.53E-064.05E-061.30E-046.57E-040.13721.32E-07-1.74E-065.31E-050.00170.00180.11891.60E-07-2.36E-062.12E-066.77E-054.53E-040.12042.87E-07-1.92E-061.44E-054.60E-040.00120.11049.44E-07-8.86E-078.11E-062.59E-049.09E-040.11592.06E-07-1.59E-062.21E-067.07E-055.37E-

47、040.1293-1.82E-09-1.53E-065.75E-061.84E-047.66E-040.13743.45E-07-1.55E-065.18E-061.66E-047.15E-040.1501-2.60E-09-1.52E-061.28E-040.00410.00270.09172.36E-07-1.46E-069.86E-050.00320.00260.102-2.61E-09-9.75E-065.92E-050.00190.00350.10679.82E-06-3.92E-066.52E-050.00210.00220.09961.67E-06-1.59E-063.96E-0

48、40.01270.01080.09021.11E-08-1.56E-061.46E-040.00470.01790.0871-1.50E-09-1.60E-060.00120.0370.01790.07813.88E-07-5.32E-063.39E-040.01080.00560.07936.41E-04-1.39E-064.63E-040.01480.00870.08281.52E-06-1.41E-067.05E-040.02250.01320.08188.49E-08;t= 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

49、1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0;p=p'net=newff(minmax(p(:,1:15),40 1,'logsig','purelin','traingdm');net.trainParam.epochs=50000;net.trainParam.goal=0.001;net,tr=train(net,p,t);p1=-5.33E-073.29E-050.001

50、10.00150.1171.93E-08-1.48E-064.87E-061.56E-045.78E-040.1261.63E-07-7.45E-064.31E-061.38E-045.46E-040.1165-2.80E-09-1.47E-064.67E-061.49E-045.43E-040.11444.33E-08-1.56E-064.73E-061.51E-046.01E-040.11535.14E-08-1.53E-063.41E-061.09E-044.90E-040.1492-6.75E-10-1.57E-063.76E-050.00120.00150.11335.65E-07-

51、1.46E-063.44E-061.10E-044.41E-040.11643.85E-08-1.35E-063.60E-061.15E-044.82E-040.11564.35E-08-1.31E-061.87E-065.97E-053.21E-040.1298.85E-10-1.34E-062.98E-069.52E-054.66E-040.12313.59E-08-1.31E-063.37E-061.08E-044.70E-040.11811.23E-07-1.49E-061.12E-063.57E-052.58E-040.12492.28E-07-1.39E-061.25E-064.0

52、1E-052.80E-040.1354.07E-09-1.19E-061.80E-065.77E-053.21E-040.12071.46E-07-1.32E-061.26E-064.01E-053.33E-040.12154.29E-07-1.23E-062.00E-066.39E-053.59E-040.1247-2.95E-09-1.28E-068.87E-072.84E-052.66E-040.1256-2.43E-09-1.47E-062.37E-067.58E-053.91E-040.1128-4.60E-07-1.28E-068.24E-072.63E-052.49E-040.1

53、278-2.38E-09-1.27E-065.07E-071.62E-051.77E-040.12522.01E-08-1.32E-067.51E-072.40E-052.55E-040.1231.15E-08-1.54E-062.04E-066.52E-053.31E-040.12591.02E-08-1.37E-067.13E-072.28E-052.46E-040.12814.39E-08-1.46E-065.44E-071.74E-052.41E-040.12096.92E-08-1.35E-061.24E-063.97E-052.63E-040.1261-4.09E-09-1.34E-061.06E-063.39E-052.64E-040.13299.90E-08-1.57E

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論