數(shù)學(xué)建模聲音識(shí)別模型的建立與評(píng)價(jià)_第1頁(yè)
數(shù)學(xué)建模聲音識(shí)別模型的建立與評(píng)價(jià)_第2頁(yè)
數(shù)學(xué)建模聲音識(shí)別模型的建立與評(píng)價(jià)_第3頁(yè)
數(shù)學(xué)建模聲音識(shí)別模型的建立與評(píng)價(jià)_第4頁(yè)
數(shù)學(xué)建模聲音識(shí)別模型的建立與評(píng)價(jià)_第5頁(yè)
已閱讀5頁(yè),還剩25頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、聲音識(shí)別模型的建立與評(píng)價(jià)【摘要】 聲音識(shí)別是研發(fā)智能防盜門的重要環(huán)節(jié),對(duì)正常和非正常開門(指盜竊開門等聲音)的聲音進(jìn)行準(zhǔn)確地識(shí)別變得尤為重要。本文對(duì)采集到的正常和非正常聲音進(jìn)行識(shí)別模型建立和評(píng)價(jià)。其主要方法是:利用80次聲音數(shù)據(jù),結(jié)合MATLAB工具及分析計(jì)算,建立正常、非正常聲音與數(shù)據(jù)y的均值、方差、短時(shí)平均能量均值、短時(shí)平均幅度均值、短時(shí)平均過零率均值和短時(shí)自相關(guān)函數(shù)均值之間的關(guān)系的BP神經(jīng)網(wǎng)絡(luò)模型。然后分析模型,確定目標(biāo)函數(shù)t,1表示正常,0表示非正常,即對(duì)聲音進(jìn)行識(shí)別;又進(jìn)行誤差分析,達(dá)到誤差要求時(shí)將80個(gè)數(shù)據(jù)代入函數(shù),即為對(duì)聲音模型進(jìn)行驗(yàn)證與評(píng)價(jià)。 針對(duì)問題一,首先從80次聲音數(shù)據(jù)入

2、手,利用MATLAB的load函數(shù)載入到計(jì)算機(jī)內(nèi)存,內(nèi)存中變量有Fs和y等變量,其中Fs為采用頻率,y為采用數(shù)據(jù)。再用sound函數(shù),播放出聲音信號(hào),從聽覺角度比較正常、非正常聲音在響度和音調(diào)兩方的差異。最后利用plot函數(shù)繪制出具體的聲音波形圖,從視覺角度比較聲音的頻率與振幅的不同效果。 針對(duì)問題二,采用合適的時(shí)域分析處理聲音信號(hào),找出和提取了最重要的特征向量是短時(shí)能量和平均幅度、短時(shí)平均過零率、短時(shí)自相關(guān)函數(shù),并比較了它們?cè)诒磉_(dá)聲音時(shí)的不同優(yōu)越性和特點(diǎn),用途。 針對(duì)問題三,用MATLAB計(jì)算出80個(gè)正常、非正常聲音數(shù)據(jù),y的均值、方差、短時(shí)平均能量均值、短時(shí)平均幅度均值、短時(shí)平均過零率均值

3、和短時(shí)自相關(guān)函數(shù)均值,利用這些均值作為BP神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù)p且對(duì)p進(jìn)行轉(zhuǎn)置。確定目標(biāo)函數(shù)t,1表示正常,0表示非正常。進(jìn)行多次訓(xùn)練達(dá)到誤差要求,求解和分析模型結(jié)果,并對(duì)80組樣本數(shù)據(jù)進(jìn)行檢驗(yàn)。最后對(duì)BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行評(píng)價(jià)、改進(jìn)及推廣。 針對(duì)問題四,利用主成分分析(PCA)特征變換對(duì)參數(shù)進(jìn)行優(yōu)化,先在正常和非正常中分別隨機(jī)選取聲音組號(hào),再將以上問題得到的對(duì)應(yīng)特征參數(shù)均值進(jìn)行PCA變換,獲得新的特征參數(shù)f正和f非能夠更具區(qū)分性,并用參數(shù)優(yōu)化技術(shù)包括語(yǔ)音包絡(luò)檢測(cè)、Delta特征的引入,獲得更好的聲音識(shí)別率。 針對(duì)問題五,對(duì)于原始信號(hào)中有疊加一定幅度的白噪聲,前期處理時(shí)為了達(dá)到優(yōu)良的消噪效果,采用

4、新興方法小波去噪原理,先用所給函數(shù)得到如11.mat的加白噪聲的聲音,運(yùn)用MATLAB中的小波工具箱對(duì)含噪信號(hào)進(jìn)行小波分解、閾值量化、小波重組,獲得的去噪結(jié)果與原始信號(hào)效果比較,驗(yàn)證小波去噪的可靠性。關(guān)鍵詞:BP神經(jīng)網(wǎng)絡(luò) 時(shí)域分析 特征向量 主成分分析 小波去噪原理1 問題重述A題:聲音識(shí)別模型的建立與評(píng)價(jià)隨著家居智能化逐漸普及,智能冰箱、智能清潔機(jī)器人、智能電視等已步入平常老百姓家庭,但智能化的防盜門還處于研發(fā)階段,未進(jìn)入市場(chǎng)。隨著人們對(duì)家居安全意識(shí)的不斷增強(qiáng),對(duì)防盜、防搶和防砸的門禁系統(tǒng)的智能性提出更高的要求?;诖?,對(duì)正常和非正常開門(指盜竊開門等聲音)的聲音進(jìn)行識(shí)別是智能防盜門的關(guān)鍵問

5、題和技術(shù),其具有廣泛的應(yīng)用前景和實(shí)用價(jià)值。 為了進(jìn)行聲音識(shí)別模型的建立,我們采集到了正常和非正常開門的聲音,附件中有正常開門聲音(如正1.mat),非正常開門聲音(如非1.mat),各40次開門,共80次開門聲音數(shù)據(jù)。該數(shù)據(jù)可利用matlab的load函數(shù)載入到計(jì)算機(jī)內(nèi)存,內(nèi)存中變量有Fs和y等變量,其中Fs為采用頻率,y為采用數(shù)據(jù)。利用這些數(shù)據(jù)要求完成以下工作:1. 利用matlab中的sound函數(shù),播放出聲音信號(hào),試聽并比較正常和非正常開門聲音的差別,利用plot函數(shù)繪制出具體的聲音波形圖,總結(jié)差別在哪些方面?2. 利用合適的時(shí)域或(和)頻域特征表達(dá)個(gè)聲音信號(hào),建立特征向量,寫出提取特征

6、向量的具體方法和程序代碼。3. 建立聲音識(shí)別模型(二分類模型),利用模型區(qū)分正常和非正常聲音,評(píng)價(jià)模型的好壞。4. 試?yán)锰卣鬟x擇或變換,對(duì)特征向量進(jìn)行優(yōu)化,并利用參數(shù)優(yōu)化技術(shù)優(yōu)化模型的參數(shù),使識(shí)別模型的準(zhǔn)確率提高。5. 若原始聲音信號(hào)中有環(huán)境噪聲(如白噪聲),設(shè)y中疊加了一定幅值的白噪聲(利用y1=y+(-0.15+0.3*rand(size(y)*max(y)疊加噪聲),如何對(duì)聲音進(jìn)行前期處理?2 模型假設(shè)1、 假設(shè)80組樣本的采用數(shù)據(jù)真實(shí)、有效、可靠;2、 假設(shè)每個(gè)樣本的采用數(shù)據(jù)之間相互獨(dú)立;3、 假設(shè)樣本音頻的錄音環(huán)境為同一環(huán)境且外界環(huán)境對(duì)數(shù)據(jù)無(wú)影響;4、 假設(shè)我們?cè)诰W(wǎng)上查閱的資料以及

7、結(jié)論真實(shí)可靠。3 符號(hào)說(shuō)明表示輸入層第j個(gè)節(jié)點(diǎn)的輸入,j=1,M表示隱含層第i個(gè)節(jié)點(diǎn)到輸入層第j個(gè)節(jié)點(diǎn)之間的權(quán)值表示隱含層第i個(gè)節(jié)點(diǎn)的閾值表示隱含層的激勵(lì)函數(shù)表示輸出層第k個(gè)節(jié)點(diǎn)到隱含層第i個(gè)節(jié)點(diǎn)之間的權(quán)值,i=1,q表示輸出層第k個(gè)節(jié)點(diǎn)的閾值,k=1,L表示輸出層的激勵(lì)函數(shù)表示輸出層第k個(gè)節(jié)點(diǎn)的輸出En短時(shí)平均能量Mn短時(shí)平均幅度Zn短時(shí)平均過零率Rn短時(shí)自相關(guān)函數(shù)4 問題的分析本文主要對(duì)正常和非正常開門的聲音的識(shí)別進(jìn)行研究,首先用matlab提取了數(shù)據(jù)y的均值、方差,然后得出短時(shí)平均能量、短時(shí)平均幅度、短時(shí)平均過零率、短時(shí)自相關(guān)函數(shù)等特征向量。通過BP神經(jīng)網(wǎng)絡(luò)建立聲音識(shí)別模型,得出結(jié)論并對(duì)

8、樣本進(jìn)行驗(yàn)證。 針對(duì)問題一,由于正常聲音與非正常聲音存在差別,所以其波形圖也存在差別,我們通過觀察圖中不同聲音的頻率與振幅并比較,從而得出它們?cè)陧懚群鸵粽{(diào)兩方面存在差異。 針對(duì)問題二,采用時(shí)域分析處理聲音信號(hào),提取最基本的參數(shù)有短時(shí)能量和平均幅度、短時(shí)平均過零率、短時(shí)自相關(guān)函數(shù),并闡述了它們的用途及特點(diǎn)。 針對(duì)問題三,主要以80組樣本數(shù)據(jù)y的均值、方差、短時(shí)平均能量均值、短時(shí)平均幅度均值、短時(shí)平均過零率均值和短時(shí)自相關(guān)函數(shù)均值作為BP神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù)p。確定目標(biāo)函數(shù)t,1表示正常,0表示非正常。進(jìn)行多次訓(xùn)練達(dá)到誤差要求,并對(duì)80組樣本數(shù)據(jù)進(jìn)行檢驗(yàn)。最后對(duì)BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行評(píng)價(jià)。針對(duì)問題四,

9、為使模型識(shí)別率提高,使用主成分分析(PCA)特征變換對(duì)參數(shù)進(jìn)行優(yōu)化,并用參數(shù)優(yōu)化技術(shù)包括語(yǔ)音包絡(luò)檢測(cè)、Delta特征的引入,有利于參數(shù)分類和系統(tǒng)識(shí)別率提高。 針對(duì)問題五,對(duì)于原始信號(hào)中疊加一定幅度的白噪聲,前期處理時(shí)為了達(dá)到優(yōu)良的消噪效果,采用新興方法小波去噪原理,運(yùn)用MATLAB中的小波工具箱對(duì)含噪信號(hào)進(jìn)行閾值處理,即可得到可靠地去噪信號(hào)。5模型的建立與求解5.1問題一5.1.1正常和非正常聲音的差別 正常聲音與非正常開鎖聲音的差別主要體現(xiàn)在非正常開鎖聲音的響度大且音調(diào)高,而正常開鎖聲音則恰恰相反,其響度低且音調(diào)高。這些差別在聲音波形圖上表現(xiàn)為正常聲音的頻率低(約為1000020000Hz)

10、,則其音調(diào)低,振幅?。s為0.5589左右)則其響度低,而非正常開鎖聲音的波形圖其頻率高約為(2000030000Hz),振幅大(約為0.6676),如圖為一組圖形的對(duì)比(更多圖形對(duì)比見附錄一)。 圖1.正常聲音32的波形圖 圖2.非常聲音32的波形圖 對(duì)這些差別的解釋:一般來(lái)說(shuō)正常用鑰匙開門聲音比較小,聲音比較緩和,表現(xiàn)在頻率與振幅都比較小。而非正常開門的聲音則是相反,因?yàn)榉钦i_門的情況下,其開門速度快,而發(fā)出的聲音就比正常開門所發(fā)出的聲音大一些,聲音也較刺耳一些,這表現(xiàn)在振幅和頻率都較大,這也是為何圖中的非正常聲音波形圖與正常聲音波形圖存在差別。5.2問題二為了表達(dá)這個(gè)聲音型號(hào),對(duì)聲音識(shí)

11、別分析,采用時(shí)域分析的方法,直接對(duì)開門聲音的時(shí)域波形進(jìn)行分析,提取特征向量主要有短時(shí)能量和平均幅度、短時(shí)平均過零率、短時(shí)自相關(guān)函數(shù)。5.2.1時(shí)域分析 在MATLAB的信號(hào)處理工具箱中函數(shù)FFT和IFFT進(jìn)行快速變換,F(xiàn)FT其調(diào)用格式為y=fft(x),其中x是序列,y是序列的FFT,x可為一向量或矩陣,若x為向量,y是x的FFT且和x相同長(zhǎng)度;若x為矩陣,則y是對(duì)矩陣的每一列向量進(jìn)行FFT。利用上述函數(shù)畫出(如正3.mat)聲音的時(shí)域波形如圖1:再畫出(如非32.mat)聲音的時(shí)域波形如圖2:提取特征向量短時(shí)平均能量和幅度 聲音信號(hào)的能量隨時(shí)間是變化的,正常聲音和非正常聲音差別顯著,所以對(duì)短

12、時(shí)能量和短時(shí)平均幅度進(jìn)行分析,描述它的這種特征變化情況。短時(shí)平均能量為2=2 ,式中N為窗長(zhǎng)。它為一幀樣點(diǎn)值的加權(quán)平方和,w(n)為矩形窗。具體方法是:首先計(jì)算原始信號(hào)各個(gè)采樣值的平方,然后用一個(gè)移動(dòng)窗h(n-m)選取出一個(gè)一個(gè)短時(shí)平方序列,并將各短段的平方值求和得到短時(shí)能量序列。我們給出了聲音在不同窗長(zhǎng)N時(shí)的短時(shí)能量函數(shù)曲線,幀之間無(wú)交疊。以(正32.mat)為例如圖3: 圖3.正32.mat短時(shí)能量函數(shù)曲線其相應(yīng)程序代碼見附錄二。對(duì)比給出“非32.mat”的短時(shí)能量曲線如圖4:圖4.非32.mat的短時(shí)能量曲線 但是短時(shí)能量函數(shù)的平方處理對(duì)信號(hào)電平值過于敏感,容易在定點(diǎn)實(shí)現(xiàn)時(shí)產(chǎn)生溢出。為此

13、,用短時(shí)平均幅度來(lái)衡量聲音幅度變化:其方法就是將w(n)對(duì)|x(n)|的線性濾波運(yùn)算,用絕對(duì)值代替平方和,給出了不同矩形窗長(zhǎng)N時(shí)的短時(shí)平均幅度函數(shù)曲線,幀之間無(wú)交疊。如圖5、6、7、8:圖5.正32.mat短時(shí)平均幅度(N=128)圖6.非32.mat短時(shí)平均幅度(N=128) 圖7.正32.mat短時(shí)平均幅度(N=256) 圖8. 非32.mat短時(shí)平均幅度(N=256)其相應(yīng)程序代碼見附錄三。 通過上述對(duì)短時(shí)能量和短時(shí)平均幅度函數(shù)曲線的對(duì)比,兩者分析的結(jié)論是一樣的,但由于平均幅度函數(shù)沒有平方運(yùn)算,故其動(dòng)態(tài)范圍要比短時(shí)能量小。短時(shí)平均過零率當(dāng)離散時(shí)間信號(hào)相鄰兩個(gè)樣點(diǎn)的正負(fù)異號(hào)時(shí),稱為“過零”

14、,短時(shí)平均過零率為:式中,sgn 為符號(hào)函數(shù),即有w(n)為窗函數(shù),計(jì)算時(shí)常采用矩形窗,窗長(zhǎng)為N。 具體方法是:當(dāng)相鄰兩個(gè)樣點(diǎn)符號(hào)相同時(shí),|sgnx(m)-sgnx(m-1)|=0,沒有產(chǎn)生過零;而當(dāng)相鄰兩個(gè)樣點(diǎn)符號(hào)相反時(shí),|sgnx(m)-sgnx(m-1)|=2,為過零次數(shù)的兩倍。因此,在統(tǒng)計(jì)一幀(N點(diǎn))的短時(shí)平均過零率時(shí),求和后必須要除以2N。因此我們給出了一段聲音(正32.mat和非32.mat)的短時(shí)平均過零次數(shù)的變化曲線,如圖9:圖9.正32.mat短時(shí)平均過零次數(shù)的變化曲線圖10.非32.mat短時(shí)平均過零次數(shù)的變化曲線其相應(yīng)程序代碼見附錄四。大量試驗(yàn)統(tǒng)計(jì),得到每10ms作為一個(gè)

15、平均段的直方圖的分布形狀與高斯分布非常吻合。非正常聲音全部都在0.2以下,正常聲音大部分在0.2以下有突破,接近0.4的。短時(shí)自相關(guān)函數(shù) 自相關(guān)函數(shù)用于衡量信號(hào)自身時(shí)間波形的相似性。正常開門聲和非正常開門聲在波形上存在較大差異,正常的時(shí)間波形呈現(xiàn)出一定的周期性,波形之間的相似性較好;非正常的時(shí)間波形雜亂無(wú)章,樣點(diǎn)間的相似性較差。這樣就可以用短時(shí)自相關(guān)函數(shù)來(lái)測(cè)定聲音的相似特性。短時(shí)自相關(guān)函數(shù)的定義為具體方法是:首先用一個(gè)起點(diǎn)為n的窗函數(shù)w(n-m)選取一段聲音x(m)w(n-m),然后用計(jì)算該短聲音的自相關(guān)值,這樣得到就是。以下圖10、11分別給出了非正常聲音與正常聲音的短時(shí)自相關(guān)函數(shù)變化,窗長(zhǎng)

16、為40ms。圖10.非32.mat短時(shí)自相關(guān)函數(shù)(N=320)圖11.正32.mat短時(shí)自相關(guān)函數(shù)(N=320)其相應(yīng)程序代碼見附錄五。 觀察自相關(guān)函數(shù),發(fā)現(xiàn)非正常聲音峰值出現(xiàn)在1左右,有一定的周期性,而正常聲音沒有一定周期性。不同的窗長(zhǎng)對(duì)短時(shí)自相關(guān)函數(shù)有一定影響。5.3問題三5.3.1模型原理 BP算法采用廣義的學(xué)習(xí)規(guī)則,是一種有導(dǎo)師的學(xué)習(xí)算法。它是一種無(wú)反饋的前向網(wǎng)絡(luò),由輸入層、輸出層、隱層構(gòu)成,如下圖所示。它分兩個(gè)階段:正向傳播階段和反向傳播階段。正向傳播階段,將學(xué)習(xí)樣本的輸入信息輸入前饋網(wǎng)絡(luò)的輸入層,輸入層單元接受到輸入信號(hào),計(jì)算權(quán)重合,然后根據(jù)神經(jīng)元的激活函數(shù)將信息傳到隱含層(1層或

17、2層),同樣根據(jù)隱含層的輸出計(jì)算輸出層的輸出。反向傳播階段,將網(wǎng)絡(luò)的實(shí)際輸出與期望輸出相比較,如果誤差不滿足要求,將誤差向后傳播,即從輸出層到輸入層逐層求其誤差(實(shí)際上是等效誤差),然后相應(yīng)地修改權(quán)值。信號(hào)的前向傳播過程:隱含層第i個(gè)節(jié)點(diǎn)的輸入neti:隱含層第i個(gè)節(jié)點(diǎn)的輸出:輸出層第k個(gè)節(jié)點(diǎn)的輸入:輸出層第k個(gè)節(jié)點(diǎn)的輸出:誤差的反向傳播過程 誤差的反向傳播,即首先由輸出層開始逐層計(jì)算各層神經(jīng)元的輸出誤差,然后根據(jù)誤差梯度下降法來(lái)調(diào)節(jié)各層的權(quán)值和閾值,使修改后的網(wǎng)絡(luò)的最終輸出能接近期望值。對(duì)于每一個(gè)樣本p的二次型誤差準(zhǔn)則函數(shù)為Ep:系統(tǒng)對(duì)P個(gè)訓(xùn)練樣本的總誤差準(zhǔn)則函數(shù)為:根據(jù)誤差梯度下降法依次修

18、正輸出層權(quán)值的修正量wki,輸出層閾值的修正量ak,隱含層權(quán)值的修正量wij,隱含層閾值的修正量輸出層權(quán)值調(diào)整公式:輸出層閾值調(diào)整公式:隱含層權(quán)值調(diào)整公式:隱含層閾值調(diào)整公式:最后得到以下公式:5.3.2模型建立與解答 第一步:從數(shù)據(jù)中導(dǎo)出40組正常聲音和40組非正常聲音的采用數(shù)據(jù)均值、采用數(shù)據(jù)方差、能量均值、平均幅度、平均過零率和自相關(guān)函數(shù)作為輸入數(shù)據(jù)p,并對(duì)p進(jìn)行轉(zhuǎn)置。具體數(shù)據(jù)見附錄七。p=5.33E-073.29E-050.00110.00150.1171.93E-08-1.48E-064.87E-061.56E-045.78E-040.1261.63E-07.-1.39E-064.63

19、E-040.01480.00870.08281.52E-06-1.41E-067.05E-040.02250.01320.08188.49E-08;p=p; 第二步:確定目標(biāo)函數(shù)t,設(shè)正常聲音為1,非正常聲音為0.t= 1 1.0 0; 第三步:設(shè)置訓(xùn)練次數(shù),達(dá)到誤差要求。net=newff(minmax(p(:,1:15),40 1,logsig,purelin,traingdm);net.trainParam.epochs=50000;net.trainParam.goal=0.001;net,tr=train(net,p,t); 第四部:對(duì)所有數(shù)據(jù)進(jìn)行檢驗(yàn)。p1=5.33E-073.29

20、E-050.00110.00150.1171.93E-08-1.48E-064.87E-061.56E-045.78E-040.1261.63E-07.-1.39E-064.63E-040.01480.00870.08281.52E-06-1.41E-067.05E-040.02250.01320.08188.49E-08;p1=p1;t1=sim(net,p1)運(yùn)行程序,輸出結(jié)果如下:t1 =Columns 1 through 100.9875 0.5798 0.9580 0.9030 0.7203 0.5707 0.9694 1.0066 0.8894 0.8880Columns 11 t

21、hrough 200.6726 0.8997 0.9960 0.8911 1.0997 0.6680 0.8159 0.9550 1.0013 0.9698Columns 21 through 301.1566 1.0206 0.9617 0.9825 1.0937 1.0138 0.9196 0.9362 0.7906 0.8207Columns 31 through 400.9587 1.0651 0.8183 0.9854 0.9371 0.9900 1.0740 1.1653 0.9372 1.0600Columns 41 through 500.2671 0.2905 -0.0998

22、 0.1440 0.1290 -0.0336 0.3472 0.0786 0.0891 0.1337Columns 51 through 60-0.0448 -0.3311 -0.2200 0.0384 0.4893 0.5723 0.1723 -0.0028 0.1215 0.1646Columns 61 through 700.1370 -0.3832 0.0673 -0.0528 0.3897 -0.0647 -0.0795 0.2804 0.0720 0.1177Columns 71 through 800.0624 -0.1200 0.1119 0.0281 0.0814 -0.00

23、35 0.0456 -0.0817 -0.1038 0.0382 結(jié)果趨近與1表示正常聲音,結(jié)果趨近與0表示非正常聲音。通過多次訓(xùn)練,減小誤差后,對(duì)樣本進(jìn)行檢驗(yàn),得出比較真確的結(jié)果。具體程序見附錄六。程序訓(xùn)練圖形見圖12 圖12.BP網(wǎng)絡(luò)訓(xùn)練過程相關(guān)圖形模型的評(píng)價(jià)(1) BP神經(jīng)網(wǎng)絡(luò)模型考慮比較全面、準(zhǔn)確、簡(jiǎn)單、易行、計(jì)算量小、并行性強(qiáng)。從不同的方面分別討論了正常聲音和非正常聲音的不同信息,并用來(lái)判斷其他聲音的類別。(2) 該模型具有一般性,在一定的條件下適用于其他基因的類別判斷。(3) 模型對(duì)該問題的各種參量做了分析檢驗(yàn),具有良好的穩(wěn)定性。(4) BP神經(jīng)網(wǎng)絡(luò)在其局部的或者部分的神經(jīng)元受到破

24、壞后對(duì)全局的訓(xùn)練結(jié)果不會(huì)造成很大的影響,也就是說(shuō)即使系統(tǒng)在受到局部損傷時(shí)還是可以正常工作的。即BP神經(jīng)網(wǎng)絡(luò)具有一定的容錯(cuò)能力。(5) 模型學(xué)習(xí)效率較低,收斂速度慢,易陷入局部極小狀態(tài)。(6) 該模型難以解決應(yīng)用問題的實(shí)例規(guī)模和網(wǎng)絡(luò)規(guī)模間的矛盾問題,其涉及到網(wǎng)絡(luò)容量的可能性與可行性的關(guān)系問題,即學(xué)習(xí)復(fù)雜性問題。5.4問題四 PCA特征變換為了提高模型的精確度,我們采用PCA變換,它可以揭示特征變量間的模糊關(guān)系,簡(jiǎn)化數(shù)據(jù)。選取聲音正常聲音與非正常聲音各10組,取4個(gè)特征向量分別是:X1 :短時(shí)平均能量,X2:短時(shí)平均幅度,X3:短時(shí)平均過零率,X4:短時(shí)自相關(guān)函數(shù),收集數(shù)據(jù),得到數(shù)據(jù)表,然后進(jìn)行P

25、CA特征變換:采用數(shù)據(jù)極差標(biāo)準(zhǔn)化方法;求相關(guān)系數(shù)矩陣;求相關(guān)系數(shù)矩陣的特征值和特征向量:按特征值的大小,對(duì)于正常開門聲,非正常與正常開門聲主成分分析程序見附錄八4=2.0678,3=1.4722,2=0.0120,1=0.4481;計(jì)算累計(jì)貢獻(xiàn)率,寫出各主成分:各特征值對(duì)應(yīng)主成分的信息貢獻(xiàn)率分別為:1=51.69%,2=36.8%,3=0.3%,4=11.2%,選擇1、2、4三個(gè)主成分:對(duì)1=0.4481,F(xiàn)1=0.1016 X1+0.0712 X2+ 0.7169 X3+ 0.6861 X4為第一主成分,對(duì)3=1.4722,F(xiàn)3= 0.1916X1+ 0.2524 X2+ 0.6280X3-

26、0.7108X4為第二主成分,對(duì)4=2.0678,F(xiàn)4= 0.6726X1+ 0.6590X2 -0.3024X3+ 0.1481X4為第三主成分,給出綜合評(píng)價(jià)模型:f=0.4481F1+1.4722F3+2.0678F4,再將數(shù)據(jù)代入,f正=95.5626;同理可得非正常開門聲f非=94.7705,明顯 f正 f非 經(jīng)過參數(shù)變換,新的特征更具有區(qū)分性。 特征參數(shù)優(yōu)化 我們對(duì)現(xiàn)有特征進(jìn)行分析,對(duì)于特征提取過程中某些可調(diào)整的地方以及特征參數(shù)進(jìn)行優(yōu)化。語(yǔ)音包絡(luò)檢測(cè) 去除靜音,對(duì)聲音能量和過零率的檢測(cè),留下重要信息部分。方法現(xiàn)將聲音開始部分看作靜音,計(jì)算這期間平均幅度和過零率的統(tǒng)計(jì)特性,再和最大幅度

27、結(jié)合計(jì)算能量,參考平均幅度輪廓找出超出很保守門限的一段時(shí)間間隔。有無(wú)包絡(luò)檢測(cè)下的識(shí)別率未使用包絡(luò)檢測(cè)使用包絡(luò)檢測(cè)識(shí)別率0.96720.9761實(shí)驗(yàn)表明,包絡(luò)檢測(cè)將識(shí)別率提高了0.89%,使得特征向量有利于分類。 Delta特征的引入 聲音信號(hào)本質(zhì)上具有連續(xù)性,所以獲取語(yǔ)音幀特征之間的時(shí)變特性,將會(huì)提高識(shí)別的性能。對(duì)特征在語(yǔ)音幀序列的時(shí)序上作一次傅里葉變換,就得到了對(duì)應(yīng)于該特征的Delta特征。其中,表示第t幀特征的Delta特征,表示考慮第t幀順序變化的語(yǔ)音幀的數(shù)量。下面來(lái)看Delta特征對(duì)于識(shí)別率的影響:引入Delta特征的識(shí)別率識(shí)別率未加入Delta特征0.9703Delta0.9826可

28、以看出,Delta特征的引入能夠提高系統(tǒng)的識(shí)別率,達(dá)到1.23%。5.5問題五 如果在原始信號(hào)中加有一定白噪聲,在預(yù)處理時(shí)我們采用小波分析法去噪,小波分析能夠通過變換充分突出信號(hào)的時(shí)頻局部特征,小波分析是重要的信號(hào)去噪工具,我們運(yùn)用MATLAB中的小波工具箱,對(duì)一個(gè)含噪信號(hào)進(jìn)行閾值去噪,運(yùn)用實(shí)例來(lái)驗(yàn)證小波分析法的可靠性。5.5.1小波去噪原理 一個(gè)含有噪聲的信號(hào)可表示為:A(i)=f(i)+k(i),i=1,n.,其中A(i)為含有噪聲的信號(hào),f(i)為真實(shí)信號(hào),為噪聲水平,k(i)為噪聲信號(hào)且假設(shè)為白噪聲。噪聲高頻部分影響小波分解高頻層,低頻部分影響小波最深層,為此對(duì)小波分解系數(shù)進(jìn)行處理達(dá)到

29、分解噪聲目的。5.5.2小波去噪步驟觀測(cè)數(shù)據(jù)作小波分解變化:Y是觀測(cè)數(shù)據(jù)向量,f是真實(shí)信號(hào)向量,z是高斯隨機(jī)向量,此式是線性變換。對(duì)小波系數(shù)閾值量化,閾值處理可以表示為,閾值選取方法:小波重構(gòu):現(xiàn)將系數(shù)作逆變換得出重構(gòu)信號(hào):即為受污染信號(hào)去噪后信號(hào)。5.5.3小波去噪實(shí)例 首先對(duì)原始信號(hào)進(jìn)行一定處理,即是利用y1=y+(-0.15+0.3*rand(size(y)*max(y)疊加噪聲,得到了含有一定幅值的白噪聲信號(hào),選取正11.mat和非11.mat如圖13、14:圖13.正13.mat白噪聲圖14.非11.mat白噪聲 利用上述步驟,對(duì)小波分解系數(shù)使用函數(shù)wthcoef進(jìn)行閾值處理,然后利

30、用閾值處理后的小波系數(shù)進(jìn)行重構(gòu)達(dá)到去噪目的。相應(yīng)程序代碼見附錄九。小波去噪后其相應(yīng)的效果圖如圖15、16:圖15去噪后正11.mat圖16.去噪后非11.mat 實(shí)驗(yàn)表明小波信號(hào)消噪具有良好的時(shí)頻分析能力,從視覺效果上看,該方法計(jì)算小,編程簡(jiǎn)單。對(duì)原始信號(hào)添加噪聲后得到的含噪信號(hào),利用MATLAB中的小波工具箱對(duì)含噪信號(hào)進(jìn)行閾值處理,得出的去噪結(jié)果與原始信號(hào)效果非常接近,由此說(shuō)明MATLAB中的小波變換工具箱對(duì)信號(hào)去噪處理時(shí)可靠的,理想的。6模型的改進(jìn)與推廣 由于在人工神經(jīng)網(wǎng)絡(luò)中,反向傳播法占據(jù)了非常主要的地位,為了加快訓(xùn)練速度,避免陷入局部極小值和改善其他能力,提出了彈性BP算法。彈性BP算

31、法只取偏導(dǎo)數(shù)的符號(hào),而不考慮偏導(dǎo)數(shù)的副值,偏導(dǎo)數(shù)的符號(hào)決定權(quán)值更新的方向。在彈性BP算法中,當(dāng)訓(xùn)練發(fā)生振蕩時(shí),權(quán)值的變化量將會(huì)減小,當(dāng)在幾次迭代過程中權(quán)值都朝某個(gè)方向變化時(shí),權(quán)值的變化量將增大。因此彈性BP算法的收斂速度較快,算法也不復(fù)雜,更不需要消耗更多的內(nèi)存。7參考文獻(xiàn)1同濟(jì)大學(xué)應(yīng)用數(shù)學(xué)系編.高等數(shù)學(xué).北京:高等教育出版社,2006年第三版.2華東師范大學(xué)數(shù)學(xué)系編.數(shù)學(xué)分析.北京:高等教育出版社,2008年第三版.3韓中庚.數(shù)學(xué)建模競(jìng)賽獲獎(jiǎng)?wù)撐木x與點(diǎn)評(píng).北京:科學(xué)出版社,2007.附錄附錄一正1.mat正2.mat正3.mat正4.mat正5.mat非1.mat非2.mat非3.mat附

32、錄二:正32.mat短時(shí)能量程序代碼load(正32.mat)subplot(6,1,1),plot(y);N=32;for i=2:6 h=linspace(1,1, (i-1)*N);%形成一個(gè)矩形窗,長(zhǎng)度為N En=conv(h,y.*y);%求卷積得其短時(shí)能量函數(shù)En subplot(6,1,i),plot(En); if(i=2) legend(N=32); elseif(i=3) legend(N=64); elseif(i=4) legend(N=128); elseif(i=5) legend(N=256); elseif(i=6) legend(N=512); endend附

33、錄三:短時(shí)平均幅度程序代碼load(正32.mat)subplot(6,1,1),plot(y);N=256;L=length(y)LL=length(y)/N;Mn=sum(abs(y)/NMn=zeros(1,(LL-1)*256);for ii=1:(LL-1)*256; temp=y(ii:ii+256); Mn(ii)=sum(abs(temp)/N;endjj=1:(LL-1)*256;plot(jj,Mn,b);grid附錄四:短時(shí)平均過零次數(shù)程序代碼load(正32.mat)subplot(6,1,1),plot(y);n=length(y);N=320;subplot(3,1

34、,1),plot(y);h=linspace(1,1,N);En=conv(h,y.*y);subplot(3,1,2),plot(En);for i=1:n-1 if y(i)=0; b(i)=1; else b(i)=-1; end if y(i+1)=0 b(i+1)=1; else b(i+1)=-1; end w(i)=abs(b(i+1)-b(i);endk=1; j=0; while (k+N-1) p=-5.33E-073.29E-050.00110.00150.1171.93E-08-1.48E-064.87E-061.56E-045.78E-040.1261.63E-07-

35、7.45E-064.31E-061.38E-045.46E-040.1165-2.80E-09-1.47E-064.67E-061.49E-045.43E-040.11444.33E-08-1.56E-064.73E-061.51E-046.01E-040.11535.14E-08-1.53E-063.41E-061.09E-044.90E-040.1492-6.75E-10-1.57E-063.76E-050.00120.00150.11335.65E-07-1.46E-063.44E-061.10E-044.41E-040.11643.85E-08-1.35E-063.60E-061.15

36、E-044.82E-040.11564.35E-08-1.31E-061.87E-065.97E-053.21E-040.1298.85E-10-1.34E-062.98E-069.52E-054.66E-040.12313.59E-08-1.31E-063.37E-061.08E-044.70E-040.11811.23E-07-1.49E-061.12E-063.57E-052.58E-040.12492.28E-07-1.39E-061.25E-064.01E-052.80E-040.1354.07E-09-1.19E-061.80E-065.77E-053.21E-040.12071.

37、46E-07-1.32E-061.26E-064.01E-053.33E-040.12154.29E-07-1.23E-062.00E-066.39E-053.59E-040.1247-2.95E-09-1.28E-068.87E-072.84E-052.66E-040.1256-2.43E-09-1.47E-062.37E-067.58E-053.91E-040.1128-4.60E-07-1.28E-068.24E-072.63E-052.49E-040.1278-2.38E-09-1.27E-065.07E-071.62E-051.77E-040.12522.01E-08-1.32E-0

38、67.51E-072.40E-052.55E-040.1231.15E-08-1.54E-062.04E-066.52E-053.31E-040.12591.02E-08-1.37E-067.13E-072.28E-052.46E-040.12814.39E-08-1.46E-065.44E-071.74E-052.41E-040.12096.92E-08-1.35E-061.24E-063.97E-052.63E-040.1261-4.09E-09-1.34E-061.06E-063.39E-052.64E-040.13299.90E-08-1.57E-066.27E-072.01E-052

39、.37E-040.13765.22E-09-1.46E-061.23E-063.92E-053.30E-040.13151.05E-07-1.53E-066.32E-072.02E-052.78E-040.141-1.09E-09-9.56E-071.23E-063.93E-053.65E-040.10994.13E-06-1.24E-069.84E-073.15E-052.21E-040.1273-3.57E-09-1.52E-061.44E-064.61E-053.32E-040.13011.36E-07-1.63E-069.80E-073.13E-052.71E-040.12717.68

40、E-09-1.39E-064.65E-071.49E-052.36E-040.11613.16E-07-1.59E-067.88E-072.52E-052.56E-040.12765.36E-10-1.55E-066.34E-072.03E-052.16E-040.12211.87E-07-1.22E-064.65E-071.49E-052.26E-040.1177-2.01E-09-1.34E-067.23E-072.31E-052.30E-040.13381.22E-07-1.26E-064.95E-071.58E-051.75E-040.13419.41E-09-1.26E-063.29

41、E-061.05E-046.23E-040.11747.31E-09-1.45E-065.71E-061.82E-046.49E-040.12254.39E-07-1.51E-062.24E-057.16E-040.00120.1299-4.36E-07-1.49E-061.20E-053.85E-040.0010.12141.02E-09-1.35E-067.87E-062.52E-048.22E-040.12642.38E-07-1.42E-061.50E-054.79E-040.00110.11688.69E-09-1.46E-064.32E-061.38E-046.30E-040.12

42、143.35E-08-1.36E-063.24E-061.04E-046.49E-040.12661.35E-07-1.26E-061.29E-054.14E-040.00120.11866.15E-07-1.50E-062.94E-059.39E-040.00130.12582.22E-09-1.43E-061.37E-054.38E-040.00110.12781.37E-07-1.46E-067.58E-062.42E-049.26E-040.13051.55E-07-1.35E-063.77E-061.21E-047.48E-040.13051.95E-07-1.44E-061.06E

43、-053.39E-040.0010.11534.08E-08-1.36E-063.16E-061.01E-044.82E-040.1351.89E-07-1.51E-063.30E-061.06E-044.90E-040.12983.66E-08-1.66E-063.64E-061.16E-046.26E-040.136.13E-08-2.37E-062.72E-068.69E-055.63E-040.13961.39E-06-1.39E-063.26E-061.04E-045.96E-040.1426-1.02E-08-1.41E-068.80E-062.81E-048.88E-040.13

44、993.13E-07-1.28E-063.96E-061.27E-046.13E-040.14195.40E-08-1.33E-065.41E-061.73E-048.99E-040.13212.64E-07-1.53E-064.05E-061.30E-046.57E-040.13721.32E-07-1.74E-065.31E-050.00170.00180.11891.60E-07-2.36E-062.12E-066.77E-054.53E-040.12042.87E-07-1.92E-061.44E-054.60E-040.00120.11049.44E-07-8.86E-078.11E

45、-062.59E-049.09E-040.11592.06E-07-1.59E-062.21E-067.07E-055.37E-040.1293-1.82E-09-1.53E-065.75E-061.84E-047.66E-040.13743.45E-07-1.55E-065.18E-061.66E-047.15E-040.1501-2.60E-09-1.52E-061.28E-040.00410.00270.09172.36E-07-1.46E-069.86E-050.00320.00260.102-2.61E-09-9.75E-065.92E-050.00190.00350.10679.8

46、2E-06-3.92E-066.52E-050.00210.00220.09961.67E-06-1.59E-063.96E-040.01270.01080.09021.11E-08-1.56E-061.46E-040.00470.01790.0871-1.50E-09-1.60E-060.00120.0370.01790.07813.88E-07-5.32E-063.39E-040.01080.00560.07936.41E-04-1.39E-064.63E-040.01480.00870.08281.52E-06-1.41E-067.05E-040.02250.01320.08188.49

47、E-08;t= 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0;p=p;net=newff(minmax(p(:,1:15),40 1,logsig,purelin,traingdm);net.trainParam.epochs=50000;net.trainParam.goal=0.001;net,tr=train(net,

48、p,t);p1=-5.33E-073.29E-050.00110.00150.1171.93E-08-1.48E-064.87E-061.56E-045.78E-040.1261.63E-07-7.45E-064.31E-061.38E-045.46E-040.1165-2.80E-09-1.47E-064.67E-061.49E-045.43E-040.11444.33E-08-1.56E-064.73E-061.51E-046.01E-040.11535.14E-08-1.53E-063.41E-061.09E-044.90E-040.1492-6.75E-10-1.57E-063.76E

49、-050.00120.00150.11335.65E-07-1.46E-063.44E-061.10E-044.41E-040.11643.85E-08-1.35E-063.60E-061.15E-044.82E-040.11564.35E-08-1.31E-061.87E-065.97E-053.21E-040.1298.85E-10-1.34E-062.98E-069.52E-054.66E-040.12313.59E-08-1.31E-063.37E-061.08E-044.70E-040.11811.23E-07-1.49E-061.12E-063.57E-052.58E-040.12

50、492.28E-07-1.39E-061.25E-064.01E-052.80E-040.1354.07E-09-1.19E-061.80E-065.77E-053.21E-040.12071.46E-07-1.32E-061.26E-064.01E-053.33E-040.12154.29E-07-1.23E-062.00E-066.39E-053.59E-040.1247-2.95E-09-1.28E-068.87E-072.84E-052.66E-040.1256-2.43E-09-1.47E-062.37E-067.58E-053.91E-040.1128-4.60E-07-1.28E

51、-068.24E-072.63E-052.49E-040.1278-2.38E-09-1.27E-065.07E-071.62E-051.77E-040.12522.01E-08-1.32E-067.51E-072.40E-052.55E-040.1231.15E-08-1.54E-062.04E-066.52E-053.31E-040.12591.02E-08-1.37E-067.13E-072.28E-052.46E-040.12814.39E-08-1.46E-065.44E-071.74E-052.41E-040.12096.92E-08-1.35E-061.24E-063.97E-052.63E-040.1261-4.09E-09-1.34E-061.06E-063.39E-052.64E-040.13299.90E-08-1.57E-066.27E-072.01E-052.37E-040.13765.22E-09-1.46E-061.23E-063.92E-053.30E-040.13151.05E-07-1.53E-066.32E-072.02E-052.78E-040.141-1.09E-09-9.56E-071.23E-063.93E-053.65E-040.10994.13E-06-1.24E-069

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論