




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、CN4321258/TP ISSN10072130X 計算機工程與科學(xué)COMPU TER EN GIN EERIN G&SCIENCE2010年第32卷第5期Vol132,No15,2010基于擴展卡爾曼粒子濾波算法的神經(jīng)網(wǎng)絡(luò)訓(xùn)練Neural Netwo rk Training Based o nt he Extended Kalman Particle Filter王法勝,郭權(quán)WANG F a2sheng,GU O Q u an(大連東軟信息學(xué)院計算機科學(xué)與技術(shù)系,遼寧大連116023(Deptartment of Computer Science and T echnology,D
2、alian N eusoft Institute of I nform ation,Dalian116023,China摘要:神經(jīng)網(wǎng)絡(luò)的訓(xùn)練是一種非線性系統(tǒng)的辨識問題,基本粒子濾波算法已被成功用于訓(xùn)練神經(jīng)網(wǎng)絡(luò),但基本粒子濾波算法在建議分布的選擇上并沒有考慮當(dāng)前時刻觀測值的影響,本文針對該問題提出使用擴展卡爾曼濾波器來生成建議分布。由于擴展卡爾曼濾波器在傳遞近似建議分布的均值和協(xié)方差的過程中充分利用了觀測值信息,從而可以更好地描述神經(jīng)網(wǎng)絡(luò)權(quán)值的后驗概率分布。實驗結(jié)果證明,使用擴展卡爾曼濾波器作為建議分布的粒子濾波算法性能明顯優(yōu)于基本粒子濾波算法。Abstract:Training neural
3、networks can be viewed as an identification problem for a nonlinear dynamic system.The ge2 neric particle filter has been applied with success to neural network training,but the proposal distribution chosen by the ge2 neric particle filter does not incorporate the latest observations which can deter
4、iorate the performance of the algorithm.In this paper,we propose to use the extended Kalman filter to generate proposal distribution in the particle filtering f rame2 work.The extended Kalman filter can make efficient use of the latest observations,and the generated proposal distribution can approxi
5、mate the posterior distribution of neural network weights much better,which consequently improve the perform2 ance of the particle filter.The experimental results show that the proposed particle filter outperforms the generic particle fil2 ter.關(guān)鍵詞:多層感知器;神經(jīng)網(wǎng)絡(luò)訓(xùn)練;擴展卡爾曼粒子濾波K ey w ords:multilayer percept
6、ron;neural network training;extended Kalman particle filter中圖分類號:TP183文獻標(biāo)識碼:A1引言多層感知器(Multilayer Perceptrons是應(yīng)用較為廣泛的一種人工神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。在多數(shù)實際應(yīng)用中,一般采用BP算法來訓(xùn)練神經(jīng)網(wǎng)絡(luò)。盡管BP算法對于小型網(wǎng)絡(luò)以及規(guī)模相對簡單的問題能夠取得較好的效果,但對于復(fù)雜問題收斂性能非常差。為了克服BP算法的缺陷,研究者提出了很多改進方法,比如引入變步長、加入動量項等等。Singhal S和Wu L1提出將多層感知器的訓(xùn)練看作非線性動態(tài)系統(tǒng)的辨識問題,使用狀態(tài)空間法建立模型,并應(yīng)用擴展卡
7、爾曼濾波算法(Extended Kalman Filter,簡稱EKF來進行訓(xùn)練。實驗結(jié)果表明,與傳統(tǒng)的BP算法相比,EKF訓(xùn)練算法的收斂性能明顯優(yōu)于BP算法。這一研究成果受到許多研究者的重視。EKF算法基于局部線性化方法,針對輸出方程,將其展開成一階泰勒展式,然后使用卡爾曼濾波方程估計神經(jīng)網(wǎng)絡(luò)權(quán)值。然而,EKF算法對輸出方程進行局部線性化的過程中常常會丟失一些重要的信息,對于非線性輸出模型而言,使用E KF進行線性化以后得到的分布不能很好地逼近真實843收稿日期:2009209203;修訂日期:2009212206基金項目:國家863計劃資助項目(2006AA01A124作者簡介:王法勝(1
8、983-,男,山東臨沂人,碩士,講師,研究方向為智能信息處理;郭權(quán),博士,教授,研究方向為人工智能和網(wǎng)絡(luò)安全。通訊地址:116023遼寧省大連市軟件園路8號大連東軟信息學(xué)院計算機系A(chǔ)32220;Tel:133*;E2mail:wangfashengneusoft. Address:Deptart ment of Computer Science,Dalian Neusoft Institute of Information,8Ruanjianyuan Rd,Dalian,Liaoning116023,P.R. China的非線性系統(tǒng)分布。為解決EKF 算法存在的問題,Freitas 等人2提出
9、使用SIR 算法(Sequential Importance Sam 2pling 2Resampling ,簡稱SIR 對神經(jīng)網(wǎng)絡(luò)進行序貫訓(xùn)練(Se 2quential Training 。SIR 算法,即粒子濾波算法,是近年來新興的一種解決非線性濾波問題的方法,其基本思想是用一個帶有權(quán)重(也稱重要性比率的樣本粒子集合來逼近感興趣的概率分布。Freitas 等人率先提出使用該算法對神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,并在實驗中證明其性能要優(yōu)于EKF 訓(xùn)練算法,這主要是由于粒子濾波算法能夠更好地逼近真實的神經(jīng)網(wǎng)絡(luò)權(quán)值的概率分布。但是,SIR 算法卻存在嚴(yán)重的退化問題,即經(jīng)過若干次迭代以后,僅有極少數(shù)粒子的權(quán)重能
10、夠?qū)Ρ平怕史植籍a(chǎn)生重要影響,大多數(shù)粒子權(quán)重小到可以忽略不計的程度。退化現(xiàn)象嚴(yán)重影響粒子濾波算法的性能3。有效減少退化現(xiàn)象影響的方法之一是選擇一個好的建議分布來產(chǎn)生樣本粒子4。一種比較好的選擇方法是,將后驗概率密度近似為高斯分布,這樣只要得到了均值和協(xié)方差,就可以構(gòu)造該高斯分布,以該高斯分布為建議分布,從中抽取樣本粒子。本文以該思想為基礎(chǔ),使用EKF 算法來構(gòu)造近似高斯后驗概率密度函數(shù),以此產(chǎn)生擴展卡爾曼粒子濾波算法,并應(yīng)用該算法訓(xùn)練多層感知器網(wǎng)絡(luò),在實驗中與SIR 算法對比,驗證了算法的訓(xùn)練性能。2粒子濾波算法2.1神經(jīng)網(wǎng)絡(luò)的狀態(tài)空間模型首先,使用狀態(tài)空間表示法為神經(jīng)網(wǎng)絡(luò)建模,以描述神經(jīng)網(wǎng)絡(luò)
11、隨時間變化的過程。使用一個狀態(tài)遷移方程描述神經(jīng)網(wǎng)絡(luò)權(quán)值的變化,一個測量方程描述某一具體物理過程的輸入和輸出之間的非線性關(guān)系,方程如下:w k+1=w k +d k (1y k =g (w k ,x k +v k(2其中,y k R o 表示輸出測量,x k R d 表示輸入測量,w kR m 表示神經(jīng)網(wǎng)絡(luò)的權(quán)值。非線性測量函數(shù)g (使用一個多層感知器來近似。假設(shè)系統(tǒng)測量噪聲v k 為0均值高斯噪聲,協(xié)方差為R 。假設(shè)第k +1時刻的網(wǎng)絡(luò)權(quán)值依賴于k 時刻的網(wǎng)絡(luò)權(quán)值以及系統(tǒng)隨機過程噪聲d k 。過程噪聲可用來描述系統(tǒng)參數(shù)變化的不確定性、系統(tǒng)建模誤差或者未知的輸入量,如目標(biāo)機動等。假設(shè)過程噪聲為0
12、均值高斯噪聲,協(xié)方差為Q 。2.2粒子濾波算法粒子濾波算法的基本思想是使用一個帶權(quán)粒子集合來逼近在推理過程中需要進行的積分運算,這些粒子取自于神經(jīng)網(wǎng)絡(luò)權(quán)值的后驗概率密度函數(shù)p (w 0:k |y 1:k 。后驗概率密度可近似為:p (w 0:k |y 1:k =Ni =1q ik(w 0:k (w 0:k -w i 0:k (3其中,w i0:k 表示用來近似后驗概率密度函數(shù)的粒子;(為delta 函數(shù);N s 表示使用的粒子數(shù)目,粒子w i0:k 從后驗概率密度函數(shù)中抽取;q k (w 0:k 為粒子的重要性比率。在實際應(yīng)用中,直接從后驗概率密度中抽取樣本粒子是很難做到的。因此,有學(xué)者提出從
13、一個已知的概率分布密度,即建議分布密度(w 0:k |y 1:k 中抽取樣本粒子,使用這些粒子來近似后驗概率密度4。引入建議分布以后,粒子的重要性比率q k (w 0:k 可以通過下式遞歸計算得到:q k =q k-1p (y k |w k p (w k |w k-1(w k |w 0:k-1,y 1:k (4上式為我們提供了一種遞歸更新粒子重要性比率的機制。再采樣技術(shù)可以有效減少退化現(xiàn)象的影響,它的基本思想是去除重要性比率低的粒子,復(fù)制重要性比率高的粒子,再采樣之后得到的粒子集合中,每一個粒子的重要性比率均為1/N s 。關(guān)于再采樣方法的內(nèi)容,請參考文獻4。文獻2,4給出了詳細(xì)的SIR 粒子
14、濾波算法。SIR 粒子濾波算法中建議分布函數(shù)選擇的是先驗概率密度轉(zhuǎn)移函數(shù)p (w k |w k-1,但先驗概率密度轉(zhuǎn)移函數(shù)只考慮了上一時刻神經(jīng)網(wǎng)絡(luò)權(quán)值w k-1對當(dāng)前時刻神經(jīng)網(wǎng)絡(luò)權(quán)值的影響,忽視了當(dāng)前時刻觀測值y k 對估計網(wǎng)絡(luò)權(quán)值的作用。為解決這個問題,本文使用高斯近似方法,將網(wǎng)絡(luò)權(quán)值的后驗概率密度函數(shù)近似為高斯函數(shù),然后使用EKF 來估計高斯函數(shù)的參數(shù),這樣在估計過程中,EKF 融合了當(dāng)前時刻觀測值的影響,從而可以提高估計精度。3擴展卡爾曼粒子濾波神經(jīng)網(wǎng)絡(luò)訓(xùn)練算法擴展卡爾曼粒子濾波算法(Extended Kalman Particle Filter ,簡稱EKPF 是由Doucet 3等人
15、提出的。本文將在神經(jīng)網(wǎng)絡(luò)訓(xùn)練背景下詳細(xì)介紹EKPF 算法。將后驗概率密度函數(shù)近似為高斯密度函數(shù),使用均值和方差即可描述該高斯函數(shù)。p (w 0:k |y 1:k p N (w 0:k |y 1:k =N ( w k ,P k (5因此,我們只需要遞歸地計算權(quán)值的均值和相應(yīng)的協(xié)方差即可,將近似高斯分布向前傳遞。在粒子濾波算法的框架內(nèi),對每一個粒子,使用EKF 產(chǎn)生并傳遞近似高斯的建議分布,即:q (w i t |w i0:k-1,y 1:k =N ( wi k ,P i k ,i =1,N s (6在時刻k -1,根據(jù)最新的觀測值信息,使用EKF 方程計算每一個粒子的均值和協(xié)方差的估計,然后從構(gòu)
16、成的近似建議分布中抽取第i 個粒子,該過程遞歸進行下去。假設(shè)在k -1時刻,已經(jīng)得到樣本粒子集合w i0:k-1,q i k-1N s i =1來近似表示k -1時刻的后驗概率密度函數(shù),在k 時刻,首先根據(jù)方程(1計算該時刻的預(yù)測狀態(tài)和預(yù)測協(xié)方差:w i k|k-1=w i k-1(7P i k|k-1=F i k P i ,T k-1F i ,Tk+G i k Q k G i ,T k (8計算卡爾曼增益:K k =P i k|k-1H i ,T k U i k R k U i ,T k +H i k P k|k-1i H i ,T k -1(9k 時刻觀測值y k 到來,根據(jù)該時刻的觀測值
17、和計算的卡爾曼增益,更新前面計算的均值和協(xié)方差的預(yù)測值:w i k = w i k|k-1+K k (y k -g ( w i k|k-1,x k (10P i k =P i k|k-1-K k H i k P i k|k-1(11這樣就得到了k 時刻的均值和協(xié)方差估計,進而可以得到近似的高斯建議分布N ( w i k ,P i k ,從中抽取粒子w i k 94N( w i k,P i k。EKPF算法步驟總結(jié)如下:步驟1初始化網(wǎng)絡(luò)權(quán)值(k=0時刻:FOR i=1,N s,從網(wǎng)絡(luò)第一層先驗分布p1(w0和第二層先驗分布p2(w0中抽取粒子w i0;計算重要性比率:q i0=p(y0|w i0
18、;歸一化重要性比率:q i0=q i0N s j=1q j0步驟2FOR k=1,2,(1采樣階段:FOR i=1,N s計算雅克比矩陣F i k&G i k和H i k&U i k;使用E KF方程更新粒子得到均值和協(xié)方差估計量 w i k和P i k;抽取粒子w i kN( w i k,P i k;根據(jù)方程(4計算重要性比率;歸一化重要性比率:q i k+1=q i k+1N s j=1q j k+1(2再采樣階段:去除重要性比率較小的粒子,同時復(fù)制重要性比率較大的粒子,得到N s個隨機粒子w i k+1,為每個粒子分配大小相同的重要性比率,q i k+1=1/N s。4實
19、驗本節(jié)將通過實驗驗證EKPF算法的性能。在實驗中,輸入輸出數(shù)據(jù)由下列非線性非平穩(wěn)狀態(tài)空間模型產(chǎn)生:x k+1=0.5x k+25x k(1+x k2+8cos(1.2k+process_noise(12y k=x2k20+60.05(k-1+3+measurement_noise(13實驗中,使用一個多層感知器來逼近這些數(shù)據(jù),該多層感知器網(wǎng)絡(luò)為三層前饋網(wǎng)絡(luò),隱層神經(jīng)元數(shù)為10個,輸出層為1個線性神經(jīng)元。多層感知器的訓(xùn)練中使用SIR粒子濾波算法和EKPF算法。粒子濾波算法的粒子數(shù)目N s為50個。表1所示為兩種算法的一步預(yù)測平均誤差及運行時間對比,實驗進行100次,獨立運行,每一次運行120個時
20、刻。從表中可以看出,EKPF訓(xùn)練算法的一步預(yù)測誤差約為4. 58,低于SIR訓(xùn)練算法的6.76;在運行時間方面,SIR為115s,EKPF為118s,相差不大,EKPF算法訓(xùn)練運行時間稍高于SIR算法。表1平均一步預(yù)測誤差對比算法RMS error Time(sSIR 6.76115EKPF 4.58118圖1所示為某一次運行中,E KPF算法和SIR算法訓(xùn)練感知器對輸出的預(yù)測誤差曲線。從圖1中可以看出,EKPF算法明顯優(yōu)于SIR算法。圖1兩種算法的一步預(yù)測值與真實值對比曲線5結(jié)束語本文提出一種新型的神經(jīng)網(wǎng)絡(luò)訓(xùn)練算法,即EKPF算法。在粒子濾波算法框架內(nèi),使用EKF算法傳播近似高斯建議分布,有效利用觀測值提供的信息,從而可以更好地描述神經(jīng)網(wǎng)絡(luò)權(quán)值的分布函數(shù)。本算法不僅可用于多層前饋網(wǎng)絡(luò),也可用于遞歸神經(jīng)網(wǎng)絡(luò)、徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)等.參考文獻:1Singhal
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 企業(yè)高管責(zé)任與合規(guī)風(fēng)險的預(yù)防
- 2025年礦產(chǎn)資源交易協(xié)議書
- 二甲基亞砜在醫(yī)藥行業(yè)的潛力探索
- 組織文化塑造對國企改革深化的推動
- 深化工業(yè)園區(qū)改革創(chuàng)新的背景意義及必要性
- 商業(yè)步行街規(guī)劃基礎(chǔ)知識點歸納
- 教聯(lián)體高質(zhì)量發(fā)展未來展望及發(fā)展趨勢
- 語音與圖像識別技術(shù)在輔導(dǎo)員工作中的創(chuàng)新應(yīng)用
- 影視產(chǎn)業(yè)對地方就業(yè)市場的促進作用
- 校園急救知識與技能培養(yǎng)的創(chuàng)新實踐
- T/CIQA 31-2022出入境生物安全消毒服務(wù)機構(gòu)能力等級劃分及相關(guān)要求
- 退休移交協(xié)議書
- 國家開放大學(xué)國開電大《法律職業(yè)倫理》形考及期末終考參考答案
- 2025年便攜式B超診斷儀項目市場調(diào)查研究報告
- 消防單位招聘心理測試題及答案
- 2025-2030年留學(xué)中介產(chǎn)業(yè)市場深度分析及發(fā)展趨勢與投資戰(zhàn)略研究報告
- 子宮增生的預(yù)防與治療
- 植物分子育種策略-全面剖析
- 荊州市監(jiān)利縣2025年五年級數(shù)學(xué)第二學(xué)期期末考試模擬試題含答案
- 2025年河南省安陽市滑縣中考二模道德與法治試題(原卷版+解析版)
- 八省聯(lián)考模擬試題及答案
評論
0/150
提交評論