




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第五章第五章 神經(jīng)網(wǎng)絡(luò)控制論神經(jīng)網(wǎng)絡(luò)控制論2 引言引言1234 非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)5 神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)n由于神經(jīng)網(wǎng)絡(luò)本質(zhì)上是一個(gè)大規(guī)模并行分布處由于神經(jīng)網(wǎng)絡(luò)本質(zhì)上是一個(gè)大規(guī)模并行分布處理的非線性動(dòng)力學(xué)系統(tǒng),并在更高層次上體現(xiàn)理的非線性動(dòng)力學(xué)系統(tǒng),并在更高層次上體現(xiàn)出一些人腦的智能行為,為智能控制提供了新出一些人腦的智能行為,為智能控制提供了新途徑。途徑。n神經(jīng)網(wǎng)絡(luò)控制的優(yōu)越性體現(xiàn)在:神經(jīng)網(wǎng)絡(luò)控制的優(yōu)越性體現(xiàn)在: n神經(jīng)網(wǎng)絡(luò)可以處理那些難以用模型或規(guī)則描述的過神經(jīng)網(wǎng)絡(luò)可以處理那些難以用模型或
2、規(guī)則描述的過程或系統(tǒng)。程或系統(tǒng)。 n神經(jīng)網(wǎng)絡(luò)采用并行分布式信息處理,具有很強(qiáng)的容神經(jīng)網(wǎng)絡(luò)采用并行分布式信息處理,具有很強(qiáng)的容錯(cuò)性。錯(cuò)性。 n神經(jīng)網(wǎng)絡(luò)是本質(zhì)的非線性系統(tǒng)。神經(jīng)網(wǎng)絡(luò)是本質(zhì)的非線性系統(tǒng)。 n神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的信息綜合能力。神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的信息綜合能力。 n神經(jīng)網(wǎng)絡(luò)的硬件實(shí)現(xiàn)愈趨方便。神經(jīng)網(wǎng)絡(luò)的硬件實(shí)現(xiàn)愈趨方便。 一、引言一、引言n神經(jīng)網(wǎng)絡(luò)控制器的分類神經(jīng)網(wǎng)絡(luò)控制器的分類n根據(jù)神經(jīng)網(wǎng)絡(luò)在控制系統(tǒng)中的作用不同根據(jù)神經(jīng)網(wǎng)絡(luò)在控制系統(tǒng)中的作用不同,又可分為兩大類,又可分為兩大類n一一是是神經(jīng)控制,它是以神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)而形神經(jīng)控制,它是以神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)而形成的獨(dú)立智能控制系統(tǒng)成的獨(dú)立智能控制
3、系統(tǒng)n二是二是混合神經(jīng)網(wǎng)絡(luò)控制,它代表著那些利用混合神經(jīng)網(wǎng)絡(luò)控制,它代表著那些利用神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)和優(yōu)化能力來改善傳統(tǒng)的控制神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)和優(yōu)化能力來改善傳統(tǒng)的控制方法方法一、引言一、引言n神經(jīng)網(wǎng)絡(luò)控制器的典型分類神經(jīng)網(wǎng)絡(luò)控制器的典型分類n導(dǎo)師指導(dǎo)下的控制器導(dǎo)師指導(dǎo)下的控制器n逆控制器逆控制器 n自適應(yīng)網(wǎng)絡(luò)控制器自適應(yīng)網(wǎng)絡(luò)控制器 n前饋控制結(jié)構(gòu)前饋控制結(jié)構(gòu) n自適應(yīng)評價(jià)網(wǎng)絡(luò)自適應(yīng)評價(jià)網(wǎng)絡(luò) n混合控制系統(tǒng)混合控制系統(tǒng) 一、引言一、引言XUY專家經(jīng)驗(yàn)控制器動(dòng)力學(xué)系統(tǒng)動(dòng)力學(xué)系統(tǒng)神經(jīng)網(wǎng)絡(luò)UYX利用專家經(jīng)驗(yàn)圖3-2-1 導(dǎo)師指導(dǎo)下的神經(jīng)控制結(jié)構(gòu)圖動(dòng)力學(xué)系統(tǒng)神經(jīng)網(wǎng)絡(luò)YYUd動(dòng)力學(xué)系統(tǒng)UYYdF-1Y=FU圖3-
4、2-2 逆控制器的結(jié)構(gòu)圖網(wǎng)絡(luò)控制器N神經(jīng)網(wǎng)絡(luò)N參考模型非線性系統(tǒng)ryecipmceecpyyiu+-圖3-2-3自適應(yīng)網(wǎng)絡(luò)控制結(jié)構(gòu)圖n導(dǎo)師指導(dǎo)下的控制器:導(dǎo)師指導(dǎo)下的控制器:神經(jīng)網(wǎng)絡(luò)控制結(jié)構(gòu)的學(xué)神經(jīng)網(wǎng)絡(luò)控制結(jié)構(gòu)的學(xué)習(xí)樣本直接取自于專家的控制經(jīng)驗(yàn)習(xí)樣本直接取自于專家的控制經(jīng)驗(yàn)。一旦神經(jīng)一旦神經(jīng)網(wǎng)絡(luò)的訓(xùn)練達(dá)到了能夠充分描述人的控制行為網(wǎng)絡(luò)的訓(xùn)練達(dá)到了能夠充分描述人的控制行為時(shí),則網(wǎng)絡(luò)訓(xùn)練結(jié)束時(shí),則網(wǎng)絡(luò)訓(xùn)練結(jié)束一、引言一、引言n逆控制器:逆控制器:如果一個(gè)動(dòng)力學(xué)系統(tǒng)可以用一個(gè)逆如果一個(gè)動(dòng)力學(xué)系統(tǒng)可以用一個(gè)逆動(dòng)力學(xué)函數(shù)來表示,則采用簡單的控制結(jié)構(gòu)和動(dòng)力學(xué)函數(shù)來表示,則采用簡單的控制結(jié)構(gòu)和方式是可能的方
5、式是可能的XUY專家經(jīng)驗(yàn)控制器動(dòng)力學(xué)系統(tǒng)動(dòng)力學(xué)系統(tǒng)神經(jīng)網(wǎng)絡(luò)UYX利用專家經(jīng)驗(yàn)圖3-2-1 導(dǎo)師指導(dǎo)下的神經(jīng)控制結(jié)構(gòu)圖動(dòng)力學(xué)系統(tǒng)神經(jīng)網(wǎng)絡(luò)YYUd動(dòng)力學(xué)系統(tǒng)UYYdF-1Y=FU圖3-2-2 逆控制器的結(jié)構(gòu)圖網(wǎng)絡(luò)控制器N神經(jīng)網(wǎng)絡(luò)N參考模型非線性系統(tǒng)ryecipmceecpyyiu+-圖3-2-3自適應(yīng)網(wǎng)絡(luò)控制結(jié)構(gòu)圖一、引言一、引言n模型參考自適應(yīng)網(wǎng)絡(luò)控制器:模型參考自適應(yīng)網(wǎng)絡(luò)控制器:利用神經(jīng)網(wǎng)絡(luò)將利用神經(jīng)網(wǎng)絡(luò)將線性系統(tǒng)經(jīng)典的自適應(yīng)控制設(shè)計(jì)理論和思想方線性系統(tǒng)經(jīng)典的自適應(yīng)控制設(shè)計(jì)理論和思想方法直接引到非線性系統(tǒng)自適應(yīng)控制系統(tǒng)中來是法直接引到非線性系統(tǒng)自適應(yīng)控制系統(tǒng)中來是可能的可能的XUY專家經(jīng)驗(yàn)控制
6、器動(dòng)力學(xué)系統(tǒng)動(dòng)力學(xué)系統(tǒng)神經(jīng)網(wǎng)絡(luò)UYX利用專家經(jīng)驗(yàn)圖3-2-1 導(dǎo)師指導(dǎo)下的神經(jīng)控制結(jié)構(gòu)圖動(dòng)力學(xué)系統(tǒng)神經(jīng)網(wǎng)絡(luò)YYUd動(dòng)力學(xué)系統(tǒng)UYYdF-1Y=FU圖3-2-2 逆控制器的結(jié)構(gòu)圖網(wǎng)絡(luò)控制器N神經(jīng)網(wǎng)絡(luò)N參考模型非線性系統(tǒng)ryecipmceecpyyiu+-圖3-2-3自適應(yīng)網(wǎng)絡(luò)控制結(jié)構(gòu)圖一、引言一、引言n神經(jīng)內(nèi)模控制結(jié)構(gòu)神經(jīng)內(nèi)??刂平Y(jié)構(gòu):系統(tǒng)的實(shí)際輸出與模型系統(tǒng)的實(shí)際輸出與模型M M的輸出信號差用于反饋的目的。這個(gè)反饋信號的輸出信號差用于反饋的目的。這個(gè)反饋信號通過前向通道上的控制子系統(tǒng)通過前向通道上的控制子系統(tǒng)G G預(yù)處理。通常預(yù)處理。通常G G是一個(gè)濾波器,用于提高系統(tǒng)的魯棒性。系統(tǒng)是一個(gè)濾波
7、器,用于提高系統(tǒng)的魯棒性。系統(tǒng)模型模型M M和控制器和控制器C C可以由神經(jīng)網(wǎng)絡(luò)來實(shí)現(xiàn)可以由神經(jīng)網(wǎng)絡(luò)來實(shí)現(xiàn)一、引言一、引言n前饋控制結(jié)構(gòu):前饋控制結(jié)構(gòu):通常單純的求逆控制結(jié)構(gòu)不能通常單純的求逆控制結(jié)構(gòu)不能很好地起到抗干擾能力,因此結(jié)合反饋控制的很好地起到抗干擾能力,因此結(jié)合反饋控制的思想組成前饋補(bǔ)償器的網(wǎng)絡(luò)控制結(jié)構(gòu)思想組成前饋補(bǔ)償器的網(wǎng)絡(luò)控制結(jié)構(gòu)一、引言一、引言n自適應(yīng)評價(jià)網(wǎng)絡(luò)是由自適應(yīng)評價(jià)網(wǎng)絡(luò)是由Barto,Sutten Barto,Sutten 和和AndersonAnderson在在19831983年提出來的。整個(gè)學(xué)習(xí)系統(tǒng)由一個(gè)相關(guān)的搜索單元和年提出來的。整個(gè)學(xué)習(xí)系統(tǒng)由一個(gè)相關(guān)的搜索單元
8、和一個(gè)自適應(yīng)評價(jià)單元組成,在這個(gè)算法中,相關(guān)搜索一個(gè)自適應(yīng)評價(jià)單元組成,在這個(gè)算法中,相關(guān)搜索單元是作用網(wǎng)絡(luò)。自適應(yīng)評價(jià)單元為評價(jià)網(wǎng)絡(luò)。它不單元是作用網(wǎng)絡(luò)。自適應(yīng)評價(jià)單元為評價(jià)網(wǎng)絡(luò)。它不需要控制系統(tǒng)數(shù)學(xué)模型,只是通過對某一指標(biāo)準(zhǔn)則需要控制系統(tǒng)數(shù)學(xué)模型,只是通過對某一指標(biāo)準(zhǔn)則J J的的處理和分析得到獎(jiǎng)勵(lì)或懲罰信號。處理和分析得到獎(jiǎng)勵(lì)或懲罰信號。一、引言一、引言n神經(jīng)網(wǎng)絡(luò)的逼近能力神經(jīng)網(wǎng)絡(luò)的逼近能力n首先要搞清楚到底什么樣的被控系統(tǒng)可以用神首先要搞清楚到底什么樣的被控系統(tǒng)可以用神經(jīng)網(wǎng)絡(luò)來描述。對于眾多的神經(jīng)網(wǎng)絡(luò)類型來說經(jīng)網(wǎng)絡(luò)來描述。對于眾多的神經(jīng)網(wǎng)絡(luò)類型來說,要得到一個(gè)統(tǒng)一的神經(jīng)網(wǎng)絡(luò)逼近理論是不現(xiàn)
9、,要得到一個(gè)統(tǒng)一的神經(jīng)網(wǎng)絡(luò)逼近理論是不現(xiàn)實(shí)的,況且,還有很多神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的逼近性實(shí)的,況且,還有很多神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的逼近性問題至今尚未得到證明問題至今尚未得到證明n多層前向傳播神經(jīng)網(wǎng)絡(luò)能夠相當(dāng)好地逼近許多多層前向傳播神經(jīng)網(wǎng)絡(luò)能夠相當(dāng)好地逼近許多實(shí)際問題中的非線性函數(shù)。實(shí)際問題中的非線性函數(shù)。n這一節(jié)就要回答這個(gè)問題。這一節(jié)就要回答這個(gè)問題。一、引言一、引言n神經(jīng)網(wǎng)絡(luò)的逼近能力神經(jīng)網(wǎng)絡(luò)的逼近能力n含有兩個(gè)隱含層的前向傳播神經(jīng)網(wǎng)絡(luò),且神經(jīng)元激勵(lì)函數(shù)為單調(diào)的含有兩個(gè)隱含層的前向傳播神經(jīng)網(wǎng)絡(luò),且神經(jīng)元激勵(lì)函數(shù)為單調(diào)的S S型函數(shù),則此神經(jīng)網(wǎng)絡(luò)能夠得到合適的逼近精度型函數(shù),則此神經(jīng)網(wǎng)絡(luò)能夠得到合適的逼近精
10、度n對于在緊湊集中的任何平方可積函數(shù)可以通過有限個(gè)隱含神經(jīng)元組對于在緊湊集中的任何平方可積函數(shù)可以通過有限個(gè)隱含神經(jīng)元組成的二層前向傳播神經(jīng)網(wǎng)絡(luò)來逼近,并能達(dá)到任意逼近精度??紤]成的二層前向傳播神經(jīng)網(wǎng)絡(luò)來逼近,并能達(dá)到任意逼近精度。考慮具有單個(gè)隱含層的前向傳播神經(jīng)網(wǎng)絡(luò),其輸出屬于集合:具有單個(gè)隱含層的前向傳播神經(jīng)網(wǎng)絡(luò),其輸出屬于集合:n n其中:其中:x x表示表示n n維輸入矢量,維輸入矢量, =(1,xT)T; =(1,xT)T;n vj vj 表示隱含層第表示隱含層第j j個(gè)神經(jīng)元到輸出層的權(quán)值;個(gè)神經(jīng)元到輸出層的權(quán)值;n wj wj 表示輸入矢量到隱含層第表示輸入矢量到隱含層第j j個(gè)
11、神經(jīng)元的權(quán)值矢量個(gè)神經(jīng)元的權(quán)值矢量n j=1,2,.,q j=1,2,.,q; q q為隱含層神經(jīng)元個(gè)數(shù);為隱含層神經(jīng)元個(gè)數(shù);n ( () )為隱含層神經(jīng)元特性。為隱含層神經(jīng)元特性。一、引言一、引言n神經(jīng)網(wǎng)絡(luò)的逼近能力神經(jīng)網(wǎng)絡(luò)的逼近能力n定義定義5-15-1: S: S型函數(shù)型函數(shù)如果函數(shù)如果函數(shù)( () ):R R0 0,1 1是非遞減函是非遞減函數(shù),且滿足數(shù),且滿足n則稱函數(shù)則稱函數(shù)( () )為為 S S型函數(shù)。型函數(shù)。n定義定義5-25-2: : 距離函數(shù)距離函數(shù)- -給定的函數(shù)空間給定的函數(shù)空間S S,設(shè),設(shè)f,g,hf,g,hS S。則距離。則距離函數(shù)函數(shù)滿足以下條件:滿足以下條件
12、:n . . 正定性正定性(f,g)(f,g)0 0,且僅當(dāng),且僅當(dāng) f=g f=g 時(shí)等號成立;時(shí)等號成立;n . . 對稱性對稱性(f,g)=(f,g)=(g(g,f)f);n . . 三角不等式關(guān)系三角不等式關(guān)系(f,g)(f,g)(f,h)+(f,h)+(h,g)(h,g)。n定義定義5-35-3: : - -稠密稠密 - - 一個(gè)度量空間(一個(gè)度量空間(X X,)中的子集)中的子集S S稱為是稱為是在子集在子集T T上的上的 - -稠密,只有當(dāng)對于任意一個(gè)給定的稠密,只有當(dāng)對于任意一個(gè)給定的00,對所,對所有的有的t tT T,存在一個(gè),存在一個(gè)s sS S,有,有 (s,t)(s,
13、t)。一、引言一、引言n神經(jīng)網(wǎng)絡(luò)的逼近能力神經(jīng)網(wǎng)絡(luò)的逼近能力n定理定理5-15-1: : 若神經(jīng)元的激勵(lì)函數(shù)若神經(jīng)元的激勵(lì)函數(shù)( () )是是S-S-型連續(xù)函數(shù)型連續(xù)函數(shù)。那么,。那么,( () )在在C C(U U)中是)中是 - -稠密。稠密。n這個(gè)定理說明,只要是有限空間中的這個(gè)定理說明,只要是有限空間中的連續(xù)函數(shù)連續(xù)函數(shù)g(x),g(x),總總存在具有上述存在具有上述神經(jīng)元特性神經(jīng)元特性( () )的三層網(wǎng)絡(luò)的三層網(wǎng)絡(luò)( () ),使得其使得其輸出函數(shù)輸出函數(shù)f(x)f(x)能夠以任意精度逼近能夠以任意精度逼近g(x)g(x)。n對于非連續(xù)函數(shù)是否也有類似的神經(jīng)網(wǎng)絡(luò)來逼近它呢對于非連續(xù)
14、函數(shù)是否也有類似的神經(jīng)網(wǎng)絡(luò)來逼近它呢?如果能夠?qū)崿F(xiàn)這樣的逼近,則非連續(xù)函數(shù)?如果能夠?qū)崿F(xiàn)這樣的逼近,則非連續(xù)函數(shù)g(x)g(x)應(yīng)該應(yīng)該滿足什么樣的條件?滿足什么樣的條件?HornikHornik等人在等人在19891989年發(fā)表論文中年發(fā)表論文中闡明了多層前向傳播神經(jīng)網(wǎng)絡(luò)可以逼近任意連續(xù)函數(shù)闡明了多層前向傳播神經(jīng)網(wǎng)絡(luò)可以逼近任意連續(xù)函數(shù)或分段連續(xù)函數(shù)或分段連續(xù)函數(shù)一、引言一、引言16 引言引言1234 非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)5 神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)n系統(tǒng)建模是神經(jīng)網(wǎng)絡(luò)的最早應(yīng)用。系統(tǒng)建模是神經(jīng)網(wǎng)
15、絡(luò)的最早應(yīng)用。n什么叫系統(tǒng)辨識(shí)?什么叫系統(tǒng)辨識(shí)?nL.A.ZadchL.A.Zadch曾經(jīng)下過這樣的定義:曾經(jīng)下過這樣的定義:“辨識(shí)是在輸入和輸辨識(shí)是在輸入和輸出數(shù)據(jù)的基礎(chǔ)上,從一組給定的模型中,確定一個(gè)與出數(shù)據(jù)的基礎(chǔ)上,從一組給定的模型中,確定一個(gè)與所測系統(tǒng)等價(jià)的模型所測系統(tǒng)等價(jià)的模型”。n使用非線性系統(tǒng)的輸入輸出數(shù)據(jù)來訓(xùn)練神經(jīng)網(wǎng)絡(luò)可認(rèn)使用非線性系統(tǒng)的輸入輸出數(shù)據(jù)來訓(xùn)練神經(jīng)網(wǎng)絡(luò)可認(rèn)為是非線性函數(shù)的逼近問題。為是非線性函數(shù)的逼近問題。 n多層前向傳播網(wǎng)絡(luò)能夠逼近任意多層前向傳播網(wǎng)絡(luò)能夠逼近任意L2L2非線性函數(shù)。非線性函數(shù)。 二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)n系
16、統(tǒng)辨識(shí)的三要素:系統(tǒng)辨識(shí)的三要素:n模型的選擇模型的選擇 n輸入信號的選擇輸入信號的選擇 n誤差準(zhǔn)則的選擇誤差準(zhǔn)則的選擇 二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)n系統(tǒng)辨識(shí)的三要素:系統(tǒng)辨識(shí)的三要素:n模型的選擇模型的選擇n神經(jīng)網(wǎng)絡(luò)用于系統(tǒng)辨識(shí)的實(shí)質(zhì)就是選擇適當(dāng)?shù)纳窠?jīng)神經(jīng)網(wǎng)絡(luò)用于系統(tǒng)辨識(shí)的實(shí)質(zhì)就是選擇適當(dāng)?shù)纳窠?jīng)網(wǎng)絡(luò)模型來逼近實(shí)際系統(tǒng),即網(wǎng)絡(luò)模型來逼近實(shí)際系統(tǒng),即 為神經(jīng)網(wǎng)絡(luò)模型類為神經(jīng)網(wǎng)絡(luò)模型類, 為一神經(jīng)網(wǎng)絡(luò)。考慮到多層前向傳播網(wǎng)絡(luò)為一神經(jīng)網(wǎng)絡(luò)??紤]到多層前向傳播網(wǎng)絡(luò)具備良好的學(xué)習(xí)算法,本章我們選擇多層前向傳播具備良好的學(xué)習(xí)算法,本章我們選擇多層前向傳播網(wǎng)絡(luò)為模型類網(wǎng)
17、絡(luò)為模型類 , 為一能充分逼近實(shí)際系統(tǒng)而又為一能充分逼近實(shí)際系統(tǒng)而又不過分復(fù)雜的多層網(wǎng)絡(luò)。不過分復(fù)雜的多層網(wǎng)絡(luò)。 二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)n系統(tǒng)辨識(shí)的三要素:系統(tǒng)辨識(shí)的三要素:n輸入信號的選擇輸入信號的選擇 n從時(shí)域上來看,要求系統(tǒng)的動(dòng)態(tài)過程在辨識(shí)時(shí)間從時(shí)域上來看,要求系統(tǒng)的動(dòng)態(tài)過程在辨識(shí)時(shí)間內(nèi)必須被輸入信號持續(xù)激勵(lì),即輸入信號必須充內(nèi)必須被輸入信號持續(xù)激勵(lì),即輸入信號必須充分激勵(lì)系統(tǒng)的所有模態(tài);分激勵(lì)系統(tǒng)的所有模態(tài);n從頻域來看,要求輸入信號的頻譜必須足以覆蓋從頻域來看,要求輸入信號的頻譜必須足以覆蓋系統(tǒng)的頻譜系統(tǒng)的頻譜二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)
18、二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)n系統(tǒng)辨識(shí)的三要素:系統(tǒng)辨識(shí)的三要素:n誤差準(zhǔn)則的選擇誤差準(zhǔn)則的選擇 n誤差準(zhǔn)則是用來衡量模型接近實(shí)際系統(tǒng)的標(biāo)準(zhǔn),它誤差準(zhǔn)則是用來衡量模型接近實(shí)際系統(tǒng)的標(biāo)準(zhǔn),它通常表示為一個(gè)誤差的泛函通常表示為一個(gè)誤差的泛函E Wf e kk()( ( )f e kek ( )( )2二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)n 一旦三大要素確定以后,神經(jīng)網(wǎng)絡(luò)的辨識(shí)就歸結(jié)為一一旦三大要素確定以后,神經(jīng)網(wǎng)絡(luò)的辨識(shí)就歸結(jié)為一個(gè)最優(yōu)化問題。神經(jīng)網(wǎng)絡(luò)辨識(shí)具有以下五個(gè)特點(diǎn)。個(gè)最優(yōu)化問題。神經(jīng)網(wǎng)絡(luò)辨識(shí)具有以下五個(gè)特點(diǎn)。n(1)(1)不要求建立實(shí)際系統(tǒng)的辨識(shí)格式。不要求
19、建立實(shí)際系統(tǒng)的辨識(shí)格式。n(2)(2)可以對本質(zhì)非線性系統(tǒng)進(jìn)行辨識(shí),而且辨識(shí)是通過在網(wǎng)絡(luò)外可以對本質(zhì)非線性系統(tǒng)進(jìn)行辨識(shí),而且辨識(shí)是通過在網(wǎng)絡(luò)外部擬合系統(tǒng)的輸入部擬合系統(tǒng)的輸入/ /輸出,網(wǎng)絡(luò)內(nèi)部隱含著系統(tǒng)的特性。因此這輸出,網(wǎng)絡(luò)內(nèi)部隱含著系統(tǒng)的特性。因此這種辨識(shí)是由神經(jīng)網(wǎng)絡(luò)本身實(shí)現(xiàn)的,是非算法式的。種辨識(shí)是由神經(jīng)網(wǎng)絡(luò)本身實(shí)現(xiàn)的,是非算法式的。n(3)(3)辨識(shí)的收斂速度不依賴于待辨識(shí)系統(tǒng)的維數(shù),只與神經(jīng)網(wǎng)絡(luò)辨識(shí)的收斂速度不依賴于待辨識(shí)系統(tǒng)的維數(shù),只與神經(jīng)網(wǎng)絡(luò)本身及其所采用的學(xué)習(xí)算法有關(guān),傳統(tǒng)的辨識(shí)方法隨模型參數(shù)維本身及其所采用的學(xué)習(xí)算法有關(guān),傳統(tǒng)的辨識(shí)方法隨模型參數(shù)維數(shù)的增大而變得很復(fù)雜。數(shù)的
20、增大而變得很復(fù)雜。n(4)(4)由于神經(jīng)網(wǎng)絡(luò)具有大量的連接,這些連接之間的權(quán)值在辨識(shí)由于神經(jīng)網(wǎng)絡(luò)具有大量的連接,這些連接之間的權(quán)值在辨識(shí)中對應(yīng)于模型參數(shù),通過調(diào)節(jié)這些權(quán)值使網(wǎng)絡(luò)輸出逼近系統(tǒng)輸出中對應(yīng)于模型參數(shù),通過調(diào)節(jié)這些權(quán)值使網(wǎng)絡(luò)輸出逼近系統(tǒng)輸出n(5) (5) 神經(jīng)網(wǎng)絡(luò)作為實(shí)際系統(tǒng)的辨識(shí)模型,實(shí)際上也是系統(tǒng)的一個(gè)神經(jīng)網(wǎng)絡(luò)作為實(shí)際系統(tǒng)的辨識(shí)模型,實(shí)際上也是系統(tǒng)的一個(gè)物理實(shí)現(xiàn),可以用于在線控制。物理實(shí)現(xiàn),可以用于在線控制。二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)n神經(jīng)網(wǎng)絡(luò)辨識(shí)模型的結(jié)構(gòu)神經(jīng)網(wǎng)絡(luò)辨識(shí)模型的結(jié)構(gòu) n前向建模法前向建模法n逆模型法逆模型法二、非線性動(dòng)態(tài)系統(tǒng)的神
21、經(jīng)網(wǎng)絡(luò)辨識(shí)二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)n前向建模法:利用神經(jīng)網(wǎng)絡(luò)來逼近非線性系統(tǒng)前向建模法:利用神經(jīng)網(wǎng)絡(luò)來逼近非線性系統(tǒng)的前向動(dòng)力學(xué)模型的前向動(dòng)力學(xué)模型 。yN(k+1)=f(y(k),.,y(k-n+1),u(k),.,u(k-m+1) 二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)n逆模型法逆模型法n直接法:直接法:逆向建模是最直接的方法是將系統(tǒng)逆向建模是最直接的方法是將系統(tǒng)輸出作為網(wǎng)絡(luò)的輸入,網(wǎng)絡(luò)輸出與其期望輸輸出作為網(wǎng)絡(luò)的輸入,網(wǎng)絡(luò)輸出與其期望輸出即系統(tǒng)的輸入進(jìn)行比較得到誤差作為此神出即系統(tǒng)的輸入進(jìn)行比較得到誤差作為此神經(jīng)網(wǎng)絡(luò)訓(xùn)練的信號經(jīng)網(wǎng)絡(luò)訓(xùn)練的信號二、非線性動(dòng)
22、態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)n逆模型法存在的問題逆模型法存在的問題n 學(xué)習(xí)過程不一定是目標(biāo)最優(yōu)的學(xué)習(xí)過程不一定是目標(biāo)最優(yōu)的,可以采用,可以采用下圖所示的實(shí)用逆模型法下圖所示的實(shí)用逆模型法n一旦非線性系統(tǒng)對應(yīng)關(guān)系不是一對一的,那一旦非線性系統(tǒng)對應(yīng)關(guān)系不是一對一的,那么不準(zhǔn)確的逆模型可能會(huì)被建立么不準(zhǔn)確的逆模型可能會(huì)被建立二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)n非線性系統(tǒng)的前向建模非線性系統(tǒng)的前向建模n辨識(shí)的兩種結(jié)構(gòu)辨識(shí)的兩種結(jié)構(gòu)n并行結(jié)構(gòu)并行結(jié)構(gòu)n串行結(jié)構(gòu)串行結(jié)構(gòu))1(),.,1(),(),1( ),.,1( ),( ) 1( mkukukunk
23、ykykyNky)1(),.,1(),(),1(),.,1(),() 1( mkukukunkykykyNky串行結(jié)構(gòu)收斂性較好串行結(jié)構(gòu)收斂性較好二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)n對于非線性系統(tǒng):對于非線性系統(tǒng):n其中其中 X(k) X(k)、U(k)U(k)、Y(k)Y(k)分別為分別為n n維、維、p p維、維、m m維狀態(tài)維狀態(tài)矢量序列矢量序列n神經(jīng)網(wǎng)絡(luò)系統(tǒng)辨識(shí)的基本思想是利用神經(jīng)網(wǎng)絡(luò)的非線神經(jīng)網(wǎng)絡(luò)系統(tǒng)辨識(shí)的基本思想是利用神經(jīng)網(wǎng)絡(luò)的非線性映射特性來逼近動(dòng)態(tài)系統(tǒng)的非線性函數(shù)性映射特性來逼近動(dòng)態(tài)系統(tǒng)的非線性函數(shù)和和。如如下圖所示。下圖所示。二、非線性動(dòng)態(tài)系統(tǒng)的
24、神經(jīng)網(wǎng)絡(luò)辨識(shí)二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)n設(shè)系統(tǒng)的輸入空間為設(shè)系統(tǒng)的輸入空間為u,u,輸出空間為輸出空間為g,g,實(shí)際系統(tǒng)可以表實(shí)際系統(tǒng)可以表示為一個(gè)從輸入空間到輸出空間的算子示為一個(gè)從輸入空間到輸出空間的算子P:P:u ug;g;給定給定一個(gè)模型類一個(gè)模型類SMSM,設(shè),設(shè)P PSMSM,則辨識(shí)的目的就是確定一個(gè),則辨識(shí)的目的就是確定一個(gè)SMSM的子集類的子集類 ,使其中存在,使其中存在 ,且,且P P在給定的準(zhǔn)在給定的準(zhǔn)則下,則下, 為為P P的一個(gè)最佳逼近的一個(gè)最佳逼近二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)yyP uP uuNpu ( )( )n討論討論非線
25、性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)的的四種辨識(shí)模型四種辨識(shí)模型nI InIIIInIIIIIInIVIVn其中其中f f、g g分別為非線性函數(shù)。分別為非線性函數(shù)。u(u(k k),y(),y(k k)表示在表示在k k時(shí)刻的時(shí)刻的輸入輸入- -輸出對輸出對二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)n假定:假定:n(1) (1) 線性部分的階次線性部分的階次n n、m m已知;已知;n(2) (2) 系統(tǒng)是穩(wěn)定的,即對于所有給定的有界輸入其輸出響系統(tǒng)是穩(wěn)定的,即對于所有給定的有界輸入其輸出響應(yīng)必定也是有界的。反映在模型應(yīng)必定也是有界的。反映在模型上要求線
26、性部分的特征上要求線性部分的特征多項(xiàng)式多項(xiàng)式 的根應(yīng)全部位于單位圓內(nèi)。的根應(yīng)全部位于單位圓內(nèi)。n(3) (3) 系統(tǒng)是最小相位系統(tǒng),反映在模型系統(tǒng)是最小相位系統(tǒng),反映在模型上要求上要求 的零點(diǎn)全部位于單位圓內(nèi)。的零點(diǎn)全部位于單位圓內(nèi)。n(4) u(k-i),i=0,1,.(4) u(k-i),i=0,1,.與與y(k-j),j=0,1,.y(k-j),j=0,1,.可以量測可以量測二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)n神經(jīng)網(wǎng)絡(luò)的辨識(shí)途徑有二種:神經(jīng)網(wǎng)絡(luò)的辨識(shí)途徑有二種:n線性部分的參數(shù)已知線性部分的參數(shù)已知 可可歸結(jié)為帶時(shí)滯的多層感知網(wǎng)絡(luò)模型的學(xué)習(xí)問題歸結(jié)為帶時(shí)滯的
27、多層感知網(wǎng)絡(luò)模型的學(xué)習(xí)問題,只是,只是導(dǎo)師學(xué)習(xí)信號有所不同。導(dǎo)師學(xué)習(xí)信號有所不同。n線性部分的參數(shù)未知線性部分的參數(shù)未知 可可歸結(jié)為帶時(shí)滯的多層感知網(wǎng)絡(luò)模型的學(xué)習(xí)和線性系歸結(jié)為帶時(shí)滯的多層感知網(wǎng)絡(luò)模型的學(xué)習(xí)和線性系統(tǒng)的參數(shù)估計(jì)問題統(tǒng)的參數(shù)估計(jì)問題。二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)n對于模型對于模型I I、IIIIn如果如果線性部分已知,系統(tǒng)實(shí)際輸出線性部分已知,系統(tǒng)實(shí)際輸出與模型輸出(神經(jīng)網(wǎng)絡(luò)輸出與線性與模型輸出(神經(jīng)網(wǎng)絡(luò)輸出與線性部分輸出之和)的差可以用部分輸出之和)的差可以用BPBP算法算法來來訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型)1(),.,1(),()()
28、1(10mkukukugikykynii)()1(),.,1(),() 1(10ikunkykykyfkymii二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)n對于模型對于模型I I、IIII,如果,如果線性部分線性部分未知。采用改進(jìn)未知。采用改進(jìn)的的BPBP迭代學(xué)習(xí)算法迭代學(xué)習(xí)算法二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)n設(shè)線性部分的未知參數(shù)用矢量設(shè)線性部分的未知參數(shù)用矢量表示,非線性部表示,非線性部分的神經(jīng)網(wǎng)絡(luò)模型參數(shù)用分的神經(jīng)網(wǎng)絡(luò)模型參數(shù)用W W陣表示陣表示n 針對模型I二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)n由于線性模
29、型和非線性模型的期望輸出由于線性模型和非線性模型的期望輸出Z(l+1)Z(l+1)和和t tpjpj 在這里都是未知的,已知的只是兩個(gè)模型的在這里都是未知的,已知的只是兩個(gè)模型的輸出之和。而它們的期望值應(yīng)該是系統(tǒng)在當(dāng)前時(shí)輸出之和。而它們的期望值應(yīng)該是系統(tǒng)在當(dāng)前時(shí)刻刻k+1k+1的實(shí)際輸出矢量的實(shí)際輸出矢量y(k+1)y(k+1)值。因此在實(shí)際對值。因此在實(shí)際對如上算法進(jìn)行計(jì)算時(shí)可交替使用如上算法進(jìn)行計(jì)算時(shí)可交替使用y(k+1)-yy(k+1)-y2 2(k+1)(k+1)和和y(k+1)-yy(k+1)-y1 1(k+1)(k+1)去近似地代替去近似地代替Z(k+1)Z(k+1)和和t tpj
30、pj n 在初始條件完全未知的情況下可以取:在初始條件完全未知的情況下可以?。簄 n其中其中為比較大的數(shù)字。為比較大的數(shù)字。二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)n舉例舉例 5-15-1n考慮以下模型:考慮以下模型:y(k+1y(k+1)=ay(k)+by(k-1)+g(u) =ay(k)+by(k-1)+g(u) 其中其中a=0.3, b=0.6a=0.3, b=0.6 g(u)=u g(u)=u3 3+0.3u+0.3u2 2-0.4u-0.4un試辨識(shí)該系統(tǒng)試辨識(shí)該系統(tǒng)二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)n解:線性部分,采用遞推最小二
31、乘學(xué)習(xí)法解:線性部分,采用遞推最小二乘學(xué)習(xí)法n非線性部分采用前向傳播多層神經(jīng)網(wǎng)絡(luò)來逼近非線性部分采用前向傳播多層神經(jīng)網(wǎng)絡(luò)來逼近選擇神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)為選擇神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)為1,8,4,1, 1,8,4,1, )( ) 1() 1()(1()( ) 1( lllZlKllT1)1()() 1() 1()1()() 1(llPllllPlKT)()1() 1() 1(lPllKIlPT00)0( ba100010)0(=0.2, =0 二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)n為了驗(yàn)證辨識(shí)效果,采用校驗(yàn)輸入信號為了驗(yàn)證辨識(shí)效果,采用校驗(yàn)輸入信號 :100.2 , 1 , 01002s
32、in)(kkku二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)n對于對于模型模型,可以用一個(gè),可以用一個(gè)NNNN來逼近,也可以用來逼近,也可以用兩個(gè)兩個(gè)NNNN來逼近。下面考慮第二種情況:來逼近。下面考慮第二種情況:n Nf f 網(wǎng)絡(luò)用來逼近可分離的非線性函數(shù)之一網(wǎng)絡(luò)用來逼近可分離的非線性函數(shù)之一 f()n Ng g 網(wǎng)絡(luò)用來逼近可分離的非線性函數(shù)之二網(wǎng)絡(luò)用來逼近可分離的非線性函數(shù)之二 g()1(),.,1(),()1(),.,1(),() 1(mkukukugnkykykyfky二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)n選指標(biāo)函數(shù)選指標(biāo)函數(shù):n根據(jù)根
33、據(jù)BP算法的推導(dǎo)思路可得廣義誤差為:算法的推導(dǎo)思路可得廣義誤差為:pjLpjpjLpjLpjLpjLpjpjLpjLpjLtoooNettoofNet112111211( )( )( )( )( )( )( )( )()()()pjLpjpjLpjLpjLtoofNet21222( )( )( )( )()()pjrpjrpkrkkjrfNetw1111111( )( )()()()pjrpjrpkrkkjrfNetw2222121( )( )()()()二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)n神經(jīng)網(wǎng)絡(luò)系數(shù)更新公式為:神經(jīng)網(wǎng)絡(luò)系數(shù)更新公式為:n在整個(gè)算法的計(jì)算過程中,
34、交替使用網(wǎng)絡(luò)的實(shí)在整個(gè)算法的計(jì)算過程中,交替使用網(wǎng)絡(luò)的實(shí)際輸出值際輸出值opj1(L)和和o opj2(L),使得廣義誤差信號可,使得廣義誤差信號可以不斷地進(jìn)行計(jì)算和修正,直至最終收斂以不斷地進(jìn)行計(jì)算和修正,直至最終收斂二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)43 引言引言1234 非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)5 神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)n神經(jīng)元控制器的目的在于如何設(shè)計(jì)一個(gè)有效的神經(jīng)元控制器的目的在于如何設(shè)計(jì)一個(gè)有效的神經(jīng)元網(wǎng)絡(luò)去代替?zhèn)鹘y(tǒng)控制器的作用,使得系神經(jīng)元網(wǎng)絡(luò)去代替?zhèn)鹘y(tǒng)控制器
35、的作用,使得系統(tǒng)的輸出跟隨系統(tǒng)的期望輸出。為了達(dá)到這個(gè)統(tǒng)的輸出跟隨系統(tǒng)的期望輸出。為了達(dá)到這個(gè)目的,神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)方法就是尋找一種有效目的,神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)方法就是尋找一種有效的途徑進(jìn)行網(wǎng)絡(luò)連接權(quán)陣或網(wǎng)絡(luò)結(jié)構(gòu)的修改,的途徑進(jìn)行網(wǎng)絡(luò)連接權(quán)陣或網(wǎng)絡(luò)結(jié)構(gòu)的修改,從而使得網(wǎng)絡(luò)控制器輸出的控制信號能夠保證從而使得網(wǎng)絡(luò)控制器輸出的控制信號能夠保證系統(tǒng)輸出跟隨系統(tǒng)的期望輸出。系統(tǒng)輸出跟隨系統(tǒng)的期望輸出。 三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制n學(xué)習(xí)機(jī)制分為:學(xué)習(xí)機(jī)制分為:n監(jiān)督式學(xué)習(xí)(有導(dǎo)師指導(dǎo)下的控制網(wǎng)絡(luò)學(xué)習(xí)監(jiān)督式學(xué)習(xí)(有導(dǎo)師指導(dǎo)下的控制網(wǎng)絡(luò)學(xué)習(xí) )n離線學(xué)習(xí)法離線學(xué)習(xí)法n在線學(xué)習(xí)法在線學(xué)習(xí)法
36、n反饋誤差學(xué)習(xí)法反饋誤差學(xué)習(xí)法n多網(wǎng)絡(luò)學(xué)習(xí)法多網(wǎng)絡(luò)學(xué)習(xí)法n增強(qiáng)式學(xué)習(xí)(通過某一評價(jià)函數(shù)指定下的學(xué)習(xí))增強(qiáng)式學(xué)習(xí)(通過某一評價(jià)函數(shù)指定下的學(xué)習(xí)) 三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制n1 1、離線學(xué)習(xí)法、離線學(xué)習(xí)法 適合靜態(tài)環(huán)境,適合靜態(tài)環(huán)境,網(wǎng)絡(luò)離線訓(xùn)練中選擇的性能指標(biāo)為網(wǎng)絡(luò)離線訓(xùn)練中選擇的性能指標(biāo)為u-uu-uc的平方誤差極小,這一指標(biāo)并不能保證系統(tǒng)的最終性能的平方誤差極小,這一指標(biāo)并不能保證系統(tǒng)的最終性能y yd-y-y的平方誤差極小的平方誤差極小三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制2 2、在線學(xué)習(xí)法:、在線學(xué)習(xí)法: 找出一個(gè)最優(yōu)控制量找出一個(gè)最優(yōu)控制量u
37、u使得系統(tǒng)輸出使得系統(tǒng)輸出y y趨于期望趨于期望輸出輸出y yd。權(quán)陣的調(diào)整應(yīng)該使得。權(quán)陣的調(diào)整應(yīng)該使得y yd-y-y的誤差減少最快的誤差減少最快適合模型已知的動(dòng)態(tài)環(huán)境適合模型已知的動(dòng)態(tài)環(huán)境三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制n學(xué)習(xí)算法:學(xué)習(xí)算法:n采用最速下降法采用最速下降法 wkwkEwwkyky ky kwkwkyky ky ku ku kwkjijipjijidjijidji()( )( )( )( )( )( )( )( )( )( )( )( )( )1假設(shè)系統(tǒng)的假設(shè)系統(tǒng)的Jacobian矩陣已知矩陣已知三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制n3 3
38、、反饋誤差學(xué)習(xí)法 適用于非線性系統(tǒng)線性絕對占優(yōu)條件下的網(wǎng)絡(luò)學(xué)習(xí)適用于非線性系統(tǒng)線性絕對占優(yōu)條件下的網(wǎng)絡(luò)學(xué)習(xí) 三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制n4 4、多神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)法(兩種)三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制n增強(qiáng)式學(xué)習(xí)增強(qiáng)式學(xué)習(xí)n當(dāng)某些被控系統(tǒng)的導(dǎo)師信號無法得到當(dāng)某些被控系統(tǒng)的導(dǎo)師信號無法得到時(shí),期時(shí),期望輸出就沒有了。增強(qiáng)型學(xué)習(xí)就是利用當(dāng)前望輸出就沒有了。增強(qiáng)型學(xué)習(xí)就是利用當(dāng)前控制是否成功來決定下一次控制該如何走的控制是否成功來決定下一次控制該如何走的學(xué)習(xí)方式。學(xué)習(xí)方式。 n修正的辦法是對某一成功的行為進(jìn)行鼓勵(lì),修正的辦法是對某一成功的行為進(jìn)行鼓勵(lì),而
39、對不成功的行為進(jìn)行懲罰。而對不成功的行為進(jìn)行懲罰。 n用神經(jīng)網(wǎng)絡(luò)來實(shí)現(xiàn)時(shí),用神經(jīng)網(wǎng)絡(luò)來實(shí)現(xiàn)時(shí), 則可在權(quán)值空間進(jìn)則可在權(quán)值空間進(jìn)行調(diào)整。行調(diào)整。三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制52 引言引言1234 非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)5 神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)四、神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)四、神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)n神經(jīng)網(wǎng)絡(luò)控制的設(shè)計(jì)方法有四種:神經(jīng)網(wǎng)絡(luò)控制的設(shè)計(jì)方法有四種:n直接逆模型控制法直接逆模型控制法 n直接網(wǎng)絡(luò)控制法直接網(wǎng)絡(luò)控制法n多網(wǎng)絡(luò)自學(xué)習(xí)控制法多網(wǎng)絡(luò)自學(xué)習(xí)控制法n單一神經(jīng)元控制單一神
40、經(jīng)元控制 1 1、直接逆模型控制法:、直接逆模型控制法: 最直觀的一種神經(jīng)網(wǎng)絡(luò)控制器實(shí)現(xiàn)方法,其最直觀的一種神經(jīng)網(wǎng)絡(luò)控制器實(shí)現(xiàn)方法,其基本思想就是假設(shè)被控系統(tǒng)可逆,通過基本思想就是假設(shè)被控系統(tǒng)可逆,通過離線建模離線建模得到系統(tǒng)的逆模型網(wǎng)絡(luò),然后用這一逆網(wǎng)絡(luò)模型得到系統(tǒng)的逆模型網(wǎng)絡(luò),然后用這一逆網(wǎng)絡(luò)模型去直接控制被控對象去直接控制被控對象u(k)y(k+1)u (k)NZZZZ-1-1-n+1-m神經(jīng)網(wǎng)絡(luò)對象+圖3-2-27 直接逆控制的訓(xùn)練結(jié)構(gòu)示意圖Z神經(jīng)網(wǎng)絡(luò)對象u (k)Ny(k+1)y(k+1)d-1-1ZZZ-n+1-m圖3-2-28 直接網(wǎng)絡(luò)逆模型控制的結(jié)構(gòu)示意圖訓(xùn)練結(jié)構(gòu)示意圖訓(xùn)練結(jié)構(gòu)
41、示意圖 四、神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)四、神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)四、神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)四、神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)n考慮如下單輸入單輸出系統(tǒng)考慮如下單輸入單輸出系統(tǒng):ny(k+1)=f(y(k-1),.,y(k-n+1),u(k),.,u(k-m)ny: 系統(tǒng)的輸出變量;系統(tǒng)的輸出變量; nu: 系統(tǒng)的輸入變量;系統(tǒng)的輸入變量;nn:系統(tǒng)的階數(shù);:系統(tǒng)的階數(shù);nm:輸入信號滯后階:輸入信號滯后階nf():任意的線性或非線性函數(shù):任意的線性或非線性函數(shù)n如果已知系統(tǒng)階次如果已知系統(tǒng)階次n、m,并假設(shè)系統(tǒng)可逆,則存在函,并假設(shè)系統(tǒng)可逆,則存在函數(shù)數(shù)g(),有:,有:n u(k)=g(y(k+1),.,y(k
42、-n+1),u(k-1),.,u(k-m)四、神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)四、神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)n若能用一個(gè)多層前向傳播神經(jīng)網(wǎng)絡(luò)來實(shí)現(xiàn),則網(wǎng)絡(luò)的輸若能用一個(gè)多層前向傳播神經(jīng)網(wǎng)絡(luò)來實(shí)現(xiàn),則網(wǎng)絡(luò)的輸入輸出關(guān)系為入輸出關(guān)系為: :n u uN= =(x) (x) n式中:式中:u uN為神經(jīng)網(wǎng)絡(luò)的輸出,它表示訓(xùn)練完成后神經(jīng)網(wǎng)為神經(jīng)網(wǎng)絡(luò)的輸出,它表示訓(xùn)練完成后神經(jīng)網(wǎng)絡(luò)產(chǎn)生的控制作用;絡(luò)產(chǎn)生的控制作用;n 為神經(jīng)網(wǎng)絡(luò)的輸入輸出關(guān)系式,它用來逼近被控為神經(jīng)網(wǎng)絡(luò)的輸入輸出關(guān)系式,它用來逼近被控系統(tǒng)的逆模型函數(shù)系統(tǒng)的逆模型函數(shù)g(g() );n X X為神經(jīng)網(wǎng)絡(luò)的輸入矢量,為神經(jīng)網(wǎng)絡(luò)的輸入矢量, X=y(k+1),
43、y(k),.,y(k-n+1),u(k-1),.,u(k-m)TX=y(k+1),y(k),.,y(k-n+1),u(k-1),.,u(k-m)Tn將神經(jīng)網(wǎng)絡(luò)輸入矢量將神經(jīng)網(wǎng)絡(luò)輸入矢量X X中的中的y(k+1)y(k+1)用期望系統(tǒng)輸出值用期望系統(tǒng)輸出值y yd(k+1)(k+1)去代替就可以通過神經(jīng)網(wǎng)絡(luò)去代替就可以通過神經(jīng)網(wǎng)絡(luò)產(chǎn)生期望的控制量產(chǎn)生期望的控制量u u。即:。即:X=yX=yd(k+1),y(k),.,y(k-n+1),u(k-(k+1),y(k),.,y(k-n+1),u(k-1),.,u(k-m)1),.,u(k-m)Tn直接網(wǎng)絡(luò)控制法直接網(wǎng)絡(luò)控制法: :直接逆模型控制法由于
44、缺乏學(xué)習(xí)機(jī)制直接逆模型控制法由于缺乏學(xué)習(xí)機(jī)制,且在控制器的設(shè)計(jì)中又沒有考慮到系統(tǒng)本身的輸入,且在控制器的設(shè)計(jì)中又沒有考慮到系統(tǒng)本身的輸入輸出狀態(tài),因此,一旦系統(tǒng)運(yùn)行的環(huán)境、參數(shù)發(fā)生變輸出狀態(tài),因此,一旦系統(tǒng)運(yùn)行的環(huán)境、參數(shù)發(fā)生變化時(shí),這類控制器就無法適應(yīng)了化時(shí),這類控制器就無法適應(yīng)了。直接網(wǎng)絡(luò)控制法直接網(wǎng)絡(luò)控制法是在神經(jīng)網(wǎng)絡(luò)的輸入端引入了系統(tǒng)的狀態(tài)信號,并將學(xué)在神經(jīng)網(wǎng)絡(luò)的輸入端引入了系統(tǒng)的狀態(tài)信號,并將學(xué)習(xí)機(jī)制實(shí)時(shí)在線地用于網(wǎng)絡(luò)控制器的調(diào)整和改善習(xí)機(jī)制實(shí)時(shí)在線地用于網(wǎng)絡(luò)控制器的調(diào)整和改善四、神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)四、神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)n以例子來說明設(shè)計(jì)方法:以例子來說明設(shè)計(jì)方法:n考慮被控系統(tǒng)考慮被控系統(tǒng) 假設(shè)動(dòng)力學(xué)逆模型成立假設(shè)動(dòng)力學(xué)逆模型成立 ,即有,即有u(k)=gy(k+1),y(k),y(k-1),y(k-1),u(k-1) u(k)=gy(k+1),y(k),y(k-1),y(k-1),u(k-1) n試用直接網(wǎng)絡(luò)控制法控制。試用直接網(wǎng)絡(luò)控制法控制。y ky k y ky ku ky ku kykyk()( ) () () ()( ()( )()()11211111222四、神經(jīng)網(wǎng)絡(luò)控
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 物理防護(hù)性能測試-洞察及研究
- 納米結(jié)構(gòu)生物學(xué)-洞察及研究
- 代謝途徑協(xié)同進(jìn)化-洞察及研究
- 海水化學(xué)資源利用-洞察及研究
- 城市更新空間治理-洞察及研究
- 柔性顯示封裝設(shè)計(jì)-洞察及研究
- 營養(yǎng)補(bǔ)充恢復(fù)策略-洞察及研究
- 社交網(wǎng)絡(luò)憶力-洞察及研究
- 展會(huì)品牌塑造-洞察及研究
- 生物醫(yī)藥股東合作協(xié)議書規(guī)范范本
- 2025年護(hù)士執(zhí)業(yè)資格考試題庫(老年護(hù)理學(xué))歷年真題與模擬試題匯編
- 網(wǎng)絡(luò)內(nèi)容運(yùn)營的策略與方法
- 第三方支付AI應(yīng)用企業(yè)制定與實(shí)施新質(zhì)生產(chǎn)力戰(zhàn)略研究報(bào)告
- 高考期間走讀學(xué)生安全協(xié)議書
- 成人重癥患者顱內(nèi)壓增高防控護(hù)理專家共識(shí)(2024版)解讀
- 大型醫(yī)療設(shè)備培訓(xùn)
- 2024年四川樂山中考滿分作文《有幸被照亮亦想成為光》
- 電氣CAD項(xiàng)目化教程 課件全套 萬勝前 0.1 說課 CAD- 5 電氣平面布置圖的繪制與識(shí)圖
- AI在市場營銷的智能推廣策略
- 2025年1月國家開放大學(xué)漢語言本科《古代小說戲曲專題》期末紙質(zhì)考試試題及答案
- 2025年廣東省中考物理模擬試卷一(含答案)
評論
0/150
提交評論