神經(jīng)網(wǎng)絡(luò)控制論

上傳人：q*** IP屬地：湖北上傳時(shí)間：2023-02-04 格式：PPT 頁數(shù)：66 大?。?.12MB 積分：28 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩61頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第五章神經(jīng)網(wǎng)絡(luò)控制論2

引言1234

非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)5

神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)由于神經(jīng)網(wǎng)絡(luò)本質(zhì)上是一個(gè)大規(guī)模并行分布處理的非線性動(dòng)力學(xué)系統(tǒng)，并在更高層次上體現(xiàn)出一些人腦的智能行為，為智能控制提供了新途徑。神經(jīng)網(wǎng)絡(luò)控制的優(yōu)越性體現(xiàn)在：神經(jīng)網(wǎng)絡(luò)可以處理那些難以用模型或規(guī)則描述的過程或系統(tǒng)。神經(jīng)網(wǎng)絡(luò)采用并行分布式信息處理，具有很強(qiáng)的容錯(cuò)性。神經(jīng)網(wǎng)絡(luò)是本質(zhì)的非線性系統(tǒng)。神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的信息綜合能力。神經(jīng)網(wǎng)絡(luò)的硬件實(shí)現(xiàn)愈趨方便。一、引言神經(jīng)網(wǎng)絡(luò)控制器的分類根據(jù)神經(jīng)網(wǎng)絡(luò)在控制系統(tǒng)中的作用不同，又可分為兩大類一是神經(jīng)控制，它是以神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)而形成的獨(dú)立智能控制系統(tǒng)二是混合神經(jīng)網(wǎng)絡(luò)控制，它代表著那些利用神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)和優(yōu)化能力來改善傳統(tǒng)的控制方法一、引言神經(jīng)網(wǎng)絡(luò)控制器的典型分類導(dǎo)師指導(dǎo)下的控制器逆控制器自適應(yīng)網(wǎng)絡(luò)控制器前饋控制結(jié)構(gòu)自適應(yīng)評(píng)價(jià)網(wǎng)絡(luò)混合控制系統(tǒng)一、引言導(dǎo)師指導(dǎo)下的控制器：神經(jīng)網(wǎng)絡(luò)控制結(jié)構(gòu)的學(xué)習(xí)樣本直接取自于專家的控制經(jīng)驗(yàn)。一旦神經(jīng)網(wǎng)絡(luò)的訓(xùn)練達(dá)到了能夠充分描述人的控制行為時(shí)，則網(wǎng)絡(luò)訓(xùn)練結(jié)束一、引言逆控制器：如果一個(gè)動(dòng)力學(xué)系統(tǒng)可以用一個(gè)逆動(dòng)力學(xué)函數(shù)來表示，則采用簡(jiǎn)單的控制結(jié)構(gòu)和方式是可能的一、引言模型參考自適應(yīng)網(wǎng)絡(luò)控制器：利用神經(jīng)網(wǎng)絡(luò)將線性系統(tǒng)經(jīng)典的自適應(yīng)控制設(shè)計(jì)理論和思想方法直接引到非線性系統(tǒng)自適應(yīng)控制系統(tǒng)中來是可能的一、引言神經(jīng)內(nèi)?？刂平Y(jié)構(gòu)：系統(tǒng)的實(shí)際輸出與模型M的輸出信號(hào)差用于反饋的目的。這個(gè)反饋信號(hào)通過前向通道上的控制子系統(tǒng)G預(yù)處理。通常G是一個(gè)濾波器，用于提高系統(tǒng)的魯棒性。系統(tǒng)模型M和控制器C可以由神經(jīng)網(wǎng)絡(luò)來實(shí)現(xiàn)一、引言前饋控制結(jié)構(gòu)：通常單純的求逆控制結(jié)構(gòu)不能很好地起到抗干擾能力，因此結(jié)合反饋控制的思想組成前饋補(bǔ)償器的網(wǎng)絡(luò)控制結(jié)構(gòu)一、引言自適應(yīng)評(píng)價(jià)網(wǎng)絡(luò)是由Barto,Sutten和Anderson在1983年提出來的。整個(gè)學(xué)習(xí)系統(tǒng)由一個(gè)相關(guān)的搜索單元和一個(gè)自適應(yīng)評(píng)價(jià)單元組成，在這個(gè)算法中，相關(guān)搜索單元是作用網(wǎng)絡(luò)。自適應(yīng)評(píng)價(jià)單元為評(píng)價(jià)網(wǎng)絡(luò)。它不需要控制系統(tǒng)數(shù)學(xué)模型，只是通過對(duì)某一指標(biāo)準(zhǔn)則J的處理和分析得到獎(jiǎng)勵(lì)或懲罰信號(hào)。一、引言神經(jīng)網(wǎng)絡(luò)的逼近能力首先要搞清楚到底什么樣的被控系統(tǒng)可以用神經(jīng)網(wǎng)絡(luò)來描述。對(duì)于眾多的神經(jīng)網(wǎng)絡(luò)類型來說，要得到一個(gè)統(tǒng)一的神經(jīng)網(wǎng)絡(luò)逼近理論是不現(xiàn)實(shí)的，況且，還有很多神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的逼近性問題至今尚未得到證明多層前向傳播神經(jīng)網(wǎng)絡(luò)能夠相當(dāng)好地逼近許多實(shí)際問題中的非線性函數(shù)。這一節(jié)就要回答這個(gè)問題。一、引言神經(jīng)網(wǎng)絡(luò)的逼近能力含有兩個(gè)隱含層的前向傳播神經(jīng)網(wǎng)絡(luò)，且神經(jīng)元激勵(lì)函數(shù)為單調(diào)的S型函數(shù)，則此神經(jīng)網(wǎng)絡(luò)能夠得到合適的逼近精度對(duì)于在緊湊集中的任何平方可積函數(shù)可以通過有限個(gè)隱含神經(jīng)元組成的二層前向傳播神經(jīng)網(wǎng)絡(luò)來逼近，并能達(dá)到任意逼近精度?？紤]具有單個(gè)隱含層的前向傳播神經(jīng)網(wǎng)絡(luò)，其輸出屬于集合：

其中：x表示n維輸入矢量，=(1,xT)T;vj表示隱含層第j個(gè)神經(jīng)元到輸出層的權(quán)值；wj表示輸入矢量到隱含層第j個(gè)神經(jīng)元的權(quán)值矢量j=1,2,...,q；q為隱含層神經(jīng)元個(gè)數(shù)；

Ψ(·)為隱含層神經(jīng)元特性。一、引言神經(jīng)網(wǎng)絡(luò)的逼近能力定義5-1:S型函數(shù)如果函數(shù)Ψ(·)：R→［0，1］是非遞減函數(shù)，且滿足則稱函數(shù)Ψ(·)為S型函數(shù)。定義5-2:距離函數(shù)ρ-給定的函數(shù)空間S，設(shè)f,g,h∈S。則距離函數(shù)ρ滿足以下條件：

①.正定性ρ(f,g)≥0，且僅當(dāng)f=g時(shí)等號(hào)成立；

②.對(duì)稱性ρ(f,g)=ρ(g，f)；

③.三角不等式關(guān)系ρ(f,g)≤ρ(f,h)+ρ(h,g)。定義5-3:ρ-稠密-一個(gè)度量空間（X，ρ）中的子集S稱為是在子集T上的ρ-稠密，只有當(dāng)對(duì)于任意一個(gè)給定的ε>0，對(duì)所有的t∈T，存在一個(gè)s∈S，有ρ(s,t)<ε。一、引言神經(jīng)網(wǎng)絡(luò)的逼近能力定理5-1:若神經(jīng)元的激勵(lì)函數(shù)Ψ(·)是S-型連續(xù)函數(shù)。那么，Σ(Ψ)在C（U）中是ρ-稠密。這個(gè)定理說明，只要是有限空間中的連續(xù)函數(shù)g(x),總存在具有上述神經(jīng)元特性Ψ(·)的三層網(wǎng)絡(luò)Σ(Ψ)，使得其輸出函數(shù)f(x)能夠以任意精度逼近g(x)。對(duì)于非連續(xù)函數(shù)是否也有類似的神經(jīng)網(wǎng)絡(luò)來逼近它呢？如果能夠?qū)崿F(xiàn)這樣的逼近，則非連續(xù)函數(shù)g(x)應(yīng)該滿足什么樣的條件？Hornik等人在1989年發(fā)表論文中闡明了多層前向傳播神經(jīng)網(wǎng)絡(luò)可以逼近任意連續(xù)函數(shù)或分段連續(xù)函數(shù)一、引言16

引言1234

非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)5

神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)系統(tǒng)建模是神經(jīng)網(wǎng)絡(luò)的最早應(yīng)用。什么叫系統(tǒng)辨識(shí)？L.A.Zadch曾經(jīng)下過這樣的定義：“辨識(shí)是在輸入和輸出數(shù)據(jù)的基礎(chǔ)上，從一組給定的模型中，確定一個(gè)與所測(cè)系統(tǒng)等價(jià)的模型”。使用非線性系統(tǒng)的輸入輸出數(shù)據(jù)來訓(xùn)練神經(jīng)網(wǎng)絡(luò)可認(rèn)為是非線性函數(shù)的逼近問題。多層前向傳播網(wǎng)絡(luò)能夠逼近任意L2非線性函數(shù)。二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)系統(tǒng)辨識(shí)的三要素：模型的選擇輸入信號(hào)的選擇誤差準(zhǔn)則的選擇二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)系統(tǒng)辨識(shí)的三要素：模型的選擇神經(jīng)網(wǎng)絡(luò)用于系統(tǒng)辨識(shí)的實(shí)質(zhì)就是選擇適當(dāng)?shù)纳窠?jīng)網(wǎng)絡(luò)模型來逼近實(shí)際系統(tǒng)，即

為神經(jīng)網(wǎng)絡(luò)模型類，

∈

為一神經(jīng)網(wǎng)絡(luò)。考慮到多層前向傳播網(wǎng)絡(luò)具備良好的學(xué)習(xí)算法，本章我們選擇多層前向傳播網(wǎng)絡(luò)為模型類

，

為一能充分逼近實(shí)際系統(tǒng)而又不過分復(fù)雜的多層網(wǎng)絡(luò)。

二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)系統(tǒng)辨識(shí)的三要素：輸入信號(hào)的選擇從時(shí)域上來看，要求系統(tǒng)的動(dòng)態(tài)過程在辨識(shí)時(shí)間內(nèi)必須被輸入信號(hào)持續(xù)激勵(lì)，即輸入信號(hào)必須充分激勵(lì)系統(tǒng)的所有模態(tài)；從頻域來看，要求輸入信號(hào)的頻譜必須足以覆蓋系統(tǒng)的頻譜二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)系統(tǒng)辨識(shí)的三要素：誤差準(zhǔn)則的選擇誤差準(zhǔn)則是用來衡量模型接近實(shí)際系統(tǒng)的標(biāo)準(zhǔn)，它通常表示為一個(gè)誤差的泛函二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)一旦三大要素確定以后，神經(jīng)網(wǎng)絡(luò)的辨識(shí)就歸結(jié)為一個(gè)最優(yōu)化問題。神經(jīng)網(wǎng)絡(luò)辨識(shí)具有以下五個(gè)特點(diǎn)。(1)不要求建立實(shí)際系統(tǒng)的辨識(shí)格式。(2)可以對(duì)本質(zhì)非線性系統(tǒng)進(jìn)行辨識(shí)，而且辨識(shí)是通過在網(wǎng)絡(luò)外部擬合系統(tǒng)的輸入/輸出，網(wǎng)絡(luò)內(nèi)部隱含著系統(tǒng)的特性。因此這種辨識(shí)是由神經(jīng)網(wǎng)絡(luò)本身實(shí)現(xiàn)的，是非算法式的。(3)辨識(shí)的收斂速度不依賴于待辨識(shí)系統(tǒng)的維數(shù)，只與神經(jīng)網(wǎng)絡(luò)本身及其所采用的學(xué)習(xí)算法有關(guān)，傳統(tǒng)的辨識(shí)方法隨模型參數(shù)維數(shù)的增大而變得很復(fù)雜。(4)由于神經(jīng)網(wǎng)絡(luò)具有大量的連接，這些連接之間的權(quán)值在辨識(shí)中對(duì)應(yīng)于模型參數(shù)，通過調(diào)節(jié)這些權(quán)值使網(wǎng)絡(luò)輸出逼近系統(tǒng)輸出(5)神經(jīng)網(wǎng)絡(luò)作為實(shí)際系統(tǒng)的辨識(shí)模型，實(shí)際上也是系統(tǒng)的一個(gè)物理實(shí)現(xiàn)，可以用于在線控制。二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)神經(jīng)網(wǎng)絡(luò)辨識(shí)模型的結(jié)構(gòu)前向建模法逆模型法二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)前向建模法：利用神經(jīng)網(wǎng)絡(luò)來逼近非線性系統(tǒng)的前向動(dòng)力學(xué)模型。yN(k+1)=f~(y(k),...,y(k-n+1),u(k),...,u(k-m+1))二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)逆模型法直接法：逆向建模是最直接的方法是將系統(tǒng)輸出作為網(wǎng)絡(luò)的輸入，網(wǎng)絡(luò)輸出與其期望輸出即系統(tǒng)的輸入進(jìn)行比較得到誤差作為此神經(jīng)網(wǎng)絡(luò)訓(xùn)練的信號(hào)二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)逆模型法存在的問題學(xué)習(xí)過程不一定是目標(biāo)最優(yōu)的，可以采用下圖所示的實(shí)用逆模型法一旦非線性系統(tǒng)對(duì)應(yīng)關(guān)系不是一對(duì)一的，那么不準(zhǔn)確的逆模型可能會(huì)被建立二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)非線性系統(tǒng)的前向建模辨識(shí)的兩種結(jié)構(gòu)并行結(jié)構(gòu)串行結(jié)構(gòu)串行結(jié)構(gòu)收斂性較好二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)對(duì)于非線性系統(tǒng)：其中X(k)、U(k)、Y(k)分別為n維、p維、m維狀態(tài)矢量序列神經(jīng)網(wǎng)絡(luò)系統(tǒng)辨識(shí)的基本思想是利用神經(jīng)網(wǎng)絡(luò)的非線性映射特性來逼近動(dòng)態(tài)系統(tǒng)的非線性函數(shù)Φ和ψ。如下圖所示。二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)設(shè)系統(tǒng)的輸入空間為Ωu,輸出空間為Ωg,實(shí)際系統(tǒng)可以表示為一個(gè)從輸入空間到輸出空間的算子P:Ωu→Ωg;給定一個(gè)模型類SM，設(shè)P∈SM，則辨識(shí)的目的就是確定一個(gè)SM的子集類

，使其中存在

，且P在給定的準(zhǔn)則下，

為P的一個(gè)最佳逼近二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)討論非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)的四種辨識(shí)模型IIIIIIIV其中f、g分別為非線性函數(shù)。[u(k),y(k)]表示在k時(shí)刻的輸入-輸出對(duì)二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)假定：(1)線性部分的階次n、m已知；(2)系統(tǒng)是穩(wěn)定的，即對(duì)于所有給定的有界輸入其輸出響應(yīng)必定也是有界的。反映在模型Ⅰ上要求線性部分的特征多項(xiàng)式

的根應(yīng)全部位于單位圓內(nèi)。(3)系統(tǒng)是最小相位系統(tǒng)，反映在模型Ⅱ上要求

的零點(diǎn)全部位于單位圓內(nèi)。(4){u(k-i),i=0,1,...}與{y(k-j),j=0,1,...}可以量測(cè)二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)神經(jīng)網(wǎng)絡(luò)的辨識(shí)途徑有二種：線性部分的參數(shù)已知

可歸結(jié)為帶時(shí)滯的多層感知網(wǎng)絡(luò)模型的學(xué)習(xí)問題，只是導(dǎo)師學(xué)習(xí)信號(hào)有所不同。線性部分的參數(shù)未知

可歸結(jié)為帶時(shí)滯的多層感知網(wǎng)絡(luò)模型的學(xué)習(xí)和線性系統(tǒng)的參數(shù)估計(jì)問題。二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)對(duì)于模型I、II如果線性部分已知，系統(tǒng)實(shí)際輸出與模型輸出（神經(jīng)網(wǎng)絡(luò)輸出與線性部分輸出之和）的差可以用BP算法來訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)對(duì)于模型I、II，如果線性部分未知。采用改進(jìn)的BP迭代學(xué)習(xí)算法二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)設(shè)線性部分的未知參數(shù)用矢量α表示，非線性部分的神經(jīng)網(wǎng)絡(luò)模型參數(shù)用W陣表示針對(duì)模型I二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)由于線性模型和非線性模型的期望輸出Z(l+1)和tpj

在這里都是未知的，已知的只是兩個(gè)模型的輸出之和。而它們的期望值應(yīng)該是系統(tǒng)在當(dāng)前時(shí)刻k+1的實(shí)際輸出矢量y(k+1)值。因此在實(shí)際對(duì)如上算法進(jìn)行計(jì)算時(shí)可交替使用y(k+1)-y2(k+1)和y(k+1)-y1(k+1)去近似地代替Z(k+1)和tpj

在初始條件完全未知的情況下可以?。?/p>

其中ρ為比較大的數(shù)字。二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)舉例5-1考慮以下模型：

y(k+1）=a·y(k)+b·y(k-1)+g(u)

其中a=0.3,b=0.6g(u)=u3+0.3u2-0.4u試辨識(shí)該系統(tǒng)二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)解：線性部分，采用遞推最小二乘學(xué)習(xí)法非線性部分采用前向傳播多層神經(jīng)網(wǎng)絡(luò)來逼近選擇神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)為Π1,8,4,1,η=0.2，β=0

二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)為了驗(yàn)證辨識(shí)效果，采用校驗(yàn)輸入信號(hào)：二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)對(duì)于模型Ⅲ，可以用一個(gè)NN來逼近，也可以用兩個(gè)NN來逼近。下面考慮第二種情況：Nf

網(wǎng)絡(luò)用來逼近可分離的非線性函數(shù)之一

f(·)Ng

網(wǎng)絡(luò)用來逼近可分離的非線性函數(shù)之二

g(·)二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)選指標(biāo)函數(shù)：根據(jù)BP算法的推導(dǎo)思路可得廣義誤差為：二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)神經(jīng)網(wǎng)絡(luò)系數(shù)更新公式為：在整個(gè)算法的計(jì)算過程中，交替使用網(wǎng)絡(luò)的實(shí)際輸出值opj1(L）和opj2(L），使得廣義誤差信號(hào)可以不斷地進(jìn)行計(jì)算和修正，直至最終收斂二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)43

引言1234

非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)5

神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)神經(jīng)元控制器的目的在于如何設(shè)計(jì)一個(gè)有效的神經(jīng)元網(wǎng)絡(luò)去代替?zhèn)鹘y(tǒng)控制器的作用，使得系統(tǒng)的輸出跟隨系統(tǒng)的期望輸出。為了達(dá)到這個(gè)目的，神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)方法就是尋找一種有效的途徑進(jìn)行網(wǎng)絡(luò)連接權(quán)陣或網(wǎng)絡(luò)結(jié)構(gòu)的修改，從而使得網(wǎng)絡(luò)控制器輸出的控制信號(hào)能夠保證系統(tǒng)輸出跟隨系統(tǒng)的期望輸出。三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制學(xué)習(xí)機(jī)制分為：監(jiān)督式學(xué)習(xí)（有導(dǎo)師指導(dǎo)下的控制網(wǎng)絡(luò)學(xué)習(xí)）離線學(xué)習(xí)法在線學(xué)習(xí)法反饋誤差學(xué)習(xí)法多網(wǎng)絡(luò)學(xué)習(xí)法增強(qiáng)式學(xué)習(xí)（通過某一評(píng)價(jià)函數(shù)指定下的學(xué)習(xí)）三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制1、離線學(xué)習(xí)法適合靜態(tài)環(huán)境，網(wǎng)絡(luò)離線訓(xùn)練中選擇的性能指標(biāo)為u-uc的平方誤差極小，這一指標(biāo)并不能保證系統(tǒng)的最終性能yd-y的平方誤差極小三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制2、在線學(xué)習(xí)法：

找出一個(gè)最優(yōu)控制量u使得系統(tǒng)輸出y趨于期望輸出yd。權(quán)陣的調(diào)整應(yīng)該使得yd-y的誤差減少最快適合模型已知的動(dòng)態(tài)環(huán)境三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制學(xué)習(xí)算法：采用最速下降法假設(shè)系統(tǒng)的Jacobian矩陣已知三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制3、反饋誤差學(xué)習(xí)法適用于非線性系統(tǒng)線性絕對(duì)占優(yōu)條件下的網(wǎng)絡(luò)學(xué)習(xí)

三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制4、多神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)法（兩種）三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制增強(qiáng)式學(xué)習(xí)當(dāng)某些被控系統(tǒng)的導(dǎo)師信號(hào)無法得到時(shí)，期望輸出就沒有了。增強(qiáng)型學(xué)習(xí)就是利用當(dāng)前控制是否成功來決定下一次控制該如何走的學(xué)習(xí)方式。修正的辦法是對(duì)某一成功的行為進(jìn)行鼓勵(lì)，而對(duì)不成功的行為進(jìn)行懲罰。用神經(jīng)網(wǎng)絡(luò)來實(shí)現(xiàn)時(shí)，則可在權(quán)值空間進(jìn)行調(diào)整。三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制52

引言1234

非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)5

神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)四、神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)控制的設(shè)計(jì)方法有四種：直接逆模型控制法直接網(wǎng)絡(luò)控制法多網(wǎng)絡(luò)自學(xué)習(xí)控制法單一神經(jīng)元控制1、直接逆模型控制法：

最直觀的一種神經(jīng)網(wǎng)絡(luò)控制器實(shí)現(xiàn)方法，其基本思想就是假設(shè)被控系統(tǒng)可逆，通過離線建模得到系統(tǒng)的逆模型網(wǎng)絡(luò)，然后用這一逆網(wǎng)絡(luò)模型去直接控制被控對(duì)象訓(xùn)練結(jié)構(gòu)示意圖四、神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)四、神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)考慮如下單輸入單輸出系統(tǒng)：y(k+1)=f(y(k-1),...,y(k-n+1),u(k),...,u(k-m))y:系統(tǒng)的輸出變量；u:系統(tǒng)的輸入變量；n：系統(tǒng)的階數(shù)；m：輸入信號(hào)滯后階f(·)：任意的線性或非線性函數(shù)如果已知系統(tǒng)階次n、m，并假設(shè)系統(tǒng)可逆，則存在函數(shù)g(·)，有：u(k)=g(y(k+1),...,y(k-n+1),u(k-1),...,u(k-m))四、神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)若能用一個(gè)多層前向傳播神經(jīng)網(wǎng)絡(luò)來實(shí)現(xiàn)，則網(wǎng)絡(luò)的輸入輸出關(guān)系為:uN=Π(x)式中：uN為神經(jīng)網(wǎng)絡(luò)的輸出，它表示訓(xùn)練完成后神經(jīng)網(wǎng)絡(luò)產(chǎn)生的控制作用；

Π為神經(jīng)網(wǎng)絡(luò)的輸入輸出關(guān)系式，它用來逼近被控系統(tǒng)的逆模型函數(shù)g(·)；X為神經(jīng)網(wǎng)絡(luò)的輸入矢量，X=[y(k+1),y(k),...,y(k-n+1),u(k-1),...,,u(k-m)]T將神經(jīng)網(wǎng)絡(luò)輸入矢量X中的y(k+1)用期望系統(tǒng)輸出值yd(k+1)去代替就可以通過神經(jīng)網(wǎng)絡(luò)Π產(chǎn)生期望的控制量u。即：X=[yd(k+1),y(k),...,y(k-n+1),u(k-1),...,u(k-m)]T直接網(wǎng)絡(luò)控制法:直接逆模型控制法由于缺乏學(xué)習(xí)機(jī)制，且在控制器的設(shè)計(jì)中又沒有考慮到系統(tǒng)本身的輸入輸出狀態(tài)，因此，一旦系統(tǒng)運(yùn)行的環(huán)境、參數(shù)發(fā)生變化時(shí)，這類控制器就無法適應(yīng)了。直接網(wǎng)絡(luò)控制法是在神經(jīng)網(wǎng)絡(luò)的輸入端引入了系統(tǒng)的狀態(tài)信號(hào)，并將學(xué)習(xí)機(jī)制實(shí)時(shí)在線地用于網(wǎng)絡(luò)控制器的調(diào)整和改善四、神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)以例子來說明設(shè)計(jì)方法：考慮被控系統(tǒng)假設(shè)動(dòng)力學(xué)逆模型成立，即有

u(k)=g[y(k+1),y(k),y(k-1),y(k-1)

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

神經(jīng)網(wǎng)絡(luò)控制論

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

神經(jīng)網(wǎng)絡(luò)控制論

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔