神經(jīng)網(wǎng)絡(luò)控制論_第1頁
神經(jīng)網(wǎng)絡(luò)控制論_第2頁
神經(jīng)網(wǎng)絡(luò)控制論_第3頁
神經(jīng)網(wǎng)絡(luò)控制論_第4頁
神經(jīng)網(wǎng)絡(luò)控制論_第5頁
已閱讀5頁,還剩61頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第五章神經(jīng)網(wǎng)絡(luò)控制論2

引言1234

非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識5

神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機制神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計由于神經(jīng)網(wǎng)絡(luò)本質(zhì)上是一個大規(guī)模并行分布處理的非線性動力學(xué)系統(tǒng),并在更高層次上體現(xiàn)出一些人腦的智能行為,為智能控制提供了新途徑。神經(jīng)網(wǎng)絡(luò)控制的優(yōu)越性體現(xiàn)在:神經(jīng)網(wǎng)絡(luò)可以處理那些難以用模型或規(guī)則描述的過程或系統(tǒng)。神經(jīng)網(wǎng)絡(luò)采用并行分布式信息處理,具有很強的容錯性。神經(jīng)網(wǎng)絡(luò)是本質(zhì)的非線性系統(tǒng)。神經(jīng)網(wǎng)絡(luò)具有很強的信息綜合能力。神經(jīng)網(wǎng)絡(luò)的硬件實現(xiàn)愈趨方便。一、引言神經(jīng)網(wǎng)絡(luò)控制器的分類根據(jù)神經(jīng)網(wǎng)絡(luò)在控制系統(tǒng)中的作用不同,又可分為兩大類一是神經(jīng)控制,它是以神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)而形成的獨立智能控制系統(tǒng)二是混合神經(jīng)網(wǎng)絡(luò)控制,它代表著那些利用神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)和優(yōu)化能力來改善傳統(tǒng)的控制方法一、引言神經(jīng)網(wǎng)絡(luò)控制器的典型分類導(dǎo)師指導(dǎo)下的控制器逆控制器自適應(yīng)網(wǎng)絡(luò)控制器前饋控制結(jié)構(gòu)自適應(yīng)評價網(wǎng)絡(luò)混合控制系統(tǒng)一、引言導(dǎo)師指導(dǎo)下的控制器:神經(jīng)網(wǎng)絡(luò)控制結(jié)構(gòu)的學(xué)習(xí)樣本直接取自于專家的控制經(jīng)驗。一旦神經(jīng)網(wǎng)絡(luò)的訓(xùn)練達到了能夠充分描述人的控制行為時,則網(wǎng)絡(luò)訓(xùn)練結(jié)束一、引言逆控制器:如果一個動力學(xué)系統(tǒng)可以用一個逆動力學(xué)函數(shù)來表示,則采用簡單的控制結(jié)構(gòu)和方式是可能的一、引言模型參考自適應(yīng)網(wǎng)絡(luò)控制器:利用神經(jīng)網(wǎng)絡(luò)將線性系統(tǒng)經(jīng)典的自適應(yīng)控制設(shè)計理論和思想方法直接引到非線性系統(tǒng)自適應(yīng)控制系統(tǒng)中來是可能的一、引言神經(jīng)內(nèi)??刂平Y(jié)構(gòu):系統(tǒng)的實際輸出與模型M的輸出信號差用于反饋的目的。這個反饋信號通過前向通道上的控制子系統(tǒng)G預(yù)處理。通常G是一個濾波器,用于提高系統(tǒng)的魯棒性。系統(tǒng)模型M和控制器C可以由神經(jīng)網(wǎng)絡(luò)來實現(xiàn)一、引言前饋控制結(jié)構(gòu):通常單純的求逆控制結(jié)構(gòu)不能很好地起到抗干擾能力,因此結(jié)合反饋控制的思想組成前饋補償器的網(wǎng)絡(luò)控制結(jié)構(gòu)一、引言自適應(yīng)評價網(wǎng)絡(luò)是由Barto,Sutten和Anderson在1983年提出來的。整個學(xué)習(xí)系統(tǒng)由一個相關(guān)的搜索單元和一個自適應(yīng)評價單元組成,在這個算法中,相關(guān)搜索單元是作用網(wǎng)絡(luò)。自適應(yīng)評價單元為評價網(wǎng)絡(luò)。它不需要控制系統(tǒng)數(shù)學(xué)模型,只是通過對某一指標(biāo)準(zhǔn)則J的處理和分析得到獎勵或懲罰信號。一、引言神經(jīng)網(wǎng)絡(luò)的逼近能力首先要搞清楚到底什么樣的被控系統(tǒng)可以用神經(jīng)網(wǎng)絡(luò)來描述。對于眾多的神經(jīng)網(wǎng)絡(luò)類型來說,要得到一個統(tǒng)一的神經(jīng)網(wǎng)絡(luò)逼近理論是不現(xiàn)實的,況且,還有很多神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的逼近性問題至今尚未得到證明多層前向傳播神經(jīng)網(wǎng)絡(luò)能夠相當(dāng)好地逼近許多實際問題中的非線性函數(shù)。這一節(jié)就要回答這個問題。一、引言神經(jīng)網(wǎng)絡(luò)的逼近能力含有兩個隱含層的前向傳播神經(jīng)網(wǎng)絡(luò),且神經(jīng)元激勵函數(shù)為單調(diào)的S型函數(shù),則此神經(jīng)網(wǎng)絡(luò)能夠得到合適的逼近精度對于在緊湊集中的任何平方可積函數(shù)可以通過有限個隱含神經(jīng)元組成的二層前向傳播神經(jīng)網(wǎng)絡(luò)來逼近,并能達到任意逼近精度??紤]具有單個隱含層的前向傳播神經(jīng)網(wǎng)絡(luò),其輸出屬于集合:

其中:x表示n維輸入矢量,=(1,xT)T;vj表示隱含層第j個神經(jīng)元到輸出層的權(quán)值;wj表示輸入矢量到隱含層第j個神經(jīng)元的權(quán)值矢量j=1,2,...,q;q為隱含層神經(jīng)元個數(shù);

Ψ(·)為隱含層神經(jīng)元特性。一、引言神經(jīng)網(wǎng)絡(luò)的逼近能力定義5-1:S型函數(shù)如果函數(shù)Ψ(·):R→[0,1]是非遞減函數(shù),且滿足則稱函數(shù)Ψ(·)為S型函數(shù)。定義5-2:距離函數(shù)ρ-給定的函數(shù)空間S,設(shè)f,g,h∈S。則距離函數(shù)ρ滿足以下條件:

①.正定性ρ(f,g)≥0,且僅當(dāng)f=g時等號成立;

②.對稱性ρ(f,g)=ρ(g,f);

③.三角不等式關(guān)系ρ(f,g)≤ρ(f,h)+ρ(h,g)。定義5-3:ρ-稠密-一個度量空間(X,ρ)中的子集S稱為是在子集T上的ρ-稠密,只有當(dāng)對于任意一個給定的ε>0,對所有的t∈T,存在一個s∈S,有ρ(s,t)<ε。一、引言神經(jīng)網(wǎng)絡(luò)的逼近能力定理5-1:若神經(jīng)元的激勵函數(shù)Ψ(·)是S-型連續(xù)函數(shù)。那么,Σ(Ψ)在C(U)中是ρ-稠密。這個定理說明,只要是有限空間中的連續(xù)函數(shù)g(x),總存在具有上述神經(jīng)元特性Ψ(·)的三層網(wǎng)絡(luò)Σ(Ψ),使得其輸出函數(shù)f(x)能夠以任意精度逼近g(x)。對于非連續(xù)函數(shù)是否也有類似的神經(jīng)網(wǎng)絡(luò)來逼近它呢?如果能夠?qū)崿F(xiàn)這樣的逼近,則非連續(xù)函數(shù)g(x)應(yīng)該滿足什么樣的條件?Hornik等人在1989年發(fā)表論文中闡明了多層前向傳播神經(jīng)網(wǎng)絡(luò)可以逼近任意連續(xù)函數(shù)或分段連續(xù)函數(shù)一、引言16

引言1234

非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識5

神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機制神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計系統(tǒng)建模是神經(jīng)網(wǎng)絡(luò)的最早應(yīng)用。什么叫系統(tǒng)辨識?L.A.Zadch曾經(jīng)下過這樣的定義:“辨識是在輸入和輸出數(shù)據(jù)的基礎(chǔ)上,從一組給定的模型中,確定一個與所測系統(tǒng)等價的模型”。使用非線性系統(tǒng)的輸入輸出數(shù)據(jù)來訓(xùn)練神經(jīng)網(wǎng)絡(luò)可認為是非線性函數(shù)的逼近問題。多層前向傳播網(wǎng)絡(luò)能夠逼近任意L2非線性函數(shù)。二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識系統(tǒng)辨識的三要素:模型的選擇輸入信號的選擇誤差準(zhǔn)則的選擇二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識系統(tǒng)辨識的三要素:模型的選擇神經(jīng)網(wǎng)絡(luò)用于系統(tǒng)辨識的實質(zhì)就是選擇適當(dāng)?shù)纳窠?jīng)網(wǎng)絡(luò)模型來逼近實際系統(tǒng),即

為神經(jīng)網(wǎng)絡(luò)模型類,

為一神經(jīng)網(wǎng)絡(luò)。考慮到多層前向傳播網(wǎng)絡(luò)具備良好的學(xué)習(xí)算法,本章我們選擇多層前向傳播網(wǎng)絡(luò)為模型類

為一能充分逼近實際系統(tǒng)而又不過分復(fù)雜的多層網(wǎng)絡(luò)。

二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識系統(tǒng)辨識的三要素:輸入信號的選擇從時域上來看,要求系統(tǒng)的動態(tài)過程在辨識時間內(nèi)必須被輸入信號持續(xù)激勵,即輸入信號必須充分激勵系統(tǒng)的所有模態(tài);從頻域來看,要求輸入信號的頻譜必須足以覆蓋系統(tǒng)的頻譜二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識系統(tǒng)辨識的三要素:誤差準(zhǔn)則的選擇誤差準(zhǔn)則是用來衡量模型接近實際系統(tǒng)的標(biāo)準(zhǔn),它通常表示為一個誤差的泛函二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識一旦三大要素確定以后,神經(jīng)網(wǎng)絡(luò)的辨識就歸結(jié)為一個最優(yōu)化問題。神經(jīng)網(wǎng)絡(luò)辨識具有以下五個特點。(1)不要求建立實際系統(tǒng)的辨識格式。(2)可以對本質(zhì)非線性系統(tǒng)進行辨識,而且辨識是通過在網(wǎng)絡(luò)外部擬合系統(tǒng)的輸入/輸出,網(wǎng)絡(luò)內(nèi)部隱含著系統(tǒng)的特性。因此這種辨識是由神經(jīng)網(wǎng)絡(luò)本身實現(xiàn)的,是非算法式的。(3)辨識的收斂速度不依賴于待辨識系統(tǒng)的維數(shù),只與神經(jīng)網(wǎng)絡(luò)本身及其所采用的學(xué)習(xí)算法有關(guān),傳統(tǒng)的辨識方法隨模型參數(shù)維數(shù)的增大而變得很復(fù)雜。(4)由于神經(jīng)網(wǎng)絡(luò)具有大量的連接,這些連接之間的權(quán)值在辨識中對應(yīng)于模型參數(shù),通過調(diào)節(jié)這些權(quán)值使網(wǎng)絡(luò)輸出逼近系統(tǒng)輸出(5)神經(jīng)網(wǎng)絡(luò)作為實際系統(tǒng)的辨識模型,實際上也是系統(tǒng)的一個物理實現(xiàn),可以用于在線控制。二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識神經(jīng)網(wǎng)絡(luò)辨識模型的結(jié)構(gòu)前向建模法逆模型法二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識前向建模法:利用神經(jīng)網(wǎng)絡(luò)來逼近非線性系統(tǒng)的前向動力學(xué)模型。yN(k+1)=f~(y(k),...,y(k-n+1),u(k),...,u(k-m+1))二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識逆模型法直接法:逆向建模是最直接的方法是將系統(tǒng)輸出作為網(wǎng)絡(luò)的輸入,網(wǎng)絡(luò)輸出與其期望輸出即系統(tǒng)的輸入進行比較得到誤差作為此神經(jīng)網(wǎng)絡(luò)訓(xùn)練的信號二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識逆模型法存在的問題學(xué)習(xí)過程不一定是目標(biāo)最優(yōu)的,可以采用下圖所示的實用逆模型法一旦非線性系統(tǒng)對應(yīng)關(guān)系不是一對一的,那么不準(zhǔn)確的逆模型可能會被建立二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識非線性系統(tǒng)的前向建模辨識的兩種結(jié)構(gòu)并行結(jié)構(gòu)串行結(jié)構(gòu)串行結(jié)構(gòu)收斂性較好二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識對于非線性系統(tǒng):其中X(k)、U(k)、Y(k)分別為n維、p維、m維狀態(tài)矢量序列神經(jīng)網(wǎng)絡(luò)系統(tǒng)辨識的基本思想是利用神經(jīng)網(wǎng)絡(luò)的非線性映射特性來逼近動態(tài)系統(tǒng)的非線性函數(shù)Φ和ψ。如下圖所示。二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識設(shè)系統(tǒng)的輸入空間為Ωu,輸出空間為Ωg,實際系統(tǒng)可以表示為一個從輸入空間到輸出空間的算子P:Ωu→Ωg;給定一個模型類SM,設(shè)P∈SM,則辨識的目的就是確定一個SM的子集類

,使其中存在

,且P在給定的準(zhǔn)則下,

為P的一個最佳逼近二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識討論非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識的四種辨識模型IIIIIIIV其中f、g分別為非線性函數(shù)。[u(k),y(k)]表示在k時刻的輸入-輸出對二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識假定:(1)線性部分的階次n、m已知;(2)系統(tǒng)是穩(wěn)定的,即對于所有給定的有界輸入其輸出響應(yīng)必定也是有界的。反映在模型Ⅰ上要求線性部分的特征多項式

的根應(yīng)全部位于單位圓內(nèi)。(3)系統(tǒng)是最小相位系統(tǒng),反映在模型Ⅱ上要求

的零點全部位于單位圓內(nèi)。(4){u(k-i),i=0,1,...}與{y(k-j),j=0,1,...}可以量測二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識神經(jīng)網(wǎng)絡(luò)的辨識途徑有二種:線性部分的參數(shù)已知

可歸結(jié)為帶時滯的多層感知網(wǎng)絡(luò)模型的學(xué)習(xí)問題,只是導(dǎo)師學(xué)習(xí)信號有所不同。線性部分的參數(shù)未知

可歸結(jié)為帶時滯的多層感知網(wǎng)絡(luò)模型的學(xué)習(xí)和線性系統(tǒng)的參數(shù)估計問題。二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識對于模型I、II如果線性部分已知,系統(tǒng)實際輸出與模型輸出(神經(jīng)網(wǎng)絡(luò)輸出與線性部分輸出之和)的差可以用BP算法來訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識對于模型I、II,如果線性部分未知。采用改進的BP迭代學(xué)習(xí)算法二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識設(shè)線性部分的未知參數(shù)用矢量α表示,非線性部分的神經(jīng)網(wǎng)絡(luò)模型參數(shù)用W陣表示針對模型I二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識由于線性模型和非線性模型的期望輸出Z(l+1)和tpj

在這里都是未知的,已知的只是兩個模型的輸出之和。而它們的期望值應(yīng)該是系統(tǒng)在當(dāng)前時刻k+1的實際輸出矢量y(k+1)值。因此在實際對如上算法進行計算時可交替使用y(k+1)-y2(k+1)和y(k+1)-y1(k+1)去近似地代替Z(k+1)和tpj

在初始條件完全未知的情況下可以?。?/p>

其中ρ為比較大的數(shù)字。二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識舉例5-1考慮以下模型:

y(k+1)=a·y(k)+b·y(k-1)+g(u)

其中a=0.3,b=0.6g(u)=u3+0.3u2-0.4u試辨識該系統(tǒng)二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識解:線性部分,采用遞推最小二乘學(xué)習(xí)法非線性部分采用前向傳播多層神經(jīng)網(wǎng)絡(luò)來逼近 選擇神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)為Π1,8,4,1,η=0.2,β=0

二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識為了驗證辨識效果,采用校驗輸入信號:二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識對于模型Ⅲ,可以用一個NN來逼近,也可以用兩個NN來逼近。下面考慮第二種情況:Nf

網(wǎng)絡(luò)用來逼近可分離的非線性函數(shù)之一

f(·)Ng

網(wǎng)絡(luò)用來逼近可分離的非線性函數(shù)之二

g(·)二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識選指標(biāo)函數(shù):根據(jù)BP算法的推導(dǎo)思路可得廣義誤差為:二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識神經(jīng)網(wǎng)絡(luò)系數(shù)更新公式為:在整個算法的計算過程中,交替使用網(wǎng)絡(luò)的實際輸出值opj1(L)和opj2(L),使得廣義誤差信號可以不斷地進行計算和修正,直至最終收斂二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識43

引言1234

非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識5

神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機制神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計神經(jīng)元控制器的目的在于如何設(shè)計一個有效的神經(jīng)元網(wǎng)絡(luò)去代替?zhèn)鹘y(tǒng)控制器的作用,使得系統(tǒng)的輸出跟隨系統(tǒng)的期望輸出。為了達到這個目的,神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)方法就是尋找一種有效的途徑進行網(wǎng)絡(luò)連接權(quán)陣或網(wǎng)絡(luò)結(jié)構(gòu)的修改,從而使得網(wǎng)絡(luò)控制器輸出的控制信號能夠保證系統(tǒng)輸出跟隨系統(tǒng)的期望輸出。三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機制學(xué)習(xí)機制分為:監(jiān)督式學(xué)習(xí)(有導(dǎo)師指導(dǎo)下的控制網(wǎng)絡(luò)學(xué)習(xí))離線學(xué)習(xí)法在線學(xué)習(xí)法反饋誤差學(xué)習(xí)法多網(wǎng)絡(luò)學(xué)習(xí)法增強式學(xué)習(xí)(通過某一評價函數(shù)指定下的學(xué)習(xí))三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機制1、離線學(xué)習(xí)法適合靜態(tài)環(huán)境,網(wǎng)絡(luò)離線訓(xùn)練中選擇的性能指標(biāo)為u-uc的平方誤差極小,這一指標(biāo)并不能保證系統(tǒng)的最終性能yd-y的平方誤差極小三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機制2、在線學(xué)習(xí)法:

找出一個最優(yōu)控制量u使得系統(tǒng)輸出y趨于期望輸出yd。權(quán)陣的調(diào)整應(yīng)該使得yd-y的誤差減少最快適合模型已知的動態(tài)環(huán)境三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機制學(xué)習(xí)算法:采用最速下降法假設(shè)系統(tǒng)的Jacobian矩陣已知三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機制3、反饋誤差學(xué)習(xí)法適用于非線性系統(tǒng)線性絕對占優(yōu)條件下的網(wǎng)絡(luò)學(xué)習(xí)

三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機制4、多神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)法(兩種)三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機制增強式學(xué)習(xí)當(dāng)某些被控系統(tǒng)的導(dǎo)師信號無法得到時,期望輸出就沒有了。增強型學(xué)習(xí)就是利用當(dāng)前控制是否成功來決定下一次控制該如何走的學(xué)習(xí)方式。修正的辦法是對某一成功的行為進行鼓勵,而對不成功的行為進行懲罰。用神經(jīng)網(wǎng)絡(luò)來實現(xiàn)時,則可在權(quán)值空間進行調(diào)整。三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機制52

引言1234

非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識5

神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機制神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計四、神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計神經(jīng)網(wǎng)絡(luò)控制的設(shè)計方法有四種:直接逆模型控制法直接網(wǎng)絡(luò)控制法多網(wǎng)絡(luò)自學(xué)習(xí)控制法單一神經(jīng)元控制1、直接逆模型控制法:

最直觀的一種神經(jīng)網(wǎng)絡(luò)控制器實現(xiàn)方法,其基本思想就是假設(shè)被控系統(tǒng)可逆,通過離線建模得到系統(tǒng)的逆模型網(wǎng)絡(luò),然后用這一逆網(wǎng)絡(luò)模型去直接控制被控對象訓(xùn)練結(jié)構(gòu)示意圖四、神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計四、神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計考慮如下單輸入單輸出系統(tǒng):y(k+1)=f(y(k-1),...,y(k-n+1),u(k),...,u(k-m))y:系統(tǒng)的輸出變量;u:系統(tǒng)的輸入變量;n:系統(tǒng)的階數(shù);m:輸入信號滯后階f(·):任意的線性或非線性函數(shù)如果已知系統(tǒng)階次n、m,并假設(shè)系統(tǒng)可逆,則存在函數(shù)g(·),有:u(k)=g(y(k+1),...,y(k-n+1),u(k-1),...,u(k-m))四、神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計若能用一個多層前向傳播神經(jīng)網(wǎng)絡(luò)來實現(xiàn),則網(wǎng)絡(luò)的輸入輸出關(guān)系為:uN=Π(x)式中:uN為神經(jīng)網(wǎng)絡(luò)的輸出,它表示訓(xùn)練完成后神經(jīng)網(wǎng)絡(luò)產(chǎn)生的控制作用;

Π為神經(jīng)網(wǎng)絡(luò)的輸入輸出關(guān)系式,它用來逼近被控系統(tǒng)的逆模型函數(shù)g(·);X為神經(jīng)網(wǎng)絡(luò)的輸入矢量,X=[y(k+1),y(k),...,y(k-n+1),u(k-1),...,,u(k-m)]T將神經(jīng)網(wǎng)絡(luò)輸入矢量X中的y(k+1)用期望系統(tǒng)輸出值yd(k+1)去代替就可以通過神經(jīng)網(wǎng)絡(luò)Π產(chǎn)生期望的控制量u。即:X=[yd(k+1),y(k),...,y(k-n+1),u(k-1),...,u(k-m)]T直接網(wǎng)絡(luò)控制法:直接逆模型控制法由于缺乏學(xué)習(xí)機制,且在控制器的設(shè)計中又沒有考慮到系統(tǒng)本身的輸入輸出狀態(tài),因此,一旦系統(tǒng)運行的環(huán)境、參數(shù)發(fā)生變化時,這類控制器就無法適應(yīng)了。直接網(wǎng)絡(luò)控制法是在神經(jīng)網(wǎng)絡(luò)的輸入端引入了系統(tǒng)的狀態(tài)信號,并將學(xué)習(xí)機制實時在線地用于網(wǎng)絡(luò)控制器的調(diào)整和改善四、神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計以例子來說明設(shè)計方法:考慮被控系統(tǒng)假設(shè)動力學(xué)逆模型成立,即有

u(k)=g[y(k+1),y(k),y(k-1),y(k-1)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論