智能控制技術(shù)(第6章-神經(jīng)網(wǎng)絡(luò)控制)課件_第1頁
智能控制技術(shù)(第6章-神經(jīng)網(wǎng)絡(luò)控制)課件_第2頁
智能控制技術(shù)(第6章-神經(jīng)網(wǎng)絡(luò)控制)課件_第3頁
智能控制技術(shù)(第6章-神經(jīng)網(wǎng)絡(luò)控制)課件_第4頁
智能控制技術(shù)(第6章-神經(jīng)網(wǎng)絡(luò)控制)課件_第5頁
已閱讀5頁,還剩36頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、神經(jīng)網(wǎng)絡(luò)控制2神經(jīng)網(wǎng)絡(luò)辨識基礎(chǔ) 所謂系統(tǒng)辨識,就是根據(jù)系統(tǒng)的輸入和輸出數(shù)據(jù),在指定的一類系統(tǒng)中選擇一個(gè)系統(tǒng),這個(gè)系統(tǒng)和所研究的實(shí)際系統(tǒng)等價(jià)。6.2 神經(jīng)網(wǎng)絡(luò)辨識由于實(shí)際上不可能找到一個(gè)與實(shí)際系統(tǒng)完全等價(jià)的模型。因此,從實(shí)用角度看,辨識就是從一組模型中選擇一個(gè)模型,按照某種準(zhǔn)則,使之能最好的擬合所關(guān)心的實(shí)際系統(tǒng)動(dòng)態(tài)或靜態(tài)特性。36.3 神經(jīng)網(wǎng)絡(luò)辨識神經(jīng)網(wǎng)絡(luò)對非線性函數(shù)具有任意逼近和自學(xué)習(xí)能力,為系統(tǒng)的辨識,尤其是非線性動(dòng)態(tài)系統(tǒng)的辨識提供了一條十分有效的途徑。 神經(jīng)網(wǎng)絡(luò)系統(tǒng)辨識實(shí)質(zhì)上是從神經(jīng)網(wǎng)絡(luò)模型中選擇一個(gè)適當(dāng)?shù)哪P蛠肀平鼘?shí)際系統(tǒng)的數(shù)學(xué)模型。 神經(jīng)網(wǎng)絡(luò)系統(tǒng)通過直接學(xué)習(xí)輸入輸出數(shù)據(jù),使所要求的誤差

2、函數(shù)達(dá)到最小,來歸納出隱含在系統(tǒng)的輸入輸出數(shù)據(jù)中的關(guān)系。46.3 神經(jīng)網(wǎng)絡(luò)辨識逼近理論是一種經(jīng)典的數(shù)學(xué)方法。多項(xiàng)式函數(shù)和其它逼近方法都可以逼近任意的非線性函數(shù)。但由于其學(xué)習(xí)能力和并行處理能力不及神經(jīng)網(wǎng)絡(luò),從而使得神經(jīng)網(wǎng)絡(luò)的逼近理論研究得到迅速發(fā)展。 56.3 神經(jīng)網(wǎng)絡(luò)辨識神經(jīng)網(wǎng)絡(luò)系統(tǒng)辨識的原理 在神經(jīng)網(wǎng)絡(luò)系統(tǒng)辨識中,神經(jīng)網(wǎng)絡(luò)用作辨識模型,將對象的輸入輸出狀態(tài)u、y看作神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本數(shù)據(jù),以J=e2/2作為網(wǎng)絡(luò)訓(xùn)練的目標(biāo),則通過用一定的訓(xùn)練算法來訓(xùn)練網(wǎng)絡(luò),使J足夠小,就可以達(dá)到辨識對象模型的目的。 系統(tǒng)辨識的原理系統(tǒng)辨識的原理:給對象和辨識模型施加相同的輸入,得到對象的輸出y和模型的輸出 ,

3、通過調(diào)整辨識模型的結(jié)構(gòu)來使對象的輸出y和模型的輸出 之間的誤差最小。 76.3 神經(jīng)網(wǎng)絡(luò)辨識輸入信號的選擇 為了能夠精確有效的對未知系統(tǒng)進(jìn)行辨識,輸入信號必須滿足一定的條件。從時(shí)域上來看,要求系統(tǒng)的動(dòng)態(tài)過程在辨識時(shí)間內(nèi)必須被輸入信號持續(xù)激勵(lì),即輸入信號必須充分激勵(lì)系統(tǒng)的所有模態(tài);從頻域來看,要求輸入信號的頻譜必須足以覆蓋系統(tǒng)的頻譜。通常在神經(jīng)網(wǎng)絡(luò)辨識中可選用白噪聲或偽隨機(jī)信號作為系統(tǒng)的輸入信號。對于實(shí)際運(yùn)行系統(tǒng)而言,選擇測試信號需考慮對系統(tǒng)安全運(yùn)行的影響。86.3 神經(jīng)網(wǎng)絡(luò)辨識3. 誤差準(zhǔn)則的選擇 誤差準(zhǔn)則是用來衡量模型接近實(shí)際系統(tǒng)的標(biāo)準(zhǔn)。它通常表示為一個(gè)誤差的泛函,記作其中 是誤差適量e(k

4、)的函數(shù),用得最多的是平方函數(shù),即這里的誤差e(k)是廣義誤差,即既可以表示輸出誤差又可以表示輸入誤差甚至是兩種誤差函數(shù)的合成。6.3 神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制 構(gòu)造一個(gè)參考模型,使其輸出為期望輸出,控制的目的是使y跟蹤r。神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制構(gòu)造一個(gè)參考模型,使其輸出為期望輸出,控制的目的,是使y跟蹤r。對象特性非線性、不確定、不確知時(shí)采用。 神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制3.4.1 基于BP神經(jīng)網(wǎng)絡(luò)控制參數(shù)自學(xué)習(xí)PID控制 BP神經(jīng)網(wǎng)絡(luò)具有逼近任意非線性函數(shù)的能力,而且結(jié)構(gòu)和學(xué)習(xí)算法簡單明確。通過神經(jīng)網(wǎng)絡(luò)自身的學(xué)習(xí),可以找到某一最優(yōu)控制律下的P,I,D參數(shù)?;贐P神經(jīng)網(wǎng)絡(luò)的PD控制系統(tǒng)結(jié)構(gòu)如圖所示,控制器由

5、兩個(gè)部分組成:經(jīng)典的PID控制器:直接對被控對象進(jìn)行閉環(huán)控制,并且KP,KI,KD三個(gè)參數(shù)為在線整定;神經(jīng)網(wǎng)絡(luò)NN:根據(jù)系統(tǒng)的運(yùn)行狀態(tài),調(diào)節(jié)PID控制器的參數(shù),以期達(dá)到某種性能指標(biāo)的最優(yōu)化。即使輸出層神經(jīng)元的輸出狀態(tài)對應(yīng)于PID控制器的三個(gè)可調(diào)參數(shù)KP,KI,KD,通過神經(jīng)網(wǎng)絡(luò)的自學(xué)習(xí)、調(diào)整權(quán)系數(shù),從而使其穩(wěn)定狀態(tài)對應(yīng)于某種最優(yōu)控制律下的PID控制器參數(shù)。3.4.2 改進(jìn)型BP神經(jīng)網(wǎng)絡(luò)控制參數(shù)自學(xué)習(xí)PID控制將神經(jīng)網(wǎng)絡(luò)用于控制器的設(shè)計(jì)或直接學(xué)習(xí)計(jì)算控制器的輸出(控制量),一般都要用到系統(tǒng)的預(yù)測輸出值或其變化量來計(jì)算權(quán)系數(shù)的修正量。但實(shí)際上,系統(tǒng)的預(yù)測輸出值是不易直接測得的,通常的做法是建立被控

6、對象的預(yù)測數(shù)學(xué)模型,用該模型所計(jì)算的預(yù)測輸出來取代預(yù)測處的實(shí)測值,以提高控制效果。1采用線性預(yù)測模型的BP神經(jīng)網(wǎng)絡(luò)PID控制器 采用線性預(yù)測模型的BP神經(jīng)網(wǎng)絡(luò)PID控制系統(tǒng)算法歸納如下: 1). 事先選定BP神經(jīng)網(wǎng)絡(luò)NN的結(jié)構(gòu),即選定輸入層節(jié)點(diǎn)數(shù)M和隱含層節(jié)點(diǎn)數(shù)Q,并給出權(quán)系數(shù)的初值w(2)ij(0), w(3)li(0),選定學(xué)習(xí)速率和平滑因子,k=1; 2). 用線性系統(tǒng)辨識法估計(jì)出參數(shù)矢量(k),從而形成一步預(yù)報(bào)模型式; 3). 采樣得到r(k)和y(k),計(jì)算e(k)=z(k)=r(k)-y(k); 4). 對r(i),y(i),u(i-1),e(i)進(jìn)行歸一化處理,作為NN的輸入;

7、5). 前向計(jì)算NN的各層神經(jīng)元的輸入和輸出,NN輸出層的輸出即為PID控制器的三個(gè)可調(diào)參數(shù)KP(k),KI(k),KD(k); 6). 計(jì)算PID控制器的控制輸出u(k),參與控制和計(jì)算; 7).計(jì)算 和 ; 8). 計(jì)算修正輸出層的權(quán)系數(shù)w(3)li(k); 9). 計(jì)算修正隱含層的權(quán)系數(shù)w(2)ij(k); 10). 置k=k+1,返回到“2)”。 2采用非線性預(yù)測模型的BP神經(jīng)網(wǎng)絡(luò)PID控制器基于BP神經(jīng)網(wǎng)絡(luò)的PID控制算法可歸納如下: 1). 事先選定BP神經(jīng)網(wǎng)絡(luò)NN的結(jié)構(gòu),即選定輸入層節(jié)點(diǎn)數(shù)M和隱含層節(jié)點(diǎn)數(shù)Q,并給出權(quán)系數(shù)的初值w(2)ij(0), w(3)li(0),選定學(xué)習(xí)速率

8、和平滑因子,k=1; 2). 采樣得到r(k)和y(k),計(jì)算e(k)=z(k)=r(k)-y(k); 3). 對r(i),y(i),u(i-1),e(i)進(jìn)行歸一化處理,作為NN的輸入; 4). 前向計(jì)算NN的各層神經(jīng)元的輸入和輸出,NN輸出層的輸出即為PID控制器的三個(gè)可調(diào)參數(shù)KP(k),KI(k),KD(k); 5). 計(jì)算PID控制器的控制輸出u(k),參與控制和計(jì)算; 6).前向計(jì)算NNM的各層神經(jīng)元的輸入和輸出,NNM的輸出為 ,計(jì)算修正隱含層和輸出層的權(quán)系數(shù); 7).計(jì)算 ; 8). 計(jì)算修正輸出層的權(quán)系數(shù)w(3)li(k); 9). 計(jì)算修正隱含層的權(quán)系數(shù)w(2)ij(k);

9、10). 置k=k+1,返回到“2)”。單神經(jīng)元自適應(yīng)控制系統(tǒng)結(jié)構(gòu)系統(tǒng)對象:仿真示例系統(tǒng)輸入:MATLAB程序%Single Neural Adaptive Controllerclear all;close all;x=0,0,0;xiteP=0.40;xiteI=0.35;xiteD=0.40;%Adjusting Weight Value by hebb learning algorithmM=4;if M=1 %No Supervised Heb learning algorithm wkp(k)=wkp_1+xiteP*u_1*x(1); %P wki(k)=wki_1+xiteI*

10、u_1*x(2); %I wkd(k)=wkd_1+xiteD*u_1*x(3); %D K=0.06; elseif M=2 %Supervised Delta learning algorithm wkp(k)=wkp_1+xiteP*error(k)*u_1; %P wki(k)=wki_1+xiteI*error(k)*u_1; %I wkd(k)=wkd_1+xiteD*error(k)*u_1; %DK=0.12; elseif M=3 %Supervised Heb learning algorithm wkp(k)=wkp_1+xiteP*error(k)*u_1*x(1);

11、%P wki(k)=wki_1+xiteI*error(k)*u_1*x(2); %I wkd(k)=wkd_1+xiteD*error(k)*u_1*x(3); %D K=0.12; elseif M=4 %Improved Heb learning algorithm wkp(k)=wkp_1+xiteP*error(k)*u_1*(2*error(k)-error_1); wki(k)=wki_1+xiteI*error(k)*u_1*(2*error(k)-error_1); wkd(k)=wkd_1+xiteD*error(k)*u_1*(2*error(k)-error_1); K

12、=0.12; endx(1)=error(k)-error_1; %P x(2)=error(k); %I x(3)=error(k)-2*error_1+error_2; %D wadd(k)=abs(wkp(k)+abs(wki(k)+abs(wkd(k); w11(k)=wkp(k)/wadd(k); w22(k)=wki(k)/wadd(k); w33(k)=wkd(k)/wadd(k); w=w11(k),w22(k),w33(k);u(k)=u_1+K*w*x; %Control lawif u(k)10 u(k)=10; endif u(k)-10 u(k)=-10;enderr

13、or_2=error_1;error_1=error(k); u_3=u_2;u_2=u_1;u_1=u(k);y_3=y_2;y_2=y_1;y_1=yout(k); wkp_1=wkp(k);wkd_1=wkd(k);wki_1=wki(k);endfigure(1);plot(time,rin,b,time,yout,r);xlabel(time(s);ylabel(rin,yout);figure(2);plot(time,error,r);xlabel(time(s);ylabel(error);figure(3);plot(time,u,r);xlabel(time(s);ylabel(u);假設(shè)系統(tǒng)第k + 1 個(gè)采樣時(shí)刻的期望輸出值為d k+ 1, 則變學(xué)習(xí)因子自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制系統(tǒng)考慮到實(shí)際系統(tǒng)的制約, 對控制量u 加了限幅處理, N 1 為一BP 網(wǎng)絡(luò), g 為比例環(huán)節(jié)。如果f 對u 為非線性的, 則g 亦為BP 網(wǎng)絡(luò)。學(xué)習(xí)算法為了對網(wǎng)絡(luò)權(quán)值進(jìn)行在線學(xué)習(xí), 取輸出偏差并定義學(xué)習(xí)誤差式中 為網(wǎng)絡(luò)輸出的對象輸出預(yù)測值, yk+ 1 為對象實(shí)際輸出值。則于是由梯度法得到權(quán)值調(diào)整規(guī)則為如果P 含有純滯后為T d = L T 的滯后環(huán)節(jié)時(shí), 相應(yīng)的權(quán)值調(diào)整規(guī)則為在實(shí)際應(yīng)用中, 可以先估計(jì)一個(gè)滯后時(shí)間。運(yùn)行時(shí),

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論