神經(jīng)網(wǎng)絡(luò)講義第四章_第1頁
神經(jīng)網(wǎng)絡(luò)講義第四章_第2頁
神經(jīng)網(wǎng)絡(luò)講義第四章_第3頁
神經(jīng)網(wǎng)絡(luò)講義第四章_第4頁
神經(jīng)網(wǎng)絡(luò)講義第四章_第5頁
已閱讀5頁,還剩69頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、神經(jīng)網(wǎng)絡(luò)原理王永驥1神經(jīng)網(wǎng)絡(luò)控制器設(shè)計(jì)4.1 引言4.2 監(jiān)督學(xué)習(xí)NN控制器4.3 NNMRAC(Model-Reference Adaptive Control)4.4 神經(jīng)網(wǎng)絡(luò)自校正控制(NNSTC)4.5 NN直接自適應(yīng)控制4.6 NN-PID控制4.7 NN-Fuzzy控制神經(jīng)網(wǎng)絡(luò)原理王永驥2引言NN在控制器設(shè)計(jì)中的幾條路存在的幾個(gè)問題本章簡介神經(jīng)網(wǎng)絡(luò)原理王永驥3NN控制器幾條路與已有控制結(jié)構(gòu)的結(jié)合,如:NN自適應(yīng)控制(NN MRAC 、NN STR:直接、 間接)、NN-PID、NN-IMC(PC)與已有控制方法的結(jié)合,如:NN-Fuzzy控制、NN-expert控制NN特有的控制器

2、設(shè)計(jì)方法,如:監(jiān)督學(xué)習(xí)控制(SNC)、評(píng)價(jià)學(xué)習(xí)控制器(ACE)、無模型的控制器設(shè)計(jì)方法(單個(gè)元的或網(wǎng)絡(luò)的,即按誤差調(diào)整的)神經(jīng)網(wǎng)絡(luò)原理王永驥4存在的幾個(gè)問題缺乏一種專門適用于控制的動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)(目前方法:靜態(tài)網(wǎng)絡(luò)處理動(dòng)態(tài)問題,不可避免的帶來差分方程定階問題)穩(wěn)定性、魯棒型分析困難神經(jīng)網(wǎng)絡(luò)原理王永驥5本章簡介學(xué)習(xí)控制(監(jiān)督)NN自適應(yīng)(MRAC和STR)NN-PIDNN-無模型控制(單個(gè)神經(jīng)元)NN-Fuzzy(思想)有關(guān)穩(wěn)定性的一些成果神經(jīng)網(wǎng)絡(luò)原理王永驥6監(jiān)督學(xué)習(xí)NN控制器問題的提出SNC設(shè)計(jì): 控制系統(tǒng)結(jié)構(gòu) 思路 實(shí)例神經(jīng)網(wǎng)絡(luò)原理王永驥7問題的提出當(dāng)對(duì)象動(dòng)力學(xué)特性未知時(shí)系統(tǒng)可控,人的知識(shí)如何

3、傳遞給控制裝置?解決思路:利用專家控制、規(guī)則控制采用監(jiān)督(導(dǎo)師)NN控制(SNC)神經(jīng)網(wǎng)絡(luò)原理王永驥8控制系統(tǒng)結(jié)構(gòu)神經(jīng)網(wǎng)絡(luò)原理王永驥9思路弄清人在控制過程中利用了過程或人本身的何種信息構(gòu)造NNC 考慮問題:何種網(wǎng)絡(luò)、結(jié)構(gòu)(層數(shù))參數(shù)、訓(xùn)練方法(實(shí)時(shí)性、收斂性)SNC的訓(xùn)練過程 在人進(jìn)行控制時(shí),將控制信號(hào)及過程收集起來以此為數(shù)據(jù), 訓(xùn)練可以是離線的也可以是在線的,即人一邊控制NNC一邊學(xué)習(xí)。 訓(xùn)練結(jié)束后,網(wǎng)絡(luò)實(shí)現(xiàn)了以參考信號(hào)及以往控制軸上y為網(wǎng)絡(luò)輸入,當(dāng)前控制u為網(wǎng)絡(luò)輸出的I/O映射,即可實(shí)現(xiàn)正確控制。神經(jīng)網(wǎng)絡(luò)原理王永驥10小車倒立擺系統(tǒng)的控制示意圖數(shù)學(xué)model:令 為小車位置、速度、桿角度、

4、角速度 3. NN控制器神經(jīng)網(wǎng)絡(luò)原理王永驥11小車倒立擺 示意圖MxmLj神經(jīng)網(wǎng)絡(luò)原理王永驥12NN控制器為四層BP網(wǎng)4-16-4-1結(jié)構(gòu),S型作用函數(shù)訓(xùn)練用數(shù)據(jù):Ii ,Z 輸出u(k) 輸出值 控制區(qū)間仿真時(shí)用:導(dǎo)師為線性或非線性的控制律 取M=1kg,m=0.1kg, f=5.1kg/s,g=9.81m/ 神經(jīng)網(wǎng)絡(luò)原理王永驥13控制結(jié)果線性控制為狀態(tài)反饋: 訓(xùn)練20000次后NN可實(shí)現(xiàn)線性律 K=11.01,19.68,96.49,35.57非線性:80000次 反饋線性化及解耦變換人控制:40000次 訓(xùn)練結(jié)束后,HSNC比 人本身操作更好 訓(xùn)練后,SNC還可繼續(xù)在線學(xué)習(xí)以 適應(yīng)新的擾

5、動(dòng)、取得新的控制策略樣本、 增強(qiáng)對(duì)系統(tǒng)的全面了解。 神經(jīng)網(wǎng)絡(luò)原理王永驥14問題及思路問題:控制不成功,SNC如何辦思路:引入評(píng)價(jià)學(xué)習(xí)的NNC,由ASE加上ACE構(gòu)成神經(jīng)網(wǎng)絡(luò)原理王永驥15NN-MRACMRAC的思路NN MRAC 1)NN控制器 2)控制框圖 3)例1 4)例2神經(jīng)網(wǎng)絡(luò)原理王永驥16MRAC的思路一般控制系統(tǒng)可包含前饋和反饋控制器兩種(前饋:由期望輸出產(chǎn)生控制信號(hào),反饋:由期望與實(shí)際之差產(chǎn)生控制信號(hào)) MRAC思路是給定期望響應(yīng)的動(dòng)態(tài)模型, 利用期望與實(shí)際輸出之差去改變調(diào)節(jié)器參數(shù),使對(duì)象+控制器形成的閉環(huán)系統(tǒng)對(duì)給定信號(hào)的響應(yīng)與參考模型一致。當(dāng)給定模型穩(wěn)定時(shí),閉環(huán)系統(tǒng)穩(wěn)定并改善了

6、動(dòng)態(tài)響應(yīng)。 調(diào)節(jié)機(jī)構(gòu)設(shè)計(jì):可利用Lyapunov或Popov方法以保證閉環(huán)的穩(wěn)定神經(jīng)網(wǎng)絡(luò)原理王永驥17一般控制系統(tǒng)框圖前饋控制器反饋控制器對(duì)象神經(jīng)網(wǎng)絡(luò)原理王永驥18NN控制器辨識(shí)+在線控制器設(shè)計(jì)(泛化學(xué)習(xí)),間接控制誤差直接改變控制器參數(shù)(特定學(xué)習(xí)),直接控制 泛化學(xué)習(xí)+自適應(yīng) NN MRAC神經(jīng)網(wǎng)絡(luò)原理王永驥19MRAC控制系統(tǒng)參考模型調(diào)整機(jī)構(gòu)對(duì)象P控制器Cymyu(t)神經(jīng)網(wǎng)絡(luò)原理王永驥20NN-MRAC框圖參考模型神經(jīng)網(wǎng)絡(luò)NNITDLTDLTDLTDL非線性對(duì)象神經(jīng)網(wǎng)絡(luò)NNCtext1-Z+-+ceupymypyIer神經(jīng)網(wǎng)絡(luò)原理王永驥21NNI-辨別器 NNC-控制器 NNI-對(duì)象辨識(shí)

7、,目的、預(yù)報(bào)對(duì)象輸出做法:準(zhǔn)則:NNC-使 為小數(shù) 準(zhǔn)則: 控制周期 辨識(shí)周期 按常規(guī)自適應(yīng)方法選取 神經(jīng)網(wǎng)絡(luò)原理王永驥22例1系統(tǒng) NNI:BP網(wǎng) 2-20-10-1結(jié)構(gòu) NNC: 此時(shí) 滿足 神經(jīng)網(wǎng)絡(luò)原理王永驥23例2系統(tǒng)模型 示意圖 參考模型神經(jīng)網(wǎng)絡(luò)原理王永驥24NN MRAC 圖 神經(jīng)網(wǎng)絡(luò)原理王永驥25NN控制框圖神經(jīng)網(wǎng)絡(luò)原理王永驥26MRAC訓(xùn)練數(shù)據(jù)神經(jīng)網(wǎng)絡(luò)原理王永驥27MRAC test data神經(jīng)網(wǎng)絡(luò)原理王永驥28MRAC 檢驗(yàn)數(shù)據(jù)神經(jīng)網(wǎng)絡(luò)原理王永驥29控制結(jié)果x-y圖神經(jīng)網(wǎng)絡(luò)原理王永驥30控制結(jié)果神經(jīng)網(wǎng)絡(luò)原理王永驥31神經(jīng)網(wǎng)絡(luò)自校正控制STR基本思想對(duì)象描述一階系統(tǒng)的一個(gè)實(shí)例

8、神經(jīng)網(wǎng)絡(luò)原理王永驥32基本思想如果系統(tǒng)環(huán)境和模型的參數(shù)已知,則可采用適當(dāng)方法獲得某種意義下的最優(yōu)控制器;若系統(tǒng)參數(shù)未知,則可用在線參數(shù)估計(jì)值來代替真實(shí)值(確定性等效原則)設(shè)計(jì)控制器,實(shí)現(xiàn)在線監(jiān)控。神經(jīng)網(wǎng)絡(luò)原理王永驥33對(duì)象描述SISO可反饋線性化的系統(tǒng)設(shè) 逆存在, 、 已知在 未知時(shí),用 逼近神經(jīng)網(wǎng)絡(luò)原理王永驥34實(shí)例例 引入NN NN的一步預(yù)報(bào)模型為:?。?則控制器為:神經(jīng)網(wǎng)絡(luò)原理王永驥35 調(diào)整準(zhǔn)則令 ,系統(tǒng)神經(jīng)網(wǎng)絡(luò)原理王永驥36權(quán)系數(shù)修正公式神經(jīng)網(wǎng)絡(luò)原理王永驥37設(shè)隱層為 或 , 或 則 神經(jīng)網(wǎng)絡(luò)原理王永驥38仿真例: 一個(gè)元, ,1-10-10-1結(jié)構(gòu) 初值 逐漸減小 初始振蕩,900

9、0步以后 2500步后仍有輕微振蕩神經(jīng)網(wǎng)絡(luò)原理王永驥39例2 y(t)距離 i(t) 電流 M質(zhì)量神經(jīng)網(wǎng)絡(luò)原理王永驥40控制結(jié)構(gòu)神經(jīng)網(wǎng)絡(luò)原理王永驥41控制結(jié)果神經(jīng)網(wǎng)絡(luò)原理王永驥42NN直接自適應(yīng)控制基本概念一種NN直接STC方案 描述 問題 訓(xùn)練方案 特點(diǎn)基于單個(gè)自適應(yīng)神經(jīng)元的控制神經(jīng)網(wǎng)絡(luò)原理王永驥43基本概念直接自適應(yīng)控制即直接根據(jù)對(duì)象的知識(shí)來調(diào)整控制器的內(nèi)部參數(shù),使得對(duì)象的輸出誤差盡量小 間接:辨識(shí)模型 直接:不辨識(shí) 兩種方案:1.基于MRAC 2.基于STC神經(jīng)網(wǎng)絡(luò)原理王永驥44系統(tǒng)描述 只要 維持足夠高,可描述任意非線性系統(tǒng) 設(shè):NN為BP網(wǎng)絡(luò) 訓(xùn)練規(guī)則: 為期望的對(duì)象輸出 時(shí)對(duì)應(yīng)的輸

10、入神經(jīng)網(wǎng)絡(luò)原理王永驥45問題問題希望 ,此時(shí) 應(yīng)確知, 但P未知,而為訓(xùn)練NNC, 又該知解決思路:將NNC與P看成一體,NN的最后一層(或幾層)固定不變,用來描述對(duì)象,訓(xùn)練指標(biāo)相應(yīng)修改成 Q為加權(quán)陣,Q0 選擇 使 神經(jīng)網(wǎng)絡(luò)原理王永驥46訓(xùn)練方案:梯度法設(shè)控制器參數(shù) 空間 計(jì)算 時(shí),當(dāng) 為網(wǎng)絡(luò)最后一層(描述對(duì)象的)時(shí),用下法 為對(duì)象的Jacobian陣,未知神經(jīng)網(wǎng)絡(luò)原理王永驥47將 , 對(duì)于網(wǎng)絡(luò)最后一層最后可得其它各層仍按標(biāo)準(zhǔn)BP算法修正神經(jīng)網(wǎng)絡(luò)原理王永驥48特點(diǎn)無特定學(xué)習(xí)階段,即沒有依賴于辨識(shí),直接控制效果設(shè)計(jì)控制器;控制參數(shù)調(diào)整為依賴時(shí)間的自適應(yīng)過程.例神經(jīng)網(wǎng)絡(luò)原理王永驥49例:小車倒立

11、擺控制例:小車倒立擺控制(動(dòng)力學(xué)方程同前) Rouge-kutta法求解,步長0.001秒 未時(shí),失敗 該系統(tǒng)NMP系統(tǒng) 4層BP 4-4-4-1結(jié)構(gòu), 初始條件, 隨機(jī)給定 2040次后,可使平衡保持15分鐘神經(jīng)網(wǎng)絡(luò)原理王永驥50單個(gè)自適應(yīng)神經(jīng)元控制框圖單個(gè)自適應(yīng)神經(jīng)元描述系統(tǒng)結(jié)構(gòu) 對(duì)r為定值系統(tǒng)學(xué)習(xí)方法P為線性系統(tǒng)時(shí)穩(wěn)定性分析神經(jīng)網(wǎng)絡(luò)原理王永驥51單個(gè)自適應(yīng)神經(jīng)元控制框圖神經(jīng)網(wǎng)絡(luò)原理王永驥52單個(gè)神經(jīng)元控制神經(jīng)網(wǎng)絡(luò)原理王永驥53學(xué)習(xí)方法督促學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)原理王永驥54改進(jìn)算法監(jiān)督與Hebb之組合 a 改變放大系數(shù). b.增加小誤差時(shí)e (t)的敏感性 神經(jīng)網(wǎng)絡(luò)原理王永驥55思想 神經(jīng)網(wǎng)絡(luò)原理

12、王永驥56線性系統(tǒng)閉環(huán)穩(wěn)定性設(shè) 控制器等效為: 將 神經(jīng)網(wǎng)絡(luò)原理王永驥57即:Roche定理 若在復(fù)平面環(huán)路上有 在此環(huán)路上有相同數(shù)目的零點(diǎn)神經(jīng)網(wǎng)絡(luò)原理王永驥58設(shè)在 神經(jīng)網(wǎng)絡(luò)原理王永驥59NN PID 直接NN PID 常規(guī) PID NN PID 間接NN PID 結(jié)構(gòu) 學(xué)習(xí) 算法流程神經(jīng)網(wǎng)絡(luò)原理王永驥60常規(guī)PID 神經(jīng)網(wǎng)絡(luò)原理王永驥61NN - PID采用BP網(wǎng)絡(luò) 3-6-1結(jié)構(gòu) 輸入 學(xué)習(xí)方法,標(biāo)準(zhǔn)BP算法 問題:要使網(wǎng)絡(luò)之期望值不知 先用 代替 輸出層: 神經(jīng)網(wǎng)絡(luò)原理王永驥62BP網(wǎng)絡(luò) 3-6-1結(jié)構(gòu)PID神經(jīng)網(wǎng)絡(luò)原理王永驥63討論隱層:討論:1)本法不一定能保證系統(tǒng)穩(wěn)定性與收斂性

13、2)實(shí)時(shí)控制時(shí),用到 計(jì)算慢神經(jīng)網(wǎng)絡(luò)原理王永驥642。間接NN PID 兩個(gè)NN:NNC PID;NNI 辨識(shí)器間接NNPID結(jié)構(gòu)示意圖NNI:設(shè) 3層BP網(wǎng) 神經(jīng)網(wǎng)絡(luò)原理王永驥65間接NNPID結(jié)構(gòu)示意圖神經(jīng)網(wǎng)絡(luò)原理王永驥66NNC神經(jīng)網(wǎng)絡(luò)原理王永驥67NNPID 學(xué)習(xí).神經(jīng)網(wǎng)絡(luò)原理王永驥68算法流程 (-0.1,0.1)隨機(jī)值初始化NNC,NNI 計(jì)算 計(jì)算NN PID之 修正NNI權(quán)值 修正NNC權(quán)值 1+t t,到2神經(jīng)網(wǎng)絡(luò)原理王永驥69NN-Fuzzy控制Fuzzy控制的基本思想做法一個(gè)實(shí)例神經(jīng)網(wǎng)絡(luò)原理王永驥70基于人的經(jīng)驗(yàn),依據(jù) 進(jìn)行表格化處理,控制規(guī)則為:if A then B形

14、式, 分為大、小、快、慢等,規(guī)則為:if E=Ai and then A選作E,B選作EC(變化率) 一般分成210檔,通常取7檔8檔, NL,NM NS,NO PO PS PM PL具體計(jì)算時(shí)按隸屬關(guān)系集,由具體數(shù)值 得到屬于何種狀態(tài),控制變量也如此處理.神經(jīng)網(wǎng)絡(luò)原理王永驥71幾種做法NN模擬Fuzzy系統(tǒng)中的各個(gè)模塊,為Fuzzy化、推理、決策等NN中引入Fuzzy邏輯,使之具有直接處理Fuzzy信息的能力 例:NN的加權(quán)求和變成“并”與“交”等形 式的Fuzzy邏輯運(yùn)算,稱為模糊神 經(jīng)元 模糊神經(jīng)網(wǎng)絡(luò)一般為5層網(wǎng)絡(luò),參考p326神經(jīng)網(wǎng)絡(luò)原理王永驥72小車倒立擺問題 和 為觀測(cè)量; f 為控制量;Q0 為垂線右邊反之為 ; 方向向右, 反之向左;f 的作用為抵消 為精確變量時(shí),則 為精確數(shù)值 為模糊變量時(shí),為語言值NB:negative Big,NM:negative middleNS:negative small ZE: zeroPS:positiv

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論