吳受章最優(yōu)控制講授提綱.ppt

上傳人：m*** IP屬地：河南上傳時(shí)間：2020-11-03 格式：PPT 頁數(shù)：92 大?。?.30MB 積分：20 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩87頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、最優(yōu)控制講授提綱,* 配合教材：最優(yōu)控制理論與應(yīng)用吳受章編著機(jī)械工業(yè)出版社 2008年,1,使用說明,講課開始時(shí)，學(xué)生需人手一冊(cè)教材，已可開講。講授提綱用幻燈片放映，僅起畫龍點(diǎn)睛作用（若無幻燈片放映，可用板書代之）。關(guān)鍵是：任課教師是否習(xí)慣此種講課方式。實(shí)踐表明：學(xué)生的收效卻更好。任課教師都有自己的習(xí)慣、風(fēng)格，都喜愛自己的講稿，因此，只適宜于列出講授提綱供參考，逐次的講稿宜自己用Power Point編寫。此時(shí)，教材和講授提綱可供參照，并亦可各自按需補(bǔ)充些內(nèi)容。此外，講課進(jìn)度的安排也因人而異，有40學(xué)時(shí)全講課的，有壓縮課時(shí)并添加大作業(yè)的，有寫讀文獻(xiàn)的報(bào)告的，故不宜編寫劃一的講稿（寫了也是

2、白寫）。,2,緒論,從經(jīng)典的反饋控制到最優(yōu)控制從特點(diǎn)看控制器設(shè)計(jì)經(jīng)歷的“改朝換代”,3,特點(diǎn)經(jīng)典反饋控制最優(yōu)控制,上世紀(jì)40-50年代起的炮火控制 SISO，輸入輸出描寫低階傳遞函數(shù) 應(yīng)無未建模動(dòng)態(tài) 手算，作圖，憑經(jīng)驗(yàn) 不計(jì)控制能耗模擬器件實(shí)現(xiàn) 軍工及民用工業(yè),上世紀(jì)60年代起延伸至今的航空航天 MIMO，內(nèi)部描寫低階狀態(tài)方程應(yīng)無未建模動(dòng)態(tài) 計(jì)算機(jī)，優(yōu)化，算法考慮控制能耗數(shù)字器件實(shí)現(xiàn) 航空航天工業(yè),4,第1章變分法,引言變分問題求解的兩條路本章的重要性,5,泛函,定義 1-1（泛函）圖 1-1 弧長(zhǎng) ，目標(biāo)泛函定義 1-2（函數(shù)空間中的距離）圖 1-2 曲線間的距

3、離定義 1-3（n級(jí)鄰區(qū)和泛函的局部極值）圖 1-3 泛函求局部極值定義 1-4（泛函的全局極值）,6,變分的推演,泛函求極值從式（1-1）推導(dǎo)式（1-6）的過程：寫出目標(biāo)值的差，式（1-2）用導(dǎo)數(shù)中值定理，得式（1-5）式（1-5）的第二項(xiàng)為高階無窮小改用變分記號(hào)，式（1-6）,7,（續(xù)）變分的推演,式（1-1）的被積函數(shù)用 Taylor 級(jí)數(shù) 展開后的線性主部，即式（1-6）第一項(xiàng)的被積函數(shù) 定義 1-5（函數(shù)的一次變分）式（1-7），式（1-8）定義 1-6（泛函的一次變分）式（1-9）,8,（續(xù)）變分的推演,定義 1-7（泛函的二次變分）式（1-10）泛函的

4、高次變分，式（1-11）泛函極值存在的必要條件，式（1-12）泛函局部極大值存在的充分條件，式（1-13）泛函局部極小值存在的充分條件，式（1-14）,9,Euler方程和橫截條件,泛函求極值從式（1-16）推導(dǎo)式（1-21）的過程：用分部積分得式（1-18）用推論1-1得式（1-19）及式（1-20）用推論1-2得式（1-21） TPBVP（兩點(diǎn)邊值問題）例1-3,10,向量情況,泛函求極值從式（1-25）推導(dǎo)式（1-32）的過程：成對(duì)應(yīng)用式（1-18），得式（1-26）分類及合并，得式（1-27）仿式（1-21）及式（1-23），得式（1-30）及式（1-31）

5、向量形式，式（1-32）,11,有約束的情況,函數(shù)的約束優(yōu)化與Lagrange乘子式（1-33）化為無約束優(yōu)化，式（1-34）兩個(gè)默認(rèn)的特點(diǎn) 函數(shù)的向量約束優(yōu)化與Lagrange 乘子向量式（1-35）,12,（續(xù)）有約束的情況,化為無約束優(yōu)化，式（1-37）兩個(gè)默認(rèn)的特點(diǎn) 泛函的約束優(yōu)化約束方程變量多、方程少化為無約束優(yōu)化定理1-1的敘述：式（1-39）與式（1-40）等價(jià),13,（續(xù)）有約束的情況,定理1-1的證明過程：為何要分兩步走第1步證明式（1-40）改寫為式（1-42）泛函極值存在的必要條件，式（1-43）結(jié)合約束方程求解，結(jié)果滿足約束方程，式（1-

6、40）的解即為式（1-39）的解第2步證明,14,（續(xù)）有約束的情況,式（1-39）的構(gòu)成：式（1-25）及約束方程式（1-25）所示泛函極值存在的必要條件，式（1-44）對(duì)約束方程取一次變分，式（1-45）即式（1-46）構(gòu)造式（1-49）式（1-44）的第一式與式（1-49）合成，得式（1-51）用約束方程和式（1-51），構(gòu)造式（1-52）,15,（續(xù)）有約束的情況,式（1-53）與式（1-52）的差別，得式（1-55）及式（1-56），式（1-39）的解即為式（1-40）的解兩步證明的完成，才說明式（1-39）與式（1-40）完全等價(jià) 定理1-1推廣到微分系統(tǒng),1

7、6,端點(diǎn)可變的情況,兩端可變可化為一端可變，終端可變目標(biāo)值的差推演得式（1-61）利用積分中值定理及式（1-6），式（1-18）由式（1-61）得式（1-62）圖1-4與式（1-63）從式（1-64）得式（1-65）推廣到式（1-67）,17,變分的另一種定義,定義1-8（函數(shù)的一次變分）定義1-9（泛函的一次變分）式（1-69）對(duì)求導(dǎo),得J的一次變分，式（1-71）式（1-72）同式（1-9）,18,變分與Frchet微分,定義1-10（Frchet微分）線性逼近的誤差，式（1-74）對(duì)照圖1-5及式（1-75）規(guī)定了線性逼近方式 Frchet微分，式（1-76）

8、計(jì)算Frchet微分的方法，式（1-77）泛函的一次變分即Frchet微分，對(duì)照式（1-78），式（1-79）,19,小結(jié),泛函求極值變分常微分方程的TPBVP 本章僅為尋求極值曲線，并未涉及尋求極值曲面變分法的現(xiàn)代進(jìn)展為變分原理（不是第5章的最大值原理）,20,第2章連續(xù)系統(tǒng)最優(yōu)控制,引言了解受控對(duì)象建模提出概念性目標(biāo) 優(yōu)化問題提法式（2-1） Bolza問題，Lagrange問題，Mayer問題折衷優(yōu)化如何套用第1章公式,21,時(shí)間端點(diǎn)固定的情況,式（2-2）的背景化為無約束優(yōu)化問題式（2-3），Hamilton函數(shù) 式（2-3）取一次變分，分兩部分式（2-7

9、）由式（2-4）及式（2-6）組成橫截條件，伴隨方程，耦合方程，狀態(tài)方程，式（2-10）,22,（續(xù)）時(shí)間端點(diǎn)固定的情況,沿最優(yōu)軌線H為常量的條件橫截條件三種情況 TPBVP 例2-1，例2-2，例2-3，例2-4,23,有終端函數(shù)約束的情況,式（2-60）的背景化為無約束優(yōu)化問題，式（2-61）式（2-61）取一次變分，式（2-63）橫截條件，伴隨方程，耦合方程，狀態(tài)方程，終端函數(shù)，式（2-67）例2-5,24,終時(shí)不指定的情況,式（2-78）的背景化為無約束優(yōu)化問題，式（2-79）式（2-79）取一次變分，分三部分式（2-84）由式（2-80)，式（2- 81)

10、及式（2-83）組成橫截條件，伴隨方程，耦合方程，狀態(tài)方程，終端函數(shù)，式（2-88）例2-6,25,考慮其它幾種約束,積分約束化為微商約束和終態(tài)約束狀態(tài)和控制的等式約束狀態(tài)和控制的不等式約束用松弛變量化為狀態(tài)和控制的等式約束角隅條件，式（2-120）,26,用符號(hào)數(shù)學(xué)工具箱求TPBVP的解析解,見程序集,27,小結(jié),TPBVP的解析解多謝MATLAB的符號(hào)數(shù)學(xué)工具箱，它改變了求取TPBVP的解析解的面貌要關(guān)注符號(hào)計(jì)算的進(jìn)展（包括新版本 MATLAB中的符號(hào)數(shù)學(xué)工具箱）確定性最優(yōu)控制開環(huán)與閉環(huán)不分,28,第3章線性連續(xù)系統(tǒng)的二次型調(diào)節(jié)器,引言優(yōu)化問題提法，式（3

11、-1）物理意義重視LQR的原因,29,有限時(shí)間（狀態(tài)）調(diào)節(jié)器,時(shí)變情況式（3-1）化為無約束優(yōu)化問題泛函極值存在的必要條件：橫截條件，伴隨方程，耦合方程，狀態(tài)方程 TPBVP,式（3-6） Hamilton矩陣(t) 式（3-7）式（3-12）矩陣Riccati微分方程，式（3-17）,30,全狀態(tài)反饋，Kalman增益，式（3-19） P(t)的性質(zhì) 對(duì)稱，半正定 P(t)的計(jì)算，Euler法最優(yōu)反饋控制的結(jié)構(gòu)，圖3-1 x(t)的重構(gòu)，圖3-2 對(duì)加權(quán)矩陣的要求,31,（續(xù)）有限時(shí)間（狀態(tài)）調(diào)節(jié)器,（續(xù)）有限時(shí)間（狀態(tài)）調(diào)節(jié)器,非時(shí)變情況式（3-1）式(3-1) 式（3

12、-17）式(3-17) 式（3-18）式(3-18) 式（3-19）式(3-19) P(t)的解析解，式（3-28），幾種解法例3-1，例3-2 觀察終時(shí)tf對(duì)Kalman增益K(t)的影響見程序集和圖3-3,32,（續(xù)）有限時(shí)間（狀態(tài)）調(diào)節(jié)器,P(t)的數(shù)值解見程序集,33,有限時(shí)間輸出調(diào)節(jié)器,優(yōu)化問題提法式（3-58）矩陣Riccati 微分方程，式（3-60）全狀態(tài)反饋，Kalman增益K(t) 式（3-62）,34,無限時(shí)間輸出調(diào)節(jié)器,優(yōu)化問題提法，式（3-63）定理3-1有4部份： (a) P(t)= Pbar=const的充要條件為（A , B）能穩(wěn)定能觀性

13、分解，式（3-66）代入系數(shù)矩陣，式（3-64）即式（3-68）從式（3-69）的第二式、第三式和邊界條件得 P12(t)=O ，P22(t)=O，得式（3-70) 不能觀極點(diǎn)在A22中，不影響P(t）,35,（續(xù)）無限時(shí)間輸出調(diào)節(jié)器,設(shè)能觀，不會(huì)影響證明P(t)= Pbar=const 從能控性分解式（3-71)出發(fā) 證必要條件(能穩(wěn)定)：設(shè)（A , B）不能穩(wěn)定（不穩(wěn)定極點(diǎn)不能控）不能控極點(diǎn)在A22中,輸出z(t)和 J 都發(fā)散按式（3-25），P(t)不存在，Pbar不存在證充分條件(能穩(wěn)定)：設(shè)能穩(wěn)定（不穩(wěn)定極點(diǎn)能控）式（3-73）說明P(t)有上界,36,（續(xù)）無限

14、時(shí)間輸出調(diào)節(jié)器,式（3-73）單調(diào)非減，得P(t)單調(diào)非減有唯一極限P(t)= Pbar=const (b) 若能穩(wěn)定，能檢測(cè)，則唯一的Pbar半正定 P(t)= Pbar=const，式（3-64）退化為矩陣Riccati 代數(shù)方程，式（3-65），前已證有唯一極限Pbar 能檢測(cè)（不能觀極點(diǎn)穩(wěn)定），不考慮不能觀部分由式（3-24）及式（3-25）得 Pbar半正定 (c) u(t)穩(wěn)定的充要條件為能穩(wěn)定，能檢測(cè),37,（續(xù)）無限時(shí)間輸出調(diào)節(jié)器,證必要條件：必需能穩(wěn)定和能檢測(cè)，否則不穩(wěn)定極點(diǎn)不能控，不能觀極點(diǎn)不穩(wěn)定證充分條件：能控性分解式(3-71),得式（3-75）從式（3-

15、75）可寫出式（3-76），解出P11(t) 能控性分解中的A11含能控的極點(diǎn)（包括不穩(wěn)定的極點(diǎn)）, A11-B1R-1(B1)TP11漸近穩(wěn)定 A22含不能控的極點(diǎn)（但包括穩(wěn)定的極點(diǎn)）,38,（續(xù)）無限時(shí)間輸出調(diào)節(jié)器,(A11,B1)能控包含(A11,B1)能穩(wěn)定，按本定理 (a) P11(t)=P11bar=const 的充要條件為(A11,B1) 能穩(wěn)定最優(yōu)反饋控制為式（3-77）反饋系統(tǒng)為式（3-78）分塊上三角形矩陣的特征值取決于對(duì)角塊各矩陣的，因A11-B1R-1(B1)TP11漸近穩(wěn)定及A22漸近穩(wěn)定，故反饋系統(tǒng)漸近穩(wěn)定,39,（續(xù)）無限時(shí)間輸出調(diào)節(jié)器,(d)設(shè)Q正定

16、，Pbar正定的充要條件為能觀證必要條件(能觀)：設(shè)部分能觀，能觀性分解，式（3-66）, 在本定理(a)中有式（3-70） det P(t)=0, P(t)非正定，Pbar非正定證充分條件(能觀)：反設(shè)能觀，但Pbar非正定存在x0 0 ，不加控制，卻可使輸出為0，荒謬，故Pbar 正定,40,（續(xù)）無限時(shí)間輸出調(diào)節(jié)器,Pbar的解析解令非異變換T，式（3-82）對(duì)Hamilton矩陣可驗(yàn)證式（3-83）式（3-84）表示陣有特征值式（3-85）表示陣有特征值 - 陣無復(fù)特征值模態(tài)陣M使陣分塊對(duì)角化，式（3-87）有相異特征值時(shí)，分塊對(duì)角化,41,（續(xù)）無限時(shí)間

17、輸出調(diào)節(jié)器,有重復(fù)特征值時(shí)，Jordan塊從式（3-87）式（3-92） Pbar=M21(M11)-1 見程序集 Pbar的數(shù)值解見程序集用控制系統(tǒng)工具箱見程序集,42,使用 LQR的系統(tǒng)的穩(wěn)定裕量,式（3-102)式（3-109），Kalman不等式單輸入系統(tǒng)的Kalman不等式式（3-110）式（3-111）系統(tǒng)方框圖，圖3-6 開環(huán)傳遞函數(shù)與開環(huán)頻率特性圖3-7，頻率特性幅度余量無限大相位余量至少600 以全狀態(tài)反饋為條件,43,小結(jié),有限時(shí)間調(diào)節(jié)器的設(shè)計(jì)，只需求解矩陣Riccati 微分方程，為終值問題，它比TPBVP容易解無限時(shí)間調(diào)節(jié)器的設(shè)計(jì)，僅需求解

18、矩陣Riccati代數(shù)方程，它又比有限時(shí)間調(diào)節(jié)器的設(shè)計(jì)簡(jiǎn)單，又容易實(shí)現(xiàn) 有限時(shí)間調(diào)節(jié)器的設(shè)計(jì)，得K(t) 無限時(shí)間調(diào)節(jié)器的設(shè)計(jì)，得K,44,（續(xù)）小結(jié),必須先選取幾組加權(quán)矩陣Q及R，通過設(shè) 計(jì)和仿真，修改Q及R，直至獲得滿意的暫態(tài)過程，控制器設(shè)計(jì)才告終 LQR的優(yōu)異性能（幅度余量無限大，相位余量至少600）以全狀態(tài)反饋為條件 LQR是自動(dòng)控制理論發(fā)展中的一個(gè)里程碑（雖然有缺點(diǎn)）,45,第4章離散系統(tǒng)最優(yōu)控制,引言兩種離散系統(tǒng) 優(yōu)化問題提法離散變分法與Euler方程泛函求極值（無約束）泛函的一次變分式（4-3），式（4-4）,46,（續(xù)）離散變分法與Euler方程,泛函極值

19、存在的必要條件式（4-5） Euler方程和橫截條件式（4-8）,47,離散系統(tǒng)最優(yōu)控制,泛函求極值式（4-9）化為無約束優(yōu)化問題式（4-10）， Lagrange乘子向量(k+1) 泛函極值存在的必要條件橫截條件，伴隨方程，耦合方程，狀態(tài)方程，式（4-15）例4-1,48,有限時(shí)間離散LQR問題,時(shí)變情況泛函求極值，式（4-17）泛函極值存在的必要條件伴隨方程，耦合方程，橫截條件兩點(diǎn)邊值問題，式（4-24），Hamilton矩陣H(k) 矩陣Riccati差分方程三種形式式（4-26a），式（4-26b），式（4-26c）最優(yōu)反饋控制結(jié)構(gòu)，圖4-1 式（4-27）

20、，式（4-28），Kalman增益K(k),49,（續(xù)）有限時(shí)間離散LQR問題,非時(shí)變情況泛函求極值，式（4-17）矩陣Riccati差分方程三種形式式（4-26a），式（4-26b) ，式（4-26c）最優(yōu)反饋控制結(jié)構(gòu) 式（4-27），式（4-28) ，Kalman增益K(k) P(k)的解析解，式（4-30）例4-2,50,（續(xù)）有限時(shí)間離散LQR問題,P(k)的數(shù)值解見程序集例4-3,51,無限時(shí)間離散LQR問題,矩陣Riccati 代數(shù)方程式（4-26a)退化為式（4-41a) 式（4-26b)退化為式（4-41b) 式（4-26c)退化為式（4-41c) 式（4-27

21、)退化為式（4-42a) 式（4-28)退化為式（4-42b) 全狀態(tài)反饋,52,（續(xù)）無限時(shí)間離散LQR問題,Pbar的解析解式（4-44) 式（4-48)求H-1的過程: 令非異變換T，同式（3-82）對(duì)Hamilton矩陣H可驗(yàn)證式（4-46) T及H的內(nèi)容代入式（4-46)，得式（4-48) 設(shè)H-1的特征值和相應(yīng)的特征向量fT gTT，求 H的特征值： H-1的內(nèi)容代入式（4-49)，得式（4-50) 展開并重組，得式（4-52),53,（續(xù)）無限時(shí)間離散LQR問題,向量形式，式（4-53)，即式（4-54) 式（4-54)說明H有特征值故H-1有特征值1/（前已設(shè)H-1有特征

22、值）故H有特征值和1/ H只含實(shí)特征值(無復(fù)特征值)，并只分為穩(wěn)定的和不穩(wěn)定的兩種，即只分為位于單位圓內(nèi)的和單位圓外的兩種（若在單位圓內(nèi)，1/必在單位圓外）,54,（續(xù)）無限時(shí)間離散LQR問題,模態(tài)陣M使陣分塊對(duì)角化，式（4-56）有相異特征值時(shí)，分塊對(duì)角化有重復(fù)特征值時(shí)，Jordan塊 M和H的內(nèi)容代入式（4-56) 從式（4-56）式（4-65） Pbar=M22(M12)-1 例4-4,55,（續(xù)）無限時(shí)間離散LQR問題,Pbar的數(shù)值解見程序集例4-5 用控制系統(tǒng)工具箱見程序集例4-6,例4-7,56,第5章最大值原理,引言式（5-1）不能用變分法求解的原因

23、最小值原理引理5-1的敘述：非線性、非時(shí)變系統(tǒng)，給定初始條件，控制有界,57,（續(xù)）最小值原理,xi(t)為連續(xù)函數(shù)，用最大值范數(shù)；在不同的i時(shí)，從xi(t)的最大值范數(shù)中取最大的一個(gè)作為x向量的范數(shù) ui(t)可為按段光滑的函數(shù)，取p范數(shù)，當(dāng)p=1, 則為1范數(shù)；在不同的i時(shí)，從 ui(t)的1范數(shù)中取上確界（最小的上界）作為u向量的范數(shù) 求證：x和u的范數(shù)為同階無窮小,58,（續(xù)）最小值原理,引理5-1的證明過程：設(shè)微分方程滿足Lipschitz條件（即設(shè)為壓縮映射），式（5-2）附錄5A 賦范線性向量空間最大值范數(shù)，p范數(shù) Banach空間 Cauchy序列，完

24、備性壓縮映射與不動(dòng)點(diǎn) 壓縮映射原理,59,（續(xù)）最小值原理,dx/dt=f(x) 可化為x=F(x) u取最優(yōu)控制，式（5-2）化為式（5-3）由 Frchet微分的定義，得式（5-4） Frchet微分df，式（5-5）式（5-6）的推導(dǎo)過程，并類似得式（5-7）對(duì)狀態(tài)方程兩邊取Frchet微分，式（5-8）攝動(dòng)方程的解，式（5-9） x和u的范數(shù)為同階無窮小，式（5-10）,60,（續(xù)）最小值原理,引理5-2的敘述：非線性、非時(shí)變系統(tǒng)，給定初始條件，控制有界目標(biāo)函數(shù)，式（5-12）求證：目標(biāo)值的差為式（5-13）引理5-2的證明過程：化為無約束優(yōu)化問題，式（5-14）

25、,61,（續(xù)）最小值原理,推演式（5-15），并類似得式（5-16）推演式（5-17）定理5-1的敘述：泛函求極值，式（5-18），控制有界泛函極值存在的必要條件伴隨方程，狀態(tài)方程，H全局最小，式（5-19）定理5-1的證明過程：,62,（續(xù)）最小值原理,耦合方程已不復(fù)存在，但伴隨方程和狀態(tài)方程仍為必要條件證明H全局最小為必要條件時(shí)，用反證法設(shè)tbart0 , tf , w，有式（5-21）因f及連續(xù)， tbar 的鄰域ta , tb， tbar ta , tb 為 t0 , tf的子集，0，有式（5-22）取特殊控制u 當(dāng)t不屬于ta , tb 時(shí), u=ucap

26、當(dāng)t屬于ta , tb 時(shí), u =w,63,（續(xù)）最小值原理,卻有J(ucap)-J(u) 0 式（5-23）表明事實(shí)相反，故上述特殊控制 u 非最優(yōu)控制因tbar任取，故式（5-23）之證明有普遍意義因伴隨方程、狀態(tài)方程均為必要條件，故式（5-19）仍為必要條件,64,Bang-Bang控制,式（5-24）的兩個(gè)特點(diǎn) Hamilton函數(shù) 使用“H全局最小” ui取兩個(gè)極端值，Bang-Bang Bang-Bang 產(chǎn)生的條件,65,時(shí)間最優(yōu)控制系統(tǒng)的性質(zhì),線性非時(shí)變系統(tǒng)的時(shí)間最優(yōu)控制式（5-25）的物理概念 Hamilton函數(shù)H，式（5-26）橫截條件，式（5-27）協(xié)態(tài)方

27、程，式（5-29）狀態(tài)方程 H全局最小，式（5-30） ui(t)= - sgnBT(t)i 式（5-25）為另一種形式的提法，本質(zhì)不變,66,（續(xù)）時(shí)間最優(yōu)控制系統(tǒng)的性質(zhì),命題5-1的敘述：式（5-25）所示時(shí)間最優(yōu)控制問題 ui(t)= - sgnBT(t)i為唯一的命題5-1的證明過程：協(xié)態(tài)方程的解中，(0) 0 ，否則矛盾 (t) 0 , ui(t)不發(fā)生奇異情況若設(shè)u1,u2兩個(gè)不同的最優(yōu)控制向量，則與狀態(tài)方程解的唯一性相矛盾,67,（續(xù)）時(shí)間最優(yōu)控制系統(tǒng)的性質(zhì),命題5-2的敘述：式（5-25）所示時(shí)間最優(yōu)控制問題若存在最優(yōu)控制ui(t)= - sgnBT(t) i

28、式（5-30） ui(t)至多切換n-1次命題5-2的證明過程：協(xié)態(tài)方程的解,式（5-31）最優(yōu)控制可改寫為ui(t)= - sgn(e-Atbi)T0,68,（續(xù)）時(shí)間最優(yōu)控制系統(tǒng)的性質(zhì),切換條件為(e-Atbi)T0=0，式（5-32）設(shè)有相異特征值，式（5-32）改為式（5-33）滿足此式t的個(gè)數(shù)，即為切換次數(shù) 用數(shù)學(xué)歸納法證之 n=1時(shí)成立 n=2時(shí)成立設(shè)n-1時(shí)成立，應(yīng)證明n時(shí)也成立，用反證法：先反設(shè)式（5-33）有n個(gè)實(shí)根，結(jié)果自相矛盾；有n-1個(gè)實(shí)根，才能自圓其說,69,無阻尼運(yùn)動(dòng)的時(shí)間最優(yōu)控制,物理背景，式（5-36）優(yōu)化問題提法，式（5-39） H函數(shù) 協(xié)態(tài)

29、方程 H全局最小，式（5-40）啟發(fā)式求解 u=+1 , 式（5-41a） u=-1 , 式（5-41b）,70,（續(xù)）無阻尼運(yùn)動(dòng)的時(shí)間最優(yōu)控制,式（5-41a）及式（5-41b）示于圖5-1 分析圖5-2 開關(guān)函數(shù)，式（5-43）控制系統(tǒng)方框圖，圖5-3,71,存在恢復(fù)力時(shí),無阻尼運(yùn)動(dòng)的時(shí)間最優(yōu)控制,物理背景，式（5-45）優(yōu)化問題提法，式（5-47） H函數(shù) H全局最小，式（5-48）協(xié)態(tài)方程，式（5-49），從圖5-4看出切換的持續(xù)時(shí)間為啟發(fā)式求解 u=+1 , 式（5-51） u=-1 , 式（5-52）,72,（續(xù)）存在恢復(fù)力時(shí),無阻尼運(yùn) 動(dòng)的時(shí)間最優(yōu)控制,式（5-51

30、）及式（5-52）示于圖5-5，基本的開關(guān)線分析圖5-5，衍生出開關(guān)線的總體，圖5-6 開關(guān)函數(shù)，式（5-54）控制系統(tǒng)方框圖，圖5-7,73,燃料最優(yōu)控制系統(tǒng)的性質(zhì),物理背景泛函求極值，式（5-55） H函數(shù) H全局最小，式（5-58）式（5-58）的圖示，圖5-8(a),(b)，兩者疊合得圖5-9的陰影區(qū) 陰影區(qū)的下部邊界即為式（5-58）的解式（5-60）與式（5-61）對(duì)照，用死區(qū)函數(shù)表示，圖5-10，Bang-off-Bang,74,無阻尼運(yùn)動(dòng)的燃料最優(yōu)控制,優(yōu)化問題提法，式（5-63）物理背景 H函數(shù) 協(xié)態(tài)方程 H全局最小啟發(fā)式求解 u=+1 , 式（5-41a

31、） u=-1 , 式（5-41b） u=0, 式（5-65）,式（5-66）,75,（續(xù)）無阻尼運(yùn)動(dòng)的燃料最優(yōu)控制,若初速為0，又u=0，則不能控圖5-11，四個(gè)區(qū)域分析圖5-12，開關(guān)線控制系統(tǒng)方框圖，圖5-13,76,SIMULINK用于Bang-Bang控制的仿真,見程序集,77,小結(jié),最大值原理是自動(dòng)控制理論發(fā)展中的一個(gè)里程碑，至今尚無取代物最大值原理與LQR思路各不相同：前者在約束條件中直接考慮控制有界；后者在目標(biāo)函數(shù)中間接考慮控制能量消耗要少 Bang-Bang控制有產(chǎn)生的條件，并有適用的范圍,78,第6章動(dòng)態(tài)規(guī)劃,引言定積分與無窮和式最優(yōu)控制與最優(yōu)決策序

32、列單段決策過程和多段決策過程不同的求解方法,79,多段決策過程,動(dòng)態(tài)系統(tǒng)的遞推關(guān)系，圖6-1 多段決策過程泛函求極值，式（6-2）加性可分目標(biāo)函數(shù) u(N)不存在，圖6-2,80,動(dòng)態(tài)規(guī)劃的基本思想,假定現(xiàn)在和將來的決策不影響過去的狀態(tài)、決策和目標(biāo) 在k時(shí)刻，由x(k)立即作出決策u(k) 改寫為普遍形式，式（6-3）簡(jiǎn)記I(x , k) , 式（6-4）,81,（續(xù)）動(dòng)態(tài)規(guī)劃的基本思想,Bellman方程的推演過程：按假定1，先對(duì)u(k+1),u(k+2),u(N-1) 求min,后對(duì)u(k)求min 和式分開寫 (x(k),u(k),k)和u(k+1),u(k+2),u(N-1) 無關(guān)，可提至min記號(hào)外再次使用式（6-4）之定義式（6-5），Bellman方程，遞推關(guān)系，動(dòng)態(tài)規(guī)劃,82,（續(xù)）動(dòng)態(tài)規(guī)劃的基本思想,動(dòng)態(tài)規(guī)劃的特點(diǎn) 目標(biāo)值反向掃掠狀態(tài)值正向掃掠兩者聯(lián)系的紐帶為最優(yōu)決策序列每一段中尋求最優(yōu)決策的方法是關(guān)鍵例6-1及例6-2使用求導(dǎo)（局部極值）和解代數(shù)方程,可使用符號(hào)計(jì)算（見程序集）例6-3及例6-4,用數(shù)值比大?。ㄈ謽O值），見表6-2,表6-3,表6-4,83,用動(dòng)態(tài)規(guī)劃求解離散LQR問題,有限時(shí)間離散LQR問題，式（6-6）寫出Bellman方程，式（6-7）令I(lǐng)(x,k)=(1

人人文庫> 全部分類> 生活休閑 > 科普知識(shí)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

吳受章最優(yōu)控制講授提綱.ppt

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

吳受章最優(yōu)控制講授提綱.ppt

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔