吳受章最優(yōu)控制講授提綱.ppt_第1頁
吳受章最優(yōu)控制講授提綱.ppt_第2頁
吳受章最優(yōu)控制講授提綱.ppt_第3頁
吳受章最優(yōu)控制講授提綱.ppt_第4頁
吳受章最優(yōu)控制講授提綱.ppt_第5頁
已閱讀5頁,還剩87頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、最優(yōu)控制講授提綱,* 配合教材: 最優(yōu)控制理論與應(yīng)用吳受章編著 機(jī)械工業(yè)出版社 2008年,1,使用說明,講課開始時(shí),學(xué)生需人手一冊(cè)教材,已可開講。講授提綱用幻燈片放映,僅起畫龍點(diǎn)睛作用(若無幻燈片放映,可用板書代之)。關(guān)鍵是:任課教師是否習(xí)慣此種講課方式。實(shí)踐表明:學(xué)生的收效卻更好。 任課教師都有自己的習(xí)慣、風(fēng)格,都喜愛自己的講稿,因此,只適宜于列出講授提綱供參考,逐次的講稿宜自己用Power Point編寫。此時(shí),教材和講授提綱可供參照,并亦可各自按需補(bǔ)充些內(nèi)容。此外,講課進(jìn)度的安排也因人而異,有40學(xué)時(shí)全講課的,有壓縮課時(shí)并添加大作業(yè)的,有寫讀文獻(xiàn)的報(bào)告的,故不宜編寫劃一的講稿(寫了也是

2、白寫)。,2,緒論,從經(jīng)典的反饋控制到最優(yōu)控制 從特點(diǎn)看控制器設(shè)計(jì)經(jīng)歷的“改朝換代”,3,特 點(diǎn)經(jīng)典反饋控制 最優(yōu)控制,上世紀(jì)40-50年代起的炮火控制 SISO,輸入輸出描寫 低階傳遞函數(shù) 應(yīng)無未建模動(dòng)態(tài) 手算,作圖,憑經(jīng)驗(yàn) 不計(jì)控制能耗 模擬器件實(shí)現(xiàn) 軍工及民用工業(yè),上世紀(jì)60年代起延伸至今的航空航天 MIMO,內(nèi)部描寫 低階狀態(tài)方程 應(yīng)無未建模動(dòng)態(tài) 計(jì)算機(jī),優(yōu)化,算法 考慮控制能耗 數(shù)字器件實(shí)現(xiàn) 航空航天工業(yè),4,第1章 變分法,引言 變分問題求解的兩條路 本章的重要性,5,泛函,定義 1-1(泛函) 圖 1-1 弧長(zhǎng) ,目標(biāo)泛函 定義 1-2(函數(shù)空間中的距離) 圖 1-2 曲線間的距

3、離 定義 1-3(n級(jí)鄰區(qū)和泛函的局部極值) 圖 1-3 泛函求局部極值 定義 1-4(泛函的全局極值),6,變分的推演,泛函求極值 從式(1-1)推導(dǎo)式(1-6)的過程: 寫出目標(biāo)值的差,式(1-2) 用導(dǎo)數(shù)中值定理,得式(1-5) 式(1-5)的第二項(xiàng)為高階無窮小 改用變分記號(hào),式(1-6),7,(續(xù))變分的推演,式(1-1)的被積函數(shù)用 Taylor 級(jí)數(shù) 展開后的線性主部,即式(1-6)第一 項(xiàng)的被積函數(shù) 定義 1-5(函數(shù)的一次變分) 式(1-7),式(1-8) 定義 1-6(泛函的一次變分) 式(1-9),8,(續(xù))變分的推演,定義 1-7(泛函的二次變分) 式(1-10) 泛函的

4、高次變分,式(1-11) 泛函極值存在的必要條件,式(1-12) 泛函局部極大值存在的充分條件,式(1-13) 泛函局部極小值存在的充分條件,式(1-14),9,Euler方程和橫截條件,泛函求極值 從式(1-16)推導(dǎo)式(1-21)的過程: 用分部積分得式(1-18) 用推論1-1得式(1-19)及式(1-20) 用推論1-2得式(1-21) TPBVP(兩點(diǎn)邊值問題) 例1-3,10,向量情況,泛函求極值 從式(1-25)推導(dǎo)式(1-32)的過程: 成對(duì)應(yīng)用式(1-18),得式(1-26) 分類及合并,得式(1-27) 仿式(1-21)及式(1-23),得式(1-30) 及式(1-31)

5、向量形式,式(1-32),11,有約束的情況,函數(shù)的約束優(yōu)化與Lagrange乘子 式(1-33) 化為無約束優(yōu)化,式(1-34) 兩個(gè)默認(rèn)的特點(diǎn) 函數(shù)的向量約束優(yōu)化與Lagrange 乘子向量 式(1-35),12,(續(xù))有約束的情況,化為無約束優(yōu)化, 式(1-37) 兩個(gè)默認(rèn)的特點(diǎn) 泛函的約束優(yōu)化 約束方程變量多、方程少 化為無約束優(yōu)化 定理1-1的敘述: 式(1-39)與式(1-40)等價(jià),13,(續(xù))有約束的情況,定理1-1的證明過程: 為何要分兩步走 第1步證明 式(1-40)改寫為式(1-42) 泛函極值存在的必要條件,式(1-43) 結(jié)合約束方程求解,結(jié)果滿足約束方程, 式(1-

6、40)的解即為式(1-39)的解 第2步證明,14,(續(xù))有約束的情況,式(1-39)的構(gòu)成:式(1-25)及約束方程 式(1-25)所示泛函極值存在的必要條件, 式(1-44) 對(duì)約束方程取一次變分,式(1-45)即式(1-46) 構(gòu)造式(1-49) 式(1-44)的第一式與式(1-49)合成,得式(1-51) 用約束方程和式(1-51),構(gòu)造式(1-52),15,(續(xù))有約束的情況,式(1-53)與式(1-52)的差別,得式 (1-55)及式(1-56),式(1-39)的 解即為式(1-40)的解 兩步證明的完成,才說明式(1-39)與 式(1-40)完全等價(jià) 定理1-1推廣到微分系統(tǒng),1

7、6,端點(diǎn)可變的情況,兩端可變可化為一端可變,終端可變 目標(biāo)值的差推演得式(1-61) 利用積分中值定理及式(1-6),式 (1-18) 由式(1-61)得式(1-62) 圖1-4與式(1-63) 從式(1-64)得式(1-65) 推廣到式(1-67),17,變分的另一種定義,定義1-8(函數(shù)的一次變分) 定義1-9(泛函的一次變分) 式(1-69) 對(duì)求導(dǎo),得J的一次變分,式(1-71) 式(1-72)同式(1-9),18,變分與Frchet微分,定義1-10(Frchet微分) 線性逼近的誤差,式(1-74)對(duì)照 圖1-5及式(1-75) 規(guī)定了線性逼近方式 Frchet微分,式(1-76)

8、 計(jì)算Frchet微分的方法,式(1-77) 泛函的一次變分即Frchet微分,對(duì)照 式(1-78),式(1-79),19,小結(jié),泛函求極值變分常微分方程 的TPBVP 本章僅為尋求極值曲線,并未涉 及尋求極值曲面 變分法的現(xiàn)代進(jìn)展為變分原理( 不是第5章的最大值原理),20,第2章 連續(xù)系統(tǒng)最優(yōu)控制,引言 了解受控對(duì)象建模提出概念性目標(biāo) 優(yōu)化問題提法 式(2-1) Bolza問題,Lagrange問題,Mayer問題 折衷優(yōu)化 如何套用第1章公式,21,時(shí)間端點(diǎn)固定的情況,式(2-2)的背景 化為無約束優(yōu)化問題 式(2-3),Hamilton函數(shù) 式(2-3)取一次變分,分兩部分 式(2-7

9、)由式(2-4)及式(2-6)組成 橫截條件,伴隨方程,耦合方程,狀態(tài)方 程,式(2-10),22,(續(xù))時(shí)間端點(diǎn)固定的情況,沿最優(yōu)軌線H為常量的條件 橫截條件三種情況 TPBVP 例2-1,例2-2,例2-3, 例2-4,23,有終端函數(shù)約束的情況,式(2-60)的背景 化為無約束優(yōu)化問題, 式(2-61) 式(2-61)取一次變分,式(2-63) 橫截條件,伴隨方程,耦合方程, 狀態(tài)方程,終端函數(shù), 式(2-67) 例2-5,24,終時(shí)不指定的情況,式(2-78)的背景 化為無約束優(yōu)化問題,式(2-79) 式(2-79)取一次變分,分三部分 式(2-84)由式(2-80),式(2- 81)

10、及式(2-83)組成 橫截條件,伴隨方程,耦合方程, 狀態(tài)方程,終端函數(shù), 式(2-88) 例2-6,25,考慮其它幾種約束,積分約束化為微商約束和終態(tài)約束 狀態(tài)和控制的等式約束 狀態(tài)和控制的不等式約束用松弛變量 化為狀態(tài)和控制的等式約束 角隅條件,式(2-120),26,用符號(hào)數(shù)學(xué)工具箱 求TPBVP的解析解,見程序集,27,小結(jié),TPBVP的解析解 多謝MATLAB的符號(hào)數(shù)學(xué)工具箱,它 改變了求取TPBVP的解析解的面貌 要關(guān)注符號(hào)計(jì)算的進(jìn)展(包括新版本 MATLAB中的符號(hào)數(shù)學(xué)工具箱) 確定性最優(yōu)控制開環(huán)與閉環(huán)不分,28,第3章 線性連續(xù)系統(tǒng)的 二次型調(diào)節(jié)器,引言 優(yōu)化問題提法, 式(3

11、-1) 物理意義 重視LQR的原因,29,有限時(shí)間(狀態(tài))調(diào)節(jié)器,時(shí)變情況 式(3-1)化為無約束優(yōu)化問題 泛函極值存在的必要條件:橫截條件,伴隨 方程,耦合方程,狀態(tài)方程 TPBVP,式(3-6) Hamilton矩陣(t) 式(3-7) 式(3-12) 矩陣Riccati微分方程,式(3-17),30,全狀態(tài)反饋,Kalman增益,式(3-19) P(t)的性質(zhì) 對(duì)稱,半正定 P(t)的計(jì)算,Euler法 最優(yōu)反饋控制的結(jié)構(gòu),圖3-1 x(t)的重構(gòu),圖3-2 對(duì)加權(quán)矩陣的要求,31,(續(xù))有限時(shí)間(狀態(tài))調(diào)節(jié)器,(續(xù))有限時(shí)間(狀態(tài))調(diào)節(jié)器,非時(shí)變情況 式(3-1) 式(3-1) 式(3

12、-17) 式(3-17) 式(3-18) 式(3-18) 式(3-19) 式(3-19) P(t)的解析解,式(3-28),幾種解法 例3-1,例3-2 觀察終時(shí)tf對(duì)Kalman增益K(t)的影響 見程序集和圖3-3,32,(續(xù))有限時(shí)間(狀態(tài))調(diào)節(jié)器,P(t)的數(shù)值解 見程序集,33,有限時(shí)間輸出調(diào)節(jié)器,優(yōu)化問題提法 式(3-58) 矩陣Riccati 微分方程,式(3-60) 全狀態(tài)反饋,Kalman增益K(t) 式(3-62),34,無限時(shí)間輸出調(diào)節(jié)器,優(yōu)化問題提法,式(3-63) 定理3-1有4部份: (a) P(t)= Pbar=const的充要條件為(A , B) 能穩(wěn)定 能觀性

13、分解,式(3-66) 代入系數(shù)矩陣,式(3-64)即式(3-68) 從式(3-69)的第二式、第三式和邊界條 件得 P12(t)=O ,P22(t)=O,得式(3-70) 不能觀極點(diǎn)在A22中,不影響P(t),35,(續(xù))無限時(shí)間輸出調(diào)節(jié)器,設(shè)能觀,不會(huì)影響證明P(t)= Pbar=const 從能控性分解式(3-71)出發(fā) 證必要條件(能穩(wěn)定): 設(shè)(A , B)不能穩(wěn)定(不穩(wěn)定極點(diǎn)不能控) 不能控極點(diǎn)在A22中,輸出z(t)和 J 都發(fā)散 按式(3-25),P(t)不存在,Pbar不存在 證充分條件(能穩(wěn)定): 設(shè)能穩(wěn)定(不穩(wěn)定極點(diǎn)能控) 式(3-73)說明P(t)有上界,36,(續(xù))無限

14、時(shí)間輸出調(diào)節(jié)器,式(3-73)單調(diào)非減,得P(t)單調(diào)非減 有唯一極限P(t)= Pbar=const (b) 若能穩(wěn)定,能檢測(cè),則唯一的Pbar半正定 P(t)= Pbar=const,式(3-64)退化為矩陣Riccati 代數(shù)方程,式(3-65),前已證有唯一極限Pbar 能檢測(cè)(不能觀極點(diǎn)穩(wěn)定),不考慮不能觀部分 由式(3-24)及式(3-25)得 Pbar半正定 (c) u(t)穩(wěn)定的充要條件為能穩(wěn)定,能檢測(cè),37,(續(xù))無限時(shí)間輸出調(diào)節(jié)器,證必要條件: 必需能穩(wěn)定和能檢測(cè),否則不穩(wěn)定極點(diǎn)不能 控,不能觀極點(diǎn)不穩(wěn)定 證充分條件: 能控性分解式(3-71),得式(3-75) 從式(3-

15、75)可寫出式(3-76),解出P11(t) 能控性分解中的A11含能控的極點(diǎn)(包括不 穩(wěn)定的極點(diǎn)), A11-B1R-1(B1)TP11漸近穩(wěn)定 A22含不能控的極點(diǎn)(但包括穩(wěn)定的極點(diǎn)),38,(續(xù))無限時(shí)間輸出調(diào)節(jié)器,(A11,B1)能控包含(A11,B1)能穩(wěn)定,按本定理 (a) P11(t)=P11bar=const 的充要條件為(A11,B1) 能穩(wěn)定 最優(yōu)反饋控制為式(3-77) 反饋系統(tǒng)為式(3-78) 分塊上三角形矩陣的特征值取決于對(duì)角塊 各矩陣的,因A11-B1R-1(B1)TP11漸近穩(wěn)定 及A22漸近穩(wěn)定,故反饋系統(tǒng)漸近穩(wěn)定,39,(續(xù))無限時(shí)間輸出調(diào)節(jié)器,(d)設(shè)Q正定

16、,Pbar正定的充要條件為能觀 證必要條件(能觀): 設(shè)部分能觀,能觀性分解,式(3-66), 在本定理(a)中有式(3-70) det P(t)=0, P(t)非正定,Pbar非正定 證充分條件(能觀): 反設(shè)能觀,但Pbar非正定 存在x0 0 ,不加控制,卻可使輸出為0, 荒謬,故Pbar 正定,40,(續(xù))無限時(shí)間輸出調(diào)節(jié)器,Pbar的解析解 令非異變換T,式(3-82) 對(duì)Hamilton矩陣可驗(yàn)證式(3-83) 式(3-84)表示 陣有特征值 式(3-85)表示 陣有特征值 - 陣無復(fù)特征值 模態(tài)陣M使 陣分塊對(duì)角化,式(3-87) 有相異特征值時(shí),分塊對(duì)角化,41,(續(xù))無限時(shí)間

17、輸出調(diào)節(jié)器,有重復(fù)特征值時(shí),Jordan塊 從式(3-87) 式(3-92) Pbar=M21(M11)-1 見程序集 Pbar的數(shù)值解 見程序集 用控制系統(tǒng)工具箱 見程序集,42,使用 LQR的系統(tǒng)的穩(wěn)定裕量,式(3-102)式(3-109),Kalman不等式 單輸入系統(tǒng)的Kalman不等式 式(3-110) 式(3-111) 系統(tǒng)方框圖,圖3-6 開環(huán)傳遞函數(shù)與開環(huán)頻率特性 圖3-7,頻率特性 幅度余量無限大 相位余量至少600 以全狀態(tài)反饋為條件,43,小結(jié),有限時(shí)間調(diào)節(jié)器的設(shè)計(jì),只需求解矩 陣Riccati 微分方程,為終值問題,它 比TPBVP容易解 無限時(shí)間調(diào)節(jié)器的設(shè)計(jì),僅需求解

18、矩 陣Riccati代數(shù)方程,它又比有限時(shí)間 調(diào)節(jié)器的設(shè)計(jì)簡(jiǎn)單,又容易實(shí)現(xiàn) 有限時(shí)間調(diào)節(jié)器的設(shè)計(jì),得K(t) 無限時(shí)間調(diào)節(jié)器的設(shè)計(jì),得K,44,(續(xù))小結(jié),必須先選取幾組加權(quán)矩陣Q及R,通過設(shè) 計(jì)和仿真,修改Q及R,直至獲得滿意的 暫態(tài)過程,控制器設(shè)計(jì)才告終 LQR的優(yōu)異性能(幅度余量無限大,相 位余量至少600)以全狀態(tài)反饋為條件 LQR是自動(dòng)控制理論發(fā)展中的一個(gè)里程 碑(雖然有缺點(diǎn)),45,第4章 離散系統(tǒng)最優(yōu)控制,引言 兩種離散系統(tǒng) 優(yōu)化問題提法 離散變分法與Euler方程 泛函求極值(無約束) 泛函的一次變分 式(4-3),式(4-4),46,(續(xù))離散變分法與Euler方程,泛函極值

19、存在的必要條件 式(4-5) Euler方程和橫截條件 式(4-8),47,離散系統(tǒng)最優(yōu)控制,泛函求極值 式(4-9) 化為無約束優(yōu)化問題 式(4-10), Lagrange乘子向量(k+1) 泛函極值存在的必要條件 橫截條件,伴隨方程,耦合方程, 狀態(tài)方程,式(4-15) 例4-1,48,有限時(shí)間離散LQR問題,時(shí)變情況 泛函求極值,式(4-17) 泛函極值存在的必要條件 伴隨方程,耦合方程,橫截條件 兩點(diǎn)邊值問題,式(4-24),Hamilton矩陣H(k) 矩陣Riccati差分方程三種形式 式(4-26a),式(4-26b),式(4-26c) 最優(yōu)反饋控制結(jié)構(gòu),圖4-1 式(4-27)

20、,式(4-28),Kalman增益K(k),49,(續(xù))有限時(shí)間離散LQR問題,非時(shí)變情況 泛函求極值,式(4-17) 矩陣Riccati差分方程三種形式 式(4-26a),式(4-26b) ,式(4-26c) 最優(yōu)反饋控制結(jié)構(gòu) 式(4-27),式(4-28) ,Kalman增益K(k) P(k)的解析解,式(4-30) 例4-2,50,(續(xù))有限時(shí)間離散LQR問題,P(k)的數(shù)值解 見程序集 例4-3,51,無限時(shí)間離散LQR問題,矩陣Riccati 代數(shù)方程 式(4-26a)退化為式(4-41a) 式(4-26b)退化為式(4-41b) 式(4-26c)退化為式(4-41c) 式(4-27

21、)退化為式(4-42a) 式(4-28)退化為式(4-42b) 全狀態(tài)反饋,52,(續(xù))無限時(shí)間離散LQR問題,Pbar的解析解 式(4-44) 式(4-48)求H-1的過程: 令非異變換T,同式(3-82) 對(duì)Hamilton矩陣H可驗(yàn)證式(4-46) T及H的內(nèi)容代入式(4-46),得式(4-48) 設(shè)H-1的特征值和相應(yīng)的特征向量fT gTT,求 H的特征值: H-1的內(nèi)容代入式(4-49),得式(4-50) 展開并重組,得式(4-52),53,(續(xù))無限時(shí)間離散LQR問題,向量形式,式(4-53),即式(4-54) 式(4-54)說明H有特征值 故H-1有特征值1/(前已設(shè)H-1有特征

22、值) 故H有特征值和1/ H只含實(shí)特征值(無復(fù)特征值),并只分為 穩(wěn)定的和不穩(wěn)定的兩種,即只分為位于單 位圓內(nèi)的和單位圓外的兩種(若在單位 圓內(nèi),1/必在單位圓外),54,(續(xù))無限時(shí)間離散LQR問題,模態(tài)陣M使 陣分塊對(duì)角化,式(4-56) 有相異特征值時(shí),分塊對(duì)角化 有重復(fù)特征值時(shí),Jordan塊 M和H的內(nèi)容代入式(4-56) 從式(4-56) 式(4-65) Pbar=M22(M12)-1 例4-4,55,(續(xù))無限時(shí)間離散LQR問題,Pbar的數(shù)值解 見程序集 例4-5 用控制系統(tǒng)工具箱 見程序集 例4-6,例4-7,56,第5章 最大值原理,引言 式(5-1)不能用變分法求解的原因

23、 最小值原理 引理5-1的敘述 : 非線性、非時(shí)變系統(tǒng),給定初始條件, 控制有界,57,(續(xù))最小值原理,xi(t)為連續(xù)函數(shù),用最大值范數(shù);在 不同的i時(shí),從xi(t)的最大值范數(shù)中取 最大的一個(gè)作為x向量的范數(shù) ui(t)可為按段光滑的函數(shù),取p范數(shù), 當(dāng)p=1, 則為1范數(shù);在不同的i時(shí),從 ui(t)的1范數(shù)中取上確界(最小的上界 )作為u向量的范數(shù) 求證:x和u的范數(shù)為同階無窮小,58,(續(xù))最小值原理,引理5-1的證明過程: 設(shè)微分方程滿足Lipschitz條件(即設(shè)為壓縮 映射),式(5-2) 附錄5A 賦范線性向量空間 最大值范數(shù),p范數(shù) Banach空間 Cauchy序列,完

24、備性 壓縮映射與不動(dòng)點(diǎn) 壓縮映射原理,59,(續(xù))最小值原理,dx/dt=f(x) 可化為x=F(x) u取最優(yōu)控制,式(5-2)化為式(5-3) 由 Frchet微分的定義,得式(5-4) Frchet微分df,式(5-5) 式(5-6)的推導(dǎo)過程,并類似得式(5-7) 對(duì)狀態(tài)方程兩邊取Frchet微分,式(5-8) 攝動(dòng)方程的解,式(5-9) x和u的范數(shù)為同階無窮小,式(5-10),60,(續(xù))最小值原理,引理5-2的敘述: 非線性、非時(shí)變系統(tǒng),給定初始條件, 控制有界 目標(biāo)函數(shù),式(5-12) 求證:目標(biāo)值的差為式(5-13) 引理5-2的證明過程: 化為無約束優(yōu)化問題,式(5-14)

25、,61,(續(xù))最小值原理,推演式(5-15),并類似得式(5-16) 推演式(5-17) 定理5-1的敘述: 泛函求極值,式(5-18) ,控制有界 泛函極值存在的必要條件 伴隨方程,狀態(tài)方程,H全局最小, 式(5-19) 定理5-1的證明過程:,62,(續(xù))最小值原理,耦合方程已不復(fù)存在,但伴隨方程和狀態(tài)方程 仍為必要條件 證明H全局最小為必要條件時(shí),用反證法 設(shè)tbart0 , tf , w,有式(5-21) 因f及連續(xù), tbar 的鄰域ta , tb, tbar ta , tb 為 t0 , tf的子集,0,有式(5-22) 取特殊控制u 當(dāng)t不屬于ta , tb 時(shí), u=ucap

26、當(dāng)t屬于ta , tb 時(shí), u =w,63,(續(xù))最小值原理,卻有J(ucap)-J(u) 0 式(5-23)表明事實(shí)相反,故上述特殊控制 u 非最優(yōu)控制 因tbar任取,故式(5-23)之證明有普遍意義 因伴隨方程、狀態(tài)方程均為必要條件,故式 (5-19)仍為必要條件,64,Bang-Bang控制,式(5-24)的兩個(gè)特點(diǎn) Hamilton函數(shù) 使用“H全局最小” ui取兩個(gè)極端值,Bang-Bang Bang-Bang 產(chǎn)生的條件,65,時(shí)間最優(yōu)控制系統(tǒng)的性質(zhì),線性非時(shí)變系統(tǒng)的時(shí)間最優(yōu)控制 式(5-25)的物理概念 Hamilton函數(shù)H,式(5-26) 橫截條件,式(5-27) 協(xié)態(tài)方

27、程,式(5-29) 狀態(tài)方程 H全局最小,式(5-30) ui(t)= - sgnBT(t)i 式(5-25)為另一種形式的提法,本質(zhì)不變,66,(續(xù))時(shí)間最優(yōu)控制系統(tǒng)的性質(zhì),命題5-1的敘述: 式(5-25)所示時(shí)間最優(yōu)控制問題 ui(t)= - sgnBT(t)i為唯一的 命題5-1的證明過程: 協(xié)態(tài)方程的解中,(0) 0 ,否則矛盾 (t) 0 , ui(t)不發(fā)生奇異情況 若設(shè)u1,u2兩個(gè)不同的最優(yōu)控制向量, 則與狀態(tài)方程解的唯一性相矛盾,67,(續(xù))時(shí)間最優(yōu)控制系統(tǒng)的性質(zhì),命題5-2的敘述: 式(5-25)所示時(shí)間最優(yōu)控制問題 若存在最優(yōu)控制ui(t)= - sgnBT(t) i

28、式(5-30) ui(t)至多切換n-1次 命題5-2的證明過程: 協(xié)態(tài)方程的解,式(5-31) 最優(yōu)控制可改寫為ui(t)= - sgn(e-Atbi)T0,68,(續(xù))時(shí)間最優(yōu)控制系統(tǒng)的性質(zhì),切換條件為(e-Atbi)T0=0,式(5-32) 設(shè)有相異特征值,式(5-32)改為式(5-33) 滿足此式t的個(gè)數(shù),即為切換次數(shù) 用數(shù)學(xué)歸納法證之 n=1時(shí)成立 n=2時(shí)成立 設(shè)n-1時(shí)成立,應(yīng)證明n時(shí)也成立,用反證法 :先反設(shè)式(5-33)有n個(gè)實(shí)根,結(jié)果自相 矛盾;有n-1個(gè)實(shí)根,才能自圓其說,69,無阻尼運(yùn)動(dòng)的時(shí)間最優(yōu)控制,物理背景,式(5-36) 優(yōu)化問題提法,式(5-39) H函數(shù) 協(xié)態(tài)

29、方程 H全局最小,式(5-40) 啟發(fā)式求解 u=+1 , 式(5-41a) u=-1 , 式(5-41b),70,(續(xù))無阻尼運(yùn)動(dòng)的時(shí)間最優(yōu)控制,式(5-41a)及式(5-41b)示于圖5-1 分析圖5-2 開關(guān)函數(shù),式(5-43) 控制系統(tǒng)方框圖,圖5-3,71,存在恢復(fù)力時(shí),無阻尼運(yùn)動(dòng)的 時(shí)間最優(yōu)控制,物理背景,式(5-45) 優(yōu)化問題提法,式(5-47) H函數(shù) H全局最小,式(5-48) 協(xié)態(tài)方程,式(5-49),從圖5-4看出切 換的持續(xù)時(shí)間為 啟發(fā)式求解 u=+1 , 式(5-51) u=-1 , 式(5-52),72,(續(xù))存在恢復(fù)力時(shí),無阻尼運(yùn) 動(dòng)的時(shí)間最優(yōu)控制,式(5-51

30、)及式(5-52)示于圖5-5,基 本的開關(guān)線 分析圖5-5,衍生出開關(guān)線的總體,圖5-6 開關(guān)函數(shù),式(5-54) 控制系統(tǒng)方框圖,圖5-7,73,燃料最優(yōu)控制系統(tǒng)的性質(zhì),物理背景 泛函求極值,式(5-55) H函數(shù) H全局最小,式(5-58) 式(5-58)的圖示,圖5-8(a),(b),兩者 疊合得圖5-9的陰影區(qū) 陰影區(qū)的下部邊界即為式(5-58)的解 式(5-60)與式(5-61)對(duì)照,用死區(qū)函 數(shù)表示,圖5-10,Bang-off-Bang,74,無阻尼運(yùn)動(dòng)的燃料最優(yōu)控制,優(yōu)化問題提法,式(5-63) 物理背景 H函數(shù) 協(xié)態(tài)方程 H全局最小 啟發(fā)式求解 u=+1 , 式(5-41a

31、) u=-1 , 式(5-41b) u=0, 式(5-65),式(5-66),75,(續(xù))無阻尼運(yùn)動(dòng)的燃料最優(yōu)控制,若初速為0,又u=0,則不能控 圖5-11,四個(gè)區(qū)域分析 圖5-12,開關(guān)線 控制系統(tǒng)方框圖,圖5-13,76,SIMULINK用于Bang-Bang控制 的仿真,見程序集,77,小結(jié),最大值原理是自動(dòng)控制理論發(fā)展中的一 個(gè)里程碑,至今尚無取代物 最大值原理與LQR思路各不相同:前者 在約束條件中直接考慮控制有界;后者 在目標(biāo)函數(shù)中間接考慮控制能量消耗要 少 Bang-Bang控制有產(chǎn)生的條件,并有 適用的范圍,78,第6章 動(dòng)態(tài)規(guī)劃,引言 定積分與無窮和式 最優(yōu)控制與最優(yōu)決策序

32、列 單段決策過程和多段決策過程 不同的求解方法,79,多段決策過程,動(dòng)態(tài)系統(tǒng)的遞推關(guān)系,圖6-1 多段決策過程 泛函求極值,式(6-2) 加性可分目標(biāo)函數(shù) u(N)不存在,圖6-2,80,動(dòng)態(tài)規(guī)劃的基本思想,假定 現(xiàn)在和將來的決策不影響過去的狀 態(tài)、決策和目標(biāo) 在k時(shí)刻,由x(k)立即作出決策u(k) 改寫為普遍形式,式(6-3) 簡(jiǎn)記I(x , k) , 式(6-4),81,(續(xù))動(dòng)態(tài)規(guī)劃的基本思想,Bellman方程的推演過程: 按假定1,先對(duì)u(k+1),u(k+2),u(N-1) 求min,后對(duì)u(k)求min 和式分開寫 (x(k),u(k),k)和u(k+1),u(k+2),u(N-1) 無關(guān),可提至min記號(hào)外 再次使用式(6-4)之定義 式(6-5),Bellman方程,遞推關(guān)系, 動(dòng)態(tài)規(guī)劃,82,(續(xù))動(dòng)態(tài)規(guī)劃的基本思想,動(dòng)態(tài)規(guī)劃的特點(diǎn) 目標(biāo)值反向掃掠 狀態(tài)值正向掃掠 兩者聯(lián)系的紐帶為最優(yōu)決策序列 每一段中尋求最優(yōu)決策的方法是關(guān)鍵 例6-1及例6-2使用求導(dǎo)(局部極值)和解代數(shù)方程,可使用符號(hào)計(jì)算(見程序集) 例6-3及例6-4,用數(shù)值比大?。ㄈ謽O值),見表6-2,表6-3,表6-4,83,用動(dòng)態(tài)規(guī)劃求解離散LQR問題,有限時(shí)間離散LQR問題,式(6-6) 寫出Bellman方程,式(6-7) 令I(lǐng)(x,k)=(1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論