北京交通大學(xué)最優(yōu)控制理論與算法研究生課程第四章-極大值原理_第1頁(yè)
北京交通大學(xué)最優(yōu)控制理論與算法研究生課程第四章-極大值原理_第2頁(yè)
北京交通大學(xué)最優(yōu)控制理論與算法研究生課程第四章-極大值原理_第3頁(yè)
北京交通大學(xué)最優(yōu)控制理論與算法研究生課程第四章-極大值原理_第4頁(yè)
北京交通大學(xué)最優(yōu)控制理論與算法研究生課程第四章-極大值原理_第5頁(yè)
已閱讀5頁(yè),還剩93頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、極大值原理(1/4),第 4 章 極大值原理 前一章討論的最優(yōu)控制問題都基于以下基本假定: 控制量u(t)的取值范圍U不受任何限制,即控制域U充滿整個(gè)r維控制空間,或者U是一個(gè)開集。 即控制量u(t)受等式條件約束 但是,大多數(shù)情況下控制量總是受限制的。 例如,控制量可能受如下大小限制 |ui(t)|a i=1,2,r 式中, a 為已知常數(shù)。,極大值原理(2/4),上述約束條件即相當(dāng)于容許控制空間U是一個(gè)超方體。 甚至, 有些實(shí)際控制問題的控制量為某一孤立點(diǎn)集。 例如, 繼電器控制系統(tǒng)的控制輸入限制為 ui(t) =a i=1, 2, , r 一般情況下, 可將控制量所受的約束用不等式來(lái)表示

2、 Mi(u(t),t)0, i=1,2, 當(dāng)控制變量u(t)受不等式約束條件限制時(shí), 古典變分法就無(wú)能為力了。 最優(yōu)控制往往需要在閉集的邊界上取值。 這就要求人們?nèi)ヌ剿餍碌睦碚摵头椒ā?極大值原理(3/4),應(yīng)用古典變分法的另一個(gè)限制條件是要求函數(shù)L(x,u,t), f(x,u,t), S(x(tf),tf) 對(duì)其自變量的連續(xù)可微性, 特別是要求H/u=0存在。 因此, 對(duì)于 有較大實(shí)際意義的性能指標(biāo)泛函就無(wú)能為力了。 所以,類似消耗燃料最小這類常見最優(yōu)控制就無(wú)法用古典變分法來(lái)解決。,極大值原理(4/4),鑒于古典變分法的應(yīng)用條件失之過嚴(yán),引起了不少數(shù)學(xué)界和控制界學(xué)者的關(guān)注。 貝爾曼的動(dòng)態(tài)規(guī)劃

3、和龐特里亞金的極大值原理是較為成功的,應(yīng)用很廣泛,成為解決最優(yōu)控制問題的有效工具。 本節(jié)主要介紹極大值原理的結(jié)論及其啟發(fā)性證明。 講授內(nèi)容為 自由末端的極大值原理 極大值原理的證明 極大值原理的幾種具體形式 約束條件的處理,自由末端的極大值原理(1/8),4.1 自由末端的極大值原理 最優(yōu)控制問題的具體形式是多種多樣的,在第2章的討論中可知,3種泛函問題(拉格朗日問題、波爾扎問題和麥耶爾問題)的表達(dá)形式可以互相轉(zhuǎn)換。 這里,研究泛函為定常的末值型性能指標(biāo)的最優(yōu)控制問題(麥耶爾問題),然后將結(jié)論逐步推廣至其他最優(yōu)控制問題。 下面,就定常的末值型性能指標(biāo)、末態(tài)自由的控制問題來(lái)敘述極大值原理。,自由

4、末端的極大值原理(2/8)定理7-9,定理 9(極大值原理) 設(shè)u(t)U, tt0,tf, 是一容許控制。 指定的末值型性能指標(biāo)泛函為 Ju()=S(x(tf), 式中,x(t)是定常的被控系統(tǒng) 相應(yīng)于控制量u(t)的狀態(tài)軌線,tf為未知的末態(tài)時(shí)刻。 設(shè)使該性能指標(biāo)泛函極小的最優(yōu)控制函數(shù)為u*(t)、最優(yōu)狀態(tài)軌線為x*(t)。 則必存在不恒為零的n維向量函數(shù)(t),使得 1) (t)是方程,自由末端的極大值原理(3/8),滿足 2) 邊界條件 的解, 其中哈密頓函數(shù)為 3)則有 即,自由末端的極大值原理(4/8),4) 沿最優(yōu)軌線哈密頓函數(shù)應(yīng)滿足 下面先對(duì)上述極大值原理的涵義作簡(jiǎn)單的解釋,再

5、給出該定理的啟發(fā)性證明。,自由末端的極大值原理(5/8),容許控制條件的放寬。 古典變分法應(yīng)用于最優(yōu)控制問題,要求控制域U=Rr,即控制域U充滿整個(gè)r維控制空間。 然后,從控制量的變分u(t)的任意性出發(fā),導(dǎo)出極值條件H/u=0。 這一條件是非常嚴(yán)格的。 其一,它要求哈密頓函數(shù)H對(duì)控制量u(t)連續(xù)可微; 其二,它要求控制量的變分u(t)具有任意性, 即控制量u(t)不受限制, 或僅在受等式約束條件限制的開集中取值。,自由末端的極大值原理(6/8),2) 定理9中的式(93)和(94)同樣稱為協(xié)態(tài)方程和橫截條件,其相應(yīng)求解方法與基于古典變分法的最優(yōu)控制求解方法類似。 變分法的極值條件是一種解析

6、形式,而極大值原理的極值求解條件(96)是一種定義形式,不需要哈密頓函數(shù)H對(duì)控制量u(t)的可微性加以約束,而且對(duì)于通常的對(duì)u(t)的約束都是適用的, 例如,u(t) 受不等式約束條件約束, 即在閉集中取值。,自由末端的極大值原理(7/8),3) 由極值求解條件(96)可知,極大值原理得到的是全局最小值,而非局部極值,而古典變分法中由極值條件H/u=0得到的是局部極小值。 再則,如果把條件(96)仍稱為極值條件,則極大值原理得到的是強(qiáng)極值。 而古典變分法在歐拉方程推導(dǎo)時(shí),對(duì)極值曲線x*(t)和其導(dǎo)數(shù)都引入變分,得到的是弱極值。 不難理解,當(dāng)滿足古典變分法的應(yīng)用條件時(shí),極值條件H/u=0只是極大

7、值原理的極值求解條件(96)的一個(gè)特例。,自由末端的極大值原理(8/8),4) 在上述定理中,最優(yōu)控制u*(t)使哈密頓函數(shù)取最小值。 所謂“極小值原理”一詞正源于此,稱“極大值原理”是習(xí)慣性叫法。 若實(shí)際控制問題需求極大值,可將極值求解條件的求最小(min)改為求最大(max)即可。 5) 極大值原理只給出最優(yōu)控制的必要條件,并非充分條件。 得到的解是否能使泛函J最小,還有待證實(shí)。 極大值原理更沒有涉及解的存在性問題。 如果實(shí)際問題的物理意義已經(jīng)能夠判定所討論的問題的解是存在的,而由極大值原理所求出的控制僅有一個(gè),可以斷定,此控制就是最優(yōu)控制。 實(shí)際遇到的問題往往屬于這種情況。,極大值原理的

8、證明(1/2),7.4.2 極大值原理的證明 龐特里亞金對(duì)極大值原理作了嚴(yán)格的證明,涉及拓?fù)鋵W(xué)、實(shí)函數(shù)分析等很多數(shù)學(xué)問題,這是作為工科教材難以詳細(xì)論述的。 本教材利用增量法給出極大值原理的一個(gè)啟發(fā)性證明。 證明中所作的假設(shè)是: 1) 函數(shù) f(x,u) 和 S(x(tf) 都是其自變量的連續(xù)函數(shù); 2)函數(shù)f(x,u)和S(x(tf)對(duì)于x是連續(xù)可微的,即f/x和S/x(tf)存在且連續(xù), 但并不要求函數(shù) f(x,u)對(duì)u可微;,極大值原理的證明(2/2),3) 為了保證微分方程解的存在和惟一性,假定f(x,u)在任意有界集上對(duì)自變量 x 滿足如下李普希茨(Lipschitz)條件 f(x1,

9、u)-f(x2,u)x1-x2 0,x1,x2XRn,uURr 下面敘述用增量法證明極大值原理的過程,證明步驟為: 構(gòu)造泛函J的增量 求取x(t)的表達(dá)式 對(duì) x(t)進(jìn)行估計(jì) 極值條件的推證 tf的考慮 然后介紹一基于極大值原理的最優(yōu)控制算例,泛函J的增量(1/2),(1) 泛函J的增量 假定末態(tài)時(shí)刻tf已知,根據(jù)S(x(tf)對(duì)x(tf)的連續(xù)可微性泛函J的增量J可表示為 式中u*(t)和x*(t)分別表示最優(yōu)控制函數(shù)及相應(yīng)的最優(yōu)軌線; x(t)為x(t)在最優(yōu)軌線x*(tf)附近的變分; o(x(tf)表示泰勒展開式中x(tf)的高階項(xiàng)。,Ju()=S(x(tf),泛函J的增量(2/2)

10、,要從Ju*()0的條件導(dǎo)出最優(yōu)控制必要條件, 首先應(yīng)找出x(t)與控制量u(t)的變分u(t)的關(guān)系, 進(jìn)而對(duì)x(t)作出估計(jì)。 下面為表述更簡(jiǎn)潔, 時(shí)間函數(shù)x(t)與u(t)的時(shí)間變量t略去不寫。,x(t)的表達(dá)式(1/3),(2) x(t)的表達(dá)式 根據(jù)f(x,u)對(duì)x的可微性,由狀態(tài)方程(92)可得如下由控制量的變分u(t)引起的狀態(tài)方程(92)的變分,x(t)的表達(dá)式(2/3),令矩陣函數(shù)(t,s)為線性狀態(tài)方程 的狀態(tài)轉(zhuǎn)移矩陣,即(t,s)滿足如下微分方程組 考慮到x(t0)=0,則x(t)在t=tf時(shí)的解為,x(t)的表達(dá)式(3/3),將上述方程代入式(98),則得泛函J的增量J

11、為 上式雖然給出了泛函增量J與(u,x )的關(guān)系,但是對(duì)一般形式的u, 還很難估計(jì)上式的J。 然而,對(duì)任意的u, 上式均成立,故對(duì)特定的u也應(yīng)成立。 為此,下面討論時(shí)取一特定的變分u,以利于對(duì)上式的估計(jì)。,對(duì)x(t)的估計(jì)(1/11),(3) 對(duì)x(t)的估計(jì) 設(shè)u(t)是控制u(t)的任意變分,對(duì)應(yīng)x(t)的增量x(t)應(yīng)滿足如下方程 將上式的第一式改寫為,對(duì)x(t)的估計(jì)(2/11),對(duì)于給定的u(t)和u(t),由于它們的分段連續(xù)性,必存在有界的U1U及XRn,使u(t)+u(t)U1,x(t)X,對(duì)所有的tt0,tf,根據(jù)李卜希茨條件,必存在0,滿足 f(x+x,u+u)-f(x,u+

12、u)0,則 f(x,u+u)-f(x,u)|b(t)| tt0,tf 其中 于是由式(105)可知, x(t)滿足,對(duì)x(t)的估計(jì)(3/11)引理 2,為了作進(jìn)一步的估計(jì),下面先引入一個(gè)引理。 引理 2 證明 由歐幾里德范數(shù)(2-范數(shù))的定義,有 從而有 證畢,對(duì)x(t)的估計(jì)(4/11),因此,由引理 2和式(109),有 即 將兩邊乘以e-t,得 解得,對(duì)x(t)的估計(jì)(5/11),至今我們還沒有對(duì)u(t)作任何限制。 為了使變分后的控制u(t)仍屬于容許控制空間,即u(t)U,對(duì)所有的tt0,tf, 為了便于導(dǎo)出極值求解條件,采用一種異于古典變分的特定形式的變分-針狀變分。,圖5 針狀

13、變分示意圖,令為最優(yōu)控制u*(t)的任意一個(gè)連續(xù)點(diǎn), l0是某一確定的數(shù), 0是一個(gè)充分小的數(shù)。 可將控制量的變分u(t)取成一個(gè)依賴于,l和的針狀變分,如圖5所示。,對(duì)x(t)的估計(jì)(6/11),上述針狀變分記為u(t), 可表示為,式中, U表示任意容許控制,這就是說(shuō),在充分小的時(shí)間區(qū)間,+l內(nèi), 可以取控制域U內(nèi)的任何點(diǎn)。 當(dāng)然,也可以取閉集上的點(diǎn)。 變分 是一個(gè)有限量。 當(dāng)是一個(gè)充分小的量時(shí), 則由u(t)所引起的變分x(t)是否仍為一個(gè)充分小的量。,對(duì)x(t)的估計(jì)(7/11),下面證明由針狀變分u(t)引起的狀態(tài)增量x(t)是一個(gè)與同階的無(wú)窮小量。 事實(shí)上,當(dāng)控制量作針狀變分時(shí),式

14、(108)可表示為 于是,由式(111)可知,由針狀變分u(t)引起的狀態(tài)增量x(t)為 上式表明,x(t)與0是同階無(wú)窮小量。,對(duì)x(t)的估計(jì)(8/11),據(jù)此,由式(103)可得如下由針狀變分u(t)所引起的泛函J的變分J的表達(dá)式,對(duì)x(t)的估計(jì)(9/11),上式中后3項(xiàng)都是的高階無(wú)窮小量,可歸并成一項(xiàng),則上式可記為,對(duì)x(t)的估計(jì)(10/11),令 則向量(t)必滿足狀態(tài)方程的協(xié)態(tài)方程及邊界條件,對(duì)x(t)的估計(jì)(11/11),若記 則共軛方程( 118)可寫成 于是,泛函增量表達(dá)式( 116)可改寫成,極值條件的推證(1/4),(4) 極值條件的推證 已記u*(t)是使泛函J取最

15、小值的最優(yōu)控制, x*(t)為相應(yīng)的軌線, 而(t)是協(xié)態(tài)方程的解。 所以,對(duì)任意的控制變分,當(dāng)然也包含對(duì)u(t)的針狀變分,泛函的增量(122)必滿足 因?yàn)閤*(t)和(t)在tt0,tf范圍內(nèi)是連續(xù)函數(shù),而u*(t)和 =u*(t)-u(t)在上式的積分范圍內(nèi)也是連續(xù)的,所以哈密頓函數(shù)H是一連續(xù)函數(shù)。,極值條件的推證(2/4),根據(jù)中值定理及H的連續(xù)性,則有 式中,01。 將上式代入式( 123),可得 用除上式的兩邊,得,極值條件的推證(3/4),當(dāng)0時(shí),考慮到l0,則有 或?qū)懽?由于上式在區(qū)間t0,tf內(nèi)u*(t)的所有連續(xù)點(diǎn)都成立。 同時(shí)考慮到 要取遍容許控制域U中所有的點(diǎn),因此,上

16、式也可表示為 式中,是區(qū)間t0,tf內(nèi)u*(t)的任意連續(xù)點(diǎn)。,極值條件的推證(4/4),由于假定u(t)是分段連續(xù)函數(shù),而u*(t)的不連續(xù)點(diǎn)上的函數(shù)值如何, 并不影響控制效果, 因此,不妨認(rèn)為(127)對(duì)于任意的t0,tf都成立。 這就是說(shuō),如果u*(t)U, tt0,tf是最優(yōu)控制,則對(duì)所有tt0,tf都必須滿足 從而證明了極值條件。,tf的考慮(1/9),(5) tf的考慮 前面僅僅考慮了末態(tài)時(shí)刻tf給定的情況。 當(dāng)tf可變時(shí),還要考慮由tf的改變量tf所引起的泛函改變量。 設(shè)u*(t)是使性能指標(biāo)泛函最小的最優(yōu)解, x*(t)是相應(yīng)的最優(yōu)軌線。 若令tf的改變量tf=T1,其中T1為

17、任意常數(shù),并同時(shí)考慮控制u(t)的針狀變分u()。,Ju()=S(x(tf),tf的考慮(2/9),根據(jù)S(x(tf)的可微性 ,則有 上式對(duì)任意T1及任意控制變分均成立, 對(duì)u(t)0時(shí)也成立。 當(dāng)u(t)0時(shí),顯然有u(tf)=0, 考慮到T1為任意實(shí)數(shù),于是可得,Ju()=S(x(tf),tf的考慮(3/9),因此,有 從而證明了式(97)的第1部分。 當(dāng)取T1=0,對(duì)于針狀變分u(t)應(yīng)有 因此,依上述證明過程(1)(4),同樣可以證明式(128)成立。,tf的考慮(4/9),下面證明當(dāng) tf 固定, x(tf)自由時(shí),式( 97)的第2部分的證明。 哈密頓函數(shù)H的增量可表示為 考慮到

18、哈密頓函數(shù)H(x,u)對(duì)x和的連續(xù)可微性,因此,由泰勒展開式可得哈密頓函數(shù)的一階增量表示式,若定義 =u*(t+t),則由上式有如下H的一階增量式 考慮到u*(t)是最優(yōu)控制函數(shù), 由極值條件則有,tf的考慮(5/9),tf的考慮(6/9),考慮到時(shí)間增量t的任意性,其值可正可負(fù)。 因此, 由上式可知, 當(dāng)t0時(shí), H0,則意味著哈密頓函數(shù)H隨時(shí)間t遞增; 而當(dāng)t0時(shí), H0則意味著哈密頓函數(shù)H隨時(shí)間t遞減。 故證明了 即證明了式 ( 97)的第2部分。 綜合式(128)和上式,即證明了式 (97)。,tf的考慮(7/9)例10,例 10 給定被控系統(tǒng) 控制變量u(t)受不等式約束 -1u(t

19、)1 約束,試求最優(yōu)控制函數(shù)u*(t)和最優(yōu)軌線x*(t),使性能指標(biāo)泛函 J=x2(1) 最小。,tf的考慮(7/9),解 該問題的哈密頓函數(shù)為 則協(xié)態(tài)方程是 其末端條件(橫截條件)為 解之得 1(t)=1- et-1 , 2(t)=1,tf的考慮(8/9),運(yùn)用極大值原理 解得 由于1(t)=1-et-10, t0,1, 可得 u*(t)=-1 t0,1,1(t)=1-et-1 2(t)=1,tf的考慮(9/9),因此,由 得 同樣,可求得 因此,該問題的最優(yōu)控制函數(shù)u*(t)和最優(yōu)軌線x*(t)分別為,1(t)=1-et-1 2(t)=1,極大值原理的幾種具體形式 (1/1),4.3 極

20、大值原理的幾種具體形式 前面討論了定常系統(tǒng)的定常末值型性能指標(biāo)、末態(tài)自由的最優(yōu)控制問題的極大值原理。 經(jīng)數(shù)學(xué)變換,上述最優(yōu)控制問題的極大值原理的結(jié)論可以推廣至 時(shí)變系統(tǒng) 積分型或復(fù)合型性能指標(biāo) 等控制問題的最優(yōu)控制中, 不再詳加證明。 下面將給出幾種具體的極大值原理形式和分析證明的思路。,時(shí)變情況(1/7),1. 時(shí)變情況 如果描述最優(yōu)控制問題的一些函數(shù),如狀態(tài)方程的 f() 中顯含時(shí)間t, 或末值型性能指標(biāo) S()中顯含時(shí)間tf, 則該問題稱為時(shí)變(非定常)的,并可描述如下。 時(shí)變系統(tǒng)最優(yōu)控制問題 對(duì)時(shí)變的被控系統(tǒng) 求一容許控制u(t)U,tt0,tf,使如下末值型性能指標(biāo)泛函取極值。 Ju

21、()=S(x(tf),tf),時(shí)變情況(2/7),對(duì)于時(shí)變問題,可以通過引進(jìn)新的狀態(tài)變量的方法將時(shí)變的問題變換成定常的問題,再應(yīng)用定常問題的極大值原理(定理9),便可推導(dǎo)出時(shí)變問題的極大值原理。 證明:對(duì)時(shí)變的狀態(tài)方程和性能指標(biāo),引入如下輔助狀態(tài)變量 xn+1(t) = t 使其滿足輔助狀態(tài)方程 和初始條件 xn+1(t0)=t0, xn+1(tf)=tf,時(shí)變情況(3/7),則上述時(shí)變的狀態(tài)方程和性能指標(biāo)泛函可分別變換為如下定常的狀態(tài)方程和性能指標(biāo)泛函 對(duì)上述輔助的定常最優(yōu)控制問題,應(yīng)用極大值原理(定理9),則有如下時(shí)變最優(yōu)控制問題的極大值原理。,時(shí)變情況(4/7)定理10,定理10(時(shí)變系

22、統(tǒng)極大值原理)時(shí)變系統(tǒng)最優(yōu)控制問題的最優(yōu)控制函數(shù)u*(t)、最優(yōu)狀態(tài)軌線x*(t)和協(xié)態(tài)向量函數(shù)(t)使得: 1) x*(t)和(t)滿足規(guī)范方程 式中,哈密頓函數(shù)為,時(shí)變情況(5/7),2) 邊界條件 3) 哈密頓函數(shù)H作為u(t)U的函數(shù),在u(t)=u*(t),tt0,tf時(shí)取絕對(duì)極小,即 或 4) 在最優(yōu)軌線的末端,哈密頓函數(shù)應(yīng)滿足,時(shí)變情況(6/7),5) 沿最優(yōu)軌線哈密頓函數(shù)滿足如下關(guān)系 定理10的證明可直接應(yīng)用定常情況的極大值原理(定理9)給出(略)。,時(shí)變情況(7/7),比較定理10和定理9可知,時(shí)變性并沒有改變極大值原理的規(guī)范方程、橫截條件及極值條件,卻改變了最優(yōu)軌線末端哈密

23、頓函數(shù)的值。 在定常情況下,沿最優(yōu)軌線哈密頓函數(shù)的值為常數(shù)(當(dāng)tf自由時(shí)為零),而時(shí)變時(shí)卻不是常數(shù),它由定理10的條件5)決定。 值得指出的是,定理10的條件(5)不是求解該最優(yōu)控制問題的必要條件,只是描述最優(yōu)軌線上哈密頓函數(shù)的一個(gè)性質(zhì)。 定理10的前4個(gè)條件才是必要的,由它們已經(jīng)能決定出最優(yōu)控制函數(shù)u*(t)、最優(yōu)軌線x*(t)和最優(yōu)末態(tài)時(shí)刻。,積分型性能指標(biāo)(1/7),2. 積分型性能指標(biāo) 最優(yōu)控制的極大值原理討論的性能指標(biāo)泛函為末值型的,實(shí)際上許多控制問題的指標(biāo)函數(shù)為積分型。 對(duì)該類性能指標(biāo)函數(shù)的控制問題可描述如下。 積分型泛函最優(yōu)控制問題 對(duì)定常的被控系統(tǒng)(92),求容許控制u(t)U

24、,tt0,tf,使如下積分型性能指標(biāo)泛函取極值。,積分型性能指標(biāo)(2/7),對(duì)積分型泛函指標(biāo)(138),引入輔助狀態(tài)變量x0,使其滿足 則有 則上述積分型性能指標(biāo)泛函的最優(yōu)控制問題可變換成狀態(tài)方程和性能指標(biāo)泛函分別為 的最優(yōu)控制問題。,積分型性能指標(biāo)(3/7)定理11,對(duì)上述輔助的最優(yōu)控制問題,應(yīng)用極大值原理(定理 9),則有如下積分型性能指標(biāo)泛函的最優(yōu)控制問題的極大值原理。 定理11(積分型泛函極大值原理) 積分型泛函最優(yōu)控制問題的最優(yōu)控制函數(shù)u*(t)、最優(yōu)狀態(tài)軌線x*(t)和協(xié)態(tài)向量函數(shù)(t),使得: 1) x*(t)和(t)滿足規(guī)范方程 式中,哈密頓函數(shù)為,積分型性能指標(biāo)(4/7),2

25、) 邊界條件 3) 哈密頓函數(shù)H作為u(t)U的函數(shù),在u(t)=u*(t),tt0,tf時(shí)取絕對(duì)極小,即 或 4) 在最優(yōu)軌線的末端,哈密頓函數(shù)應(yīng)滿足,積分型性能指標(biāo)(5/7),定理11的證明可直接應(yīng)用定常情況的極大值原理(定理9)給出(略)。 比較定理11和定理9可知,積分型性能指標(biāo)泛函的極大值原理與末值型性能指標(biāo)的極大值原理相比,除哈密頓函數(shù)H的定義和協(xié)態(tài)變量向量函數(shù)(t)的邊界條件有一定區(qū)別之外,其他條件與結(jié)論基本一致。,積分型性能指標(biāo)(6/7),不難驗(yàn)證,若性能指標(biāo)泛函為復(fù)合型的,即 則相應(yīng)的哈密頓函數(shù)為 復(fù)合型性能指標(biāo)泛函的最優(yōu)控制問題的極大值原理與積分型性能指標(biāo)泛函的基本一致,但

26、協(xié)態(tài)變量向量函數(shù)(t)的邊界條件(橫截條件)變?yōu)?可見末值型性能指標(biāo)不影響哈密頓函數(shù)的定義,但會(huì)影響邊界條件(橫截條件)。,積分型性能指標(biāo)(7/7),上面討論的是時(shí)變的、末值型性能指標(biāo)泛函的最優(yōu)控制問題,和定常的、積分型性能指標(biāo)泛函的最優(yōu)控制問題的極大值原理。 由于前面所述的各種最優(yōu)控制問題經(jīng)數(shù)學(xué)變換都可等效到同一類型的最優(yōu)控制問題來(lái)處理,故其他情況的最優(yōu)控制問題的極大值原理可由定理9、定理10和定理11推廣而得。,自由末端的極大值原理(1/1),4.4 末端受約束的極大值原理 前面討論了自由末端問題的極大值原理,下面考慮存在 末態(tài)約束 積分型限制 的最優(yōu)控制問題。,末態(tài)約束問題(1/6),1

27、. 末態(tài)約束問題 末態(tài)x(tf)受約束的控制問題可描述如下。 末態(tài)約束最優(yōu)控制問題 對(duì)定常的被控系統(tǒng)(7-92),其末態(tài)滿足約束(目標(biāo)集) 式中,g1(x(tf)和g2(x(tf)分別表示p維和q維關(guān)于x(tf)的連續(xù)可微向量函數(shù)。 求一容許控制u(t)U,tt0,tf,使末值型性能指標(biāo)(91)取極小值。,末態(tài)約束問題(2/6),末態(tài)約束(144)中末態(tài)時(shí)刻tf是狀態(tài)軌線x(t)與目標(biāo)集M首次相遇的時(shí)刻。 若式(144)中性能指標(biāo)含有末值項(xiàng), pn;否則,pn。 而維數(shù)q不受限制。 與自由末端問題不同,現(xiàn)在要求末態(tài)x(tf)只能落在由約束條件(144)所規(guī)定的目標(biāo)集上。 對(duì)于這種約束條件下的泛

28、函極值問題,如同等式和不等式約束下求函數(shù)極值一樣,通過引入拉格朗日乘子和,將末態(tài)約束化為等價(jià)的末值型性能指標(biāo) J1u()=S(x(tf)+g1(x(tf)+g2(x(tf) 式中,和為不同時(shí)為零的p維和q維常向量。,末態(tài)約束問題(3/6),類似不等式約束的函數(shù)極值問題的庫(kù)恩-塔克爾定理,考慮不等式約束條件的乘子要滿足約束條件 類似于前面定常的末值型性能指標(biāo)泛函的最優(yōu)控制問題的極大值原理的證明,有如下末態(tài)受等式和不等式條件約束的定常末值型性能指標(biāo)泛函的最優(yōu)控制問題的極大值原理。,末態(tài)約束問題(4/6)定理7-12,定理12(末態(tài)約束極大值原理)末態(tài)約束最優(yōu)控制問題的最優(yōu)控制函數(shù)為u*(t)、最優(yōu)

29、狀態(tài)軌線為x*(t)和協(xié)態(tài)向量函數(shù)(t),以及不同時(shí)為零的 p 維常向量 和 q維常向量 ,使得: 1) x*(t) 和 (t) 滿足規(guī)范方程 式中, 哈密頓函數(shù)為,末態(tài)約束問題(5/6),2) 邊界條件 3) 哈密頓函數(shù)H作為u(t)U的函數(shù),在u(t)=u*(t),tt0,tf時(shí)取絕對(duì)極小,即 或,末態(tài)約束問題(6/6),4) 在最優(yōu)軌線的末端,哈密頓函數(shù)應(yīng)滿足 上面給出的是末態(tài)受約束的定常性能指標(biāo)泛函的最優(yōu)控制問題的極大值原理,對(duì)于其他情況, 如時(shí)變的、積分型的或復(fù)合型的性能指標(biāo)泛函的最優(yōu)控制問題的極大值原理, 可參照定理12及相應(yīng)的定理10或定理11得到。 這里不再進(jìn)行詳細(xì)討論。,積分

30、約束問題(1/7),2. 積分約束問題 實(shí)際被控系統(tǒng)由于所處環(huán)境的復(fù)雜性,所受的限制、約束條件是各異的。 例如,航天器材上要求總的消耗能量是有限的。 這些約束條件有時(shí)可用對(duì)狀態(tài)變量x(t)和控制變量u(t)的積分型約束條件來(lái)表示。 這類有積分型約束條件的最優(yōu)控制問題可描述如下。,積分約束問題(2/7),積分型約束最優(yōu)控制問題 對(duì)定常的被控系統(tǒng)(92),其系統(tǒng)狀態(tài)軌線x(t)和控制函數(shù)u(t)滿足積分型約束 式中,L1(x(t),u(t)和L2(x(t),u(t)分別為k維和l維向量函數(shù)。 求一容許控制u(t)U,tt0,tf,使積分型性能指標(biāo)(138)取極值。 處理這類問題與前面類似,同樣可以

31、采用引進(jìn)新的狀態(tài)變量的方法將受上述積分限制的最優(yōu)控制問題轉(zhuǎn)換到前面已經(jīng)討論過的最優(yōu)控制問題,從而獲得該最優(yōu)控制問題的極大值原理。,積分約束問題(3/7),如,引入輔助狀態(tài)變量x0,x1和x2如下 則積分型性能指標(biāo)泛函變換為輔助末值型性能指標(biāo)泛函 Ju()=x0(tf) 上述積分型約束變換為如下輔助狀態(tài)變量的末端條件 x1(tf)=J1=0 x2(tf)=J20 那么,再應(yīng)用極大值原理,可推導(dǎo)得受積分限制的、積分型性能指標(biāo)泛函指標(biāo)的最優(yōu)控制的極大值原理。,積分約束問題(4/7)定理13,定理13(積分型約束極大值原理) 積分型約束最優(yōu)控制問題的最優(yōu)控制函數(shù)u*(t)、最優(yōu)狀態(tài)軌線x*(t)和協(xié)態(tài)

32、向量函數(shù)(t),以及k維常向量1和l維常向量2,使得: 1) x*(t)和(t)滿足規(guī)范方程 式中,哈密頓函數(shù)為,積分約束問題(5/7),2) 邊界條件 3) 哈密頓函數(shù)H作為u(t)U的函數(shù),在u(t)=u*(t),tt0,tf時(shí)取絕對(duì)極小,即 或,積分約束問題(6/7),4) 在最優(yōu)軌線的末端,哈密頓函數(shù)應(yīng)滿足 綜上所述,積分型約束限制條件可通過拉格朗日乘子向量轉(zhuǎn)化成等價(jià)的積分型性能指標(biāo)泛函。 因此,相應(yīng)的哈密頓函數(shù)的定義中,引進(jìn)了乘子向量1和2。,積分約束問題(7/7),上面討論的是帶積分約束限制條件的、定常的積分型性能指標(biāo)泛函的最優(yōu)控制問題。 對(duì)其他類型的被控系統(tǒng)和性能指標(biāo)泛函,帶積分

33、型約束限制條件的最優(yōu)控制問題,可類似于上述定理13給出。,4.5 離散系統(tǒng)極小值原理,設(shè)離散系統(tǒng)的狀態(tài)方程為:,其中f是連續(xù)可導(dǎo)的n維向量函數(shù), x(k)為n維的狀態(tài)向量序列, u(k)為p維控制向量序列,k表示時(shí)刻tk,終端時(shí)刻tf =tN.設(shè)初始狀態(tài)x(0)=0,終端時(shí)刻tN給定,終端狀態(tài) x(N)自由,控制向量序列u(k)無(wú)不等式約束.系統(tǒng)性能指標(biāo)為:,要求尋找最優(yōu)控制u*(k),使性能指標(biāo)J為極小.,建立新的指標(biāo)泛函,式中(k+1)為n維拉格朗日乘子向量序列,離散哈密而頓函數(shù)序列H為,由于x(0)給定, x(0)=0,令,可得J取極值的必要條件為:,正則方程,邊界條件與橫截條件:,控制

34、方程:,*特別的當(dāng)終端狀態(tài)有等式 約束時(shí),橫截條件改為:,*當(dāng)u(k) 有不等式約束時(shí)u(k) U,不成立, 此時(shí)最優(yōu)控制序列對(duì)應(yīng)的H函數(shù)序列為絕對(duì)極小值, 即:,例 設(shè)離散狀態(tài)方程及邊界條件為,試用離散極小值原理求最優(yōu)控制序列使性能指標(biāo),取極小值, 并求出最優(yōu)狀態(tài)序列.,解,狀態(tài)方程:,列寫結(jié)果如下,4.6 極小值原理的應(yīng)用 1. 最小時(shí)間控制(時(shí)間最優(yōu)控制),設(shè)線性定常系統(tǒng)的狀態(tài)方程,其中 。,控制向量u(t)滿足不等式約束,尋求最優(yōu)控制u*(t),使系統(tǒng)從已知的初始狀態(tài)轉(zhuǎn)移到終端狀態(tài),tf 自由,并使性能指標(biāo),為極小.,構(gòu)造哈密爾頓函數(shù):,根據(jù)極小值原理,最優(yōu)控制的必要條件為:,正則方程,邊界條件,極值條件,設(shè),則,設(shè)各控制分量相互獨(dú)立,則有,在約束條件,下的最優(yōu)控制為:

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論