




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
2023/7/221
最優(yōu)控制2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系2
第二章變分法及其
在最優(yōu)控制中的應(yīng)用2.1變分法簡介2.2泛函的變分2.3歐拉方程2.4橫截條件2.5泛函局部極值的充分條件2.6等式約束條件下的變分問題2.7利用變分法求解最優(yōu)控制問題小結(jié)2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系32.1變分法簡介
作為數(shù)學(xué)的一個(gè)分支,變分法(calculusofvariations)的誕生,是現(xiàn)實(shí)世界許多現(xiàn)象不斷探索的結(jié)果:約翰·伯努利(JohannBernoulli,1667-1748)1696年向全歐洲數(shù)學(xué)家挑戰(zhàn),提出一個(gè)難題:“設(shè)在垂直平面內(nèi)有任意兩點(diǎn),一個(gè)質(zhì)點(diǎn)受地心引力的作用,自較高點(diǎn)下滑至較低點(diǎn),不計(jì)摩擦,問沿著什么曲線下滑,時(shí)間最短?”這就是著名的“最速降線”問題(TheBrachistochroneProblem)。2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系4
它的難處在于和普通的極大極小值求法不同,它要求出一個(gè)未知函數(shù)(曲線),來滿足所給的條件。這問題的新穎和別出心裁引起了很大興趣.羅比塔(1661-1704)、雅可比·伯努利(1654-1705)、萊布尼茨(1646-1716)和牛頓(1642—1727)都得到了解答。約翰的解法比較漂亮,而雅可布的解法雖然麻煩與費(fèi)勁,卻更為一般化.歐拉(EulerLonhard,1707~1783)和拉格朗日(Lagrange,JosephLouis,1736-1813)發(fā)明了這一類問題的普遍解法,從而確立了數(shù)學(xué)的一個(gè)新分支——變分學(xué)。
2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系5
有趣的是,在1690年約翰·伯努利的哥哥雅可比·伯努利曾提出著名的懸鏈線問題
(TheHangingChainProblem),向數(shù)學(xué)界征求答案,即,固定項(xiàng)鏈的兩端,在重力場(chǎng)中讓它自然垂下,問項(xiàng)鏈的曲線方程是什么。在大自然中,除了懸垂的項(xiàng)鏈外,我們還可以觀察到吊橋上方的懸垂鋼索,掛著水珠的蜘蛛網(wǎng),以及兩根電線桿之間所架設(shè)的電線,這些都是懸鏈線(catenary)。2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系6
伽利略(Galileo,1564~1643)比貝努利更早注意到懸鏈線,他猜測(cè)懸鏈線是拋物線,從外表看的確象,但實(shí)際上不是?;莞梗℉uygens,1629~1695)在1646年(當(dāng)時(shí)17歲),經(jīng)由物理的論證,得知伽利略的猜測(cè)不對(duì),但那時(shí),他也求不出答案。到1691年,也就是雅可比·伯努利提出懸鏈線問題的第二年,萊布尼茲、惠更斯(62歲)與約翰·伯努利各自得到了正確答案,所用方法是誕生不久的微積分,具體說是把問題轉(zhuǎn)化為求解一個(gè)二階常微分方程2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系7解此方程并適當(dāng)選取參數(shù),得
即為懸鏈線。
懸鏈線問題本身和變分法并沒有關(guān)系,雅可比·貝努利隨后所證明的“懸掛于兩個(gè)固定點(diǎn)之間的同一條項(xiàng)鏈,在所有可能的形狀中,以懸鏈線的重心最低,具有最小勢(shì)能”,有關(guān)懸鏈線的得幾個(gè)結(jié)論,可以用變分法來證明!2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系8
現(xiàn)實(shí)生活中的許多現(xiàn)象可以表達(dá)為泛函求極值問題,稱為變分問題。變分法是處理函數(shù)的函數(shù)的數(shù)學(xué)領(lǐng)域,和處理數(shù)的函數(shù)的普通微積分相對(duì)。
什么叫泛函?2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系92.1泛函的變分一、泛函的定義
如果變量J對(duì)于某一函數(shù)類中的每一個(gè)函數(shù)x(t),都有一個(gè)確定的值與之對(duì)應(yīng),那么就稱變量J為依賴于函數(shù)x(t)的泛函,記為:J=J[x(t)]。
說明:由于函數(shù)的值是由自變量的選取而確定的,而泛函的值是由自變量的函數(shù)的選取而確定的,所以將泛函理解為“函數(shù)的函數(shù)”。2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系10例2.1.1函數(shù)的定積分都是泛函。因?yàn)樽兞縅的值是由函數(shù)的選取而確定的。2.
離散系統(tǒng)1.連續(xù)時(shí)間系統(tǒng):是泛函嗎?2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系11例2.1.2在平面上連接給定兩點(diǎn)A(ta,xa)和B(tb,xb)的曲線的弧長J是一個(gè)泛函,如圖2-1所示。當(dāng)曲線方程x=x(t)(滿足x(ta)=xa
,x(tb)=xb
)給定后,可算出它在A、B兩點(diǎn)間的弧長為:A(ta,xa)x(t)B(tb,xb)xot圖2-1ΔtiΔxi2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系12例2.1.3函數(shù)的不定積分泛函的上述概念,可以推廣到含有幾個(gè)函數(shù)的泛函的情況:不是泛函。例如2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系13幾點(diǎn)說明:
1、泛函是映射,是從函數(shù)空間到數(shù)域的映射。
2、泛函的自變量是函數(shù),泛函的自變量稱為泛函的宗量。
3、容許函數(shù)空間:滿足泛函的規(guī)定條件的宗量的全體所構(gòu)成的函數(shù)空間。
4、求函數(shù)的極值時(shí),微分或?qū)?shù)起著重要的作用。求泛函的極值時(shí),變分起著類似的作用。我們將求泛函的極值問題稱為變分問題,其相應(yīng)的方法稱為變分法。2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系14從例2.1.2可以知道,連接A、B兩點(diǎn)的曲線之弧長的泛函,其被積函數(shù)是未知函數(shù)導(dǎo)數(shù)的函數(shù)。在一般情況下,被積函數(shù)是自變量t,未知函數(shù)x(t)及其導(dǎo)數(shù)的函數(shù)。所以最簡單的一類泛函可表示為:2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系15二、泛函宗量的變分(2.1.1)
泛函J[x(t)]的宗量x(t)的變分是指在同一函數(shù)類中的兩個(gè)函數(shù)間的差:圖2-2x(t)x0x0(t)t1t22023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系16
三、泛函的連續(xù)性
函數(shù)相近
零階相近當(dāng)函數(shù)x(t)與x0(t)之差的絕對(duì)值,即:
∣x(t)-x0(t)∣,t1tt2
(2.1.2)
對(duì)于x(t)的定義域中的一切t(t1
t
t2
)都很小時(shí),稱函數(shù)x(t)與函數(shù)x0(t)是相近的,也稱為零階相近。如圖2-3所示。x(t)xot圖2-3x0(t)t1t22023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系17一階相近
當(dāng)函數(shù)x(t)與x0(t)之差的絕對(duì)值以及它們的一階導(dǎo)數(shù)和之差的絕對(duì)值,即
(2.1.3)都很小,稱函數(shù)x(t)與函數(shù)x0(t)是一階相近的,如圖2-4所示。x(t)xot圖2-4x0(t)t1t2注意:一階相近的兩個(gè)函數(shù),必然是零階相近,反之不成立。2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系18都很小時(shí),稱函數(shù)x(t)與函數(shù)x0(t)是k階相近的。k階接近:當(dāng)(2.1.4)2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系19
在不同的函數(shù)空間,函數(shù)間的距離也不同。在函數(shù)空間C[a,b](在區(qū)間[a,b]上連續(xù)的函數(shù)的全體構(gòu)成的函數(shù)空間)中,通常采用下式定義距離:
(2.1.5)函數(shù)間距離在函數(shù)空間Ck[a,b](在區(qū)間[a,b]上連續(xù)且具有連續(xù)的k階導(dǎo)數(shù)的函數(shù)的全體構(gòu)成的函數(shù)空間)中,任意兩個(gè)函數(shù)間的距離定義為:(2.1.6)顯然,式(2.1.5)定量地表示兩個(gè)函數(shù)之間的零階相近度,而式(2.1.6)定量地表示兩個(gè)函數(shù)之間的k階相近度。2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系20
如果對(duì)于任意給定的正數(shù),可以找到這樣一個(gè)>0,當(dāng)
d[x(t),x0(t)]<
(2.1.7)
時(shí),存在
∣J[x(t)]-J[x0(t)]∣<
(2.1.8)
那么,就說泛函J在點(diǎn)x0(t)處是連續(xù)的。根據(jù)所采用的函數(shù)之間距離定義的不同,是按式(2.1.5)還是式(2.1.6),其對(duì)應(yīng)的泛函分別稱為零階連續(xù)泛函或k階連續(xù)泛函。泛函的連續(xù)性2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系21四、泛函的常見形式
1、線性泛函連續(xù)泛函如果滿足下列條件:
(1)J[x1(t)+x2(t)]=J[x1(t)]+J[x2(t)]
(2)J[cx(t)]=cJ[x(t)]其中,c是任意常數(shù),就稱為線性泛函。例如都滿足上述兩個(gè)條件,故均為線性泛函。2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系22連續(xù)泛函如果滿足下列條件:(1)J[x1(t)]+J[x2(t)]=1/2[J[x1(t)+x2(t)]+J[x1(t)-x2(t)]](2)J[cx(t)]=c2J[x(t)]就稱為*****二次型泛函*****。例如是關(guān)于x(t)的二次型泛函,其中F、Q均為對(duì)稱矩陣。2、二次型泛函2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系23
五、泛函的變分
變分法(calculusofvariations)是處理函數(shù)的函數(shù)的數(shù)學(xué)領(lǐng)域,和處理數(shù)的函數(shù)的普通微積分相對(duì)。譬如,這樣的泛函可以通過未知函數(shù)的積分和它的導(dǎo)數(shù)來構(gòu)造。變分法最終尋求的是極值函數(shù):它們使得泛函取得極大或極小值。2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系24泛函的變分的定義如果連續(xù)泛函J[x(t)]的增量可以表示為:其中,L[x(t),x(t)]是關(guān)于x(t)的線性連續(xù)泛函,而r[x(t),x(t)]是關(guān)于x(t)的高階無窮小。L[x(t),x(t)]
稱為泛函的變分,記為(2.1.9)(2.1.10)也就是說,泛函的變分是泛函增量的線性主部。當(dāng)一個(gè)泛函具有變分時(shí),即泛函的增量可以用式(2.1.9)來表示時(shí),稱該泛函是可微的。2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系25例如,泛函的增量為:于是,其變分為:
可以證明,泛函的變分是唯一的。因?yàn)椋舴汉淖兎植皇俏ㄒ坏?,則泛函的增量可以寫為:2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系26引理2.1.1泛函J[x(t)]的變分為:證明:如上所述,泛函J[x(t)]的增量為:其中,(0≤≤1)是一個(gè)參變量。由于L[x(t),
x(t)]是關(guān)于
x(t)的線性連續(xù)泛函,根據(jù)線性泛函的性質(zhì)(2),有(2.1.11)2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系27又由于r[x(t),
x(t)]是關(guān)于
x(t)的高階無窮小,所以利用上述兩點(diǎn)結(jié)論,便得根據(jù)偏微分的定義2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系28因?yàn)榉汉疛[x(t)]的變分為:所以Q.E.D2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系29例2.1.5求泛函的變分
例2.1.4求泛函的變分。2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系30例2.1.4求泛函的變分。根據(jù)式(2.1.11),該泛函的變分為:2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系31根據(jù)式(2.1.11),所求泛函的變分為:例2.1.5求泛函的變分
2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系32若設(shè)則2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系33六、泛函的極值
如果泛函J[x(t)]在函數(shù)空間中點(diǎn)x=x0(t)的鄰域內(nèi),其增量為:就稱泛函J[x(t)]在點(diǎn)x0(t)處達(dá)到極小值;如果泛函J[x(t)]在函數(shù)空間中點(diǎn)x=x0(t)的鄰域內(nèi),其增量為:就稱泛函J[x(t)]在點(diǎn)x0(t)處達(dá)到極大值;x0(t)的鄰域包含滿足條件:的所有點(diǎn)x(t)的球(即以x0(t)為圓心,以為半徑的球)。2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系34注意:所采用的函數(shù)間的距離的定義的不同,點(diǎn)x0(t)的鄰域內(nèi)所包含的函數(shù)也不同。*若→強(qiáng)極值*若→弱極值
顯然,如果泛函J[x(t)]在點(diǎn)x0(t)處達(dá)到強(qiáng)極值,那么它在點(diǎn)x0(t)處也一定達(dá)到弱極值。反之不成立。定理2.1.1(必要條件)若泛函J[x(t)]是連續(xù)可微的,并且在點(diǎn)x0(t)處達(dá)到極值,則泛函在點(diǎn)x0(t)處的變分等于零,即(2.1.12)2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系35證明:對(duì)于任意給定的x(t),J[x0(t)+x(t)]既是函數(shù)x(t)的泛函,又是變量的函數(shù)。泛函J[x0(t)+x(t)]在x0(t)處達(dá)到極值,也可看成是函數(shù)J[x0(t)+x(t)]在=0處達(dá)到極值,所以函數(shù)J[x0(t)+x(t)]對(duì)變量的偏導(dǎo)數(shù)在=0處應(yīng)等于零,即而由式(1.1.11)有比較上面兩式,又考慮x(t)是任意給定的,所以Q.E.D.2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系36
從定理2.1.1的推證中可見,泛函達(dá)到強(qiáng)極值與弱極值的必要條件是相同的。應(yīng)當(dāng)指出:本節(jié)所討論的定義、引理和定理,稍加變動(dòng)就可以應(yīng)用于含有多個(gè)未知函數(shù)的泛函:J[x1(t),x2(t),…,xn(t)]2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系37AByx0
求平面上過兩點(diǎn)和的最短曲線。解:設(shè)曲線方程,且。兩點(diǎn)間弧長L
是的泛函,設(shè)本例就是要解得當(dāng)泛函為極值的極端函數(shù)。例2.1.62023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系38例2.1.72.1.72023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系392.2歐拉方程
最優(yōu)控制問題中,根據(jù)性能指標(biāo)的類型(積分型性能指標(biāo)、終值型性能指標(biāo)、復(fù)合型性能指標(biāo))的不同,分別對(duì)應(yīng)了古典變分法中的三類基本問題。拉格朗日(Lagrange)問題—基本問題麥耶耳(Mayer)問題波爾扎(Bolza)問題(2.2.1)(2.2.2)(2.2.3)2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系40問題描述:假定點(diǎn)A(t0,x0)和B(tf
,xf)是所要尋求的泛函(2.2.1)的極值曲線x(t)的兩個(gè)固定端點(diǎn),如圖2-5所示,其坐標(biāo)為:x*(t)xot圖2-5x(t)A(t0,x0)B(tf,xf)(2.2.4)現(xiàn)在的問題是:從滿足邊界條件(2.2.4)的二階可微的函數(shù)中,選擇使泛函(2.2.1)達(dá)到極小值的函數(shù)x(t)。
固定端點(diǎn)的Lagrange問題2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系41解:設(shè)x*(t)是使泛函(2.2.1)達(dá)到極小值且滿足邊界條件(2.2.4)的極值曲線。現(xiàn)用(2.2.5)表示滿足邊界條件(2.2.4)的極值曲線x*(t)的鄰域曲線。其中x(t)是泛函宗量x(t)的變分,(01)是一參變量。為使x(t)是滿足邊界條件(2.2.4)的極值曲線x*(t)的鄰域曲線,x(t)應(yīng)具有連續(xù)導(dǎo)數(shù)且滿足條件:
(2.2.6)于是,由式(2.2.5)得到(2.2.7)2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系42
由于x*(t)是極值曲線,所以泛函(2.2.1)在極值曲線x*(t)上的變分等于零(定理2.1.1),即由引理2.1.1知,泛函的變分為(2.2.8)(2.2.9)2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系43(2.2.10)將代入,得2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系44(2.2.12)利用條件x(t0)=x(tf)=0
,則上式變?yōu)椋?.2.13)(2.2.11)考慮到泛函宗量的變分x(t)是任意的函數(shù),不妨選擇(2.2.14)其中w(t)是任一滿足下列條件的函數(shù):對(duì)式右端第二項(xiàng)進(jìn)行分部積分將式(2.2.11)代入,并考慮式得變分預(yù)備定理2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系45由上式可見,一個(gè)非負(fù)的函數(shù)的定積分為零,只能是被積函數(shù)恒等于零,因此有(2.2.15)將上式左端第二項(xiàng)展開,可得(2.2.16)歐拉(Euler)方程歐拉方程(C為某一函數(shù))將式代入式,可得2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系46式中若時(shí),歐拉方程是一個(gè)二階微分方程。2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系47定理2.2.1若給定曲線x(t)的始端x(t0)=x0和終端x(tf)=xf,則泛函達(dá)到極值的必要條件是,曲線x(t)滿足歐拉方程其中x(t)應(yīng)有連續(xù)的二階導(dǎo)數(shù),則至少應(yīng)是二次連續(xù)可微的。為什么?2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系48幾種特殊的歐拉方程(可以得到封閉形式的解)其中c是待定的積分常數(shù)。實(shí)際上,將上式左邊對(duì)t求全導(dǎo)數(shù),有L不顯含t歐拉方程1.被積函數(shù)L不顯含t,即在這種情況下,歐拉方程的首次積分為(2.2.17)2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系493.被積函數(shù)L不顯含
,即在這種情況下,歐拉方程的首次積分為在這種情況下,歐拉方程的首次積分為2.被積函數(shù)L不顯含x,即2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系50泛函變分的分量表示法對(duì)于2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系51在n維函數(shù)空間中,若極值曲線的始端和終端是給定的,則泛函
的每一個(gè)分量xi引起的J的變分:同理:泛函變分的向量表示法2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系52歐拉(Euler)方程2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系53
對(duì)于向量空間的泛函,也存在著歐拉方程,不過是歐拉方程組(即向量歐拉方程)。(說明了什么?)定理2.2.2在n維函數(shù)空間中,若極值曲線X(t)=[x1(t),x2(t),…,xn(t)]T的始端X(t0)=[x1(t0),x2(t0),…,xn(t0)]T和終端X(tf)=[x1(tf),x2(tf),…,xn(tf)]T是給定的,則泛函達(dá)到極值的必要條件是曲線X(t)滿足向量歐拉方程其中X(t)應(yīng)有連續(xù)的二階導(dǎo)數(shù),而則至少應(yīng)是二次連續(xù)可微的。(2.2.18)2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系54例2.2.1求泛函滿足邊界條件的極值函數(shù)。解:由式(2.2.18)得:其特征方程為:特征根為:從而得2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系55由給定的邊界條件于是得極值函數(shù):得2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系56例2.2.2最速降線(又稱捷線)問題所謂最速降線問題是:設(shè)在豎直平面內(nèi)有兩點(diǎn)A和B,它們不在同一條鉛垂線上,現(xiàn)有一質(zhì)點(diǎn)受重力的作用自較高的A點(diǎn)向較低的B點(diǎn)滑動(dòng),如果不考慮各種阻力的影響,問應(yīng)取怎樣的路徑,才能使所經(jīng)歷的時(shí)間最短?解:在A、B兩點(diǎn)所在的豎直平面內(nèi)選擇一坐標(biāo)系,如圖2-6所示。A點(diǎn)為坐標(biāo)原點(diǎn),水平線為x軸,鉛垂線為y軸。設(shè)質(zhì)點(diǎn)的初速度為零,則由力學(xué)的知識(shí)可知,質(zhì)點(diǎn)在重力的作用下,不考慮各種阻力的影響,從A點(diǎn)向B點(diǎn)下滑的速度的大小為(2.2.19)xoyA(0,0)B(xf,yf)dxdydl圖2-6為什么?目標(biāo)泛函?2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系57由圖2-6得(2.2.20)將式(2.2.20)代入式(2.2.19)中,并變換,得對(duì)上式兩邊進(jìn)行積分,可得質(zhì)點(diǎn)自點(diǎn)A(0,0)滑動(dòng)到點(diǎn)B(xf,yf)所需的時(shí)間為(2.2.21)
設(shè)y=y(x)是連接點(diǎn)A(0,0)和點(diǎn)B(xf,yf)的任一光滑曲線,則最速降線問題的數(shù)學(xué)提法是:在XOY平面上確定一條滿足邊界條件(2.2.22)2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系58的極值曲線y=y(x),使泛函(2.2.23)達(dá)到極小值。這時(shí)被積函數(shù)為:不顯含自變量x,由(2.2.17)知,它的首次積分為化簡上式得
理由?2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系59這種方程宜于利用參數(shù)法求解,為此,令于是,又由對(duì)上式積分,得由邊界條件y(0)知,c2=0,于是2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系60令最后得
這是圓滾線的參數(shù)方程。式中r是滾動(dòng)圓半徑,其值由另一邊界條件y(xf)=yf確定。所以,最速降線是一條圓滾線。說明:圓滾線(擺線/旋輪線)是指一圓沿定直線滾動(dòng)時(shí),圓周上一定點(diǎn)所描繪出的軌跡。2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系612023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系622.3橫截條件當(dāng)極值曲線x*(t)的端點(diǎn)變化時(shí),要使泛函達(dá)到極小值,x*(t)首先應(yīng)當(dāng)滿足歐拉方程:若端點(diǎn)固定,可以利用端點(diǎn)條件:確定歐拉方程中的兩個(gè)待定的積分常數(shù)。問題:若端點(diǎn)可變,如何確定這兩個(gè)積分常數(shù)?2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系63問題描述:假定極值曲線的始端A(t0,x0)是固定的,而終端B(tf,xf)是可變的,并沿著給定的曲線(2.3.1)變動(dòng),(2.3.1)如圖2-7所示?,F(xiàn)在的問題是需要確定一條從給定的點(diǎn)A(t0,x0)到給定的曲線(2.3.1)上的某一點(diǎn)B(tf,xf)的連續(xù)可微的曲線x(t),使得泛函達(dá)到極小值。(2.3.2)txA(t0,x0)B(t*f,x*f)x*(t)x(t))(ftj圖
2
7橫截條件推導(dǎo)過程2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系64(2.3.3)(2.3.4)由圖2-7可見,每一條鄰域曲線x(t)都對(duì)應(yīng)一個(gè)終端時(shí)刻tf
,設(shè)極值曲線x*(t)所對(duì)應(yīng)的終端時(shí)刻為tf*,則鄰域曲線x(t)所對(duì)應(yīng)的終端時(shí)刻tf可以表示為:(2.3.5)將式(2.3.3)~(2.3.5)代入式(2.3.2),得(2.3.6)解:設(shè)x*(t)是泛函的極值曲線。x*(t)的鄰域曲線可表示為:2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系65根據(jù)泛函達(dá)到極值的必要條件則有:(2.3.7)式(2.3.7)左邊第一項(xiàng)相當(dāng)于tf固定時(shí)的泛函的變分,按照上一節(jié)推導(dǎo)的結(jié)果可得(2.3.8)2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系66式(2.3.7)左邊第二項(xiàng)先利用中值定理,然后求導(dǎo),則得(2.3.9)將式(2.3.8)和式(2.3.9)代入式(2.3.7),得考慮到歐拉方程和始端固定所以有(2.3.10)2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系672023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系68(2.3.11)但是,終端點(diǎn)沿曲線(2.3.1)變動(dòng),所以x(t*f)與dtf相關(guān)。為了進(jìn)一步簡化式(2.3.10),應(yīng)當(dāng)求出x(t*f)與dtf之間的關(guān)系。
若x(t*f)與dtf互不相關(guān),則由上式得2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系69將上式代入式(2.3.10),可得x(t*f)與dtf
之間的關(guān)系根據(jù)終端約束條件,應(yīng)有將上式對(duì)取偏導(dǎo)數(shù),并令=0,利用,整理得2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系70的圖解xtA(t0,x0)B(t*f,x*f)x*(t)x(t))(ftj2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系71由于dtf是任意的,所以(2.3.12)橫截條件2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系72定理2.3.1
若曲線x(t)由一給定的點(diǎn)(t0,x0)到給定的曲線x(tf)=(tf)上的某一點(diǎn)(tf,xf),則泛函達(dá)到極值的必要條件是,x(t)滿足歐拉方程和橫截條件其中x(t)應(yīng)有連續(xù)的二階導(dǎo)數(shù),則至少應(yīng)是二次連續(xù)可微的,而(t)
則應(yīng)有連續(xù)的一階導(dǎo)數(shù)。2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系73若極值曲線的始端不是固定的,并沿著曲線(2.3.13)變動(dòng),則同樣可以推導(dǎo)出始端的橫截條件(2.3.14)2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系74(1)t0、
tf
自由x(t0)與x(tf)受約,即x(t0)=(t0),x(tf)=(tf),則橫截條件為:(2)當(dāng)t0、
tf
自由,而x(t0)與x(tf)固定時(shí),則橫截條件為:
根據(jù)定理2.3.1和式(2.3.14),可得到端點(diǎn)可變時(shí),Lagrange問題的解,除有歐拉方程外,還有橫截條件:2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系75(3)當(dāng)t0、
tf
固定,即始端與終端分別在t=t0、t=tf上滑動(dòng),則橫截條件為:同理:2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系76(4)始端、終端時(shí)間和狀態(tài)都自由時(shí)的橫截條件為:定理2.3.1和以上幾種情況的橫截條件,都可以將其推廣到n維函數(shù)向量X(t)=[x1(t),x2(t),…,xn(t)]T的泛函的情形。2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系77定理2.3.2在n維函數(shù)空間中,若曲線X(t)=[x1(t),x2(t),…,xn(t)]T的始端X(t0)=[x1(t0),x2(t0),…,xn(t0)]T是固定的,而終端X(tf)=[x1(tf),x2(tf),…,xn(tf)]T是可變的,且在曲面X(tf)=(tf)上變動(dòng),則泛函達(dá)到極值的必要條件是,曲線X(t)滿足向量歐拉方程和橫截條件2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系78其中X(t)應(yīng)有連續(xù)的二階導(dǎo)數(shù),而則至少應(yīng)是二次連續(xù)可微的,而(t)=[1(t),2(t),,n(t)]T則應(yīng)有連續(xù)的一階導(dǎo)數(shù)。
若曲線X(t)=[x1(t),x2(t),…,xn(t)]T的始端不是固定的,而是可變的,并在給定的曲面上變動(dòng),其中,則同樣可以推導(dǎo)出始端的橫截條件為:2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系79
采用分量的變分方式在n維函數(shù)空間中,若曲線X(t)=[x1(t),x2(t),…,xn(t)]T的始端X(t0)=[x1(t0),x2(t0),…,xn(t0)]T是固定的,而終端X(tf)=[x1(tf),x2(tf),…,xn(tf)]T是可變的,且在曲面X(tf)=(tf)上變動(dòng),求泛函的極值.可用代入消去法,這時(shí)2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系802023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系81txA(t0,x0)B(t*f,x*f)x*(t)x(t))(ftj圖
2
72023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系82取極值的必要條件為:2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系83由于的任意性,所以有以下的等式成立:(橫截條件)2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系842023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系85(1)始端、終端可變,即x(t0)=(t0),x(tf)=(tf),則橫截條件為:(2)當(dāng)t0、
tf
可變,而x(t0)與x(tf)固定時(shí),則橫截條件為:(3)當(dāng)t0、
tf
固定,而x(t0)與x(tf)約束時(shí),即始端與終端分別在t=t0、t=tf上滑動(dòng),則橫截條件為:同理:2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系86(4)始端、終端自由的橫截條件為:2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系87例2.3.1求t-x平面上由給定A(0,1)至給定直線x=2-t的弧長最短的曲線方程。o1212txA(0,1)dsx*(t)圖2-8解:由圖2-8,弧長根據(jù)題意,目標(biāo)泛函應(yīng)選為:這是一個(gè)始端固定,終端可變的泛函的變分問題。由于泛函的被積函數(shù)中不顯含x(t),所以Euler方程為:2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系88由初始條件x(0)=1,得c2=1,從而有由橫截條件(2.3.12),得經(jīng)整理得,所以c1=1。最優(yōu)軌線方程為:最優(yōu)軌線與給定直線垂直。2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系89*2.4泛函局部極值的充分條件泛函二階變分推導(dǎo)過程:給定泛函為其一階變分為(2.4.1)(2.4.2)2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系90而二階變分為2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系91(2.4.3)
于是,為使泛函(2.4.1)在曲線x(t)上達(dá)到極小(或極大)值,其一階變分(2.4.2)應(yīng)為零,而其二階變分(2.4.3)必須為正(或負(fù))。由此,得到下面的定理。2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系92定理2.4.1若泛函的一階變分則J[x(t)]達(dá)到極小值的充分條件是二階型矩陣(2.4.4)是正定的或半正定的;而J[x(t)]達(dá)到極大值的充分條件是式(2.4.4)是負(fù)定的或半負(fù)定的。
定理2.4.1可以推廣到含有n個(gè)未知函數(shù)的泛函的情形。2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系93
復(fù)習(xí)與討論1)請(qǐng)寫出歐拉方程,并說明歐拉方程是在什么樣的端點(diǎn)條件和性能泛函下導(dǎo)出?如何導(dǎo)出?它用來解決什么問題?2)對(duì)于拉格朗日問題有幾種端點(diǎn)條件?使性能泛函達(dá)到極值的定解條件分別是什么?可以由哪些方法推導(dǎo)而來?2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系942.5等式約束條件下的變分問題一、回顧等式約束條件下函數(shù)極值問題的解法
設(shè)有函數(shù)(2.5.2)現(xiàn)在需要求函數(shù)Z在約束條件為(2.5.1)情況下的極值。2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系95①從方程(2.5.2)中將y解出來往往是很困難的;②對(duì)x和y這兩個(gè)自變量未能平等看待。從約束條件(2.5.2)中將y解出來。用x表示y,即y=y(x)然后將y(x)代入f(x,y)中,得到
Z=f[x,y(x)](2.5.3)這樣,函數(shù)Z就只含有一個(gè)自變量x了,在等式(2.5.2)約束條件下的函數(shù)(2.5.1)的極值問題,就變成無約束條件的函數(shù)(2.5.3)的極值問題了。但是,消元法存在兩個(gè)問題:(1)消元法2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系96(2)拉格朗日乘子法(Lagrangefactor)步驟如下:
①作一個(gè)輔助函數(shù)F=f(x,y)+g(x,y)
式中,是待定的常數(shù),稱為拉格朗日乘子;
②求輔助函數(shù)F的無條件極值,即令(2.5.4)
③聯(lián)立求解方程(2.5.2)和(2.5.4),求出駐點(diǎn)(x0
,y
0)和待定常數(shù)值;④判斷(x0
,y
0)是否是函數(shù)f(x,y)的極值點(diǎn)。2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系97
拉格朗日乘子法對(duì)于求n元函數(shù)
y=f(x1,x2,…,xn)在多個(gè)約束方程
gi(x1,x2,…,xn)=0,i=1,2,…,m;m<n條件下的極值問題,同樣適用。2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系98二、等式約束條件下泛函極值問題的解法求泛函(2.5.5)在約束方程為(2.5.6)和端點(diǎn)條件為(2.5.7)情況下的極值曲線。這里
X(t)=[x1(t),x2(t),…,xn(t)]T,f=[f1,f2,…,fm]T,m<n。而是x1(t),x2(t),…,xn(t)和t的標(biāo)量函數(shù)。2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系99
利用拉格朗日乘子法求解上述等式約束條件下的泛函極值問題,其具體步驟為構(gòu)造輔助泛函
其中(t)=[
1(t),
2(t),…,
m(t)]T是m維待定向量乘子。令(2.5.9)
寫出向量形式的歐拉方程
(2.5.10)
(2.5.8)2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系100定解條件:
檢驗(yàn)候選函數(shù)X(t)是否使泛函達(dá)到極值以及是極大值還是極小值。得到候選函數(shù)X(t)2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系101如果將向量乘子
(t)也看做是輔助泛函的宗量,那么約束方程(2.5.6)也可以看作是輔助泛函的歐拉方程:2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系102①利用拉格朗日乘子法求得的函數(shù)X(t),如果輔助泛函達(dá)到極值,就一定是原泛函(2.5.5)的極值函數(shù)。因?yàn)橛杉s束方程(2.5.6)和歐拉方程(2.5.10)聯(lián)立解出的向量函數(shù)X(t)和(t)一定滿足約束方程(2.5.6),所以必有J0=J,另外,當(dāng)將所解出的(t)代入輔助泛函(2.5.8)時(shí),函數(shù)X(t)將使輔助泛函(2.5.8)達(dá)到無條件極值,因?yàn)楹瘮?shù)X(t)是輔助泛函(2.5.8)的歐拉方程(2.5.10)的解。②上面的論述僅僅指出了利用拉格朗日乘子法求出的輔助泛函(2.5.8)的無條件的極值函數(shù),一定是原泛函(2.5.5)在等式(2.5.6)約束條件下的極值函數(shù)。但是,卻沒有說明原泛函(2.5.5)在等式(2.5.6)約束條件下的所有極值函數(shù)是否都能利用拉格朗日乘子法求出來?下面的定理將回答這個(gè)問題。
說明:2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系103定理2.5.1如果n維向量函數(shù)X(t)=[x1(t),x2(t),…,xn(t)]T
(2.5.11)能使泛函(2.5.15)在等式約束(2.5.12)條件下達(dá)到極值,這里f是m維向量函數(shù),m<n,必存在適當(dāng)?shù)膍維向量函數(shù)(t)=[
1(t),
2(t),…,
m(t)]T(2.5.14)使泛函(2.5.13)2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系104達(dá)到無條件極值。即函數(shù)X(t)是泛函(2.5.15)的歐拉方程(2.5.16)的解,其中而X(t)和(t)由歐拉方程(2.5.16)和約束方程共同確定。2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系105說明:
①定理2.5.1表明,泛函(2.5.12)在等式(2.5.13)約束條件下的極值函數(shù)X(t),同時(shí)也使泛函(2.5.15)達(dá)到無條件極值。這就進(jìn)一步說明泛函(2.5.12)在等式(2.5.13)約束條件下的極值函數(shù)X(t)都可通過拉格朗日乘子法求得。
②如果不僅將X(t),而且連函數(shù)(t)在內(nèi),都看成是泛函(2.5.15)的宗量,那么,約束方程(2.5.13)也可以看成是泛函(2.5.15)的歐拉方程。方程(2.5.13)和(2.5.16)共有n+m個(gè)方程,恰好可以解出n維和m維未知函數(shù)X(t)和(t)。
③當(dāng)約束方程中(2.5.13)中的函數(shù)f不包括有X(t)的導(dǎo)數(shù)時(shí),則式(2.5.13)便成為一種代數(shù)方程約束。定理2.5.1仍然成立。2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系106例2.5.1已知受控系統(tǒng)的動(dòng)態(tài)結(jié)構(gòu)如圖2-9所示。求最優(yōu)控制u*(t),使目標(biāo)泛函取極小值。給定的邊界條件為x(t)u(t)21s圖2-9雙積分對(duì)象2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系107解:令則得系統(tǒng)的狀態(tài)方程為:現(xiàn)在的目標(biāo)泛函為應(yīng)用拉格朗日乘子法,構(gòu)造輔助泛函(2.5.17)令2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系108則向量形式的歐拉方程為根據(jù)狀態(tài)方程(1.5.17),得2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系109利用邊界條件,可得所以,最優(yōu)控制2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系1102.6利用變分法求解最優(yōu)控制問題
對(duì)于最優(yōu)控制問題來說,當(dāng)狀態(tài)變量和控制變量均不受約束,即X(t)Rn,U(t)Rm時(shí),是在等式約束條件下求泛函極值的變分問題,因此,可以利用在上一節(jié)中介紹的拉格朗日乘子法來求解。在這一節(jié)中,利用拉格朗日乘子法求解最優(yōu)控制問題時(shí),將引入哈密頓(Hamilton)函數(shù),推導(dǎo)出幾種典型的最優(yōu)控制問題應(yīng)滿足的必要條件。2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系111問題2.6.1
給定系統(tǒng)狀態(tài)方程(2.6.2)初始條件(2.6.1)終端條件:tf固定,X(tf)自由和性能泛函(2.6.3)2.6.1拉格朗日問題的解要求從容許控制U(t)
Rm中確定最優(yōu)控制U*(t),使系統(tǒng)(2.6.1)從給定的初態(tài)X(t0)轉(zhuǎn)移到某個(gè)終態(tài)X(tf),并使性能泛函(2.6.3)達(dá)到極小值。這是拉格朗日問題,又稱為積分型最優(yōu)控制問題。2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系112
解:將狀態(tài)方程(2.6.1)改寫為(2.6.4)于是,上述最優(yōu)控制問題就變成為在微分方程(2.6.4)約束條件下求泛函(2.6.3)極值的變分問題。利用拉格朗日乘子法,引入n維拉格朗日乘子向量
(t)=[
1(t),
2(t),…,
n(t)]T
(t)稱為協(xié)態(tài)變量,以便與狀態(tài)變量相對(duì)應(yīng)。構(gòu)造輔助泛函(2.6.5)2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系113其中,(2.6.6)于是,求泛函(2.6.3)在等式(2.6.1)約束條件下的極值問題,就轉(zhuǎn)變成為求泛函(2.6.5)的無約束條件的極值問題。定義哈密頓(Hamilton)函數(shù)為:(2.6.7)它是一標(biāo)量函數(shù),則式(2.6.6)變?yōu)?/p>
利用變分法可以寫出輔助泛函(2.6.5)的歐拉方程(2.6.8)2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系114
協(xié)態(tài)方程(或共軛方程)狀態(tài)方程規(guī)范方程(或正則方程)(2.6.11)(2.6.10)(2.6.9)控制方程由得2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系115(2.6.12)初始狀態(tài)為由于終端時(shí)刻tf固定,終端狀態(tài)X(tf)自由,所以橫截條件為(2.6.13)
式(2.6.9)~(2.6.13)就是式(2.6.1)~(2.6.3)所給定的最優(yōu)控制問題的解應(yīng)滿足的必要條件。這些條件也可以由求輔助泛函J0對(duì)狀態(tài)變量X(t)和控制變量U(t)的變分中推導(dǎo)出來。聯(lián)立求解規(guī)范方程(2.6.9)和(2.6.10)可以得到兩個(gè)未知函數(shù)X(t)和
(t),其一個(gè)邊界在始端(2.6.12),另一個(gè)邊界在終端(2.6.13),故稱為混合邊界問題或兩點(diǎn)邊界值問題。考慮式,得2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系116求解兩點(diǎn)邊界值問題步驟由控制方程(2.6.11)求得
U=U[X(t),(t),t](2.6.14)
(2.6.15)(2.6.16)利用邊界條件(2.6.12)和(2.6.13)聯(lián)立求解方程(2.6.15)和(2.6.16),可得唯一確定的解X(t)和(t)。將所求得的X(t)和(t)代入式(2.6.14)中,可求得相應(yīng)的U(t)。并代入2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系117說明:
(1)對(duì)于兩點(diǎn)邊界值問題,一般難以求得其解析解,通常需要采用數(shù)值計(jì)算方法求其數(shù)值解。(2)利用引入哈密頓函數(shù)的方法求解拉格朗日型最優(yōu)控制問題,是將求泛函(2.6.3)在等式(2.6.1)約束條件下對(duì)控制函數(shù)U(t)的條件極值問題轉(zhuǎn)化為求哈密頓函數(shù)H對(duì)控制變量U(t)的無條件極值問題。這種方法稱為哈密頓方法。2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系118定理2.6.1設(shè)系統(tǒng)的狀態(tài)方程則為將系統(tǒng)從給定的初態(tài)轉(zhuǎn)移到終端時(shí)刻tf固定,終端狀態(tài)X(tf)自由的某個(gè)終態(tài),并使性能泛函2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系119達(dá)到極小值的最優(yōu)控制應(yīng)滿足的必要條件是(1)設(shè)U*(t)是最優(yōu)控制,X*(t)是對(duì)應(yīng)于U*(t)的最優(yōu)軌線,則必存在一與U*(t)和X*(t)相對(duì)應(yīng)的n維協(xié)態(tài)變量(t)
,使得X(t)與(t)
滿足規(guī)范方程其中
(2)邊界條件為2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系120
(3)哈密頓函數(shù)H對(duì)控制變量U(t)(t0ttf)取極值,即*沿著最優(yōu)控制和最優(yōu)軌線,哈密頓函數(shù)H對(duì)時(shí)間t求全導(dǎo)數(shù),得若H不顯含t時(shí),則有
H(t)=常數(shù)t[t0,tf];
也就是說,當(dāng)H不顯含t時(shí),哈密頓函數(shù)H是不依賴于t的常數(shù)。2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系121例2.6.1已知系統(tǒng)方程和邊界條件為求使性能泛函為極小值的最優(yōu)控制函數(shù)與最優(yōu)軌線。
2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系122由控制方程得解:這是一個(gè)最小能量控制問題。其哈密頓函數(shù)為協(xié)態(tài)方程為解協(xié)態(tài)方程,得2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系123于是由狀態(tài)方程解得2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系124利用邊界條件求得積分常數(shù)為于是,最優(yōu)控制與最優(yōu)軌線分別為2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系125例2.6.2已知系統(tǒng)方程和邊界條件為求使性能泛函為極小值的最優(yōu)控制函數(shù)與最優(yōu)軌線。2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系126由這些邊界條件求得的積分常數(shù)為解:問題的規(guī)范方程和控制方程均與例1.6.1相同,但邊界條件變?yōu)?023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系127于是,所求得的最優(yōu)解為
由例2.6.1和例2.6.2可見,對(duì)于兩個(gè)相同的最優(yōu)控制問題,只是部分終端狀態(tài)不相同,所得到的最優(yōu)解則完全不同。2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系1282.6.2波爾扎問題的解問題2.6.2給定系統(tǒng)狀態(tài)方程(2.6.18)初始條件(2.6.17)和性能泛函(2.6.19)要求從容許控制U(t)
Rm中確定最優(yōu)控制U*(t),使系統(tǒng)(2.6.17)從給定的初態(tài)X(t0)轉(zhuǎn)移到某個(gè)終態(tài)X(tf),并使性能泛函(2.6.19)達(dá)到極小值。這是波爾扎問題,又稱為復(fù)合型最優(yōu)控制問題。由于給定的端點(diǎn)條件不同,上述最優(yōu)控制問題的解將不同。下面根據(jù)三種不同的端點(diǎn)條件,分別予以討論。2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系129
1.終端時(shí)刻tf固定,終端狀態(tài)X(tf)自由的情況構(gòu)造輔助泛函為:若令哈密頓函數(shù)為(2.6.20)(2.6.21)并對(duì)式(2.6.20)積分號(hào)內(nèi)第三項(xiàng)進(jìn)行分部積分,則輔助泛函變?yōu)?023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系130(2.6.22)求上式對(duì)狀態(tài)變量X(t),X(tf)和控制變量U(t)的變分,得(2.6.24)由于泛函J0達(dá)到極值的必要條件為(2.6.23)由于X(t0)=0,X(tf)≠0,X(t)≠0,U(t)≠0,則由式(2.6.23)和(2.6.24)可得上述波爾扎型最優(yōu)控制問題的解應(yīng)2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系131滿足的必要條件為這些關(guān)系與拉格朗日型最優(yōu)控制問題的完全相同,所不同的只是橫截條件,即協(xié)態(tài)變量的終端值2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系132
2.終端時(shí)刻tf固定,終端狀態(tài)X(tf)受約束的情況設(shè)終端狀態(tài)受到如下等式的約束(2.6.25)其中為r(當(dāng)L=0,rn-1;當(dāng)L0,rn)維向量,即這時(shí),終端狀態(tài)X(tf)即不是固定的,也不是完全自由的,只能在終端流型(2.6.25)上變動(dòng)。在構(gòu)造輔助泛函時(shí),應(yīng)考慮終端約束條件(2.6.25),為此,需要引入待定的r維拉格朗日乘子向量于是,所構(gòu)造的輔助泛函為2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系133考慮到哈密頓函數(shù)為(2.6.26)并對(duì)式(2.6.26)積分號(hào)內(nèi)第三項(xiàng)進(jìn)行分部積分,則輔助泛函變?yōu)?023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系134求J0對(duì)狀態(tài)變量X(t),X(tf)和控制變量U(t)的變分,得考慮到
J0=0,X(t0)=0,X(tf)≠0,X(t)≠0,U(t)≠0,則得到所述最優(yōu)控制問題的解應(yīng)滿足的必要條件2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系135這些關(guān)系與1中的完全相同,所不同的是狀態(tài)變量的終端約束條件和橫截條件2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系136
3.終端時(shí)刻tf可變,終端狀態(tài)X(tf)受約束的情況設(shè)終端狀態(tài)X(tf)受到式(2.6.25)的約束條件。輔助泛函為其中這時(shí),不僅存在最優(yōu)控制和最優(yōu)軌線,還存在一個(gè)最優(yōu)的終端時(shí)刻。最優(yōu)控制和最優(yōu)軌線應(yīng)滿足2中的必要條件,即(2.6.27)2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系137
為了確定最優(yōu)的終端時(shí)刻,令式(2.6.27)對(duì)時(shí)間t的全導(dǎo)數(shù)等于零,即得代入和為02023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系138(2.6.28)式(2.6.28)也稱為橫截條件。定理2.6.2設(shè)系統(tǒng)狀態(tài)方程為則為將系統(tǒng)從給定的初態(tài)的某個(gè)終態(tài)X(tf),其中tf是可變的,并使性能泛函轉(zhuǎn)移到滿足約束條件達(dá)到極小值的最優(yōu)控制應(yīng)滿足的必要條件。2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系139
(1)設(shè)U*(t)是最優(yōu)控制,X*(t)是對(duì)應(yīng)于U*(t)的最優(yōu)軌線,則必存在一與U*(t)和X*(t)相對(duì)應(yīng)的n維協(xié)態(tài)變量(t),使得X(t)與(t)滿足規(guī)范方程其中
(2)邊界條件為2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系140
(3)哈密頓函數(shù)H對(duì)控制變量取極值,即
應(yīng)當(dāng)指出,對(duì)于波爾扎問題來說,哈密頓函數(shù)H的性質(zhì)仍然成立。當(dāng)H不顯含t時(shí)H(t)=常數(shù)t[t0,tf]約束條件2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系141例2.6.3給定系統(tǒng)狀態(tài)方程初始條件:和性能泛函:要求確定最優(yōu)控制u*(t),使性能泛函J達(dá)到極小值。2023/7/22中南大學(xué)信息科學(xué)與工程學(xué)院自動(dòng)化系142由控制方程得解:這是一個(gè)最小能量控制問題。其哈密頓函數(shù)為協(xié)態(tài)方程為解協(xié)態(tài)方程,得2023/
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度國際貿(mào)易知識(shí)產(chǎn)權(quán)傭金協(xié)議
- 二零二五年度分手補(bǔ)償協(xié)議書及子女教育費(fèi)用承擔(dān)
- 2025年度股份代持股份占比調(diào)整合同協(xié)議書模板
- 2025年度酒店餐飲服務(wù)兼職員工合同
- 二零二五年度隱名股東股權(quán)轉(zhuǎn)讓及管理權(quán)移交協(xié)議
- 二零二五年度足療養(yǎng)生店轉(zhuǎn)讓與品牌授權(quán)使用合同
- 二零二五年度學(xué)校食堂租賃協(xié)議書(含智能點(diǎn)餐系統(tǒng)建設(shè))
- 二零二五年度文化旅游項(xiàng)目介紹費(fèi)合作協(xié)議書
- 初中校長發(fā)言稿
- 安全教育領(lǐng)導(dǎo)發(fā)言稿
- 2024年廣西高考化學(xué)試卷真題(含答案解析)
- 老年人能力、綜合征評(píng)估量表、綜合評(píng)估基本信息表、護(hù)理服務(wù)項(xiàng)目清單
- 2024-2030年全球及中國體育贊助行業(yè)市場(chǎng)現(xiàn)狀供需分析及市場(chǎng)深度研究發(fā)展前景及規(guī)劃可行性分析研究報(bào)告
- 數(shù)據(jù)崗位招聘筆試題與參考答案(某大型央企)2025年
- 第六單元 資本主義制度的初步確立 復(fù)習(xí)課件 2024-2025學(xué)年統(tǒng)編版九年級(jí)歷史上冊(cè)
- 2024年大學(xué)英語四級(jí)詞匯和語法全真模擬試題及答案(共六套)
- 人工智能崗位招聘筆試題及解答(某大型央企)2025年
- 緊急停車按鈕的安全設(shè)置要求
- 2024年玩具陀螺項(xiàng)目可行性研究報(bào)告
- v建筑主墩雙壁鋼圍堰施工工藝資料
- 新部編人教版六年級(jí)道德與法治下冊(cè)全冊(cè)全套課件
評(píng)論
0/150
提交評(píng)論