使用神經(jīng)網(wǎng)絡(luò)對隨機(jī)線性二次型奇異系統(tǒng)的最優(yōu)控制_第1頁
使用神經(jīng)網(wǎng)絡(luò)對隨機(jī)線性二次型奇異系統(tǒng)的最優(yōu)控制_第2頁
使用神經(jīng)網(wǎng)絡(luò)對隨機(jī)線性二次型奇異系統(tǒng)的最優(yōu)控制_第3頁
使用神經(jīng)網(wǎng)絡(luò)對隨機(jī)線性二次型奇異系統(tǒng)的最優(yōu)控制_第4頁
使用神經(jīng)網(wǎng)絡(luò)對隨機(jī)線性二次型奇異系統(tǒng)的最優(yōu)控制_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、optimal control for stochastic linear quadratic singular systemusing neural networksn. kumaresan *,p. balasubramaniamjournal of process control 19 (2009) : page482-488使用神經(jīng)網(wǎng)絡(luò)對隨機(jī)線性二次型奇異系統(tǒng)的最優(yōu)控制n庫瑪瑞森博士,p巴拉蘇布拉馬尼亞姆過程控制雜志19期(2009年):引用482488頁在本文中,最優(yōu)控制隨機(jī)線性奇異系統(tǒng)與二次型已經(jīng)在神經(jīng)網(wǎng)絡(luò)領(lǐng)域獲得 使用。其目的是提供最優(yōu)控制和努力通過比較矩陣riccati微分方程

2、(mrde)的 解減少微積分獲得了從眾所周知的傳統(tǒng)runge-kutta(rk)方法和傳統(tǒng)神經(jīng)網(wǎng)絡(luò) 方法。為了獲得最優(yōu)控制,mrde的解可以通過前向神經(jīng)網(wǎng)絡(luò)(ffnn)計算得到。 更接近神經(jīng)網(wǎng)絡(luò)方法得到的精確解來解決這一問題性能更好。該方法的優(yōu)點(diǎn)是, 一旦網(wǎng)絡(luò)運(yùn)行起來,它可以瞬吋計算出評估方案在任意點(diǎn)和任意少量的時間和 記憶的支出,其計算時間的方法比傳統(tǒng)rk方法更快、耗時更短。下面一個數(shù)值 算例給出了該方法。關(guān)鍵詞:矩陣微分方程;神經(jīng)網(wǎng)絡(luò);最優(yōu)控制;龍格庫塔法;隨機(jī)奇異線性系 統(tǒng)1簡介眾多學(xué)者一直在研究隨機(jī)線性二次型調(diào)節(jié)器(lqr)問題文獻(xiàn)2、6、8、15、34o陳等人文獻(xiàn)12的研究表明對于隨

3、機(jī)lqr問題是如果riccati方程有解,那么 可以得到最優(yōu)反饋控制。關(guān)于lqr方面的問題,相關(guān)的研究riccati方程,這是很 自然的。然而,對于eccd"方程解的存在性和唯一性,一般來說,由于存在復(fù)朵 的非線性項(xiàng),這似乎成為一個很困難的問題。朱和李文獻(xiàn)36采用迭代方法求解 隨機(jī)lqr問題中ricca"方程的隨機(jī)性。常規(guī)用ccm方程有幾種數(shù)值方法解,這些 可能發(fā)生非線性過程基本誤差積累。為了使誤差最小,最近傳統(tǒng)的用方程分 析了利用神經(jīng)網(wǎng)絡(luò)方法文獻(xiàn)3-5o本文闡述了擴(kuò)展的神經(jīng)網(wǎng)絡(luò)方法求解隨機(jī) riccati 方程。神經(jīng)網(wǎng)絡(luò)或簡單的神經(jīng)網(wǎng)絡(luò)都是計算機(jī)系統(tǒng),它可以通過訓(xùn)練學(xué)習(xí)兩

4、個或多 個變量的某種復(fù)雜關(guān)系或數(shù)據(jù)集。具有類似于他們的生物學(xué)配對物的結(jié)構(gòu),經(jīng)過 神經(jīng)網(wǎng)絡(luò)處理信息和并行分布式簡單處理節(jié)點(diǎn)連接的計算模型的組成形式文獻(xiàn) 33。神經(jīng)網(wǎng)絡(luò)技術(shù)己被成功地應(yīng)用于許多領(lǐng)域,如函數(shù)逼近、信號處理和自適 應(yīng)或非線性系統(tǒng)的學(xué)習(xí)控制。利用神經(jīng)網(wǎng)絡(luò),各式各樣的對非線性系統(tǒng)離線學(xué)習(xí) 控制算法己經(jīng)開發(fā)出來文獻(xiàn)21, 25o為求解代數(shù)riccati方程,各種數(shù)值算法文 獻(xiàn)11也已經(jīng)隨z開發(fā)出來。近年來,神經(jīng)網(wǎng)絡(luò)問題已經(jīng)引起了越來越多的重視, 許多研究人員進(jìn)行了數(shù)值代數(shù)用ccd"方程等方面的研究,見文獻(xiàn)16, 17, 32。奇異系統(tǒng)包含一個混合代數(shù)和微分方程組。從這個意義上說,代

5、數(shù)方程組代 表代數(shù)方程限定解的微分部分。這些系統(tǒng)也被稱為退化、描述或半狀態(tài)和廣義狀 態(tài)空間系統(tǒng)。奇異系統(tǒng)的復(fù)雜本質(zhì)導(dǎo)致在分析及數(shù)值處理這樣的系統(tǒng)會遇到許多 困難,尤其是在需要對它們的控制時。該系統(tǒng)自然演變成一個線性系統(tǒng)模型或者 在許多領(lǐng)域應(yīng)用的線性系統(tǒng)模型,如:電網(wǎng)、飛機(jī)動力學(xué)、中立型時滯系統(tǒng)、化 學(xué)、熱擴(kuò)散過程、大型系統(tǒng)、機(jī)器人學(xué)、生物等。見文獻(xiàn)9, 10, 23。許多實(shí)際過程可以被建成為描述系統(tǒng)模型,如約束控制問題模型,電路模型, 某些人口增長模型和奇異擾動模型。由于這樣的事實(shí),在過去的幾年中,描述系 統(tǒng)的穩(wěn)定性問題以及控制問題已被廣泛地研究,即描述系統(tǒng)能夠比狀態(tài)空間系統(tǒng) 更好的描述某個物

6、理系統(tǒng)。與狀態(tài)空間系統(tǒng)相比,描述系統(tǒng)結(jié)構(gòu)更復(fù)雜更完善。 此外,由于描述系統(tǒng)通常有三種模式,即有限的動態(tài)模式、脈沖模式和非動態(tài)模 式文獻(xiàn)13,研究描述系統(tǒng)的動態(tài)性能比對狀態(tài)空間系統(tǒng)研究困難,而后者兩個 不出現(xiàn)在狀態(tài)空間系統(tǒng)。由于標(biāo)準(zhǔn)二次型性能線性系統(tǒng)的最優(yōu)控制理論發(fā)展迅速,其結(jié)果在許多實(shí)際 設(shè)計問題中是最完整、最接近使用。該理論的二次成木控制問題被視為一個更有 趣的問題,最小成本最優(yōu)反饋控制一宜是用于求解用ccd"方程。da prato和ichikawa獻(xiàn)14表明riccati方程解的總是具有最優(yōu)反饋控制、總成本最低的特 征。mrde解決的中心問題是最優(yōu)控制理論。經(jīng)常需耍分析和綜合求解

7、這類方程, 如線性二次型最優(yōu)控制系統(tǒng)、控制系統(tǒng)魯棒h2和h1控制文獻(xiàn)35的性能標(biāo)準(zhǔn)、 隨機(jī)過濾和控制系統(tǒng)模型的降階、微分對策等。其中在數(shù)學(xué)和工程學(xué)領(lǐng)域,一個 最深入研究的非線性矩陣方程是用cam方程。對于該方程,它存在一種或另一種 形式,在最優(yōu)控制問題,多變量、大規(guī)模系統(tǒng),散射理論,估計檢測、運(yùn)輸和輻 射傳輸文獻(xiàn)19小扮演一個重要的角色。該方程的解也很難從兩個角度獲得。一 個是非線性的,另一個是用矩陣的形式表示。求解mrde邊界條件的最普通的方 法是得到mrde并將它轉(zhuǎn)變成一個等價的線性微分哈密頓系統(tǒng)文獻(xiàn)20。利用這 個方法,得到與mrde解的狀態(tài)轉(zhuǎn)換矩陣相關(guān)的哈密頓系統(tǒng)文獻(xiàn)31。另一類方 法

8、是基于mrde轉(zhuǎn)變成一個線性矩陣微分方程,然后分析或計算求解mrde文 獻(xiàn)24, 29, 30o然而,該方法文獻(xiàn)28僅適用于當(dāng)mrde的某些系數(shù)是非奇異的 情況下。在文獻(xiàn)20,在制導(dǎo)導(dǎo)彈系統(tǒng)小提岀了求解mrde線性二次控制問題的 解析方fee mrde中丿的解是通過k(f) = (%(/),這里的/和p"丿都是一階普通 線性微分方程的確定解。然而,給定技術(shù)操作僅限于單輸入。雖然并行算法的求解速度比序列算法更快,但是與rk方法和比,mrde在 神經(jīng)網(wǎng)絡(luò)解決方案中還沒有提岀新的報告。為了得到最優(yōu)解,本文通過基于神經(jīng) 計算的途徑求解mrdeo而求解的辦法就是在整個有限域找到一致準(zhǔn)確性和熟練

9、 的神經(jīng)網(wǎng)絡(luò),從而提供一個簡潔的解析解表達(dá)式。并給出一個實(shí)例與rk方法相 比,說明該方法快速、計算準(zhǔn)確等優(yōu)勢和特點(diǎn)。本文組織如下:第二章,給出了問題的聲明;第三章,提出了mrde求解方 案;第四章,討論了數(shù)值算例;最后的結(jié)論部分論證了該方法的有效性。2問題的提出考慮到線性動態(tài)奇界系統(tǒng),可以表達(dá)成如下形式:fdx =ax(t) + du(t)dw(tx(0) = 0,/ e 0心(1)某些情況下矩陣尸口j能是奇異的,x(r) e r'1是一個廣義狀態(tài)空間向量,u m是控制變量并且在歐氏空間有一定的值,w“丿是一個布朗運(yùn)動a e r' ,b e rnxm和d w it"是

10、已知的與曲丿和必丿相關(guān)的系數(shù)矩陣,分別給出了竝初始 狀態(tài)向量和加 no為了使這兩種狀態(tài)和反饋控制系統(tǒng)的控制信號達(dá)到最小,通常是讓這個二次型性能指標(biāo)最小化:住酗)+/j =斗* (f/)f兀()+式屮上標(biāo)片旨移位算子,s e rnx,i和是兀a)的正定對稱(或半正定)加權(quán) 矩陣,r是必丿的一個正定對稱加權(quán)矩陣。假設(shè)對于某些s有|sf-人卜0。這種假 設(shè)可保證任何輸入mj會產(chǎn)生唯一的一個狀態(tài)軌跡?!柏?。如果所有狀態(tài)變量是可測量的,那么可以得到一個線性狀態(tài)反饋控制律文 獻(xiàn)1, 36u(t) = (r + dtk(t)dy bt (0可以給出此系統(tǒng)描述eq.(l),此處入= k(f)fx (2)k(t

11、) e r,lxn是一個對稱矩陣并月是mrde的解。與mrde相關(guān)的隨機(jī)線性奇異系 統(tǒng)是:ftk(t)f + ftk(t)a + ftk(t)f + q-fkb(r + dtkd)t btk(tf = 0它有終止條件(tc)k(tf) = ftsf和(r + dtk(t)d)0。3 mrde的引入1 t=x2眾所周知,最小化j相當(dāng)于減少哈密頓量方程:qx(f) + utru(t) +(t)ax(t) + biz(t) + 兔(t)du(t)在這里a2(t) = k(t)du(t),通過最優(yōu)軌跡。利用隨機(jī)最優(yōu)性條件和隨機(jī)極值原理文獻(xiàn)7,我們所得到的哈密頓量方程麗如心(,),從)宀0這意味著(r

12、+ drk(t)d)u(t) + bt(r) = 0 => u(t) = (r + dtk(t)dy br(/)dhdx(t)=ftd => rd入(0 = qx(t)dt + a2dwq)=ftdx(t) => fdx(t) = ax(t) + du(t)dw(z) 由(4),我們得到:fdx =ax(t) b(r + dtk(t)dyl b丁入+ du(t)dw(t)由,我們得到:d 入(/) = k (t)fx(t) + k (t)fdx(t)并且我們有:ftd =fk fx + f1 fdx (7)通過eqs.(5)和代入(7),我們得到:ftk(t)f + ftk(

13、t)a + atk(t)f + q(8)ftk b(r + zt k(/)q)t btk(t)fx(t)dt + dm = 0這里dm=q“a)入dw(f),并且m是可積鞅。hteq.(8)適用于所有非零兀(7丿和a/ = 0,那么約定左乘x必須是零。因此 我們得到以下隨機(jī)線性奇異系統(tǒng)(mrde) (1)ftk(t)f + ftk(t)a + atk(t)f + q-ftk(t)b(r + dtk(t)dy btk(t)f = 0該方程已經(jīng)在第二節(jié)求解k(0得到最優(yōu)解。在上述的方程式中運(yùn)用適當(dāng)?shù)木仃嚕?將它們變成了一個奇異系統(tǒng)或者微分代數(shù)系統(tǒng)的一個指標(biāo)。該系統(tǒng)運(yùn)用一次代數(shù) 微分方程可以變形為一

14、個系統(tǒng)的非線性微分方程。所以,求解mrde相當(dāng)于求解 系統(tǒng)的非線性微分方程。4 mrde的求解考慮系統(tǒng)的微分方程(3)=/心),(心)匕)=舛,0 j = 1,2,/)(9)4.1 runge-kutta 法求解在連續(xù)時間動力學(xué)中,常微分方程的數(shù)值解是最重要的技術(shù)。由于大多數(shù)的 微分方程是無法分析求解的,數(shù)值積分就是獲得信息的唯一途徑。下面提出了幾 種方法,用于準(zhǔn)確求解各種類型的微分方程。他們是runge-kutta法,亞當(dāng)斯前 擊法和向后微分公式法。上述所有方法都能使微分系統(tǒng)離散化產(chǎn)生差分方程。選擇runge-kutta法的優(yōu)勢如下:1 它采用四階方法思想,因此與低階方法相比冇更精確解,如:

15、泰勒法, 歐拉法。2. 它能夠精確調(diào)整為每一個i'.ij題。3. 它采用控制理論思想,能有效控制步長的大小。4. 在該方法中,步長的大小變化比其他方法如bdf(向后微分公式法)更簡 單。rk算法已被認(rèn)為是常微分方程中數(shù)值積分最好的工具(odes)o系統(tǒng)(9)包 含帶有,變量的一階常微分方程組。特別是當(dāng)斤=2時,系統(tǒng)將包含四個等式。 曲于矩陣k是對稱的,并11該系統(tǒng)是奇異的,則k12 = k21hk22是不受約束的(令 k22 = 0)o最后,系統(tǒng)將含有兩個變量和兩個方程。因此用rk思想將系統(tǒng)表示成 含有兩個變量的一階常微分方程組。心(i + l) =心+ z&+2人+2人+心)

16、,6kji +1)=心0 + 匚(厶 + 2z2 + 2/3 +仃),o其中=/? *伙口&2) 人=/2*%(褊,代2)心=力*叫(何1 +號,任2 +日*%偽+級2+扌)心=力*叫伙口 +<3 = * 12 伙| + 號'*12 + 扌) 忽=力*11(心1+心&2 +a) /4=/2*%&i+&&2+g用同樣的方式,原系統(tǒng)(9)可以用含有/的一-階常微分方程組求解。4.2神經(jīng)網(wǎng)絡(luò)求解在本方法屮,新型前饋神經(jīng)網(wǎng)絡(luò)用丁將eq.(9丿的誤差解轉(zhuǎn)變?yōu)榍笊窠?jīng)網(wǎng)絡(luò)(9) 的解。謀差解可表示為兩個不同的術(shù)語如下(參見22):(褊川)=4廠化匕叫)(

17、10)第一個術(shù)語滿足了tcs和包含不可調(diào)和參數(shù)。第二個術(shù)語采用一種前饋神經(jīng)網(wǎng)絡(luò) 和同神經(jīng)結(jié)構(gòu)權(quán)重對應(yīng)的參數(shù)w”??紤]一個擁有斤個輸入單位、川個反曲雙隱層單位和一個線性輸出設(shè)備的多層 感知器。對于一個給定的輸入向量,網(wǎng)絡(luò)輸出為(11)nij=£vp(zj/=!英中防工w必+冬/=!旳指從輸入單元j到隱藏單元i的權(quán)重,匕指從隱藏單元i到輸岀單元的權(quán) 重,旳指隱藏單元j的偏移,b(z)是反曲的傳遞函數(shù)。式(11)的可微性的階數(shù)和激活函數(shù)廠(*)相同。由于我們選擇的sigmoid函數(shù)是無窮可微函數(shù),就給定的輸入,網(wǎng)絡(luò)輸出將是dt i=力7jot:/=i(12)其中/(*)表示sigmoid函

18、數(shù)就其標(biāo)量輸入,eqs. 1)和(分別構(gòu)成網(wǎng)絡(luò)的輸出和 梯度方程。謀差量可由下式最小化e嚴(yán)丈(&)j-”(伙丿)(神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,一直到誤差函數(shù)(13)變成零。一旦耳趨于零,(10)的誤差解就 是神經(jīng)網(wǎng)絡(luò)方程(9)的解。4.3 ffnn 結(jié)構(gòu)ffnn結(jié)構(gòu)由個輸入單元、一個包含個反曲單元隱層和一個線性輸出。每 個神經(jīng)元的輸出是基于它的輸入內(nèi)積和適當(dāng)?shù)臋?quán)值向量。圖i;irr神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu) 用來計算n"。權(quán)重和網(wǎng)絡(luò)偏并初始值遵循niyenand widrow規(guī)則文獻(xiàn)26, 27。該規(guī)則的 作用是通過設(shè)定初始網(wǎng)絡(luò)權(quán)重的隱層,每一個隱藏的節(jié)點(diǎn)分配自己的區(qū)間,從而 加快訓(xùn)練過程。在訓(xùn)練期

19、間,網(wǎng)絡(luò)訓(xùn)練的每個隱藏節(jié)點(diǎn)可以口由調(diào)整其區(qū)間的大 小和它的位置。函數(shù)在區(qū)域(0, 1)內(nèi)神經(jīng)網(wǎng)絡(luò)不是全開狀態(tài)的,它只有一種 長度,但有刃個隱藏的單元。因此,每一個隱藏的單位負(fù)責(zé)一個平均長度為%的 區(qū)間。由于(7(w7.+w)在0<比幾.+妁v 1內(nèi)近似線性,該收益區(qū)間0</.<-7叫-色r度為-w.)因此1 _ 1然而,所選區(qū)間最好略有重疊,這樣我們可以選取w, = 0.7/2,接著采集下一個均, 那么區(qū)間就位于0 <兀v 1的隨機(jī)區(qū)域,區(qū)間的中心則位于wt =-=介于0和1之間的均勻隨機(jī)值 叫這種良好的初始化可以大大加快學(xué)習(xí)過程。權(quán)重和偏差通過用3傾berg - ma

20、rquardt(lm)算法文獻(xiàn)18的迭代更新,直 到誤差函數(shù)趨近于零。lm算法是一種變化的牛頓法,其目的是盡量使其他非線 性函數(shù)的平方和最小化。這非常適合于神經(jīng)網(wǎng)絡(luò)訓(xùn)練。訃我們首先考慮牛頓法的誤差函數(shù)是平方和形式的情況,假設(shè)誤差函數(shù)相對 于參數(shù)向量冷已經(jīng)最小化,那么牛頓法可以描述成(褊)i+i =(褊)i a心(14)心=歹耳伙川w仗(褊),其中v2ee是一個海森矩陣,vek.是梯度,如果乞假設(shè)為一個平方和函n數(shù)乙伙嚴(yán)工6伙丿,1=1那么我們可以得到e(k嚴(yán) jgjg) + s伙)'弘(心)弘(心)弘(心) 呱)”%2(焉)処(褊)処伙丿 °(勺)|鞏心)2 妞(心)妞傀)

21、妞(褊) 8(心)2呱)”這里的丿心是雅可比矩陣j (褊)=呂(褊)=尸傀龍(褊),v2n運(yùn)用高斯牛頓法,又假定s伙“)uo,那么等式組(14)可變形為a褊=廠(褊)廠鶴龍伙川.則le venberg-ma rqua rdt將高斯牛頓法改進(jìn)為(k片=伙“)廠廠(褊”(褊)+ mf jt伙屏(對).無論是否增加ek.,這里的參數(shù)“都會和一些因子(0)相乘,當(dāng)毎一步減少ek., “被0分割,注意此處“值很大,這個公式的值將會最速下降變小,該 方法稱為高斯牛頓法,lm法是訓(xùn)練中等前饋神經(jīng)網(wǎng)絡(luò)最快的方法,神經(jīng)網(wǎng)絡(luò)算 法可以在cpu為1.7ghz的個人電腦上使用matlab軟件運(yùn)行,它通過用神經(jīng)計 算的

22、方法來近似求解線性隨機(jī)奇異系統(tǒng)(1)的mrde(3)輸入層輸出層隱藏層圖神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)5神經(jīng)網(wǎng)絡(luò)算法步驟1:饋入輸入向量。步驟2:用nguyen and w/drow規(guī)則初始化隨機(jī)權(quán)重矩陣w和偏移量ui。步驟3:計算j = £ wjj + ui oy=i步驟4:將爲(wèi)的值傳遞給斤個奇異函數(shù)。步驟5:從隱藏單元初始化權(quán)重向量匕到輸出單元。步驟6:計算他=工匕q(zj o/=1步驟7:計purelrn函數(shù)(飾)。步驟8:計算誤差函數(shù)乙的值。步驟9:如果e,值為0,停止訓(xùn)練;否則用lm算法更新權(quán)重矩陣。步驟10:重復(fù)神經(jīng)網(wǎng)絡(luò)訓(xùn)練直到下面誤差函數(shù)ij=該神經(jīng)網(wǎng)絡(luò)訓(xùn)練流程圖已經(jīng)在圖.2中給出。fi

23、g. z flow chart.6數(shù)值實(shí)例考慮最優(yōu)控制問題:最小化a/)fr5fx(z/) + -j/ xt)qx(t) + ut)ru(t)dt它滿足奇界線性系統(tǒng):fdx(t) = ax(t) + bu(t)dt + du(t)dw (/),x(0) = x0.這里:1 ,/? = l,q =<1(°o),d =0丿<1 0)v 0、<-12、s =,f =<0 0丿<0 。丿<0-4丿為了求解以上與mrde相關(guān)的線性奇異系統(tǒng),數(shù)值實(shí)現(xiàn)應(yīng)該滿足條件tf=2,采 用適當(dāng)?shù)木仃嚧鎒q. (3)o在莒和為屮將mrde化為系統(tǒng)的微分方程,在這個 問題里

24、,在系統(tǒng)的矩陣k中褊是隨機(jī)值,不妨設(shè)褊=0,則該系統(tǒng)的非線性 微分方程為譏=2心-1 +=1,1 +鉛(k v、kn= 2莒-1+、“ & =0.1 +舖丿一個有5個隱藏單元的隱藏層和一個線性輸出單位被使用的多層感知器,每 個隱藏單位的曲形激活函數(shù)是b(/)=一。謀差函數(shù)是1 + er=譏-(2 紀(jì)1 +如-+1 + k-丄十心丿.在區(qū)間0, 2內(nèi)選取等距點(diǎn)作為輸入向量。其學(xué)習(xí)速率是0.05。網(wǎng)絡(luò)的權(quán)重和偏 羌遵循ngu)m和w/drow規(guī)則進(jìn)行初始化,并利用levenberg-marqucirdt(lm)算法 被反復(fù)更新。在100個周期之后網(wǎng)絡(luò)的輸出為:= 0 0.2 0.4 0.6

25、 0.8 1.0 1.2 1.4 1.6 1.8 2,ku = 0.489 0.497 0.502 0.520 0.532 0.558 0.603 0.633 0.735 0.854 1.047,= -0.27 -0.21-0.24 -0.22 -0.22 -0.22 -0.24 -0.13 -0.15 -0.04 -0.04.對應(yīng)謀差函數(shù)的值為().()()()3 o一個有10個隱藏單元的隱藏層和一個線性輸出單位被使用的多層感知器。在10()個周期之后網(wǎng)絡(luò)的輸出為:tj = q 0.2 0.4 0.6 0.8 1.0 1.2 1.4 1.6 1.8 2,kn = 0.489 0.494 0.

26、501 0.511 0.526 0.549 0.582 0.632 0.708 0.823 1.000,k2 = -0.23 -0.23 -0.23 -0.22 -0.21 -0.20 -0.19 -0.16 -0.14 -0.08 0.00.對應(yīng)謀差函數(shù)的值為0.0000005o運(yùn)用rk方法和神經(jīng)網(wǎng)絡(luò)近似方法,mrde通過計算得到數(shù)值解并顯示在表.1上。一個有10個隱藏單元的隱藏層和一個線性輸出單位被使用的多層感知器,每個隱藏單位的曲形激活函數(shù)是7(0=1 + £6.1神經(jīng)網(wǎng)絡(luò)解的曲線神經(jīng)網(wǎng)絡(luò)和傳統(tǒng)rk方法求mrde的解和解z間的謀差顯示在圖.3圖.6上。所求解的數(shù)值結(jié)果在表.1中

27、列出。神經(jīng)網(wǎng)絡(luò)求解的計算時間是1.6秒。表一1mrde的解trunge-kutta solutionneural network solution111212ojd0.490355-0254823(1490354-q254822020.496200-0251900(1496199-02519000.40504585-0247708(1504584-02477070.60516623-0241688(1516622-02416880啟0533933-0233034a533931-0233()341j00558870-0220565a558868-0220565120594896-o2q2552a

28、594894-02q2552l40.647136-07g432a647133一07g433l60723264-oj38368a 723261一 0.1383691啟0-834921-0.0825400.834917-0.0825412.0loooooo0.000000loooooo0.000000而用rk方法求解的計算時間是2.2秒。因此,神經(jīng)網(wǎng)絡(luò)解法比rk方法更快速。fig. 3. solution curve for k.fig. 4. error curve for kibnfig. 1 solution curve for ku.fig. gi error curve for 處,7總

29、結(jié)隨機(jī)線性奇異系統(tǒng)最優(yōu)控制是通過神經(jīng)網(wǎng)絡(luò)的方法獲得的。在這種方法中, 很明顯,所構(gòu)造的誤差函數(shù)耳在很短的時間內(nèi)趨于0。因此,神經(jīng)網(wǎng)絡(luò)方法可以 作為一個比標(biāo)準(zhǔn)解法如rk方法明顯快速的mrde解法。我們已經(jīng)給出一個數(shù)值 算例說明推導(dǎo)結(jié)果。尋找最優(yōu)控制的長微積分時間是為了避免使用神經(jīng)最優(yōu)控制 器。最優(yōu)解的有效近似可以使用cpu為1.7ghz的計算機(jī)上使用matlab軟件實(shí) 現(xiàn)。作者非常感謝評審團(tuán)對提高這篇論文所提出的寶貴意見。作者的工作得到了 國務(wù)院科學(xué)與技術(shù)部政府的支持。印度新徳里-serc項(xiàng)目序號:sr/s4/ ms:485/07 日期:2008年4月21 日。參考文獻(xiàn)i m ait ram,

30、j.b. moore, x.y. zhou, indefinite stochastic linear quadratic control and generalized differential riccati equation, siam j. control optim. 40 (2001) 1296-1311 2| m. athens, special issues on linear quadratic gaussian problem, ieee automat.control ac-16 (1971) 527-869.|3| p. balasubramaniam, j. abdu

31、l samath, n. kumaresan, a. vincent antony kumar, solution of matrix riccati differential equation for the linear quadratic singular system using neural networks, appl math. comput. 182 (2006) 1832-1839.4 p. balasubramaniam, j. abdul samath, n. kumaresan, optimal control for nonlinear singular system

32、s with quadratic performance using neural networks, appl. math. comput.187 (2007) 1535-1543.5| p. balasubramaniam, j. abdul samath, n. kumaresan, a. vincent antony kumar, neuro approach for solving matrix riccati differential equation, neural parallel sci. comput. 15 (2007) 125-135.6 a. bensoussan,

33、lecture on stochastic control part i,in: nonlinear and stochastic control, lecture notes in math, vol. 972, springer-verlag, berlin, 1983, pp. 1-39.7| j.m bismut, an introductory approach to duality in optimal stochastic control, syst. control lett. 39 (2000) 79-86.8| e bucci, l. pandolfi, the regul

34、ator problem with indefinite quadratic cost for boundary control systems: the finite horizon case, syst. control lett. 39 (2000) 79-86.9 s-l. campbell, singular systems of differential equations, pitman, marshfield, ma, 1980.10 s.l. campbell, singular systems of differential equations ii,pitman, mar

35、shfield, ma, 1982.ii c.h. choi, a survey of numerical methods for solving matrix riccati differential equation, proc. southeastcon (1990) 696-700.12 s.p. chen, x.j. li, x.y. zho, stochastic linear quadratic regulators with indefinite control weight costs, siam j. control optim. 36 (5) (1998) 1685-17

36、02.13 l. dai, singular control systems, lecture notes in control andinformation sciences, springer, new york, 1989.14 g. da prato, a. ichikawa, quadratic control for linear periodic systems, appl. math. optim. 18 (1988) 39-66.15 m.h.a. davis, linear estimation and stochastic control, chapman and hal

37、l, london, 1997.16 s.w. ellacott, aspects of the numerical analysis of neural networks, acta numer. 5 (1994) 145-202.17 f.m ham, e.g. collins, a neurocomputing approach for solving the algebraic matrix riccati equation, proc. ieee int. conf. neural networks 1 (1996) 617-62218 m.t. hagan, m. menhaj,

38、training feedforward networks with the marquardt algorithm, ieee trans. neural networks 5 (6) (1994) 989-993.19 m. jamshidi, an overview on the solutions of the algebraic matrix riccati equation and related problems, large scale syst. 1 (1980) 167-192.20 l. jodar, e. navarro, closed analytical solut

39、ion of riccati type matrix differential equations, indian j. pure appl. math. 23 (1992) 185-187.211 a. karakasoglu, s.l. sudharsanan, mk. sundareshan, identification and decentralized adaptive control using neural networks with application to robotic manipulators, ieee trans. neural networks 4 (1993

40、) 919-930.22 i.e. lagaris, a. likas, d.i. fotiadis, artificial neural networks for solving ordinary and partial differential equations, ieee trans. neural networks 9 (1998) 987-1000.23 f.l. lewis, a survey of linear singular systems, circ. syst. sig. proc 5 (1) (1986) 3-36.24 n lovren, m. tomic, analytic solution of the riccati equation for the homing missile linear quadratic control problem, j. guid. control dynam. 17 (1994) 619-621.25 k.s. narendra, k parathasarathy, identification and control of dynamical systems using neural networks, ieee trans. neural networks 1 (1990) 4-27.26

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論