使用神經(jīng)網(wǎng)絡(luò)對隨機(jī)線性二次型奇異系統(tǒng)的最優(yōu)控制

上傳人：灰*** IP屬地：寧夏上傳時間：2021-12-03 格式：DOC 頁數(shù)：20 大小：394.50KB 積分：10.8 舉報 版權(quán)申訴

使用神經(jīng)網(wǎng)絡(luò)對隨機(jī)線性二次型奇異系統(tǒng)的最優(yōu)控制_第2頁

使用神經(jīng)網(wǎng)絡(luò)對隨機(jī)線性二次型奇異系統(tǒng)的最優(yōu)控制_第3頁

使用神經(jīng)網(wǎng)絡(luò)對隨機(jī)線性二次型奇異系統(tǒng)的最優(yōu)控制_第4頁

使用神經(jīng)網(wǎng)絡(luò)對隨機(jī)線性二次型奇異系統(tǒng)的最優(yōu)控制_第5頁

已閱讀5頁，還剩15頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、optimal control for stochastic linear quadratic singular systemusing neural networksn. kumaresan *，p. balasubramaniamjournal of process control 19 (2009) : page482-488使用神經(jīng)網(wǎng)絡(luò)對隨機(jī)線性二次型奇異系統(tǒng)的最優(yōu)控制n庫瑪瑞森博士，p巴拉蘇布拉馬尼亞姆過程控制雜志19期（2009年）：引用482488頁在本文中，最優(yōu)控制隨機(jī)線性奇異系統(tǒng)與二次型已經(jīng)在神經(jīng)網(wǎng)絡(luò)領(lǐng)域獲得使用。其目的是提供最優(yōu)控制和努力通過比較矩陣riccati微分方程

2、(mrde)的解減少微積分獲得了從眾所周知的傳統(tǒng)runge-kutta(rk)方法和傳統(tǒng)神經(jīng)網(wǎng)絡(luò) 方法。為了獲得最優(yōu)控制,mrde的解可以通過前向神經(jīng)網(wǎng)絡(luò)(ffnn)計算得到。更接近神經(jīng)網(wǎng)絡(luò)方法得到的精確解來解決這一問題性能更好。該方法的優(yōu)點(diǎn)是, 一旦網(wǎng)絡(luò)運(yùn)行起來，它可以瞬吋計算出評估方案在任意點(diǎn)和任意少量的時間和記憶的支出，其計算時間的方法比傳統(tǒng)rk方法更快、耗時更短。下面一個數(shù)值算例給出了該方法。關(guān)鍵詞：矩陣微分方程；神經(jīng)網(wǎng)絡(luò)；最優(yōu)控制；龍格庫塔法；隨機(jī)奇異線性系統(tǒng)1簡介眾多學(xué)者一直在研究隨機(jī)線性二次型調(diào)節(jié)器(lqr)問題文獻(xiàn)2、6、8、15、34o陳等人文獻(xiàn)12的研究表明對于隨

3、機(jī)lqr問題是如果riccati方程有解，那么可以得到最優(yōu)反饋控制。關(guān)于lqr方面的問題，相關(guān)的研究riccati方程，這是很自然的。然而，對于eccd"方程解的存在性和唯一性，一般來說，由于存在復(fù)朵的非線性項(xiàng)，這似乎成為一個很困難的問題。朱和李文獻(xiàn)36采用迭代方法求解隨機(jī)lqr問題中ricca"方程的隨機(jī)性。常規(guī)用ccm方程有幾種數(shù)值方法解，這些可能發(fā)生非線性過程基本誤差積累。為了使誤差最小，最近傳統(tǒng)的用方程分析了利用神經(jīng)網(wǎng)絡(luò)方法文獻(xiàn)3-5o本文闡述了擴(kuò)展的神經(jīng)網(wǎng)絡(luò)方法求解隨機(jī) riccati 方程。神經(jīng)網(wǎng)絡(luò)或簡單的神經(jīng)網(wǎng)絡(luò)都是計算機(jī)系統(tǒng)，它可以通過訓(xùn)練學(xué)習(xí)兩

4、個或多個變量的某種復(fù)雜關(guān)系或數(shù)據(jù)集。具有類似于他們的生物學(xué)配對物的結(jié)構(gòu)，經(jīng)過神經(jīng)網(wǎng)絡(luò)處理信息和并行分布式簡單處理節(jié)點(diǎn)連接的計算模型的組成形式文獻(xiàn) 33。神經(jīng)網(wǎng)絡(luò)技術(shù)己被成功地應(yīng)用于許多領(lǐng)域，如函數(shù)逼近、信號處理和自適應(yīng)或非線性系統(tǒng)的學(xué)習(xí)控制。利用神經(jīng)網(wǎng)絡(luò)，各式各樣的對非線性系統(tǒng)離線學(xué)習(xí) 控制算法己經(jīng)開發(fā)出來文獻(xiàn)21, 25o為求解代數(shù)riccati方程，各種數(shù)值算法文獻(xiàn)11也已經(jīng)隨z開發(fā)出來。近年來，神經(jīng)網(wǎng)絡(luò)問題已經(jīng)引起了越來越多的重視, 許多研究人員進(jìn)行了數(shù)值代數(shù)用ccd"方程等方面的研究，見文獻(xiàn)16, 17, 32。奇異系統(tǒng)包含一個混合代數(shù)和微分方程組。從這個意義上說，代

5、數(shù)方程組代表代數(shù)方程限定解的微分部分。這些系統(tǒng)也被稱為退化、描述或半狀態(tài)和廣義狀態(tài)空間系統(tǒng)。奇異系統(tǒng)的復(fù)雜本質(zhì)導(dǎo)致在分析及數(shù)值處理這樣的系統(tǒng)會遇到許多困難，尤其是在需要對它們的控制時。該系統(tǒng)自然演變成一個線性系統(tǒng)模型或者在許多領(lǐng)域應(yīng)用的線性系統(tǒng)模型，如：電網(wǎng)、飛機(jī)動力學(xué)、中立型時滯系統(tǒng)、化學(xué)、熱擴(kuò)散過程、大型系統(tǒng)、機(jī)器人學(xué)、生物等。見文獻(xiàn)9, 10, 23。許多實(shí)際過程可以被建成為描述系統(tǒng)模型，如約束控制問題模型，電路模型, 某些人口增長模型和奇異擾動模型。由于這樣的事實(shí)，在過去的幾年中，描述系統(tǒng)的穩(wěn)定性問題以及控制問題已被廣泛地研究，即描述系統(tǒng)能夠比狀態(tài)空間系統(tǒng) 更好的描述某個物

6、理系統(tǒng)。與狀態(tài)空間系統(tǒng)相比，描述系統(tǒng)結(jié)構(gòu)更復(fù)雜更完善。此外，由于描述系統(tǒng)通常有三種模式，即有限的動態(tài)模式、脈沖模式和非動態(tài)模式文獻(xiàn)13,研究描述系統(tǒng)的動態(tài)性能比對狀態(tài)空間系統(tǒng)研究困難，而后者兩個不出現(xiàn)在狀態(tài)空間系統(tǒng)。由于標(biāo)準(zhǔn)二次型性能線性系統(tǒng)的最優(yōu)控制理論發(fā)展迅速，其結(jié)果在許多實(shí)際設(shè)計問題中是最完整、最接近使用。該理論的二次成木控制問題被視為一個更有趣的問題，最小成本最優(yōu)反饋控制一宜是用于求解用ccd"方程。da prato和ichikawa獻(xiàn)14表明riccati方程解的總是具有最優(yōu)反饋控制、總成本最低的特征。mrde解決的中心問題是最優(yōu)控制理論。經(jīng)常需耍分析和綜合求解

7、這類方程, 如線性二次型最優(yōu)控制系統(tǒng)、控制系統(tǒng)魯棒h2和h1控制文獻(xiàn)35的性能標(biāo)準(zhǔn)、隨機(jī)過濾和控制系統(tǒng)模型的降階、微分對策等。其中在數(shù)學(xué)和工程學(xué)領(lǐng)域，一個最深入研究的非線性矩陣方程是用cam方程。對于該方程，它存在一種或另一種形式，在最優(yōu)控制問題，多變量、大規(guī)模系統(tǒng)，散射理論，估計檢測、運(yùn)輸和輻射傳輸文獻(xiàn)19小扮演一個重要的角色。該方程的解也很難從兩個角度獲得。一個是非線性的，另一個是用矩陣的形式表示。求解mrde邊界條件的最普通的方法是得到mrde并將它轉(zhuǎn)變成一個等價的線性微分哈密頓系統(tǒng)文獻(xiàn)20。利用這個方法，得到與mrde解的狀態(tài)轉(zhuǎn)換矩陣相關(guān)的哈密頓系統(tǒng)文獻(xiàn)31。另一類方法

8、是基于mrde轉(zhuǎn)變成一個線性矩陣微分方程，然后分析或計算求解mrde文獻(xiàn)24, 29, 30o然而，該方法文獻(xiàn)28僅適用于當(dāng)mrde的某些系數(shù)是非奇異的情況下。在文獻(xiàn)20,在制導(dǎo)導(dǎo)彈系統(tǒng)小提岀了求解mrde線性二次控制問題的解析方fee mrde中丿的解是通過k(f) = (%(/)，這里的/和p"丿都是一階普通線性微分方程的確定解。然而，給定技術(shù)操作僅限于單輸入。雖然并行算法的求解速度比序列算法更快，但是與rk方法和比，mrde在神經(jīng)網(wǎng)絡(luò)解決方案中還沒有提岀新的報告。為了得到最優(yōu)解，本文通過基于神經(jīng) 計算的途徑求解mrdeo而求解的辦法就是在整個有限域找到一致準(zhǔn)確性和熟練

9、的神經(jīng)網(wǎng)絡(luò)，從而提供一個簡潔的解析解表達(dá)式。并給出一個實(shí)例與rk方法相比，說明該方法快速、計算準(zhǔn)確等優(yōu)勢和特點(diǎn)。本文組織如下：第二章，給出了問題的聲明；第三章，提出了mrde求解方案；第四章，討論了數(shù)值算例；最后的結(jié)論部分論證了該方法的有效性。2問題的提出考慮到線性動態(tài)奇界系統(tǒng)，可以表達(dá)成如下形式：fdx =ax(t) + du(t)dw(tx(0) = 0,/ e 0心(1)某些情況下矩陣尸口j能是奇異的，x(r) e r'1是一個廣義狀態(tài)空間向量，u m是控制變量并且在歐氏空間有一定的值，w“丿是一個布朗運(yùn)動a e r' ,b e rnxm和d w it"是

10、已知的與曲丿和必丿相關(guān)的系數(shù)矩陣，分別給出了竝初始狀態(tài)向量和加 no為了使這兩種狀態(tài)和反饋控制系統(tǒng)的控制信號達(dá)到最小，通常是讓這個二次型性能指標(biāo)最小化：住酗)+/j =斗* (f/)f兀()+式屮上標(biāo)片旨移位算子,s e rnx,i和是兀a)的正定對稱(或半正定)加權(quán) 矩陣，r是必丿的一個正定對稱加權(quán)矩陣。假設(shè)對于某些s有|sf-人卜0。這種假設(shè)可保證任何輸入mj會產(chǎn)生唯一的一個狀態(tài)軌跡?！柏?。如果所有狀態(tài)變量是可測量的，那么可以得到一個線性狀態(tài)反饋控制律文獻(xiàn)1, 36u(t) = (r + dtk(t)dy bt (0可以給出此系統(tǒng)描述eq.(l),此處入= k(f)fx (2)k(t

11、) e r,lxn是一個對稱矩陣并月是mrde的解。與mrde相關(guān)的隨機(jī)線性奇異系統(tǒng)是:ftk(t)f + ftk(t)a + ftk(t)f + q-fkb(r + dtkd)t btk(tf = 0它有終止條件(tc)k(tf) = ftsf和(r + dtk(t)d)0。3 mrde的引入1 t=x2眾所周知,最小化j相當(dāng)于減少哈密頓量方程:qx(f) + utru(t) +(t)ax(t) + biz(t) + 兔(t)du(t)在這里a2(t) = k(t)du(t),通過最優(yōu)軌跡。利用隨機(jī)最優(yōu)性條件和隨機(jī)極值原理文獻(xiàn)7,我們所得到的哈密頓量方程麗如心(,),從)宀0這意味著(r

12、+ drk(t)d)u(t) + bt(r) = 0 => u(t) = (r + dtk(t)dy br(/)dhdx(t)=ftd => rd入(0 = qx(t)dt + a2dwq)=ftdx(t) => fdx(t) = ax(t) + du(t)dw(z) 由(4),我們得到：fdx =ax(t) b(r + dtk(t)dyl b丁入+ du(t)dw(t)由,我們得到：d 入(/) = k (t)fx(t) + k (t)fdx(t)并且我們有：ftd =fk fx + f1 fdx (7)通過eqs.(5)和代入(7),我們得到:ftk(t)f + ftk(

13、t)a + atk(t)f + q(8)ftk b(r + zt k(/)q)t btk(t)fx(t)dt + dm = 0這里dm=q“a)入dw(f),并且m是可積鞅。hteq.(8)適用于所有非零兀(7丿和a/ = 0,那么約定左乘x必須是零。因此我們得到以下隨機(jī)線性奇異系統(tǒng)(mrde) (1)ftk(t)f + ftk(t)a + atk(t)f + q-ftk(t)b(r + dtk(t)dy btk(t)f = 0該方程已經(jīng)在第二節(jié)求解k(0得到最優(yōu)解。在上述的方程式中運(yùn)用適當(dāng)?shù)木仃嚕?將它們變成了一個奇異系統(tǒng)或者微分代數(shù)系統(tǒng)的一個指標(biāo)。該系統(tǒng)運(yùn)用一次代數(shù) 微分方程可以變形為一

14、個系統(tǒng)的非線性微分方程。所以，求解mrde相當(dāng)于求解系統(tǒng)的非線性微分方程。4 mrde的求解考慮系統(tǒng)的微分方程(3)=/心)，(心)匕)=舛，0 j = 1,2,/)(9)4.1 runge-kutta 法求解在連續(xù)時間動力學(xué)中，常微分方程的數(shù)值解是最重要的技術(shù)。由于大多數(shù)的微分方程是無法分析求解的，數(shù)值積分就是獲得信息的唯一途徑。下面提出了幾種方法，用于準(zhǔn)確求解各種類型的微分方程。他們是runge-kutta法，亞當(dāng)斯前擊法和向后微分公式法。上述所有方法都能使微分系統(tǒng)離散化產(chǎn)生差分方程。選擇runge-kutta法的優(yōu)勢如下:1 它采用四階方法思想，因此與低階方法相比冇更精確解，如：

15、泰勒法，歐拉法。2. 它能夠精確調(diào)整為每一個i'.ij題。3. 它采用控制理論思想，能有效控制步長的大小。4. 在該方法中，步長的大小變化比其他方法如bdf(向后微分公式法)更簡單。rk算法已被認(rèn)為是常微分方程中數(shù)值積分最好的工具(odes)o系統(tǒng)(9)包含帶有，變量的一階常微分方程組。特別是當(dāng)斤=2時，系統(tǒng)將包含四個等式。曲于矩陣k是對稱的，并11該系統(tǒng)是奇異的，則k12 = k21hk22是不受約束的(令 k22 = 0)o最后，系統(tǒng)將含有兩個變量和兩個方程。因此用rk思想將系統(tǒng)表示成含有兩個變量的一階常微分方程組。心(i + l) =心+ z&+2人+2人+心)

16、，6kji +1)=心0 + 匚(厶 + 2z2 + 2/3 +仃)，o其中=/? *伙口&2) 人=/2*%(褊，代2)心=力*叫(何1 +號,任2 +日*%偽+級2+扌)心=力*叫伙口 +<3 = * 12 伙| + 號'*12 + 扌) 忽=力*11(心1+心&2 +a) /4=/2*%&i+&&2+g用同樣的方式，原系統(tǒng)(9)可以用含有/的一-階常微分方程組求解。4.2神經(jīng)網(wǎng)絡(luò)求解在本方法屮，新型前饋神經(jīng)網(wǎng)絡(luò)用丁將eq.(9丿的誤差解轉(zhuǎn)變?yōu)榍笊窠?jīng)網(wǎng)絡(luò)(9) 的解。謀差解可表示為兩個不同的術(shù)語如下(參見22)：(褊川)=4廠化匕叫)(

17、10)第一個術(shù)語滿足了tcs和包含不可調(diào)和參數(shù)。第二個術(shù)語采用一種前饋神經(jīng)網(wǎng)絡(luò) 和同神經(jīng)結(jié)構(gòu)權(quán)重對應(yīng)的參數(shù)w”?？紤]一個擁有斤個輸入單位、川個反曲雙隱層單位和一個線性輸出設(shè)備的多層感知器。對于一個給定的輸入向量，網(wǎng)絡(luò)輸出為(11)nij=£vp(zj/=!英中防工w必+冬/=!旳指從輸入單元j到隱藏單元i的權(quán)重，匕指從隱藏單元i到輸岀單元的權(quán) 重，旳指隱藏單元j的偏移，b(z)是反曲的傳遞函數(shù)。式(11)的可微性的階數(shù)和激活函數(shù)廠(*)相同。由于我們選擇的sigmoid函數(shù)是無窮可微函數(shù)，就給定的輸入，網(wǎng)絡(luò)輸出將是dt i=力7jot:/=i(12)其中/(*)表示sigmoid函

18、數(shù)就其標(biāo)量輸入，eqs. 1)和(分別構(gòu)成網(wǎng)絡(luò)的輸出和梯度方程。謀差量可由下式最小化e嚴(yán)丈（&）j-”（伙丿）（神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練，一直到誤差函數(shù)（13）變成零。一旦耳趨于零，（10）的誤差解就是神經(jīng)網(wǎng)絡(luò)方程（9）的解。4.3 ffnn 結(jié)構(gòu)ffnn結(jié)構(gòu)由個輸入單元、一個包含個反曲單元隱層和一個線性輸出。每個神經(jīng)元的輸出是基于它的輸入內(nèi)積和適當(dāng)?shù)臋?quán)值向量。圖i；irr神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu) 用來計算n"。權(quán)重和網(wǎng)絡(luò)偏并初始值遵循niyenand widrow規(guī)則文獻(xiàn)26, 27。該規(guī)則的作用是通過設(shè)定初始網(wǎng)絡(luò)權(quán)重的隱層，每一個隱藏的節(jié)點(diǎn)分配自己的區(qū)間，從而加快訓(xùn)練過程。在訓(xùn)練期

19、間，網(wǎng)絡(luò)訓(xùn)練的每個隱藏節(jié)點(diǎn)可以口由調(diào)整其區(qū)間的大小和它的位置。函數(shù)在區(qū)域（0, 1）內(nèi)神經(jīng)網(wǎng)絡(luò)不是全開狀態(tài)的，它只有一種長度，但有刃個隱藏的單元。因此，每一個隱藏的單位負(fù)責(zé)一個平均長度為%的區(qū)間。由于（7（w7.+w）在0<比幾.+妁v 1內(nèi)近似線性，該收益區(qū)間0</.<-7叫-色r度為-w.）因此1 _ 1然而，所選區(qū)間最好略有重疊，這樣我們可以選取w, = 0.7/2,接著采集下一個均，那么區(qū)間就位于0 <兀v 1的隨機(jī)區(qū)域，區(qū)間的中心則位于wt =-=介于0和1之間的均勻隨機(jī)值叫這種良好的初始化可以大大加快學(xué)習(xí)過程。權(quán)重和偏差通過用3傾berg - ma

20、rquardt（lm）算法文獻(xiàn)18的迭代更新，直到誤差函數(shù)趨近于零。lm算法是一種變化的牛頓法，其目的是盡量使其他非線性函數(shù)的平方和最小化。這非常適合于神經(jīng)網(wǎng)絡(luò)訓(xùn)練。訃我們首先考慮牛頓法的誤差函數(shù)是平方和形式的情況，假設(shè)誤差函數(shù)相對于參數(shù)向量冷已經(jīng)最小化，那么牛頓法可以描述成（褊）i+i =（褊）i a心（14）心=歹耳伙川w仗（褊），其中v2ee是一個海森矩陣，vek.是梯度，如果乞假設(shè)為一個平方和函n數(shù)乙伙嚴(yán)工6伙丿,1=1那么我們可以得到e（k嚴(yán) jgjg） + s伙）'弘（心）弘（心）弘（心）呱）”%2（焉）処（褊）処伙丿 °（勺）|鞏心）2 妞（心）妞傀）

21、妞（褊） 8（心）2呱）”這里的丿心是雅可比矩陣j （褊）=呂（褊）=尸傀龍（褊）,v2n運(yùn)用高斯牛頓法，又假定s伙“）uo,那么等式組（14）可變形為a褊=廠（褊）廠鶴龍伙川.則le venberg-ma rqua rdt將高斯牛頓法改進(jìn)為（k片=伙“）廠廠（褊”（褊）+ mf jt伙屏（對）.無論是否增加ek.,這里的參數(shù)“都會和一些因子（0）相乘，當(dāng)毎一步減少ek., “被0分割，注意此處“值很大，這個公式的值將會最速下降變小，該方法稱為高斯牛頓法，lm法是訓(xùn)練中等前饋神經(jīng)網(wǎng)絡(luò)最快的方法，神經(jīng)網(wǎng)絡(luò)算法可以在cpu為1.7ghz的個人電腦上使用matlab軟件運(yùn)行，它通過用神經(jīng)計算的

22、方法來近似求解線性隨機(jī)奇異系統(tǒng)（1）的mrde（3）輸入層輸出層隱藏層圖神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)5神經(jīng)網(wǎng)絡(luò)算法步驟1：饋入輸入向量。步驟2：用nguyen and w/drow規(guī)則初始化隨機(jī)權(quán)重矩陣w和偏移量ui。步驟3:計算j = £ wjj + ui oy=i步驟4：將爲(wèi)的值傳遞給斤個奇異函數(shù)。步驟5：從隱藏單元初始化權(quán)重向量匕到輸出單元。步驟6：計算他=工匕q（zj o/=1步驟7：計purelrn函數(shù)（飾）。步驟8：計算誤差函數(shù)乙的值。步驟9：如果e,值為0,停止訓(xùn)練；否則用lm算法更新權(quán)重矩陣。步驟10：重復(fù)神經(jīng)網(wǎng)絡(luò)訓(xùn)練直到下面誤差函數(shù)ij=該神經(jīng)網(wǎng)絡(luò)訓(xùn)練流程圖已經(jīng)在圖.2中給出。fi

23、g. z flow chart.6數(shù)值實(shí)例考慮最優(yōu)控制問題:最小化a/)fr5fx(z/) + -j/ xt)qx(t) + ut)ru(t)dt它滿足奇界線性系統(tǒng):fdx(t) = ax(t) + bu(t)dt + du(t)dw (/),x(0) = x0.這里:1 ,/? = l,q =<1(°o),d =0丿<1 0)v 0、<-12、s =,f =<0 0丿<0 。丿<0-4丿為了求解以上與mrde相關(guān)的線性奇異系統(tǒng)，數(shù)值實(shí)現(xiàn)應(yīng)該滿足條件tf=2,采用適當(dāng)?shù)木仃嚧鎒q. (3)o在莒和為屮將mrde化為系統(tǒng)的微分方程，在這個問題里

24、，在系統(tǒng)的矩陣k中褊是隨機(jī)值，不妨設(shè)褊=0,則該系統(tǒng)的非線性微分方程為譏=2心-1 +=1,1 +鉛(k v、kn= 2莒-1+、“ & =0.1 +舖丿一個有5個隱藏單元的隱藏層和一個線性輸出單位被使用的多層感知器，每個隱藏單位的曲形激活函數(shù)是b(/)=一。謀差函數(shù)是1 + er=譏-(2 紀(jì)1 +如-+1 + k-丄十心丿.在區(qū)間0, 2內(nèi)選取等距點(diǎn)作為輸入向量。其學(xué)習(xí)速率是0.05。網(wǎng)絡(luò)的權(quán)重和偏羌遵循ngu)m和w/drow規(guī)則進(jìn)行初始化，并利用levenberg-marqucirdt(lm)算法被反復(fù)更新。在100個周期之后網(wǎng)絡(luò)的輸出為：= 0 0.2 0.4 0.6

25、 0.8 1.0 1.2 1.4 1.6 1.8 2,ku = 0.489 0.497 0.502 0.520 0.532 0.558 0.603 0.633 0.735 0.854 1.047,= -0.27 -0.21-0.24 -0.22 -0.22 -0.22 -0.24 -0.13 -0.15 -0.04 -0.04.對應(yīng)謀差函數(shù)的值為().()()()3 o一個有10個隱藏單元的隱藏層和一個線性輸出單位被使用的多層感知器。在10()個周期之后網(wǎng)絡(luò)的輸出為：tj = q 0.2 0.4 0.6 0.8 1.0 1.2 1.4 1.6 1.8 2,kn = 0.489 0.494 0.

26、501 0.511 0.526 0.549 0.582 0.632 0.708 0.823 1.000,k2 = -0.23 -0.23 -0.23 -0.22 -0.21 -0.20 -0.19 -0.16 -0.14 -0.08 0.00.對應(yīng)謀差函數(shù)的值為0.0000005o運(yùn)用rk方法和神經(jīng)網(wǎng)絡(luò)近似方法，mrde通過計算得到數(shù)值解并顯示在表.1上。一個有10個隱藏單元的隱藏層和一個線性輸出單位被使用的多層感知器，每個隱藏單位的曲形激活函數(shù)是7(0=1 + £6.1神經(jīng)網(wǎng)絡(luò)解的曲線神經(jīng)網(wǎng)絡(luò)和傳統(tǒng)rk方法求mrde的解和解z間的謀差顯示在圖.3圖.6上。所求解的數(shù)值結(jié)果在表.1中

27、列出。神經(jīng)網(wǎng)絡(luò)求解的計算時間是1.6秒。表一1mrde的解trunge-kutta solutionneural network solution111212ojd0.490355-0254823(1490354-q254822020.496200-0251900(1496199-02519000.40504585-0247708(1504584-02477070.60516623-0241688(1516622-02416880啟0533933-0233034a533931-0233()341j00558870-0220565a558868-0220565120594896-o2q2552a

28、594894-02q2552l40.647136-07g432a647133一07g433l60723264-oj38368a 723261一 0.1383691啟0-834921-0.0825400.834917-0.0825412.0loooooo0.000000loooooo0.000000而用rk方法求解的計算時間是2.2秒。因此，神經(jīng)網(wǎng)絡(luò)解法比rk方法更快速。fig. 3. solution curve for k.fig. 4. error curve for kibnfig. 1 solution curve for ku.fig. gi error curve for 處,7總

29、結(jié)隨機(jī)線性奇異系統(tǒng)最優(yōu)控制是通過神經(jīng)網(wǎng)絡(luò)的方法獲得的。在這種方法中，很明顯，所構(gòu)造的誤差函數(shù)耳在很短的時間內(nèi)趨于0。因此，神經(jīng)網(wǎng)絡(luò)方法可以作為一個比標(biāo)準(zhǔn)解法如rk方法明顯快速的mrde解法。我們已經(jīng)給出一個數(shù)值算例說明推導(dǎo)結(jié)果。尋找最優(yōu)控制的長微積分時間是為了避免使用神經(jīng)最優(yōu)控制器。最優(yōu)解的有效近似可以使用cpu為1.7ghz的計算機(jī)上使用matlab軟件實(shí) 現(xiàn)。作者非常感謝評審團(tuán)對提高這篇論文所提出的寶貴意見。作者的工作得到了國務(wù)院科學(xué)與技術(shù)部政府的支持。印度新徳里-serc項(xiàng)目序號：sr/s4/ ms:485/07 日期:2008年4月21 日。參考文獻(xiàn)i m ait ram,

30、j.b. moore, x.y. zhou, indefinite stochastic linear quadratic control and generalized differential riccati equation, siam j. control optim. 40 (2001) 1296-1311 2| m. athens, special issues on linear quadratic gaussian problem, ieee automat.control ac-16 (1971) 527-869.|3| p. balasubramaniam, j. abdu

31、l samath, n. kumaresan, a. vincent antony kumar, solution of matrix riccati differential equation for the linear quadratic singular system using neural networks, appl math. comput. 182 (2006) 1832-1839.4 p. balasubramaniam, j. abdul samath, n. kumaresan, optimal control for nonlinear singular system

32、s with quadratic performance using neural networks, appl. math. comput.187 (2007) 1535-1543.5| p. balasubramaniam, j. abdul samath, n. kumaresan, a. vincent antony kumar, neuro approach for solving matrix riccati differential equation, neural parallel sci. comput. 15 (2007) 125-135.6 a. bensoussan,

33、lecture on stochastic control part i，in: nonlinear and stochastic control, lecture notes in math, vol. 972, springer-verlag, berlin, 1983, pp. 1-39.7| j.m bismut, an introductory approach to duality in optimal stochastic control, syst. control lett. 39 (2000) 79-86.8| e bucci, l. pandolfi, the regul

34、ator problem with indefinite quadratic cost for boundary control systems: the finite horizon case, syst. control lett. 39 (2000) 79-86.9 s-l. campbell, singular systems of differential equations, pitman, marshfield, ma, 1980.10 s.l. campbell, singular systems of differential equations ii，pitman, mar

35、shfield, ma, 1982.ii c.h. choi, a survey of numerical methods for solving matrix riccati differential equation, proc. southeastcon (1990) 696-700.12 s.p. chen, x.j. li, x.y. zho, stochastic linear quadratic regulators with indefinite control weight costs, siam j. control optim. 36 (5) (1998) 1685-17

36、02.13 l. dai, singular control systems, lecture notes in control andinformation sciences, springer, new york, 1989.14 g. da prato, a. ichikawa, quadratic control for linear periodic systems, appl. math. optim. 18 (1988) 39-66.15 m.h.a. davis, linear estimation and stochastic control, chapman and hal

37、l, london, 1997.16 s.w. ellacott, aspects of the numerical analysis of neural networks, acta numer. 5 (1994) 145-202.17 f.m ham, e.g. collins, a neurocomputing approach for solving the algebraic matrix riccati equation, proc. ieee int. conf. neural networks 1 (1996) 617-62218 m.t. hagan, m. menhaj,

38、training feedforward networks with the marquardt algorithm, ieee trans. neural networks 5 (6) (1994) 989-993.19 m. jamshidi, an overview on the solutions of the algebraic matrix riccati equation and related problems, large scale syst. 1 (1980) 167-192.20 l. jodar, e. navarro, closed analytical solut

39、ion of riccati type matrix differential equations, indian j. pure appl. math. 23 (1992) 185-187.211 a. karakasoglu, s.l. sudharsanan, mk. sundareshan, identification and decentralized adaptive control using neural networks with application to robotic manipulators, ieee trans. neural networks 4 (1993

40、) 919-930.22 i.e. lagaris, a. likas, d.i. fotiadis, artificial neural networks for solving ordinary and partial differential equations, ieee trans. neural networks 9 (1998) 987-1000.23 f.l. lewis, a survey of linear singular systems, circ. syst. sig. proc 5 (1) (1986) 3-36.24 n lovren, m. tomic, analytic solution of the riccati equation for the homing missile linear quadratic control problem, j. guid. control dynam. 17 (1994) 619-621.25 k.s. narendra, k parathasarathy, identification and control of dynamical systems using neural networks, ieee trans. neural networks 1 (1990) 4-27.26

人人文庫> 全部分類> 生活休閑 > 科普知識

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

使用神經(jīng)網(wǎng)絡(luò)對隨機(jī)線性二次型奇異系統(tǒng)的最優(yōu)控制

文檔簡介

溫馨提示

最新文檔

評論

使用神經(jīng)網(wǎng)絡(luò)對隨機(jī)線性二次型奇異系統(tǒng)的最優(yōu)控制

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔