版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)控制器摘要:木文將神經(jīng)網(wǎng)絡(luò)控制器應(yīng)川于受限非線(xiàn)性系統(tǒng)的優(yōu)化模型預(yù)測(cè)控制屮,控制規(guī)則用一 個(gè)神經(jīng)網(wǎng)絡(luò)函數(shù)逼近器來(lái)表示,該網(wǎng)絡(luò)是通過(guò)最小化一個(gè)與控制相關(guān)的代價(jià)函數(shù)來(lái)訓(xùn)練的。 本文提出的方法可以用于構(gòu)造任意結(jié)構(gòu)的控制器,如減速優(yōu)化控制器和分散控制器。 關(guān)鍵字:模型預(yù)測(cè)控制、神經(jīng)網(wǎng)絡(luò)、非線(xiàn)性控制1 介紹由于非線(xiàn)性控制問(wèn)題的復(fù)雜性,通常用逼近方法來(lái)獲得近似解。在木文中,提出了一種廣泛 應(yīng)用的方法即模型預(yù)測(cè)控制(mpc),這對(duì)用于解決在線(xiàn)優(yōu)化問(wèn)題,另一種方法是甌數(shù)逼近 器,如人工神經(jīng)網(wǎng)絡(luò),這可用于離線(xiàn)的優(yōu)化控制規(guī)則。在模型預(yù)測(cè)控制中,控制信號(hào)取決于在每個(gè)采樣時(shí)刻時(shí)的想要在線(xiàn)最小化的代價(jià)函數(shù)
2、,它己 經(jīng)廣泛地應(yīng)用于受限的多變量系統(tǒng)和非線(xiàn)性過(guò)程等工業(yè)控制中13,11,22jompc方法一個(gè)潛在 的弱點(diǎn)是優(yōu)化問(wèn)題必須能?chē)?yán)格地按要求推算,尤其是在非線(xiàn)性系統(tǒng)中。模型預(yù)測(cè)控制已經(jīng)廣 泛地應(yīng)川于線(xiàn)性mpc問(wèn)題中5,但為了減小在線(xiàn)計(jì)算時(shí)的計(jì)算量,該部分的計(jì)算為離線(xiàn)。 個(gè)非常強(qiáng)犬的函數(shù)逼近器為神經(jīng)網(wǎng)絡(luò),它能很好地用于表示非線(xiàn)性模型或控制器,如文獻(xiàn) 4,13,14。基于模型跟蹤控制的方法己經(jīng)普遍地應(yīng)用在神經(jīng)網(wǎng)絡(luò)控制,這種方法的一個(gè)局限 性是它不適合于不穩(wěn)定地逆系統(tǒng),基此本文研究了基于優(yōu)化控制技術(shù)的方法。許多基于神經(jīng)網(wǎng)絡(luò)的方法己經(jīng)提出了應(yīng)用衣優(yōu)化控制問(wèn)題方而,該優(yōu)化控制的日標(biāo)是最小化 一個(gè)與控制相關(guān)的
3、代價(jià)苗數(shù)。一個(gè)方法是川一個(gè)神經(jīng)網(wǎng)絡(luò)來(lái)逼近與優(yōu)化控制問(wèn)題相關(guān)聯(lián)的動(dòng) 態(tài)程式方程的解6。一個(gè)更直接地方法是模仿mpc方法,用通過(guò)最小化預(yù)測(cè)代價(jià)函數(shù)來(lái)訓(xùn) 練神經(jīng)網(wǎng)絡(luò)控制器。為了達(dá)到精確的mpc技術(shù),用神經(jīng)網(wǎng)絡(luò)來(lái)逼近模型預(yù)測(cè)控制策略,且 通過(guò)離線(xiàn)計(jì)算1,7.9,19。用一個(gè)交替且更直接的方法即直接最小化代價(jià)函數(shù)訓(xùn)練網(wǎng)絡(luò)控制器 代替通過(guò)訓(xùn)練一個(gè)神經(jīng)網(wǎng)絡(luò)來(lái)逼近一個(gè)優(yōu)化模型預(yù)測(cè)控制策略。這種方法目前已有許多版 本,parisini20和zoppoli24等人研究了隨機(jī)優(yōu)化控制問(wèn)題,其中控制器作為神經(jīng)網(wǎng)絡(luò)逼近 器的輸入輸出的一個(gè)函數(shù)。seong和widrow23研究了一個(gè)初始狀態(tài)為隨機(jī)分配的優(yōu)化控制 問(wèn)題,控
4、制器為反饋狀態(tài),用一個(gè)神經(jīng)網(wǎng)絡(luò)來(lái)表示。在以上的研究中,應(yīng)用了一個(gè)隨機(jī)逼近 器算法來(lái)訓(xùn)練網(wǎng)絡(luò)。al-dajani2和nayeri等人提出了一種和似的方法,即用最速下降法 來(lái)訓(xùn)練神經(jīng)網(wǎng)絡(luò)控制器。在許多應(yīng)用中,設(shè)計(jì)一個(gè)控制器都涉及到一個(gè)特殊的結(jié)構(gòu)。對(duì)于復(fù)雜的系統(tǒng)如減速控制器或 分散控制系統(tǒng),都需要許多輸入與輸出。在模型預(yù)測(cè)控制中,模型是用于預(yù)測(cè)系統(tǒng)未來(lái)的運(yùn) 動(dòng)軌跡,優(yōu)化控制信號(hào)是系統(tǒng)模型的系統(tǒng)的函數(shù)。因此,模型預(yù)測(cè)控制不能用于定結(jié)構(gòu)控制 問(wèn)題。不同的是,基于神經(jīng)網(wǎng)絡(luò)函數(shù)逼近器的控制器可以應(yīng)用于優(yōu)化定結(jié)構(gòu)控制問(wèn)題。 在木文中,主要研究的是應(yīng)用于非線(xiàn)性?xún)?yōu)化控制問(wèn)題的結(jié)構(gòu)受限的mpc類(lèi)型20,2,24,2
5、3,15。 控制規(guī)則用神經(jīng)網(wǎng)絡(luò)逼近器表示,最小化一個(gè)與控制相關(guān)的代價(jià)函數(shù)來(lái)離線(xiàn)訓(xùn)練神經(jīng)網(wǎng)絡(luò)。 通過(guò)將神經(jīng)網(wǎng)絡(luò)控制的輸入適當(dāng)特殊化來(lái)完成優(yōu)化低階控制器的設(shè)計(jì),分散和其它定結(jié)構(gòu)神 經(jīng)網(wǎng)絡(luò)控制器是通過(guò)對(duì)網(wǎng)絡(luò)結(jié)構(gòu)加入合適的限制構(gòu)成的。通過(guò)一個(gè)數(shù)據(jù)例子來(lái)評(píng)價(jià)神經(jīng)網(wǎng)絡(luò) 控制器的性能并與優(yōu)化模型預(yù)測(cè)控制器進(jìn)行比較。2. 問(wèn)題表述考慮一個(gè)離散非線(xiàn)性控制系統(tǒng):x伙+ 1) =/(.工(町屮仗)y 伙)=/(x 伙)其中丿伙)e用為控制器的輸出,心)e r1為輸入,x(k)6肥為狀態(tài)矢量??刂?目標(biāo)是保持輸出接近參考軌跡, 一般地控制目標(biāo)是通過(guò)最小化代價(jià)函數(shù)來(lái)實(shí)現(xiàn)的:a+jv1jn(u=力 ®(i+1比
6、)一兒(i+l)tq®(i+來(lái))i=kyr(i + 1) + au(j)t7?au(:) + qnxk + n 比)同時(shí)約束條件為:gx(%(i + 1|約)w 0g“s(i) w 0gd(aw(z) w 0,i = k.k + 1, ., + at - 1其中x(| k) and yk)為k時(shí)刻預(yù)測(cè)狀態(tài)和輸出的函數(shù),這里,s(幻山將來(lái)的輸入 組成:udk) = u(kuk + 1),,u(k + n - 1)(4)為輸入增量:aw (k) = u(k) uk 1)(5)在方程(2)中,q和r輸入與輸出權(quán)值矩陣,4訊)為非負(fù)終止條件。根據(jù)動(dòng)態(tài)編程的優(yōu)化原則,必須最小化代價(jià)函數(shù)(2),
7、當(dāng)終止條件么心伙+ n*) 為在k+n時(shí)刻時(shí)的無(wú)窮小,得出當(dāng)八'1 x時(shí)的無(wú)窮優(yōu)化控制問(wèn)題的解,同樣就能得到 有窮優(yōu)化問(wèn)題。對(duì)于非線(xiàn)性系統(tǒng),優(yōu)化控制問(wèn)題一般無(wú)閉式解,因此,本文研究強(qiáng)力和不最 理想的方法。在模型預(yù)測(cè)控制(mpc)屮,控制信號(hào)的確定是通過(guò)在每個(gè)采樣時(shí)刻輸入序列為ue 時(shí), 最小化代價(jià)函數(shù)(2)。只有優(yōu)化輸入序列的第一個(gè)元素u (k)作為系統(tǒng)的輸入,在下一個(gè) 采樣吋刻k+1,新的優(yōu)化問(wèn)題是對(duì)于給定的優(yōu)化控制問(wèn)題而言的。在這種方法中,終止條件 么十)可以看作是一個(gè)當(dāng)時(shí)刻k+n趨于無(wú)窮時(shí)最小化代價(jià)函數(shù)的逼近器,但實(shí)際上更多的 是川于保證閉環(huán)的穩(wěn)定性。模型預(yù)測(cè)控制方法有一個(gè)非線(xiàn)性
8、的缺點(diǎn),h需要通過(guò)在每個(gè)采樣 時(shí)刻得到受約束的優(yōu)化問(wèn)題,同時(shí)需耍通過(guò)在線(xiàn)計(jì)算來(lái)實(shí)現(xiàn)。為了減小模型預(yù)測(cè)控制的計(jì)算量,本文提出了一種精確mpc方法,在這種方法中,計(jì)算的 部分是離線(xiàn)進(jìn)行的。對(duì)于非線(xiàn)性系統(tǒng),優(yōu)化的mpc方法應(yīng)該由離線(xiàn)計(jì)算進(jìn)行映射,且川一 個(gè)函數(shù)逼近器表示。更準(zhǔn)確地,控制策略是通過(guò)最小化代價(jià)函數(shù)(2)定義控制信號(hào),或等 于它的增量如 po = g(/1pc 伙)其中/.mpc伙)=.?伙i k)y(k + 1);伙+ 2),j尸伙+ w)作為計(jì)算代價(jià)函 數(shù)(2)中的u從町。對(duì)于任意hlpc(k),最小化代價(jià)慚數(shù)(2)來(lái)評(píng)估方程(6)。從而 通過(guò)離線(xiàn)訓(xùn)練來(lái)獲得函數(shù)逼近器作為優(yōu)化策略,盡管
9、這種方法非常有用,但仍然存在一些限 制。因?yàn)閙pc策略是基于/mpc(信息來(lái)計(jì)算預(yù)測(cè)輸出,這種不能很好的表示階次遞減 或定結(jié)構(gòu)的控制器。另外,計(jì)算述要求產(chǎn)牛訓(xùn)練的數(shù)據(jù)1f常廣泛,這些每個(gè)訓(xùn)練數(shù)據(jù)點(diǎn)都需 要一個(gè)mpc優(yōu)化問(wèn)題的解。3. 神經(jīng)網(wǎng)絡(luò)優(yōu)化控制器在本節(jié)屮,研究了構(gòu)成第2節(jié)所述的控制問(wèn)題的一個(gè)神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)控制器的問(wèn)題。這里 我們采樣一個(gè)訓(xùn)練數(shù)據(jù)集作為直接訓(xùn)練代價(jià)函數(shù)(2)的控制器,而沒(méi)有計(jì)算優(yōu)化mpc控 制信號(hào)的離線(xiàn)優(yōu)化問(wèn)題??刂破鞅硎救缦拢?quot;=gnn (/;w)其中為神經(jīng)網(wǎng)絡(luò)函數(shù)逼近器,i (k)為k時(shí)刻控制器的有效信號(hào),w為逼 近器參數(shù)(即神經(jīng)網(wǎng)絡(luò)權(quán)值)。假設(shè)狀態(tài)信息,如
10、i (k)丿"fc伙),時(shí),控制器(7)可以看作是優(yōu)化mpc策略(6)的 函數(shù)近似。在本文中盡管研究的是這個(gè)方法,但控制器并沒(méi)有完全受到狀態(tài)信息的限制,而 是把i (k)當(dāng)成由許多輸入u (k-i)與輸出y (k-i)的過(guò)去值組成。,并將其作為參考信號(hào) 的設(shè)定值yk+l 這種方法可以構(gòu)成高階系統(tǒng)的較為復(fù)雜的控制器。i (k)值的不同選 取方法將在第四節(jié)通過(guò)例子講述。remark 1為了降低控制器的復(fù)雜性,控制器的結(jié)構(gòu)可以利用映射函數(shù)來(lái)確定,例如,假設(shè)信息i (k)為:/伙)=川")仏伙),j/q, 一個(gè)分布式控制器為:的伙)=gnn”伙);比),/ = i,控制器的結(jié)構(gòu)為:
11、gnn(/ 伙);w)= gjnj (a ;w1 ),陰鬧(/2 伙);他), gw”(ut(8)為了川控制規(guī)則(7),即最小化代價(jià)函數(shù)(2)來(lái)確定控制器的參數(shù)w,需要知道訓(xùn)練數(shù)據(jù): 艸)=x(伙)衛(wèi)的伙一 1)糾伙+ 1),,列)伙+n),m= 1,2,(9)x(叫,+1) =/¥%)"“)(,)au(m)(z) =gnn(z(z);w)/-)(/) = a(x(/), i = kki 用訓(xùn)練數(shù)據(jù)泄義聯(lián)想代價(jià)函數(shù):&+7v 1 .z?vv)= £ 嚴(yán) + 1)一件+1)莎叫+1) i=k l+ 1) + )除血伽)+做(兀(則伙+何)(11)逼近器(7)
12、的訓(xùn)練,最小化優(yōu)化問(wèn)題的平方為:呷工03)m= 1約朿條件為:(12).g3)(r+i)wo乩(“的)w 0g(")(i) w 0. i = k、k+、k+n(13)訓(xùn)練問(wèn)題町以通過(guò)梯度算法來(lái)最小化優(yōu)化問(wèn)題的平方,如lm算法,從方程(11) nj以得到 代價(jià)函數(shù)的梯度為期dvvt(i +16vvtfl (2工0叫+1)-訛+1)勺 i=k + *)除。;)(14)其中:cyw(z + l)前(x(加)(,+ 1) &()(,+ i)&仙)(i + 1 )t亦 t6川加 = 6gnn(/(,);w)6vvt6wt迦nn(/(i);w) sx(叫i)(15)其屮nn(a0
13、;叩)/6川t為神經(jīng)網(wǎng)絡(luò)輸出關(guān)于網(wǎng)絡(luò)參數(shù)的偏導(dǎo)數(shù),它取決于網(wǎng)絡(luò)的結(jié)構(gòu), dx(mi)/dwt可以根據(jù)下式得到:&(叫i)t6屛(6/(x的川)&")(/)0恥)(/)tovvtcw(z)(加)(,一 1) | 6az0)(j)c ta tia t代價(jià)函數(shù)di) jij于訓(xùn)練神經(jīng)網(wǎng)絡(luò)控制器,與模型預(yù)測(cè)控制屮代價(jià)函數(shù)類(lèi)似,本文提出的控 制器可以作為精確的模型預(yù)測(cè)控制器。注意到,對(duì)于一個(gè)給定的控制器的復(fù)雜性,計(jì)算量取 決于優(yōu)化控制器的參數(shù)w,而不是控制器的長(zhǎng)度n。因此可以比模型預(yù)測(cè)控制能更靈活地 川控制器的長(zhǎng)度,從而被優(yōu)化的參數(shù)也能成比例地增加。4. 仿真例子在本節(jié)中,用例
14、子仿真來(lái)說(shuō)明第3節(jié)中所講的神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)控制器,在所有例子中,控 制規(guī)則(7)用一個(gè)前饋神經(jīng)網(wǎng)絡(luò)來(lái)表示,該網(wǎng)絡(luò)含有一層隱含層,用雙曲正切函數(shù)作為激 活函數(shù)。這種網(wǎng)絡(luò)可以以任意耕度逼近所有連續(xù)非線(xiàn)性函數(shù)120 i (k)作為輸入,"(*) 為輸出,訓(xùn)練算法為lm算法21,用來(lái)解決非線(xiàn)性故小二乘問(wèn)題(12),稠 matlab的優(yōu) 化工具箱中的常規(guī)函數(shù)lsqnonlin來(lái)計(jì)算。在所有的例子中,優(yōu)化范圍n為足夠大,這樣對(duì)于閉環(huán)系統(tǒng)就能達(dá)到平衡,因此,用一個(gè) 零終止條件作為代價(jià)函數(shù)(11)。在本例屮,我們仿真一個(gè)ph屮和過(guò)程10,18,17,1,在文獻(xiàn)1屮,應(yīng)川了一個(gè)神經(jīng)網(wǎng)絡(luò)來(lái)逼 近優(yōu)化mp
15、c策略的過(guò)程。這個(gè)過(guò)程可以用非線(xiàn)性微分方程來(lái)表示,該過(guò)程的表達(dá)式如下式 所示17,1:x(k + 1) = f(y(/c)x(/c) + g0(y(k)d(k)+ g()血伙一厶)+ gc(y(k)v(k)(17)y(k) = hx(k) + n(k)式中,輸.'ll y (k)由ph值控制,u(k)為輸入流量,用于控制,系統(tǒng)還有確定性擾動(dòng)d(k)、 相互獨(dú)立的隨機(jī)白躁聲擾動(dòng)v (k)和n (k)(分別用rv和rn表示)。采樣時(shí)間為0.2分鐘, 時(shí)延為l=5,系統(tǒng)矩陣表示為輸出的函數(shù),如下所示。g a) = 0.2pi 0)=pi 0)=-0.591 + 0-3.59)+194心)+(
16、)96pi 0)p10) + 0.96()f0)=p (刃0p2(j;) + 0960p b)()00p?(刃pmp? )1.心)+()96go)=0.2p 0)-15必a)p2o)p2(y) + 0.960pm/ = () 0 0 1狀態(tài)參數(shù)農(nóng)達(dá)式為:0.23j _|_ 04.69y-h24.59p3(» = 一 ()64eg耐/°皿-0.11 必 0) = 1.31e-4 53)2/043 + 0.1 7其中這些系統(tǒng)參數(shù)的函數(shù)農(nóng)達(dá)式在文獻(xiàn)1中已有研究。根據(jù)方程(17),預(yù)測(cè)輸出曲+ 1伙+厶 + n悶根據(jù)下式確定:yk + lk) =hx(k + /| jt): / =
17、 0? l + n(18)其中狀態(tài)參數(shù)根據(jù)kalman濾波原理得到:xkk) = x(kk - 1)+ k(k)y(k) - hxkk 1) x(k + i + k)= f®(k + iky)xk + ik)+ g®伙+伙+ /-厶)kg=p 仗)小(hp(k)ht + 幾)p(k +1)= f(yk | 燈)(/ - k(k)h)p(k)fw(k 約)+ g 風(fēng) g:(19)優(yōu)化控制策略為預(yù)測(cè)狀態(tài)*伙+ l i 的函數(shù),參考軌跡為川'十厶+ /) , #1,. 假設(shè)參考軌跡由參考模型給出:xr(k + 1) = fr心伙)+ gp 伙) yr(k) = h + j
18、rysp(k) 式中3環(huán)伙)為設(shè)定值,為階躍響應(yīng)??刂撇呗詾樵趉+l時(shí)刻時(shí)預(yù)測(cè)系統(tǒng)狀態(tài)* + 4幼, 參考模型的狀態(tài)廠伙+ qq ,設(shè)定值兒p伙+ l)等的函數(shù),控制器(7)的信息i (k) 為:/=©伙+屮),心伙+厶),依+厶)(21)參數(shù)的選取根據(jù)文獻(xiàn)1,代價(jià)函數(shù)(11)中的權(quán)值為:q=l, r=l0白躁聲變量:r" = °丄°°1 ,用于kalman濾波方程(19)中,參考模型(20)為一個(gè)二階系統(tǒng),增益為1, 一對(duì)極點(diǎn),均為0.9由丁非線(xiàn)性系統(tǒng)的動(dòng)態(tài)特性,為了在整個(gè)操作過(guò)程中獲得優(yōu)化控制器的梢確特性,需要大量 的數(shù)據(jù)集。與非線(xiàn)性系統(tǒng)辨
19、識(shí)相比較,仍需要長(zhǎng)的訓(xùn)練集16。訓(xùn)練數(shù)據(jù)(9)用于訓(xùn)練控 制器,包括軌跡跟蹤和擾動(dòng)抑制(將輸出ph的范圍控制在彳*0 7)。因此訓(xùn)練數(shù)據(jù)有兩種類(lèi)型。對(duì)于軌跡跟蹤,訓(xùn)練數(shù)據(jù)由以下構(gòu)成:初始狀態(tài)作為穩(wěn)定狀態(tài)響應(yīng) 対(?)=kk ,設(shè)定值的改變y$)(z) 間伙)± ,1 =k.k + 1,. 八個(gè)相等的初始ph值,14個(gè)設(shè)定值,給 定的14個(gè)參考軌跡。代價(jià)函數(shù)(11)的控制范圍設(shè)定為n=15(),這個(gè)足夠使新的設(shè)定到達(dá) 參考模型(20)所定義的參考軌跡。對(duì)于擾動(dòng)抑制,訓(xùn)練數(shù)據(jù)由以下構(gòu)成:常量設(shè)定值,參 考信號(hào)0(')=於孑,i=k、k+.,.k+n初始狀態(tài)對(duì)穩(wěn)定狀態(tài)的響應(yīng) 沖)仏
20、)=)*伙)± 0。同樣有14個(gè)不同的常量設(shè)定值,用于軌跡跟蹤,且有28 個(gè)初始狀態(tài)。在這種情況下,控制范圍為n=25步,這就使系統(tǒng)能達(dá)到設(shè)定值的一個(gè)初始偏 值。初始狀態(tài)和參考軌跡的總數(shù)為m=42。訓(xùn)練集屮的每個(gè)元素包括了 n個(gè)數(shù)據(jù)點(diǎn),總的數(shù) 據(jù)點(diǎn)數(shù)為2800o根據(jù)一個(gè)獨(dú)立的測(cè)試數(shù)據(jù)集來(lái)選取優(yōu)化網(wǎng)絡(luò)的大小,測(cè)試數(shù)據(jù)有36組2400個(gè)數(shù)據(jù)點(diǎn),均是 均相同的方法產(chǎn)生訓(xùn)練數(shù)據(jù),6個(gè)范圍在'j丟* 65的初始ph值以及6個(gè)范圍在 彳* 門(mén)pw7的設(shè)定值。為了找出一個(gè)最小測(cè)試數(shù)據(jù)集,網(wǎng)絡(luò)的大小不同,訓(xùn)練的結(jié)果如 表1所示。當(dāng)網(wǎng)絡(luò)中含有11個(gè)隱含節(jié)點(diǎn)時(shí),測(cè)試數(shù)據(jù)中的代價(jià)函數(shù)為最小,而當(dāng)增
21、加網(wǎng)絡(luò) 人小時(shí)該值不會(huì)減小,因此,以下仿真屮網(wǎng)絡(luò)的結(jié)構(gòu)為11。table 1iraining results in example 1 for networks with various numbers of hidden nodes (?h)"hcosttrainingtestnn414.033.21nn10813.732.94nn11893.712.93nn12973.712.93mpc3.702.91the total number of weights (nw) is also given. results obtained with the mpc strategy are
22、 included for comparison.這個(gè)結(jié)果與1屮一致,即當(dāng)川于逼近mpc策略時(shí)網(wǎng)絡(luò)的人小也為11。同時(shí),表1也表明了 用一個(gè)非線(xiàn)性mpc的結(jié)果。mpc策略的預(yù)測(cè)和控制范圍為n=20步。為了避免局部收斂特性,需要川不同初始點(diǎn)來(lái)優(yōu)化網(wǎng)絡(luò)的權(quán)值。在本例中沒(méi)有遇到局部最優(yōu) 化值的問(wèn)題。一般來(lái)說(shuō),網(wǎng)絡(luò)權(quán)值在第400-500代時(shí)就已收斂。所需要的代數(shù)與優(yōu)化mpc 策略中神經(jīng)網(wǎng)絡(luò)的代數(shù)相同1,且用相同的數(shù)據(jù)點(diǎn)。然而,當(dāng)對(duì)每一代的軌跡(10)和聯(lián) 想代價(jià)(11)進(jìn)行評(píng)估吋,用于訓(xùn)練的計(jì)算量將比直接逼近要重。從另一個(gè)方而說(shuō),直接逼 近方法在每個(gè)數(shù)據(jù)進(jìn)行優(yōu)化mpc控制時(shí)所需要的計(jì)算量,大體上比以前
23、要重。應(yīng)用神經(jīng)網(wǎng)絡(luò)控制器和優(yōu)化mpc策略得到的閉環(huán)響應(yīng)如果圖1所示,圖2表明了當(dāng)有一個(gè) 可測(cè)量的白躁聲凡=°°°1時(shí)的響應(yīng)。注意到圖1和圖2的設(shè)定值是在每個(gè)訓(xùn)練數(shù)據(jù)處 都是不同的,為了測(cè)試神經(jīng)網(wǎng)絡(luò)控制器的性能,在達(dá)到一個(gè)新的穩(wěn)定之前改變?cè)O(shè)定值,響應(yīng) 如圖3所示,表明了神經(jīng)網(wǎng)絡(luò)控制器的性能很好。圖4為階躍擾動(dòng)d (k)在不同穩(wěn)定值ph處的響應(yīng),階躍變化在時(shí)刻k=75處從10到11變 化然后又在時(shí)刻k=325變冋10o在仿真中可測(cè)躁聲的表示一樣。注意到擾動(dòng)d (k)對(duì)于控 制器是未知的,神經(jīng)網(wǎng)絡(luò)控制器不能用階躍擾動(dòng)來(lái)訓(xùn)練。穩(wěn)定狀態(tài)偏移量的限制根據(jù)條件 “伙)=伙);“
24、')=°來(lái)確定。仿真結(jié)果表明神經(jīng)網(wǎng)絡(luò)控制器對(duì)丁不同類(lèi)型的擾動(dòng)都能達(dá)到一個(gè)近似優(yōu)化控制的性能。同時(shí) 注意到神經(jīng)網(wǎng)絡(luò)控制器在每段采樣數(shù)據(jù)中僅僅需要238步,這比模型預(yù)測(cè)控制的平均操作步 驟要少0.1%,這個(gè)結(jié)構(gòu)與文獻(xiàn)中一致。fig. 1. responses obtained in example 1 with the neural network controller (solid lines) cind model predictive control (clashed lines) for setpoint changes.100o6(j40200206080fig. 2.
25、 responses obtained in example 1 with the neural network controller (solid lines) and model predictive control (dcished lines) for setpoint changes when there is measurement noise.02040oo100020406080100120140160180200fg- 3. responses obtained in example 1 with the neural network controller (solid li
26、nes) and model predictive control (dashed lines) for a sequence of setpoint changes. the totcil cost obtained when using the neural network controller is 2.60 and l60 when using the optimal mpc strategy.6 5 4 3050100150200250300350400450500kfig. 4. responses obtained in example 1 with the neuml netw
27、ork controller (solid lines) and model predictive control (dashed lines) for step disturbances when there is measurement noise. the total cost is 22.6 when using the neural network controller and 2l8 when using the optimal 卜 1 pc strcitegy.dca _ idt = 7 dcbdrdi)dtpcp廠他一 *) +“ r_ ( c?k (“ 一 k)例2在這個(gè)例子
28、中,同時(shí)對(duì)集屮型和分散型神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)控制器進(jìn)行了仿真,仿真的對(duì)象為 一個(gè)多層非等溫連續(xù)水箱反應(yīng)器8。過(guò)程包括反應(yīng)物a,期與的產(chǎn)物b,同樣還有產(chǎn)物c 和d。反應(yīng)器的模型川四個(gè)微分方程表示:一(ca0 ca) ei()ca 斤3()樂(lè)rv+ei()ca 2(v)cb(a:i(1?)caa/ab 比2(血“刃應(yīng) + 居(比;山仏d)(22)其屮°a “nd 分別為a和b的濃度,"為反應(yīng)器的溫度,"k為冷卻劑的溫度。原料a的濃度為gao,原料流的溫度為 0。反應(yīng)器的體積為"r,/為原料的流速,°k為吸收的熱量的速度。反應(yīng)系數(shù)'山“ aild
29、仏根據(jù)arrhenius方程確定: 用)7心( + 2倉(cāng)5 j 123(23;模型參數(shù)的數(shù)值如表2所示。table 2ftirameters of the van de v'usse reactorkqx = 1.287x 1012 h_lahrm = 4.2 kj/niol*o2=l287xl0l2h-1ahr叱=1 l0 kj/mol嗆3 = 9.043x 1()9 "(molh)r w = 41.85 kj/mol£a1 = 一975 &3 kp =0.9342 kg/1£a2= -9758.3 kcp=3.01 kj/(kg k)£
30、;a3= -8560 ktw=4032kj/(hnr k )jr =0.215 m28 = 0.01 n?mk = 5-0 kg= 2.0 kj/(kg k)控制的目標(biāo)是操作原料的流速f和吸熱的速度°k來(lái)控制濃度cb和反應(yīng)器溫度d。濃度 他和反應(yīng)器溫度*可以通過(guò)檢測(cè)得到,原料的濃度°a°和原料溫度 譏 作為擾動(dòng),分別 為5.imoi/i, i30°co原料流速卩的范圍為°"m/h w v w 0.35 n?/h,吸熱的速 度 0k 的范圍為一9000 kj/h w 0k w o kj/h。川一個(gè)歐拉近似值形式的離散系統(tǒng)表示法來(lái)對(duì)模型(
31、22)進(jìn)行離散化,采樣時(shí)間為20s???制器的輸出為力=cb mol/1 , y2 =6 °c,輸入為= v m3/h, u2 = qk kj/h將分散型和集中型的神經(jīng)網(wǎng)絡(luò)控制器應(yīng)用在反應(yīng)器系統(tǒng)中,訓(xùn)練的數(shù)據(jù)川例1中的方式模擬 產(chǎn)牛,輸出利設(shè)定值的范圍為:0.8 mol/1 w 館 w 1.0 mol/1,(25 °c w * g 135 °c對(duì)于軌跡跟蹤,初始狀態(tài)作為穩(wěn)定狀態(tài)與輸出旳,坷伙)和設(shè)定值境小瑤心的響 應(yīng),四個(gè)相等的空間值作為被選取的每個(gè)輸出的范圍。對(duì)于每個(gè)初始穩(wěn)定狀態(tài),選取8個(gè)設(shè) 定值:必小環(huán)2) = m土 0,方伙)土 5),甜,堪土 5),m伙)
32、±0.1,剔除落在范圍外的數(shù)據(jù),這樣就有84個(gè)初始狀態(tài)。預(yù)測(cè)范闈的長(zhǎng)度設(shè)為n二60步。對(duì)于擾動(dòng) 抑制,訓(xùn)練數(shù)據(jù)由如下構(gòu)成:參考信號(hào)必=.瑞1用=)恥'=以+ 1,初始狀態(tài)對(duì)穩(wěn)定狀 態(tài)=臨1 士 °°2,=_環(huán)2 士 1的響應(yīng)。用四個(gè)相等的空間值作為設(shè)定值,這樣可以得到64個(gè)初始狀態(tài)。預(yù)測(cè)范圍的長(zhǎng)度為n二25。因此訓(xùn)練集中初始狀態(tài)的 總數(shù)為肛148,訓(xùn)練數(shù)據(jù)點(diǎn)總數(shù)為6640o測(cè)試數(shù)據(jù)集包括四個(gè)設(shè)定的在0. 85與0. 95 z間變 化,力=128, 133 °c (如圖5-7所示),網(wǎng)絡(luò)的大小與例子一樣。fig. 5 responses obtai
33、ned in example 2 to four setpoint changes when using controller (dashed lines) designed for the weights in eq. (25).£ 010 20 0 10 20 0 10 20 0 10 20-sw) 110 20 010 20a neural network controller (solid lines) and an optimal model predktivefig. 6 responses obtained in example 2 to (bur setpoint c
34、hanges used as test data when using a centralized neural network controller (solid lines) and an optimal model predictive controller (dashed lines) designed for the weights in eq. (26).2 0.9j 0.810 20fig. 7. responses obtained m example 2 to four setpoint changes used as test data when using a decen
35、tralized neural network controller (solid lines i and an optimal model predictive controller (dashed lines).神經(jīng)網(wǎng)絡(luò)控制器作為過(guò)去輸出y(k-i),輸入增量- /),參考模型(20)的狀態(tài)兒伙), 當(dāng)前設(shè)定值的函數(shù)。被辨識(shí)參考模型的輸出作為一階系統(tǒng),ii有駐位增益和一個(gè)位于0.8的 極點(diǎn)。在集屮控制器屮,控制器方程如下所示:l(k) = y(k. ,y (k 一® + 1),- i),.,一 亦),心伙)識(shí)p伙)(24)式中® = 3 and如=3這樣® a
36、nd幾的變化就不會(huì)很明顯。以多變量系統(tǒng)為例,神經(jīng)網(wǎng)絡(luò)控制器的訓(xùn)練比例1中siso系統(tǒng)的耍復(fù)雜,實(shí)際上,神經(jīng)網(wǎng) 絡(luò)權(quán)值的優(yōu)化可能會(huì)陷入局部最優(yōu)值。為了避免這點(diǎn),在優(yōu)化的開(kāi)始時(shí)用隨機(jī)初始值。在多變量系統(tǒng)中,權(quán)值幅值的選擇對(duì)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練有著明顯的影響,基于相同權(quán)值的優(yōu)化 模型預(yù)測(cè)控制器對(duì)于所有輸出都能獲得好的控制性能,對(duì)于輸入也是如此。對(duì)于一個(gè)神經(jīng)網(wǎng) 絡(luò)控制器的代價(jià)函數(shù)的權(quán)值集都可以通過(guò)第3節(jié)屮的方法得到好的訓(xùn)練,如圖5所示,顯示 了一個(gè)川優(yōu)化mpc策略得到的閉環(huán)響應(yīng),最優(yōu)神經(jīng)網(wǎng)絡(luò)逼近器屮的代價(jià)函數(shù)的權(quán)值矩陣如 下式如示:40()00 10rio ()r= 0 1 ()"(25)從上式可以看出第一個(gè)輸出“b對(duì)代價(jià)函數(shù)的貢獻(xiàn)比第二個(gè)輸出"要小,通常主要控制第二 個(gè)輸出,而第一個(gè)輸出
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 勾股定理教案
- 2024-2025學(xué)年云南省大理賓川縣高平第一完全中學(xué)高三上學(xué)期期中化學(xué)試題及答案
- 金融行業(yè)平臺(tái)價(jià)值
- 上海市縣(2024年-2025年小學(xué)五年級(jí)語(yǔ)文)統(tǒng)編版專(zhuān)題練習(xí)((上下)學(xué)期)試卷及答案
- 浙江省臺(tái)州市臺(tái)州十校聯(lián)考2024-2025學(xué)年高一上學(xué)期11月期中物理試題含答案
- 人教版九年級(jí)歷史上冊(cè)全套教案
- 基層醫(yī)療衛(wèi)生機(jī)構(gòu)公益目標(biāo)評(píng)估指標(biāo)調(diào)查表
- 第五單元《厘米和米》-2024-2025學(xué)年二年級(jí)數(shù)學(xué)上冊(cè)單元測(cè)試卷(蘇教版)
- 職業(yè)學(xué)院大數(shù)據(jù)技術(shù)與應(yīng)用專(zhuān)業(yè)人才培養(yǎng)方案
- 人教版英語(yǔ)八年級(jí)下冊(cè) Unit 8 Section B 隨堂練習(xí)
- 太空碎片對(duì)衛(wèi)星芯片的沖擊影響
- DZ∕T 0011-2015 地球化學(xué)普查規(guī)范(1:50000)(正式版)
- 2023年河南省對(duì)口升學(xué)種植類(lèi)基礎(chǔ)課試卷
- 學(xué)生體育學(xué)情分析報(bào)告
- 《時(shí)間的合理利用》班會(huì)課件
- 2023-2024學(xué)年山東省泰安市新泰市八年級(jí)(上)期中數(shù)學(xué)試卷(五四學(xué)制)
- 2024年?duì)I養(yǎng)指導(dǎo)員理論知識(shí)考試題庫(kù)及答案
- 試驗(yàn)驗(yàn)證方案設(shè)計(jì)
- (2024年)互聯(lián)網(wǎng)加比賽
- 公共政策導(dǎo)論全套教學(xué)課件
- 《1+X幼兒照護(hù)(中級(jí))》課件-6.1.身高的測(cè)量與評(píng)估
評(píng)論
0/150
提交評(píng)論