




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、 第第9章章 迭代學習控制迭代學習控制 實際控制中存在一類軌跡跟蹤問題,它的控制任務(wù)是尋找控制律 ,使得被控對象輸出 在有限時間 上沿著整個期望軌跡實現(xiàn)零誤差軌跡跟蹤。這列跟蹤問題是具有挑戰(zhàn)性的控制問題。 人們在處理實際場合中的重復操作任務(wù)時,往往依據(jù)對象的可重復動態(tài)行為與期望行為的差距來調(diào)整決策。通過重復操作,使得對象行為與期望行為的配合達到要求。這時,衡量動態(tài)行為的指標是某種滿意指標。 u t y t0,T 迭代學習控制(迭代學習控制(ILC,Iterative Learning Control)的思想最初由)的思想最初由日本學者日本學者Uchiyama于于1978年提出,于年提出,于19
2、84年由年由Arimoto等人做出了等人做出了開創(chuàng)性的研究。這些學者借鑒人們在重復過程中追求滿意指標達到期開創(chuàng)性的研究。這些學者借鑒人們在重復過程中追求滿意指標達到期望行為的簡單原理,成功地使得具有強耦合非線性多變量的工業(yè)機器望行為的簡單原理,成功地使得具有強耦合非線性多變量的工業(yè)機器人快速高精度地執(zhí)行軌跡跟蹤任務(wù)。其基本做法是對于一個在有限時人快速高精度地執(zhí)行軌跡跟蹤任務(wù)。其基本做法是對于一個在有限時間區(qū)間上執(zhí)行軌跡跟蹤任務(wù)的機器人,利用前一次或前幾次操作時測間區(qū)間上執(zhí)行軌跡跟蹤任務(wù)的機器人,利用前一次或前幾次操作時測得的誤差信息修正控制輸入,使得該重復任務(wù)在下一次操作過程中做得的誤差信息修
3、正控制輸入,使得該重復任務(wù)在下一次操作過程中做得更好。如此不斷重復,直至在整個時間區(qū)間上輸出軌跡跟蹤上期望得更好。如此不斷重復,直至在整個時間區(qū)間上輸出軌跡跟蹤上期望軌跡。軌跡。 迭代學習控制適合于具有重復運動性質(zhì)的被控對象,通過迭代修迭代學習控制適合于具有重復運動性質(zhì)的被控對象,通過迭代修正達到某種控制目標的改善。迭代學習控制方法不依賴于系統(tǒng)的精確正達到某種控制目標的改善。迭代學習控制方法不依賴于系統(tǒng)的精確數(shù)學模型,能在給定的時間范圍內(nèi)數(shù)學模型,能在給定的時間范圍內(nèi),以非常簡單的算法實現(xiàn)不確定性以非常簡單的算法實現(xiàn)不確定性高的非線性強耦合動態(tài)系統(tǒng)的控制,并高精度跟蹤給定期望軌跡,因高的非線性
4、強耦合動態(tài)系統(tǒng)的控制,并高精度跟蹤給定期望軌跡,因而一經(jīng)推出,就在運動控制領(lǐng)域得到了廣泛的運用。而一經(jīng)推出,就在運動控制領(lǐng)域得到了廣泛的運用。 迭代學習控制方法具有很強的工程背景,這些背景包括:執(zhí)行諸迭代學習控制方法具有很強的工程背景,這些背景包括:執(zhí)行諸如焊接、噴涂、裝配、搬運等重復任務(wù)的工業(yè)機器人;指令信號為周如焊接、噴涂、裝配、搬運等重復任務(wù)的工業(yè)機器人;指令信號為周期函數(shù)的伺服系統(tǒng);數(shù)控機床;磁盤光盤驅(qū)動系統(tǒng);機械制造中使用期函數(shù)的伺服系統(tǒng);數(shù)控機床;磁盤光盤驅(qū)動系統(tǒng);機械制造中使用的坐標測量機等。的坐標測量機等。 由于迭代學習控制模擬了人腦學習和自我調(diào)節(jié)的功能,因而是一種典型的智能控
5、制方法。經(jīng)歷了三十多年的發(fā)展,迭代學習控制已成為智能控制中具有嚴格數(shù)學描述的一個分支。目前,迭代學習控制在學習算法、收斂性、魯棒性、學習速度及工程應用研究上取得了很大的進展。 9.1 基本原理基本原理 設(shè)被控對象的動態(tài)過程為 , (9.1)( )( ( ), ( ), )tftt txxu( )( ( ), ( ), )tgtt tyxu 式中, 、 、 分別為系統(tǒng)的狀態(tài),輸出和輸入變量, 、 、 為適當維數(shù)的向量函數(shù),其結(jié)構(gòu)與參數(shù)均未知。若期望控制 存在,則迭代學習控制的目標為:給定期望輸出 和每次運行的初始狀態(tài) ,要求在給定的時間 內(nèi),按照一定的學習控制算法通過多次重復的運行,使控制輸入
6、,而系統(tǒng)輸出 第k 次運行時,式(9.1) 表示為: (9.2) 跟蹤誤差為 (9.3) nxRmyRruR( )f( )gd( ) tud( ) ty(0)kx0,tTd( )( )kttuud( )( )kttyy( )( ),( ), )kkktftt txxu( )( ),( ), )kkktgtt tyxud( )( )( )kkttteyy 迭代學習控制可分為開環(huán)學習和閉環(huán)學習。 開環(huán)學習控制的方法是:第k+1次的控制等于第k次控制再加上第k次輸出誤差的校正項,即 (9.4) 閉環(huán)學習策略是:取第K+1次運行的誤差作為學習的修正項,即 (9.5) 式中,L為線性或非線性算子。1(
7、)L( ),( )kkktttuue11( )L( ),( )kkktttuue 9.2 基本迭代學習控制算法基本迭代學習控制算法 Arimoto 等首先給出了線性時變連續(xù)系統(tǒng)的等首先給出了線性時變連續(xù)系統(tǒng)的D型迭代學習控制律型迭代學習控制律 (9.6) 式中,式中, 為常數(shù)增益矩陣。在為常數(shù)增益矩陣。在D 型算法的基礎(chǔ)上,相繼出現(xiàn)了型算法的基礎(chǔ)上,相繼出現(xiàn)了P 型、型、PI 型、型、PD 型迭代學習控制律。從一般意義來看它們都是型迭代學習控制律。從一般意義來看它們都是PID型迭代型迭代學習控制律的特殊形式,學習控制律的特殊形式,PID迭代學習控制律表示為迭代學習控制律表示為 (9.7) 式中
8、式中, 、 、 為學習增益矩陣。算法中的誤差信息使用稱為開環(huán)迭為學習增益矩陣。算法中的誤差信息使用稱為開環(huán)迭代學習控制,如果使用代學習控制,如果使用 則稱為閉環(huán)迭代學習控制,如果同時使用和則稱為閉環(huán)迭代學習控制,如果同時使用和則稱為開閉環(huán)迭代學習控制。則稱為開閉環(huán)迭代學習控制。1( )( )( )kkktttuue 1d( )( )( )( )( )tkkkkktttt0uueee 此外,還有高階迭代學習控制算法、最優(yōu)迭代學習控制算法、遺忘因子迭此外,還有高階迭代學習控制算法、最優(yōu)迭代學習控制算法、遺忘因子迭代學習控制算法和反饋代學習控制算法和反饋-前饋迭代學習控制算法等。前饋迭代學習控制算法
9、等。 9.3 迭代學習控制的關(guān)鍵技術(shù)迭代學習控制的關(guān)鍵技術(shù) 9.3.1 學習算法的穩(wěn)定性和收斂性學習算法的穩(wěn)定性和收斂性 穩(wěn)定性與收斂性問題是研究當學習律與被控系統(tǒng)滿足什么條件時,迭代穩(wěn)定性與收斂性問題是研究當學習律與被控系統(tǒng)滿足什么條件時,迭代學習控制過程才是穩(wěn)定收斂的。算法的穩(wěn)定性保證了隨著學習次數(shù)的增加,學習控制過程才是穩(wěn)定收斂的。算法的穩(wěn)定性保證了隨著學習次數(shù)的增加,控制系統(tǒng)不發(fā)散,但是,對于學習控制系統(tǒng)而言,僅僅穩(wěn)定是沒有實際意義控制系統(tǒng)不發(fā)散,但是,對于學習控制系統(tǒng)而言,僅僅穩(wěn)定是沒有實際意義的,只有使學習過程收斂到真值,才能保證得到的控制為某種意義下最優(yōu)的的,只有使學習過程收斂到
10、真值,才能保證得到的控制為某種意義下最優(yōu)的控制。收斂是對學習控制的最基本的要求,多數(shù)學者在提出新的學習律的同控制。收斂是對學習控制的最基本的要求,多數(shù)學者在提出新的學習律的同時,基于被控對象的一些假設(shè),給出了收斂的條件。例如,時,基于被控對象的一些假設(shè),給出了收斂的條件。例如,Arimoto在最初在最初提出提出PID型學習控制律時,僅針對線性系統(tǒng)在型學習控制律時,僅針對線性系統(tǒng)在D型學習律下的穩(wěn)定性和收斂條型學習律下的穩(wěn)定性和收斂條件作了證明件作了證明 9.3.2 初始值問題初始值問題 運用迭代學習控制技術(shù)設(shè)計控制器時,只需要通過重復操作獲得的受控運用迭代學習控制技術(shù)設(shè)計控制器時,只需要通過重
11、復操作獲得的受控對象的誤差或誤差導數(shù)信號。在這種控制技術(shù)中,迭代學習總要從某初始點對象的誤差或誤差導數(shù)信號。在這種控制技術(shù)中,迭代學習總要從某初始點開始,初始點指初始狀態(tài)或初始輸出。幾乎所有的收斂性證明都要求初始條開始,初始點指初始狀態(tài)或初始輸出。幾乎所有的收斂性證明都要求初始條件是相同的,解決迭代學習控制理論中的初始條件問題一直是人們追求的目件是相同的,解決迭代學習控制理論中的初始條件問題一直是人們追求的目標之一。目前已提出的迭代學習控制算法大多數(shù)要求被控系統(tǒng)每次運行時的標之一。目前已提出的迭代學習控制算法大多數(shù)要求被控系統(tǒng)每次運行時的初始狀態(tài)在期望軌跡對應的初始狀態(tài)上,即滿足初始條件:初始
12、狀態(tài)在期望軌跡對應的初始狀態(tài)上,即滿足初始條件: (9.8) 當系統(tǒng)的初始狀態(tài)不在期望軌跡上,而在期望軌跡的某一很小的鄰域內(nèi)當系統(tǒng)的初始狀態(tài)不在期望軌跡上,而在期望軌跡的某一很小的鄰域內(nèi)時,通常把這類問題歸結(jié)為學習控制的魯棒性問題研究。時,通常把這類問題歸結(jié)為學習控制的魯棒性問題研究。d(0)(0),0,1,2,kxxk 9.3.3 學習速度問題學習速度問題 在迭代學習算法研究中,其收斂條件基本上都是在學習次數(shù)在迭代學習算法研究中,其收斂條件基本上都是在學習次數(shù) 下給出的。而在實際應用場合,學習次數(shù)下給出的。而在實際應用場合,學習次數(shù) 顯然是沒有任何實際顯然是沒有任何實際意義的。因此,如何使迭
13、代學習過程更快地收斂于期望值是迭代學習意義的。因此,如何使迭代學習過程更快地收斂于期望值是迭代學習控制研究中的另一個重要問題??刂蒲芯恐械牧硪粋€重要問題。 迭代學習控制本質(zhì)上是一種前饋控制技術(shù),大部分學習律盡管證迭代學習控制本質(zhì)上是一種前饋控制技術(shù),大部分學習律盡管證明了學習收斂的充分條件,但收斂速度還是很慢。可利用多次學習過明了學習收斂的充分條件,但收斂速度還是很慢??衫枚啻螌W習過程中得到的知識來改進后續(xù)學習過程的速度,例如,采用高階迭代控程中得到的知識來改進后續(xù)學習過程的速度,例如,采用高階迭代控制算法、帶遺忘因子的學習律、利用當前項或反饋配置等方法來構(gòu)造制算法、帶遺忘因子的學習律、利用
14、當前項或反饋配置等方法來構(gòu)造學習律,可使收斂速度大大加快。學習律,可使收斂速度大大加快。k k 9.3.4 魯棒性問題魯棒性問題 迭代學習控制理論的提出有濃厚的工程背景,因此僅僅在無干擾迭代學習控制理論的提出有濃厚的工程背景,因此僅僅在無干擾條件下討論收斂性問題是不夠的,還應討論存在各種干擾的情形下系條件下討論收斂性問題是不夠的,還應討論存在各種干擾的情形下系統(tǒng)的跟蹤性能。一個實際運行的迭代學習控制系統(tǒng)除了存在初始偏移統(tǒng)的跟蹤性能。一個實際運行的迭代學習控制系統(tǒng)除了存在初始偏移外,還或多或少存在狀態(tài)擾動、測量噪聲、輸入擾動等各種干擾。魯外,還或多或少存在狀態(tài)擾動、測量噪聲、輸入擾動等各種干擾。
15、魯棒性問題討論存在各種干擾時迭代學習控制系統(tǒng)的跟蹤性能。具體地棒性問題討論存在各種干擾時迭代學習控制系統(tǒng)的跟蹤性能。具體地說,一個迭代學習控制系統(tǒng)是魯棒的,是指系統(tǒng)在各種有界干擾的影說,一個迭代學習控制系統(tǒng)是魯棒的,是指系統(tǒng)在各種有界干擾的影響下,其迭代軌跡能收斂到期望軌跡的鄰域內(nèi),而當這些干擾消除時響下,其迭代軌跡能收斂到期望軌跡的鄰域內(nèi),而當這些干擾消除時,迭代軌跡會收斂到期望軌跡。,迭代軌跡會收斂到期望軌跡。 9.4 機械手軌跡跟蹤迭代學習控制仿真實例機械手軌跡跟蹤迭代學習控制仿真實例 9.4.1控制器設(shè)計控制器設(shè)計 考慮一個關(guān)節(jié)的機器人,其動態(tài)性能可以由以下二階非線性微分方考慮一個關(guān)節(jié)
16、的機器人,其動態(tài)性能可以由以下二階非線性微分方程描述:程描述: (9.9) 式中:式中: 為關(guān)節(jié)角位移量,為關(guān)節(jié)角位移量, 為機器人的慣性矩陣,為機器人的慣性矩陣, 表示離心力和哥氏力,表示離心力和哥氏力, 為重力項,為重力項, 為控制力矩,為控制力矩, 為各為各種誤差和擾動。種誤差和擾動。 設(shè)系統(tǒng)所要跟蹤的期望軌跡為設(shè)系統(tǒng)所要跟蹤的期望軌跡為 , 。系統(tǒng)第次輸出為。系統(tǒng)第次輸出為 令令 。 d, D q qC q q qG qnqR n nD qR,nC q qR nG qRnRdnR dty0,tT ity diittteyy 在學習開始時,系統(tǒng)的初始狀態(tài)為 。學習控制的任務(wù)為通過學習控制
17、律設(shè)計 ,使第 次運動誤差 減少。 采用三種基于反饋的迭代學習控制律: (1)閉環(huán)D型 (9.10) (2)閉環(huán)PD型: (9.11) (3)指數(shù)變增益D型: (9.12) 00 x 1uit1i 1eit 1dd1kkkttttuuKqq 1pd1dd1kkkkttttttuuKqqKqq 1pd1dd1kkkkttttttuuKqqKqq 9.4.2 仿真實例仿真實例 針對二關(guān)節(jié)機械手,介紹一種機器人針對二關(guān)節(jié)機械手,介紹一種機器人PD型反饋迭代學習控制的仿型反饋迭代學習控制的仿真設(shè)計方法。針對二關(guān)節(jié)機器人控制系統(tǒng)式(真設(shè)計方法。針對二關(guān)節(jié)機器人控制系統(tǒng)式(9.9),各項表示為:),各項表
18、示為: 2 2ijdD2221111212122122coscccdd ldlll lqII21221221222cosccdddll lql222222cdd lI2 2ijcC112chq1212chqhq211chq 220c2 122sinchm l lq T12GGG 干擾項為 機器人系統(tǒng)參數(shù)為 , , , 采用三種閉環(huán)迭代學習控制律,其中 為D型迭代學習控制, 為PD型迭代學習控制, 為變增益指數(shù)D型迭代學習控制。 兩個關(guān)節(jié)的位置指令分別為 和 ,為了保證被控對象初始輸出與指令初值一致,取被控對象的初始狀態(tài)為 。取PD型迭代學習控制,即 ,仿真結(jié)果如圖9-1至圖9-3所示。1112
19、 112212gcosgcosccGd ld lqd lqq22212gcoscGd lqqTd0.3sin0.1 1 ett121 kgdd120.5mll120.25mccll2120.1 kg mII29.81 m/sg 1M 2M 3M sin(3 ) tcos(3 ) t T00310 x3M 圖圖9 9-1 20 20次迭代學習的跟蹤過程次迭代學習的跟蹤過程圖圖9-2 第第20次迭代學習的位置跟蹤次迭代學習的位置跟蹤圖圖9 9-3 20 20次迭代過程中誤差范數(shù)的收斂過程次迭代過程中誤差范數(shù)的收斂過程 9.5 線性時變連續(xù)系統(tǒng)迭代學習控制線性時變連續(xù)系統(tǒng)迭代學習控制 9.5.1 系
20、統(tǒng)描述系統(tǒng)描述 Arimoto等給出了線性時變連續(xù)系統(tǒng)等給出了線性時變連續(xù)系統(tǒng) (9.13) 的開環(huán)的開環(huán)PID型迭代學習控制律:型迭代學習控制律: (9.14) 其中其中 , , 為學習增益矩陣。為學習增益矩陣。 ttttttttxAxBuyCx 1dddkkktttttuuLeL 9.5.2 控制器設(shè)計及收斂性分析控制器設(shè)計及收斂性分析定理定理1 若由式(若由式(9.13)和式()和式(9.14)式描述的系統(tǒng)滿足如下條件:)式描述的系統(tǒng)滿足如下條件:(1) ; (2)每次迭代初始條件一致,即)每次迭代初始條件一致,即 則當則當 時,有時,有 , 。證明:證明: 由式(由式(9.13)及條件
21、式()及條件式(2)得)得則則 ,即系統(tǒng)滿足初始條件。,即系統(tǒng)滿足初始條件。 1tttICB 00d01,2,3,00 xxyykkk dyyktt0,tT 110000yCxCxykkkk 000,1,2,kke 非齊次一階線性微分方程 的解為: 取 ,則 由于 , ,則 tttttxAxBu 000000expdexpdexpd dexpexpexpdexpexpdtttttttttt xCAABuACAABuACAABu,expttA 110,dtkkkktttxxBuu deyykkttt 1d1eyykkttt 11110,deeyyCxxCBuukkkkkktkkttttttttt
22、 即 將PID型控制律式(9.14)代入上式,則第k+1次輸出的誤差為: (9.15) 利用分部積分公式,令 ,有 (9.16) 將式(9.16)代入式(9.15),得 (9.17) 110,deeCBuutkkkktttt 100,ddeeCBeLeetkkkkktttt ,GCBtt 0000d,d,dtttkkktkktttttCBeGeGeCBeGe 1000 0,d,d,d deI CBeGeCBLeCBetkkkttkktttttttttt 將式(9.17)兩端取范數(shù),有 (9.18) 式中 根據(jù) 范數(shù)的定義可知,函數(shù) 的范數(shù)為 。將式(9.18)兩端同乘以 , ,并考慮到有 10
23、00 01200 0,d,d,d ddd deI CBeGeCBLeCBeI CBeeetkkkttkkttkkkttttttttttttttbb 1,0,0,maxsup, sup,tTtTbtttGCBL 2,0,sup,CBtTbtt: 0,nfTR 0supett Tff t expt00exp1expdtt (9.19) 根據(jù) 范數(shù)的定義,函數(shù) 的范數(shù)為:由于 , , ,則有 。 將式(9.19)的結(jié)果應用于下式,得: 1110001111expdexpexpexpdexpexpd1 expexp1expexpexp11 exptttkkkkkkktbtbbtttbbtttbTbee
24、eeeee: 0,nfTR 0suptt Tff te 0,tT 0,t 0, kkee其中 。即 (9.20) 22000020202022expd dexpexpexpd d1 expexpexpd1 expexpexpd1 expexpexpd1 expexp1exp1 exp1 exttkktktktkkktbtbTtbTbtTbtTtbtTb eeeeeee 22p1 expktTbe1 exp1 exp0tT 222001expexpd dtkkTtbb ee 則(9.19)和(9.20)代入(9.18),得 (9.21) 其中 。由于 ,則當 取足夠大時,可以 使 。 因此 。定
25、理得證。 如果將控制律式(9.14)中的 改為 ,則為閉環(huán)PID型迭代學習控制律。同定理1的證明過程,可證明閉環(huán)PID迭代學習控制律。1eekk 2121 exp1 expTTbb11lim0ekk e k1e k 9.5.3 仿真實例仿真實例 考慮考慮2輸入輸入2輸出線性系統(tǒng):輸出線性系統(tǒng): 期望跟蹤軌跡為期望跟蹤軌跡為 11122223111101x tx tu txtxtut 11222001y tx tytxt 1d2dsin(3 )cos(3 )ytttyt0,1t 由于 ,取 ,可滿足定理1中的條件(1),在控制律式(9.14)中取 , ,系統(tǒng)的初始狀態(tài)為 。 在chap9_2si
26、m.mdl程序中,選擇Simulink的Manual Switch開關(guān),將開關(guān)向下,取PD型開環(huán)迭代學習控制律,仿真結(jié)果見圖9-4至9-6所示。將開關(guān)向上,采用PD型閉環(huán)迭代學習控制律,仿真結(jié)果見圖9-7至9-9所示??梢姡]環(huán)收斂速度好于開環(huán)收斂速度。2201CB0.95000.952.0002.0L0 1 02 00010 xx 圖圖9-4 30次迭代學習的跟蹤過程次迭代學習的跟蹤過程(開環(huán)(開環(huán)PD控制)控制)圖圖9-5 第第30次迭代學習的位置跟次迭代學習的位置跟蹤(開環(huán)蹤(開環(huán)PD控制控制)圖圖9-6 30次迭代過程中誤差最大絕對次迭代過程中誤差最大絕對值的收斂過程(開環(huán)值的收斂過程
27、(開環(huán)PD控制)控制)圖圖9-7 30次迭代學習的跟蹤過程次迭代學習的跟蹤過程(閉環(huán)(閉環(huán)PD控制)控制)圖圖9-8 第第30次迭代學習的位置跟次迭代學習的位置跟蹤(閉環(huán)蹤(閉環(huán)PD控制)控制)圖圖9-9 30次迭代過程中誤差最大絕對值次迭代過程中誤差最大絕對值的收斂過程(閉環(huán)的收斂過程(閉環(huán)PD控制)控制) 9.6 移動機器人軌跡跟蹤迭代學習控制移動機器人軌跡跟蹤迭代學習控制 移動機器人是一種在復雜的環(huán)境下工作的具有自規(guī)劃、自組織、自移動機器人是一種在復雜的環(huán)境下工作的具有自規(guī)劃、自組織、自適應能力的機器人。在移動機器人的相關(guān)技術(shù)研究中,控制技術(shù)是其適應能力的機器人。在移動機器人的相關(guān)技術(shù)研
28、究中,控制技術(shù)是其核心技術(shù),也是其實現(xiàn)真正的智能化和完全的自主移動的關(guān)鍵技術(shù)。核心技術(shù),也是其實現(xiàn)真正的智能化和完全的自主移動的關(guān)鍵技術(shù)。移動機器人具有時變、強耦合和非線性的動力學特征,由于測量和建移動機器人具有時變、強耦合和非線性的動力學特征,由于測量和建模的不精確,加上負載的變化以及外部擾動的影響,實際上無法得到模的不精確,加上負載的變化以及外部擾動的影響,實際上無法得到移動機器人精確、完整的運動模型。移動機器人精確、完整的運動模型。通過對文通過對文27的控制方法進行詳細推導及仿真分析,研究一類移動機的控制方法進行詳細推導及仿真分析,研究一類移動機器人迭代學習離散控制的設(shè)計及仿真方法。器人
29、迭代學習離散控制的設(shè)計及仿真方法。 9.6.1 數(shù)學基礎(chǔ)數(shù)學基礎(chǔ) 代表代表N維歐氏空間,定義向量范數(shù)為:維歐氏空間,定義向量范數(shù)為: (9.22) 其中其中 為為( )階實數(shù)矩陣,定義矩陣范數(shù)為:階實數(shù)矩陣,定義矩陣范數(shù)為: (9.23) 其中其中 為矩陣的最大特征值。為矩陣的最大特征值。取取 , , ,定義范數(shù)為:,定義范數(shù)為: (9.249.24)nR1/2Tzz znRzp mRCpmT|maxCC C max1,Nndizzz, ,zq u y 1| ( ), 1supkk Nkzz:z NR 9.6.2 系統(tǒng)描述 圖9-10為移動機器人運動模型,它在同一根軸上有兩個獨立的推進輪,機器
30、人在二維空間移動,點代表機器人的當前位置,廣義坐標定義為,和為直角坐標系下的坐標,為機器人的方位角。當機器人的標定方向為地理坐標系的橫軸正半軸時,定義為0。移動機器人受不完全約束的影響而只能在驅(qū)動輪軸的方向運動,點的線速度和角速度定義為和。 圖圖9-10 移動機器人運動模型移動機器人運動模型 根據(jù)圖9-10,針對P點,移動機器人的離散運動學方程可由下式描述 (9.25) 其中 為采樣時間,機器人狀態(tài)向量為 ,速度向量為 。 式(9.25)可寫為: (9.26) 其中 (9.27)pppppppppp(1)( )cos( )0( )(1)( )sin( )0( )(1)( )01x kx kkv
31、 ky ky kTkkkkTTppp( )( ),( ),( )kx ky kkqTppp( )( ),( )kv kkup(1)( )( ( ), )( )kkk kkqqB qupppcos( )0( ), )sin( )001kk kTk B q 如圖9-10所示,期望軌跡為 。運動軌跡跟蹤的控制問題就是為確定 ,使 跟蹤 。 線速度和角速度誤差分別為: (9.28) (9.29) 移動機器人迭代學習控制系統(tǒng)結(jié)構(gòu)如圖9-11所示。dddd( )( ),( ),( ) , 1kx ky kkknpT( )( ),( )kv kku( )P kd( )P k pv kvkv kp( )( )
32、( )kkk 圖圖9-11 移動機器人迭代學習控制系統(tǒng)結(jié)構(gòu)移動機器人迭代學習控制系統(tǒng)結(jié)構(gòu)移動機器人離散運動學方程可描述如下:移動機器人離散運動學方程可描述如下: (9.30) (9.31)(1)( )( ( ), ) ( )( ),kkkkkkqqB qu( )( )( )kkkyq其中 為狀態(tài)干擾, 為輸出測量噪聲, 為系統(tǒng)輸出, 。 考慮迭代過程,由(9.30)和(9.31)可得: (9.32) (9.33) 其中 為迭代次數(shù), 為離散時間, 。 , 分別代表第 次迭代的狀態(tài)、輸入、輸出、狀態(tài)干擾和輸出噪聲。 機器人運動方程(9.32)和(9.33)滿足下列性質(zhì)和假設(shè):性質(zhì)1:考慮理想情況
33、,取 均為零, ,則期望軌跡的方程可寫為 (9.34) (9.35)( )k( )kT( )( ), ( ), ( )kx ky kky( )( ),( )kv kkTu(1)( )( ), )( )( ),iiiiikkk kkkqqB qu( )( )( )iiikkkyqik1,kn( )ikq( ),( ),( ),( )iiiikkkkuyi( ),( )iikkkNdddd(1)( )(q ( ), )( ),kkk kkqqBudd( )( ),kkyq 性質(zhì)2:矩陣函數(shù)滿足Lipschitz條件: , , 為正常數(shù) (9.36) 性質(zhì)3:矩陣 是有界的 , ,為正常數(shù),矩陣 為
34、 的滿秩矩陣。 假設(shè)1: ; 假設(shè)2:干擾和噪聲有界 (9.37) 其中 , 為正常數(shù)。 假設(shè)3:在每一次迭代中,軌跡都是從 的鄰域開始,即 , , 。12B12|(, )(, )|kkcB qB qqqkNBc( ( ), )iq k kBB|( ), )|ik kbB q( ), )ik kB q( ), )ik kqddu1max |( )|k nkb u11 k n11 k nmax max |( )| ,max max |( )|iiiikbkb bbd(0)q0dq|(0)(0)|ibqq0q0b1i 9.6.3 控制律設(shè)計及收斂性分析 迭代學習控制律設(shè)計為: (9.38) 對于第
35、i次迭代,跟蹤誤差信號為 , 和 為學習的增益矩陣,滿足 , , , , 。 通過控制律(9.38),使狀態(tài)變量 、控制輸入 、系統(tǒng)輸出 分別收斂于期望值。1121( )( )( ) (1)( )( )iiiikkkkkkuuLeLed( )( )( )iikkkeyy1( )kL2( )kL11L|( )|kbL22L|( )|kbLkN1L0b2L0b( )ikq( )iku( )iky 定理定理 1:考慮離散系統(tǒng)(:考慮離散系統(tǒng)(9.32)和()和(9.33),滿足假設(shè)),滿足假設(shè)1-3,采用控制,采用控制律(律(9.38),則),則 (9.39) 對于所有對于所有 都成立。如果忽略狀態(tài)
36、干擾,輸出噪聲和初始都成立。如果忽略狀態(tài)干擾,輸出噪聲和初始狀態(tài)誤差(即狀態(tài)誤差(即 ),則分別收斂于期望值。如果考慮干擾),則分別收斂于期望值。如果考慮干擾、噪聲和誤差的存在,則、噪聲和誤差的存在,則 , , 有界,且收斂于有界,且收斂于 的函數(shù)。的函數(shù)。 證明:證明:由式由式(9.349.34)和)和(9.329.32)得:)得: 1|( ) (, )|1ikkILB q(, )nikRNq0q0bbbd|( )( )|ikkuud|( )( )|ikkqqd|( )( )|ikkyy0q,b b b (9.40) 考慮性質(zhì)2和3及假設(shè)1和2,得 令 ,則 對上式進行遞推并考慮假設(shè)3,得:
37、 (9.41) dddddddddd111,iiiiiiiiiiiiiiikkkkkkkkkkkkkkkkq kkkkkkkkkkkkkkkkqqqqB quqB quqB quBuuuqB qB quB qu dBuB1iiiikkc bkbkbqqqud2Bu1hc b 2B1iiikhkbkbqqu 0112B2q0kkjkiijkhbjbh b qu由(9.38)式得:1d1d1211d2d11d2d111dd( )( )( )( )( )( ) (1)( )( )( )( )(1)(1)( )( )( )( )( )(1)(1)(1)( )( )( )( )( )( )( )( ),
38、 )iiiiiiiiiiiiiikkkkkkkkkkkkkkkkkkkkkkkkkkkkk kuuuuuLeLeuLyyLyyuLqqLqquLqB qud121111dddd112111( )( )( ), )( ) ( )( )(1)( )( )(1)( )( )( )( )( ), )( )( ), )( )( )( ) ( )( )( )( )( )(1)( )(iiiiiiiiiiiiiiiikkk kkkkkkkkkkkkk kkk kkkkkkkkkkkkqB quLLquLqLB quB quuuLLquL11dd211121111dd211)( )( ) ( ), )( )(
39、 )( ), )( ( ), )( ) ( )( )( )( )( )( )( )( ) ( ), )( )( )( )( )( ), )( ), )( ) ( )( )( )iiiiiiiiiiiiikkk kkkk kq k kkkkkkkkkkk kkkkkk kk kkkkkqLB quLB qBuLqLLILB quLqLB qB quLqL121( )( )( )( )iiikkkkL 利用性質(zhì)2和假設(shè)2,得 令 , ,則 將(9.39)和(9.41)代入上式,得11d21211LLBuL1LL( )( ) ( ), )( )( )( )( )()iiiiiikkkkkbkb c
40、bkbkbbbb buILB quqqq1d11LBuL2(1)hbc bb h121LL()bbbbb b2111L11( )( ) ( ), )( )( )( )iiiiikkk kkhkbkbuILB quqq02011112B2011L2B12q10( )( )( )( )kkjkiiiqjkkjkijkkhhbjbh bbhbjbh bb uuuu 因此 上式兩端同乘,取范數(shù),得20211112112B011L2B10( )( )( )( )kkkjiiLqijkkjijkkhbh bbhhbjbbhbjb uuuu202211Lq11121B011L2B1011( )( )()111( )11( )kkkiikjkjjkijkjjkijhkkhbbhhbbjbbhbjb
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 商鋪租賃裝修合同條款
- 塑鋼門窗工程安裝合同協(xié)議書
- 營銷現(xiàn)場作業(yè)安全管理和反竊電技能競賽參考復習測試卷
- 2025年勞務(wù)聘用合同
- 委托人力資源合同協(xié)議書
- 消防工程承攬合同.2
- 設(shè)備出兌合同范本
- 廣東電梯保養(yǎng)合同范本
- 貴州裝修合同范本
- 場館售賣飲品合同范本
- 老年人的口腔知識講座
- 5G智能工廠建設(shè)規(guī)劃
- 電纜隱蔽驗收記錄文本20種
- 一例化膿性鏈球菌感染的下肢靜脈潰瘍傷口循證護理
- Unit1+Art+Ancient+Reading+and+Thinking+Chinese+Art+on+show教學設(shè)計 高中英語人教選擇性必修第三冊
- 儲能系統(tǒng)介紹-電化學能-儲能電站
- 《PCB設(shè)計與制作(基于Altium-Designer)》教材配套電子課件電子教案(全)完整版課件
- 建筑裝飾工程施工總平面布置圖
- 外科護理系統(tǒng)考試題庫匯總含答案(多選題10)
- 豎井工程地質(zhì)勘察報告
- 職業(yè)道德與法律中職PPT完整全套教學課件
評論
0/150
提交評論