第9章 迭代算法_第1頁(yè)
第9章 迭代算法_第2頁(yè)
第9章 迭代算法_第3頁(yè)
第9章 迭代算法_第4頁(yè)
第9章 迭代算法_第5頁(yè)
已閱讀5頁(yè),還剩53頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 第第9章章 迭代學(xué)習(xí)控制迭代學(xué)習(xí)控制 實(shí)際控制中存在一類(lèi)軌跡跟蹤問(wèn)題,它的控制任務(wù)是尋找控制律 ,使得被控對(duì)象輸出 在有限時(shí)間 上沿著整個(gè)期望軌跡實(shí)現(xiàn)零誤差軌跡跟蹤。這列跟蹤問(wèn)題是具有挑戰(zhàn)性的控制問(wèn)題。 人們?cè)谔幚韺?shí)際場(chǎng)合中的重復(fù)操作任務(wù)時(shí),往往依據(jù)對(duì)象的可重復(fù)動(dòng)態(tài)行為與期望行為的差距來(lái)調(diào)整決策。通過(guò)重復(fù)操作,使得對(duì)象行為與期望行為的配合達(dá)到要求。這時(shí),衡量動(dòng)態(tài)行為的指標(biāo)是某種滿(mǎn)意指標(biāo)。 u t y t0,T 迭代學(xué)習(xí)控制(迭代學(xué)習(xí)控制(ILC,Iterative Learning Control)的思想最初由)的思想最初由日本學(xué)者日本學(xué)者Uchiyama于于1978年提出,于年提出,于19

2、84年由年由Arimoto等人做出了等人做出了開(kāi)創(chuàng)性的研究。這些學(xué)者借鑒人們?cè)谥貜?fù)過(guò)程中追求滿(mǎn)意指標(biāo)達(dá)到期開(kāi)創(chuàng)性的研究。這些學(xué)者借鑒人們?cè)谥貜?fù)過(guò)程中追求滿(mǎn)意指標(biāo)達(dá)到期望行為的簡(jiǎn)單原理,成功地使得具有強(qiáng)耦合非線性多變量的工業(yè)機(jī)器望行為的簡(jiǎn)單原理,成功地使得具有強(qiáng)耦合非線性多變量的工業(yè)機(jī)器人快速高精度地執(zhí)行軌跡跟蹤任務(wù)。其基本做法是對(duì)于一個(gè)在有限時(shí)人快速高精度地執(zhí)行軌跡跟蹤任務(wù)。其基本做法是對(duì)于一個(gè)在有限時(shí)間區(qū)間上執(zhí)行軌跡跟蹤任務(wù)的機(jī)器人,利用前一次或前幾次操作時(shí)測(cè)間區(qū)間上執(zhí)行軌跡跟蹤任務(wù)的機(jī)器人,利用前一次或前幾次操作時(shí)測(cè)得的誤差信息修正控制輸入,使得該重復(fù)任務(wù)在下一次操作過(guò)程中做得的誤差信息修

3、正控制輸入,使得該重復(fù)任務(wù)在下一次操作過(guò)程中做得更好。如此不斷重復(fù),直至在整個(gè)時(shí)間區(qū)間上輸出軌跡跟蹤上期望得更好。如此不斷重復(fù),直至在整個(gè)時(shí)間區(qū)間上輸出軌跡跟蹤上期望軌跡。軌跡。 迭代學(xué)習(xí)控制適合于具有重復(fù)運(yùn)動(dòng)性質(zhì)的被控對(duì)象,通過(guò)迭代修迭代學(xué)習(xí)控制適合于具有重復(fù)運(yùn)動(dòng)性質(zhì)的被控對(duì)象,通過(guò)迭代修正達(dá)到某種控制目標(biāo)的改善。迭代學(xué)習(xí)控制方法不依賴(lài)于系統(tǒng)的精確正達(dá)到某種控制目標(biāo)的改善。迭代學(xué)習(xí)控制方法不依賴(lài)于系統(tǒng)的精確數(shù)學(xué)模型,能在給定的時(shí)間范圍內(nèi)數(shù)學(xué)模型,能在給定的時(shí)間范圍內(nèi),以非常簡(jiǎn)單的算法實(shí)現(xiàn)不確定性以非常簡(jiǎn)單的算法實(shí)現(xiàn)不確定性高的非線性強(qiáng)耦合動(dòng)態(tài)系統(tǒng)的控制,并高精度跟蹤給定期望軌跡,因高的非線性

4、強(qiáng)耦合動(dòng)態(tài)系統(tǒng)的控制,并高精度跟蹤給定期望軌跡,因而一經(jīng)推出,就在運(yùn)動(dòng)控制領(lǐng)域得到了廣泛的運(yùn)用。而一經(jīng)推出,就在運(yùn)動(dòng)控制領(lǐng)域得到了廣泛的運(yùn)用。 迭代學(xué)習(xí)控制方法具有很強(qiáng)的工程背景,這些背景包括:執(zhí)行諸迭代學(xué)習(xí)控制方法具有很強(qiáng)的工程背景,這些背景包括:執(zhí)行諸如焊接、噴涂、裝配、搬運(yùn)等重復(fù)任務(wù)的工業(yè)機(jī)器人;指令信號(hào)為周如焊接、噴涂、裝配、搬運(yùn)等重復(fù)任務(wù)的工業(yè)機(jī)器人;指令信號(hào)為周期函數(shù)的伺服系統(tǒng);數(shù)控機(jī)床;磁盤(pán)光盤(pán)驅(qū)動(dòng)系統(tǒng);機(jī)械制造中使用期函數(shù)的伺服系統(tǒng);數(shù)控機(jī)床;磁盤(pán)光盤(pán)驅(qū)動(dòng)系統(tǒng);機(jī)械制造中使用的坐標(biāo)測(cè)量機(jī)等。的坐標(biāo)測(cè)量機(jī)等。 由于迭代學(xué)習(xí)控制模擬了人腦學(xué)習(xí)和自我調(diào)節(jié)的功能,因而是一種典型的智能控

5、制方法。經(jīng)歷了三十多年的發(fā)展,迭代學(xué)習(xí)控制已成為智能控制中具有嚴(yán)格數(shù)學(xué)描述的一個(gè)分支。目前,迭代學(xué)習(xí)控制在學(xué)習(xí)算法、收斂性、魯棒性、學(xué)習(xí)速度及工程應(yīng)用研究上取得了很大的進(jìn)展。 9.1 基本原理基本原理 設(shè)被控對(duì)象的動(dòng)態(tài)過(guò)程為 , (9.1)( )( ( ), ( ), )tftt txxu( )( ( ), ( ), )tgtt tyxu 式中, 、 、 分別為系統(tǒng)的狀態(tài),輸出和輸入變量, 、 、 為適當(dāng)維數(shù)的向量函數(shù),其結(jié)構(gòu)與參數(shù)均未知。若期望控制 存在,則迭代學(xué)習(xí)控制的目標(biāo)為:給定期望輸出 和每次運(yùn)行的初始狀態(tài) ,要求在給定的時(shí)間 內(nèi),按照一定的學(xué)習(xí)控制算法通過(guò)多次重復(fù)的運(yùn)行,使控制輸入

6、,而系統(tǒng)輸出 第k 次運(yùn)行時(shí),式(9.1) 表示為: (9.2) 跟蹤誤差為 (9.3) nxRmyRruR( )f( )gd( ) tud( ) ty(0)kx0,tTd( )( )kttuud( )( )kttyy( )( ),( ), )kkktftt txxu( )( ),( ), )kkktgtt tyxud( )( )( )kkttteyy 迭代學(xué)習(xí)控制可分為開(kāi)環(huán)學(xué)習(xí)和閉環(huán)學(xué)習(xí)。 開(kāi)環(huán)學(xué)習(xí)控制的方法是:第k+1次的控制等于第k次控制再加上第k次輸出誤差的校正項(xiàng),即 (9.4) 閉環(huán)學(xué)習(xí)策略是:取第K+1次運(yùn)行的誤差作為學(xué)習(xí)的修正項(xiàng),即 (9.5) 式中,L為線性或非線性算子。1(

7、)L( ),( )kkktttuue11( )L( ),( )kkktttuue 9.2 基本迭代學(xué)習(xí)控制算法基本迭代學(xué)習(xí)控制算法 Arimoto 等首先給出了線性時(shí)變連續(xù)系統(tǒng)的等首先給出了線性時(shí)變連續(xù)系統(tǒng)的D型迭代學(xué)習(xí)控制律型迭代學(xué)習(xí)控制律 (9.6) 式中,式中, 為常數(shù)增益矩陣。在為常數(shù)增益矩陣。在D 型算法的基礎(chǔ)上,相繼出現(xiàn)了型算法的基礎(chǔ)上,相繼出現(xiàn)了P 型、型、PI 型、型、PD 型迭代學(xué)習(xí)控制律。從一般意義來(lái)看它們都是型迭代學(xué)習(xí)控制律。從一般意義來(lái)看它們都是PID型迭代型迭代學(xué)習(xí)控制律的特殊形式,學(xué)習(xí)控制律的特殊形式,PID迭代學(xué)習(xí)控制律表示為迭代學(xué)習(xí)控制律表示為 (9.7) 式中

8、式中, 、 、 為學(xué)習(xí)增益矩陣。算法中的誤差信息使用稱(chēng)為開(kāi)環(huán)迭為學(xué)習(xí)增益矩陣。算法中的誤差信息使用稱(chēng)為開(kāi)環(huán)迭代學(xué)習(xí)控制,如果使用代學(xué)習(xí)控制,如果使用 則稱(chēng)為閉環(huán)迭代學(xué)習(xí)控制,如果同時(shí)使用和則稱(chēng)為閉環(huán)迭代學(xué)習(xí)控制,如果同時(shí)使用和則稱(chēng)為開(kāi)閉環(huán)迭代學(xué)習(xí)控制。則稱(chēng)為開(kāi)閉環(huán)迭代學(xué)習(xí)控制。1( )( )( )kkktttuue 1d( )( )( )( )( )tkkkkktttt0uueee 此外,還有高階迭代學(xué)習(xí)控制算法、最優(yōu)迭代學(xué)習(xí)控制算法、遺忘因子迭此外,還有高階迭代學(xué)習(xí)控制算法、最優(yōu)迭代學(xué)習(xí)控制算法、遺忘因子迭代學(xué)習(xí)控制算法和反饋代學(xué)習(xí)控制算法和反饋-前饋迭代學(xué)習(xí)控制算法等。前饋迭代學(xué)習(xí)控制算法

9、等。 9.3 迭代學(xué)習(xí)控制的關(guān)鍵技術(shù)迭代學(xué)習(xí)控制的關(guān)鍵技術(shù) 9.3.1 學(xué)習(xí)算法的穩(wěn)定性和收斂性學(xué)習(xí)算法的穩(wěn)定性和收斂性 穩(wěn)定性與收斂性問(wèn)題是研究當(dāng)學(xué)習(xí)律與被控系統(tǒng)滿(mǎn)足什么條件時(shí),迭代穩(wěn)定性與收斂性問(wèn)題是研究當(dāng)學(xué)習(xí)律與被控系統(tǒng)滿(mǎn)足什么條件時(shí),迭代學(xué)習(xí)控制過(guò)程才是穩(wěn)定收斂的。算法的穩(wěn)定性保證了隨著學(xué)習(xí)次數(shù)的增加,學(xué)習(xí)控制過(guò)程才是穩(wěn)定收斂的。算法的穩(wěn)定性保證了隨著學(xué)習(xí)次數(shù)的增加,控制系統(tǒng)不發(fā)散,但是,對(duì)于學(xué)習(xí)控制系統(tǒng)而言,僅僅穩(wěn)定是沒(méi)有實(shí)際意義控制系統(tǒng)不發(fā)散,但是,對(duì)于學(xué)習(xí)控制系統(tǒng)而言,僅僅穩(wěn)定是沒(méi)有實(shí)際意義的,只有使學(xué)習(xí)過(guò)程收斂到真值,才能保證得到的控制為某種意義下最優(yōu)的的,只有使學(xué)習(xí)過(guò)程收斂到

10、真值,才能保證得到的控制為某種意義下最優(yōu)的控制。收斂是對(duì)學(xué)習(xí)控制的最基本的要求,多數(shù)學(xué)者在提出新的學(xué)習(xí)律的同控制。收斂是對(duì)學(xué)習(xí)控制的最基本的要求,多數(shù)學(xué)者在提出新的學(xué)習(xí)律的同時(shí),基于被控對(duì)象的一些假設(shè),給出了收斂的條件。例如,時(shí),基于被控對(duì)象的一些假設(shè),給出了收斂的條件。例如,Arimoto在最初在最初提出提出PID型學(xué)習(xí)控制律時(shí),僅針對(duì)線性系統(tǒng)在型學(xué)習(xí)控制律時(shí),僅針對(duì)線性系統(tǒng)在D型學(xué)習(xí)律下的穩(wěn)定性和收斂條型學(xué)習(xí)律下的穩(wěn)定性和收斂條件作了證明件作了證明 9.3.2 初始值問(wèn)題初始值問(wèn)題 運(yùn)用迭代學(xué)習(xí)控制技術(shù)設(shè)計(jì)控制器時(shí),只需要通過(guò)重復(fù)操作獲得的受控運(yùn)用迭代學(xué)習(xí)控制技術(shù)設(shè)計(jì)控制器時(shí),只需要通過(guò)重

11、復(fù)操作獲得的受控對(duì)象的誤差或誤差導(dǎo)數(shù)信號(hào)。在這種控制技術(shù)中,迭代學(xué)習(xí)總要從某初始點(diǎn)對(duì)象的誤差或誤差導(dǎo)數(shù)信號(hào)。在這種控制技術(shù)中,迭代學(xué)習(xí)總要從某初始點(diǎn)開(kāi)始,初始點(diǎn)指初始狀態(tài)或初始輸出。幾乎所有的收斂性證明都要求初始條開(kāi)始,初始點(diǎn)指初始狀態(tài)或初始輸出。幾乎所有的收斂性證明都要求初始條件是相同的,解決迭代學(xué)習(xí)控制理論中的初始條件問(wèn)題一直是人們追求的目件是相同的,解決迭代學(xué)習(xí)控制理論中的初始條件問(wèn)題一直是人們追求的目標(biāo)之一。目前已提出的迭代學(xué)習(xí)控制算法大多數(shù)要求被控系統(tǒng)每次運(yùn)行時(shí)的標(biāo)之一。目前已提出的迭代學(xué)習(xí)控制算法大多數(shù)要求被控系統(tǒng)每次運(yùn)行時(shí)的初始狀態(tài)在期望軌跡對(duì)應(yīng)的初始狀態(tài)上,即滿(mǎn)足初始條件:初始

12、狀態(tài)在期望軌跡對(duì)應(yīng)的初始狀態(tài)上,即滿(mǎn)足初始條件: (9.8) 當(dāng)系統(tǒng)的初始狀態(tài)不在期望軌跡上,而在期望軌跡的某一很小的鄰域內(nèi)當(dāng)系統(tǒng)的初始狀態(tài)不在期望軌跡上,而在期望軌跡的某一很小的鄰域內(nèi)時(shí),通常把這類(lèi)問(wèn)題歸結(jié)為學(xué)習(xí)控制的魯棒性問(wèn)題研究。時(shí),通常把這類(lèi)問(wèn)題歸結(jié)為學(xué)習(xí)控制的魯棒性問(wèn)題研究。d(0)(0),0,1,2,kxxk 9.3.3 學(xué)習(xí)速度問(wèn)題學(xué)習(xí)速度問(wèn)題 在迭代學(xué)習(xí)算法研究中,其收斂條件基本上都是在學(xué)習(xí)次數(shù)在迭代學(xué)習(xí)算法研究中,其收斂條件基本上都是在學(xué)習(xí)次數(shù) 下給出的。而在實(shí)際應(yīng)用場(chǎng)合,學(xué)習(xí)次數(shù)下給出的。而在實(shí)際應(yīng)用場(chǎng)合,學(xué)習(xí)次數(shù) 顯然是沒(méi)有任何實(shí)際顯然是沒(méi)有任何實(shí)際意義的。因此,如何使迭

13、代學(xué)習(xí)過(guò)程更快地收斂于期望值是迭代學(xué)習(xí)意義的。因此,如何使迭代學(xué)習(xí)過(guò)程更快地收斂于期望值是迭代學(xué)習(xí)控制研究中的另一個(gè)重要問(wèn)題??刂蒲芯恐械牧硪粋€(gè)重要問(wèn)題。 迭代學(xué)習(xí)控制本質(zhì)上是一種前饋控制技術(shù),大部分學(xué)習(xí)律盡管證迭代學(xué)習(xí)控制本質(zhì)上是一種前饋控制技術(shù),大部分學(xué)習(xí)律盡管證明了學(xué)習(xí)收斂的充分條件,但收斂速度還是很慢??衫枚啻螌W(xué)習(xí)過(guò)明了學(xué)習(xí)收斂的充分條件,但收斂速度還是很慢。可利用多次學(xué)習(xí)過(guò)程中得到的知識(shí)來(lái)改進(jìn)后續(xù)學(xué)習(xí)過(guò)程的速度,例如,采用高階迭代控程中得到的知識(shí)來(lái)改進(jìn)后續(xù)學(xué)習(xí)過(guò)程的速度,例如,采用高階迭代控制算法、帶遺忘因子的學(xué)習(xí)律、利用當(dāng)前項(xiàng)或反饋配置等方法來(lái)構(gòu)造制算法、帶遺忘因子的學(xué)習(xí)律、利用

14、當(dāng)前項(xiàng)或反饋配置等方法來(lái)構(gòu)造學(xué)習(xí)律,可使收斂速度大大加快。學(xué)習(xí)律,可使收斂速度大大加快。k k 9.3.4 魯棒性問(wèn)題魯棒性問(wèn)題 迭代學(xué)習(xí)控制理論的提出有濃厚的工程背景,因此僅僅在無(wú)干擾迭代學(xué)習(xí)控制理論的提出有濃厚的工程背景,因此僅僅在無(wú)干擾條件下討論收斂性問(wèn)題是不夠的,還應(yīng)討論存在各種干擾的情形下系條件下討論收斂性問(wèn)題是不夠的,還應(yīng)討論存在各種干擾的情形下系統(tǒng)的跟蹤性能。一個(gè)實(shí)際運(yùn)行的迭代學(xué)習(xí)控制系統(tǒng)除了存在初始偏移統(tǒng)的跟蹤性能。一個(gè)實(shí)際運(yùn)行的迭代學(xué)習(xí)控制系統(tǒng)除了存在初始偏移外,還或多或少存在狀態(tài)擾動(dòng)、測(cè)量噪聲、輸入擾動(dòng)等各種干擾。魯外,還或多或少存在狀態(tài)擾動(dòng)、測(cè)量噪聲、輸入擾動(dòng)等各種干擾。

15、魯棒性問(wèn)題討論存在各種干擾時(shí)迭代學(xué)習(xí)控制系統(tǒng)的跟蹤性能。具體地棒性問(wèn)題討論存在各種干擾時(shí)迭代學(xué)習(xí)控制系統(tǒng)的跟蹤性能。具體地說(shuō),一個(gè)迭代學(xué)習(xí)控制系統(tǒng)是魯棒的,是指系統(tǒng)在各種有界干擾的影說(shuō),一個(gè)迭代學(xué)習(xí)控制系統(tǒng)是魯棒的,是指系統(tǒng)在各種有界干擾的影響下,其迭代軌跡能收斂到期望軌跡的鄰域內(nèi),而當(dāng)這些干擾消除時(shí)響下,其迭代軌跡能收斂到期望軌跡的鄰域內(nèi),而當(dāng)這些干擾消除時(shí),迭代軌跡會(huì)收斂到期望軌跡。,迭代軌跡會(huì)收斂到期望軌跡。 9.4 機(jī)械手軌跡跟蹤迭代學(xué)習(xí)控制仿真實(shí)例機(jī)械手軌跡跟蹤迭代學(xué)習(xí)控制仿真實(shí)例 9.4.1控制器設(shè)計(jì)控制器設(shè)計(jì) 考慮一個(gè)關(guān)節(jié)的機(jī)器人,其動(dòng)態(tài)性能可以由以下二階非線性微分方考慮一個(gè)關(guān)節(jié)

16、的機(jī)器人,其動(dòng)態(tài)性能可以由以下二階非線性微分方程描述:程描述: (9.9) 式中:式中: 為關(guān)節(jié)角位移量,為關(guān)節(jié)角位移量, 為機(jī)器人的慣性矩陣,為機(jī)器人的慣性矩陣, 表示離心力和哥氏力,表示離心力和哥氏力, 為重力項(xiàng),為重力項(xiàng), 為控制力矩,為控制力矩, 為各為各種誤差和擾動(dòng)。種誤差和擾動(dòng)。 設(shè)系統(tǒng)所要跟蹤的期望軌跡為設(shè)系統(tǒng)所要跟蹤的期望軌跡為 , 。系統(tǒng)第次輸出為。系統(tǒng)第次輸出為 令令 。 d, D q qC q q qG qnqR n nD qR,nC q qR nG qRnRdnR dty0,tT ity diittteyy 在學(xué)習(xí)開(kāi)始時(shí),系統(tǒng)的初始狀態(tài)為 。學(xué)習(xí)控制的任務(wù)為通過(guò)學(xué)習(xí)控制

17、律設(shè)計(jì) ,使第 次運(yùn)動(dòng)誤差 減少。 采用三種基于反饋的迭代學(xué)習(xí)控制律: (1)閉環(huán)D型 (9.10) (2)閉環(huán)PD型: (9.11) (3)指數(shù)變?cè)鲆鍰型: (9.12) 00 x 1uit1i 1eit 1dd1kkkttttuuKqq 1pd1dd1kkkkttttttuuKqqKqq 1pd1dd1kkkkttttttuuKqqKqq 9.4.2 仿真實(shí)例仿真實(shí)例 針對(duì)二關(guān)節(jié)機(jī)械手,介紹一種機(jī)器人針對(duì)二關(guān)節(jié)機(jī)械手,介紹一種機(jī)器人PD型反饋迭代學(xué)習(xí)控制的仿型反饋迭代學(xué)習(xí)控制的仿真設(shè)計(jì)方法。針對(duì)二關(guān)節(jié)機(jī)器人控制系統(tǒng)式(真設(shè)計(jì)方法。針對(duì)二關(guān)節(jié)機(jī)器人控制系統(tǒng)式(9.9),各項(xiàng)表示為:),各項(xiàng)表

18、示為: 2 2ijdD2221111212122122coscccdd ldlll lqII21221221222cosccdddll lql222222cdd lI2 2ijcC112chq1212chqhq211chq 220c2 122sinchm l lq T12GGG 干擾項(xiàng)為 機(jī)器人系統(tǒng)參數(shù)為 , , , 采用三種閉環(huán)迭代學(xué)習(xí)控制律,其中 為D型迭代學(xué)習(xí)控制, 為PD型迭代學(xué)習(xí)控制, 為變?cè)鲆嬷笖?shù)D型迭代學(xué)習(xí)控制。 兩個(gè)關(guān)節(jié)的位置指令分別為 和 ,為了保證被控對(duì)象初始輸出與指令初值一致,取被控對(duì)象的初始狀態(tài)為 。取PD型迭代學(xué)習(xí)控制,即 ,仿真結(jié)果如圖9-1至圖9-3所示。1112

19、 112212gcosgcosccGd ld lqd lqq22212gcoscGd lqqTd0.3sin0.1 1 ett121 kgdd120.5mll120.25mccll2120.1 kg mII29.81 m/sg 1M 2M 3M sin(3 ) tcos(3 ) t T00310 x3M 圖圖9 9-1 20 20次迭代學(xué)習(xí)的跟蹤過(guò)程次迭代學(xué)習(xí)的跟蹤過(guò)程圖圖9-2 第第20次迭代學(xué)習(xí)的位置跟蹤次迭代學(xué)習(xí)的位置跟蹤圖圖9 9-3 20 20次迭代過(guò)程中誤差范數(shù)的收斂過(guò)程次迭代過(guò)程中誤差范數(shù)的收斂過(guò)程 9.5 線性時(shí)變連續(xù)系統(tǒng)迭代學(xué)習(xí)控制線性時(shí)變連續(xù)系統(tǒng)迭代學(xué)習(xí)控制 9.5.1 系

20、統(tǒng)描述系統(tǒng)描述 Arimoto等給出了線性時(shí)變連續(xù)系統(tǒng)等給出了線性時(shí)變連續(xù)系統(tǒng) (9.13) 的開(kāi)環(huán)的開(kāi)環(huán)PID型迭代學(xué)習(xí)控制律:型迭代學(xué)習(xí)控制律: (9.14) 其中其中 , , 為學(xué)習(xí)增益矩陣。為學(xué)習(xí)增益矩陣。 ttttttttxAxBuyCx 1dddkkktttttuuLeL 9.5.2 控制器設(shè)計(jì)及收斂性分析控制器設(shè)計(jì)及收斂性分析定理定理1 若由式(若由式(9.13)和式()和式(9.14)式描述的系統(tǒng)滿(mǎn)足如下條件:)式描述的系統(tǒng)滿(mǎn)足如下條件:(1) ; (2)每次迭代初始條件一致,即)每次迭代初始條件一致,即 則當(dāng)則當(dāng) 時(shí),有時(shí),有 , 。證明:證明: 由式(由式(9.13)及條件

21、式()及條件式(2)得)得則則 ,即系統(tǒng)滿(mǎn)足初始條件。,即系統(tǒng)滿(mǎn)足初始條件。 1tttICB 00d01,2,3,00 xxyykkk dyyktt0,tT 110000yCxCxykkkk 000,1,2,kke 非齊次一階線性微分方程 的解為: 取 ,則 由于 , ,則 tttttxAxBu 000000expdexpdexpd dexpexpexpdexpexpdtttttttttt xCAABuACAABuACAABu,expttA 110,dtkkkktttxxBuu deyykkttt 1d1eyykkttt 11110,deeyyCxxCBuukkkkkktkkttttttttt

22、 即 將PID型控制律式(9.14)代入上式,則第k+1次輸出的誤差為: (9.15) 利用分部積分公式,令 ,有 (9.16) 將式(9.16)代入式(9.15),得 (9.17) 110,deeCBuutkkkktttt 100,ddeeCBeLeetkkkkktttt ,GCBtt 0000d,d,dtttkkktkktttttCBeGeGeCBeGe 1000 0,d,d,d deI CBeGeCBLeCBetkkkttkktttttttttt 將式(9.17)兩端取范數(shù),有 (9.18) 式中 根據(jù) 范數(shù)的定義可知,函數(shù) 的范數(shù)為 。將式(9.18)兩端同乘以 , ,并考慮到有 10

23、00 01200 0,d,d,d ddd deI CBeGeCBLeCBeI CBeeetkkkttkkttkkkttttttttttttttbb 1,0,0,maxsup, sup,tTtTbtttGCBL 2,0,sup,CBtTbtt: 0,nfTR 0supett Tff t expt00exp1expdtt (9.19) 根據(jù) 范數(shù)的定義,函數(shù) 的范數(shù)為:由于 , , ,則有 。 將式(9.19)的結(jié)果應(yīng)用于下式,得: 1110001111expdexpexpexpdexpexpd1 expexp1expexpexp11 exptttkkkkkkktbtbbtttbbtttbTbee

24、eeeee: 0,nfTR 0suptt Tff te 0,tT 0,t 0, kkee其中 。即 (9.20) 22000020202022expd dexpexpexpd d1 expexpexpd1 expexpexpd1 expexpexpd1 expexp1exp1 exp1 exttkktktktkkktbtbTtbTbtTbtTtbtTb eeeeeee 22p1 expktTbe1 exp1 exp0tT 222001expexpd dtkkTtbb ee 則(9.19)和(9.20)代入(9.18),得 (9.21) 其中 。由于 ,則當(dāng) 取足夠大時(shí),可以 使 。 因此 。定

25、理得證。 如果將控制律式(9.14)中的 改為 ,則為閉環(huán)PID型迭代學(xué)習(xí)控制律。同定理1的證明過(guò)程,可證明閉環(huán)PID迭代學(xué)習(xí)控制律。1eekk 2121 exp1 expTTbb11lim0ekk e k1e k 9.5.3 仿真實(shí)例仿真實(shí)例 考慮考慮2輸入輸入2輸出線性系統(tǒng):輸出線性系統(tǒng): 期望跟蹤軌跡為期望跟蹤軌跡為 11122223111101x tx tu txtxtut 11222001y tx tytxt 1d2dsin(3 )cos(3 )ytttyt0,1t 由于 ,取 ,可滿(mǎn)足定理1中的條件(1),在控制律式(9.14)中取 , ,系統(tǒng)的初始狀態(tài)為 。 在chap9_2si

26、m.mdl程序中,選擇Simulink的Manual Switch開(kāi)關(guān),將開(kāi)關(guān)向下,取PD型開(kāi)環(huán)迭代學(xué)習(xí)控制律,仿真結(jié)果見(jiàn)圖9-4至9-6所示。將開(kāi)關(guān)向上,采用PD型閉環(huán)迭代學(xué)習(xí)控制律,仿真結(jié)果見(jiàn)圖9-7至9-9所示。可見(jiàn),閉環(huán)收斂速度好于開(kāi)環(huán)收斂速度。2201CB0.95000.952.0002.0L0 1 02 00010 xx 圖圖9-4 30次迭代學(xué)習(xí)的跟蹤過(guò)程次迭代學(xué)習(xí)的跟蹤過(guò)程(開(kāi)環(huán)(開(kāi)環(huán)PD控制)控制)圖圖9-5 第第30次迭代學(xué)習(xí)的位置跟次迭代學(xué)習(xí)的位置跟蹤(開(kāi)環(huán)蹤(開(kāi)環(huán)PD控制控制)圖圖9-6 30次迭代過(guò)程中誤差最大絕對(duì)次迭代過(guò)程中誤差最大絕對(duì)值的收斂過(guò)程(開(kāi)環(huán)值的收斂過(guò)程

27、(開(kāi)環(huán)PD控制)控制)圖圖9-7 30次迭代學(xué)習(xí)的跟蹤過(guò)程次迭代學(xué)習(xí)的跟蹤過(guò)程(閉環(huán)(閉環(huán)PD控制)控制)圖圖9-8 第第30次迭代學(xué)習(xí)的位置跟次迭代學(xué)習(xí)的位置跟蹤(閉環(huán)蹤(閉環(huán)PD控制)控制)圖圖9-9 30次迭代過(guò)程中誤差最大絕對(duì)值次迭代過(guò)程中誤差最大絕對(duì)值的收斂過(guò)程(閉環(huán)的收斂過(guò)程(閉環(huán)PD控制)控制) 9.6 移動(dòng)機(jī)器人軌跡跟蹤迭代學(xué)習(xí)控制移動(dòng)機(jī)器人軌跡跟蹤迭代學(xué)習(xí)控制 移動(dòng)機(jī)器人是一種在復(fù)雜的環(huán)境下工作的具有自規(guī)劃、自組織、自移動(dòng)機(jī)器人是一種在復(fù)雜的環(huán)境下工作的具有自規(guī)劃、自組織、自適應(yīng)能力的機(jī)器人。在移動(dòng)機(jī)器人的相關(guān)技術(shù)研究中,控制技術(shù)是其適應(yīng)能力的機(jī)器人。在移動(dòng)機(jī)器人的相關(guān)技術(shù)研

28、究中,控制技術(shù)是其核心技術(shù),也是其實(shí)現(xiàn)真正的智能化和完全的自主移動(dòng)的關(guān)鍵技術(shù)。核心技術(shù),也是其實(shí)現(xiàn)真正的智能化和完全的自主移動(dòng)的關(guān)鍵技術(shù)。移動(dòng)機(jī)器人具有時(shí)變、強(qiáng)耦合和非線性的動(dòng)力學(xué)特征,由于測(cè)量和建移動(dòng)機(jī)器人具有時(shí)變、強(qiáng)耦合和非線性的動(dòng)力學(xué)特征,由于測(cè)量和建模的不精確,加上負(fù)載的變化以及外部擾動(dòng)的影響,實(shí)際上無(wú)法得到模的不精確,加上負(fù)載的變化以及外部擾動(dòng)的影響,實(shí)際上無(wú)法得到移動(dòng)機(jī)器人精確、完整的運(yùn)動(dòng)模型。移動(dòng)機(jī)器人精確、完整的運(yùn)動(dòng)模型。通過(guò)對(duì)文通過(guò)對(duì)文27的控制方法進(jìn)行詳細(xì)推導(dǎo)及仿真分析,研究一類(lèi)移動(dòng)機(jī)的控制方法進(jìn)行詳細(xì)推導(dǎo)及仿真分析,研究一類(lèi)移動(dòng)機(jī)器人迭代學(xué)習(xí)離散控制的設(shè)計(jì)及仿真方法。器人

29、迭代學(xué)習(xí)離散控制的設(shè)計(jì)及仿真方法。 9.6.1 數(shù)學(xué)基礎(chǔ)數(shù)學(xué)基礎(chǔ) 代表代表N維歐氏空間,定義向量范數(shù)為:維歐氏空間,定義向量范數(shù)為: (9.22) 其中其中 為為( )階實(shí)數(shù)矩陣,定義矩陣范數(shù)為:階實(shí)數(shù)矩陣,定義矩陣范數(shù)為: (9.23) 其中其中 為矩陣的最大特征值。為矩陣的最大特征值。取取 , , ,定義范數(shù)為:,定義范數(shù)為: (9.249.24)nR1/2Tzz znRzp mRCpmT|maxCC C max1,Nndizzz, ,zq u y 1| ( ), 1supkk Nkzz:z NR 9.6.2 系統(tǒng)描述 圖9-10為移動(dòng)機(jī)器人運(yùn)動(dòng)模型,它在同一根軸上有兩個(gè)獨(dú)立的推進(jìn)輪,機(jī)器

30、人在二維空間移動(dòng),點(diǎn)代表機(jī)器人的當(dāng)前位置,廣義坐標(biāo)定義為,和為直角坐標(biāo)系下的坐標(biāo),為機(jī)器人的方位角。當(dāng)機(jī)器人的標(biāo)定方向?yàn)榈乩碜鴺?biāo)系的橫軸正半軸時(shí),定義為0。移動(dòng)機(jī)器人受不完全約束的影響而只能在驅(qū)動(dòng)輪軸的方向運(yùn)動(dòng),點(diǎn)的線速度和角速度定義為和。 圖圖9-10 移動(dòng)機(jī)器人運(yùn)動(dòng)模型移動(dòng)機(jī)器人運(yùn)動(dòng)模型 根據(jù)圖9-10,針對(duì)P點(diǎn),移動(dòng)機(jī)器人的離散運(yùn)動(dòng)學(xué)方程可由下式描述 (9.25) 其中 為采樣時(shí)間,機(jī)器人狀態(tài)向量為 ,速度向量為 。 式(9.25)可寫(xiě)為: (9.26) 其中 (9.27)pppppppppp(1)( )cos( )0( )(1)( )sin( )0( )(1)( )01x kx kkv

31、 ky ky kTkkkkTTppp( )( ),( ),( )kx ky kkqTppp( )( ),( )kv kkup(1)( )( ( ), )( )kkk kkqqB qupppcos( )0( ), )sin( )001kk kTk B q 如圖9-10所示,期望軌跡為 。運(yùn)動(dòng)軌跡跟蹤的控制問(wèn)題就是為確定 ,使 跟蹤 。 線速度和角速度誤差分別為: (9.28) (9.29) 移動(dòng)機(jī)器人迭代學(xué)習(xí)控制系統(tǒng)結(jié)構(gòu)如圖9-11所示。dddd( )( ),( ),( ) , 1kx ky kkknpT( )( ),( )kv kku( )P kd( )P k pv kvkv kp( )( )

32、( )kkk 圖圖9-11 移動(dòng)機(jī)器人迭代學(xué)習(xí)控制系統(tǒng)結(jié)構(gòu)移動(dòng)機(jī)器人迭代學(xué)習(xí)控制系統(tǒng)結(jié)構(gòu)移動(dòng)機(jī)器人離散運(yùn)動(dòng)學(xué)方程可描述如下:移動(dòng)機(jī)器人離散運(yùn)動(dòng)學(xué)方程可描述如下: (9.30) (9.31)(1)( )( ( ), ) ( )( ),kkkkkkqqB qu( )( )( )kkkyq其中 為狀態(tài)干擾, 為輸出測(cè)量噪聲, 為系統(tǒng)輸出, 。 考慮迭代過(guò)程,由(9.30)和(9.31)可得: (9.32) (9.33) 其中 為迭代次數(shù), 為離散時(shí)間, 。 , 分別代表第 次迭代的狀態(tài)、輸入、輸出、狀態(tài)干擾和輸出噪聲。 機(jī)器人運(yùn)動(dòng)方程(9.32)和(9.33)滿(mǎn)足下列性質(zhì)和假設(shè):性質(zhì)1:考慮理想情況

33、,取 均為零, ,則期望軌跡的方程可寫(xiě)為 (9.34) (9.35)( )k( )kT( )( ), ( ), ( )kx ky kky( )( ),( )kv kkTu(1)( )( ), )( )( ),iiiiikkk kkkqqB qu( )( )( )iiikkkyqik1,kn( )ikq( ),( ),( ),( )iiiikkkkuyi( ),( )iikkkNdddd(1)( )(q ( ), )( ),kkk kkqqBudd( )( ),kkyq 性質(zhì)2:矩陣函數(shù)滿(mǎn)足Lipschitz條件: , , 為正常數(shù) (9.36) 性質(zhì)3:矩陣 是有界的 , ,為正常數(shù),矩陣 為

34、 的滿(mǎn)秩矩陣。 假設(shè)1: ; 假設(shè)2:干擾和噪聲有界 (9.37) 其中 , 為正常數(shù)。 假設(shè)3:在每一次迭代中,軌跡都是從 的鄰域開(kāi)始,即 , , 。12B12|(, )(, )|kkcB qB qqqkNBc( ( ), )iq k kBB|( ), )|ik kbB q( ), )ik kB q( ), )ik kqddu1max |( )|k nkb u11 k n11 k nmax max |( )| ,max max |( )|iiiikbkb bbd(0)q0dq|(0)(0)|ibqq0q0b1i 9.6.3 控制律設(shè)計(jì)及收斂性分析 迭代學(xué)習(xí)控制律設(shè)計(jì)為: (9.38) 對(duì)于第

35、i次迭代,跟蹤誤差信號(hào)為 , 和 為學(xué)習(xí)的增益矩陣,滿(mǎn)足 , , , , 。 通過(guò)控制律(9.38),使?fàn)顟B(tài)變量 、控制輸入 、系統(tǒng)輸出 分別收斂于期望值。1121( )( )( ) (1)( )( )iiiikkkkkkuuLeLed( )( )( )iikkkeyy1( )kL2( )kL11L|( )|kbL22L|( )|kbLkN1L0b2L0b( )ikq( )iku( )iky 定理定理 1:考慮離散系統(tǒng)(:考慮離散系統(tǒng)(9.32)和()和(9.33),滿(mǎn)足假設(shè)),滿(mǎn)足假設(shè)1-3,采用控制,采用控制律(律(9.38),則),則 (9.39) 對(duì)于所有對(duì)于所有 都成立。如果忽略狀態(tài)

36、干擾,輸出噪聲和初始都成立。如果忽略狀態(tài)干擾,輸出噪聲和初始狀態(tài)誤差(即狀態(tài)誤差(即 ),則分別收斂于期望值。如果考慮干擾),則分別收斂于期望值。如果考慮干擾、噪聲和誤差的存在,則、噪聲和誤差的存在,則 , , 有界,且收斂于有界,且收斂于 的函數(shù)。的函數(shù)。 證明:證明:由式由式(9.349.34)和)和(9.329.32)得:)得: 1|( ) (, )|1ikkILB q(, )nikRNq0q0bbbd|( )( )|ikkuud|( )( )|ikkqqd|( )( )|ikkyy0q,b b b (9.40) 考慮性質(zhì)2和3及假設(shè)1和2,得 令 ,則 對(duì)上式進(jìn)行遞推并考慮假設(shè)3,得:

37、 (9.41) dddddddddd111,iiiiiiiiiiiiiiikkkkkkkkkkkkkkkkq kkkkkkkkkkkkkkkkqqqqB quqB quqB quBuuuqB qB quB qu dBuB1iiiikkc bkbkbqqqud2Bu1hc b 2B1iiikhkbkbqqu 0112B2q0kkjkiijkhbjbh b qu由(9.38)式得:1d1d1211d2d11d2d111dd( )( )( )( )( )( ) (1)( )( )( )( )(1)(1)( )( )( )( )( )(1)(1)(1)( )( )( )( )( )( )( )( ),

38、 )iiiiiiiiiiiiiikkkkkkkkkkkkkkkkkkkkkkkkkkkkk kuuuuuLeLeuLyyLyyuLqqLqquLqB qud121111dddd112111( )( )( ), )( ) ( )( )(1)( )( )(1)( )( )( )( )( ), )( )( ), )( )( )( ) ( )( )( )( )( )(1)( )(iiiiiiiiiiiiiiiikkk kkkkkkkkkkkkk kkk kkkkkkkkkkkkqB quLLquLqLB quB quuuLLquL11dd211121111dd211)( )( ) ( ), )( )(

39、 )( ), )( ( ), )( ) ( )( )( )( )( )( )( )( ) ( ), )( )( )( )( )( ), )( ), )( ) ( )( )( )iiiiiiiiiiiiikkk kkkk kq k kkkkkkkkkkk kkkkkk kk kkkkkqLB quLB qBuLqLLILB quLqLB qB quLqL121( )( )( )( )iiikkkkL 利用性質(zhì)2和假設(shè)2,得 令 , ,則 將(9.39)和(9.41)代入上式,得11d21211LLBuL1LL( )( ) ( ), )( )( )( )( )()iiiiiikkkkkbkb c

40、bkbkbbbb buILB quqqq1d11LBuL2(1)hbc bb h121LL()bbbbb b2111L11( )( ) ( ), )( )( )( )iiiiikkk kkhkbkbuILB quqq02011112B2011L2B12q10( )( )( )( )kkjkiiiqjkkjkijkkhhbjbh bbhbjbh bb uuuu 因此 上式兩端同乘,取范數(shù),得20211112112B011L2B10( )( )( )( )kkkjiiLqijkkjijkkhbh bbhhbjbbhbjb uuuu202211Lq11121B011L2B1011( )( )()111( )11( )kkkiikjkjjkijkjjkijhkkhbbhhbbjbbhbjb

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論