第9章迭代算法

上傳人：v*** IP屬地：湖北上傳時(shí)間：2022-02-03 格式：PPT 頁數(shù)：58 大小：808KB 積分：30 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩53頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第第9章章迭代學(xué)習(xí)控制迭代學(xué)習(xí)控制實(shí)際控制中存在一類軌跡跟蹤問題，它的控制任務(wù)是尋找控制律，使得被控對象輸出在有限時(shí)間上沿著整個(gè)期望軌跡實(shí)現(xiàn)零誤差軌跡跟蹤。這列跟蹤問題是具有挑戰(zhàn)性的控制問題。人們在處理實(shí)際場合中的重復(fù)操作任務(wù)時(shí)，往往依據(jù)對象的可重復(fù)動(dòng)態(tài)行為與期望行為的差距來調(diào)整決策。通過重復(fù)操作，使得對象行為與期望行為的配合達(dá)到要求。這時(shí)，衡量動(dòng)態(tài)行為的指標(biāo)是某種滿意指標(biāo)。 u t y t0,T 迭代學(xué)習(xí)控制（迭代學(xué)習(xí)控制（ILC,Iterative Learning Control）的思想最初由）的思想最初由日本學(xué)者日本學(xué)者Uchiyama于于1978年提出，于年提出，于19

2、84年由年由Arimoto等人做出了等人做出了開創(chuàng)性的研究。這些學(xué)者借鑒人們在重復(fù)過程中追求滿意指標(biāo)達(dá)到期開創(chuàng)性的研究。這些學(xué)者借鑒人們在重復(fù)過程中追求滿意指標(biāo)達(dá)到期望行為的簡單原理，成功地使得具有強(qiáng)耦合非線性多變量的工業(yè)機(jī)器望行為的簡單原理，成功地使得具有強(qiáng)耦合非線性多變量的工業(yè)機(jī)器人快速高精度地執(zhí)行軌跡跟蹤任務(wù)。其基本做法是對于一個(gè)在有限時(shí)人快速高精度地執(zhí)行軌跡跟蹤任務(wù)。其基本做法是對于一個(gè)在有限時(shí)間區(qū)間上執(zhí)行軌跡跟蹤任務(wù)的機(jī)器人，利用前一次或前幾次操作時(shí)測間區(qū)間上執(zhí)行軌跡跟蹤任務(wù)的機(jī)器人，利用前一次或前幾次操作時(shí)測得的誤差信息修正控制輸入，使得該重復(fù)任務(wù)在下一次操作過程中做得的誤差信息修

3、正控制輸入，使得該重復(fù)任務(wù)在下一次操作過程中做得更好。如此不斷重復(fù)，直至在整個(gè)時(shí)間區(qū)間上輸出軌跡跟蹤上期望得更好。如此不斷重復(fù)，直至在整個(gè)時(shí)間區(qū)間上輸出軌跡跟蹤上期望軌跡。軌跡。迭代學(xué)習(xí)控制適合于具有重復(fù)運(yùn)動(dòng)性質(zhì)的被控對象，通過迭代修迭代學(xué)習(xí)控制適合于具有重復(fù)運(yùn)動(dòng)性質(zhì)的被控對象，通過迭代修正達(dá)到某種控制目標(biāo)的改善。迭代學(xué)習(xí)控制方法不依賴于系統(tǒng)的精確正達(dá)到某種控制目標(biāo)的改善。迭代學(xué)習(xí)控制方法不依賴于系統(tǒng)的精確數(shù)學(xué)模型，能在給定的時(shí)間范圍內(nèi)數(shù)學(xué)模型，能在給定的時(shí)間范圍內(nèi),以非常簡單的算法實(shí)現(xiàn)不確定性以非常簡單的算法實(shí)現(xiàn)不確定性高的非線性強(qiáng)耦合動(dòng)態(tài)系統(tǒng)的控制，并高精度跟蹤給定期望軌跡，因高的非線性

4、強(qiáng)耦合動(dòng)態(tài)系統(tǒng)的控制，并高精度跟蹤給定期望軌跡，因而一經(jīng)推出，就在運(yùn)動(dòng)控制領(lǐng)域得到了廣泛的運(yùn)用。而一經(jīng)推出，就在運(yùn)動(dòng)控制領(lǐng)域得到了廣泛的運(yùn)用。迭代學(xué)習(xí)控制方法具有很強(qiáng)的工程背景，這些背景包括：執(zhí)行諸迭代學(xué)習(xí)控制方法具有很強(qiáng)的工程背景，這些背景包括：執(zhí)行諸如焊接、噴涂、裝配、搬運(yùn)等重復(fù)任務(wù)的工業(yè)機(jī)器人；指令信號(hào)為周如焊接、噴涂、裝配、搬運(yùn)等重復(fù)任務(wù)的工業(yè)機(jī)器人；指令信號(hào)為周期函數(shù)的伺服系統(tǒng)；數(shù)控機(jī)床；磁盤光盤驅(qū)動(dòng)系統(tǒng)；機(jī)械制造中使用期函數(shù)的伺服系統(tǒng)；數(shù)控機(jī)床；磁盤光盤驅(qū)動(dòng)系統(tǒng)；機(jī)械制造中使用的坐標(biāo)測量機(jī)等。的坐標(biāo)測量機(jī)等。由于迭代學(xué)習(xí)控制模擬了人腦學(xué)習(xí)和自我調(diào)節(jié)的功能，因而是一種典型的智能控

5、制方法。經(jīng)歷了三十多年的發(fā)展，迭代學(xué)習(xí)控制已成為智能控制中具有嚴(yán)格數(shù)學(xué)描述的一個(gè)分支。目前,迭代學(xué)習(xí)控制在學(xué)習(xí)算法、收斂性、魯棒性、學(xué)習(xí)速度及工程應(yīng)用研究上取得了很大的進(jìn)展。 9.1 基本原理基本原理設(shè)被控對象的動(dòng)態(tài)過程為， (9.1)( )( ( ), ( ), )tftt txxu( )( ( ), ( ), )tgtt tyxu 式中，、、分別為系統(tǒng)的狀態(tài)，輸出和輸入變量，、、為適當(dāng)維數(shù)的向量函數(shù)，其結(jié)構(gòu)與參數(shù)均未知。若期望控制存在,則迭代學(xué)習(xí)控制的目標(biāo)為：給定期望輸出和每次運(yùn)行的初始狀態(tài) ,要求在給定的時(shí)間內(nèi),按照一定的學(xué)習(xí)控制算法通過多次重復(fù)的運(yùn)行,使控制輸入

6、，而系統(tǒng)輸出第k 次運(yùn)行時(shí)，式(9.1) 表示為： (9.2) 跟蹤誤差為 (9.3) nxRmyRruR( )f( )gd( ) tud( ) ty(0)kx0,tTd( )( )kttuud( )( )kttyy( )( ),( ), )kkktftt txxu( )( ),( ), )kkktgtt tyxud( )( )( )kkttteyy 迭代學(xué)習(xí)控制可分為開環(huán)學(xué)習(xí)和閉環(huán)學(xué)習(xí)。開環(huán)學(xué)習(xí)控制的方法是：第k+1次的控制等于第k次控制再加上第k次輸出誤差的校正項(xiàng)，即 (9.4) 閉環(huán)學(xué)習(xí)策略是：取第K+1次運(yùn)行的誤差作為學(xué)習(xí)的修正項(xiàng)，即 (9.5) 式中，L為線性或非線性算子。1(

7、)L( ),( )kkktttuue11( )L( ),( )kkktttuue 9.2 基本迭代學(xué)習(xí)控制算法基本迭代學(xué)習(xí)控制算法 Arimoto 等首先給出了線性時(shí)變連續(xù)系統(tǒng)的等首先給出了線性時(shí)變連續(xù)系統(tǒng)的D型迭代學(xué)習(xí)控制律型迭代學(xué)習(xí)控制律 (9.6) 式中，式中，為常數(shù)增益矩陣。在為常數(shù)增益矩陣。在D 型算法的基礎(chǔ)上，相繼出現(xiàn)了型算法的基礎(chǔ)上，相繼出現(xiàn)了P 型、型、PI 型、型、PD 型迭代學(xué)習(xí)控制律。從一般意義來看它們都是型迭代學(xué)習(xí)控制律。從一般意義來看它們都是PID型迭代型迭代學(xué)習(xí)控制律的特殊形式，學(xué)習(xí)控制律的特殊形式，PID迭代學(xué)習(xí)控制律表示為迭代學(xué)習(xí)控制律表示為 (9.7) 式中

8、式中, 、、為學(xué)習(xí)增益矩陣。算法中的誤差信息使用稱為開環(huán)迭為學(xué)習(xí)增益矩陣。算法中的誤差信息使用稱為開環(huán)迭代學(xué)習(xí)控制，如果使用代學(xué)習(xí)控制，如果使用則稱為閉環(huán)迭代學(xué)習(xí)控制，如果同時(shí)使用和則稱為閉環(huán)迭代學(xué)習(xí)控制，如果同時(shí)使用和則稱為開閉環(huán)迭代學(xué)習(xí)控制。則稱為開閉環(huán)迭代學(xué)習(xí)控制。1( )( )( )kkktttuue 1d( )( )( )( )( )tkkkkktttt0uueee 此外，還有高階迭代學(xué)習(xí)控制算法、最優(yōu)迭代學(xué)習(xí)控制算法、遺忘因子迭此外，還有高階迭代學(xué)習(xí)控制算法、最優(yōu)迭代學(xué)習(xí)控制算法、遺忘因子迭代學(xué)習(xí)控制算法和反饋代學(xué)習(xí)控制算法和反饋-前饋迭代學(xué)習(xí)控制算法等。前饋迭代學(xué)習(xí)控制算法

9、等。 9.3 迭代學(xué)習(xí)控制的關(guān)鍵技術(shù)迭代學(xué)習(xí)控制的關(guān)鍵技術(shù) 9.3.1 學(xué)習(xí)算法的穩(wěn)定性和收斂性學(xué)習(xí)算法的穩(wěn)定性和收斂性穩(wěn)定性與收斂性問題是研究當(dāng)學(xué)習(xí)律與被控系統(tǒng)滿足什么條件時(shí)，迭代穩(wěn)定性與收斂性問題是研究當(dāng)學(xué)習(xí)律與被控系統(tǒng)滿足什么條件時(shí)，迭代學(xué)習(xí)控制過程才是穩(wěn)定收斂的。算法的穩(wěn)定性保證了隨著學(xué)習(xí)次數(shù)的增加，學(xué)習(xí)控制過程才是穩(wěn)定收斂的。算法的穩(wěn)定性保證了隨著學(xué)習(xí)次數(shù)的增加，控制系統(tǒng)不發(fā)散，但是，對于學(xué)習(xí)控制系統(tǒng)而言，僅僅穩(wěn)定是沒有實(shí)際意義控制系統(tǒng)不發(fā)散，但是，對于學(xué)習(xí)控制系統(tǒng)而言，僅僅穩(wěn)定是沒有實(shí)際意義的，只有使學(xué)習(xí)過程收斂到真值，才能保證得到的控制為某種意義下最優(yōu)的的，只有使學(xué)習(xí)過程收斂到

10、真值，才能保證得到的控制為某種意義下最優(yōu)的控制。收斂是對學(xué)習(xí)控制的最基本的要求，多數(shù)學(xué)者在提出新的學(xué)習(xí)律的同控制。收斂是對學(xué)習(xí)控制的最基本的要求，多數(shù)學(xué)者在提出新的學(xué)習(xí)律的同時(shí)，基于被控對象的一些假設(shè)，給出了收斂的條件。例如，時(shí)，基于被控對象的一些假設(shè)，給出了收斂的條件。例如，Arimoto在最初在最初提出提出PID型學(xué)習(xí)控制律時(shí)，僅針對線性系統(tǒng)在型學(xué)習(xí)控制律時(shí)，僅針對線性系統(tǒng)在D型學(xué)習(xí)律下的穩(wěn)定性和收斂條型學(xué)習(xí)律下的穩(wěn)定性和收斂條件作了證明件作了證明 9.3.2 初始值問題初始值問題運(yùn)用迭代學(xué)習(xí)控制技術(shù)設(shè)計(jì)控制器時(shí)，只需要通過重復(fù)操作獲得的受控運(yùn)用迭代學(xué)習(xí)控制技術(shù)設(shè)計(jì)控制器時(shí)，只需要通過重

11、復(fù)操作獲得的受控對象的誤差或誤差導(dǎo)數(shù)信號(hào)。在這種控制技術(shù)中，迭代學(xué)習(xí)總要從某初始點(diǎn)對象的誤差或誤差導(dǎo)數(shù)信號(hào)。在這種控制技術(shù)中，迭代學(xué)習(xí)總要從某初始點(diǎn)開始，初始點(diǎn)指初始狀態(tài)或初始輸出。幾乎所有的收斂性證明都要求初始條開始，初始點(diǎn)指初始狀態(tài)或初始輸出。幾乎所有的收斂性證明都要求初始條件是相同的，解決迭代學(xué)習(xí)控制理論中的初始條件問題一直是人們追求的目件是相同的，解決迭代學(xué)習(xí)控制理論中的初始條件問題一直是人們追求的目標(biāo)之一。目前已提出的迭代學(xué)習(xí)控制算法大多數(shù)要求被控系統(tǒng)每次運(yùn)行時(shí)的標(biāo)之一。目前已提出的迭代學(xué)習(xí)控制算法大多數(shù)要求被控系統(tǒng)每次運(yùn)行時(shí)的初始狀態(tài)在期望軌跡對應(yīng)的初始狀態(tài)上，即滿足初始條件：初始

12、狀態(tài)在期望軌跡對應(yīng)的初始狀態(tài)上，即滿足初始條件：（9.8）當(dāng)系統(tǒng)的初始狀態(tài)不在期望軌跡上，而在期望軌跡的某一很小的鄰域內(nèi)當(dāng)系統(tǒng)的初始狀態(tài)不在期望軌跡上，而在期望軌跡的某一很小的鄰域內(nèi)時(shí)，通常把這類問題歸結(jié)為學(xué)習(xí)控制的魯棒性問題研究。時(shí)，通常把這類問題歸結(jié)為學(xué)習(xí)控制的魯棒性問題研究。d(0)(0),0,1,2,kxxk 9.3.3 學(xué)習(xí)速度問題學(xué)習(xí)速度問題在迭代學(xué)習(xí)算法研究中，其收斂條件基本上都是在學(xué)習(xí)次數(shù)在迭代學(xué)習(xí)算法研究中，其收斂條件基本上都是在學(xué)習(xí)次數(shù) 下給出的。而在實(shí)際應(yīng)用場合，學(xué)習(xí)次數(shù)下給出的。而在實(shí)際應(yīng)用場合，學(xué)習(xí)次數(shù) 顯然是沒有任何實(shí)際顯然是沒有任何實(shí)際意義的。因此，如何使迭

13、代學(xué)習(xí)過程更快地收斂于期望值是迭代學(xué)習(xí)意義的。因此，如何使迭代學(xué)習(xí)過程更快地收斂于期望值是迭代學(xué)習(xí)控制研究中的另一個(gè)重要問題。控制研究中的另一個(gè)重要問題。迭代學(xué)習(xí)控制本質(zhì)上是一種前饋控制技術(shù)，大部分學(xué)習(xí)律盡管證迭代學(xué)習(xí)控制本質(zhì)上是一種前饋控制技術(shù)，大部分學(xué)習(xí)律盡管證明了學(xué)習(xí)收斂的充分條件，但收斂速度還是很慢?？衫枚啻螌W(xué)習(xí)過明了學(xué)習(xí)收斂的充分條件，但收斂速度還是很慢?？衫枚啻螌W(xué)習(xí)過程中得到的知識(shí)來改進(jìn)后續(xù)學(xué)習(xí)過程的速度，例如，采用高階迭代控程中得到的知識(shí)來改進(jìn)后續(xù)學(xué)習(xí)過程的速度，例如，采用高階迭代控制算法、帶遺忘因子的學(xué)習(xí)律、利用當(dāng)前項(xiàng)或反饋配置等方法來構(gòu)造制算法、帶遺忘因子的學(xué)習(xí)律、利用

14、當(dāng)前項(xiàng)或反饋配置等方法來構(gòu)造學(xué)習(xí)律，可使收斂速度大大加快。學(xué)習(xí)律，可使收斂速度大大加快。k k 9.3.4 魯棒性問題魯棒性問題迭代學(xué)習(xí)控制理論的提出有濃厚的工程背景，因此僅僅在無干擾迭代學(xué)習(xí)控制理論的提出有濃厚的工程背景，因此僅僅在無干擾條件下討論收斂性問題是不夠的，還應(yīng)討論存在各種干擾的情形下系條件下討論收斂性問題是不夠的，還應(yīng)討論存在各種干擾的情形下系統(tǒng)的跟蹤性能。一個(gè)實(shí)際運(yùn)行的迭代學(xué)習(xí)控制系統(tǒng)除了存在初始偏移統(tǒng)的跟蹤性能。一個(gè)實(shí)際運(yùn)行的迭代學(xué)習(xí)控制系統(tǒng)除了存在初始偏移外，還或多或少存在狀態(tài)擾動(dòng)、測量噪聲、輸入擾動(dòng)等各種干擾。魯外，還或多或少存在狀態(tài)擾動(dòng)、測量噪聲、輸入擾動(dòng)等各種干擾。

15、魯棒性問題討論存在各種干擾時(shí)迭代學(xué)習(xí)控制系統(tǒng)的跟蹤性能。具體地棒性問題討論存在各種干擾時(shí)迭代學(xué)習(xí)控制系統(tǒng)的跟蹤性能。具體地說，一個(gè)迭代學(xué)習(xí)控制系統(tǒng)是魯棒的，是指系統(tǒng)在各種有界干擾的影說，一個(gè)迭代學(xué)習(xí)控制系統(tǒng)是魯棒的，是指系統(tǒng)在各種有界干擾的影響下，其迭代軌跡能收斂到期望軌跡的鄰域內(nèi)，而當(dāng)這些干擾消除時(shí)響下，其迭代軌跡能收斂到期望軌跡的鄰域內(nèi)，而當(dāng)這些干擾消除時(shí)，迭代軌跡會(huì)收斂到期望軌跡。，迭代軌跡會(huì)收斂到期望軌跡。 9.4 機(jī)械手軌跡跟蹤迭代學(xué)習(xí)控制仿真實(shí)例機(jī)械手軌跡跟蹤迭代學(xué)習(xí)控制仿真實(shí)例 9.4.1控制器設(shè)計(jì)控制器設(shè)計(jì) 考慮一個(gè)關(guān)節(jié)的機(jī)器人，其動(dòng)態(tài)性能可以由以下二階非線性微分方考慮一個(gè)關(guān)節(jié)

16、的機(jī)器人，其動(dòng)態(tài)性能可以由以下二階非線性微分方程描述：程描述：（9.9）式中：式中：為關(guān)節(jié)角位移量，為關(guān)節(jié)角位移量，為機(jī)器人的慣性矩陣，為機(jī)器人的慣性矩陣，表示離心力和哥氏力，表示離心力和哥氏力，為重力項(xiàng)，為重力項(xiàng)，為控制力矩，為控制力矩，為各為各種誤差和擾動(dòng)。種誤差和擾動(dòng)。設(shè)系統(tǒng)所要跟蹤的期望軌跡為設(shè)系統(tǒng)所要跟蹤的期望軌跡為，。系統(tǒng)第次輸出為。系統(tǒng)第次輸出為令令。 d, D q qC q q qG qnqR n nD qR,nC q qR nG qRnRdnR dty0,tT ity diittteyy 在學(xué)習(xí)開始時(shí)，系統(tǒng)的初始狀態(tài)為。學(xué)習(xí)控制的任務(wù)為通過學(xué)習(xí)控制

17、律設(shè)計(jì) ，使第次運(yùn)動(dòng)誤差減少。采用三種基于反饋的迭代學(xué)習(xí)控制律：（1）閉環(huán)D型（9.10）（2）閉環(huán)PD型：（9.11）（3）指數(shù)變增益D型：（9.12） 00 x 1uit1i 1eit 1dd1kkkttttuuKqq 1pd1dd1kkkkttttttuuKqqKqq 1pd1dd1kkkkttttttuuKqqKqq 9.4.2 仿真實(shí)例仿真實(shí)例針對二關(guān)節(jié)機(jī)械手，介紹一種機(jī)器人針對二關(guān)節(jié)機(jī)械手，介紹一種機(jī)器人PD型反饋迭代學(xué)習(xí)控制的仿型反饋迭代學(xué)習(xí)控制的仿真設(shè)計(jì)方法。針對二關(guān)節(jié)機(jī)器人控制系統(tǒng)式（真設(shè)計(jì)方法。針對二關(guān)節(jié)機(jī)器人控制系統(tǒng)式（9.9），各項(xiàng)表示為：），各項(xiàng)表

18、示為： 2 2ijdD2221111212122122coscccdd ldlll lqII21221221222cosccdddll lql222222cdd lI2 2ijcC112chq1212chqhq211chq 220c2 122sinchm l lq T12GGG 干擾項(xiàng)為機(jī)器人系統(tǒng)參數(shù)為，，，采用三種閉環(huán)迭代學(xué)習(xí)控制律，其中為D型迭代學(xué)習(xí)控制，為PD型迭代學(xué)習(xí)控制，為變增益指數(shù)D型迭代學(xué)習(xí)控制。兩個(gè)關(guān)節(jié)的位置指令分別為和，為了保證被控對象初始輸出與指令初值一致，取被控對象的初始狀態(tài)為。取PD型迭代學(xué)習(xí)控制，即，仿真結(jié)果如圖9-1至圖9-3所示。1112

19、 112212gcosgcosccGd ld lqd lqq22212gcoscGd lqqTd0.3sin0.1 1 ett121 kgdd120.5mll120.25mccll2120.1 kg mII29.81 m/sg 1M 2M 3M sin(3 ) tcos(3 ) t T00310 x3M 圖圖9 9-1 20 20次迭代學(xué)習(xí)的跟蹤過程次迭代學(xué)習(xí)的跟蹤過程圖圖9-2 第第20次迭代學(xué)習(xí)的位置跟蹤次迭代學(xué)習(xí)的位置跟蹤圖圖9 9-3 20 20次迭代過程中誤差范數(shù)的收斂過程次迭代過程中誤差范數(shù)的收斂過程 9.5 線性時(shí)變連續(xù)系統(tǒng)迭代學(xué)習(xí)控制線性時(shí)變連續(xù)系統(tǒng)迭代學(xué)習(xí)控制 9.5.1 系

20、統(tǒng)描述系統(tǒng)描述 Arimoto等給出了線性時(shí)變連續(xù)系統(tǒng)等給出了線性時(shí)變連續(xù)系統(tǒng) （9.13）的開環(huán)的開環(huán)PID型迭代學(xué)習(xí)控制律：型迭代學(xué)習(xí)控制律：（9.14）其中其中，，為學(xué)習(xí)增益矩陣。為學(xué)習(xí)增益矩陣。 ttttttttxAxBuyCx 1dddkkktttttuuLeL 9.5.2 控制器設(shè)計(jì)及收斂性分析控制器設(shè)計(jì)及收斂性分析定理定理1 若由式（若由式（9.13）和式（）和式（9.14）式描述的系統(tǒng)滿足如下條件：）式描述的系統(tǒng)滿足如下條件：（1）；（2）每次迭代初始條件一致，即）每次迭代初始條件一致，即則當(dāng)則當(dāng) 時(shí)，有時(shí)，有，。證明：證明：由式（由式（9.13）及條件

21、式（）及條件式（2）得）得則則，即系統(tǒng)滿足初始條件。，即系統(tǒng)滿足初始條件。 1tttICB 00d01,2,3,00 xxyykkk dyyktt0,tT 110000yCxCxykkkk 000,1,2,kke 非齊次一階線性微分方程的解為：取，則由于，，則 tttttxAxBu 000000expdexpdexpd dexpexpexpdexpexpdtttttttttt xCAABuACAABuACAABu,expttA 110,dtkkkktttxxBuu deyykkttt 1d1eyykkttt 11110,deeyyCxxCBuukkkkkktkkttttttttt

22、即將PID型控制律式（9.14）代入上式，則第k+1次輸出的誤差為：（9.15）利用分部積分公式，令，有（9.16）將式（9.16）代入式（9.15），得（9.17） 110,deeCBuutkkkktttt 100,ddeeCBeLeetkkkkktttt ,GCBtt 0000d,d,dtttkkktkktttttCBeGeGeCBeGe 1000 0,d,d,d deI CBeGeCBLeCBetkkkttkktttttttttt 將式（9.17）兩端取范數(shù)，有（9.18）式中根據(jù) 范數(shù)的定義可知，函數(shù) 的范數(shù)為。將式（9.18）兩端同乘以，，并考慮到有 10

23、00 01200 0,d,d,d ddd deI CBeGeCBLeCBeI CBeeetkkkttkkttkkkttttttttttttttbb 1,0,0,maxsup, sup,tTtTbtttGCBL 2,0,sup,CBtTbtt: 0,nfTR 0supett Tff t expt00exp1expdtt （9.19）根據(jù) 范數(shù)的定義，函數(shù) 的范數(shù)為：由于，，，則有。將式（9.19）的結(jié)果應(yīng)用于下式，得： 1110001111expdexpexpexpdexpexpd1 expexp1expexpexp11 exptttkkkkkkktbtbbtttbbtttbTbee

24、eeeee: 0,nfTR 0suptt Tff te 0,tT 0,t 0, kkee其中。即（9.20） 22000020202022expd dexpexpexpd d1 expexpexpd1 expexpexpd1 expexpexpd1 expexp1exp1 exp1 exttkktktktkkktbtbTtbTbtTbtTtbtTb eeeeeee 22p1 expktTbe1 exp1 exp0tT 222001expexpd dtkkTtbb ee 則（9.19）和（9.20）代入（9.18），得（9.21）其中。由于，則當(dāng) 取足夠大時(shí)，可以使。因此。定

25、理得證。如果將控制律式（9.14）中的改為，則為閉環(huán)PID型迭代學(xué)習(xí)控制律。同定理1的證明過程，可證明閉環(huán)PID迭代學(xué)習(xí)控制律。1eekk 2121 exp1 expTTbb11lim0ekk e k1e k 9.5.3 仿真實(shí)例仿真實(shí)例考慮考慮2輸入輸入2輸出線性系統(tǒng)：輸出線性系統(tǒng)：期望跟蹤軌跡為期望跟蹤軌跡為 11122223111101x tx tu txtxtut 11222001y tx tytxt 1d2dsin(3 )cos(3 )ytttyt0,1t 由于，取，可滿足定理1中的條件（1），在控制律式（9.14）中取，，系統(tǒng)的初始狀態(tài)為。在chap9_2si

26、m.mdl程序中，選擇Simulink的Manual Switch開關(guān)，將開關(guān)向下，取PD型開環(huán)迭代學(xué)習(xí)控制律，仿真結(jié)果見圖9-4至9-6所示。將開關(guān)向上，采用PD型閉環(huán)迭代學(xué)習(xí)控制律，仿真結(jié)果見圖9-7至9-9所示?？梢姡]環(huán)收斂速度好于開環(huán)收斂速度。2201CB0.95000.952.0002.0L0 1 02 00010 xx 圖圖9-4 30次迭代學(xué)習(xí)的跟蹤過程次迭代學(xué)習(xí)的跟蹤過程（開環(huán)（開環(huán)PD控制）控制）圖圖9-5 第第30次迭代學(xué)習(xí)的位置跟次迭代學(xué)習(xí)的位置跟蹤（開環(huán)蹤（開環(huán)PD控制控制）圖圖9-6 30次迭代過程中誤差最大絕對次迭代過程中誤差最大絕對值的收斂過程（開環(huán)值的收斂過程

27、（開環(huán)PD控制）控制）圖圖9-7 30次迭代學(xué)習(xí)的跟蹤過程次迭代學(xué)習(xí)的跟蹤過程（閉環(huán)（閉環(huán)PD控制）控制）圖圖9-8 第第30次迭代學(xué)習(xí)的位置跟次迭代學(xué)習(xí)的位置跟蹤（閉環(huán)蹤（閉環(huán)PD控制）控制）圖圖9-9 30次迭代過程中誤差最大絕對值次迭代過程中誤差最大絕對值的收斂過程（閉環(huán)的收斂過程（閉環(huán)PD控制）控制） 9.6 移動(dòng)機(jī)器人軌跡跟蹤迭代學(xué)習(xí)控制移動(dòng)機(jī)器人軌跡跟蹤迭代學(xué)習(xí)控制移動(dòng)機(jī)器人是一種在復(fù)雜的環(huán)境下工作的具有自規(guī)劃、自組織、自移動(dòng)機(jī)器人是一種在復(fù)雜的環(huán)境下工作的具有自規(guī)劃、自組織、自適應(yīng)能力的機(jī)器人。在移動(dòng)機(jī)器人的相關(guān)技術(shù)研究中，控制技術(shù)是其適應(yīng)能力的機(jī)器人。在移動(dòng)機(jī)器人的相關(guān)技術(shù)研

28、究中，控制技術(shù)是其核心技術(shù)，也是其實(shí)現(xiàn)真正的智能化和完全的自主移動(dòng)的關(guān)鍵技術(shù)。核心技術(shù)，也是其實(shí)現(xiàn)真正的智能化和完全的自主移動(dòng)的關(guān)鍵技術(shù)。移動(dòng)機(jī)器人具有時(shí)變、強(qiáng)耦合和非線性的動(dòng)力學(xué)特征，由于測量和建移動(dòng)機(jī)器人具有時(shí)變、強(qiáng)耦合和非線性的動(dòng)力學(xué)特征，由于測量和建模的不精確，加上負(fù)載的變化以及外部擾動(dòng)的影響，實(shí)際上無法得到模的不精確，加上負(fù)載的變化以及外部擾動(dòng)的影響，實(shí)際上無法得到移動(dòng)機(jī)器人精確、完整的運(yùn)動(dòng)模型。移動(dòng)機(jī)器人精確、完整的運(yùn)動(dòng)模型。通過對文通過對文27的控制方法進(jìn)行詳細(xì)推導(dǎo)及仿真分析，研究一類移動(dòng)機(jī)的控制方法進(jìn)行詳細(xì)推導(dǎo)及仿真分析，研究一類移動(dòng)機(jī)器人迭代學(xué)習(xí)離散控制的設(shè)計(jì)及仿真方法。器人

29、迭代學(xué)習(xí)離散控制的設(shè)計(jì)及仿真方法。 9.6.1 數(shù)學(xué)基礎(chǔ)數(shù)學(xué)基礎(chǔ) 代表代表N維歐氏空間，定義向量范數(shù)為：維歐氏空間，定義向量范數(shù)為：（9.22) 其中其中為為( )階實(shí)數(shù)矩陣，定義矩陣范數(shù)為：階實(shí)數(shù)矩陣，定義矩陣范數(shù)為：（9.23) 其中其中為矩陣的最大特征值。為矩陣的最大特征值。取取， , ，定義范數(shù)為：，定義范數(shù)為：（9.249.24)nR1/2Tzz znRzp mRCpmT|maxCC C max1,Nndizzz, ,zq u y 1| ( ), 1supkk Nkzz:z NR 9.6.2 系統(tǒng)描述圖9-10為移動(dòng)機(jī)器人運(yùn)動(dòng)模型，它在同一根軸上有兩個(gè)獨(dú)立的推進(jìn)輪，機(jī)器

30、人在二維空間移動(dòng)，點(diǎn)代表機(jī)器人的當(dāng)前位置，廣義坐標(biāo)定義為，和為直角坐標(biāo)系下的坐標(biāo)，為機(jī)器人的方位角。當(dāng)機(jī)器人的標(biāo)定方向?yàn)榈乩碜鴺?biāo)系的橫軸正半軸時(shí)，定義為0。移動(dòng)機(jī)器人受不完全約束的影響而只能在驅(qū)動(dòng)輪軸的方向運(yùn)動(dòng)，點(diǎn)的線速度和角速度定義為和。圖圖9-10 移動(dòng)機(jī)器人運(yùn)動(dòng)模型移動(dòng)機(jī)器人運(yùn)動(dòng)模型根據(jù)圖9-10，針對P點(diǎn)，移動(dòng)機(jī)器人的離散運(yùn)動(dòng)學(xué)方程可由下式描述（9.25）其中為采樣時(shí)間，機(jī)器人狀態(tài)向量為，速度向量為。式（9.25）可寫為：（9.26）其中（9.27）pppppppppp(1)( )cos( )0( )(1)( )sin( )0( )(1)( )01x kx kkv

31、 ky ky kTkkkkTTppp( )( ),( ),( )kx ky kkqTppp( )( ),( )kv kkup(1)( )( ( ), )( )kkk kkqqB qupppcos( )0( ), )sin( )001kk kTk B q 如圖9-10所示，期望軌跡為。運(yùn)動(dòng)軌跡跟蹤的控制問題就是為確定，使跟蹤。線速度和角速度誤差分別為：（9.28）（9.29）移動(dòng)機(jī)器人迭代學(xué)習(xí)控制系統(tǒng)結(jié)構(gòu)如圖9-11所示。dddd( )( ),( ),( ) , 1kx ky kkknpT( )( ),( )kv kku( )P kd( )P k pv kvkv kp( )( )

32、( )kkk 圖圖9-11 移動(dòng)機(jī)器人迭代學(xué)習(xí)控制系統(tǒng)結(jié)構(gòu)移動(dòng)機(jī)器人迭代學(xué)習(xí)控制系統(tǒng)結(jié)構(gòu)移動(dòng)機(jī)器人離散運(yùn)動(dòng)學(xué)方程可描述如下：移動(dòng)機(jī)器人離散運(yùn)動(dòng)學(xué)方程可描述如下：（9.30) （9.31)(1)( )( ( ), ) ( )( ),kkkkkkqqB qu( )( )( )kkkyq其中為狀態(tài)干擾，為輸出測量噪聲，為系統(tǒng)輸出，。考慮迭代過程，由（9.30）和（9.31）可得：（9.32）（9.33）其中為迭代次數(shù)，為離散時(shí)間，。，分別代表第次迭代的狀態(tài)、輸入、輸出、狀態(tài)干擾和輸出噪聲。機(jī)器人運(yùn)動(dòng)方程（9.32）和（9.33）滿足下列性質(zhì)和假設(shè)：性質(zhì)1：考慮理想情況

33、，取均為零，，則期望軌跡的方程可寫為（9.34）（9.35）( )k( )kT( )( ), ( ), ( )kx ky kky( )( ),( )kv kkTu(1)( )( ), )( )( ),iiiiikkk kkkqqB qu( )( )( )iiikkkyqik1,kn( )ikq( ),( ),( ),( )iiiikkkkuyi( ),( )iikkkNdddd(1)( )(q ( ), )( ),kkk kkqqBudd( )( ),kkyq 性質(zhì)2：矩陣函數(shù)滿足Lipschitz條件：，，為正常數(shù) （9.36）性質(zhì)3：矩陣是有界的 , ,為正常數(shù)，矩陣為

34、的滿秩矩陣。假設(shè)1: ；假設(shè)2：干擾和噪聲有界（9.37）其中，為正常數(shù)。假設(shè)3：在每一次迭代中，軌跡都是從的鄰域開始，即，，。12B12|(, )(, )|kkcB qB qqqkNBc( ( ), )iq k kBB|( ), )|ik kbB q( ), )ik kB q( ), )ik kqddu1max |( )|k nkb u11 k n11 k nmax max |( )| ,max max |( )|iiiikbkb bbd(0)q0dq|(0)(0)|ibqq0q0b1i 9.6.3 控制律設(shè)計(jì)及收斂性分析迭代學(xué)習(xí)控制律設(shè)計(jì)為：（9.38）對于第

35、i次迭代，跟蹤誤差信號(hào)為，和為學(xué)習(xí)的增益矩陣，滿足，，，，。通過控制律（9.38），使?fàn)顟B(tài)變量、控制輸入、系統(tǒng)輸出分別收斂于期望值。1121( )( )( ) (1)( )( )iiiikkkkkkuuLeLed( )( )( )iikkkeyy1( )kL2( )kL11L|( )|kbL22L|( )|kbLkN1L0b2L0b( )ikq( )iku( )iky 定理定理 1：考慮離散系統(tǒng)（：考慮離散系統(tǒng)（9.32）和（）和（9.33），滿足假設(shè)），滿足假設(shè)1-3，采用控制，采用控制律（律（9.38），則），則（9.39）對于所有對于所有都成立。如果忽略狀態(tài)

36、干擾，輸出噪聲和初始都成立。如果忽略狀態(tài)干擾，輸出噪聲和初始狀態(tài)誤差（即狀態(tài)誤差（即），則分別收斂于期望值。如果考慮干擾），則分別收斂于期望值。如果考慮干擾、噪聲和誤差的存在，則、噪聲和誤差的存在，則，，有界，且收斂于有界，且收斂于的函數(shù)。的函數(shù)。證明：證明：由式由式（9.349.34）和）和（9.329.32）得：）得： 1|( ) (, )|1ikkILB q(, )nikRNq0q0bbbd|( )( )|ikkuud|( )( )|ikkqqd|( )( )|ikkyy0q,b b b （9.40）考慮性質(zhì)2和3及假設(shè)1和2，得令，則對上式進(jìn)行遞推并考慮假設(shè)3，得：

37、（9.41） dddddddddd111,iiiiiiiiiiiiiiikkkkkkkkkkkkkkkkq kkkkkkkkkkkkkkkkqqqqB quqB quqB quBuuuqB qB quB qu dBuB1iiiikkc bkbkbqqqud2Bu1hc b 2B1iiikhkbkbqqu 0112B2q0kkjkiijkhbjbh b qu由（9.38）式得：1d1d1211d2d11d2d111dd( )( )( )( )( )( ) (1)( )( )( )( )(1)(1)( )( )( )( )( )(1)(1)(1)( )( )( )( )( )( )( )( ),

38、 )iiiiiiiiiiiiiikkkkkkkkkkkkkkkkkkkkkkkkkkkkk kuuuuuLeLeuLyyLyyuLqqLqquLqB qud121111dddd112111( )( )( ), )( ) ( )( )(1)( )( )(1)( )( )( )( )( ), )( )( ), )( )( )( ) ( )( )( )( )( )(1)( )(iiiiiiiiiiiiiiiikkk kkkkkkkkkkkkk kkk kkkkkkkkkkkkqB quLLquLqLB quB quuuLLquL11dd211121111dd211)( )( ) ( ), )( )(

39、 )( ), )( ( ), )( ) ( )( )( )( )( )( )( )( ) ( ), )( )( )( )( )( ), )( ), )( ) ( )( )( )iiiiiiiiiiiiikkk kkkk kq k kkkkkkkkkkk kkkkkk kk kkkkkqLB quLB qBuLqLLILB quLqLB qB quLqL121( )( )( )( )iiikkkkL 利用性質(zhì)2和假設(shè)2，得令，，則將（9.39）和（9.41）代入上式，得11d21211LLBuL1LL( )( ) ( ), )( )( )( )( )()iiiiiikkkkkbkb c

40、bkbkbbbb buILB quqqq1d11LBuL2(1)hbc bb h121LL()bbbbb b2111L11( )( ) ( ), )( )( )( )iiiiikkk kkhkbkbuILB quqq02011112B2011L2B12q10( )( )( )( )kkjkiiiqjkkjkijkkhhbjbh bbhbjbh bb uuuu 因此上式兩端同乘，取范數(shù)，得20211112112B011L2B10( )( )( )( )kkkjiiLqijkkjijkkhbh bbhhbjbbhbjb uuuu202211Lq11121B011L2B1011( )( )()111( )11( )kkkiikjkjjkijkjjkijhkkhbbhhbbjbbhbjb

人人文庫> 全部分類> 教育資料 > 備課教案

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

第9章迭代算法

文檔簡介

溫馨提示

最新文檔

評論

第9章 迭代算法

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔

第9章迭代算法