15自適應(yīng)迭代學(xué)習(xí)控制理論及其_第1頁
15自適應(yīng)迭代學(xué)習(xí)控制理論及其_第2頁
15自適應(yīng)迭代學(xué)習(xí)控制理論及其_第3頁
15自適應(yīng)迭代學(xué)習(xí)控制理論及其_第4頁
15自適應(yīng)迭代學(xué)習(xí)控制理論及其_第5頁
已閱讀5頁,還剩43頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、自適應(yīng)迭代學(xué)習(xí)控制理論及其應(yīng)用李俊民自適應(yīng)迭代學(xué)習(xí)控制理論及其應(yīng)用:信息世界中的控制科學(xué) 問題的背景及科學(xué)意義:研究方法及缺陷 亟待解決的關(guān)鍵問題 應(yīng)用前景信息世界中的控制科學(xué)控制指在工程系統(tǒng)中反饋和算法的運用 控制就是把反饋作為處理系統(tǒng)不確定性的工具??刂茊栴}和目標(biāo):調(diào)節(jié)問題和跟蹤問題控制系統(tǒng)的典型結(jié)構(gòu)圖控制科學(xué)的發(fā)展簡史從基于物理和(或)數(shù)學(xué)模型的控制理論到基于 信息的智能控制理論,再到基于行為化方法的一 般控制理論。經(jīng)典控制理論:SISO,數(shù)學(xué)工具:傳遞函數(shù)和復(fù)變函數(shù)理論。 現(xiàn)代控制理論:MIMO,數(shù)學(xué)工具:線性代數(shù),微分方程,隨 機過程、微分幾何,變分法及泛函分析等。智能控制理論:3C

2、問題,基礎(chǔ)工具:動力系統(tǒng),人工智能, 知識工程,神經(jīng)網(wǎng)絡(luò),模糊數(shù)學(xué),進(jìn)化算法、行為化理論等??刂圃?jīng)在過程工業(yè)、電力、通信、 父通和制造系統(tǒng)等起著基礎(chǔ)性的作用O 控制已經(jīng)在以下領(lǐng)域中取得成功的應(yīng) 用:控制科學(xué)成功應(yīng)用的領(lǐng)域 宇航飛行器的導(dǎo)航和控制:如商用飛機、制導(dǎo)導(dǎo)彈、先I進(jìn)的戰(zhàn)斗機、登陸飛行器和衛(wèi)星。這些控制系統(tǒng)提供了在存在大的環(huán)境和系統(tǒng)的不確定性的情況下,保證系統(tǒng) 的穩(wěn)定性和跟蹤特性。制造工業(yè)和過程工業(yè)的自動化:汽車制造業(yè),機器人、 集成電路的生產(chǎn)、裝配線、機器的精確定位,以及化工 過程等。通信系統(tǒng)的控制:包括電報、電話系統(tǒng)和互聯(lián)網(wǎng)中發(fā)射 器(transmitter)和中繼器(repeat

3、er)的信號能量水平調(diào) 節(jié);網(wǎng)絡(luò)路由設(shè)備的數(shù)據(jù)包緩沖器管理以及為適應(yīng)傳輸 線路的時變特性提供自適應(yīng)去噪方法??刂瓶茖W(xué)面臨重要的機遇和挑戰(zhàn)信息與網(wǎng)絡(luò)(Information and Networks)網(wǎng)絡(luò)的控制(Control of networks)和網(wǎng)絡(luò)環(huán)境下的控制(或 稱為網(wǎng)絡(luò)化控制)(Control over networks) 克網(wǎng)絡(luò)的控制包括:擁塞控制、路由器設(shè)計、數(shù)據(jù)的高速緩沖存儲、 信息的延遲和數(shù)據(jù)包的丟失等關(guān)鍵問題。淀 網(wǎng)絡(luò)環(huán)境下的控制(或稱為網(wǎng)絡(luò)化控制):網(wǎng)絡(luò)連接被控對象和控制器所形成的人規(guī)模復(fù)雜混合控制系統(tǒng)的建模、分析和綜合。建立一種分布式異步且有數(shù)據(jù)包丟失傳輸?shù)目刂葡到y(tǒng)理

4、論和方法 成為一個具有挑戰(zhàn)性的問題。X控制科學(xué)面臨重要的機遇和挑戰(zhàn)機器人與智能機器(Robotics and Intelligent Machine) 擬人化機器人是高智能的人工智能系統(tǒng),如何實現(xiàn)復(fù)朵 目標(biāo)的跟蹤成為關(guān)鍵問題之一。宇航和交通(Aerospace and Transportation)分子量子和微系統(tǒng)(Molecular,Quantum and Nanoscale systems )生物和醫(yī)學(xué)材料和工業(yè)過程環(huán)境科學(xué)與工程經(jīng)濟和金融系統(tǒng)、電力系統(tǒng)1、問題的背景及科學(xué)意義 自適應(yīng)控制理論的公開問題: 無法處理本質(zhì)時-變 問題,控制系統(tǒng)的動態(tài)品質(zhì)無法保證。進(jìn)代學(xué)習(xí)控制理論的限制:只能精

5、確跟蹤固定巨 標(biāo)。過程工業(yè)穩(wěn)態(tài)優(yōu)化控制中的關(guān)鍵問題:如何確 保穩(wěn)態(tài)優(yōu)化中一次次動態(tài)進(jìn)程具有良好性能?提岀口適應(yīng)迭代學(xué)習(xí)控制理論,為解決上述問題 提供了一個可行的方法。自適應(yīng)控制問題被控對象:尢=/(兀,<9),兀(0) = x0,y(t) = h(x(t)適應(yīng)控制器:6 二(px,<9),(0) = Oq,u = 00,0)自適應(yīng)控制是參數(shù)學(xué)習(xí)的控制方法,處理系統(tǒng)參 數(shù)的不確定性和“小”的結(jié)構(gòu)不確定性。實現(xiàn)了 系統(tǒng)的漸近調(diào)節(jié)或漸近跟蹤。自適應(yīng)控制系統(tǒng)的結(jié)構(gòu)模型參考自適應(yīng)控制的仿真圖ClockTo Woitepacel系統(tǒng)響應(yīng)曲線260.O305逗 eed-0.65-0.6-0.65

6、-0.7-0.75-0.8Ou-n t自適應(yīng)控制的公開問題長期存在的公開問題是:如何保證閉環(huán)自適應(yīng)系 統(tǒng)具有良好動態(tài)性能品質(zhì)?當(dāng)參數(shù)是時變時如何設(shè)計?1、問題的背景及科學(xué)意義 自適應(yīng)控制理論的公開問題: 無法處理本質(zhì)時-變 問題,控制系統(tǒng)的動態(tài)品質(zhì)無法保證。進(jìn)代學(xué)習(xí)控制理論的限制:只能精確跟蹤固定巨 標(biāo)。過程工業(yè)穩(wěn)態(tài)優(yōu)化控制中的關(guān)鍵問題:如何確 保穩(wěn)態(tài)優(yōu)化中一次次動態(tài)進(jìn)程具有良好性能?提岀口適應(yīng)迭代學(xué)習(xí)控制理論,為解決上述問題 提供了一個可行的方法。迭代學(xué)習(xí)控制理論及其限制學(xué)習(xí)控制是指在控制系統(tǒng)的進(jìn)程中估計某些信息并據(jù)以 改善控制性能的一種控制方法,以便逐步改進(jìn)控制系統(tǒng) 的性能。迭代學(xué)習(xí)控制是

7、一種有可靠的數(shù)學(xué)基礎(chǔ)的學(xué)習(xí) 控制方法。下圖是迭代學(xué)習(xí)控制的結(jié)構(gòu)圖。迭代學(xué)習(xí)控制理論及其限制觀迭代學(xué)習(xí)控制(ILC)是品質(zhì)學(xué)習(xí)的高級控制方法, 適合處理重復(fù)系統(tǒng)或周期系統(tǒng)的各種不確定性。 實現(xiàn)了在有限時間區(qū)間內(nèi)目標(biāo)軌線的精確跟蹤o觀ILC控制器:uk+t) = g(/(,/(),/+%),/ r-yk單關(guān)節(jié)機械臂的OILC的仿真圖卜 - L O 505 o O50k005050k10005101520迭代次數(shù)205 O 50迭代學(xué)習(xí)控制理論及其限制觀ILC的缺陷:非線性函數(shù)須滿足Lipschitz條件線性系統(tǒng)的第一個Markov參數(shù)CB不為零需要知道理想的輸入初值誤差的魯棒性問題跟蹤目標(biāo)是固定的

8、1、問題的背景及科學(xué)意義 自適應(yīng)控制理論的公開問題: 無法處理本質(zhì)時-變 問題,控制系統(tǒng)的動態(tài)品質(zhì)無法保證。進(jìn)代學(xué)習(xí)控制理論的限制:只能精確跟蹤固定巨 標(biāo)。過程工業(yè)穩(wěn)態(tài)優(yōu)化控制中的關(guān)鍵問題:如何確 保穩(wěn)態(tài)優(yōu)化中一次次動態(tài)進(jìn)程具有良好性能?提岀口適應(yīng)迭代學(xué)習(xí)控制理論,為解決上述問題 提供了一個可行的方法。工業(yè)過程穩(wěn)態(tài)優(yōu)化中的關(guān)鍵問題過渡過程示意圖工業(yè)過程穩(wěn)態(tài)優(yōu)化中的關(guān)鍵問題ILC在工業(yè)過程中的應(yīng)用1、問題的背景及科學(xué)意義 自適應(yīng)控制理論的公開問題: 無法處理本質(zhì)時-變 問題,控制系統(tǒng)的動態(tài)品質(zhì)無法保證。進(jìn)代學(xué)習(xí)控制理論的限制:只能精確跟蹤固定巨 標(biāo)。過程工業(yè)穩(wěn)態(tài)優(yōu)化控制中的關(guān)鍵問題:如何確 保穩(wěn)

9、態(tài)優(yōu)化中一次次動態(tài)進(jìn)程具有良好性能?提岀口適應(yīng)迭代學(xué)習(xí)控制理論,為解決上述問題 提供了一個可行的方法。問題的提出及科學(xué)意義自適應(yīng)控制和迭代學(xué)習(xí)控制結(jié)合形成自適應(yīng)迭代學(xué)習(xí)控 I制(簡稱AILC),目前AILC主要是將自適應(yīng)控制結(jié)合進(jìn)迭代學(xué)習(xí)控制,設(shè)計新型迭代學(xué)習(xí)控制系統(tǒng)。為了解決以 上理論上的缺陷和限制,需要我們研究以下基本問題。問題的提出:1)如何將自適應(yīng)控制和ILC有機結(jié)合設(shè)計新的AILC,實 現(xiàn)對非一致目標(biāo)的精確跟蹤?2)如何將ILC引入自適應(yīng)系統(tǒng)的設(shè)計中,引導(dǎo)自適應(yīng)系統(tǒng) 的動態(tài)過程,解決自適應(yīng)系統(tǒng)的公開問題?這些問題的解決將在高智能機器人(擬人化機器人)系統(tǒng)、 大工業(yè)過程穩(wěn)態(tài)優(yōu)化以及自適

10、應(yīng)控制的應(yīng)用中具有重要 的意義。自適應(yīng)控制研究方法及其缺陷迭代學(xué)習(xí)控制理論研究的主要方法及其限制自適應(yīng)迭代學(xué)習(xí)控制的研究方法自適應(yīng)控制研究方法及其缺陷線性自適應(yīng)控制系統(tǒng)的設(shè)計理論和分析方法1.基于穩(wěn)定性理論的設(shè)計和分析(Narendra,1989, MRAC,連續(xù)時間系統(tǒng))2.基于確定性等價原理及關(guān)鍵性引理和鞅理 論的設(shè)計與分析(Goodwin, 1984,STR/STC,離 散時間系統(tǒng))自適應(yīng)控制研究方法及其缺陷非線性自適應(yīng)控制系統(tǒng)的設(shè)計理論和分析方法1 基于萬能逼近特性模型(如:神經(jīng)網(wǎng)絡(luò)或模糊系統(tǒng)) 的自適應(yīng)控制(Franklin, 1994, ANNC, or Wang, 1995, A

11、FC),利用穩(wěn)定性理論設(shè)計和分析.2. 基于微分兒何理論的自適應(yīng)控制(Isidori, 1990, AFLC; Krstic,1995, SFSAC, OFAC)3基于估計理論的自適應(yīng)控制(Krstic,1995 , Passive or Swapping)4.非線性參數(shù)化自適應(yīng)控制(Kojic等對凸或凹的非線性 參數(shù)牝索統(tǒng)提由了一種min-max設(shè)計方注2003; Lin等 Domination法設(shè)拆分別給出了一鞭非線性參數(shù)化系統(tǒng)尬 光滑自適應(yīng)控制和非光滑自適應(yīng)控制,2002。)自適應(yīng)控制研究方法及其缺陷現(xiàn)有自適應(yīng)控制方法的缺陷:無法保證系統(tǒng)具有優(yōu)良的動態(tài)品質(zhì).無法處理本質(zhì)時變系統(tǒng)問題迭代學(xué)

12、習(xí)控制理論研究方法及限制 ILC現(xiàn)有的研究方法1 開、閉環(huán)的PD,D PI, or PID型ILC算法,利用算子理論 和壓縮映射原理分析系統(tǒng)的收斂性和穩(wěn)定性.(Arimoto, 1984; Moor, 1993; Lin 1995)2. 開、閉環(huán)高階ILC,利用Bellman-Gronwall引理分析系 統(tǒng)的穩(wěn)定性(Bien, 1989; Wen, 1998)3. 基于二維系統(tǒng)理論分析ILC系統(tǒng)的穩(wěn)定性和收斂性(o wens, 1999)4最優(yōu)迭代學(xué)習(xí)控制算法(Amann, 1996; Xu5 2003)迭代學(xué)習(xí)控制理論研究方法及限制ILC的缺陷:非線性函數(shù)須滿足Lipschitz條件線性系統(tǒng)

13、的第一個Markov參數(shù)CB不為零需要知道理想的輸入初值誤差的魯棒性問題跟蹤目標(biāo)是固定的自適應(yīng)迭代學(xué)習(xí)控制理論研究方法 AILC的研究方法:1. 離散型AILC方法:在迭代域設(shè)計自適應(yīng)率,如:Owens, 1993, 2000; Xu, 2000, 2002,2. 連續(xù)型AILC方法:在每次迭代的時間域設(shè)計自適應(yīng)率, 如French 2000; Li & Yang 2002; Li & Daniel 20033. 混合型AILC:將上述兩種方法有機結(jié)合設(shè)計混合型的自適應(yīng)率,如Choi, 20015Xu5 2004, Sun52006缺陷:適合于固定目標(biāo)的跟蹤,無法應(yīng)用于變化的目標(biāo)跟蹤 問題.四、亟待解決的關(guān)鍵問題發(fā)展混合Lyapunov穩(wěn)定性理論,提出復(fù)合能量函數(shù)概念, 設(shè)計非一致目標(biāo)跟蹤的ILC系統(tǒng),分析它的穩(wěn)定性和收斂 性、魯棒柱。ILC和自適應(yīng)控制相結(jié)合,提出非一致目標(biāo)跟蹤的AILC系 統(tǒng),分析它的穩(wěn)定性、收斂性和收斂速度。根據(jù)工業(yè)過程控制的遞階結(jié)構(gòu),給出對其動態(tài)階段實施 自適應(yīng)迭代學(xué)習(xí)控制的問題的提法,建立基本的遞階非 一致目標(biāo)跟蹤的自適應(yīng)迭代學(xué)習(xí)控制結(jié)構(gòu)和算

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論