現(xiàn)代控制理論最優(yōu)控制與濾波ocofch_第1頁
現(xiàn)代控制理論最優(yōu)控制與濾波ocofch_第2頁
現(xiàn)代控制理論最優(yōu)控制與濾波ocofch_第3頁
現(xiàn)代控制理論最優(yōu)控制與濾波ocofch_第4頁
現(xiàn)代控制理論最優(yōu)控制與濾波ocofch_第5頁
已閱讀5頁,還剩44頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、最優(yōu)控制與濾波理論Principle of Optimal Control and Filtering第一章Chapter 1緒論roduction引言最優(yōu)控制問題的提出最優(yōu)控制問題的數(shù)學描述最優(yōu)控制問題的分類最優(yōu)控制問題的研究方法1.1 引言現(xiàn)代控制理論形成的歷史背景現(xiàn)代控制理論的誕生與發(fā)展最優(yōu)控制理論概述1.1.1現(xiàn)代控制理論形成的歷史背景Background of Emergence of Modern Control Theory控制理論的發(fā)展已經走過近百年的歷程,控制理論的發(fā)展歷史可分為三個階段:? 19601960 19801980 現(xiàn)在(經典控制理論現(xiàn)代控制理論 現(xiàn)代后控制理論t

2、 modern control theory)1960年第一屆全美聯(lián)合自動控制會議上提出經典與現(xiàn)代1950s后,現(xiàn)代工業(yè)、科學技術(尤其是空間技術)的發(fā)展推動現(xiàn)代控制理論的形成。被控系統(tǒng)日趨復雜,系統(tǒng)的品質指標(如時間、成本或綜合性能指標)取極值或最優(yōu)的控制方法成為控制理論與工程的關鍵問題。建立在傳遞函數(shù)、頻率特性基礎上的經典控制理論日益出它的局限性:經典控制論只適用于集中參數(shù)的SISO線性定常系統(tǒng),且只適應于以解決伺服系統(tǒng)穩(wěn)定性為主要目標的設計問題,難以適應綜合性能指標設計控制系統(tǒng)的要求;在應用經典控制理論設計時,需要憑經驗試湊及大量手工計算,難以用來解決復雜問題。 1960s數(shù)字計算機的出

3、現(xiàn),使分析和控制復雜系統(tǒng)成為可能。1.1.2 現(xiàn)代控制理論的誕生與發(fā)展Emergence & Development of Modern Control Theory1956年前科學家龐亞金(L.S. Pontryagin)提出極大值原理龐金等人首先把“極大值原理”作為一種猜想提出 來,隨后提供了嚴格證明,并于1958年在愛丁堡召開的國際數(shù)學會議上首次宣讀。L.S. Pontryagin數(shù)學家(R. Bellman)1956年提出了離散多階段決策的最優(yōu)性原理,創(chuàng)立了動態(tài)規(guī)劃。其 “最優(yōu)性原理”。之后,他發(fā)展了變分學中的雅可比(Hamilton-Jacobi)理論,為-了最優(yōu)控制問題的動態(tài)規(guī)劃法

4、。并于1964年用離散多階段決策的動態(tài)規(guī)劃法解決了連續(xù)動態(tài)系統(tǒng)的最優(yōu)控制問題。研究最優(yōu)控制問題的兩種主要方法極大值原理動態(tài)規(guī)劃法Richard Bellman:1920-1984數(shù)學家(R.1959年Kalman)等人提出了著名的波器以解決隨機最優(yōu)控制問題。濾提出能控性和能觀測1960年性并引入狀態(tài)空間法提出具有二次型性能指標的線性狀態(tài)反饋律給出最優(yōu)調節(jié)器的概念。建立在狀態(tài)空間法(時域法)基礎上的現(xiàn)代控制理論誕生 的標志R. Kalman到1960年代初,一套以狀態(tài)方程作為描述系統(tǒng)的數(shù)學模型,以最優(yōu)控制和濾波為的控制系統(tǒng)分析、設計的新原理和方法基本確定,現(xiàn)代控制理論應運而生??刂评碚摰慕M成結構

5、Components of Control Theory時間域理論(狀態(tài)空間法)多變量頻率域理論代數(shù)理論幾何理論經典控制線性系統(tǒng)理論最優(yōu)控制最優(yōu)估計與濾波隨機控制系統(tǒng)辨識自適應控制非線性系統(tǒng)理論魯棒控制理論大系統(tǒng)理論現(xiàn)代控制智能控制(模糊、神經網絡、集成控制技術系統(tǒng)、遺傳算法)現(xiàn)代后控制網絡控制 技術 1.1.3 最優(yōu)控制理論概述最優(yōu)控制理論是現(xiàn)代控制理論的重要組成部分。最優(yōu)控制問題是從大量的實際問題中提煉出來的,其發(fā)展與航空、航天、航海的制導、導航和控制技術密不可分,具有重要的應用價值。50多年來,最優(yōu)控制理論的研究,在深度和廣度上都有較大的發(fā)展,諸如分布參數(shù)系統(tǒng)的最優(yōu)控制、隨機系統(tǒng)的最優(yōu)控

6、制、大系統(tǒng)的最優(yōu)控制和微分對策等等。最優(yōu)控制問題從本質上來說是一個變分學問題。經典變分學只能解決無約束或開集性約束的最優(yōu)控制問題,而一般實際系統(tǒng)的容許控制屬于閉集性約束。尋求求解最優(yōu)控制問題的新途徑。研究最優(yōu)控制問題的兩種主要方法:極大值原理和動態(tài)規(guī)劃法廣義最優(yōu)控制的兩個組成部分廣義最優(yōu)控制包括確定性最優(yōu)控制和隨機最優(yōu)控制1.確定性最優(yōu)控制 Deterministic OC受控系統(tǒng)特性固定,且系統(tǒng)內不存在隨機干擾研究和解決從一切可能的控制方案中尋找最優(yōu)解:研究被控系統(tǒng)在給定的約束條件和性能指標下,尋求使性能指標達到最佳值的控制規(guī)律問題。例如:要求航天器達到預定軌道的時間最短、所消耗的最少等。主

7、要方法:變分法、極大值原理、動態(tài)規(guī)劃等2. 隨機最優(yōu)控制 Stochastic OC實際系統(tǒng)的本身含有未知或不能建模的因素,外部環(huán)境亦存在各種擾動,信號或信息的檢測與傳輸中往往不可避免地帶有誤差和噪音。現(xiàn)代控制理論主要以狀態(tài)空間模型為基礎,反饋采用狀態(tài)變量,因此,估計不可直接測量的狀態(tài)變量是實現(xiàn)閉環(huán)控制系統(tǒng)重要的一環(huán)。隨機最優(yōu)控制是最優(yōu)控制與狀態(tài)最優(yōu)估計的結合。最優(yōu)估計根據系統(tǒng)的輸入輸出信息估計出或構造出隨機動態(tài)系統(tǒng)中不能直接測量的系統(tǒng)狀態(tài)變量的值。最優(yōu)估計的早期工作是維納在1940年代維納濾波器,較系統(tǒng)完整的工作是在1960年代初濾波器理論。理論基礎為概率統(tǒng)計理論、線性系統(tǒng)理論和最優(yōu)控制理論

8、。本課程包含兩個部分:最優(yōu)控制與最優(yōu)估計(濾波)教學內容Course Schedule第一章第二章第三章第四章第五章緒論變分法極小值原理線性二次型最優(yōu)控制離散系統(tǒng)最優(yōu)控制第六章* 動態(tài)規(guī)劃第七章狀態(tài)估計與Kalman濾波參考文獻Referen最優(yōu)控制理論與系統(tǒng),:1.科學1994.12 第二版解學書. 最優(yōu)控制 理論與應用 .1986年. 第一版:2.3.Michael Ans, and Peter Falb. Optimal Control-Anroduction to the Theory and Its Applications. New York,NY: McGraw Hill, 19

9、66中變分法基礎(第2版)社20077:國防工業(yè)4.章最優(yōu)控制理論與應用社20083:機械工業(yè)5.,最優(yōu)控制理論與應用:高等教育6.20061第1版7.Kirk, Donald E. Optimal Control Theory: AnNew York, NY: Dover, 2004roduction.8.J.S Meditch. Stochastic Optimal Linear Estimation andControl. New York : McGraw-Hill, 1969.課件box:Password:2013fall方式半開卷可以將4張正都寫滿字的A4紙帶入考場1.2 最優(yōu)控制

10、問題的提出控制系統(tǒng)實際運行時需要考慮要求控制過程中消耗的:最少最省控制要求控制過程中消耗的能量最少要求經過的時間最短最小能量控制最短時間控制最小成本控制要求產量達到最高、成本降到最低 上述指標比經典控制理論中的上升時間、最大超調量、過渡過程時間、穩(wěn)態(tài)誤差等品質指標更精確。上述問題導致了最優(yōu)控制理論的產生和發(fā)展。上述具體的最優(yōu)控制問題可以抽象成共同的數(shù)學問題。最優(yōu)控制問題的提法(數(shù)學描述):將通常的最優(yōu)控制問題抽象成一個數(shù)學問題,并用數(shù)學語言嚴格地表述出來。例1.2.1 飛船的月球問題為了使宇宙飛船在月球表面實(即著陸時速度為0),現(xiàn)要尋求著陸過程中發(fā)優(yōu)控制規(guī)律,使得推力的最的消耗最少。設飛船的

11、質量為m(t),離月球表面的高度為h(t),飛船的垂直速度為v(t),發(fā)推力為u(t),月球表面的重力加速度為g,設不帶的飛船質量為M,初始F。的質量為飛船的運動方程為:h& vu(t)v& u gv(t)m(t)m kum&mgh(t)式中:k0,推力與消耗率的比例系數(shù)令x1 hx2 vx3 m x&1 x2 x&ug有:(1.2.1)2x3 x& 3 ku非線性狀態(tài)方程組飛船初始狀態(tài):x1(t0)=h(t0)=h0, x2(t0)= v(t0)=v0,x3(t0)= m(t0)=M+F在末態(tài)時刻tf實現(xiàn)控制過程中,推力u(t): x1(tf)=0,過發(fā)x2(tf)=0, x3(tf) M。

12、所能提供的最大推力(1.2.2)0u(t) aa,即控制變量不等式(閉集性約束)控制目的:使消耗量最小最少控制問題,即(1.2.3)飛船在著陸時的質量最大:即為最大。性能指標J(u)= x3(tf) x&1 x20u(t) a(1.2.2) x&ug(1.2.1)2xJ(u)= x3(tf)(1.2.3)3 x& 3 ku數(shù)學描述:最少控制問題在系統(tǒng)狀態(tài)方程(1.2.1)和控制變量不等式(1.2.2)的約束下尋找控制函數(shù)u(t),把系統(tǒng)(1.2.1)從某個初始狀態(tài)x(t0)轉移到所要求的狀態(tài)x(tf),且使性能指標(1.2.3)達到最大。可以從另一方面對控制系統(tǒng)提出要求,如要求著陸時間最短,即

13、使J(u)= tf - t0 最小時間最優(yōu)控制問題例1.2.2人造姿態(tài)控制問題A和B是兩組斜對稱配置的噴嘴,小噴嘴噴出的反作用力可使時產生體旋轉并進入要求的姿態(tài)。設在t0時刻體偏離要求姿態(tài)(t0)角,且以 &(t0 )的角速度繼續(xù)偏離。F/2Al要求從t 時刻起加上適當?shù)目谺0制力,使經過最短的時間質心l基準重新回到要求的姿態(tài)。BAF/2&(t f ) 0用 tf 表示終端時間,即要求: (t f ) 0,且使tf - t0最小。設繞質心轉動慣量為Jm,每個小噴嘴產生的反作用力為F/2,與質心間的垂直距離為l,則作用于體上的力矩為: F/2l+ F/2l= FlFlJm體的角加速度為:&(t

14、) 控制作用在力矩作用下,u(t ) Fl(1.2.4)令Jm&(t ) u(t )x2 (t ) &(t )為一組狀態(tài)變量則(1.2.4)變?yōu)椋?1.2.5)x1(t ) (t ),令得:x&(t ) x(t )12線性狀態(tài)方程組x& 2 (t ) u(t )寫成矩陣-向量形式: x&1 (t ) 01 x1 (t ) 0 u(t ) x&(t )0 x(t )01 2 2即:x& = Ax + Bu(1.2.6)(1.2.7) x1 (t0 ) (t0 )系統(tǒng)初始狀態(tài)為:x(t x)&(t)0(t200終端狀態(tài)為: x1 (t f )(1.2.8)0 x(t f ) x) 0(t 2f小噴

15、嘴可以產生的最大反作用力有限,因此控制變量u(t)有um const. 0t f限,即:u(t ) um ,(1.2.9)(1.2.10)這個問題要求:J tt達到最小dtf0t0姿態(tài)最優(yōu)控制問題的性能指標數(shù)學描述:時間最優(yōu)控制問題在系統(tǒng)狀態(tài)方程(1.2.6)和控制變量不等式(1.2.9)的約束下尋找控制函數(shù)u(t),把系統(tǒng)(1.2.6)從某個初始狀態(tài)x(t0)轉移到所要求的狀態(tài)x(tf)(狀態(tài)空間原點),且使性能指標 (1.2.10)達到最小??梢詮牧硪环矫鎸刂葡到y(tǒng)提出要求,如要求控制過程中消耗最少最少控制問題由于反作用力F由小噴嘴噴射出高速產生,其大小的數(shù)量成正比,由于Fu,因此,與時間

16、內噴出時間消耗的也與u(t)成正比。最少問題的性能(1.2.11)t指標為:fJu(t ) dtt0姿態(tài)控制問題的數(shù)學描述:最少控制問題在系統(tǒng)狀態(tài)方程(1.2.6)和控制變量不等式(1.2.9)的約束下尋找控制函數(shù)u(t),把系統(tǒng)(1.2.6)從某個初始狀態(tài)x(t0)轉移到狀態(tài)平面原點,且使性能指標(1.2.11)達到最小。若要求少消耗的同時使時間也盡可能短,則性能指標t u(t ) dtJ f可定義為:(1.2.12)t0其中,權系數(shù) 的大小表示消耗對時間的相對重要性?;谛阅苤笜?1.2.12)的最優(yōu)控制問題時間問題其他例子:庫存問題,費投入問題1.3 最優(yōu)控制問題的數(shù)學描述最優(yōu)控制問題可

17、以抽象成共同的數(shù)學問題描述。最優(yōu)控制問題的描述:將通常的最優(yōu)控制問題抽象成一個描述的數(shù)學問題,并用數(shù)學語言嚴格地表述出來。包括:1.2.3.4.被控系統(tǒng)的數(shù)學模型系統(tǒng)初始狀態(tài)和終止狀態(tài)容許控制性能指標被控系統(tǒng)的數(shù)學模型最優(yōu)控制問題的數(shù)學模型都采用狀態(tài)空間模型(包括線性或非線性、連續(xù)或離散、定?;驎r變、確定或隨機)時間連續(xù)控制系統(tǒng)的狀態(tài)空間模型:x& fx, u, t (非線性時變連續(xù)系統(tǒng))一般:(1.3.1)其中:x(t)Rn,u(t)Rm,tt0,tf (一般為時間變量)f(x,u,t)=f1(x,u,t)f2(x,u,t) fn(x,u,t)Tx& (t ) fx, u非線性定常連續(xù)系統(tǒng)非

18、線性函數(shù)fi中不顯含時間t,即系統(tǒng)的結構和參數(shù)不隨時間變化而變化。x& (t ) A(t )x(t ) B(t )u(t )線性時變連續(xù)系統(tǒng)x& (t ) Ax(t ) Bu(t )線性定常連續(xù)系統(tǒng)簡記符線性時變系統(tǒng): (A(t), B(t)線性定常系統(tǒng): (A, B)時間離散控制系統(tǒng)的狀態(tài)空間模型x(tk 1 ) fx(tk ), u(tk ), tk (tk kT ,T 采樣周期)x(k 1) Gx(k) Hu(k)非線性時變系統(tǒng)線性定常系統(tǒng)系統(tǒng)初始狀態(tài)和終止狀態(tài)動態(tài)系統(tǒng)在控制u(t)的作用下,從一個狀態(tài)轉移到另一個狀態(tài)狀態(tài)空間的一個點(即狀態(tài))的運動。在最優(yōu)控制問題中:系統(tǒng)的初始狀態(tài)(初

19、態(tài))通常已知:x(t0)=x0最終狀態(tài)(末態(tài)、終態(tài))要求達到的目標(因問題而異)末態(tài)舉例:1.飛船月球問題要求:x1(tf)=0,x2(tf)=0,x3(tf) M 狀態(tài)空間中的一個線段姿態(tài)控制問題要求:x1(tf)=0,2.x2(tf)=0一個固定點末態(tài)約束條件末態(tài)約束條件(對末態(tài)的要求)一般表達式:g1(x(tf), tf)=0等式約束不等式約束g2(x(tf), tf)0式中,g1(x(tf),tf)和g2(x(tf),tf)為關于末態(tài)時刻tf和末態(tài)x(tf)的非線性向量函數(shù)。定義:滿足末態(tài)約束的狀態(tài)集合稱為目標集,表述為:=x(tf):x(tf) Rn , g1(x(tf), tf)=

20、0,g2(x(tf), tf)0 若末態(tài)不受任何限制,則為整個狀態(tài)空間Rn 。沒有規(guī)定末態(tài)約束(目標集),并不表示對末態(tài)沒有要求,控制目標體現(xiàn)在性能指標中。終端時間可分為固定的和固定終端時間問題的:終端時間問題容許控制 Admissible Control實際系統(tǒng)中,控制向量u(t)(m1)的各個分量ui(t) 只能在一定范圍內取值控制約束條件飛船控制系統(tǒng)中控制量有大小范圍的限制;在控制量為開關量的控制系統(tǒng)中,輸入僅能取有限的幾個值,如-1,+1。u(t)的取值范圍對應于m維控制空間m 中的一個集合 m, u(t)的每一個取值對應于集合中的一個元素。若u(t) ,則稱u(t)為容許控制。定義:

21、由控制約束條件所規(guī)定的點集稱為控制域 。凡在閉區(qū)間t0,tf上有定義,且在控制域內取值的每一個控制函數(shù)u(t)稱為容許控制,u(t)兩類容許控制:開集和閉集u(t ) um閉集:控制量只能取值于一定范圍,如開集:控制量取值不受限制,是整個m 空間??刂朴驗殚_集或閉集的兩類控制問題的處理方法有很大差別,閉集的處理較難,結果也很復雜。通常假定容許控制u(t)是一個有界連續(xù)函數(shù)或者是分段連續(xù)函數(shù)。性能指標從給定初態(tài)x(t0)到目標集的轉移存在不同的控制律u(t),為了從所有容許控制中找出一種效果最好的控制,需要一個評價控制效果或控制品質優(yōu)劣的性能指標函數(shù)。性能指標的選擇取決于所要解決的主要。例1.2

22、.1飛船控制系統(tǒng)的兩種要求:J(u)= x3(tf)J(u)= tf - t0最少控制問題時間最優(yōu)控制問題性能指標的選擇很靈活:理論知識、實踐經驗和技巧。確定性最優(yōu)控制的性能指標一般形式(復合型性能指標):t ftJ S (x(t), t) L(x(t ), u(t ), t )dtff0末態(tài)性能指標積分性能指標末態(tài)性能指標:末值型性能指標,體現(xiàn)了對末態(tài)的要求積分性能指標:體現(xiàn)了對系統(tǒng)狀態(tài)變化過程中的狀態(tài)x(t)和控制u(t)的要求??蓪⒏鞣N不同的性能指標視為一般形式的性能指標的一種特例。例1.2.1飛船最少控制問題的性能指標J(u)= x3(tf) 可視為復合性能指標的一個特例,其中S(x(

23、tf), tf)=x3 (tf)L(x, u, t)=0末值型性能指標:接近目標集程度,即末態(tài)控制精度的度量;積分性能指標:反映控制過程偏差在某種意義上的平均或控制過程的的快速性,同時反映或能量的消耗。綜合性指標:扎Bolza問題;t ft S (x(t) J), tL(x(t ), u(t ), t )dtff0終端指標:爾Mayer問題;J S(x(t f ), t f )日Lagrange問題積分指標:tJ fL(x(t ), u(t ), t )dtt0 x& (t ) fx, ut ftJ S(x(t), t ) L(x(t ), u(t ), t )dtff0給定一個容許控制函數(shù)u

24、(t),由狀態(tài)方程可確定對應的狀態(tài)軌線x(t)和相應的末態(tài)x(tf),由此確定J中的末態(tài)指標S。 u(t)不同,J也不同。性能指標 J 的值依賴于整個控制過程所施加的控制函數(shù)u(t)和x(t),而不僅僅依賴某個時刻的u(t) 和x(t) 。因此,性能指標為一泛函(functional)。性能指標函數(shù)又稱為指標泛函performancefunctional 、目標函數(shù)、代價函數(shù)cost function或評價函數(shù)等。最優(yōu)控制問題的描述最優(yōu)控制問題用數(shù)學模型、目標集、容許控制以及性能指標可描述為:已知被控系統(tǒng)的狀態(tài)方程及給定的初態(tài)為:x& (t ) f (x(t ), u(t ), t ),規(guī)定的目標集為:x(t0 ) x0=x(tf ): x(tf )Rn,g1(x(tf ), tf )=0, g2(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論