智能控制課件8課件_第1頁(yè)
智能控制課件8課件_第2頁(yè)
智能控制課件8課件_第3頁(yè)
智能控制課件8課件_第4頁(yè)
智能控制課件8課件_第5頁(yè)
已閱讀5頁(yè),還剩37頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 (第8課) 第五章 學(xué)習(xí)控制 第六章 分層遞階智能控制智能控制Intelligent Control第五章 學(xué)習(xí)控制學(xué)習(xí)是人類具有智能的顯著標(biāo)志,同時(shí)也是智能系統(tǒng)的智能化衡量標(biāo)準(zhǔn)。 K S FU 把學(xué)習(xí)控制與智能控制相提并論1學(xué)習(xí)控制是為了解決主要由對(duì)象的非線性和系統(tǒng)建模不良所造成的不確定性問(wèn)題。 學(xué)習(xí)控制通過(guò)對(duì)未知信息的估計(jì)逐步改善控制系統(tǒng)性能。什么是學(xué)習(xí),什么是學(xué)習(xí)控制系統(tǒng) 教材 P28325.1 概述學(xué)習(xí)控制與自適應(yīng)控制 教材 P284 自適應(yīng)控制著眼于瞬時(shí),動(dòng)態(tài)特性隨時(shí)間變化,沒(méi)有記憶 學(xué)習(xí)控制強(qiáng)調(diào)全局,具有記憶特性學(xué)習(xí)控制典型類別 (1)基于模式識(shí)別的學(xué)習(xí)控制 (2)基于迭代和重復(fù)

2、的學(xué)習(xí)控制 (3)聯(lián)結(jié)主義學(xué)習(xí)控制3機(jī)器學(xué)習(xí)是智能系統(tǒng)(特別是ES)中不可缺少的一個(gè)組成部分 ES需要不斷適應(yīng)外界環(huán)境的變化,提高解決問(wèn)題的能力 機(jī)器學(xué)習(xí)的研究已經(jīng)有相當(dāng)長(zhǎng)的歷史,提出了很多尚待解決的問(wèn)題,是AI領(lǐng)域上正在發(fā)展的一個(gè)課題 學(xué)習(xí)也可以看作是獲取知識(shí)的方法4(補(bǔ)充)機(jī)器學(xué)習(xí)(3)通過(guò)例子學(xué)習(xí)(learning from example) 特殊到一般的學(xué)習(xí),歸納學(xué)習(xí)(4)通過(guò)類比學(xué)習(xí)(learning by analogy) 從特殊事例概括出類比關(guān)系和轉(zhuǎn)換規(guī)則6實(shí)例學(xué)習(xí) 學(xué)習(xí)過(guò)程:從給定的實(shí)例序列E1,E2,En(E1必須是正例)中學(xué)習(xí)概念C 步驟: (1)取E1為概念C的初始假設(shè)H

3、1; (2)處理其余的Ei ( i=2,3,n ): - 以Ei匹配當(dāng)前假設(shè)Hi-1,令匹配結(jié)果為Hi-1與Hi之差異的某種描述D7例,積木世界拱的概念12349 第1例為正例,成為“什么是拱”的當(dāng)前假設(shè)HiH1rectanglehas_partsupportis_asupport10第2例為反例E2rectanglehas_partsupportis_asupporttouch11H2rectanglehas_partsupportis_asupportmust-not-touch13再看第3例,又是反例E3rectanglehas_partis_a14H3rectanglehas_part

4、must-supportis_amust-not-touchmust-support16第4例為正例E4trianglehas_partsupportis_asupportrectangle17 將E4與H3匹配,差異是E4頂部為三角形,因而可以把頂部rectangle 變?yōu)?rectangle-or-triangle 若系統(tǒng)有領(lǐng)域知識(shí) triangle 和 rectangle同屬于stable-poly, 則最后假設(shè)為H4 18H4rectanglehas_partmust-supportis_amust-not-touchmust-supportstable-poly19原理 針對(duì)先驗(yàn)知識(shí)

5、不完全的對(duì)象和環(huán)境,將控制局勢(shì)進(jìn)行分類,確定這種分類決策,根據(jù)不同的決策切換控制作用的選擇,通過(guò)對(duì)控制器性能估計(jì)來(lái)引導(dǎo)學(xué)習(xí)過(guò)程,從而使系統(tǒng)總的性能逐步改善。205.2 基于模式識(shí)別的學(xué)習(xí)控制發(fā)展 教材P285學(xué)習(xí)控制器原理及結(jié)構(gòu) 教材P287 圖5.1 圖 5.2 閉環(huán)反饋 三個(gè)反饋層 模式分類 “教師”學(xué)習(xí)21判別函數(shù) di (x), i =1,2,m 對(duì)于x 屬于i 則di (x) dj (x), j i 決策面方程: di (x) - dj (x) = 0- 線性判別函數(shù)ir :權(quán) i,k+1:偏置23 意義可參考神經(jīng)網(wǎng)絡(luò) P289圖5.3 2類線性分類器 - NN的線性閾值單元 圖5.

6、4 m類線性分類器 - NN的多層分類器-多項(xiàng)式判別函數(shù)24Bayes 決策原理: 若p (1 | x ) p (2 | x ) ,把x歸類為1 若p (1 | x ) p (2 | x ) ,把x歸類為2 利用Bayes 決策,可獲得使錯(cuò)誤率為最小的分類規(guī)則Bayes 分類器, P290 圖5.526可訓(xùn)練控制器 2類線性分類器作為一種可訓(xùn)練控制器使用,并實(shí)現(xiàn)一種時(shí)間最優(yōu)學(xué)習(xí)控制。Bayes 學(xué)習(xí)控制 利用Bayes 定理的迭代方法,估計(jì)(學(xué)習(xí))未知的密度函數(shù)信息 隨機(jī)最優(yōu)控制器設(shè)計(jì) 27(1)有監(jiān)督的Bayes 學(xué)習(xí)控制 已知i 類樣本x(1), x(2), , x(n) 及在i 下樣本的

7、概率密度函數(shù) p ( x | i ) ,估計(jì)參數(shù) 28(2)無(wú)監(jiān)督的Bayes 學(xué)習(xí)控制 沒(méi)有x(1) , x(2), , x(n) 的正確分類,此時(shí)x(i) 可能屬于m類中的任何一類 混合密度29智能控制的對(duì)象: 復(fù)雜系統(tǒng),其中,一類是指具有復(fù)雜的要求,如規(guī)劃、決策、學(xué)習(xí)等人類的智能活動(dòng): 從簡(jiǎn)單的邏輯操作到高級(jí)的推理第六章 分層遞階智能控制系統(tǒng)6.1 結(jié)構(gòu)30G.N.Saridis提出的分層遞階智能控制系統(tǒng)結(jié)構(gòu) P328 圖6.1 三個(gè)層次:執(zhí)行級(jí)、協(xié)調(diào)級(jí)、組織級(jí) 特點(diǎn):自上而下,智能逐減、精度漸增 設(shè)計(jì)目標(biāo):尋找正確的決策和控制序列,以使整個(gè)系統(tǒng)的總熵最?。ㄐ阅茏詈茫?1P329 圖6.

8、2 機(jī)器人分層遞階智能控制系統(tǒng)過(guò)程控制: 過(guò)程控制、 監(jiān)督控制、 調(diào)度控制 CIMS結(jié)構(gòu)Scheduling layerSupervisory layer Process layer32作用: 對(duì)于給定的外部命令和任務(wù),設(shè)法找到能夠完成該任務(wù)的子任務(wù)(或動(dòng)作)組合6.2 組織級(jí)33外部命令子任務(wù)(組合)協(xié)調(diào)級(jí)結(jié)果評(píng)價(jià)實(shí)現(xiàn): 神經(jīng)網(wǎng)絡(luò) Boltzmann機(jī) ( Saridis) P330332 隨機(jī)神經(jīng)網(wǎng)絡(luò) 反饋型P34作用: 接受組織級(jí)的命令,產(chǎn)生可供執(zhí)行級(jí)執(zhí)行的具體動(dòng)作(中間層)6.3 協(xié)調(diào)級(jí)35處理具體動(dòng)作執(zhí)行級(jí)外部命令結(jié)構(gòu): P334 圖6.4 分派器、協(xié)調(diào)器 分派器:接收基元事件組合,

9、負(fù)責(zé)對(duì)協(xié)調(diào)器的控制和通訊(翻譯控制動(dòng)作)。 協(xié)調(diào)器:與一定裝置相聯(lián),對(duì)其進(jìn)行操作和數(shù)據(jù)傳輸。分派器協(xié)調(diào)器高級(jí)命令語(yǔ)言可執(zhí)行的操作語(yǔ)言36實(shí)現(xiàn): Petri網(wǎng) 1962年德國(guó)的Carl Adam Petri 在他的博士論文用自動(dòng)機(jī)通信中首次使用網(wǎng)狀結(jié)構(gòu)模擬通信系統(tǒng)。這種系統(tǒng)模型后來(lái)以Petri為名流傳。 Petri網(wǎng)是一個(gè)強(qiáng)有力的數(shù)學(xué)和圖形工具用來(lái)描述事件驅(qū)動(dòng)系統(tǒng),例如離散事件動(dòng)態(tài)系統(tǒng)。37 Petri網(wǎng)的特點(diǎn): 能夠?qū)哂胁⑿?、并發(fā)、同步、資源共 享的情況建立形象化模型; 理論結(jié)果十分豐富,網(wǎng)的性質(zhì)曾經(jīng)也正在被廣泛的研究著。 根據(jù)是否有時(shí)間限制和外界干擾,把Petri網(wǎng)分為自主Petri網(wǎng)和非自主Petri網(wǎng)。38Petri網(wǎng)類型普通Petri網(wǎng)、有色Petri網(wǎng) 、謂詞Petri網(wǎng)、連續(xù)Petri網(wǎng) 、時(shí)延Petri網(wǎng) 、解釋Petri網(wǎng) 、隨機(jī)Petri網(wǎng) 、時(shí)延連續(xù)Petri網(wǎng) 普通Petri網(wǎng), P336

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論