多智能體系統(tǒng)教材課件匯總完整版ppt全套課件最全教學(xué)教程整本書(shū)電子教案全書(shū)教案課件合集_第1頁(yè)
多智能體系統(tǒng)教材課件匯總完整版ppt全套課件最全教學(xué)教程整本書(shū)電子教案全書(shū)教案課件合集_第2頁(yè)
多智能體系統(tǒng)教材課件匯總完整版ppt全套課件最全教學(xué)教程整本書(shū)電子教案全書(shū)教案課件合集_第3頁(yè)
多智能體系統(tǒng)教材課件匯總完整版ppt全套課件最全教學(xué)教程整本書(shū)電子教案全書(shū)教案課件合集_第4頁(yè)
多智能體系統(tǒng)教材課件匯總完整版ppt全套課件最全教學(xué)教程整本書(shū)電子教案全書(shū)教案課件合集_第5頁(yè)
已閱讀5頁(yè),還剩596頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 第1章 多智能體系統(tǒng)概述1.1 自然智能和人工智能1.2 多智能體系統(tǒng)1.3 多智能體系統(tǒng)的主要技術(shù)內(nèi)容1.4 Netlogo仿真工具 第1章 多智能體系統(tǒng)概述 依賴(lài)于表現(xiàn)智能的智能體不同,我們可以簡(jiǎn)單地把智能分為人工智能和自然智能(非人工智能)?,F(xiàn)實(shí)中最普遍存在的就是大自然創(chuàng)造的各種智能體,也就是各種動(dòng)物以及我們?nèi)祟?lèi)自己。自然智能特指大自然創(chuàng)造的智能現(xiàn)象。人工智能是由機(jī)器、設(shè)備或軟件等人造對(duì)象所表現(xiàn)出的智能。 1.1.1 自然智能 自然智能包括:(1)生物個(gè)體智能,由有機(jī)的生命形態(tài)個(gè)體所表現(xiàn)出的智能。(2)人類(lèi)個(gè)體智能,由人類(lèi)個(gè)體所表現(xiàn)出的智能。(3)群體智能,由眾多智能個(gè)體的集合所表現(xiàn)出

2、的智能(4)系統(tǒng)智能,由多種有機(jī)或無(wú)機(jī)元素組成的復(fù)雜系統(tǒng)所表現(xiàn)出的智能。 1.1.1 自然智能 定義1.1生物智能(Biological Intelligence, BI)就是指各種生物個(gè)體所表現(xiàn)出來(lái)的,能夠自主的對(duì)環(huán)境做出適應(yīng)的反應(yīng)行為。 1.生物個(gè)體智能 人類(lèi)智能(human intelligence)是人類(lèi)個(gè)體所表現(xiàn)出的智能。定義1.2從感覺(jué)到記憶到思維這一過(guò)程,稱(chēng)為“智慧”,智慧的結(jié)果就產(chǎn)生了行為和語(yǔ)言,將行為和語(yǔ)言的表達(dá)過(guò)程稱(chēng)為“能力”,兩者合稱(chēng)“智能”。 2.人類(lèi)個(gè)體智能 群體智能是由眾多智能個(gè)體的集合所表現(xiàn)出的智能。定義1.3群體智能(Swarm Intelligence,SI)

3、是指在集體層面表現(xiàn)的分散的、去中心化的自組織行為。定義1.4涌現(xiàn)行為在全局狀態(tài)中是顯而易見(jiàn)的,它們沒(méi)有明確地被編入程序,但它是個(gè)人之間局部互動(dòng)的結(jié)果。根據(jù)觀察者建立的一些指標(biāo),它被認(rèn)為是有趣的。 3.群體智能 群體智能SI可以視為系統(tǒng)智能(System Intelligence,SI)的一個(gè)特殊情況。系統(tǒng)智能可以視為所有智能的根本模式,我們將從系統(tǒng)智能中揭示智能的真正來(lái)源。系統(tǒng)智能是由多種有機(jī)或無(wú)機(jī)元素組成的復(fù)雜系統(tǒng)所表現(xiàn)出的智能。 4.系統(tǒng)智能 定義1.5如果一個(gè)系統(tǒng)能夠獨(dú)立而有效地解決某種問(wèn)題,那么這個(gè)系統(tǒng)就是智能的。諸如自然界的石、木、山、水等生態(tài)系統(tǒng),乃至一個(gè)星球,它們都可以在科學(xué)現(xiàn)象

4、的支配下,遵循自然規(guī)律,感應(yīng)外界信息,交換物質(zhì)能量,有序耗散運(yùn)行。因此,物理實(shí)體系統(tǒng)也可以定義為是一種原始智能系統(tǒng)。 4.系統(tǒng)智能1.1 自然智能和人工智能1.2 多智能體系統(tǒng)1.3 多智能體系統(tǒng)的主要技術(shù)內(nèi)容1.4 Netlogo仿真工具 第1章 多智能體系統(tǒng)概述1.2.1 多智能體系統(tǒng)定義與特點(diǎn)1.2.2 多智能體系統(tǒng)的形式化描述1.2.3 多智能體系統(tǒng)理論的發(fā)展1.2.4 多智能體系統(tǒng)應(yīng)用 1.2 多智能體系統(tǒng) 智能分為自然智能和人工智能,相應(yīng)地,智能體就分為自然智能體和人工智能體。一個(gè)自然智能體可以是人群中的個(gè)人、經(jīng)濟(jì)系統(tǒng)中的經(jīng)營(yíng)者、生態(tài)系統(tǒng)中的植物個(gè)體、動(dòng)物個(gè)體等;人工智能體可以是交

5、通流中的智能汽車(chē),計(jì)算網(wǎng)絡(luò)中的計(jì)算機(jī),無(wú)人機(jī)等。 1.智能體 定義1.7任何可以被看作是通過(guò)傳感器感知環(huán)境并且通過(guò)執(zhí)行器作用于環(huán)境的實(shí)體都被稱(chēng)為智能體(Agent)。 1.智能體 定義1.8智能體的感知序列是該智能體所接收的所有數(shù)據(jù)完整的歷史。感知信息做為智能體的感知輸入,而感知序列是感知信息的集合。一般而言,智能體在任何給定時(shí)刻的行動(dòng)選擇取決于到那個(gè)時(shí)刻為止智能體的整個(gè)感知序列。 1.智能體 定義1.9把任意給定感知序列集合到執(zhí)行動(dòng)作集合的映射稱(chēng)為智能體函數(shù)。 定義1.10智能體程序是在物理實(shí)體上運(yùn)行的智能體函數(shù)的具體實(shí)現(xiàn)。 1.智能體 下面給出智能體程序的偽碼表示:function TAB

6、LE-DRIVEN-AGENT(percept)returns an action static:percepts, 一個(gè)序列,初始為空; table: 動(dòng)作列表,以感知序列為索引,初始完全指定; 將percept加入到percepts中; action - LOOKUP(percepts, table); return action; 1.智能體 定義1.11智能化智能體(Intelligent Agent,IA)是這樣一種智能個(gè)體,對(duì)于任意感知序列,智能體能夠根據(jù)接收到的感知序列和對(duì)環(huán)境的先驗(yàn)知識(shí)選擇使性能度量期望最大化的行動(dòng)。智能化智能體(IA)既強(qiáng)調(diào)它的智能性(Intelligent)

7、,也表明其代理能力(Agent)。智能性是指應(yīng)用系統(tǒng)使用推理、學(xué)習(xí)和其他技術(shù)來(lái)分析解釋它接觸過(guò)的或剛提供給它的各種信息和知識(shí)的能力,智能可以由一些方法,函數(shù),過(guò)程,搜索算法或加強(qiáng)學(xué)習(xí)來(lái)實(shí)現(xiàn)。 1.智能體 (2)感知智能 第二個(gè)是感知智能,涉及機(jī)器的視覺(jué)、聽(tīng)覺(jué)、觸覺(jué)等感知能力,即機(jī)器可以通過(guò)各種類(lèi)型的傳感器對(duì)周?chē)沫h(huán)境信息進(jìn)行捕捉和分析,并在處理后根據(jù)要求作出合乎理性的應(yīng)答與反應(yīng)。感知智能,讓機(jī)器能聽(tīng)懂我們的語(yǔ)言、看懂世界萬(wàn)物。 1.智能體 1.智能體 定義1.12多智能體系統(tǒng)是由一定數(shù)量的智能個(gè)體通過(guò)相互合作和自組織,在集體層面上呈現(xiàn)出有序的協(xié)同運(yùn)動(dòng)和行為。 2.多智能體系統(tǒng) 每個(gè)智能體僅擁有

8、不完全的信息和問(wèn)題求解能力;不存在全局控制,而采用分布式控制策略。 3.多智能體系統(tǒng)特點(diǎn) (2)系統(tǒng)中每個(gè)智能體都具有相對(duì)簡(jiǎn)單的功能及有限的信息采集、處理、通訊能力,然而經(jīng)過(guò)局部個(gè)體之間的信息傳遞和交互作用后,整個(gè)系統(tǒng)往往在群體層面上表現(xiàn)出高效的協(xié)同合作能力及高級(jí)智能水平,從而實(shí)現(xiàn)單個(gè)智能體所不能完成的各種艱巨、復(fù)雜、精度要求高的任務(wù)。 3.多智能體系統(tǒng)特點(diǎn) (4)多智能體運(yùn)行的特點(diǎn)是協(xié)同協(xié)作規(guī)則。在物聯(lián)網(wǎng)背景下,每個(gè)物體會(huì)發(fā)展成一個(gè)智能體,實(shí)體交互不僅僅在兩個(gè)物體之間發(fā)生,而是每一個(gè)智能體可以和任何一個(gè)其他的智能體進(jìn)行交互。多智能體之間的交互,其實(shí)就是在定義協(xié)同協(xié)作規(guī)則,智能體之間的行為交互

9、方式或者交互模式。 3.多智能體系統(tǒng)特點(diǎn)1.2.1 多智能體系統(tǒng)定義與特點(diǎn)1.2.2 多智能體系統(tǒng)的形式化描述1.2.3 多智能體系統(tǒng)理論的發(fā)展1.2.4 多智能體系統(tǒng)應(yīng)用 1.2 多智能體系統(tǒng) 定義 1.13 一個(gè)智能體是一個(gè)自我管理,自我決策,自我控制及自我學(xué)習(xí)的個(gè)體,有自己的行為和內(nèi)部狀態(tài),免受其它智能體的明確控制。 1.智能體數(shù)學(xué)模型 智能體e是一個(gè)七元組,其中S描述了智能體e的當(dāng)前狀態(tài);B是動(dòng)作;See是感知器部件;Choose是決策器部件;Change是智能體動(dòng)作的執(zhí)行對(duì)環(huán)境狀態(tài)的影響;F是一個(gè)評(píng)估函數(shù);G是智能體e的目標(biāo)集。 1.智能體數(shù)學(xué)模型 定義 1.14 智能體e的狀態(tài)S被

10、一組靜態(tài)或動(dòng)態(tài)屬性刻畫(huà),即,S=S1,SN。 例如,在交通網(wǎng)中,研究智能體的狀態(tài)屬性和環(huán)境的狀態(tài),智能體的狀態(tài)屬性包括智能體的位置、速度、運(yùn)行方向、源地址、目的地址、下一步、智能體之間的動(dòng)態(tài)關(guān)系等等動(dòng)態(tài)屬性;定義 1.15 智能體e的本地有窮動(dòng)作集合是B=b1,bk。 1.智能體數(shù)學(xué)模型 定義 1.16 智能體感知部件的功能是See: S一P,其中,S=s0,s1,.,sm是環(huán)境狀態(tài)集合。該函數(shù)將智能體所在的環(huán)境狀態(tài)映射為感知輸入。定義 1.17 智能體動(dòng)作決策部件的功能是Choose : PB,該函數(shù)刻畫(huà)了它根據(jù)感知信息的狀態(tài)序列確定智能體待實(shí)施的本地動(dòng)作bi。定義 1.18智能體動(dòng)作的執(zhí)行

11、對(duì)環(huán)境狀態(tài)的影響是Change:SXA P(S),其中P是冪集符號(hào)。 1.智能體數(shù)學(xué)模型 定義 1.19一個(gè)智能體通過(guò)使用一個(gè)評(píng)估函數(shù)F進(jìn)行條件的評(píng)價(jià)。例如,在交通網(wǎng)中,評(píng)估函數(shù)包括速度、方向、是否到達(dá)目的地等。 定義 1.20 智能體e可以有一組目標(biāo),記作G=g1,gN。每個(gè)目標(biāo)gi是要取得一個(gè)狀態(tài)S,滿(mǎn)足評(píng)估函數(shù)F取得某個(gè)預(yù)定義的值,即gi=S|F(.)=,其中是一個(gè)常量。 1.智能體數(shù)學(xué)模型 定義 1.21 一個(gè)多智能體系統(tǒng)是三元組 ,符號(hào) IA 用來(lái)表示多智能體集(Intelligent Agent,IA),E 是 IA 駐留的環(huán)境,是系統(tǒng)目標(biāo)函數(shù),通常是智能體狀態(tài)的非線性函數(shù)。 2.

12、多智能體系統(tǒng)數(shù)學(xué)模型 定義 1.22 環(huán)境E=es1,es2,esN,其中每個(gè)esi 對(duì)應(yīng)于一個(gè)靜態(tài)或動(dòng)態(tài)屬性,N為屬性個(gè)數(shù)。 2.多智能體系統(tǒng)數(shù)學(xué)模型 作為一個(gè)多智能體系統(tǒng)中的主要構(gòu)件之一,一個(gè)環(huán)境E通常起著三個(gè)作用。首先,它作為智能體可以活動(dòng)的范圍。這是環(huán)境的靜態(tài)觀點(diǎn)。例如對(duì)于交通網(wǎng),交通環(huán)境是以道路為中心的物的環(huán)境;第二,環(huán)境作為布告牌,其中智能體可以讀取或發(fā)布它們的信息。在這種動(dòng)態(tài)觀點(diǎn)下,環(huán)境始終在改變。在這個(gè)意義上,環(huán)境可以被看作一個(gè)智能體之間的間接的通信媒介。對(duì)于交通網(wǎng)環(huán)境如交通安全設(shè)施、交通信號(hào)、交通標(biāo)線和路面交通標(biāo)示等意義性交通環(huán)境;第三,環(huán)境保持一個(gè)中央時(shí)鐘,如果必要的話(huà),有

13、助于所有智能體的行為。 2.多智能體系統(tǒng)數(shù)學(xué)模型 是自組織系統(tǒng)目標(biāo)函數(shù),是智能體狀態(tài)的非線性函數(shù)。在交通網(wǎng)研究中,目標(biāo)函數(shù)可以是交通網(wǎng)的最短路徑。而涌現(xiàn)行為是智能體之間、智能體和環(huán)境之間的交互產(chǎn)生的,在宏觀層面上呈現(xiàn)出整體協(xié)調(diào)一致的運(yùn)動(dòng)效果。 2.多智能體系統(tǒng)數(shù)學(xué)模型1.2.1 多智能體系統(tǒng)定義與特點(diǎn)1.2.2 多智能體系統(tǒng)的形式化描述1.2.3 多智能體系統(tǒng)理論的發(fā)展1.2.4 多智能體系統(tǒng)應(yīng)用 1.2 多智能體系統(tǒng) 1、在該方面的研究早期,大量的工作集中在對(duì)自然界生物群體建模仿真上。 2、對(duì)多智能體系統(tǒng)的研究進(jìn)入“網(wǎng)絡(luò)化系統(tǒng)與圖論描述”階段。 3、針對(duì)多智能體系統(tǒng)理論的研究進(jìn)入實(shí)際應(yīng)用階段

14、。1.2.1 多智能體系統(tǒng)定義與特點(diǎn)1.2.2 多智能體系統(tǒng)的形式化描述1.2.3 多智能體系統(tǒng)理論的發(fā)展1.2.4 多智能體系統(tǒng)應(yīng)用 1.2 多智能體系統(tǒng)1.智能機(jī)器人2.智能交通3.柔性制造4. 分布式預(yù)測(cè)、監(jiān)控及診斷 5. 虛擬現(xiàn)實(shí) 6. 無(wú)線傳感器網(wǎng)絡(luò)應(yīng)用1.1 自然智能和人工智能1.2 多智能體系統(tǒng)1.3 多智能體系統(tǒng)的主要技術(shù)內(nèi)容1.4 Netlogo仿真工具 第1章 多智能體系統(tǒng)概述 AI的重要任務(wù)就是實(shí)現(xiàn)智能體程序,智能體程序是運(yùn)行在一定的體系結(jié)構(gòu)上。這里的體系結(jié)構(gòu)是指智能體的感知器、執(zhí)行器和承載這些機(jī)構(gòu)的結(jié)構(gòu)。智能體 = 智能體程序 + 智能體體系結(jié)構(gòu) 1.多智能體及環(huán)境建模

15、 AI的重要任務(wù)就是實(shí)現(xiàn)智能體程序,智能體程序是運(yùn)行在一定的體系結(jié)構(gòu)上。這里的體系結(jié)構(gòu)是指智能體的感知器、執(zhí)行器和承載這些機(jī)構(gòu)的結(jié)構(gòu)。智能體 = 智能體程序 + 智能體體系結(jié)構(gòu) 1.多智能體及環(huán)境建模 AI的重要任務(wù)就是實(shí)現(xiàn)智能體程序,智能體程序是運(yùn)行在一定的體系結(jié)構(gòu)上。這里的體系結(jié)構(gòu)是指智能體的感知器、執(zhí)行器和承載這些機(jī)構(gòu)的結(jié)構(gòu)。智能體 = 智能體程序 + 智能體體系結(jié)構(gòu) 1.多智能體及環(huán)境建模 (1)智能體體系結(jié)構(gòu) 智能體體系結(jié)構(gòu)研究在理論體系的基礎(chǔ)上如何設(shè)計(jì)內(nèi)部模塊以及它們之間的關(guān)系,從而使系統(tǒng)具備各種屬性。體系結(jié)構(gòu)為程序提供來(lái)自傳感器的感知信息,運(yùn)行程序,并且把程序產(chǎn)生的行動(dòng)選擇傳送給

16、執(zhí)行器。 1.多智能體及環(huán)境建模 智能體的結(jié)構(gòu)需要解決以下問(wèn)題:Agent由哪些模塊組成;這些模塊之間如何交互信息;Agent感知的信息如何影響它的行為和內(nèi)部狀態(tài);如何將這些模塊用軟件或硬件的方式組合起來(lái)形成一個(gè)有機(jī)的整體。 1.多智能體及環(huán)境建模 (2)各種智能體的體系結(jié)構(gòu)人們提出了各種智能體的理論。大致可以分成三類(lèi):反應(yīng)型智能體、慎思型智能體和混合型智能體。 1.多智能體及環(huán)境建模(1)蜂擁問(wèn)題(flockingProblem)(2)編隊(duì)控制問(wèn)題(Formation Control Problem) (3)聚集問(wèn)題(Rendezvous Problem)(4)同步問(wèn)題(Synchroniz

17、ationProblem) 2.一致性問(wèn)題(Consensus或Agreememt)(1)群集問(wèn)題(Swarming Problem)群集(Swarm)是指在一個(gè)共同的環(huán)境中,以一種連貫和協(xié)調(diào)的方式運(yùn)行的大量、獨(dú)立的異質(zhì)或同質(zhì)智能體集合。群集架構(gòu)(Swarm architectures)促進(jìn)了分散和自組織,這通常會(huì)導(dǎo)致涌現(xiàn)行為(Emergent behaviour)。群體的涌現(xiàn)行為是群體與其環(huán)境(或同伴)相互作用的結(jié)果,而不是設(shè)計(jì)的直接結(jié)果。3.群體智能問(wèn)題 (2)群體智能的概念和特點(diǎn)群體智能(Swarm Intelligence)是指“具有一定自治能力的個(gè)體通過(guò)合作行為表現(xiàn)出復(fù)雜的智能行為特

18、性”。群體智能中的群體是指一組可以(通過(guò)改變局部環(huán)境)進(jìn)行相互通信或間接通信的個(gè)體,這些個(gè)體通過(guò)合作可以進(jìn)行分布問(wèn)題的求解,而這些個(gè)體則只具有較為簡(jiǎn)單的能力或智能。3.群體智能問(wèn)題 (3)群體智能研究方向和主要方法群體智能的研究方向主要有以下幾個(gè)方面: 群體協(xié)作搬運(yùn)物體行為的研究,模擬建立巢穴的行為和自行裝配行為的研究,蟻群覓食過(guò)程的研究,群體任務(wù)分配行為和分工的研究,群體自組織行為及群體分類(lèi)行為的研究等。 研究的主要方法有:多機(jī)器人合作搬運(yùn)算法、模擬建巢算法、蟻群組合優(yōu)化算法和網(wǎng)絡(luò)路由控制算法、多機(jī)器人任務(wù)分配算法、數(shù)據(jù)分析和圖的分割算法等。3.群體智能問(wèn)題 (1)協(xié)同任務(wù)分配問(wèn)題研究 (2

19、)路徑規(guī)劃算法研究 4.認(rèn)知智能體 多智能體系統(tǒng)學(xué)習(xí)大致分為以下三個(gè)階段: A.在學(xué)習(xí)開(kāi)始之前收集數(shù)據(jù)階段; B.單個(gè)智能體對(duì)局部信息的學(xué)習(xí),通過(guò)通信將自己學(xué)習(xí)的部分與其他機(jī)器進(jìn)行交互,從而實(shí)現(xiàn)共享信息; C.各個(gè)智能體綜合所學(xué)習(xí)和共享獲得的信息。 5.多智能體學(xué)習(xí)(1)通信決策(2)通信的代價(jià)(3)通信失敗與恢復(fù)(4)通信語(yǔ)言 6.多智能體通信 多智能體系統(tǒng)在表達(dá)實(shí)際系統(tǒng)時(shí),通過(guò)各智能體間的通訊、合作、互解、協(xié)調(diào)、調(diào)度、管理及控制來(lái)表達(dá)系統(tǒng)的結(jié)構(gòu)、功能及行為特性。 7.多Agent協(xié)作 要研究的Agent,不僅僅具有個(gè)體理性,而且具有集體理性。由這種智能體組成的多Agent系統(tǒng),可以達(dá)到一種

20、平衡的協(xié)作狀態(tài),從而是整個(gè)系統(tǒng)達(dá)到動(dòng)態(tài)穩(wěn)定和優(yōu)化。 7.多Agent協(xié)作1.1 自然智能和人工智能1.2 多智能體系統(tǒng)1.3 多智能體系統(tǒng)的主要技術(shù)內(nèi)容1.4 Netlogo仿真工具 第1章 多智能體系統(tǒng)概述 NetLogo的第一個(gè)實(shí)現(xiàn)是用LISP(列表處理語(yǔ)言)編寫(xiě)的,并于1967年發(fā)布。最初的設(shè)計(jì)目的是向孩子們介紹編程的概念,從而發(fā)展更好的思維能力,并將其轉(zhuǎn)移到其他環(huán)境中。它的目標(biāo)是使初學(xué)者能夠輕松進(jìn)入,同時(shí)滿(mǎn)足高級(jí)用戶(hù)的需求。最著名的標(biāo)志環(huán)境涉及到海龜。海龜最初是一種坐在地板上的虛擬生物,通過(guò)接收用戶(hù)或程序員的指令,它可以被引導(dǎo)四處移動(dòng)。海龜被用來(lái)畫(huà)形狀、圖案和圖畫(huà)。 NetLogo是由

21、Wilensky在1999年編寫(xiě)并發(fā)布的。它最初是由美國(guó)西北大學(xué)的連接學(xué)習(xí)和計(jì)算機(jī)建模中心開(kāi)發(fā)的,目前正在該大學(xué)的連接學(xué)習(xí)和計(jì)算機(jī)建模中心進(jìn)行持續(xù)開(kāi)發(fā)。NetLogo非常適合于對(duì)時(shí)間依賴(lài)的復(fù)雜系統(tǒng)進(jìn)行建模,并且允許用戶(hù)向并發(fā)操作的成百上千個(gè)獨(dú)立智能體發(fā)送指令。這使得我們有可能探索微觀層面的個(gè)人行為與來(lái)自個(gè)體互動(dòng)的宏觀層面模式之間的聯(lián)系。下課了 第2章 反應(yīng)智能體2.1 復(fù)雜自組織系統(tǒng)2.2 反應(yīng)智能體建模2.3 掃地機(jī)器人反應(yīng)行為模型2.4 城市森林公園火災(zāi)撲救反應(yīng)行為模型 第2章 反應(yīng)智能體 復(fù)雜系統(tǒng)呈現(xiàn)出高度的非線性、多態(tài)穩(wěn)定性、時(shí)間不可逆性、分岔、突變、混沌、自組織、自適應(yīng)、高度不確定性

22、和實(shí)時(shí)性等特征,采用經(jīng)典系統(tǒng)科學(xué)的理論和方法難以分析解釋?zhuān)纱苏Q生的一門(mén)科學(xué)稱(chēng)之為復(fù)雜性系統(tǒng)科學(xué),簡(jiǎn)稱(chēng)復(fù)雜性科學(xué)。 1.復(fù)雜性科學(xué) 復(fù)雜性科學(xué),是以研究自然、社會(huì)的復(fù)雜性及復(fù)雜系統(tǒng)為核心,揭示其運(yùn)作演變規(guī)律的科學(xué),體現(xiàn)出非線性、生成性、自組織性等特點(diǎn),以及能夠幫助我們對(duì)各種復(fù)雜現(xiàn)象取得更好理解以便加以控制的理論和方法的科學(xué),被譽(yù)為“21世紀(jì)的科學(xué)”。 1.復(fù)雜性科學(xué) 定義2.1復(fù)雜系統(tǒng)是由大量組分組成的網(wǎng)絡(luò),不存在中央控制,通過(guò)簡(jiǎn)單運(yùn)作規(guī)則產(chǎn)生出復(fù)雜的集體行為和復(fù)雜的信息處理,并通過(guò)學(xué)習(xí)和進(jìn)化產(chǎn)生適應(yīng)性。 2.復(fù)雜系統(tǒng) 如果系統(tǒng)有組織的行為不存在內(nèi)部和外部的控制者或領(lǐng)導(dǎo)者,則稱(chēng)之為自組織(Se

23、lf-organizing)。 自組織是一個(gè)系統(tǒng)在內(nèi)在機(jī)制的驅(qū)動(dòng)下,自行從簡(jiǎn)單向復(fù)雜、從粗糙向細(xì)致方向發(fā)展,不斷提高自身復(fù)雜度和精細(xì)度的過(guò)程。在自組織系統(tǒng)中,微觀層次上一個(gè)相當(dāng)簡(jiǎn)單的行為會(huì)導(dǎo)致整個(gè)系統(tǒng)很復(fù)雜的組織。這種由于簡(jiǎn)單規(guī)則以難以預(yù)測(cè)的方式產(chǎn)生出系統(tǒng)的宏觀行為現(xiàn)象叫做涌現(xiàn)行為(Emergent Behavior)。 2.復(fù)雜系統(tǒng) 人們每時(shí)每刻都處在并能看到許許多多的復(fù)雜系統(tǒng), 如蟻群、生態(tài)、胚胎、神經(jīng)網(wǎng)絡(luò)、人體免疫系統(tǒng)、計(jì)算機(jī)網(wǎng)絡(luò)和全球經(jīng)濟(jì)系統(tǒng)。所有這些系統(tǒng)中, 眾多獨(dú)立的要素在許多方面進(jìn)行著相互作用。在每種情況下, 這些無(wú)窮無(wú)盡的相互作用使每個(gè)復(fù)雜系統(tǒng)作為一個(gè)整體產(chǎn)生了自發(fā)性的自組織。

24、霍蘭把這類(lèi)復(fù)雜系統(tǒng)稱(chēng)為復(fù)雜適應(yīng)系統(tǒng)。 3.復(fù)雜適應(yīng)系統(tǒng) 定義2.2在系統(tǒng)范圍內(nèi)具有適應(yīng)能力的結(jié)構(gòu),并且智能體間具有簡(jiǎn)單的局部交互的功能,這樣的系統(tǒng)可以稱(chēng)作自組織系統(tǒng)。自組織系統(tǒng)是一類(lèi)復(fù)雜系統(tǒng)。復(fù)雜自組織系統(tǒng)具有不同于傳統(tǒng)確定性系統(tǒng)的特點(diǎn),如大規(guī)模、分布式、異構(gòu)、動(dòng)態(tài)以及開(kāi)放等。 4.自組織系統(tǒng) 自組織系統(tǒng)一般具有以下復(fù)雜性特點(diǎn)。(1)駐留環(huán)境的開(kāi)放性自組織系統(tǒng)通常駐留在開(kāi)放的環(huán)境中,環(huán)境的變化不受系統(tǒng)控制并同時(shí)對(duì)系統(tǒng)的演化產(chǎn)生影響,系統(tǒng)需要通過(guò)不斷調(diào)整和組織以適應(yīng)環(huán)境變化。(2)系統(tǒng)演化的適應(yīng)性系統(tǒng)總是向適應(yīng)環(huán)境變化的方向調(diào)整,即演化的方向總是向系統(tǒng)適應(yīng)環(huán)境變化而擁有的一種時(shí)間、空間、功能上的

25、格局。(3)系統(tǒng)個(gè)體自治性,無(wú)集中控制系統(tǒng)中的個(gè)體都是自治的,不受其他個(gè)體控制。(4)涌現(xiàn)性它是指系統(tǒng)通過(guò)內(nèi)部元素的交互在系統(tǒng)整體上產(chǎn)生了新的屬性、特征、性質(zhì)、結(jié)構(gòu)等等。這些新特性無(wú)法從單個(gè)元素中體現(xiàn)。 4.自組織系統(tǒng) 定義2.2在系統(tǒng)范圍內(nèi)具有適應(yīng)能力的結(jié)構(gòu),并且智能體間具有簡(jiǎn)單的局部交互的功能,這樣的系統(tǒng)可以稱(chēng)作自組織系統(tǒng)。自組織系統(tǒng)是一類(lèi)復(fù)雜系統(tǒng)。復(fù)雜自組織系統(tǒng)具有不同于傳統(tǒng)確定性系統(tǒng)的特點(diǎn),如大規(guī)模、分布式、異構(gòu)、動(dòng)態(tài)以及開(kāi)放等。 4.自組織系統(tǒng)2.1 復(fù)雜自組織系統(tǒng)2.2 反應(yīng)智能體建模2.3 掃地機(jī)器人反應(yīng)行為模型2.4 城市森林公園火災(zāi)撲救反應(yīng)行為模型 第2章 反應(yīng)智能體 最基本

26、的AI系統(tǒng)是純反應(yīng)型的,它既不能儲(chǔ)存記憶也不能利用過(guò)去的經(jīng)驗(yàn)來(lái)做決定。深藍(lán)(Deep Blue)是IBM公司開(kāi)發(fā)的國(guó)際象棋超級(jí)計(jì)算機(jī),是這種類(lèi)型機(jī)器的典型示例。它在90年代末曾擊敗了國(guó)際象棋大師Garry Kasparov。 2.2.1純反應(yīng)型智能體 Deep Blue可以識(shí)別棋盤(pán)上的每一個(gè)棋子,并知道每個(gè)棋子在如何移動(dòng)。它還可以預(yù)測(cè)對(duì)手下一步會(huì)怎么走,并從可能性中選擇自己最優(yōu)的移動(dòng)。但是它對(duì)于過(guò)去毫無(wú)概念,對(duì)于過(guò)去的事情沒(méi)有任何記憶。Deep Blue會(huì)忽略一切之前的時(shí)刻,它所做的就是關(guān)注當(dāng)下棋盤(pán)上的棋子,并從目前來(lái)看可能的下一步動(dòng)作中作出選擇。 2.2.1純反應(yīng)型智能體 目前的智能機(jī)器,要

27、不就完全沒(méi)有世界的概念,要不就是只有一個(gè)非常有限和專(zhuān)門(mén)的,與它特定功能相關(guān)的概念。Deep Blue的設(shè)計(jì)創(chuàng)新點(diǎn)不是要拓展計(jì)算機(jī)的認(rèn)知范圍,相反,開(kāi)發(fā)者研發(fā)了一種方法來(lái)將范圍縮小,根據(jù)機(jī)器評(píng)估每一步棋的可能效果,直接去除一些不必要的選項(xiàng)。如果沒(méi)有這項(xiàng)特殊能力,Deep Blue則會(huì)需要一個(gè)更強(qiáng)大的電腦,來(lái)打敗真正的人類(lèi)棋手。 2.2.1純反應(yīng)型智能體 考慮到自然界和人類(lèi)社會(huì)中復(fù)雜系統(tǒng)的多樣性,對(duì)一個(gè)復(fù)雜系統(tǒng)的建模是困難的。為此,我們將從三個(gè)方面來(lái)理解ABM模型:空間環(huán)境、個(gè)體、模擬推進(jìn)。 2.2.2 ABM建模的基本概念 個(gè)體都是生活在具有一定結(jié)構(gòu)的環(huán)境中。環(huán)境提供了個(gè)體生活所需要的信息和資源

28、,個(gè)體可以讀取環(huán)境信息并且發(fā)布信息給環(huán)境,因此環(huán)境是動(dòng)態(tài)變化的。 1.空間環(huán)境(虛擬世界) 在Netlogo中,空間環(huán)境包括由無(wú)數(shù)小方塊組成的虛擬網(wǎng)格世界和實(shí)際地圖場(chǎng)景兩種類(lèi)型。柵格法(網(wǎng)格法)是將環(huán)境分解成一組網(wǎng)格單元,采用矩陣表示工作環(huán)境,每一個(gè)矩形柵格都有一個(gè)值與之對(duì)應(yīng),表示在該網(wǎng)格中存在障礙物,表示智能體可以運(yùn)動(dòng)空間。每個(gè)網(wǎng)格的坐標(biāo)用其中心點(diǎn)的位置坐標(biāo)代替,將工作環(huán)境等分成M*N的小方格,障礙物用灰色網(wǎng)格表示(不足一格的按一格算),與可運(yùn)行空間區(qū)別開(kāi)。實(shí)際生產(chǎn)應(yīng)用中常需要建立電子地圖用來(lái)表示工作環(huán)境。 1.空間環(huán)境(虛擬世界) 在虛擬網(wǎng)格世界中,世界的本質(zhì)是離散的。世界是是由地塊組成的

29、2維網(wǎng)格,其基本區(qū)域稱(chēng)為patch(地塊)。每個(gè)地塊是一塊正方形的“地面”(ground)。例如。在汽車(chē)跟馳模型中,汽車(chē)處于一個(gè)二維的虛擬網(wǎng)格世界中,環(huán)境就是一條道路。通過(guò)將地塊著不同的顏色,同時(shí)利用一些屬性,模擬我們現(xiàn)實(shí)生活中的街區(qū),道路,紅綠燈。海龜,就是這里面可以移動(dòng)的汽車(chē)。 1.空間環(huán)境(虛擬世界) 定義2.3 環(huán)境ES通過(guò)一個(gè)集合描述,ES=es1,es2,esN,其中每個(gè)esi對(duì)應(yīng)于一個(gè)靜態(tài)或動(dòng)態(tài)屬性,N為屬性個(gè)數(shù)。在每個(gè)時(shí)刻,ES也描述了環(huán)境E的當(dāng)前狀態(tài)。如圖2.1所示,為了讓智能體識(shí)別障礙物,每個(gè)esi對(duì)應(yīng)于一個(gè)方格,將灰色網(wǎng)格單元用1表示,白色網(wǎng)格單元用0表示,這樣,整個(gè)工作

30、環(huán)境即表示為一個(gè)M*N的0-1矩陣表示。 1.空間環(huán)境(虛擬世界) 1.空間環(huán)境(虛擬世界) 智能體存在于它們的環(huán)境之中。環(huán)境是決定智能體行為的基礎(chǔ)。面向智能體的系統(tǒng)的復(fù)雜性不僅是智能體與其他智能體交互的結(jié)果,也是智能體與環(huán)境交互的結(jié)果。虛擬環(huán)境是測(cè)試人工智能系統(tǒng)的一個(gè)很好的方法。 2.個(gè) 體 定義2.4個(gè)體是模型中包括狀態(tài)S、行為B和行為規(guī)則R等屬性的實(shí)體(圖2.2)。 2.個(gè) 體 (2)Patches(地塊,靜態(tài)Agent)這些都是固定的智能體,在Netlogo世界的網(wǎng)格中,每一個(gè)小方塊都是這樣的一個(gè)智能體。除了正方形,地塊不能顯示任何形狀,但是每個(gè)地塊都可以有自己的顏色。 2.個(gè) 體 (

31、3)Observer(觀察者,虛擬Agent)總是有這樣一種智能體,我們可以把它看作Netlogo本身(實(shí)質(zhì)上,觀察者就是我們用戶(hù))。這個(gè)智能體并不顯示在Netlogo世界中,但是它是唯一一個(gè)可以在模型中執(zhí)行某些全局操作的智能體(例如執(zhí)行clear-all命令)。 2.個(gè) 體 (4)Links(鏈接,靜態(tài)Agent)這些是連接一只海龜和另一只海龜?shù)闹悄荏w。沒(méi)有直接移動(dòng)鏈接的指令;當(dāng)端點(diǎn)上的一只或兩只海龜移動(dòng)時(shí),鏈接就會(huì)移動(dòng)。(鏈接也可以配置為tie,其中一個(gè)端點(diǎn)turtle的移動(dòng)將強(qiáng)制另一個(gè)端點(diǎn)turtle移動(dòng))。鏈接可以是定向的,也可以是無(wú)定向的:對(duì)于無(wú)定向鏈接,我們不認(rèn)為鏈接是從一只海龜?shù)?/p>

32、另一只海龜,而僅僅認(rèn)為鏈接在這兩只海龜之間。另一方面,定向鏈接總是從一只海龜?shù)搅硪恢缓}敗?2.個(gè) 體 定義2.5個(gè)體的狀態(tài)S被一組靜態(tài)和動(dòng)態(tài)屬性刻畫(huà),即,S=S1,SN。個(gè)體的屬性是個(gè)體內(nèi)部的描述,是個(gè)體區(qū)別于其他個(gè)體的特征所在。個(gè)體的屬性可以分為靜態(tài)(固定)和動(dòng)態(tài)屬性,靜態(tài)屬性不可更新,例如個(gè)體的標(biāo)識(shí)、內(nèi)部基因等。動(dòng)態(tài)屬性可以更新,例如個(gè)體的位置、生命期、興趣特征等。個(gè)體的屬性可以被其他的局部臨近個(gè)體進(jìn)行查閱和調(diào)用,作為其他局部個(gè)體的更新依據(jù)。 3.個(gè)體狀態(tài) (1)Netlogo的turtles個(gè)體的屬性在Netlogo中創(chuàng)建的每個(gè)智能體都有特定的屬性特征,我們可以查看Patches 和t

33、urtles的屬性,把鼠標(biāo)箭頭放在智能體上,點(diǎn)擊鼠標(biāo)右鍵,檢查Patches 和turtles的屬性。turtles是:who, color, heading, xcor, ycor, shape, label,label-color,breed,hidden?,size,pen-size 和pen-mode。 3.個(gè)體狀態(tài) (2)地塊屬性Netlogo的每個(gè)地塊都有一些內(nèi)置的數(shù)據(jù)屬性,patches個(gè)體的屬性比較簡(jiǎn)單,包括pxcor(地塊x坐標(biāo)),pycor(地塊y坐標(biāo)),pcolor(地塊顏色),plabel(地塊標(biāo)記)和plabel-color(地塊標(biāo)記顏色),注意地塊變量前面都有字符p

34、。 3.個(gè)體狀態(tài) 定義2.6Agent的本地動(dòng)作是B=b1,bN。Agent的本地動(dòng)作像創(chuàng)生,前進(jìn),后退,左轉(zhuǎn),右轉(zhuǎn)等,這些內(nèi)置于Netlogo中的命令稱(chēng)為原語(yǔ)。在Netlogo中,命令在概念上等同于我們通常所說(shuō)的語(yǔ)句,要執(zhí)行的更改系統(tǒng)狀態(tài)的動(dòng)作的規(guī)范。 Netlogo的動(dòng)作可以是系統(tǒng)內(nèi)置的原語(yǔ)動(dòng)作,例如move-to,back (bk),die,forward (fd),jump,left(lt),sprout等,也可以是用戶(hù)自定義的函數(shù)動(dòng)作。用戶(hù)還要根據(jù)實(shí)際問(wèn)題的需要,自己創(chuàng)建各種動(dòng)作。在Netlogo中是用函數(shù)實(shí)現(xiàn)的。例如,在跟馳模型中,主要的動(dòng)作就是加速和減速。 4.個(gè)體動(dòng)作 定義2.

35、7Agent的行為規(guī)則集是R=r1,rN。每個(gè)行為規(guī)則ri是要選擇一個(gè)或多個(gè)在每一步要執(zhí)行的本地行為。個(gè)體的規(guī)則是個(gè)體行為選擇的依據(jù)。個(gè)體的行為選擇模擬個(gè)體的決策機(jī)制。個(gè)體的規(guī)則由條件(IF)和行為(Behavior)組成。每個(gè)規(guī)則形式如下:Rule:If 條件then 行為例如,在跟馳模型中,主要的行為規(guī)則就是:Rule:if(前面有車(chē))then 減速 else 加速 5.個(gè)體行為規(guī)則 定義2.8Agent的鄰居是一組實(shí)體Ne=n1,nm.每個(gè)鄰居ni和實(shí)體e之間的關(guān)系(例如距離)滿(mǎn)足一個(gè)和應(yīng)用相關(guān)的約束。在不同MAS系統(tǒng)中,一個(gè)實(shí)體的鄰居可以是固定的或動(dòng)態(tài)的改變。例如,在Boids系統(tǒng)中,

36、在一個(gè)Boid的可視范圍內(nèi)其他Boid被視為它的鄰居。因此Boids到處飛,他們的鄰居隨著時(shí)間動(dòng)態(tài)變化。 6.個(gè)體鄰居 地塊可以與海龜和其他地塊相互作用。patch的全部意義在于,它們提供了一個(gè)海龜可以與之互動(dòng)的環(huán)境。turtle能夠直接訪問(wèn)所在之處的patch,對(duì)該patch的屬性進(jìn)行讀寫(xiě)。 7.個(gè)體環(huán)境交互 在Netlogo模擬中本質(zhì)上是離散的:世界(空間)是離散的(網(wǎng)格、地塊)。時(shí)間也是離散的。Netlogo 許多模型的時(shí)間是按小間隔推進(jìn)的,一個(gè)小間隔叫滴答(ticks)。一般情況下你希望每個(gè)滴答視圖更新一次。這就是基于時(shí)鐘更新的默認(rèn)行為。如果需要額外的更新,可以使用display命令強(qiáng)

37、制更新(如果使用速度滑動(dòng)條快進(jìn),這些更新會(huì)被跳過(guò))。 8.系統(tǒng)更新 智能是一種涌現(xiàn)現(xiàn)象,即整體宏觀態(tài)總是具有一些特別的屬性,而這些屬性并不存在于構(gòu)成整體的微觀態(tài)中,而這些整體的特殊屬性又是依賴(lài)于微觀態(tài)元素的相互作用而產(chǎn)生的。 9.宏觀模式涌現(xiàn) 模式(pattern):簡(jiǎn)單相互作用在宏觀尺度形成一定模式。涌現(xiàn):模式從無(wú)到有的過(guò)程, 如市場(chǎng)價(jià)格形成,組織的誕生。NetLogo提供了許多不同的模型,說(shuō)明它采用的面向智能體的編程范式擅長(zhǎng)以一種不復(fù)雜的方式對(duì)一系列令人驚訝的現(xiàn)象進(jìn)行建模。 9.宏觀模式涌現(xiàn)2.1 復(fù)雜自組織系統(tǒng)2.2 反應(yīng)智能體建模2.3 掃地機(jī)器人反應(yīng)行為模型2.4 城市森林公園火災(zāi)撲

38、救反應(yīng)行為模型 第2章 反應(yīng)智能體1.問(wèn)題背景2.3 掃地機(jī)器人反應(yīng)行為模型掃地機(jī)器人可以避開(kāi)障礙物,但可以通過(guò)簡(jiǎn)單的反應(yīng)行為快速覆蓋所有環(huán)境。1.問(wèn)題背景本模型模擬了一個(gè)掃地機(jī)器人,它的任務(wù)是清潔房間的地板。用戶(hù)可以在環(huán)境中繪制障礙物,以更好地表現(xiàn)真實(shí)的生活環(huán)境。該模型實(shí)現(xiàn)了機(jī)器人的基本反應(yīng)行為一種使用簡(jiǎn)單的向前看機(jī)制,對(duì)前方的任何障礙物做出反應(yīng)(圖2.4)。1.問(wèn)題背景機(jī)器人agent只是在環(huán)境中隨機(jī)走動(dòng)以避開(kāi)障礙物?!跋蚯翱础毙袨槭鞘褂肗etLogo的“向前看patch-ahead ”命令實(shí)現(xiàn)的,用來(lái)檢查前面是否有任何障礙,如果有,它將隨機(jī)轉(zhuǎn)動(dòng)一個(gè)方向。1.問(wèn)題背景該模型的目的是表明不需

39、要使用復(fù)雜的方法來(lái)覆蓋環(huán)境的整個(gè)空間?;诨緜鞲械碾S機(jī)行走的簡(jiǎn)單反應(yīng)方法就足夠了。1.問(wèn)題背景1.問(wèn)題背景2.模型設(shè)計(jì)2.3 掃地機(jī)器人反應(yīng)行為模型參數(shù)名稱(chēng)參數(shù)說(shuō)明取值范圍robot-size機(jī)器人大小210robot-speed機(jī)器人速度0.15rate-of-random-turn隨機(jī)轉(zhuǎn)動(dòng)率0100boundary-width邊界寬度110radius-length半徑長(zhǎng)度0203.主要算法代碼2.3 掃地機(jī)器人反應(yīng)行為模型;1、全局變量及其屬性breed robots robot ;掃地機(jī)器人品種名稱(chēng)patches-owndustglobals background-colour ;

40、除障礙物外的背景顏色 obstacles-colour ; 除障礙物的顏色 robot-colour ; 機(jī)器人的顏色 n(1)定義變量;2、設(shè)置過(guò)程to setup clear-all setup-globals ;2.1設(shè)置全局變量 set-patches;2.2設(shè)置背景屬性 set-robot;2.3創(chuàng)建機(jī)器人reset-ticksend(2)定義setup函數(shù);2.1設(shè)置全局變量to setup-globalsset-default-shape robots vacuum cleaner robot ;為每個(gè)品種設(shè)定形狀 sets shapes for each breed set b

41、ackground-colour white ;背景色設(shè)置為淡黃色set colour of background light yellow set obstacles-colour brown ;設(shè)置障礙的顏色為棕色set colour of obstacles brown set robot-colour red ;設(shè)置機(jī)器人的顏色 set colour of robotend(2)定義setup函數(shù);2.2設(shè)置背景屬性to set-patches ask patches set pcolor background-colour ;設(shè)定背景顏色 set colour of backgrou

42、nd if (pxcor = max-pxcor - boundary-width) set pcolor brown if (pxcor = max-pycor - boundary-width) set pcolor brown if (pycor = min-pycor + boundary-width) set pcolor brown ask patches ifelse random 1 = 28 and pxcor = -3 and pycor 0 ;感知到視覺(jué)范圍內(nèi)有樹(shù) avoid-tree;3.2避開(kāi)樹(shù) flock;3.3 給每只鳥(niǎo)調(diào)整一下方向 adjust-heading

43、repeat 5 ask boids fd 0.2 display ;用來(lái)使海龜?shù)膭?dòng)畫(huà)更流暢。 ; ask turtles fd 1 為了獲得更高的效率,以犧牲平滑的動(dòng)畫(huà)為代價(jià),用本行替換 tickend(3)定義go函數(shù);3.1 這定義了機(jī)器人應(yīng)該如何移動(dòng)。; 這種行為來(lái)自Models庫(kù)中的Look Ahead示例模型;“向前看”:機(jī)器人會(huì)直接向前看,看是否有障礙物,距離由半徑長(zhǎng)度滑塊確定,如果有,則隨機(jī)旋轉(zhuǎn)一個(gè)方向。to make-move let this-patch patch-ahead radius-lengthifelse (this-patch != nobody) and (

44、pcolor of this-patch = obstacles-colour) lt random-float 360 ;看見(jiàn)前面有一塊障礙物,旋轉(zhuǎn)一個(gè)隨機(jī)數(shù)量。 fd 1 ;否則,繼續(xù)前進(jìn)是安全的。 if dust = 1 set dust 0 set n n - 1 end3.1 集體運(yùn)動(dòng)和編隊(duì)隊(duì)形3.2 基于人工勢(shì)場(chǎng)的機(jī)器人避障模型3.3 無(wú)人機(jī)追捕逃犯模型 第3章 一致性問(wèn)題1.問(wèn)題背景3.3 無(wú)人機(jī)追捕逃犯模型該模型描述了多個(gè)逃犯在受到無(wú)人機(jī)追捕時(shí)的行為。該模型通過(guò)模擬追捕無(wú)人機(jī)的群集機(jī)制,解釋了逃犯的視覺(jué)和距離以及無(wú)人機(jī)的捕獵成功率的影響。逃犯和無(wú)人機(jī)都觀察它們的環(huán)境以適應(yīng)其他品

45、種。當(dāng)無(wú)人機(jī)總是移動(dòng)或捕獵時(shí),逃犯移動(dòng)并觀察無(wú)人機(jī)的環(huán)境。根據(jù)與無(wú)人機(jī)的距離,逃犯要么和其他逃犯一起在附近的環(huán)境中,要么試圖逃離無(wú)人機(jī)。1.問(wèn)題背景1.問(wèn)題背景2.模型設(shè)計(jì)3.3 無(wú)人機(jī)追捕逃犯模型參數(shù)名稱(chēng)參數(shù)說(shuō)明取值范圍number-drone無(wú)人機(jī)數(shù)量0100number-person逃犯數(shù)量0100vision視覺(jué)距離110minimum-separation最小距離010hunter-success-rate追捕成功率0100movement-speed移動(dòng)速度013.主要算法代碼3.3 無(wú)人機(jī)追捕逃犯模型breed drones drone;食肉動(dòng)物breed persons per

46、son;食草動(dòng)物globals eaten-person;這里每只鳥(niǎo)有兩個(gè)屬性;第一個(gè)屬性是flockmates,表示在視野范圍內(nèi),除自己以外所有的鄰居鳥(niǎo);第二個(gè)屬性是nearest-neighbor,表示離這只鳥(niǎo)最近的鄰居(1)定義變量persons-own flockmates;視野內(nèi)的鳥(niǎo),鳥(niǎo)的感知范圍 next-flockmate;最近的鄰伴 flock-distance ;聚集距離 flee-distance;逃離距離 person-viewing-distance;食草動(dòng)物視覺(jué)距離 person-viewing-angle;食草動(dòng)物視覺(jué)角度drones-own drone-viewi

47、ng-distance;食肉動(dòng)物視覺(jué)距離 drone-viewing-angle;食肉動(dòng)物視覺(jué)角度(1)定義變量to setup clear-all make-drone number-drone ;2.1 make-person number-person ;2.2 ask patches set pcolor white set eaten-person number-person reset-ticksend(2)定義setup函數(shù);2.1 設(shè)置場(chǎng)景to setup-patches ask patches set pcolor whiteend;2.2設(shè)置全部變量to setup-glo

48、bals set fires-left-in-sim number-of-fires set dead-trees 0 set saved-trees 0end(2)定義setup函數(shù);2.1制造無(wú)人機(jī)to make-drone number create-drones number set color red set shape drone setxy pxcor pycor set size 1.5 if not any? drones-on patch-ahead 1 fd random 2 + 1 set drone-viewing-distance 12 set drone-view

49、ing-angle 110 end(2)定義setup函數(shù);2.2創(chuàng)建人員to make-person number create-persons number set color blue set shape person setxy pxcor pycor if not any? persons-on patch-ahead 1 fd random 10 + 10 set person-viewing-distance vision set person-viewing-angle 360 set flock-distance (vision * 0.75) set flee-distan

50、ce (vision * 0.5) end(2)定義setup函數(shù)(3)定義go函數(shù);3.每一個(gè)時(shí)間步,食草動(dòng)物通過(guò)觀察,聚集或逃離,食肉動(dòng)物尋找獵物。to go ask persons if observe-for-predators flock-distance flock;3.1感知并3.2聚集 if observe-for-predators flee-distance flee ;3.1感知并3.3逃離 move ;3.4移動(dòng) ask drones hunt;3.5 尋找獵物 move;3.4移動(dòng) tickend下課了 第4章 蟻群自組織與共識(shí)自主性4.1 蟻群優(yōu)化概述4.2 蟻群算

51、法的基本實(shí)現(xiàn)技術(shù)4.3 蟻群覓食問(wèn)題4.4 月球巖石搜索機(jī)器人路徑規(guī)劃 第4章 蟻群自組織與共識(shí)自主性4.1 蟻群優(yōu)化概述4.1.1 引言4.1.2 蟻群算法工作原理4.1.3 蟻群算法的基本流程4.1.4 蟻群算法應(yīng)用當(dāng)一只螞蟻發(fā)現(xiàn)食物后,會(huì)把它帶回蟻巢,同時(shí)沿途釋放信息素吸引其他同伴。所以途中螞蟻越多,信息素也就越強(qiáng)。這種信息素就是螞蟻家族在其演化過(guò)程中所形成的一種信息傳遞方式,也是一種非常有效的產(chǎn)生共識(shí)的方式。同樣,我們?nèi)祟?lèi)演化出來(lái)的語(yǔ)言、文字、肢體語(yǔ)言,我們創(chuàng)造的紅綠交通燈、人機(jī)交互用的鍵盤(pán)、屏幕,以及各種各樣的標(biāo)準(zhǔn)、規(guī)則、法律等等,都是共識(shí)的不同呈現(xiàn)方式。 1.蟻群算法簡(jiǎn)介 螞蟻是一

52、種社會(huì)化的動(dòng)物,通過(guò)高度的社會(huì)化來(lái)進(jìn)行組織和分工協(xié)作,從而完成一些無(wú)法通過(guò)單個(gè)螞蟻來(lái)完成的任務(wù)。蟻群算法就是根據(jù)螞蟻種群的覓食行為、任務(wù)分配行為和巢穴清理行為等蟻群的生物原型而發(fā)展起來(lái)的。 2.蟻群算法生物原型(1)AS蟻群算法(2)ACS蟻群算法(3)MMAS蟻群優(yōu)化算法 3.蟻群算法的發(fā)展4.1 蟻群優(yōu)化概述4.1.1 引言4.1.2 蟻群算法工作原理4.1.3 蟻群算法的基本流程4.1.4 蟻群算法應(yīng)用 1.蟻群優(yōu)化原理 蟻群算法的機(jī)制原理描述如下:信息素和周邊環(huán)境是聯(lián)結(jié)螞蟻的重要組成部分。面對(duì)不同的環(huán)境,反應(yīng)也各有不同,造成的影響也不盡相同。 1.蟻群優(yōu)化原理 將圖4.1蟻群行為等效成

53、圖4.2的賦權(quán)圖。 1.蟻群優(yōu)化原理 蟻群算法中的人工螞蟻具有如下的特征:(1)系統(tǒng)性(2)自組織性(3)正反饋(4)負(fù)反饋(5)分布并發(fā)性 2.蟻群算法的特點(diǎn)4.1 蟻群優(yōu)化概述4.1.1 引言4.1.2 蟻群算法工作原理4.1.3 蟻群算法的基本流程4.1.4 蟻群算法應(yīng)用(1)感知范圍域螞蟻觀察到的范圍是一個(gè)方格世界,相關(guān)參數(shù)為速度半徑,一般為3,可觀察和移動(dòng)的范圍為3x3方格。1.蟻群的規(guī)則(2)環(huán)境信息螞蟻所在環(huán)境中有障礙物、其他螞蟻、信息素,其中信息素包括食物信息素(找到食物的螞蟻留下的)、窩信息素(找到窩的螞蟻留下的),信息素以一定速率消失。1.蟻群的規(guī)則(3)覓食規(guī)則螞蟻在感知

54、范圍內(nèi)尋找食物,如果感知到就會(huì)過(guò)去;否則朝信息素多的地方走,每只螞蟻會(huì)以小概率犯錯(cuò)誤,并非都往信息素最多的方向移動(dòng)。螞蟻找窩的規(guī)則類(lèi)似,僅對(duì)窩信息素有反應(yīng)。1.蟻群的規(guī)則(4)移動(dòng)規(guī)則螞蟻朝信息素最多的方向移動(dòng),當(dāng)周?chē)鷽](méi)有信息素指引時(shí),會(huì)按照原來(lái)運(yùn)動(dòng)方向慣性移動(dòng)。而且會(huì)記住最近走過(guò)的點(diǎn),防止原地轉(zhuǎn)圈。1.蟻群的規(guī)則(5)避障規(guī)則當(dāng)螞蟻待移動(dòng)方向有障礙物時(shí),將隨機(jī)選擇其他方向;當(dāng)有信息素指引時(shí),將按照覓食規(guī)則移動(dòng)。1.蟻群的規(guī)則(6)散發(fā)信息素規(guī)則在剛找到食物或者窩時(shí),螞蟻散發(fā)的信息素最多;當(dāng)隨著走遠(yuǎn)時(shí),散發(fā)的信息素將逐漸減少。1.蟻群的規(guī)則for ant in colony do /蟻群中每條

55、螞蟻都逐個(gè)更新自己路徑經(jīng)過(guò)邊上的的信息素 tour = ant.getTour(); /螞蟻計(jì)算路徑的總長(zhǎng)度 pheromoneToAdd = getParam(Q) / tour.distance(); /螞蟻計(jì)算信息素的更新值 for nodeIndex in tour do /回溯路徑中的每個(gè)城市 if lastnode(nodeIndex) do / 如果節(jié)點(diǎn)是路徑上的最后節(jié)點(diǎn),取出它和第一個(gè)節(jié)點(diǎn)間的邊 edge = getEdge(nodeIndex, 0) else edge = getEdge(nodeIndex, nodeIndex+1)/否則,取當(dāng)前節(jié)點(diǎn)和路徑下一個(gè)節(jié)點(diǎn)間的邊

56、 currentPheromone = edge.getPheromone(); /獲得邊上之前的信息素 edge.setPheromone(currentPheromone + pheromoneToAdd)/原有信息素加更新后新信息素 end for / ant路徑上所有的邊的信息素更新完畢end for /蟻群中所有螞蟻都處理完畢2.算法步驟4.1 蟻群優(yōu)化概述4.1.1 引言4.1.2 蟻群算法工作原理4.1.3 蟻群算法的基本流程4.1.4 蟻群算法應(yīng)用覓食問(wèn)題,又被稱(chēng)為搜索問(wèn)題多機(jī)器人隊(duì)形控制多機(jī)器人地圖構(gòu)建路徑規(guī)劃追捕策略多機(jī)器人協(xié)作物體操作多目標(biāo)觀測(cè)問(wèn)題機(jī)器人足球4.1 蟻群優(yōu)

57、化概述4.2 蟻群算法的基本實(shí)現(xiàn)技術(shù)4.3 蟻群覓食問(wèn)題4.4 月球巖石搜索機(jī)器人路徑規(guī)劃 第4章 蟻群自組織與共識(shí)自主性 轉(zhuǎn)移概率就是螞蟻從一個(gè)點(diǎn)出發(fā)如何判斷選擇下一個(gè)目的地的過(guò)程。在行進(jìn)過(guò)程中,螞蟻是以先行螞蟻?zhàn)哌^(guò)路徑所留下來(lái)的信息素作為自己的運(yùn)行指引,螞蟻趨向于選擇信息素濃度更大的方向行進(jìn)。 4.2.1 蟻群算法中的轉(zhuǎn)移概率 在尋找最優(yōu)路徑的過(guò)程中,螞蟻在經(jīng)過(guò)的路段上留下信息素作為溝通協(xié)調(diào)機(jī)制,它告訴經(jīng)過(guò)這里的螞蟻一些經(jīng)驗(yàn),幫助它們判斷該走那條路比較合適。信息素越多的路段上被螞蟻選中的概率就增大,但是信息素在路段上不是一直增大的,它會(huì)隨著時(shí)間的推移而不斷揮發(fā),以此來(lái)降低信息素的濃度和數(shù)量

58、,避免螞蟻尋找最優(yōu)路徑的過(guò)程中陷入了局部最優(yōu)。這種信息素的揮發(fā)機(jī)制增強(qiáng)了螞蟻的全局搜索能力。而且,經(jīng)過(guò)螞蟻數(shù)量少的路徑上信息素?fù)]發(fā)的更快,螞蟻?zhàn)叩亩嗟穆窂叫畔⑺貢?huì)越來(lái)越多,這種機(jī)制增強(qiáng)了蟻群算法的正反饋機(jī)制,使得螞蟻群體逐漸趨向于最終的一條最優(yōu)路徑的附近。4.2.2 信息素更新機(jī)制 在不同的算法模型里, 和 的表達(dá)的形式有所區(qū)別,要視具體問(wèn)題來(lái)具體對(duì)待。目前為止,普遍接受的模型有三種,分別是蟻密系統(tǒng)模型、蟻周系統(tǒng)模型和蟻量系統(tǒng)模型。 4.1 蟻群優(yōu)化概述4.2 蟻群算法的基本實(shí)現(xiàn)技術(shù)4.3 蟻群覓食問(wèn)題4.4 月球巖石搜索機(jī)器人路徑規(guī)劃 第4章 蟻群自組織與共識(shí)自主性1.問(wèn)題背景4.3 蟻群覓

59、食問(wèn)題螞蟻離開(kāi)它們的巢穴,到處亂走尋找食物。螞蟻在覓食和筑巢的過(guò)程中會(huì)釋放出一種揮發(fā)性化學(xué)物質(zhì)信息素。這種化學(xué)物質(zhì)可以被其他螞蟻用它們的觸須感知到,并作為刺激其他螞蟻跟隨化學(xué)物質(zhì)的蹤跡。隨著許多螞蟻開(kāi)始跟隨這條路徑,路徑上的化學(xué)沉積物得到加強(qiáng)。其他螞蟻的旅行頻率起到了正反饋的作用,蟻群的濃度沿著化學(xué)路徑增加。1.問(wèn)題背景實(shí)驗(yàn)1:同時(shí)為蟻群提供從巢穴到食物來(lái)源的兩條等長(zhǎng)等形橋;實(shí)驗(yàn)2:有兩個(gè)橋,一個(gè)橋的長(zhǎng)度是另一個(gè)橋的兩倍;實(shí)驗(yàn)3:實(shí)驗(yàn)開(kāi)始30分鐘后出現(xiàn)了短分枝的橋。1.問(wèn)題背景在第一種情況下,螞蟻隨意選擇了任何一條路徑,并通過(guò)頻繁地在這條路徑上移動(dòng)而強(qiáng)化了化學(xué)物質(zhì)的沉積。在第二種情況下,蟻群在

60、兩種選擇中選擇了最短路徑;在第三個(gè)實(shí)驗(yàn)中,因?yàn)楫?dāng)最短的分枝被展示出來(lái)的時(shí)候,螞蟻已經(jīng)在最長(zhǎng)的樹(shù)枝上建立了化學(xué)痕跡。在化學(xué)物質(zhì)沒(méi)有蒸發(fā)的情況下,螞蟻繼續(xù)選擇最長(zhǎng)的路徑,留下最短的路徑。1.問(wèn)題背景在模型中,最初我們會(huì)在模擬世界的中心有一個(gè)巢穴,巢穴周?chē)袃啥咽澄飦?lái)源。雖然每只螞蟻都遵循一套簡(jiǎn)單的規(guī)則,但整個(gè)蟻群的行為卻很復(fù)雜。這背后的原理是,當(dāng)每只螞蟻找到了一塊食物,它會(huì)把食物帶回蟻穴,并在移動(dòng)的過(guò)程中釋放出一種叫做信息素的化學(xué)物質(zhì)。當(dāng)其他螞蟻“嗅”到這種信息素時(shí),它們會(huì)跟隨它走向食物。隨著越來(lái)越多的螞蟻把食物帶到蟻穴,它們加強(qiáng)了信息素的蹤跡。1.問(wèn)題背景2.模型設(shè)計(jì)4.3 蟻群覓食問(wèn)題3.主要

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論