機器人控制技術(shù)基礎(chǔ):多智能體協(xié)調(diào)控制-修改_第1頁
機器人控制技術(shù)基礎(chǔ):多智能體協(xié)調(diào)控制-修改_第2頁
機器人控制技術(shù)基礎(chǔ):多智能體協(xié)調(diào)控制-修改_第3頁
機器人控制技術(shù)基礎(chǔ):多智能體協(xié)調(diào)控制-修改_第4頁
機器人控制技術(shù)基礎(chǔ):多智能體協(xié)調(diào)控制-修改_第5頁
已閱讀5頁,還剩90頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

多智能體系統(tǒng)協(xié)調(diào)控制

復(fù)雜系統(tǒng)定義:定義1:通過對一個系統(tǒng)的子系統(tǒng)的了解不能對系統(tǒng)的性質(zhì)作出完全的解釋,這樣的系統(tǒng)稱之為復(fù)雜系統(tǒng)。何謂復(fù)雜系統(tǒng)?關(guān)于復(fù)雜系統(tǒng)的界定關(guān)于復(fù)雜系統(tǒng)的基本推論對于復(fù)雜系統(tǒng),我們有以下的基本假設(shè):A1)相對于任何有限資源,在本質(zhì)上,一個復(fù)雜系統(tǒng)的整體行為不能通過獨立分析其各部分的行為而確定;A2)相對于任何有限資源,在本質(zhì)上,一個復(fù)雜系統(tǒng)的整體行為不能預(yù)先在大范圍(例如在時間或空間上)內(nèi)確定。C1)應(yīng)當(dāng)采用整體論的觀點考慮復(fù)雜系統(tǒng)的問題。C2)復(fù)雜系統(tǒng)問題一般不存在“一勞永逸”的解決方案。C3)復(fù)雜系統(tǒng)問題一般不存在一般意義下的最優(yōu)解,更不存在唯一的最優(yōu)解。定義2:通過對一個系統(tǒng)的子系統(tǒng)的了解不能對系統(tǒng)的性質(zhì)作出完全的解釋,這樣的系統(tǒng)稱之為復(fù)雜系統(tǒng)。復(fù)雜系統(tǒng)的要素1.模型:系統(tǒng)的模型通常用主體(agent)及其相互作用來描述,或者用演化的變結(jié)構(gòu)描述。

2.目標(biāo):以系統(tǒng)的整體行為,如涌現(xiàn)(emergence)等作為主要研究目標(biāo)和描述對象。

3.規(guī)律:以探討一般的演化動力學(xué)規(guī)律為目的。例如,冪律(powerlow),遺傳規(guī)則,自組織臨界性(Self-OrganizedCriticality)等。

弱定義智能體是用來完成某類任務(wù)的能作用于自身和環(huán)境、有生命周期的一個物理的或抽象的計算實體。(2)強定義智能體在弱定義基礎(chǔ)上,還要包括人類的情感特征,甚至具備諸如通信能力和理性等,而且這些特性會隨著環(huán)境變化而不斷地進(jìn)行能動的自我更新。智能體(Agent)定義自治性(Autonomy)

在沒有外界干預(yù)的情況下自主完成任務(wù)的能力。通訊能力(CommunicationCapability)

智能體必須具有與其他智能體或環(huán)境通訊以便獲取信息的能力。協(xié)作能力(CapacityforCooperation)

智能體必須具有協(xié)作精神以便共同合作。任務(wù)分解能力(TaskDecomposition)

機器人個體應(yīng)該能夠?qū)Ξ?dāng)前的任務(wù)做出判定(任務(wù)是大是小,是簡單是復(fù)雜),并根據(jù)做出的判定,決定是單獨執(zhí)行任務(wù)還是同其它個體協(xié)作執(zhí)行任務(wù)。智能體(Agent)特點自適應(yīng)性(AdaptiveBehavior)

為了維護(hù)自治和推理能力,智能體必須能評估外部環(huán)境的當(dāng)前狀態(tài)并將其融入有關(guān)下一步行動的決策之中。推理能力(CapacityforReasoning)

推理能力是智能體區(qū)別于其他軟件的關(guān)鍵所在??偠灾?智能體是設(shè)計用來完成某類任務(wù)的,能在一定環(huán)境中自主發(fā)揮作用、有生命周期的計算實體,是在帶有過程性的、動態(tài)連續(xù)的進(jìn)程中的發(fā)展智能。多智能體系統(tǒng)(MAS):多智能體系統(tǒng)是由多個智能體組成的具有松散耦合結(jié)構(gòu)的,通過系統(tǒng)中智能體之間以及智能體與環(huán)境之間進(jìn)行通信、協(xié)商和協(xié)作來共同完成單個智能體(Agent)由于能力、知識或資源上的不足而無法解決的問題的系統(tǒng)。復(fù)雜適應(yīng)性系統(tǒng)研究對象:以智能體(agent)作為子系統(tǒng)的模擬對象研究內(nèi)容:研究智能群體的若干類協(xié)調(diào)行為的動態(tài)特性研究目的:如何對多智能體動態(tài)合作行為進(jìn)行數(shù)學(xué)建模,并將其應(yīng)用于人工世界(多機器人、多無人機等的協(xié)作編隊控制)1)魯棒性(Robustness)

沒有固定的中心控制,不會由于一個或某幾個個體的故障影響整個群體行為。2)分散性(DecentralizedCharacteristics)

整個系統(tǒng)的信息,包括數(shù)據(jù)、知識和控制等,無論在邏輯上或者物理上都是分布的,不存在全局控制和數(shù)據(jù)存儲單元。3)自組織(Selforganized)

個體自主演化使得群體表現(xiàn)出顯著的整體性質(zhì),即涌現(xiàn)(Emergence)。多智能體系統(tǒng)動態(tài)行為基本特征多智能體系統(tǒng)的控制結(jié)構(gòu)集中式

一個Agent集中控制整個系統(tǒng),它是一種規(guī)劃與決策的自上而下式的層次控制結(jié)構(gòu)。該系統(tǒng)的協(xié)調(diào)性較好,但實時性、動態(tài)性較差,對環(huán)境變化響應(yīng)能力差。分散式各Agent具有高度的自治能力,自行處理信息、規(guī)劃與決策、執(zhí)行指令,與其它Agent相互通訊以協(xié)調(diào)各自行為,而沒有集中控制單元。分散式結(jié)構(gòu)有較好的容錯能力和擴展性,但對通訊要求較高,且多邊協(xié)作效率較低,無法保證全局目標(biāo)的實現(xiàn)。分布式分布式控制結(jié)構(gòu)介于上述兩種結(jié)構(gòu)之間,是一種全局上各Agent等同的分層、局部集中的結(jié)構(gòu)。這種結(jié)構(gòu)是分散式的水平交互和集中式的垂直控制相結(jié)合的產(chǎn)物,既提高了協(xié)調(diào)效率,又不影響系統(tǒng)的實時性、動態(tài)性、容錯性。多智能體系統(tǒng)的協(xié)作方式黑板通信黑板機制包括三個組件:黑板,知識源和控制機制。黑板是狀態(tài)的表示,可以被所有知識源訪問,包括傳感器的輸入、執(zhí)行機構(gòu)的反饋等。知識源包括系統(tǒng)中求解問題的組件,是每個智能體對環(huán)境的建模結(jié)果。知識源之間相互獨立,之間的任何通信都要通過改變黑板。黑板結(jié)構(gòu)的優(yōu)點是模塊化和全局知識共享,并且使得模塊間的異步通信成為可能顯式通信智能體之間根據(jù)固定的網(wǎng)絡(luò)地址,使用相應(yīng)的通信協(xié)議,進(jìn)行消息的傳輸。其優(yōu)點是可以實現(xiàn)任意點之間的信息交換,但當(dāng)系統(tǒng)中Agent的數(shù)量增加時,通信的負(fù)擔(dān)將使系統(tǒng)的運行效率下降,限制了應(yīng)用范圍。

多智能體系統(tǒng)的體系結(jié)構(gòu)同構(gòu)多智能體系統(tǒng)

系統(tǒng)中每個智能體的結(jié)構(gòu)相同,功能相同,通常由成百上千的智能群體組成。特點:適用于大空間范圍內(nèi)無時間要求的重復(fù)性操作的系統(tǒng)。典型特征是由大量同構(gòu)智能體組成群體,每個智能體的能力有限,大量的此類簡單智能體協(xié)作時,通過局部的相互作用“涌現(xiàn)”出完整的有意義的社會行為。異構(gòu)多智能體系統(tǒng)

系統(tǒng)通常由幾個到幾十個能執(zhí)行特定任務(wù)的異構(gòu)機器人組成,關(guān)鍵問題是如何在它們之間進(jìn)行有意識的合作。主要的研究問題是具有適應(yīng)性的行動選擇,通信和沖突的解決,它們對系統(tǒng)的性能具有決定性的作用。多智能體系統(tǒng)的研究意義

多個智能體相互協(xié)作以完成超出它們各自能力范圍的任務(wù),使得系統(tǒng)整體能力大于個體能力之和,因此能夠勝任比較復(fù)雜的任務(wù)。這是目前控制理論研究領(lǐng)域的一個熱點課題,具有重要的理論和現(xiàn)實意義。多智能體系統(tǒng)的應(yīng)用多智能體系統(tǒng)協(xié)調(diào)控制的研究熱點智能群體的群集行為控制多機器人系統(tǒng)隊形控制多智能體動態(tài)網(wǎng)絡(luò)的一致性控制一.生物群體的群集行為(FlockingBehavior)

群集行為是指一群自主的運動個體能夠保持成團隊的形式向某一目標(biāo)地邁進(jìn)。在對個體行為建模的時候一方面需要有使得群體保持集聚在一起的能力,另一方面也要使得個體具有對環(huán)境所施于的刺激(跟蹤的目標(biāo)物的位置信息)做出適當(dāng)反應(yīng)的能力。群集行為研究的三個階段:1.生物學(xué)家大量的研究和探索階段(1)雁群遷徙行為排成整齊的一字形或人字形隊列,有利于大雁的自我調(diào)整以避開天敵或障礙等(2)鹿群逃避行為以合理的隊形統(tǒng)一行動,而不是作胡亂分散,某只鹿可能沒有看到天敵,但其可以根據(jù)鄰近的其它鹿的奔跑方向來決定自己的行動方式。(3)蜜蜂筑巢行為在沒有可供參考的設(shè)計藍(lán)圖或領(lǐng)導(dǎo)者的指導(dǎo)的情形下,蜂群能構(gòu)建具有結(jié)構(gòu)強度最優(yōu)的蜂巢(4)蟻群覓食行為蟻群在覓食的時候能夠在巢穴與食物之間形成一條最優(yōu)路線。當(dāng)路上出現(xiàn)障礙物時,它們會設(shè)法繞過,并在不同路徑中選優(yōu)。此外,有些群集行為可以展示很好的流動性和均勻性。2.實驗物理學(xué)家和計算機專家的仿真和實驗階段普遍采用模擬仿生的方法證明生物群集現(xiàn)象可以由個體的簡單行為規(guī)律獲得。目前由大規(guī)模的簡單、同類型的個體自組織地形成某種模式、存儲信息或完成聯(lián)合決策所表現(xiàn)出來的群體涌現(xiàn)特性十分普遍,即使是更加簡單的個體規(guī)則,個體之間非線性的交互也能導(dǎo)致大規(guī)模群體內(nèi)部產(chǎn)生復(fù)雜的涌現(xiàn)行為。

1986年,克雷格·雷諾茲(Reynolds)做了一個模擬動物協(xié)作運動的計算機模型的開創(chuàng)性工作并稱這種仿真的群生物為“boid”。這種基本的群模型包括了三個簡單的指導(dǎo)規(guī)則,它們描述了一個單個的“boid”如何基于位置和鄰近個體的速度進(jìn)行分離、內(nèi)聚和排列運動,從而首次給出了群集的形式化定義。群集運動規(guī)則(1)群中心定位(Cohesion)試圖與鄰近的個體保持接近;(2)避免碰撞(Separation)避免與鄰近的個體發(fā)生沖突;(3)速度匹配(Alignment)試圖與鄰近的個體速度匹配這三個規(guī)則被稱為雷諾茲聚結(jié)規(guī)則,深入研究這些規(guī)則事實上導(dǎo)致了第一個聚結(jié)的動物靈活性行為的創(chuàng)造。這種靈活性類似于鳥類的群遷。

定義:如果所有Agent取得相同的速度向量,兩兩之間的距離穩(wěn)定并且沒有碰撞發(fā)生,一組移動Agent就稱為一個(漸近地)群集。雷諾茲給出的形式化定義是:1)分離性(separation):各成員之間避免碰撞。2)內(nèi)聚性(cohesion):各成員朝著一個平均的位置進(jìn)行聚合3)排列性(alignment):各成員沿著一個平均的方向共同運動3.群集行為動力學(xué)嚴(yán)格數(shù)學(xué)建模及分析階段此階段為群體系統(tǒng)研究走向量化的關(guān)鍵步驟,研究中可考慮綜合生物領(lǐng)域與工程領(lǐng)域的研究成果,一方面使得受自然生物群體的協(xié)調(diào)行為啟發(fā)而研究的工程智能群體行為能夠獲得自然現(xiàn)象中的某些特性,如群體涌現(xiàn)的協(xié)調(diào)性(由簡單的局部個體行為產(chǎn)生的基于目標(biāo)的全局群體行為);自適應(yīng)性(即在變化的環(huán)境中能自行選擇和跟蹤新目標(biāo)的能力);魯棒性(不依賴于固定的“領(lǐng)導(dǎo)者”,面對擾動時能繼續(xù)保持搜索目標(biāo)的行為)。另一方面通過研究實際復(fù)雜工程群體系統(tǒng)的控制與設(shè)計工作,有可能幫助研究人員對生物群體動態(tài)行為的涌現(xiàn)機制產(chǎn)生新的理解和認(rèn)識。

群集行為的基本特點個體動態(tài)+通訊拓?fù)?/p>

每個個體都有一定自主能力,包括一定程度的自我運動控制,局部范圍內(nèi)的信息傳感,處理和通信能力。系統(tǒng)中個體通過局部信息交換相互作用,調(diào)整自身動態(tài)行為,整體動力學(xué)由每個個體動態(tài)和個體間通信拓?fù)渌鶝Q定。由于個體自主運動和局部信息傳感能力,當(dāng)彼此相互或進(jìn)入個體的局部通信范圍時,關(guān)聯(lián)特性不斷變化

簡單的個體行為規(guī)則和局部信息產(chǎn)生從自然和社會的種種群體現(xiàn)象來看,群體行為完全可以在簡單的個體行為基礎(chǔ)之上自組織產(chǎn)生,每個個體都遵循相同或相似的運動規(guī)則,這些規(guī)則通常只規(guī)定個體如何根據(jù)獲得的局部信息做出相應(yīng)的基本反應(yīng),而與群體運動行為或目標(biāo)無直接關(guān)系。群體行為是所有個體關(guān)聯(lián)合作而涌現(xiàn)出的自組織運動,不同的關(guān)聯(lián)方式會產(chǎn)生不同的群體行為,如何分析和設(shè)計個體行為規(guī)則和關(guān)聯(lián)耦合結(jié)構(gòu)是控制理論與應(yīng)用的新課題。

群集動力學(xué)建模方法歐拉法

在歐拉法中,群體集結(jié)模型是使用通量來描述的連續(xù)集模型,通量也稱為某一區(qū)域的個體密度,即一個群體集結(jié)模型中的每個個體成員不作為單個實體來研究,而是通過密度概念將整個群體作為一個連續(xù)集來進(jìn)行整體描述。基于歐拉法的群體集結(jié)模型就是測量單位區(qū)域內(nèi)個體的數(shù)目(即群體密度分布函數(shù)),并使用歐拉連續(xù)方程(偏微分方程)來描述群體的密度分布函數(shù)。優(yōu)點:無需對群體所處環(huán)境作空間離散化處理,對于描述大規(guī)模密集而沒有明顯不連續(xù)分布的群體集結(jié)行為非常有效。缺點:忽略了個體的特性,對于很多由有限數(shù)量的大體積或強調(diào)個體智能特性的個體成員組成的群體不太適合使用基于歐拉法的連續(xù)集模型,如魚群、鳥群等的群體集結(jié)行為。

拉格朗日法使用基于個體的決策方法來作為控制群體運動和集結(jié)的規(guī)則。拉格朗日法建立的群體集結(jié)模型中,基本的描述就是每個個體各自的運動方程,以拉格朗日方程描述個體的受力和運動方程為:

式中Fik包括群組成員聚集或分散的力(即描述個體之間的吸引力或排斥力作用)、與鄰近個體速度與方向相匹配的作用力、確定的環(huán)境影響力(如萬有引力)以及由環(huán)境或其它個體行為產(chǎn)生的隨機擾動作用力。F是所有這些作用力的總和。綜上所述,拉格朗日法群體集結(jié)模型一般可以理解為群體集結(jié)行為就是在個體之間的吸引力和排斥力共同作用下的結(jié)果,而這種吸引力/排斥力函數(shù)在當(dāng)個體之間的距離較長時表現(xiàn)為吸引力作用,當(dāng)個體之間的距離較短時則表現(xiàn)為排斥力作用,從而在避免個體之間由于過度接近導(dǎo)致相互碰撞的同時保持群體的集結(jié)行為。

歐拉法和拉格朗日法的不同之處在于后者將個體的位置信息都體現(xiàn)在模型之中,而前者則以群體在所處物理空間中的密度分布作為建?;A(chǔ)。

區(qū)分原則:是以每個個體為對象研究其受到的群體中其它個體所施加的作用力影響還是研究群體在物理空間中的分布狀況。歐拉模型中對群體所處物理空間的連續(xù)性假設(shè)多適合于體型較小的菌類或一些多細(xì)胞生物如昆蟲、磷蝦等。當(dāng)分析由較大體型生物群體如魚群、鳥群、獸群等時,“群體所處物理空間是連續(xù)集”這一假設(shè)不再滿足?;诜抡娴娜后w模型轉(zhuǎn)而通過為群體中的個體建立模擬實際生物個體動態(tài)行為規(guī)則,用離散時間方程組來刻畫運動。代表模型:Boid

模型,Starlogo模型(MIT),Swarm模型(SantaFeInstitute)優(yōu)點:可以為個體如何完成群體行為提供一個明確的視覺過程。缺點:缺乏理論分析的手段,實際智能個體行為的復(fù)雜性在仿真中也難以復(fù)制,不能保證現(xiàn)實生物系統(tǒng)就是遵循這樣的簡單規(guī)則。

人工勢場模型:

主要思想:構(gòu)造一個人工勢能場使得Agent在受到環(huán)境中目標(biāo)吸引的同時也受到障礙物排斥,使Agent能夠在復(fù)雜的環(huán)境中完成任務(wù)。環(huán)境中不同成員的特性共同構(gòu)成了整個系統(tǒng)的人工勢能場,相互之間的互聯(lián)關(guān)系得到了體現(xiàn),各Agent的行為受到整個人工勢能場控制,環(huán)境中各種互聯(lián)關(guān)系都影響著每個個體的行為。

優(yōu)點:簡單易行,各Agent的動態(tài)行為易于理解和分析,從初始位置出發(fā)沿著負(fù)梯度方向前進(jìn),避開障礙物從而到達(dá)目的地;由于勢場函數(shù)建立的整個勢場空間是連續(xù)的,因此避免了復(fù)雜的離散規(guī)劃。對于局部勢場分析方法來說不要求獲得全局信息,對環(huán)境中障礙物等不要求先驗知識。群集系統(tǒng)交互作用建模目標(biāo)產(chǎn)生的吸引力和障礙物產(chǎn)生的排斥力示意圖等勢線分布在人工勢場中,群體系統(tǒng)動態(tài)方程可以表示為式中,xi表示個體i的狀態(tài)向量,Wij表示個體之間作用強度和權(quán)值,Va,Vr為個體之間相互作用勢函數(shù)。若Wij=0表示個體i,j之間沒用相互作用,通常令Wii=0,若Wij=Wji,則稱個體i,j作用為對稱的,矩陣W為關(guān)聯(lián)/通信拓?fù)浣Y(jié)構(gòu)數(shù)學(xué)工具—網(wǎng)絡(luò)化系統(tǒng)和代數(shù)圖論群集系統(tǒng)是由多個個體通過某種相互作用形成的一類網(wǎng)絡(luò)化互聯(lián)系統(tǒng),因此在數(shù)學(xué)上可以用圖論來進(jìn)行描述和研究。圖論的表達(dá)方式簡潔明了,是一種能夠簡單的將各Agent之間的互聯(lián)關(guān)系清晰表達(dá)的工具。一般采用頂點代表各Agent或環(huán)境中不同因素的狀態(tài),邊表示頂點之間的互聯(lián)關(guān)系,邊的方向表示信息的流向,這樣多Agent系統(tǒng)各組成部分之間的關(guān)系就一目了然。

一個群集系統(tǒng)可以表示為G={V,E,A}:V是非空節(jié)點集合,由所有個體組成;E是邊的集合,代表所有個體的相互作用關(guān)系;A稱為鄰接矩陣,描述圖中所有節(jié)點的鄰接關(guān)系和連接方式,用來刻畫群集系統(tǒng)的關(guān)聯(lián)拓?fù)浣Y(jié)構(gòu)。按照個體作用方式的不同,可分為有向圖和無向圖。一般描述Leader-following型群集系統(tǒng)的圖是有向的,而描述各向同性的群集系統(tǒng)的圖是無向圖。此外,在研究圖上的群集動力學(xué)時,描述圖拓?fù)浣Y(jié)構(gòu)的拉普拉斯矩陣是有力的工具,其他諸如連通圖,生成樹,平衡圖等概念和性質(zhì)也具有重要的應(yīng)用。群集模型的描述考慮由N個智能體組成的群集系統(tǒng),其中每個智能體的動力學(xué)方程為:智能體i的三個控制項它的控制輸入由三個控制項組成:

ai來源于Ri與之鄰近的機器人之間的相對位置所產(chǎn)生的勢場為Vi,它對應(yīng)著群集運動的內(nèi)聚性與分離特性,以使作群集運動的機器人之間相互避碰以及產(chǎn)生穩(wěn)定的距離。

αi用于調(diào)整機器人Ri的速度與其它機器人的平均速度相匹配,相當(dāng)于排列性。是另外一個勢場函數(shù),確保機器人Ri在環(huán)境中運動時,有效避免與環(huán)境中的靜態(tài)障礙物碰撞。

機器人之間勢場函數(shù)的選取,在鄰接圖中,兩相鄰的機器人Ri與Rj的人工勢場函數(shù)Vij是一個關(guān)于距離rij的非負(fù)、可微、無界的函數(shù),并得滿足如下條件:(1)當(dāng)||rij||->0時,Vij(rij)->(2)當(dāng)機器人Ri與機器人Rj之間得距離rij達(dá)到一定的值時,Vij存在唯一的最小值;人工勢場函數(shù)

總之,群集用一個“勢場”(Potentialfield)的概念就統(tǒng)一了諸如奔向目標(biāo)點,隊形保持、避障等各個子行為,使得運動協(xié)調(diào)的過程更加接近于現(xiàn)實的物質(zhì)世界;而對“勢場”進(jìn)行精確量化又使得群集成為一種可度量的運動協(xié)調(diào)模式。而與跟隨領(lǐng)航者法相比,由于方法中期望距離與夾角關(guān)系為固定的剛性(Rigid)編隊,而群內(nèi)部個體之間的幾何關(guān)系則顯得更加靈活,其編隊行為會根據(jù)系統(tǒng)初始狀態(tài)與外界環(huán)境的變化進(jìn)行實時調(diào)整。群集靈活的編隊形式,使其能更適應(yīng)真實環(huán)境下的任務(wù),這與自然界中“群”行為是和諧一致的。二.多機器人系統(tǒng)隊形控制(FormationControl)

所謂隊形控制是指多個機器人在到達(dá)目的地的過程中,保持某種隊形,同時又要適應(yīng)環(huán)境約束(例如存在障礙物或者空間的物理限制)的控制技術(shù)。多移動機器人的編隊運動,要求多個移動機器人同時運動到目標(biāo)區(qū)域,并在運動過程中始終保持給定隊形,能夠自適應(yīng)的進(jìn)行隊形切換安全地避開可能出現(xiàn)的障礙物.搜尋(foraging)任務(wù):

在大環(huán)境中,隨機分散地放一些目標(biāo),機器人群體的任務(wù)就是找到它們,并把它們帶回某個特定的位置.協(xié)作搬運(objecttransport)任務(wù):這一任務(wù)通常要求分散的幾個機器人圍繞對象形成某個幾何形狀的隊形,并將其運送到一個特定的地點。應(yīng)用包括覓食和搜索。遍歷(grazing)任務(wù):

要求機器人群體能夠充分地遍歷整個環(huán)境區(qū)域,它的潛在應(yīng)用包括區(qū)域覆蓋、偵察,探索等工作。多機器人系統(tǒng)編隊的應(yīng)用

編隊控制是一個具有典型性和通用性的多機器人協(xié)調(diào)控制問題,是許多多機協(xié)調(diào)問題的基礎(chǔ)。通過研究開發(fā)及實用化,該技術(shù)在農(nóng)業(yè)生產(chǎn)、柔性制造、無人探險(海洋、太空、核環(huán)境),國防工業(yè)等均有著巨大的應(yīng)用前景。多機器人系統(tǒng)編隊的研究意義多機器人系統(tǒng)編隊的研究方法產(chǎn)生式方法:基本思想:通過給定多機器人一些IF-THEN規(guī)則,使得當(dāng)隊形不規(guī)整的時候,使機器人很容易的調(diào)整自己的位置。優(yōu)點:反應(yīng)速度快,實時性好。缺點:就是人為指定的規(guī)則可能會遺漏或者沖突,而且不能適用于相對復(fù)雜的情況。領(lǐng)航跟隨(Leader-following)法:主要思想:在多機器人群體中,某個機器人被指定為領(lǐng)航者,其余作為它的跟隨者,跟隨者以一定的距離間隔跟蹤領(lǐng)航機器人的位姿。對該方法進(jìn)行拓展,即不僅可以指定一個領(lǐng)航者,也可以指定多個。根據(jù)領(lǐng)航者與跟隨機器人之間的相對位置關(guān)系,就可以形成不同的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),也就是說,形成不同的隊形。

優(yōu)點:僅僅給定領(lǐng)航者的行為或軌跡就可以控制整個機器人群體的行為缺點:是系統(tǒng)中沒有明確的隊形反饋控制產(chǎn)生的誤差有可能在信息傳輸?shù)倪^程中被逐漸擴大。此外就是單點故障,Leader是整個結(jié)構(gòu)的靈魂,它的行為決定了整個隊列的行為如果領(lǐng)航機器人失效,那么整個隊形陷入癱瘓,隊形就會無法保持。解決辦法:反饋線形化技術(shù)引入到編隊中。該方法的主要思想是:機器人通過自定位模塊獲取本機器人的當(dāng)前位姿信息,通過通訊模塊獲取相關(guān)機器人的當(dāng)前位姿信息,從而計算本機器人與相關(guān)機器人的相對距離、方向等參數(shù)。在給定的隊形(機器人與相關(guān)機器人相對位置的信息)下,機器人利用運動學(xué)方程來產(chǎn)生其需要移動的方向和速度,從而達(dá)到編隊的目的。該方法中,協(xié)作是通過相關(guān)機器人位姿信息的共享實現(xiàn)的。虛擬結(jié)構(gòu)(virtualstructure)法

主要思想:剛體在多自由度空間中運動時,剛體上各點之間的相對位置保持不變。用機器人代替剛體上的某些點,并以剛體的坐標(biāo)系統(tǒng)作為參考坐標(biāo)系。系統(tǒng)運動時機器人之間的相對位置也保持不變,即機器人之間可以保持一定的幾何形狀。這樣的結(jié)構(gòu)稱為虛擬結(jié)構(gòu)。雖然每個機器人相對于參考系統(tǒng)的位置不變,但它仍可以以一定的自由度來改變自己的方向。多機器人以剛體上的不同點作為各自的跟蹤目標(biāo)就可以形成一定的隊形。

優(yōu)點:容易指定機器人群體的行為(虛擬結(jié)構(gòu)的行為),并可以進(jìn)行隊形反饋,能夠取得較高精度的軌跡跟蹤效果。而且機器人之間沒有明確的功能劃分,不涉及復(fù)雜的通信協(xié)議。缺點:要求隊形在虛擬結(jié)構(gòu)下運動,限制了該方法的應(yīng)用范圍。基于行為(Behavior-based)法主要思想:為機器人定義一些期望的基本行為,包括避碰、避障、沿墻行走、駛向目標(biāo)和保持隊形等。當(dāng)機器人的傳感器接受到外界環(huán)境刺激時,根據(jù)傳感器的輸入信息做出反應(yīng),并輸出反應(yīng)向量作為該行為的期望反應(yīng)(例如,方向和運動速度)。行為選擇模塊通過一定的機制來綜合各行為的輸出,并將處理結(jié)果作為機器人對環(huán)境刺激的反應(yīng)而輸出

關(guān)于動作選擇機制的研究,是基于行為主義的多智能體協(xié)調(diào)研究的熱點和核心問題。目前的行為選擇機制主要有三種:Arkin加權(quán)平均法:

將各個行為的輸出向量乘以一定的權(quán)重再求出它們的矢量和(權(quán)值的大小對應(yīng)相應(yīng)行為的重要性),矢量和經(jīng)過正則化后作為機器人的輸出。

缺點:控制意義不明確,而且由于把每個子行為平等看待,所以各子行為之間相互干擾,從而影響整體的控制效果。

Brooks行為抑制法:對各個行為按一定的原則規(guī)定優(yōu)先級,選擇高優(yōu)先級行為的輸出作為機器人的輸出,即高優(yōu)先級的行為抑制低優(yōu)先級的行為

缺點:需要一個仲裁器來判斷行為優(yōu)先級,或者采用投票的方法來選擇行為。在每一時刻控制變量都有明確意義,由于各子行為在控制過程中不停切換,控制結(jié)果不平滑,而且完成任務(wù)所需的時間較長。模糊邏輯法:根據(jù)模糊規(guī)則綜合各行為的輸出,從而確定機器人的輸出。其實這種方法是加權(quán)平均法的變異,它根據(jù)具體情況來確定權(quán)值大小。

總之,基于行為法的優(yōu)點為每個機器人均可兼顧各種行為,同時利于實時控制。當(dāng)機器人具有多個競爭性目標(biāo)時,可以很容易的得出控制策略。由于機器人根據(jù)其它機器人位置進(jìn)行反應(yīng),系統(tǒng)中有明確的隊形反饋。該方法的另一個優(yōu)點是可以實現(xiàn)分布式控制。缺點:不能明確地定義群體行為,很難對其進(jìn)行數(shù)學(xué)分析,并且不能保證隊形的穩(wěn)定性等。另外各子行為的融合具有不可知性,且融合的方法不容易確定,隨著環(huán)境復(fù)雜性的增加,融合的難度也加大。三.多智能體動態(tài)網(wǎng)絡(luò)的一致性(Consensus)

系統(tǒng)科學(xué)中Consensus這個詞譯為群體中的成員通過與其他成員的信息交流及共同約定的簡單相互作用,使群體達(dá)成共同的意向。Consensus是保留在英文中的拉丁詞匯con=共同,sensus=感覺,consensus=共同的感知,共同的認(rèn)識,共謀,在中文文獻(xiàn)中譯為一致。

1995年,Vicsek等提出了一個簡單但引起巨大關(guān)注的多移動智能體(Agent)(即點或者粒子)模型。所有智能體以相同的速率但不同的運動方向在平面上作自主運動,每個智能體的運動方向按照它當(dāng)前的運動方向與它的“近鄰(Neighbors)”運動方向之和的平均值來更新。在某時刻,一個智能體的近鄰集合是指位于以該智能體的當(dāng)前位置為圓心,一個事先給定的值為半徑的圓上或圓內(nèi)的所有智能體。

Vicsek等在文中給出了一系列有趣的仿真結(jié)果。這些結(jié)果說明,盡管沒有集中的協(xié)調(diào),并且每個智能體的最近鄰的集合在系統(tǒng)演變的過程中隨時間而改變,模型所采用的“最鄰近規(guī)則”卻能夠使所有智能體的運動方向最終趨于一致,并且通過在一個有界區(qū)域增加智能體的密度,使得多智能體網(wǎng)絡(luò)拓?fù)渥優(yōu)檫B通時,可以觀察到相變現(xiàn)象。粒子群系統(tǒng)的相變現(xiàn)象群體行為一致性的數(shù)學(xué)描述群體的動力學(xué)系統(tǒng)(行為)是由(大量)個體(Agent)個體間通信網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)及控制協(xié)議確定。考慮有M個動力學(xué)個體的群體,每個個體之間通過通信網(wǎng)絡(luò)保持某種信息交流,這種信息交換的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)可以用一個圖來描述其中V為節(jié)點集,E為邊集。定義

為邊集權(quán)重矩陣,用以刻畫智能體間的相互作用。若則稱這個網(wǎng)絡(luò)圖是對稱的,無向的否則稱這個網(wǎng)絡(luò)圖是有向圖。若為時間的函數(shù),被稱為動態(tài)(時變)有向圖(或無向圖),若為隨機變量,稱為隨機圖。記節(jié)點的鄰居集合為

用表示個體的狀態(tài)(這個狀態(tài)可以是位置,速度等感興趣的變量)

從宏觀的角度出發(fā),對群體而言,個體可以看成是一個簡單動力學(xué)單元,在研究中往往撇開個體復(fù)雜的動力學(xué)性質(zhì),抽象其最基本的性質(zhì),用質(zhì)點動力學(xué)來建模。在連續(xù)時間下,滿足簡單的動力學(xué)規(guī)則則下面的控制協(xié)議則連續(xù)時間下群體行為動態(tài)模型相應(yīng)地,在離散時間下的群體行為動態(tài)模型可以表示成其中我們稱群體趨向于一致,就是認(rèn)為它們的狀態(tài)漸近收斂到一個共同狀態(tài)空間,也就是最終實現(xiàn)一致性的含義就是:任給初始狀態(tài)其中與系統(tǒng)的動力學(xué)方程有關(guān),也與各x的始狀態(tài)有關(guān)。當(dāng)系統(tǒng)一致的狀態(tài)可以表示為其中是總體決策意向

表示節(jié)點的度,同時定義矩陣。中第個元素為。第個元素為則矩陣為圖的拉普拉斯矩陣。L矩陣在研究線性一致性問題上是一個核心概念,對一個圖而言,L矩陣的特征根總是非負(fù)實部的,并且至少具有一個零特征根。1.時不變網(wǎng)絡(luò)下的群體行為一致性

在時不變網(wǎng)絡(luò)條件下,對任何一個體它的鄰居集都是固定不變的,并且權(quán)重也是固定不變的。系統(tǒng)可以用下面這個線性時不變系統(tǒng)來表示常數(shù)矩陣是對應(yīng)網(wǎng)絡(luò)圖矩陣

借助于圖論和矩陣分析的知識,對于固定無向拓?fù)渚W(wǎng)絡(luò)結(jié)構(gòu)下,上述群體系統(tǒng),實現(xiàn)一致性的充分必要條件是網(wǎng)絡(luò)具有連通的拓?fù)鋱D;在有向信息通信網(wǎng)絡(luò)下,群體系統(tǒng)達(dá)到一致性當(dāng)且僅當(dāng)交流網(wǎng)絡(luò)拓?fù)鋱D中有一個可達(dá)點,也即拓?fù)鋱D的L矩陣具有單個零特征根。一般的,我們用表示L的M個特征根,并且滿足則群體行為一致性的代數(shù)判別準(zhǔn)則是:

如果群體模型用離散時間系統(tǒng)表示,則我們有

其中第個元素為,第個元素為那么為了實現(xiàn)一致性,圖的連通性條件和連續(xù)系統(tǒng)完全一樣,記的特征根為

為了實現(xiàn)一致性,它相應(yīng)的代數(shù)判別準(zhǔn)則是

注:當(dāng)動態(tài)個體滿足運動定律時,也可獲得類似的結(jié)果。即只要網(wǎng)絡(luò)圖是連通的,群體行為即能實現(xiàn)一致性。個體的動態(tài)的性質(zhì)若更復(fù)雜一些,網(wǎng)絡(luò)的連通性不再是充分條件;實現(xiàn)狀態(tài)一致還需要個體動態(tài)系統(tǒng)滿足一些附加條件,當(dāng)群體間通訊信息是數(shù)字網(wǎng)絡(luò)(采樣系統(tǒng))時,系統(tǒng)為了實現(xiàn)一致性,除了網(wǎng)絡(luò)的連通性,也還須需其它條件。2.時變網(wǎng)絡(luò)下的群體行為一致性

許多群體的網(wǎng)絡(luò)系統(tǒng)具有時變的性質(zhì)!通訊過程中節(jié)點間連接的失敗,傳輸過程中信息丟失等原因,都能造成網(wǎng)絡(luò)系統(tǒng)具有時變的性質(zhì)。特別值得關(guān)注的情況是:群體在整個活動過程中,通訊網(wǎng)絡(luò)的連通性在過程中是無法保證的;甚至在任何時刻,系統(tǒng)的網(wǎng)絡(luò)都是不連通的!對這類時變通訊網(wǎng)絡(luò)條件下的一致性問題的研究是目前的研究的熱點和難點??紤]如下離散時間系統(tǒng)

是一個分段常值矩陣,取決于群體在t時刻的通訊網(wǎng)絡(luò)結(jié)構(gòu),此時該系統(tǒng)的動態(tài)網(wǎng)絡(luò)圖應(yīng)用來描述,定義一組網(wǎng)絡(luò)圖集相應(yīng)有網(wǎng)絡(luò)圖邊集合定義成為聯(lián)合網(wǎng)絡(luò)圖邊集,如果聯(lián)合網(wǎng)絡(luò)圖連通或具有一個可達(dá)點,則稱網(wǎng)絡(luò)在區(qū)間上是聯(lián)合連通的(或聯(lián)合具有可達(dá)點),令,于是可得如下的基本結(jié)果:若群體的網(wǎng)絡(luò)在所有的區(qū)間上都是聯(lián)合連通的,則該群體的行為可以實現(xiàn)一致性。3.時滯系統(tǒng)中群體行為一致性

當(dāng)個體之間的網(wǎng)絡(luò)通信存在時滯時,就會影響群體的整體行為。以連續(xù)時間系統(tǒng)為例,假設(shè)從個體個體的信息傳遞交流存在時滯體通常采用控制協(xié)議

假設(shè)時滯是時不變的,而且等于一個常數(shù),那么有以下定理:

定理1:假設(shè)通訊網(wǎng)絡(luò)是一個無向固定的連通拓?fù)鋱D,并且所有的時滯那么對于任意的初始狀態(tài),協(xié)議解決群體行為一致性的充要條件是.其中

為連通拓?fù)鋱D的最大特征值

若考慮時變有向通訊網(wǎng)絡(luò),如果個體采用控制協(xié)議,則對于任意的常數(shù)時滯,在一定條件下群體也可以解決一致性問題。假設(shè)時滯是單時變的時候常采用函數(shù)和方法探討解決群體行為的一致性問題,當(dāng)時滯為多

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論