多機(jī)器人編隊(duì)控制策略探索_第1頁(yè)
多機(jī)器人編隊(duì)控制策略探索_第2頁(yè)
多機(jī)器人編隊(duì)控制策略探索_第3頁(yè)
多機(jī)器人編隊(duì)控制策略探索_第4頁(yè)
多機(jī)器人編隊(duì)控制策略探索_第5頁(yè)
已閱讀5頁(yè),還剩24頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

SSI2002,SLAC,August6-15,2002 PAGE1*Kurt.Hubner@cern.ch1緒論1.1課題背景及意義隨著機(jī)器人的工作環(huán)境從結(jié)構(gòu)化的工廠車間擴(kuò)展到了非結(jié)構(gòu)化的一般性環(huán)境,機(jī)器人的控制方式也從預(yù)編程控制方式發(fā)展到了基于人工智能和自主控制方法。非結(jié)構(gòu)化的應(yīng)用場(chǎng)合拉動(dòng)了機(jī)器人對(duì)智能和自主能力的需求。在一些應(yīng)用場(chǎng)合,單一的機(jī)器人受個(gè)體能力和可靠性等諸多因素的制約,有時(shí)難于應(yīng)對(duì)復(fù)雜的工作內(nèi)容。此時(shí)通過(guò)多個(gè)機(jī)器人之間的協(xié)作來(lái)完成某些單個(gè)機(jī)器人難于完成的使命,作為對(duì)個(gè)體機(jī)器人能力的補(bǔ)充,多機(jī)器人協(xié)作可以有效地提高個(gè)體機(jī)器人在能力、效率、可靠性等方面的不足。因此機(jī)器人的協(xié)調(diào)合作能力已經(jīng)成為評(píng)價(jià)機(jī)器人智能和自主能力的一個(gè)重要方面。當(dāng)前,在操作大型物體,軍事偵察,自動(dòng)搬運(yùn)等領(lǐng)域多機(jī)器人協(xié)調(diào)控制技術(shù)已經(jīng)得到了應(yīng)用。機(jī)器人技術(shù)的發(fā)展目前大致正沿著兩個(gè)重要的方向:一是針對(duì)提高單個(gè)機(jī)器人性能的研究方向,另一個(gè)則是適應(yīng)復(fù)雜任務(wù)要求的多機(jī)器人系統(tǒng)的研究方向。進(jìn)行多機(jī)器人系統(tǒng)的研究是機(jī)器人技術(shù)發(fā)展的必然趨勢(shì),必將對(duì)機(jī)器人技術(shù)的發(fā)展起重要作用。今后隨著科技的發(fā)展,多機(jī)器人系統(tǒng)的應(yīng)用領(lǐng)域?qū)⒅饾u向工業(yè)、軍事領(lǐng)域發(fā)展,它的應(yīng)用將越來(lái)越廣。在工業(yè)中,多機(jī)器人系統(tǒng)的柔性可極大地加快企業(yè)的轉(zhuǎn)產(chǎn)速度,實(shí)現(xiàn)柔性加工;在國(guó)防中,它可以實(shí)現(xiàn)無(wú)人飛機(jī)和無(wú)人坦克代替軍隊(duì)進(jìn)行作戰(zhàn),最大限度地減少人員傷亡??梢灶A(yù)見(jiàn)多機(jī)器人系統(tǒng)的應(yīng)用將會(huì)對(duì)社會(huì)帶來(lái)巨大變革,能極大地提高人們的生活質(zhì)量以及工農(nóng)業(yè)和國(guó)防現(xiàn)代化程度。1.2國(guó)內(nèi)外研究現(xiàn)狀對(duì)于多機(jī)器人系統(tǒng),編隊(duì)控制是必須解決的難題,它直接影響著多機(jī)器人系統(tǒng)是否能夠正常的工作。群體機(jī)器人在執(zhí)行任務(wù)過(guò)程需要機(jī)器人之間互相通信并協(xié)調(diào)。通信機(jī)制和協(xié)調(diào)機(jī)制是群體機(jī)器人系統(tǒng)控制過(guò)程中的兩大關(guān)鍵技術(shù)。多機(jī)器人的編隊(duì)控制,指的是多個(gè)機(jī)器人組成的團(tuán)隊(duì)在執(zhí)行任務(wù)的過(guò)程中,在適當(dāng)?shù)沫h(huán)境約束下,相互之間保持預(yù)定的幾何關(guān)系。自主機(jī)器人隊(duì)形控制的基本問(wèn)題是獨(dú)立分布式控制所有機(jī)器人的移動(dòng)使得這些機(jī)器人能夠形成并保持一個(gè)給定的目標(biāo)幾何隊(duì)形,在很多的工程系統(tǒng)之中經(jīng)常需要多個(gè)獨(dú)立單元體直接的合作控制。在這個(gè)控制過(guò)程當(dāng)中,擁有可利用的全局信息對(duì)控制問(wèn)題的可解性和控制算法的復(fù)雜程度非常重要,如果能在機(jī)器人之間建立一個(gè)全局性的坐標(biāo)系統(tǒng)那么隊(duì)形控制就非常容易解決。機(jī)器人的運(yùn)動(dòng)和計(jì)算能力也是解決算法復(fù)雜程度的一個(gè)重要方面。常用的多機(jī)器人編隊(duì)算法有領(lǐng)航跟隨法、人工勢(shì)場(chǎng)法和基于行為法等。領(lǐng)航跟隨法的基本思想是:在多機(jī)器人組成的群體中,某個(gè)機(jī)器人被指定為領(lǐng)航者,其余作為它的跟隨者。跟隨者以一定的距離間隔跟蹤領(lǐng)航者的位置和方向,該方法可進(jìn)行擴(kuò)展,即不僅可以指定一個(gè)領(lǐng)航者,也可以指定多個(gè),但群體隊(duì)形的領(lǐng)航者只有一個(gè)。根據(jù)領(lǐng)航者與跟隨者之間的相對(duì)位置關(guān)系,就可以形成不同的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)。

2多機(jī)器人編隊(duì)控制方法2.1多機(jī)器人編隊(duì)的優(yōu)點(diǎn)多機(jī)器人保持一定的隊(duì)形前進(jìn),可以有許多好處:(1)更加準(zhǔn)確、有效的獲取環(huán)境信息。由于機(jī)器人的硬件約束(如傳感器的精度和能力、噪聲的干擾等),單個(gè)機(jī)器人很難準(zhǔn)確地獲取環(huán)境信息。當(dāng)多個(gè)機(jī)器人保持一定的隊(duì)形,其中每個(gè)機(jī)器人都負(fù)責(zé)相應(yīng)的職責(zé),那么在有效通訊的范圍內(nèi),將不同機(jī)器人獲得的信息融合起來(lái),可以獲得更多的環(huán)境信息。在多機(jī)器人協(xié)調(diào)探測(cè)環(huán)境過(guò)程中,通過(guò)貝葉斯理論的概率模型,可以逐漸增加單個(gè)機(jī)器人對(duì)環(huán)境認(rèn)識(shí)的可信度,從而更加有效地識(shí)別環(huán)境形狀。(2)提高工作的效率。首先,單個(gè)機(jī)器人能力有限,完成任務(wù)需要花費(fèi)很長(zhǎng)的時(shí)間。從這個(gè)角度來(lái)看,多個(gè)機(jī)器人就已經(jīng)提供了并行執(zhí)行任務(wù)的能力,因而可以提高工作的效率。另外,在搬運(yùn)物體的過(guò)程中,多個(gè)機(jī)器人編排固定的隊(duì)形,才可以將物體推動(dòng)到目標(biāo)位置。而且單個(gè)機(jī)器人不一定有能力完成這些任務(wù),此時(shí)多機(jī)器人的協(xié)作更加重要。(3)增加抵抗外界入侵的能力。在機(jī)器人軍隊(duì)中,機(jī)器人通過(guò)組成一種或多種編隊(duì)形狀,可以有效地抵抗外界的干擾。同樣,通過(guò)保持隊(duì)形,可以保護(hù)重要的對(duì)象,以達(dá)到相應(yīng)的目標(biāo)。(4)增加系統(tǒng)的魯棒性。在編隊(duì)中,機(jī)器人受到隊(duì)形向量的約束,即使在行進(jìn)過(guò)程中出現(xiàn)死鎖或停滯現(xiàn)象,其他機(jī)器人都可以通過(guò)這些約束將該機(jī)器人從死鎖的狀態(tài)中擺脫。(5)有助于機(jī)器人之間的合作。在隊(duì)形保持中,機(jī)器人滿足隊(duì)形約束,如距離約束。在距離約束之下,機(jī)器人通過(guò)視覺(jué)等輔助傳感器得知其他機(jī)器人的信息,以便給出相應(yīng)的對(duì)策或決策。2.2多機(jī)器人編隊(duì)的基本問(wèn)題2.2.1任務(wù)描述圖2.1多機(jī)器人工作區(qū)間模型如圖3.1所示,為了完成指定任務(wù),多個(gè)同構(gòu)機(jī)器人將在未知環(huán)境中完成編隊(duì)控制,具體包括:運(yùn)動(dòng)到指定位置形成某種隊(duì)形、保持隊(duì)形運(yùn)動(dòng)到某一位置、在保持隊(duì)形過(guò)程同時(shí)完成避障等其他任務(wù)。2.2.2多機(jī)器人編隊(duì)的基本隊(duì)形在機(jī)器人編隊(duì)過(guò)程中,需要解決很多問(wèn)題。其中,首先要解決的問(wèn)題是機(jī)器人隊(duì)形的選擇問(wèn)題。選擇合理的隊(duì)形,對(duì)機(jī)器人系統(tǒng)執(zhí)行任務(wù)的性能有著很大的影響。例如在障礙密集的地區(qū),柱形可以靈活的避開(kāi)障礙物。通常,機(jī)器人編隊(duì)的基本隊(duì)形有線形、柱形、菱形和V形(楔形)這四種對(duì)稱的形狀,如圖2.2所示:(a)線形(b)柱形(c)菱形(d)V形圖2.2多機(jī)器人基本隊(duì)形在編隊(duì)運(yùn)行過(guò)程中,機(jī)器人隊(duì)形并不是一成不變的,各種隊(duì)形在不同的情況下隊(duì)形保持的效果不同。2.3多機(jī)器人編隊(duì)控制方法2.3.1產(chǎn)生式方法產(chǎn)生式方法的實(shí)現(xiàn)是通過(guò)給定多機(jī)器人一些IF-THEN規(guī)則,使得當(dāng)隊(duì)形不規(guī)整的時(shí)候,機(jī)器人可以很容易的調(diào)整自己的位置。它的優(yōu)點(diǎn)就是反應(yīng)速度快,因此主要應(yīng)用于實(shí)時(shí)性要求比較高的情況。它的缺點(diǎn)就是人為指定的規(guī)則可能會(huì)遺漏或者沖突,而且不能適用于相對(duì)復(fù)雜的情況。當(dāng)環(huán)境變得復(fù)雜時(shí),規(guī)則將非常難以制定,要么制定出來(lái)的規(guī)則集非常龐大,要么規(guī)則的適應(yīng)性不高。因此,這種方法的適應(yīng)性和魯棒性都很差,無(wú)法體現(xiàn)多機(jī)器人的智能。雖然專家系統(tǒng)和模糊規(guī)則等方法對(duì)這種方法進(jìn)行改進(jìn),但是這些方法都未能解決這種方法根本問(wèn)題。2.3.2跟隨領(lǐng)航者法跟隨領(lǐng)航者法的基本思想是:在多機(jī)器人組成的群體中,某個(gè)機(jī)器人被指定為領(lǐng)航者,其余作為它的跟隨者,跟隨者以一定的距離間隔跟蹤領(lǐng)航機(jī)器人的位置和方向。對(duì)該方法進(jìn)行拓展,即不僅可以指定一個(gè)領(lǐng)航者,也可以指定多個(gè),但整體隊(duì)形的領(lǐng)航者只有一個(gè)。根據(jù)領(lǐng)航者與跟隨機(jī)器人之間的相對(duì)位置關(guān)系,就可以形成不同的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),也就是說(shuō),形成不同的隊(duì)形。該方法中,協(xié)作是通過(guò)共享領(lǐng)航機(jī)器人的狀態(tài)等知識(shí)實(shí)現(xiàn)的。2.3.3基于行為法基于行為是指機(jī)器人個(gè)體采用基于行為的體系結(jié)構(gòu)?;谛袨榉ǖ幕舅枷胧牵菏紫葹闄C(jī)器人定義一些期望的基本行為,一般情況下,機(jī)器人的行為包括避碰、避障、沿墻行走、駛向目標(biāo)和保持隊(duì)形等。當(dāng)機(jī)器人的傳感器接受到外界環(huán)境刺激時(shí),根據(jù)傳感器的輸入信息做出反應(yīng),并輸出反應(yīng)向量作為該行為的期望反應(yīng)(例如,方向和運(yùn)動(dòng)速度)。行為選擇模塊通過(guò)一定的機(jī)制來(lái)綜合各行為的輸出,并將處理結(jié)果作為機(jī)器人對(duì)環(huán)境刺激的反應(yīng)而輸出。該方法中,協(xié)作是通過(guò)共享機(jī)器人之間的相對(duì)位置、狀態(tài)等知識(shí)實(shí)現(xiàn)的,因此通訊是必不可少的。關(guān)于行為選擇機(jī)制的研究,是基于行為主義的多智能體協(xié)調(diào)研究的熱點(diǎn)和核心問(wèn)題,已經(jīng)在不同的領(lǐng)域提出了許多算法和理論。目前的行為選擇機(jī)制主要有三種:(1)Brooks提出的行為抑制法。(2)Arkin的加權(quán)平均法。(3)模糊邏輯法。2.3.4虛結(jié)構(gòu)法M.AnthonyLewis首先提出了虛結(jié)構(gòu)法(virtualstructure),其基本思想是將機(jī)器人團(tuán)體的隊(duì)形看作是一個(gè)剛體的虛擬結(jié)構(gòu),每個(gè)機(jī)器人是虛擬結(jié)構(gòu)上相對(duì)固定的一點(diǎn)。當(dāng)剛體在空間中運(yùn)動(dòng)時(shí),雖然剛體上的各點(diǎn)位置在變化,但是他們之間的相對(duì)位置保持不變。虛結(jié)構(gòu)基本算法是:采用雙向控制,首先用虛擬結(jié)構(gòu)盡量匹配個(gè)機(jī)器人的位置,然后根據(jù)局部或全局生成的軌跡,微調(diào)虛擬結(jié)構(gòu)的位置和方向,最后機(jī)器人確定各自的軌跡并調(diào)整速度以跟蹤虛擬結(jié)構(gòu)上的目標(biāo)位置點(diǎn),如此循環(huán)往復(fù)。2.3.5其他方法2.3.5.1基于圖論的隊(duì)形控制方法的基本思想是:圖上的節(jié)點(diǎn)表示機(jī)器人的動(dòng)力學(xué)或運(yùn)動(dòng)學(xué)特性,節(jié)點(diǎn)之間的邊表示機(jī)器人相互之間的約束;采用圖論和控制理論知識(shí)對(duì)以圖形表示的隊(duì)形進(jìn)行穩(wěn)定性分析,進(jìn)而得到控制策略。這方面研究一般是將圖論、控制理論及動(dòng)態(tài)系統(tǒng)理論結(jié)合起來(lái)研究隊(duì)形控制方法和穩(wěn)定性。2.3.5.2William分析并設(shè)計(jì)了將模型預(yù)測(cè)控制用于多機(jī)器人隊(duì)形控制的理論框架,同時(shí)研究了系統(tǒng)的穩(wěn)定性、魯棒性以及實(shí)時(shí)實(shí)現(xiàn)等問(wèn)題。模型預(yù)測(cè)控制顧及了動(dòng)態(tài)環(huán)境的變化和過(guò)程的不確定性,用反復(fù)進(jìn)行的有限優(yōu)化代替了一次全局優(yōu)化的結(jié)果,使預(yù)測(cè)控制在過(guò)程中實(shí)現(xiàn)了優(yōu)化與反饋的理想結(jié)合以及對(duì)信息的充分利用,通過(guò)在線滾動(dòng)優(yōu)化并結(jié)合實(shí)時(shí)信息的反饋校正,使每一時(shí)刻的優(yōu)化均建立在實(shí)際過(guò)程的基礎(chǔ)上。預(yù)測(cè)模型、滾動(dòng)優(yōu)化以及反饋校正使得預(yù)測(cè)控制滿足了許多實(shí)際需要,取得了很大成功。模型預(yù)測(cè)法具有較強(qiáng)的理論基礎(chǔ),在實(shí)時(shí)計(jì)算、可擴(kuò)展以及分布實(shí)現(xiàn)等方面還有待進(jìn)一步的研究。2.4典型的機(jī)器人運(yùn)動(dòng)規(guī)劃方法按照環(huán)境的建模方式和路徑搜索策略,運(yùn)動(dòng)規(guī)劃算法可以大體上分為三類:前向圖搜索法、智能化方法和采樣法。2.4.1前向圖搜索法前向圖搜索法的基本思想是構(gòu)造某種圖來(lái)描述環(huán)境的自由空間,從圖上找到滿足某種規(guī)則的最優(yōu)路徑。這種方法一般分為兩步:第一步構(gòu)造一個(gè)描述自由空間的關(guān)系圖,第二步按照一定搜索原則(距離最短、時(shí)間最少等)利用搜索算法尋找一條最優(yōu)路徑。構(gòu)造關(guān)系圖常用的方法有可視圖法、Voronoi圖法、柵格分解法和切線圖法[41],搜索算法常用的有貪心算法、Dijkstra算法、A*算法、D*算法和人工勢(shì)場(chǎng)法。前向圖搜索法需要在搜索路徑之前對(duì)運(yùn)行環(huán)境進(jìn)行建模過(guò)程的方法很直觀,理論上存在可行路徑的情況下一定能夠找到最優(yōu)路徑,但是在環(huán)境不斷擴(kuò)大、建模精度不斷提高的情況下,計(jì)算量將呈指數(shù)級(jí)增長(zhǎng),運(yùn)行速度明顯放慢。而在可行的精度限制下,有丟失可行路徑的可能。2.4.2智能化算法隨著人工智能技術(shù)的發(fā)展,將智能化算法應(yīng)用到運(yùn)動(dòng)規(guī)劃中來(lái),提高運(yùn)動(dòng)規(guī)劃的智能化水平已成為運(yùn)動(dòng)規(guī)劃一個(gè)重要的發(fā)展趨勢(shì),常用到的智能化算法有遺傳算法、模糊推理以及神經(jīng)網(wǎng)絡(luò)。這些智能化推理方法與前向圖搜索算法類似,都需要全局已知環(huán)境或大范圍已知環(huán)境的模型,隨著環(huán)境復(fù)雜度的增加,同樣存在內(nèi)存占用過(guò)大、運(yùn)算效率低的問(wèn)題。2.4.3采樣法基于采樣的運(yùn)動(dòng)規(guī)劃[2]僅僅通過(guò)對(duì)位形空間中的采樣點(diǎn)進(jìn)行碰撞檢測(cè)來(lái)獲取障礙物信息,并在此基礎(chǔ)上進(jìn)行運(yùn)動(dòng)規(guī)劃。其中最常見(jiàn)的是隨機(jī)性采樣法,Barraquand和atombeL設(shè)計(jì)的一種隨機(jī)路徑規(guī)劃器(RPP)[3]被認(rèn)為是隨機(jī)采樣法在運(yùn)動(dòng)規(guī)劃應(yīng)用方面的開(kāi)端。近幾年概率路標(biāo)法(PRM)和快速探索隨機(jī)樹(shù)(RRTs)得到了深入的研究和廣泛應(yīng)用。2.5多機(jī)器人編隊(duì)行為2.5.1奔向目標(biāo)行為該行為使得機(jī)器人向最終目標(biāo)點(diǎn)運(yùn)動(dòng),對(duì)于follower來(lái)說(shuō)奔向目標(biāo)行為是沒(méi)有意義的,因?yàn)楦S者具有保持隊(duì)形的任務(wù),也就是說(shuō)只有l(wèi)eader具有該行為,定義為隊(duì)伍最終目標(biāo)位置,為機(jī)器人當(dāng)前位置,為轉(zhuǎn)置操作符。式(4-1)給出奔向目標(biāo)行為的輸出向量,圖3.1描述了奔向目標(biāo)的行為。(2.1)圖2.3奔向目標(biāo)行為2.5.2保持隊(duì)形行為編隊(duì)過(guò)程要求機(jī)器人在遇到障礙物時(shí)可以實(shí)時(shí)避開(kāi)障礙物,當(dāng)沒(méi)有障礙物時(shí)就能恢復(fù)隊(duì)形,機(jī)器人的隊(duì)形保持行為同時(shí)也實(shí)現(xiàn)了隊(duì)形恢復(fù)的功能。大多數(shù)會(huì)采用動(dòng)態(tài)死區(qū)法,首先根據(jù)隊(duì)形計(jì)算機(jī)器人在期望隊(duì)形中的位置,根據(jù)同期望位置的距離,將整個(gè)空間分成三個(gè)區(qū)域:彈道區(qū),控制區(qū)和死區(qū),在彈道區(qū)機(jī)器人采用最大速度,在控制區(qū)機(jī)器人的速度與距離成正比,進(jìn)入死區(qū)后速度稍大于平均速度,到達(dá)目的點(diǎn)時(shí)速度等于平均速度,以控制機(jī)器人的速度達(dá)到保持隊(duì)形的目的。該方法中l(wèi)eader與follower之間比較獨(dú)立,且遇到復(fù)雜障礙物或障礙物密集時(shí)很難劃分空間區(qū)域。2.5.3躲避靜態(tài)障礙物行為躲避靜態(tài)障礙物行為在機(jī)器人的運(yùn)動(dòng)規(guī)劃有著非常重要的地位,首先靜態(tài)障礙物數(shù)量眾多,設(shè)計(jì)的是否合適很大程度上決定著最終運(yùn)動(dòng)路徑的好壞;其次因?yàn)殪o態(tài)障礙物是靜止的,在機(jī)器人的各種行為中,只有是可以精確確定的,在層間信息融合控制結(jié)構(gòu)中的高級(jí)層行為中,要根據(jù)輸出的方向和速度為參考量,進(jìn)行各自行為的計(jì)算。在機(jī)器人運(yùn)動(dòng)規(guī)劃中,躲避靜態(tài)障礙物的基本方法有固定角轉(zhuǎn)向法、切線避障法和人工勢(shì)場(chǎng)法。2.5.4躲避機(jī)器人行為在多機(jī)器人系統(tǒng)中,機(jī)器人除了要面對(duì)靜態(tài)環(huán)境外,還必須協(xié)調(diào)好與其他機(jī)器人的運(yùn)動(dòng),因此我們?cè)诟呒?jí)層行為中引入了躲避機(jī)器人行為,其功能是根據(jù)環(huán)境中機(jī)器人的信息和障礙物的信息,決定機(jī)器人如何運(yùn)動(dòng)。環(huán)境中多個(gè)機(jī)器人組成隊(duì)形在前進(jìn)路徑上遇到其他機(jī)器人的機(jī)會(huì)很少,而組成隊(duì)形的多個(gè)機(jī)器人在leader的協(xié)調(diào)下能保持隊(duì)形運(yùn)動(dòng)到目標(biāo)位置,但是由于在一個(gè)系統(tǒng)中各種資源是有限的,許多情況下會(huì)出現(xiàn)資源沖突,像隊(duì)形形成階段分配隊(duì)形點(diǎn)時(shí)機(jī)器人都希望分到距離最近的點(diǎn),過(guò)狹窄通道時(shí)多個(gè)機(jī)器人在某個(gè)點(diǎn)相遇都希望先通過(guò),變換隊(duì)形避障中轉(zhuǎn)換成蛇形隊(duì)形時(shí),各個(gè)follower存在一個(gè)啟動(dòng)順序的問(wèn)題等等,我們?cè)O(shè)計(jì)躲避機(jī)器人行為以防止機(jī)器人之間相互碰撞,使編隊(duì)控制過(guò)程更加理想。2.5.5多機(jī)器人編隊(duì)行為融合機(jī)制圖2.4多機(jī)器人編隊(duì)行為融合機(jī)制機(jī)器人的功能單元為行為,主體控制結(jié)構(gòu)分為三層,分別是初級(jí)層行為,中級(jí)層行為和高級(jí)層行為。初級(jí)層行為在不同的運(yùn)動(dòng)階段有和中的某一種行為與之對(duì)應(yīng),他們的基本功能是一致的,但具體實(shí)現(xiàn)時(shí)有所不同,初級(jí)層行為的基本功能為控制機(jī)器人的整體運(yùn)動(dòng)趨勢(shì),為后面行為提供運(yùn)動(dòng)速度和運(yùn)動(dòng)方向,實(shí)現(xiàn)以較高的速度和準(zhǔn)確度到達(dá)目標(biāo)位置。中級(jí)層行為包括躲避障礙物行為,為后面行為提供可通行區(qū)域和下一步的前進(jìn)方向,以便更有效地避開(kāi)障礙物。高級(jí)層行為參考前面行為所提供的運(yùn)動(dòng)方向和運(yùn)動(dòng)速度,對(duì)象為動(dòng)態(tài)。各層行為間信息流單向傳遞,相互融合,使機(jī)器人能更有效地完成編隊(duì)任務(wù)。2.6多機(jī)器人編隊(duì)中參考點(diǎn)的選取在編隊(duì)控制過(guò)程中,為了保證隊(duì)形的完整,必須有一個(gè)隊(duì)形的調(diào)節(jié)機(jī)制。即在編隊(duì)過(guò)程中必須要有一個(gè)參考點(diǎn),不同機(jī)器人位于參考點(diǎn)的不同位置,從而形成一定的隊(duì)形。隊(duì)形保持控制一般可以分兩步完成:首先是一個(gè)感性的處理,稱為探測(cè)隊(duì)形位置,根據(jù)當(dāng)前環(huán)境信息確定機(jī)器人在隊(duì)形中的正確位置;然后根據(jù)一定的控制策略生成控制命令,驅(qū)動(dòng)機(jī)器人保持一定的隊(duì)形駛向目標(biāo)位置。參考點(diǎn)的選取方法通常有三種:(1)以多機(jī)器人系統(tǒng)的中心點(diǎn)作為參考點(diǎn)(圖2.6(a));(2)以群體中的某一個(gè)機(jī)器人作為參考點(diǎn)(圖2.6(b));(3)以相鄰機(jī)器人為參考點(diǎn)(圖2.6(c))。Arkin曾對(duì)這幾種方法進(jìn)行了比較:以機(jī)器人為參考點(diǎn)在運(yùn)動(dòng)過(guò)程中隊(duì)形被打亂的時(shí)間較短,而以系統(tǒng)中心點(diǎn)為參考點(diǎn)隊(duì)形被改變的幅度較小[17]。(a)領(lǐng)航參考(b)中心參考(c)鄰居參考圖2.5隊(duì)形參考點(diǎn)圖(a)領(lǐng)航參考。從隊(duì)伍中,選取一個(gè)機(jī)器人作為領(lǐng)航機(jī)器人,其他機(jī)器人以該機(jī)器人為參考點(diǎn),只需保持自己與該機(jī)器人的相對(duì)位姿和期望值相同,就可以保證編隊(duì)的隊(duì)形。由于領(lǐng)航機(jī)器人沒(méi)有參考點(diǎn),所以不考慮隊(duì)形約束,隊(duì)形的保持由跟隨者實(shí)現(xiàn)。(b)中心參考。根據(jù)每個(gè)機(jī)器人的位置,計(jì)算出當(dāng)前的幾何中心。每個(gè)機(jī)器人都保持同該幾何中心的相對(duì)位姿,同樣也可以保持隊(duì)形。該方法要求所有機(jī)器人知道其他機(jī)器人的位姿信息,該方法使用大量的通訊量。(c)鄰居參考。當(dāng)編隊(duì)隊(duì)形確定后,每個(gè)機(jī)器人可以保持同隊(duì)形中相鄰機(jī)器人的相對(duì)位姿來(lái)達(dá)到編隊(duì)的目標(biāo)。同前兩個(gè)方法比較,除了不被選作參考點(diǎn)的機(jī)器人不需要廣播信息之外,其他機(jī)器人都要向環(huán)境中發(fā)出自己的位姿信息,信息量自然較大。另外,為了識(shí)別鄰居,對(duì)鄰居的標(biāo)識(shí)信息也需要通過(guò)通訊來(lái)告知其他機(jī)器人,因此該方法在通訊上消耗了大量的時(shí)間。通常,該方法是配合其他傳感器進(jìn)行的。針對(duì)不同的隊(duì)形和選擇不同的參考點(diǎn),隊(duì)形保持效果就可能不同。根據(jù)文獻(xiàn)[18]當(dāng)隊(duì)形轉(zhuǎn)彎時(shí),采用單位中心為參考點(diǎn),菱形隊(duì)形打亂的時(shí)間最短,隊(duì)形保持效果最好;采用領(lǐng)航機(jī)器人位置為參考點(diǎn),楔形和橫隊(duì)形保持效果較好,柱形編隊(duì)效果最差。當(dāng)隊(duì)形穿越有障礙區(qū)域時(shí),柱形編隊(duì)性能最好。在大多數(shù)情況下,選擇單位中心為參考點(diǎn)優(yōu)于選擇領(lǐng)航機(jī)器人位置為參考點(diǎn)。2.7多機(jī)器人編隊(duì)中的通訊編隊(duì)控制中的另一個(gè)基本問(wèn)題是通訊問(wèn)題。特別是以幾何中心和鄰居機(jī)器人為參考點(diǎn)的隊(duì)形控制來(lái)說(shuō),通訊技術(shù)事關(guān)隊(duì)形形成的成敗。通訊技術(shù)雖然發(fā)展很快,但不是面向機(jī)器人的。從通訊的體系結(jié)構(gòu)上來(lái)看有三種形式:一是各機(jī)器人之間沒(méi)有精確的相互作用;二是各機(jī)器人通過(guò)傳感器的相互檢測(cè)獲取對(duì)方信息,產(chǎn)生局部的相互反應(yīng);三是各機(jī)器人之間存在精確通訊,用點(diǎn)對(duì)點(diǎn)、Blackboard或Broadcast方式傳遞信息。在編隊(duì)控制中,集中控制是一種自上而下的層次控制結(jié)構(gòu),由一個(gè)機(jī)器人或計(jì)算機(jī)集中控制整個(gè)系統(tǒng),這種方式協(xié)調(diào)性較好,但實(shí)時(shí)性、動(dòng)態(tài)性較差;分布式控制是一種在全局上各機(jī)器人具有一定的自主能力基礎(chǔ)上的局部集中的結(jié)構(gòu)方式,系統(tǒng)的靈活性和魯棒性比集中控制更好。通訊是機(jī)器人之間進(jìn)行交互和組織的基礎(chǔ)。通過(guò)信息交流,機(jī)器人可以詳細(xì)地了解其他機(jī)器人的意圖、目標(biāo)和動(dòng)作以及當(dāng)前環(huán)境更全面的信息,進(jìn)而進(jìn)行有效地磋商,協(xié)作完成任務(wù)。WangJing等提出一種媒體接入?yún)f(xié)議CSMA/CD-W(carriersensemultipleaccesswithcollisiondetectionforwireless)來(lái)支持分布式機(jī)器人系統(tǒng)的點(diǎn)到點(diǎn)通信和廣播式通信[19]。與已有的通信系統(tǒng)不同,此系統(tǒng)不需要一個(gè)中心服務(wù)器或基站的存在,通過(guò)共享無(wú)線通信通道的方式實(shí)現(xiàn)了機(jī)器人之間的數(shù)據(jù)通信,符合多機(jī)器人系統(tǒng)的基本特點(diǎn)和要求。雖然近年來(lái)無(wú)線通訊技術(shù)己經(jīng)得到長(zhǎng)足發(fā)展,但在目前的技術(shù)條件下,多機(jī)器人系統(tǒng)實(shí)現(xiàn)所有機(jī)器人之間的點(diǎn)對(duì)點(diǎn)實(shí)時(shí)通訊還有較大困難,這也是大多數(shù)多機(jī)器人系統(tǒng)仍然采用集中通訊方式的主要原因。在本文中,我們模擬了基于黑板[10]的通訊方式。在多機(jī)器人系統(tǒng)中,黑板提供了公共信息區(qū),機(jī)器人從黑板上讀取或往黑板上寫入整體控制指令、本地環(huán)境信息及本身運(yùn)行狀態(tài)。在基于黑板的通訊方式中,很重要的一個(gè)方面就是要保證整個(gè)系統(tǒng)數(shù)據(jù)的一致性,防止讀取“臟數(shù)據(jù)”——寫入數(shù)據(jù)的機(jī)器人沒(méi)有完全寫入而被其它機(jī)器人讀取的數(shù)據(jù)。2.8編隊(duì)控制中的性能評(píng)估為了驗(yàn)證編隊(duì)算法的好壞,需要對(duì)編隊(duì)算法進(jìn)行評(píng)估。對(duì)隊(duì)形算法優(yōu)劣的評(píng)估主要有三個(gè)指標(biāo):(l)路徑長(zhǎng)度比率。該比率定義為隊(duì)形的平均行走距離同初始位置到達(dá)目標(biāo)位置直線距離的比值。該比值可以用來(lái)衡量算法的避障性能,比值越小說(shuō)明避障性能越好。沒(méi)有障礙物,理論上該比值為1,沒(méi)有意義。(2)隊(duì)形維持率。在整個(gè)編隊(duì)行進(jìn)過(guò)程中,機(jī)器人在期望位置的時(shí)間所占的比例。與之相對(duì)的概念就是個(gè)體偏移率,即機(jī)器人在編隊(duì)過(guò)程中不在期望位置的時(shí)間比例。該數(shù)值可以用來(lái)評(píng)價(jià)算法在避障過(guò)程中,隊(duì)形保持的性能。(3)運(yùn)行時(shí)間。指機(jī)器人在到達(dá)目標(biāo)到形成隊(duì)形所消耗的時(shí)間。該數(shù)值可以用來(lái)評(píng)價(jià)算法在隊(duì)伍避開(kāi)障礙物或打亂隊(duì)形后,恢復(fù)隊(duì)形的性能。2.9多機(jī)器人路徑規(guī)劃常用方法自由空間法的基本思想是采用預(yù)先定義的基本形狀如廣義錐形,凸多邊形等構(gòu)造自由空間,并將自由空間表示為連通圖,然后通過(guò)對(duì)圖的搜索來(lái)規(guī)劃路徑。自由空間法的優(yōu)點(diǎn)是比較靈活,機(jī)器人的起始點(diǎn)和目標(biāo)點(diǎn)的改變不會(huì)造成連通圖的重構(gòu),但算法的復(fù)雜程度與障礙物的多少成正比,且不是任何情況下都能獲得最短路徑??梢晥D法是將機(jī)器人視為一點(diǎn),通過(guò)起始點(diǎn)和目標(biāo)點(diǎn)及障礙物的頂點(diǎn)在內(nèi)的一系列點(diǎn)來(lái)構(gòu)造可視圖。連接這些點(diǎn),使某點(diǎn)與其周圍的某可視點(diǎn)相連(即使相連接的兩點(diǎn)間不存在障礙物或邊界)。然后機(jī)器人對(duì)可視圖進(jìn)行搜索,并利用優(yōu)化算法刪除一些不必要的連線以簡(jiǎn)化可視圖,最終就可以找到一條無(wú)碰最優(yōu)路徑。該方法的優(yōu)點(diǎn)是可以求得最短路徑,缺點(diǎn)是缺乏靈活性,即一旦機(jī)器人的起點(diǎn)和目標(biāo)點(diǎn)發(fā)生改變,就要重新構(gòu)造可視圖。柵格法將機(jī)器人的工作空間分成若干柵格,利用傳感器測(cè)得的信息,確定障礙物位置并映射到相應(yīng)柵格上。在由這些柵格構(gòu)成的連通圖上搜索一條從起始柵格到目標(biāo)柵格的路徑。在實(shí)現(xiàn)上,用一個(gè)二維數(shù)組表示機(jī)器人的工作區(qū)域,其中每個(gè)元素代表一個(gè)柵格。每個(gè)柵格具有一個(gè)可信度值,用于表示該區(qū)域內(nèi)的障礙物分布狀況。該方法比較容易實(shí)現(xiàn),但當(dāng)柵格數(shù)量很大時(shí),規(guī)劃時(shí)間較長(zhǎng)。人工勢(shì)場(chǎng)法把機(jī)器人在環(huán)境中的運(yùn)動(dòng)視為一種在抽象的人工受力場(chǎng)中的運(yùn)動(dòng),即在環(huán)境中建立人工勢(shì)場(chǎng)的負(fù)梯度方向指向系統(tǒng)的運(yùn)動(dòng)控制方向。把機(jī)器人處理成在人工勢(shì)場(chǎng)影響下的一個(gè)點(diǎn),目標(biāo)點(diǎn)對(duì)機(jī)器人產(chǎn)生“引力”,障礙物對(duì)機(jī)器人產(chǎn)生“斥力",些力的疊加得到合力,施加于機(jī)器人,控制機(jī)器人的運(yùn)動(dòng)方向,實(shí)現(xiàn)平滑地引導(dǎo)機(jī)器人趨向目標(biāo),同時(shí)避免碰撞障礙物。該方法簡(jiǎn)單,但對(duì)存在局部最優(yōu)解的問(wèn)題,易陷入局部最小值。遺傳算法是以自然遺傳機(jī)制和自然選擇等生物進(jìn)化理論為基礎(chǔ),構(gòu)造的一類隨機(jī)化搜索算法。它模仿生物遺傳及進(jìn)化的步驟,引入選擇、復(fù)制、交叉重組和變異等方法,并將適者生存的概念引入到算法中。由于宏觀上具有一定的方向性,使得它比一般的隨機(jī)搜索算法的效率要高。作為一種并行算法,其隱含的并行性適用于全局搜索,能搜索到全局最優(yōu)點(diǎn)。遺傳算法克服了人工勢(shì)場(chǎng)法的局部極小值問(wèn)題,魯棒性強(qiáng),但進(jìn)化眾多的規(guī)劃要占據(jù)較大的存儲(chǔ)空間和運(yùn)算時(shí)間。模糊邏輯法是駕駛員避碰動(dòng)作并非對(duì)環(huán)境信息精確計(jì)算完成的,而是根據(jù)模糊的環(huán)境信息,通過(guò)查表得到規(guī)劃出的信息,完成局部路徑規(guī)劃。模糊邏輯法模擬駕駛員的駕駛思想,將模糊控制本身所具有的魯棒性與基于生理學(xué)上的“感知,動(dòng)作"行為結(jié)合起來(lái),適用于時(shí)變未知環(huán)境下的路徑規(guī)劃,實(shí)時(shí)性較好。神經(jīng)網(wǎng)絡(luò)方法是一種仿效生物神經(jīng)系統(tǒng)的信息處理方法。它是一個(gè)高度并行的分布式系統(tǒng),處理速度高且不依賴于系統(tǒng)精確的數(shù)學(xué)模型,還具有自適應(yīng)和自學(xué)習(xí)的能力。由于路徑規(guī)劃工作沒(méi)有明顯的規(guī)劃和難以進(jìn)行事件分類,可以讓神經(jīng)網(wǎng)絡(luò)通過(guò)大量的實(shí)例學(xué)習(xí)來(lái)掌握。機(jī)器人采用一定的學(xué)習(xí)算法學(xué)習(xí)避障行為,學(xué)習(xí)從地圖上不同位置到目標(biāo)的行走路線,一旦學(xué)習(xí)完成后,機(jī)器人就能夠?qū)崿F(xiàn)自主導(dǎo)航。通過(guò)對(duì)各種算法的分析和比較,本文選擇重點(diǎn)研究利用遺傳算法和人工勢(shì)場(chǎng)法對(duì)機(jī)器人進(jìn)行路徑規(guī)劃。作為現(xiàn)實(shí)環(huán)境中駐留的智能體,機(jī)器人與外界環(huán)境交互需要解決基本的三個(gè)問(wèn)題:我在哪里?應(yīng)該去哪里?如何到達(dá)那里?對(duì)于此類問(wèn)題的研究稱為導(dǎo)航技術(shù),而最后一個(gè)問(wèn)題涉及機(jī)器人的路徑規(guī)劃,它是導(dǎo)航研究的一個(gè)重要環(huán)節(jié)和課題。所謂路徑規(guī)劃,可以描述為在有障礙物的工作環(huán)境中,如何為機(jī)器人尋找一條從起點(diǎn)到目標(biāo)點(diǎn)的最優(yōu)或次優(yōu)路徑,使機(jī)器人在運(yùn)動(dòng)過(guò)程中能安全、無(wú)碰撞地繞過(guò)所有的障礙物,到達(dá)目標(biāo)點(diǎn)。路徑的性能指標(biāo)有距離、時(shí)間、能量、安全等。與單機(jī)器人相比,多機(jī)器人的路徑規(guī)劃不僅要求每一個(gè)機(jī)器人各自尋找一條上述的路徑,還要求機(jī)器人沿該路徑行走時(shí)避免與其它機(jī)器人發(fā)生碰撞,從而對(duì)機(jī)器人之間路徑的規(guī)劃和協(xié)凋提出了更高的要求。因此,多機(jī)器人路徑規(guī)劃具有如下特點(diǎn):復(fù)雜性:動(dòng)態(tài)時(shí)變環(huán)境下的規(guī)劃非常復(fù)雜且計(jì)算量龐大;隨機(jī)性:復(fù)雜環(huán)境下的不確定因素使得環(huán)境充滿隨機(jī)性;多約束:機(jī)器人存在形狀、速度、加速度等約束;多目標(biāo):多個(gè)機(jī)器人均需路徑最短、安全無(wú)碰,在同一環(huán)境下會(huì)產(chǎn)生沖突。根據(jù)機(jī)器人對(duì)環(huán)境信息了解的程度不同,路徑規(guī)劃可分為兩種類型:(1)環(huán)境信息己知的離線全局路徑規(guī)劃;(2)環(huán)境信息全部未知或部分未知,通過(guò)傳感器對(duì)機(jī)器人的工作環(huán)境進(jìn)行探測(cè),以獲取障礙物位置、形狀和尺寸等信息的在線局部路徑規(guī)劃。目前,關(guān)于環(huán)境信息完全已知的全局路徑規(guī)劃方法比較多,由于是離線靜態(tài)規(guī)劃方法,通??梢缘玫阶顑?yōu)路徑。這類方法主要有:可視圖法、自由空間法以及柵格法等。但當(dāng)機(jī)器人在環(huán)境信息完全未知或局部未知的環(huán)境下工作時(shí),就無(wú)法使用這些離線方法了。因此,需要使用基于傳感器信息的局部路徑規(guī)劃方法。這類方法通常有:人工勢(shì)場(chǎng)法、VFI-I、D宰法等。局部路徑規(guī)劃利用傳感器提供的環(huán)境信息來(lái)進(jìn)行規(guī)劃,常用的傳感器包括有聲吶、超聲波傳感器、激光測(cè)距儀和視覺(jué)傳感器等。路經(jīng)規(guī)劃是機(jī)器人完成任務(wù)的安全保障,也是機(jī)器人實(shí)現(xiàn)智能化的關(guān)鍵技術(shù),是機(jī)器人智能化程度的重要標(biāo)志。在當(dāng)前機(jī)器人硬件系統(tǒng)精度短期內(nèi)無(wú)法提高的情況下,對(duì)于路徑規(guī)劃算法的研究顯得尤為重要。3多機(jī)器人系統(tǒng)體系結(jié)構(gòu)3.1多機(jī)器人群體體系結(jié)構(gòu)群體體系結(jié)構(gòu)一般分為集中式(Centralized)和分散式(Decentralized)兩種,而分散式結(jié)構(gòu)又可進(jìn)一步分為分層式(Hierarchical)和分布式(Distributed)兩種(具體形式見(jiàn)圖3.1)。群體體系結(jié)構(gòu)的選擇受機(jī)器人本身、任務(wù)、工作環(huán)境的狀況等諸多因素影響,因此應(yīng)當(dāng)綜合分析這些因素,確定系統(tǒng)的規(guī)模及系統(tǒng)機(jī)器人間恰當(dāng)?shù)南嗷リP(guān)系,從而選擇合適的結(jié)構(gòu),充分發(fā)揮其優(yōu)越性。多機(jī)器人協(xié)作的體系結(jié)構(gòu)可以歸結(jié)為兩個(gè)問(wèn)題:由誰(shuí)來(lái)做出決策并協(xié)調(diào)大家;用什么方法來(lái)做決策,得到每個(gè)機(jī)器人每個(gè)運(yùn)動(dòng)周期的指令。(a)集中式結(jié)構(gòu)(b)分層式結(jié)構(gòu)(c)分布式結(jié)構(gòu)圖3.1多機(jī)器人群體體系結(jié)構(gòu)圖集中式結(jié)構(gòu)集中式結(jié)構(gòu)如圖3.1(a)所示,它有一個(gè)主控機(jī)器人,主控機(jī)器人運(yùn)行各種規(guī)劃算法,對(duì)其控制下的機(jī)器人進(jìn)行任務(wù)分配、相互調(diào)度和動(dòng)作選擇。在這種體系結(jié)構(gòu)中,受控機(jī)器人之間不存在通訊,本身只是一個(gè)執(zhí)行體,沒(méi)有自己選擇動(dòng)作和進(jìn)行相互協(xié)調(diào)的能力。集中式結(jié)構(gòu)的優(yōu)點(diǎn)是理論背景清晰,實(shí)現(xiàn)起來(lái)較為直觀。它的缺點(diǎn)在于容錯(cuò)性、適應(yīng)性和靈活性差,對(duì)主控機(jī)器人的要求高,當(dāng)某一個(gè)機(jī)器人出現(xiàn)問(wèn)題,特別是主控機(jī)器人出現(xiàn)問(wèn)題時(shí),會(huì)導(dǎo)致整個(gè)系統(tǒng)的癱瘓。分布式結(jié)構(gòu)分布式結(jié)構(gòu)如圖3.1(c)所示,這種結(jié)構(gòu)不存在主控機(jī)器人,各機(jī)器人之間是平等的,均能通過(guò)通訊進(jìn)行交流、自主地進(jìn)行決策。相對(duì)于集中式結(jié)構(gòu),分布式結(jié)構(gòu)具有故障冗余、并行運(yùn)行和可伸縮性等諸多優(yōu)點(diǎn)。但是這種系統(tǒng)的整體性以及協(xié)調(diào)性較差,容易雜亂無(wú)章,當(dāng)各個(gè)機(jī)器人過(guò)分強(qiáng)調(diào)自己任務(wù)的重要性時(shí),將會(huì)過(guò)多地占用系統(tǒng)資源,使得整個(gè)系統(tǒng)的效率低下。分層式結(jié)構(gòu)分層式結(jié)構(gòu)如圖3.1(b)所示,它是介于集中式結(jié)構(gòu)和分布式結(jié)構(gòu)之間的一種結(jié)構(gòu),是一種混合型結(jié)構(gòu)。分層式結(jié)構(gòu)有一個(gè)主控機(jī)器人,同時(shí)受控機(jī)器人之間也存在著通訊。主控機(jī)器人在掌握全局信息及同受控機(jī)器人交流的基礎(chǔ)上對(duì)任務(wù)進(jìn)行分配,同時(shí)協(xié)調(diào)任務(wù)執(zhí)行過(guò)程中出現(xiàn)的沖突等問(wèn)題,但不具體地控制受控機(jī)器人的運(yùn)動(dòng)。各受控機(jī)器人掌握著局部環(huán)境信息及所需要的系統(tǒng)信息,執(zhí)行任務(wù)時(shí)結(jié)合著主控機(jī)器人的命令及周圍環(huán)境情況自主進(jìn)行運(yùn)動(dòng)規(guī)劃。3.2典型的機(jī)器人個(gè)體體系結(jié)構(gòu)機(jī)器人個(gè)體控制體系結(jié)構(gòu)是指機(jī)器人系統(tǒng)內(nèi)部硬件和軟件的組成結(jié)構(gòu)、功能分配、管理方式,是確定一個(gè)機(jī)器人系統(tǒng)的智能結(jié)構(gòu)和邏輯上的計(jì)算結(jié)構(gòu)。多機(jī)器人控制系統(tǒng)(MRCS:Multi-robotCooperativeSystem)由多個(gè)機(jī)器人組成,機(jī)器人控制系統(tǒng)是機(jī)器人的核心部分,同時(shí)也決定了MRCS中機(jī)器人的協(xié)作能力。機(jī)器人本身需要具有自主性,對(duì)環(huán)境的交互性、協(xié)作性、可通訊性,以及自適應(yīng)性、實(shí)時(shí)性等特性。可以說(shuō)系統(tǒng)性能直接取決于個(gè)體機(jī)器人性能的好壞。個(gè)體機(jī)器人的控制結(jié)構(gòu)不同,其采用的控制方法也各不相同。移動(dòng)機(jī)器人從誕生到發(fā)展至今,出現(xiàn)的頗具特色的個(gè)體控制結(jié)構(gòu)有慎思式結(jié)構(gòu)、反應(yīng)式、分層遞階式、以及混合式結(jié)構(gòu)。3.2.1慎思式結(jié)構(gòu)慎思式結(jié)構(gòu),又稱為傳統(tǒng)結(jié)構(gòu),是通過(guò)傳感系統(tǒng)獲得的描述環(huán)境的符號(hào)信息,建立環(huán)境模型,然后結(jié)合要實(shí)現(xiàn)的目標(biāo),進(jìn)行規(guī)劃任務(wù),再由執(zhí)行機(jī)構(gòu)來(lái)控制電機(jī)轉(zhuǎn)動(dòng),從而實(shí)現(xiàn)個(gè)體機(jī)器人對(duì)環(huán)境的響應(yīng)。慎思式結(jié)構(gòu)模型如圖3.2所示。慎思式體系結(jié)構(gòu)是一種縱向結(jié)構(gòu),它遵循一條從感知、建模、規(guī)劃、任務(wù)執(zhí)行到電機(jī)控制的串行控制路線,典型的結(jié)構(gòu)是智能機(jī)器人Shakey。慎思式結(jié)構(gòu)適合已知環(huán)境下的任務(wù)明確、目標(biāo)給定的系統(tǒng),其控制過(guò)程都預(yù)先規(guī)定,是一個(gè)顯式的符號(hào)模型,系統(tǒng)的智能在于規(guī)劃者或程序員,而不是執(zhí)行任務(wù)的系統(tǒng)。慎思式結(jié)構(gòu)的缺點(diǎn)很明顯:(1)體積大。機(jī)器人存儲(chǔ)符號(hào)信息量與它內(nèi)部狀態(tài)的大小相當(dāng),系統(tǒng)越復(fù)雜,體積越大。(2)建模困難。規(guī)劃和世界模型的建立是一個(gè)非常困難的過(guò)程,而且計(jì)劃的開(kāi)環(huán)執(zhí)行無(wú)法適應(yīng)環(huán)境的不確定性和不可預(yù)知性。圖3.2慎思式結(jié)構(gòu)圖3.2.2反應(yīng)式結(jié)構(gòu)反應(yīng)式結(jié)構(gòu)是R.C.Arikin提出的基于MotorSchema的一種“純粹”的行為(behaviors)控制系統(tǒng),它遵循“感知—?jiǎng)幼鳌钡囊?guī)則,在AI(AgentIntelligent)領(lǐng)域也被稱為行為主義?;谛袨榈目刂扑枷氩煌趥鹘y(tǒng)人工智能的功能分解方法,它采用動(dòng)作分解或行為分解的方法。反應(yīng)式結(jié)構(gòu)模型如圖3.3所示。圖3.3反應(yīng)式結(jié)構(gòu)反應(yīng)式結(jié)構(gòu)采用自下而上的構(gòu)造系統(tǒng)方式。它不包含世界模型,也不使用復(fù)雜的符號(hào)推理,系統(tǒng)的功能由一些基本、簡(jiǎn)單的行為完成,在得到傳感器的輸入后,有能力不經(jīng)過(guò)復(fù)雜的推理而立即對(duì)環(huán)境做出反應(yīng),是一種構(gòu)造工作于開(kāi)放式環(huán)境中機(jī)器人的有效工具。它建立了機(jī)器人傳感器與執(zhí)行器的直接聯(lián)系,通過(guò)行為的響應(yīng)實(shí)現(xiàn)控制,從而提高了系統(tǒng)的快速反應(yīng)能力。各種行為在融合時(shí)通過(guò)權(quán)重的大小來(lái)體現(xiàn)機(jī)器人的不同側(cè)重點(diǎn)(像以協(xié)作為主還是以競(jìng)爭(zhēng)為主),權(quán)重有不同的調(diào)整規(guī)則。Brooks提出的包容式結(jié)構(gòu)(SubsumptionArchitecture)可以看作反應(yīng)式結(jié)構(gòu)的一個(gè)特例,它的行為權(quán)重只有0和1,而且每次只有一種行為的權(quán)重為1,其余行為權(quán)重抑制為0。反應(yīng)式結(jié)構(gòu)的優(yōu)點(diǎn)是采用模塊化設(shè)計(jì),對(duì)于不同的任務(wù)要求及環(huán)境需求易于重構(gòu),而且響應(yīng)快速,適合于動(dòng)態(tài)、開(kāi)放的環(huán)境。其缺點(diǎn)是不能勝任傳感器數(shù)據(jù)的復(fù)雜分析、推理,而且由于知識(shí)的不足,不能完成認(rèn)知水平的任務(wù)。3.2.3分層遞階式體系結(jié)構(gòu)分層遞階式體系結(jié)構(gòu),美國(guó)學(xué)者Saridis很早就提出了一個(gè)關(guān)于智能控制系統(tǒng)的三級(jí)分層遞階式體系結(jié)構(gòu)[33],其分層原則是隨著控制精度的增加而智能減少。典型的形式如圖3.4所示。圖3.4分層遞階式結(jié)構(gòu)該結(jié)構(gòu)是以問(wèn)題的分解、規(guī)劃為基礎(chǔ),每一層都有一個(gè)統(tǒng)一的問(wèn)題表達(dá)方式,往往上層模型比下層具有更高的抽象層次,處理更為復(fù)雜的問(wèn)題。當(dāng)某層收到上層下發(fā)的任務(wù)后,要根據(jù)本層的世界模型,將該任務(wù)表達(dá)為本層問(wèn)題,同時(shí)將該問(wèn)題分解為下一層可解決的子問(wèn)題序列,并將其作為任務(wù)繼續(xù)下發(fā)給下層。這樣,一個(gè)總?cè)蝿?wù)經(jīng)層層分解直到最底層——一般為執(zhí)行機(jī)構(gòu)的驅(qū)動(dòng)層。從這一過(guò)程可以看出,其任務(wù)分解與規(guī)劃基本是離線的過(guò)程,其傳感器的作用是為離線規(guī)劃提供世界模型,這種模型是靜態(tài)的,重新規(guī)劃發(fā)生在上層下達(dá)新任務(wù)及下層報(bào)告某子任務(wù)無(wú)法完成時(shí)。而無(wú)論在何種情況下,所有已有的分解及規(guī)劃結(jié)果都將被舍棄,而代之以新的規(guī)劃結(jié)果。因此,我們只有兩種途徑處理動(dòng)態(tài)環(huán)境的問(wèn)題,一是建立可以表達(dá)這種動(dòng)態(tài)環(huán)境的世界模型,這樣就可以事先對(duì)環(huán)境的變化反應(yīng),做出合理的規(guī)劃,但是很難建立動(dòng)態(tài)環(huán)境的有效模型。因而,在高度動(dòng)態(tài)環(huán)境中,只能通過(guò)傳感器等感知環(huán)境的變化。如果環(huán)境的變化導(dǎo)致某層任務(wù)的失敗,該失敗將被上報(bào)給上層,同時(shí)環(huán)境的變化將被感知并引起世界模型的變化,上層或重新規(guī)劃或?qū)⑷蝿?wù)失敗信息繼續(xù)上報(bào),直到某一合適的功能層重新規(guī)劃為止。因此,任何環(huán)境變化都有可能導(dǎo)致重新規(guī)劃的發(fā)生,而且可能在多個(gè)層次上發(fā)生。如果這種重新規(guī)劃的頻率過(guò)高,將大大降低任務(wù)的完成效率,減弱機(jī)器人的反應(yīng)能力。這種結(jié)構(gòu)的優(yōu)點(diǎn)在于,系統(tǒng)的功能及層次分明,易于實(shí)現(xiàn);缺點(diǎn)是由于該結(jié)構(gòu)采用串行處理使得對(duì)外部時(shí)間的反應(yīng)時(shí)間變長(zhǎng),任何環(huán)境的變化都有可能導(dǎo)致重新規(guī)劃的發(fā)生,對(duì)外部的反應(yīng)時(shí)間較長(zhǎng),從而降低了任務(wù)完成的效率。3.2.4混合式結(jié)構(gòu)傳統(tǒng)的體系結(jié)構(gòu)缺乏實(shí)用性和必要的靈活性,而包容式結(jié)構(gòu)和反應(yīng)式結(jié)構(gòu)都是針對(duì)移動(dòng)機(jī)器人而提出的,提高了系統(tǒng)的響應(yīng)速度,在一些實(shí)際應(yīng)用中產(chǎn)生了良好的效果;慎思式和分層遞階式智能程度較高,但是無(wú)法對(duì)環(huán)境的變化做出快速的反應(yīng)。隨著機(jī)器人控制體系結(jié)構(gòu)研究的深入開(kāi)展,許多研究人員將多種體系結(jié)構(gòu)有機(jī)地結(jié)合起來(lái),實(shí)現(xiàn)多種體系結(jié)構(gòu)的優(yōu)勢(shì)互補(bǔ),形成了更加魯棒的混合式體系結(jié)構(gòu)。這種結(jié)構(gòu)通過(guò)對(duì)控制體系結(jié)構(gòu)進(jìn)行合理的分層,將包容式結(jié)構(gòu),反應(yīng)式控制結(jié)構(gòu)與上層規(guī)劃,推理有機(jī)地結(jié)合在一起。目前開(kāi)展的體系結(jié)構(gòu)研究工作很多圍繞著混合式體系結(jié)構(gòu)進(jìn)行,混合式結(jié)構(gòu)能夠快速響應(yīng)環(huán)境信息,但其智能程度較低。典型的結(jié)構(gòu)有蔡自興提出的基于功能/行為集成的自主式移動(dòng)機(jī)器人進(jìn)化控制體系結(jié)構(gòu)[34],趙憶文提出的由系統(tǒng)監(jiān)控管理層、行為模塊層和運(yùn)動(dòng)行為層構(gòu)成的基于行為的分層遞階控制結(jié)構(gòu)[5],Conell提出了基于包容式結(jié)構(gòu)的包括符號(hào)層、包容層和伺服控制層的SSS結(jié)構(gòu)。結(jié)論機(jī)器人作為人類20世紀(jì)最偉大的發(fā)明之一,在短短的40年內(nèi)發(fā)生了日新月異的變化。而隨著人類生產(chǎn)規(guī)模的不斷擴(kuò)大,人類活動(dòng)范圍的不斷擴(kuò)大,僅僅靠人力進(jìn)行生產(chǎn)活動(dòng)已經(jīng)不能滿足先進(jìn)生產(chǎn)力的要求。因此,代替人類進(jìn)行生產(chǎn)、探索活動(dòng)的多機(jī)器人系統(tǒng)應(yīng)運(yùn)而生。當(dāng)今,多機(jī)器人系統(tǒng)的應(yīng)用范圍大致有如下幾項(xiàng):遠(yuǎn)地作業(yè)、協(xié)助軍事行動(dòng)、震后搜索與營(yíng)救、自動(dòng)倉(cāng)庫(kù)管理、自動(dòng)化工廠、農(nóng)業(yè)機(jī)器人等。

致謝本論文是在XXX老師的諄諄教誨和指導(dǎo)下完成的,論文從選題、構(gòu)思到定稿無(wú)不滲透著導(dǎo)師的心血和汗水;教授淵博的知識(shí)和嚴(yán)謹(jǐn)?shù)膶W(xué)風(fēng)使我受益終身,在此表示深深的敬意和感謝。我還要感謝含辛茹苦、任勞任怨、望子成龍、不圖回報(bào)的父母的養(yǎng)育之恩,他們給予我的愛(ài)和支持讓我順利地完成了自己的學(xué)業(yè)。最后,因本人水平有限,在文中難免有不足之處,懇請(qǐng)各位老師批評(píng)指正。

參考文獻(xiàn)王躍,譚民,景奉永等.多機(jī)器人協(xié)調(diào)操作大型物體的運(yùn)動(dòng)學(xué)分析及應(yīng)用.機(jī)器人,2002,24(5):451-455黃閃,蔡鶴皋,談大龍.面向裝配作業(yè)的多機(jī)器人合作協(xié)調(diào)系統(tǒng).機(jī)器人.1999.21(1):50-56蔡自興.機(jī)器人學(xué).清華大學(xué)出版社,2000:10-11雷斌.動(dòng)態(tài)環(huán)境下多移動(dòng)機(jī)器人路徑規(guī)劃研究.武漢理工大學(xué)碩士學(xué)位論文,2006.4:1彭生祥.多移動(dòng)機(jī)器人編隊(duì)控制及仿真研究.北京服裝學(xué)院碩士學(xué)位論文.2003.譚民,王碩,曹志強(qiáng).多機(jī)器人系統(tǒng).北京:清華大學(xué)出版社,2005.7-16,110-

114,128JinK,LiangP,BeniG.Stabilityofsynchronizeddistributedcontrolofdiscreteswarmstructures.ProceedingsofIEEEInternationa

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論