![RoboCup小型組決策與路徑規(guī)劃研究2_第1頁](http://file4.renrendoc.com/view8/M02/36/3F/wKhkGWbJ0_KAeGeXAAKvSJpLcs4371.jpg)
![RoboCup小型組決策與路徑規(guī)劃研究2_第2頁](http://file4.renrendoc.com/view8/M02/36/3F/wKhkGWbJ0_KAeGeXAAKvSJpLcs43712.jpg)
![RoboCup小型組決策與路徑規(guī)劃研究2_第3頁](http://file4.renrendoc.com/view8/M02/36/3F/wKhkGWbJ0_KAeGeXAAKvSJpLcs43713.jpg)
![RoboCup小型組決策與路徑規(guī)劃研究2_第4頁](http://file4.renrendoc.com/view8/M02/36/3F/wKhkGWbJ0_KAeGeXAAKvSJpLcs43714.jpg)
![RoboCup小型組決策與路徑規(guī)劃研究2_第5頁](http://file4.renrendoc.com/view8/M02/36/3F/wKhkGWbJ0_KAeGeXAAKvSJpLcs43715.jpg)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
江南大學(xué)碩士學(xué)位論文RoboCup小型組決策與路徑規(guī)劃研究姓名:任華申請學(xué)位級別:碩士專業(yè):控制理論與控制工程指導(dǎo)教師:劉國棟20080601捅要捅要足球機(jī)器人是個多學(xué)科交叉的研究領(lǐng)域,它涵蓋了機(jī)器人學(xué)、人工智能和智能控制等多個領(lǐng)域,為人工智能領(lǐng)域的理論和應(yīng)用提供了一個理想的實(shí)驗(yàn)平臺。由于它具有高科技對抗性和娛樂性而吸引了廣大的科研人員投身其中,極大地促進(jìn)了人工智能的發(fā)展。本文正是以機(jī)器人足球比賽為背景,針對足球機(jī)器人決策系統(tǒng)進(jìn)行深入研究,并進(jìn)行了算法、性能和應(yīng)用上的一系列改進(jìn)。文章首先介紹了RoboCup小型組機(jī)器人系統(tǒng)體系結(jié)構(gòu),設(shè)計Robocup小型組足球機(jī)器人控制系統(tǒng),給出相應(yīng)的功能框圖。對各部分功能進(jìn)行詳細(xì)論述,設(shè)計了帶有前饋的雙閉環(huán)運(yùn)動控制器,并作的仿真分析。接著詳細(xì)闡述了機(jī)器人決策系統(tǒng)的構(gòu)建,由視覺子系統(tǒng)、決策子系統(tǒng)、無線通信子系統(tǒng)、機(jī)器人小車子系統(tǒng)和總控子系統(tǒng)組成的集控式足球機(jī)器人系統(tǒng),總結(jié)了具有集中視覺、決策與控制的集控式足球機(jī)器人系統(tǒng)的控制問題。設(shè)計了基于分層遞階控制結(jié)構(gòu)的足球機(jī)器人決策子系統(tǒng)。它由上層決策系統(tǒng)和底層決策系統(tǒng)組成,文章分別詳細(xì)介紹了各部分的功能和特點(diǎn)。路徑規(guī)劃是機(jī)器人研究中最為重要的單元,在本文中提出了在動態(tài)環(huán)境中移動機(jī)器人的一種路徑規(guī)劃方法一改進(jìn)蟻群算法。適用于環(huán)境中同時存在已知和未知、靜止和運(yùn)動障礙物的復(fù)雜情況。蟻群算法是基于生物界群體啟發(fā)行為的一種隨機(jī)搜索尋優(yōu)方法,它的正反饋性和協(xié)同性使其可用于分布式系統(tǒng),隱含的并行性更使其具有極強(qiáng)的發(fā)展?jié)摿Γ诮鉀Q組合優(yōu)化問題上有著良好的適應(yīng)性。因此將其應(yīng)用到智能機(jī)器人全局路徑規(guī)劃中,其目的是探索一種新的路徑尋優(yōu)算法。在基于柵格劃分的環(huán)境中,研究了機(jī)器人路徑規(guī)劃問題中蟻群系統(tǒng)的“外激素"表示及更新方式,提高了蟻群系統(tǒng)的路徑尋優(yōu)能力,為蟻群算法的應(yīng)用提供了一種新的探索。最后,針對局部避碰規(guī)劃中避障策略,提出了基于滾動窗口的環(huán)境探測和碰撞預(yù)測的方法。機(jī)器人在運(yùn)動過程中,根據(jù)得到的環(huán)境信息在機(jī)器視覺范圍內(nèi)建立預(yù)測窗口和避障窗口,在預(yù)測窗口內(nèi),機(jī)器人根據(jù)障礙物的信息建立障礙物的預(yù)測區(qū)域,在避障窗口內(nèi),機(jī)器人根據(jù)自身的位置與障礙物的預(yù)測區(qū)域,分別調(diào)用切線法或滾動窗口法進(jìn)行路徑規(guī)劃。實(shí)驗(yàn)結(jié)果表明:該方法能適應(yīng)足球機(jī)器人比賽的實(shí)時性和動態(tài)性。關(guān)鍵詞:足球機(jī)器人,智能決策,路徑規(guī)劃,蟻群算法,局部避碰策略AbstractRobotsocCerisafield謝tllt11ejointknowledgeofmarIy嬲pectSsuch勰robotics,鋤ificialmtelligence鋤dintelligemcontrDl.nbrings鋤ide2L1eXpe而[Ilentplatfonnt0吐leresearChofmeo巧andapplicationof缸i矗cialintelligence.M鋤yresearchersarea撇dt0devotemitbccauseof砥lligh七chccI在lI)etitionandgood鋤usement.Robotsoccer伊eanyerlllancesnledeVeloprnentof盯tificialintelligence.Inmethesis,t:herobotS0ccerdecision—m舳lgsystemisanalyzedonnlerobotsoccercompetitionbaCkground,aIldsomeimprovementinalg耐山:nS,pe喲nIlaIlce觚dapplicationsarcdeveloped.FirStly,也epaperintrodllcestlleRoboCupsm宙lsizerobotsystemarc陸te船,desig璐Robocupsmallsoccerrobotcontrolsystem,proVidesmemlmeoftllesyStem,deScribesnlefunctionofeve巧part.At、)l,o-loopmotioncontrollermcludiIlgf.eed—f.onⅣardcomrollerisdesigIledt0co曲.olmemotionoftlleo疵一directionalmobilerobot,aIldmaIlys豳m撕onanalysisescompleted.Int11enextch印ter,Ii11us傾tesoccerrobotdeciSion—mak抽gsubsyStem.Ace喲.a(chǎn)lizedsoccerrobotsystemcomposedofsuchsubsystems嬲訪sion,decision-nlaking,、】l,irelessco咖nu血cation.robotcaraIldconsoleiscons仃ucted.Tllisp印ers啪arizestllecontrolproblemsofthecentralizedsoccerrobotsystemwimce珊mVision,decision-ma:kinga11dco橢舊lsystem,anddesi弘sasoCcerrobotdecision-makjngsllbsystembasedonthehi翎lrc艟calco曲的ls眥ture.Itw硒makeupoftophalfandbottom蹦£botlloftllemwasd印ictedde“l(fā)edin廿1ethirdchaptcr.Patllpl疵ngisthemostimportantp眥inasoccerrobotsystem.TKsuIlitpresentsanew印proaCht0robotpa:thpl砌ngunderd”瑚mcenViroment,improveda11tcolonyalgorimm.An鋤tcolonyalgorinlmisastochaSticsearchjngo刪zationalgorimm廿latisbaSedon也eheuristicbellaviorofmebiolo巒c∞lony.I招positivefeedbaCka11dcoordinat主onmal(eitpossibletobe印pliedt0adistributedsystem.IthaSfaVorableadaptabil時iIls01vingc0Ⅱlb婦Ltorialopt砌zationandhasgreatdeVelopmentpotentialforitscollllotatiVeparallelproperty.TMssnJdyfocuSedonglobalpa吐lplanllingwima11觚tcolonyalgorimminaIlenViro衄entbascd0n酣ds,wmchexploresanewpa_thpl刪ngalgoritllIn.Howtopresentandupdateme:pheromoneofanantsystemwaSinVestigated.FiI試ly,iIltlle10calpl鋤Jlingforob虬acleaVoidance,putforwardtllenewmemod:enviro啪entdetectionaIldc01lisionpredictionbaSedonr01ling、)l,indowsinorderthattllerobotreachest:hegoal阻fely.n圮soccerrobot、ⅣinsetupaforecaStwindowandobsklcleavoidaIlcewmdowduringmeprocessofitSmoVi芏lg,aCC0rdingt0tllesoccerrobotpositionandobStaClefofecastareainobstacleavoi婦lcewindow.Thesoccerrobotwmcombines鋤gentpathme廿10dandrollingpammemodt0executepa:chplanIling.T11ismemodisalocalpampl砌ng.ThesoccerrobotneedSupda_cetheenvironmenti11fo徹ationandexecutepamplaImiIlgcontim腳.Keywords:Roboticsocccr’decision—making,pamp1蛐g(shù),antcolorlyalgoritIlm,localpl蛐g(shù)forobstacleavoidaIlce獨(dú)創(chuàng)性聲明本人聲明所呈交的學(xué)位論文是本人在導(dǎo)師指導(dǎo)下進(jìn)行的研究工作及取得的研究成果。盡我所知,除了文中特別加以標(biāo)注和致謝的地方外,論文中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包含本人為獲得江南大學(xué)或其它教育機(jī)構(gòu)的學(xué)位或證書而使用過的材料。與我一同工作的同志對本研究所做的任何貢獻(xiàn)均已在論文中作了明確的說明并表示謝意。簽名:日期:關(guān)于論文使用授權(quán)的說明本學(xué)位論文作者完全了解江南大學(xué)有關(guān)保留、使用學(xué)位論文的規(guī)定:江南大學(xué)有權(quán)保留并向國家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)印件和磁盤,允許論文被查閱和借閱,可以將學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進(jìn)行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存、匯編學(xué)位論文,并且本人電子文檔的內(nèi)容和紙質(zhì)論文的內(nèi)容相一致。保密的學(xué)位論文在解密后也遵守此規(guī)定。簽名:鐘導(dǎo)師簽名:麴!婭日期:笙墅!絲主少朋g.考.}3第一章緒論第一章緒論1.1足球機(jī)器人比賽概況隨著控制論及計算機(jī)技術(shù)的發(fā)展,分布式人工智能中多智能體系統(tǒng)(MAS:Multi.AgemSyStem)的理論及相關(guān)的應(yīng)用研究已成人工智能及智能控制研究的熱點(diǎn)。制造和訓(xùn)練機(jī)器人進(jìn)行足球比賽,是國際上一項(xiàng)為促進(jìn)分布式人工智能、智能機(jī)器人技術(shù)及其相關(guān)領(lǐng)域的研究與發(fā)展而舉行的大型比賽和學(xué)術(shù)活動,是人工智能領(lǐng)域與機(jī)器人領(lǐng)域的基礎(chǔ)研究課題,是一個極富挑戰(zhàn)性的高技術(shù)密集型項(xiàng)目,是當(dāng)前人工智能和機(jī)器人領(lǐng)域的研究熱點(diǎn)之一。它通過提供一個標(biāo)準(zhǔn)的比賽平臺來檢驗(yàn)各種智能機(jī)器人技術(shù)。機(jī)器人足球比賽的設(shè)想首先是由加拿大不列顛哥倫比亞大學(xué)的教授A1觚MacbⅣordl在1992年的論文《OnSeeillgR0bots》中提出的。目前國際上有組織的機(jī)器人足球比賽有兩大系列~FIRA和RoboCup。.FIRA是國際機(jī)器人足球協(xié)會聯(lián)合會(FIRA.-Fede眥ionofhltematioIlalI渤otSoccerAssociation),簡稱國際機(jī)器人足聯(lián)Il】。成立于1997年6月5日,總部設(shè)在韓國大田的韓國科學(xué)(技術(shù))院(KAIST)。目前已有30余個國家的近百個學(xué)校與科研院所為其成員單位,主要分布在亞洲、澳洲、北美和南美洲等地。1996年開始舉辦微型機(jī)器人世界杯足球賽(MiroSot—MicroRobotSoccerTournament)。另一國際組織—RoboCup(,nleRobotWbddCup111itiative)是國際人工智能學(xué)會組織的國際機(jī)器人足球協(xié)會【2】。成立于1996年??偛吭O(shè)在日本名古屋,主席是SONY公司計算機(jī)科學(xué)研究院的北野宏明教授。在此之前,日本的國家電子技術(shù)實(shí)驗(yàn)室(ETL)研制了用于機(jī)器人足球仿真比賽的軟件平臺。日本大坂大學(xué)和美國卡內(nèi)基一梅隆大學(xué)的學(xué)者也都率先開發(fā)了機(jī)器人足球系統(tǒng)。機(jī)器人足球世界杯賽(111eRobotWbrldCupSoccerG鋤es,簡稱RoboCup)正式成立之后,共舉行了多屆機(jī)器人足球世界杯賽,數(shù)十個國家的上百支球隊前往參賽。RoboCup機(jī)器人足球世界杯賽及學(xué)術(shù)大會現(xiàn)己成為國際上級別最高、規(guī)模最大、影響最廣泛的機(jī)器人足球賽事和學(xué)術(shù)會議,每年舉辦一次。1.2RoboCup小型組比賽的特點(diǎn)Rob0Cup機(jī)器人足球比賽是國際上級別最高【3】,規(guī)模最大,影響最廣泛的機(jī)器人足球賽事。比賽分為仿真組,小型組,中型組等。涉及到計算機(jī),人工智能,控制理論,傳感器融合,信號處理,無線通訊,精密機(jī)械等多個學(xué)科,是展示高科技成果的生動窗口,同時也是促進(jìn)科技成果實(shí)用化和產(chǎn)業(yè)化的新途徑。小型組足球機(jī)器人比賽是RoboCup比賽的一個分組。它是兩個由5個小型機(jī)器人組成的球隊的對抗賽,機(jī)器人必須能放進(jìn)一個直徑180n姐的圓筒并且高度不超過150mm。比賽在2800X2300的鋪有綠色地毯的場地上進(jìn)行,比賽用球是一個橙色的高爾夫球。全部比賽十分鐘,分上下半場。小型組機(jī)器人足球系統(tǒng)由視覺系統(tǒng)、決策系統(tǒng)、無線通信系統(tǒng),機(jī)器人小車系統(tǒng)以及裁判系統(tǒng)組成。江南大學(xué)碩士學(xué)位論文(1)視覺系統(tǒng):由兩部攝像機(jī)及相應(yīng)的視覺處理設(shè)備和軟件組成,負(fù)責(zé)監(jiān)測賽場上的環(huán)境信息,為其他系統(tǒng)提供信息支持。(2)決策系統(tǒng):主要由兩臺主機(jī)完成,根據(jù)賽場信息,作出決策,確定機(jī)器人球隊的策略,及各機(jī)器人的角色、任務(wù)。(3)無線通訊系統(tǒng):將上層的決策,以及必要的賽場信息發(fā)送給各個機(jī)器人,起到?jīng)Q策系統(tǒng)與機(jī)器人小車系統(tǒng)的溝通作用。(4)機(jī)器人小車系統(tǒng):在賽場環(huán)境下完成決策系統(tǒng)給定的任務(wù),實(shí)現(xiàn)決策出的策略。(5)裁判系統(tǒng):目前主要是裁判盒和人,負(fù)責(zé)計分,開球,裁判等工作。根據(jù)機(jī)器人足球比賽的狀況,小型組機(jī)器人足球環(huán)境有如下特點(diǎn):(1)實(shí)時性實(shí)時性是足球機(jī)器人系統(tǒng)必須保證的。球場上瞬息萬變,球員的快速反應(yīng)是射門得分的關(guān)鍵。我們的攝像頭的拍攝頻率是每33ms一張現(xiàn)場圖像,決策和視覺采集并行進(jìn)行,系統(tǒng)運(yùn)行周期也是33ms,所以通訊子系統(tǒng)及機(jī)器人小車必須具備快速反應(yīng)的能力,這樣才能抓住時機(jī)進(jìn)球得分。同時,多機(jī)器人協(xié)作必須適應(yīng)實(shí)時性的要求,采用比較快速的算法,做出周詳而適應(yīng)實(shí)時性要求的決策。(2)動態(tài)特性賽場上,機(jī)器人小車的最大速度可以達(dá)到2m/s,并且小車屬于輪式結(jié)構(gòu)實(shí)體,有兩個自由度以內(nèi)的連續(xù)運(yùn)動,反應(yīng)速度也很快。比賽時,機(jī)器人只能局限在賽場內(nèi),機(jī)器人之間很容易產(chǎn)生碰撞,運(yùn)動或變化非常頻繁。(3)不確定性足球機(jī)器人系統(tǒng)由多個部分組成。視覺子系統(tǒng)通過采集圖像辨識場上信息,是對連續(xù)系統(tǒng)離散化,有些賽場信息并沒有采集到。視覺部分圖像容易受光照、臺面等因素影響而變形,通訊部分也會有指令丟失的現(xiàn)象出現(xiàn)。機(jī)器人在場地上運(yùn)行時容易碰撞,并且還可能由于電池不足而使小車運(yùn)行狀態(tài)不穩(wěn)定。所以機(jī)器人足球環(huán)境充滿了不確定性。(4)非線性非線性的特性普遍存在于客觀世界,機(jī)器人足球環(huán)境和足球機(jī)器人系統(tǒng)都是非線性的。非線性系統(tǒng)的非線性導(dǎo)致了系統(tǒng)描述的相應(yīng)復(fù)雜,往往不能獲得滿意解,或者求解極其困難以至于失去了實(shí)際意義。機(jī)器人足球環(huán)境由于其動態(tài)特性和不確定因素,很難建立一個精確的數(shù)學(xué)模型來描述它,造成了控制足球機(jī)器人系統(tǒng)的難度。1.3小型組決策系統(tǒng)與路徑規(guī)劃方法足球機(jī)器人系統(tǒng)是一個較復(fù)雜、多模塊的綜合系統(tǒng)【4】。足球機(jī)器人決策系統(tǒng)作為整個系統(tǒng)的指揮機(jī)構(gòu),起著舉足輕重的作用。決策子系統(tǒng)上接視覺子系統(tǒng),下接通信子系統(tǒng),它是整個機(jī)器人足球系統(tǒng)智能處理的中心樞紐。決策子系統(tǒng)的任務(wù)是根據(jù)視覺子系統(tǒng)提供的球場信息,對場上形式進(jìn)行判斷,制定出進(jìn)攻或防守策略,并實(shí)時規(guī)劃出各球員的行走路線,通過通信子系統(tǒng)向隊員發(fā)出運(yùn)動指令,控制機(jī)器人小車做出各種動作以完成策略實(shí)施。足球機(jī)器人系統(tǒng)也是一個典型的多智能體系統(tǒng)。其中決策子系統(tǒng)涉及路徑規(guī)劃與智能2第一章緒論算法、多智能體協(xié)作、自組織與自學(xué)習(xí)理論等領(lǐng)域。目前,相關(guān)問題的研究也主要集中在這幾個方面。決策子系統(tǒng)的載體是一臺計算機(jī),其決策功能由計算機(jī)內(nèi)運(yùn)行的決策程序?qū)崿F(xiàn)。以視覺系統(tǒng)返回的圖象數(shù)據(jù)為依據(jù),經(jīng)分析后,從策略庫中調(diào)出臺適的決策方式,并將其參數(shù)化,形成機(jī)器人的運(yùn)動指令。同時,對指令的執(zhí)行效果做出評估,如需要,則對決策庫做一定的修改。最后,將指令發(fā)送給通訊子系統(tǒng),并要求通訊子系統(tǒng)向機(jī)器人發(fā)送指令。決策子系統(tǒng)設(shè)計應(yīng)考慮的問題:(1)足球機(jī)器人比賽環(huán)境復(fù)雜,決策子系統(tǒng)面對的是一個復(fù)雜、動態(tài)、難以準(zhǔn)確得到模型的環(huán)境。決策子系統(tǒng)應(yīng)能適應(yīng)復(fù)雜的環(huán)境,為進(jìn)一步的決策提供良好的背景數(shù)據(jù)基礎(chǔ)。(2)由于決策的目的就是取得比賽的勝利,所以決策子系統(tǒng)應(yīng)該能適應(yīng)場上局勢的變換并能盡力擊敗對方。因此,策略庫應(yīng)該是開放性的,決策子系統(tǒng)應(yīng)具有一定的自學(xué)習(xí)的能力。(3)由于必須實(shí)時控制小車,因而決策必須滿足實(shí)時性要求,能在較短的時間內(nèi)完成決策過程。決策時間越短,實(shí)時性越好。路徑規(guī)劃就是指在一定的未知動態(tài)的環(huán)境中給定初始位置和目標(biāo)位置,按一定的策略使運(yùn)動物體從初始位置盡可能快速、無碰撞地到達(dá)目標(biāo)位置,并滿足一些約束條件。路徑規(guī)劃技術(shù)的應(yīng)用非常廣泛,不管是關(guān)節(jié)型機(jī)器人還是移動機(jī)器人都是重點(diǎn)研究的課題。路徑規(guī)劃也是足球機(jī)器人系統(tǒng)研究中的一個重要課題,其重要性主要體現(xiàn)在:(1)機(jī)器人車體造價比較高,而足球機(jī)器人比賽是一個動態(tài)競技項(xiàng)目,機(jī)器人如果沒有避障行為,則會多次相撞,損壞車體;(2)好的路徑規(guī)劃方法可以使機(jī)器人以最短時間到達(dá)目的地,完成相應(yīng)動作取得較好成績;(3)將各種算法尤其是各種智能算法放在路徑規(guī)劃這樣一個問題中進(jìn)行研究和檢驗(yàn),可以促進(jìn)相關(guān)學(xué)科的發(fā)展,促進(jìn)人工智能的發(fā)展;(4)足球機(jī)器人系統(tǒng)場上的環(huán)境是時刻變化的,其路徑規(guī)劃屬于一種作業(yè)環(huán)境未知且動態(tài)的路徑規(guī)劃及控制,在這樣的平臺上研究的路徑規(guī)劃方法可以應(yīng)用到其他機(jī)器人應(yīng)用環(huán)境,完成有實(shí)用意義的任務(wù)。如何在這樣一個環(huán)境中規(guī)劃出每個機(jī)器人的運(yùn)動路線【5】,讓每個隊員很有策略地行動、配合,是一個研究移動機(jī)器人規(guī)劃的很好平臺,而且在這樣一個具有高度實(shí)時性和競爭性平臺上研究路徑規(guī)劃也是個很有挑戰(zhàn)性的課題。1.4本文主要的研究工作小型組足球機(jī)器人體積比較小,這就限定了機(jī)器人本身不可能裝配太多的傳感器,也限制了機(jī)器人許多功能的實(shí)現(xiàn)。但是小型組足球機(jī)器人“麻雀雖小五臟俱全’’,涉及計算機(jī)、人工智能、控制理論、傳感器融合、信號處理、無線通訊、精密機(jī)械、機(jī)器人學(xué)等多個學(xué)科。當(dāng)前策略系統(tǒng)的研究是機(jī)器人足球系統(tǒng)研究的熱點(diǎn)之一,它涉及到路徑規(guī)劃、動作控制、多智能體合作等問題。本文總結(jié)本校參加RoboCup競賽的多年經(jīng)驗(yàn),在RoboCup江南大學(xué)碩士學(xué)位論文小型組決策系統(tǒng)的設(shè)計和實(shí)現(xiàn)方面做了深入的研究。第一章緒論部分主要介紹了R.obocup足球機(jī)器人比賽的概況,小型組足球機(jī)器人的研究現(xiàn)狀,小型組決策系統(tǒng)和路徑規(guī)劃的方法以及本課題的主要研究內(nèi)容。第二章主要介紹IbboCup小型組比賽中采用的兩種典型的系統(tǒng)結(jié)構(gòu),比較了兩種結(jié)構(gòu)的優(yōu)缺點(diǎn)。重點(diǎn)描述了采用全局視覺系統(tǒng)結(jié)構(gòu)的組成,詳細(xì)列出了每個子系統(tǒng)的研究內(nèi)容,研究重點(diǎn)和當(dāng)前的研究現(xiàn)狀。第三章對RoboCup小型組決策子系統(tǒng)進(jìn)行研究。主要介紹了決策部分的組成模塊,以及決策模塊的分層結(jié)構(gòu)。詳細(xì)分析了場上態(tài)勢分析、隊形確定、角色分配、以及動作的設(shè)計。對決策系統(tǒng)軟件設(shè)計引入了三種方法,并分析了各自的優(yōu)缺點(diǎn),提出了決策系統(tǒng)軟件設(shè)計的要求。第四章提出了一種基于改進(jìn)蟻群算法的機(jī)器人路徑規(guī)劃方法,給出了該算法的詳細(xì)定義。用柵格法提出了一種建模方法,并將其應(yīng)用到改進(jìn)的蟻群算法中。給出了軟件設(shè)計的主要數(shù)據(jù)結(jié)構(gòu)和各模塊間的接口函數(shù)。最后給出了仿真分析結(jié)果。第五章設(shè)計并實(shí)現(xiàn)了機(jī)器人的避障策略。對動態(tài)障礙物進(jìn)行了預(yù)測建模,結(jié)合機(jī)器人決策系統(tǒng)的特點(diǎn),提出了切線法和滾動窗口法的動態(tài)避障方法,詳細(xì)分析了滾動窗口法并進(jìn)行了仿真研究。對本文工作做了總結(jié),并對今后的研究方向做了進(jìn)一步的探討與展望。4第二章Robocup小型組的系統(tǒng)設(shè)計第二章RoboCup小型組的系統(tǒng)設(shè)計2.1RoboCup小型組系統(tǒng)結(jié)構(gòu)設(shè)計2.1.1RoboCup小型組的的典型系統(tǒng)結(jié)構(gòu)多機(jī)器人系統(tǒng)的群體體系結(jié)構(gòu)是多機(jī)器人系統(tǒng)研究的重要課題【6】。多機(jī)器人系統(tǒng)單單依靠幾個機(jī)器人的簡單組合并不能充分發(fā)揮其優(yōu)勢,只有通過一定形式的合作才能實(shí)現(xiàn)對復(fù)雜任務(wù)的處理。如機(jī)器人球隊的防守、進(jìn)攻以及復(fù)雜戰(zhàn)略的實(shí)現(xiàn)。而多機(jī)器人要實(shí)現(xiàn)相互間的合作就必須確定機(jī)器人之間邏輯上和物理上的信息關(guān)系和控制關(guān)系,以及問題求解能力的分布問題,在目前的研究中,根據(jù)控制方式的不同,小型組足球系統(tǒng)可以分為兩類:(1)Remote-bm“ess系統(tǒng)。其特點(diǎn)在于采用全局視覺作為反饋,計算全部在服務(wù)器主機(jī)完成,機(jī)器人只接受遙控命令。這是一種相對比較簡單的集中式控制方式,這種系統(tǒng)又稱之為全局視覺系統(tǒng)。(2)Robot.based系統(tǒng)。在這種系統(tǒng)中,不使用懸掛在場地上方的攝像頭,而是每個機(jī)器人使用自身帶有的局部視覺系統(tǒng)和傳感器獲得自身周圍的部分信息,并通過機(jī)器人之間的相互無線通訊獲得其他機(jī)器人和球的信息。決策系統(tǒng)是分布式而不是集中式的,每個機(jī)器人具有決策能力,通過無線通信,多機(jī)器人合作實(shí)現(xiàn)目標(biāo)。這種系統(tǒng)又稱之為局部視覺系統(tǒng)。很明顯,局部視覺系統(tǒng)比全局視覺系統(tǒng)提出了更高的要求,兩者的主要優(yōu)缺點(diǎn)有:(1)全局視覺系統(tǒng)使用懸掛在場地上方的攝像頭,能夠在第一時間獲得整個比賽場地的比賽信息,響應(yīng)速度快。而局部視覺系統(tǒng),自身配備的攝像頭由于安裝條件只能得到一定角度范圍和距離范圍的場地信息,不能獲得整個場地的信息。(2)全局視覺系統(tǒng)通過比賽場外的一臺服務(wù)器主機(jī)完成整個決策的,決策系統(tǒng)是集中式的。而局部視覺系統(tǒng)采用分布式的決策系統(tǒng),每個機(jī)器人都具有決策的能力。這樣就要求機(jī)器人具有非常強(qiáng)大的學(xué)習(xí)能力,同時如何保證每個機(jī)器人的分布式?jīng)Q策程序有效的、協(xié)同的工作,而不會發(fā)生沖突,是決策系統(tǒng)需要解決的一個關(guān)鍵難題。(3)全局視覺系統(tǒng)中,無線通信是半雙工的,即數(shù)據(jù)的傳輸方向是單向的,由主機(jī)發(fā)送到機(jī)器人,同時發(fā)送的數(shù)據(jù)量比較少,只有決策信息,對通信系統(tǒng)要求不是很高。而在局部視覺系統(tǒng)中,機(jī)器人之間要互相發(fā)送信息,這時,無線通信是全雙工的,同時發(fā)送的數(shù)據(jù)包括視覺信息和決策信息,數(shù)據(jù)量多。因此,局部視覺比全局視覺要求更加強(qiáng)有力的通信系統(tǒng)。(4)全局視覺系統(tǒng)中,視覺和決策的處理都是由場外的主機(jī)完成的。而場外主機(jī)的運(yùn)行速度是非??斓模虼耍曈X和決策所需要的時間比較短。而局部視覺系統(tǒng)中,視覺和決策的處理都是由場上的機(jī)器人完成。由于機(jī)器人的體積和硬件的限制,使得機(jī)器人的車載處理器的速度比場外的主機(jī)慢,同時,機(jī)器人的處理器還要負(fù)責(zé)處理較大的無線通信數(shù)據(jù)量,控制機(jī)器人的運(yùn)動速度和控球、擊球裝置的動作。因此,如果采用局部視覺,整個系統(tǒng)的運(yùn)行速度將明顯低于全局視覺系統(tǒng)。5江南大學(xué)碩士學(xué)位論文由于全局視覺系統(tǒng)較局部視覺系統(tǒng)實(shí)現(xiàn)簡單,通信數(shù)據(jù)量少且運(yùn)算速更快,因此,目前參加比賽的大多數(shù)隊伍均采用全局視覺系統(tǒng)。最近又提出了一種分層式結(jié)構(gòu),介于集中式結(jié)構(gòu)和分布式結(jié)構(gòu)之間的一種混合結(jié)構(gòu),它把機(jī)器人群體系統(tǒng)分為幾層,既具有主控單元,各自主機(jī)器人又相互獨(dú)立能夠自主決策。既不像集中式那樣管的過細(xì),喪失了機(jī)器人個體對環(huán)境反映的快速性,也不像分布式結(jié)構(gòu)那樣機(jī)器人之間缺少配合和協(xié)作。在當(dāng)前的機(jī)器人比賽中,上述三種形式都存在。FⅡ認(rèn)的足球機(jī)器人比賽系統(tǒng)采用的是集中式結(jié)構(gòu),而Robocup中型組比賽采用的是分布式的結(jié)構(gòu),機(jī)器人之間較少有通訊,比較獨(dú)立。小型組比賽中多數(shù)參賽隊采用的是層式結(jié)構(gòu)。其中主控部分由一臺計算機(jī)構(gòu)成,根據(jù)視覺信息給出比賽的決策,并且實(shí)現(xiàn)各個機(jī)器人對環(huán)境信息的共享,向各個機(jī)器人發(fā)送指令等‘71。2.1.2機(jī)器人系統(tǒng)結(jié)構(gòu)設(shè)計時需要解決的問題(1)感知能力在比賽時機(jī)器人所處的環(huán)境復(fù)雜多變機(jī)器人要能夠感知賽場環(huán)境的變化,以便迅速作出反應(yīng)。我們在比賽場地上方安裝兩部高精度的3CCD攝像頭并配備一個臺式計算機(jī)以及相應(yīng)的圖像處理卡,負(fù)責(zé)監(jiān)測賽場上的環(huán)境,以給出雙方隊員的位置信息、運(yùn)動信息以及球的位置信息運(yùn)動信息。另外為了保證機(jī)器人能夠有效的捕獲到球,更好的控球,在每個機(jī)器人上還配備了一個紅外對管,以檢測球是否在機(jī)器人附近;為了保證機(jī)器人的運(yùn)動控制效果,每個機(jī)器人上還裝配有必要的速度傳感器,甚至加速度傳感器。(2)通訊能力多個機(jī)器人要完成比賽任務(wù)需要機(jī)器人之間的協(xié)調(diào)配合,這需要機(jī)器人具有一定的通訊能力,以方便機(jī)器人之間的協(xié)調(diào)以及與主控單元的交互。我們在機(jī)器人球隊的設(shè)計中采用準(zhǔn)藍(lán)牙技術(shù)進(jìn)行通訊。(3)任務(wù)分解分配的能力機(jī)器人比賽是對抗性活動,在比賽中勝出也是一個復(fù)雜的任務(wù),我們的多機(jī)器人系統(tǒng)要能夠具有任務(wù)分解、分配的能力以協(xié)調(diào)好各個機(jī)器人的行為完成任務(wù)。(4)決策規(guī)劃的能力機(jī)器人球隊要能夠根據(jù)賽場的實(shí)際信息調(diào)整比賽的策略,規(guī)劃各機(jī)器人的行為以期獲取比賽的勝利。(5)局部規(guī)劃的能力各足球機(jī)器人應(yīng)該具有局部規(guī)劃的能力,以應(yīng)付突發(fā)性事件,協(xié)調(diào)諸如空間、時間、目標(biāo)的沖突。提高整個機(jī)器人球隊的靈活性、魯棒性。(6)控制執(zhí)行的能力機(jī)器人要能夠有效的執(zhí)行上層給出的規(guī)劃、任務(wù),以及動作。(7)學(xué)習(xí)的能力為了使機(jī)器人具有靈活性適應(yīng)性,還要讓機(jī)器人個體具有適當(dāng)?shù)膶W(xué)習(xí)能力。2.1.3小型組足球機(jī)器人球隊系統(tǒng)結(jié)構(gòu)考慮到機(jī)器人比賽的復(fù)雜性,結(jié)合當(dāng)前的硬件技術(shù)水平【引,參考國外強(qiáng)隊以及兄弟院6第二章Rob0Cup小型組的系統(tǒng)設(shè)計校的設(shè)計開發(fā)經(jīng)驗(yàn),機(jī)器人球隊采用層式結(jié)構(gòu)如圖2—1所示。視覺系統(tǒng)決策系統(tǒng)圖2—1小型組足球機(jī)器人球隊系統(tǒng)結(jié)構(gòu)Fig.2-lRob0Cup鋤all—sizelea=guesy咖ms咖cture視覺信息處理部分由視覺傳感器獲取全局的環(huán)境信息,實(shí)時地監(jiān)測賽場上的環(huán)境信息,圖像處理計算機(jī)提取出有用的信息,如參賽雙方機(jī)器人的位置信息、運(yùn)動信息、球的位置信息、運(yùn)動信息等,供決策規(guī)劃層使用。決策規(guī)劃層主要由服務(wù)器程序?qū)崿F(xiàn),其運(yùn)行平臺為Lmu)【操作系統(tǒng),主要任務(wù)是綜合賽場信息和裁判信息,進(jìn)行信息處理預(yù)測、決策判斷、任務(wù)規(guī)劃,協(xié)調(diào)控制策略,對各個機(jī)器人的行為、任務(wù)作出適當(dāng)改變,從而協(xié)調(diào)機(jī)器人之間的行為,促進(jìn)機(jī)器人間的配合。最后決策模塊通過路徑規(guī)劃生成各機(jī)器人的運(yùn)行速度軌跡,并通過無線通信發(fā)送到場上機(jī)器人。各參賽機(jī)器人通過與決策規(guī)劃層的交互,將接受到速度軌跡信息經(jīng)過底層驅(qū)動控制,驅(qū)動電機(jī)運(yùn)動從而完成這一周期的輸出。在運(yùn)行的同時根據(jù)自身的傳感器信息作出相應(yīng)的動作,完成比賽。2.1.4小型組足球機(jī)器人球隊個體結(jié)構(gòu)小型組足球機(jī)器人運(yùn)行于時變的非結(jié)構(gòu)化的復(fù)雜的比賽環(huán)境中【9J,對機(jī)器人的性能要求比較高,尤其是對環(huán)境的適應(yīng)性、系統(tǒng)的魯棒性、反應(yīng)的快速性、運(yùn)動的靈活性。在對小型組足球機(jī)器人的設(shè)計中,采用一種基于行為的混合體系結(jié)構(gòu),它不僅包含有反應(yīng)式的行為的思想,還有分層式的思想,綜合了其它體系結(jié)構(gòu)的優(yōu)點(diǎn),以使設(shè)計的機(jī)器人能夠在復(fù)雜的賽場環(huán)境下表現(xiàn)良好。小型足球機(jī)器人在賽場上不僅要能夠完成帶球、踢球、跑位、阻擋、傳球、接球等功能,還要能夠?qū)崿F(xiàn)進(jìn)攻、防守等策略,以及相關(guān)的隊形控制等。這些功能(或機(jī)器人的動作)可以分解為幾個基本的行為模塊,如:運(yùn)動行為(機(jī)器人的平移、旋轉(zhuǎn))、緊急避障行為、帶球(或者說盤球)行為、踢球行為。機(jī)器人在賽場上的各種表現(xiàn),均可以由上述的一種或者幾種行為模塊同時作用表現(xiàn)出來。也就是說我們可以把機(jī)器人在賽場上的表現(xiàn)(各種動作)分解為上述的一種或者幾種行為。為了提高足球機(jī)器人的反應(yīng)速度,對個別行為模塊采用反應(yīng)式的設(shè)計方法。如:機(jī)器人一旦發(fā)現(xiàn)球在附近,則立即作帶球行為,或7江南大學(xué)碩士學(xué)位論文者機(jī)器人一旦檢測到發(fā)生碰撞立即做規(guī)避行為等。如圖2—2為小型組足球機(jī)器人個體的體系結(jié)構(gòu)。上運(yùn)動行為模塊小層決型策組信足緊急避障行為模塊球息匿動機(jī)控器制人賽層盤球行為模塊比場賽環(huán)賽境場信環(huán)息踢球行為模塊境圖2—2小型組足球機(jī)器人個體體系結(jié)構(gòu)Fig.2-2RoboCupsm越l·sizeleagueindiViduals訇mcture圖2—2中,運(yùn)動控制層根據(jù)視覺處理得到的環(huán)境信息以及上層的決策信息規(guī)劃出足球機(jī)器人的運(yùn)動(或動作)選擇一個或者幾個行為模塊起作用,即綜合決策信息、賽場信息給出對各個行為模塊的命令(指令)。這一部分將在后面的章節(jié)著重介紹。運(yùn)動行為模塊根據(jù)運(yùn)動規(guī)劃層給出的機(jī)器人的運(yùn)動信息控制機(jī)器人以一定的方式運(yùn)動(跟蹤上層規(guī)劃出的運(yùn)動),它是足球機(jī)器人中一個比較重要的行為模塊,直接關(guān)系到機(jī)器人任務(wù)的完成情況,它要能夠保證機(jī)器人跟蹤規(guī)劃出的運(yùn)動,否則上層的規(guī)劃都是無效的,因此對控制的要求比較高。在下一節(jié)中將對運(yùn)動行為模塊重點(diǎn)討論。緊急避障行為模塊在機(jī)器人遇到危險或者已經(jīng)碰到障礙物時能夠使機(jī)器人立即做出有效的躲避行為。該模塊與運(yùn)動行為模塊共用相同的執(zhí)行機(jī)構(gòu)(驅(qū)動電機(jī))。在一般的基于行為的結(jié)構(gòu)中該行為具有最高的優(yōu)先級,一旦檢測到機(jī)器人發(fā)生碰撞,立即避障。但是在本課題的設(shè)計中該行為又有所不同,它受上層的規(guī)劃信息和決策信息的影響。比如:機(jī)器人在作帶球運(yùn)動或者跑位時,如果在運(yùn)動過程中足球機(jī)器人與其它機(jī)器人發(fā)生碰撞,應(yīng)該能夠立即避碰然后再執(zhí)行上層的規(guī)劃。但如果規(guī)劃出的機(jī)器人的任務(wù)是阻擋對方的機(jī)器人,則與對方的機(jī)器人發(fā)生碰撞時不需要避碰,以期達(dá)到更好的破壞對方意圖的效果。緊急避障行為受控于規(guī)劃層和決策層,但它依然具有自主反應(yīng)的能力,只是在某些情況下不具有最高的優(yōu)先級。盤球(控球)行為模塊使球始終在機(jī)器人附近而不離開,或者不被對方機(jī)器人隊員搶走。它能夠配合機(jī)器人的運(yùn)動行為模塊完成帶球運(yùn)動,使機(jī)器人能夠帶著球由不利的位置運(yùn)動到有利的位置完成射門或傳球。另外它還能夠保證機(jī)器人更好地完成接球動作,如在準(zhǔn)備接球時(接到球之前)就做盤球動作以增加接到球的概率。該模塊受控于運(yùn)動規(guī)劃層和決策層,獨(dú)立于運(yùn)動行為模塊,有自己的執(zhí)行機(jī)構(gòu)。為了保證機(jī)器人能夠有效的控球,一旦檢測到球在機(jī)器人附近,帶球行為模塊就應(yīng)該馬上動作,這相當(dāng)于反應(yīng)式結(jié)構(gòu)中的反應(yīng)性行為,以便機(jī)器人把握先機(jī)。踢球行為模塊使得球以一定的運(yùn)動方式遠(yuǎn)離機(jī)器人,配8第二蘋Robocup小型組的系統(tǒng)設(shè)計合其它行為模塊能夠完成射門、傳球等動作。該模塊受控于上層運(yùn)動規(guī)劃層和決策層,要求只有在恰當(dāng)?shù)臅r機(jī)才動作,且動作的力度要大(當(dāng)然不允許有誤動作),以保證球有足夠的初速度運(yùn)動到目標(biāo)點(diǎn)(如對方球門、己方接球隊員),盡可能的避開對方機(jī)器人的堵截。在沒有球(球不在機(jī)器人附近)的時候也不能做踢球動作,以免浪費(fèi)機(jī)器人蓄電池有限的電能。2.2機(jī)器人運(yùn)動控制器設(shè)計RoboCup小型組機(jī)器人比賽是一種高速對抗性的活動,這就要求機(jī)器人運(yùn)動快速,準(zhǔn)確,靈活。但是機(jī)器人系統(tǒng)是一個復(fù)雜的非線性系統(tǒng),這給控制系統(tǒng)提出了很高的要求。機(jī)器人控制系統(tǒng)不僅要穩(wěn)定而且要能夠保證機(jī)器人實(shí)現(xiàn)跑位,帶球,傳球,截球,阻擋,盯人,射門等一系列技術(shù)動作。運(yùn)動控制的目的就是使之能精確并且快速地實(shí)現(xiàn)點(diǎn)到點(diǎn)以及任意轉(zhuǎn)角運(yùn)動。目前,較常用的控制方式主要是PID控制法和模糊邏輯控制法【10】。PID控制精度高,但需要精確的數(shù)學(xué)模型,并且參數(shù)的整定至關(guān)重要,在具有時變、非線性、干擾大的動態(tài)環(huán)境下,用傳統(tǒng)的PID控制器已不能達(dá)到較好的控制效果。而模糊控制無需建立精確的數(shù)學(xué)模型,具有較強(qiáng)的魯棒性,在復(fù)雜環(huán)境下,是一種對模型要求不高但又有良好控制效果的控制新策略??墒?,任何一種純模糊控制器本質(zhì)上是一種非線性PD控制,不具備積分功能,控制過程有時會出現(xiàn)不平滑現(xiàn)象,穩(wěn)態(tài)誤差也較難減至理想程度。因此,模糊PID控制方法無疑可以取得比傳統(tǒng)PID控制或單一模糊邏輯控制更好的效果【llJ112】。2.2.1小型組足球機(jī)器人運(yùn)動控制器結(jié)構(gòu)機(jī)器人運(yùn)動行為模塊貫穿于足球機(jī)器人比賽的始終,它無時無刻不在動作。該模塊對運(yùn)動規(guī)劃層給出的運(yùn)動狀態(tài)的跟蹤,直接關(guān)系到規(guī)劃出的運(yùn)動的實(shí)現(xiàn),也關(guān)系到上層策略任務(wù)的施行,從而直接影響著比賽的勝負(fù)。因此如何設(shè)計出一個高效的運(yùn)動控制器已成為一個至關(guān)重要的問題Il引。當(dāng)前在全向移動機(jī)器人運(yùn)動控制、軌跡跟蹤的研究中,大多是在全局坐標(biāo)系下,依據(jù)全局坐標(biāo)系下的機(jī)器人模型,對機(jī)器人進(jìn)行控制。在全局坐標(biāo)系下機(jī)器人模型復(fù)雜、時變性強(qiáng),因此控制算法復(fù)雜,實(shí)現(xiàn)起來難度大,對機(jī)器人的硬件要求高。另外在全局坐標(biāo)系下,對機(jī)器人的運(yùn)動控制理論上雖然可以實(shí)現(xiàn),但對于足球機(jī)器人比賽系統(tǒng)而言,全局坐標(biāo)系下的信息的獲取受到視覺處理硬件的限制,采樣周期不可能很短,而機(jī)器人本身又不具有檢測全局信息的能力。因此基于世界坐標(biāo)系下機(jī)器人模型的足球機(jī)器人運(yùn)動控制具有很大的難度,控制效果不理想。多數(shù)參賽隊伍并不是依據(jù)視覺的信息來進(jìn)行機(jī)器人的控制,而是將其用于人工智能模塊,或者決策規(guī)劃模塊;對機(jī)器人速度的控制則依據(jù)機(jī)器人本身的傳感器信息(如碼盤信息,驅(qū)動電機(jī)的電樞電流,機(jī)器人的加速度信息等)進(jìn)行控制。如圖2—3是目前多數(shù)球隊采用的控制結(jié)構(gòu)。控制器首先根據(jù)決策規(guī)劃層給出的運(yùn)動信息通過坐標(biāo)變換、逆運(yùn)動學(xué)方程得到各個驅(qū)動電機(jī)期望轉(zhuǎn)速,然后分別控制電機(jī)轉(zhuǎn)動以達(dá)到控制機(jī)器人運(yùn)動的目的。這樣將機(jī)器人的運(yùn)動控制問題轉(zhuǎn)化為電機(jī)的運(yùn)動控制問題,大大降低了控制器的設(shè)計難度。9江南大學(xué)碩士學(xué)位論文決機(jī)q~電機(jī)控制器I驅(qū)動電柵策器規(guī)人劃y‘。速逆出度峨.電機(jī)控制器Ⅱ驅(qū)動電機(jī)II的變運(yùn)壓換動動學(xué)信方息程鴨。電機(jī)控制器Ⅲ驅(qū)動電機(jī)Iu圖2—3一般的機(jī)器人控制結(jié)構(gòu)F培2-3Tllegen硎cRobocupcon臼.olsystcm圖2—3這種控制器的設(shè)計是以電機(jī)為控制對象,以電機(jī)的轉(zhuǎn)速為控制目標(biāo),孤立地對每一個電機(jī)進(jìn)行控制。雖然能夠保證每一個電機(jī)的控制都是最好的,但是忽略了它們作為一個有機(jī)整體的相互間的配合,并不能保證整體效果的最優(yōu)。另外這種設(shè)計是建立在穩(wěn)態(tài)時電機(jī)的轉(zhuǎn)速能夠達(dá)到設(shè)定值的基礎(chǔ)上的,也只有在三個電機(jī)都達(dá)到設(shè)定值時,機(jī)器人才能達(dá)到期望的運(yùn)動,這是建立在穩(wěn)態(tài)基礎(chǔ)上的靜態(tài)設(shè)計,沒有考慮到各個電機(jī)動態(tài)過程對機(jī)器入運(yùn)動的影響。由于比賽過程中機(jī)器人的期望運(yùn)動狀態(tài)處于不斷變化當(dāng)中,有時候變化的幅度比較大,每個電機(jī)都經(jīng)常地處于調(diào)節(jié)過程中,因此按照這種控制器結(jié)構(gòu)設(shè)計的控制器并不能適應(yīng)賽場高度時變的環(huán)境。本章我們將機(jī)器人整體作為控制對象,在傳統(tǒng)的控制器基礎(chǔ)上加入反饋控制和前饋控制設(shè)計足球機(jī)器人運(yùn)動控制器【14】。機(jī)器人運(yùn)動控制系統(tǒng)結(jié)構(gòu)如圖2—4所示:圖2—4機(jī)器人運(yùn)動控制系統(tǒng)結(jié)構(gòu)Fig.2_4Robotmo、,e】memC0mrollersystemStmcture其中速度變換根據(jù)上層決策規(guī)劃出的機(jī)器人的運(yùn)動信息給出相對坐標(biāo)系下移動機(jī)器人的參考運(yùn)動狀態(tài)礦’。前饋控制器(逆運(yùn)動學(xué)方程)根據(jù)給出的相對坐標(biāo)系下運(yùn)動速度參考值迅速計算出機(jī)器人的參考輸入量U’,保證機(jī)器人的快速響應(yīng)。傳統(tǒng)的PID控制沒有考慮到各個電機(jī)動態(tài)過程對機(jī)器人運(yùn)動的影響。由于比賽過程中機(jī)器人的期望運(yùn)動狀態(tài)處于不斷變化當(dāng)中,有時候變化的幅度比較大,每個電機(jī)都經(jīng)常的處于調(diào)節(jié)過程中,因此按照傳統(tǒng)的控制器設(shè)計方法并不能適應(yīng)賽場高度時變的環(huán)境,控制效果并不理想。本文將在傳10第二章Robocup小型組的系統(tǒng)設(shè)計統(tǒng)的控制器基礎(chǔ)上加入模糊控制。模糊控制器采用目前廣泛使用的二維模糊控制器,即以偏差e和偏差的變化率Pf作為模糊控制的輸入量。PID參數(shù)模糊自整定是找出PID的3個參數(shù)七。,置,屯與P和Pc之間的模糊關(guān)系,在運(yùn)行中不斷檢測P和ec,通過模糊控制原理來對3個參數(shù)進(jìn)行在線修改,以滿足不同P和口c時對控制參數(shù)的要求,從而使被控對象有良好的動、靜態(tài)性能。2.2.2小型組機(jī)器人運(yùn)動控制器的設(shè)計在不同IPI和IPcI下,被控過程對參數(shù)后。、t、吻自整定的原則如下【15】:(1)當(dāng)IPI較大時,為使系統(tǒng)具有較好的快速跟蹤性能,應(yīng)取較大的七。與較小的吒,同時為避免系統(tǒng)響應(yīng)出現(xiàn)較大的超調(diào),應(yīng)對積分作用加以限制,通常取幺=0。(2)當(dāng)IPl處于中等大小時,為使系統(tǒng)響應(yīng)具有較小的超調(diào),七。應(yīng)取得小些,在這種情況下,包的取值對系統(tǒng)影響較大,t的取值要適當(dāng)。(3)當(dāng)lPI較小時,為使系統(tǒng)具有較好的穩(wěn)態(tài)性能,七。與t應(yīng)取得大些,同時為了避免系統(tǒng)在設(shè)定值附近出現(xiàn)振蕩,t值的選擇是相當(dāng)重要的。在模糊PID參數(shù)自整定系統(tǒng)中,關(guān)鍵是如何設(shè)計模糊控制器,使它能根據(jù)偏差e及偏差變化率gc在線自整定后。、毛和憶三個參數(shù),也就是如何設(shè)計一個模糊推理控制器,使它能根據(jù)專家及操作者的經(jīng)驗(yàn)?zāi)7氯说乃季S,通過模糊推理算法,自動的推算出PID參數(shù)七。、乞和屯的取值,從而達(dá)到理想的控制目的。根據(jù)模糊控制理論及控制經(jīng)驗(yàn),模糊PID參數(shù)自整定控制器的設(shè)計內(nèi)容如下:(1)輸入、輸出變量的尺度變換對于模糊控制的輸入變量,首先要求對其進(jìn)行尺度變換,即將輸入變量的實(shí)際范圍變換到要求的論域范圍哺3。采用線性變換方法,則按下式計算變換后的任一輸入量值:%=(‰+‰)/2+屯(戈一(t+‘)/2)(2.1)其中屯=(‰一‰)/(t一‘)為量化比例因子;%為量化后的輸入量值,磊為量化前基本論域的輸入量值;實(shí)際輸入量論域?yàn)椤敬?,‘】,要求的論域?yàn)閇‰,‰】;分別取量化后的模糊論域?yàn)镋:[.6.5.4.3.2.1O123456】,EC:【.6—5_4.3.2.1Ol23456】,K:【-6—5_4—3—2·l0123456】。(2)確定變量的模糊集及所對應(yīng)的隸屬度函數(shù)選取輸入語言變量為速度誤差P和誤差的變化率Pc,輸出對應(yīng)著PID控制器三個待定參數(shù)的模糊子集。本設(shè)計中,誤差P的模糊集為E:{^7:8,Ⅳ膨,胳,z0,髂,跗,船),誤差的變化率Pc的模糊集為嬲:{加,Ⅳ必,嬲,ZD,咫,跗,船}。三個參數(shù)Kp,尺,和心的輸出模糊集同樣取為K:{船,肼,船,ZD,雕,肌,胎}。江南大學(xué)碩士學(xué)位論文冷Ⅸ一_6-5o·3-2.10123456R&圖2—5輸入空間的模糊分割示意圖Fig.2—5Fuzzyinfer%cesySteminputmemberSKp矗mction針對本系統(tǒng)中輸入E、比量化后所得到的論域,并取三角形隸屬度函數(shù),便可實(shí)現(xiàn)對輸入空間的模糊分割如圖2—5。(3)模糊推理規(guī)則模糊控制器的規(guī)則是基于專家知識或控制工程師長期積累的經(jīng)驗(yàn),其一般形式是由模糊語言和模糊邏輯組成的模糊條件語句。本文模糊控制器為雙輸入三輸出,下面給出七。(乞和顫同理可推)整定的初始模糊控制表如表2一l所示。本系統(tǒng)對PID參數(shù)自整定的模糊推理是由一個多輸入多輸出(MIMO)的模糊機(jī)推理實(shí)現(xiàn)的,其推理規(guī)則有如下基本形式:足={砣啪,確啪,?,毗啪>(2.2)表2—1七。調(diào)節(jié)規(guī)則表Table2-1七。刪ustmle協(xié)leKEECNBNMNSZOPSPMPB其中礙舢表示如果(x是4and?andy是忍)則(毛是Cf。,?,乙是巳)?!独叩那凹侵狈e空間X×?×】,上的模糊集合,后件是g個控制作用的并,它們之間是相互獨(dú)立的。因此《蚴可以看成是g個獨(dú)立的MIso規(guī)則,即蟛徹={硝煳,蟛‰,?,硝島}(2.3)其中碟渤表示如果(x是4刪?冊dy是E)則(z,是Cj,),因此只需考慮MIso子系統(tǒng)的模糊推理問題??紤]到算法的實(shí)時性和復(fù)雜性,本文采用簡單易行的最大隸屬度12蹦加瑚瑚M黔№№№№№黔M№№BMSo峪MM颶蹦i2趵№mMBBMM阻腿蹦D附洲加樅MⅢBBBBⅣ思限颶腿颶蹦耋寶MBBBB№M№∞胳晰颶颶路颶阻ⅣM三限寶i限全第二章Robocup小型組的系統(tǒng)設(shè)計法進(jìn)行解模糊處理并使用先離線計算模糊決策表(如表2—2所示),程序中直接查表求得輸出量得方式。表2—2模糊控制器查詢表1曲le2-2Fllz=萬con仃ollermqu蚵訕leKEEC-5—4-3-2.10(4)仿真與實(shí)驗(yàn)本文用MATLAB的FIS(模糊推理)編輯器與SIMULINK相結(jié)合的方式對模糊自整定PD控制方法進(jìn)行仿真研究如圖2—6所示【16】:烈zn控fI;IZ\\l更羽P£D攔霸i.f圖2—6仿真曲線圖F嘻2-6S.肼ulation爭印h從響應(yīng)曲線上可以看出單純的PID控制超調(diào)量大,過渡時間長,系統(tǒng)跟蹤速度慢。單純的模糊控制雖然跟蹤速度很快,但存在較大的靜差,因此使控制精度降低。模糊PID控制不但超調(diào)量少、無靜差,而且跟蹤速度快。仿真和實(shí)驗(yàn)表明,本文所提出的模糊PID復(fù)合控制應(yīng)用到機(jī)器人的運(yùn)動控制中,既保證了系統(tǒng)控制的動態(tài)效果、提高控制系統(tǒng)的響應(yīng)速度,又使系統(tǒng)有了較好的穩(wěn)態(tài)性能,對于較復(fù)雜的動態(tài)環(huán)境有良好的適應(yīng)性。2.3小結(jié)本章通過分析小型組控制器的結(jié)構(gòu),提出了一種基于模糊PD方法的機(jī)器人控制器設(shè)6一乏o4644444石石石石5一弓o4巧44444石缶石石4一乏。乏o44444石石缶石3一o4弓。弓弓66巧石巧缶石2—4443O0乏44擊石石石●一454300之44石缶缶石656544044缶6缶66565442OO54446565442OO54445555333OO55556565654442222擊一6565656565622缶弓4o之00,23456江南大學(xué)碩士學(xué)位論文計。詳細(xì)分析了模糊控制器的設(shè)計方法,并將其應(yīng)用到小型組機(jī)器人控制器中,通過仿真分析驗(yàn)證了該方法比傳統(tǒng)單一的PID控制或模糊控制有了更好的響應(yīng)特性。14第三章RoboCllp小型組決策子系統(tǒng)結(jié)構(gòu)分析第三章RoboCup小型組決策子系統(tǒng)結(jié)構(gòu)分析人類足球發(fā)展至今,其中蘊(yùn)含的學(xué)問可謂博大精深。除了隊員本身的技術(shù)水平和意識以外,最重要的就是教練的戰(zhàn)術(shù)安排,包括排兵布陣、攻防轉(zhuǎn)換、定位球等等。出色的策略往往是克敵制勝的法寶,這一點(diǎn)早就被無數(shù)場比賽所驗(yàn)證。機(jī)器人足球比賽同樣如此,而決策子系統(tǒng)就是機(jī)器人足球的教練,機(jī)器人足球比賽的策略本身也有許多就是直接來自于人類足球比賽的寶貴經(jīng)驗(yàn)。在足球機(jī)器人系統(tǒng)中。決策子系統(tǒng)的任務(wù)就是根據(jù)當(dāng)前球場上的比賽形勢,做出部署,給隊員發(fā)出指令,擔(dān)負(fù)起教練員的職責(zé)。顯然這種思維過程必然是豐富多彩和千變?nèi)f化的。機(jī)器人足球決策系統(tǒng)是復(fù)雜的智能控制系統(tǒng),在系統(tǒng)中廣泛采用了模糊控制、蟻群算法和專家系統(tǒng)等智能控制方法。根據(jù)場上形勢的變化,有的系統(tǒng)還具有自適應(yīng)和自學(xué)習(xí)的功制r71。3.1決策子系統(tǒng)的構(gòu)成RoboCup小型組機(jī)器人決策子系統(tǒng)構(gòu)成框圖如下圖3—1所示,各模塊的功能將依次介紹如下:圖3—1決策系統(tǒng)構(gòu)成框圖F培3-1Decision_n砭Il【ingSySt鋤composing矗amework(1)主模塊主模塊是自始至終運(yùn)行的部分,能夠接受裁判盒發(fā)送的信號控制機(jī)器人啟動停止。比賽階段,能夠自由運(yùn)行其他各模塊,讀取視覺信息,做出決策后發(fā)給通信模塊。(2)視覺模塊視覺模塊包括視覺伺服模塊和視覺數(shù)據(jù)接口。視覺伺服負(fù)責(zé)采集場上的視覺信息并進(jìn)行處理,視覺數(shù)據(jù)接口按照約定的格式,接受視覺伺服系統(tǒng)采集的信息將其轉(zhuǎn)換為場上機(jī)器人和球的位置、狀態(tài)、方向等信息,并發(fā)給主模塊。(3)決策模塊和決策庫決策模塊根據(jù)視覺系統(tǒng)的數(shù)據(jù),決定我方球隊的攻守狀態(tài),球員的角色分配,同時具體生成每個機(jī)器人的速度和位置要求。決策庫是決策模塊的重要部分,包含機(jī)器人的運(yùn)動15LL用滅平壩工平世記義規(guī)則,以及一些固定函數(shù)。(4)通信模塊通信模塊的任務(wù)主要是把決策后的數(shù)據(jù)通過發(fā)射裝置傳送給場上的機(jī)器人,程序中主要表現(xiàn)為主模塊調(diào)用通信模塊的函數(shù)。通信模塊還包括一部分掃描串行口的程序,用于監(jiān)視裁判盒發(fā)出的指令。3.2決策模塊的分層結(jié)構(gòu)模型從上面了解到,足球機(jī)器人的決策的任務(wù)便是根據(jù)視覺子系統(tǒng)的辨識結(jié)果:場上實(shí)體(機(jī)器人與球)的位姿(位置與朝向),決定本方各機(jī)器人的左右輪速度,以便各機(jī)器人走出期望的軌跡,實(shí)現(xiàn)理想的配合,在雙方激烈的競爭中,將球踢進(jìn)對方球門,而力爭我方不失球【181。如果將視覺子系統(tǒng)送來的位姿信息用(聊+1)×3矩陣,表示(聊為識別機(jī)器人個數(shù)),而將決策子系統(tǒng)發(fā)出的輪速信息用刀×2矩陣D表示(刀為我方機(jī)器人個數(shù)),那可以將決策子系統(tǒng)的開發(fā)形式化為設(shè)計如下函數(shù)關(guān)系:D=廠(,)(3.1)不難看出,方程具有如下特征:(1)描述的應(yīng)是一個動態(tài)過程,而不應(yīng)該為一個靜態(tài)過程;(2)沒有唯一解,因?yàn)闆Q策過程是豐富多彩和不斷發(fā)展的;(3)無法給出解析解,因?yàn)槌瞬糠盅堇[推理之外,更多的函數(shù)關(guān)系表現(xiàn)為規(guī)則知識和產(chǎn)生式推理;(4)求解復(fù)雜而困難,因?yàn)樵谌祟惖淖闱蚧顒又校蜗笏季S占有很大比例,而形象思維如何描述和抽象還是當(dāng)今沒有很好解決的難題.本文便是結(jié)合國內(nèi)外各大院校的研究與實(shí)踐,對于足球機(jī)器人決策與控制系統(tǒng)的設(shè)計與開發(fā)給出的系統(tǒng)總結(jié).在接續(xù)的各節(jié)中,將分別闡述智能機(jī)器人的分層遞階控制結(jié)構(gòu)。以下圖3—2給出機(jī)器人決策模塊的分層結(jié)構(gòu)。上態(tài)勢分析I瑩霪<≥策隊形確定系之多統(tǒng)角色分配I盎<鄉(xiāng)文e臣動作分配蒺≤鄉(xiāng)策動作修正系之≥統(tǒng)運(yùn)動規(guī)劃圖3—2分層結(jié)構(gòu)示意圖Fig.3-2Hie眥hic鰣g咖cturesketchm印按照GN.saridis等提出的控制系統(tǒng)理論【191,這是一個典型的分層遞階智能控制系統(tǒng)。其中態(tài)勢分析、隊形確定、角色分配屬于組織級,動作分配和動作修正屬于協(xié)調(diào)級,而運(yùn)16第三章RoboC印小型組決策子系統(tǒng)結(jié)構(gòu)分析動規(guī)劃屬于執(zhí)行級。這種結(jié)構(gòu)將計算機(jī)的高層決策、系統(tǒng)理論中的先進(jìn)的數(shù)學(xué)建模和綜合方法以及處理不精確和不完全信息的語言學(xué)方法結(jié)合起來,形成了一種適合于工程需要的統(tǒng)一的方法。每個層實(shí)現(xiàn)的功能如下【20】:(1)態(tài)勢分析在組織級給出當(dāng)前任務(wù)之前,系統(tǒng)要完成視覺的預(yù)處理。即完成場上各個實(shí)體的線速度、角速度、方向角以及各個機(jī)器人和球的相互距離的計算(球無角速度)。視覺數(shù)據(jù)預(yù)處理后,建立視覺空間到比賽狀態(tài)空間的映射。輸入的是視覺信息,輸出是賽場狀態(tài),所以它的主要作用是完成視覺空間到狀態(tài)空間的映射。賽場狀態(tài)是賽場的態(tài)勢的數(shù)學(xué)描述。賽場的狀態(tài)的定義取決于決策設(shè)計者的主觀意識。定義的和匹配賽場狀態(tài)的過程是態(tài)勢分析的關(guān)鍵。該部分的另外一個重要作用是保證從視覺系統(tǒng)傳來的傳感器信息是否完整、精確和有效。在實(shí)際的比賽過程中,由于場地的光線條件往往不是很好,場地周圍有很多觀眾,所以視覺系統(tǒng)的所面對的常常是惡劣的視覺環(huán)境。在這種情況下僅僅依靠增強(qiáng)視覺系統(tǒng)的精度和可靠性來建立傳感器空間往往是不夠的,這就需要信息預(yù)處理部分對視覺信息進(jìn)行預(yù)處理。經(jīng)常地遇到的一種情況是在場地某點(diǎn)上一些顏色不好的機(jī)器人從視覺信息中丟失。遇到這種情況,就需要利用信息預(yù)處理部分對視覺傳感器建模,預(yù)測一個機(jī)器人位姿來代替未知的機(jī)器人位姿,并進(jìn)行特殊處理以便視覺系統(tǒng)盡快重新發(fā)現(xiàn)該機(jī)器人。整個完成視覺空間到狀態(tài)空間的映射的過程是運(yùn)用專家系統(tǒng)和模糊控制的知識把相對精確的數(shù)據(jù)模糊化的過程,屬于產(chǎn)生式推理的范疇。(2)隊形確定建立有效的組織結(jié)構(gòu)可以提高多機(jī)器人系統(tǒng)的協(xié)作能力,組織方法通過定義角色、行為預(yù)測等,增強(qiáng)協(xié)作程度。根據(jù)全局視覺感知進(jìn)行集中決策,組織隊形,隊形中的每個角色由一個機(jī)器人承擔(dān),再并行(邏輯上)進(jìn)行動作選擇與執(zhí)行。多個機(jī)器人在一個隊形里分別承擔(dān)角色,表現(xiàn)團(tuán)隊的行為。這里采用隊形來實(shí)現(xiàn)機(jī)器人之間的相互協(xié)作。通過隊形將任務(wù)空間分解為角色集合。隊形中包括與對中機(jī)器人個數(shù)相等的角色,每個機(jī)器人充當(dāng)一個角色。隊形還可以分為子隊形,稱之為隊形單元,一個隊形單元是組成隊形角色的子集。通過隊形單元可以增強(qiáng)處理局部問題的能力,而不影響整體動作。在這里主要采用三種隊形:①進(jìn)攻隊形(O毹rlsiveFo鋤撕on,OF)對應(yīng)的陣型為卜卜3;②防守隊形(De脅siveFo加撕omDF)對應(yīng)的陣型為卜3—1;③攻防兼顧隊形(Dem鄴ice.O恐nSiveFo咖ation,DOF)對應(yīng)的陣型為卜2—2;相應(yīng)地定義了五種角色,即:①守門員角色(GoaJKeeper,GK);②主攻角色(ActiveO虢nSe,AO);③協(xié)攻角色(A腿ili唧O彘IlSe,AuO);④主防角色(ActivcDefense,AD);⑤協(xié)防角色(Au)【ilia巧De矗潞e,AuD);其中,進(jìn)攻隊形包含:守門員、主攻角色和協(xié)攻角色,防守隊形包括:守門員、主防角17扛兩大學(xué)壩士學(xué)位論文色和協(xié)防角色,攻防兼顧隊形包括守門員、主攻角色和主防角色。主要采用的是攻防兼顧隊形,陣型為卜2—2,其中隊形排列是按照從后場到前場的順序,即守門員一防守隊員一進(jìn)攻隊員。該隊形的球員分布如圖3—3所示:圖3—3攻防兼顧隊形陣列Fig.3-3Attackinganddefcndingorderamy這種隊形攻防兼?zhèn)?,很適合5vs5的比賽,但是兩個進(jìn)攻隊員在對方的全力防守下很難進(jìn)攻,所以在全力進(jìn)攻時會改變隊形,采取卜卜3隊形,這種隊形增強(qiáng)了球隊攻擊力。他的布局圖如下圖3—4所示。圖3—4增強(qiáng)攻擊力隊形陣列Fig.3_4Att∞kingenhancedorder繃y在微足球機(jī)器人系統(tǒng)實(shí)際應(yīng)用中,為了增強(qiáng)系統(tǒng)的靈活性,設(shè)計一些預(yù)定情節(jié)隊形。對于一些經(jīng)常發(fā)生,且非常相似的情節(jié),預(yù)先分配機(jī)器人角色并確定其采取的動作,按照預(yù)定情況進(jìn)行配合,稱之為預(yù)定情節(jié)動作。它可以提高系統(tǒng)的實(shí)時性和對特定情形的處理能力。如在比賽中經(jīng)常出現(xiàn)爭球、門球、點(diǎn)球等特殊情況,都固定了相應(yīng)的隊形。(3)角色分配基于區(qū)域的固定角色分配是微型足球機(jī)器人比賽中常采用的方法,為機(jī)器人分配固定的區(qū)域與特定的角色,只有當(dāng)球處于某個機(jī)器人的區(qū)域時,它才采取相應(yīng)的動作,為增加區(qū)域劃分的靈活性,在相鄰的區(qū)域間增設(shè)柔性區(qū)域。這種角色分配方法過于依賴場地分區(qū)(區(qū)域),限定了機(jī)器人間的相互配合,無法實(shí)現(xiàn)靈活的戰(zhàn)術(shù)。18第三章Rob0C叩小型組決策予系統(tǒng)結(jié)構(gòu)分析在這里,角色是包含在隊形之中的,確定隊形之后,根據(jù)機(jī)器人的位置和姿態(tài)分配特定的角色,此時并不考慮場地分區(qū)。如在進(jìn)攻時,除守門員外,最可能先靠近球的機(jī)器人(與球的距離和夾角比較小)承擔(dān)主攻角色,其它機(jī)器人為協(xié)攻角色。在角色分配之后的隊形保持,即實(shí)現(xiàn)相互配合時,才考慮場地的區(qū)域劃分。由協(xié)攻角色根據(jù)區(qū)域劃分和主攻的位置決定自己的策應(yīng)位置和動作1211。協(xié)攻角色所占據(jù)有可能得到傳球、進(jìn)行補(bǔ)射或是攔截對方傳球的位置,一旦得到球,角色就發(fā)生改變,即進(jìn)行角色轉(zhuǎn)換。當(dāng)然在應(yīng)用中,要依據(jù)一定的條件判據(jù)。在進(jìn)行角色轉(zhuǎn)換時,主要以機(jī)器人與球的距離和相對角度為依據(jù)。式(3.2)給出了當(dāng)前承擔(dān)主要角色(主攻、主防角色)和輔助角色(協(xié)攻、協(xié)防角色)機(jī)器人的條件判據(jù)厶和/。,通過比較它們的大小,可以衡量兩個機(jī)器人位置和姿態(tài)的好壞,決定是否進(jìn)行角色轉(zhuǎn)換。厶=丑l足一匕I+九I%I以=^l昂一只I+九1%l其中,凡,九為距離因素和角度因素的加權(quán)系數(shù),‰,%分別為小球在主要角色機(jī)器人和輔助角色機(jī)器人坐標(biāo)系中的角度表示,只為球的當(dāng)前位置,匕,只分別為承擔(dān)主要角色和輔助角色機(jī)器人的當(dāng)前位置。可以根據(jù)實(shí)際機(jī)器人小車的特性,如果轉(zhuǎn)動性能比較好,可適當(dāng)增加距離項(xiàng)的權(quán)系數(shù),“如果轉(zhuǎn)動性能不好,一定長距離的移動要比改變角度更容易控制和節(jié)省時間,則增加角度項(xiàng)的權(quán)系數(shù)。在仿真環(huán)境進(jìn)行學(xué)習(xí)只是給出這兩項(xiàng)權(quán)系數(shù)一個基本范圍,主要是通過經(jīng)驗(yàn)設(shè)定,要在比賽中不斷地改進(jìn)。如在實(shí)際應(yīng)用中常依據(jù)如下條件進(jìn)行角色轉(zhuǎn)換:比<2×叱n一萬/4<%<萬/4n%<‰(3.3)其中,d。,九分別為主要角色機(jī)器人和輔助角色機(jī)器人與小球的距離。如果上述條件滿足,則承擔(dān)主要角色和輔助角色的機(jī)器人進(jìn)行角色互換。上述角色轉(zhuǎn)換判據(jù)對于進(jìn)攻角色和防守角色同樣適用。除了主、輔角色可以進(jìn)行轉(zhuǎn)換外,守門員角色和防守角色也可以進(jìn)行轉(zhuǎn)換,當(dāng)守門員因?yàn)椴粩嗟刈钃跚颍虮粚Ψ疥爢T推擠而出門區(qū)時,防守隊員可以迅速進(jìn)入門區(qū),承擔(dān)守門員角色,而原來的守門員則自動轉(zhuǎn)換為防守角色。另外,為防止角色頻繁發(fā)生轉(zhuǎn)換,引起系統(tǒng)震蕩,可設(shè)定一最小時間間隔,即剛轉(zhuǎn)換的角色必須在最小時間間隔以后,才能進(jìn)行新的角色轉(zhuǎn)換。(4)動作分配機(jī)器人的動作是對人類智能行為的一種模擬,可以在功能上模仿人類的射門動作、攔截動作等。機(jī)器人通過動作來改變環(huán)境和自身的狀態(tài),每個動作都具有發(fā)生的條件和發(fā)生后的效果??偟膩碚f足球機(jī)器人的動作有如下特點(diǎn):①各種動作都是通過機(jī)器人的速度、位移和軌跡來實(shí)現(xiàn)的。如機(jī)器人轉(zhuǎn)身動作需要有角速度控制來完成,再如障礙回避動作是由軌跡來體現(xiàn)的,而射門、防守等動作要控制機(jī)器人的速度和進(jìn)行軌跡規(guī)劃。②所有的動作最終都是由機(jī)器人小車的速度控制來體現(xiàn)的。速度包括線速度和角速度,足球機(jī)器人小車常采用雙輪差動結(jié)構(gòu),因此這里的機(jī)器人小車速度控制也就是左、右19江南大學(xué)碩士學(xué)位論文’輪速(巧,圪)函數(shù)的設(shè)計。但在決策系統(tǒng)動作設(shè)計和實(shí)現(xiàn)中只是給出機(jī)器人左右輪速設(shè)定,也就是說屬于運(yùn)動學(xué)范疇的問題,而將機(jī)器人速度控制(動力學(xué)的內(nèi)容)留給機(jī)器人車載CPU去完成。③由于機(jī)器人在在矩形場地進(jìn)行足球比賽,實(shí)際上是機(jī)器人小車在平面上自主運(yùn)動,這使得問題描述被極大地簡化了。動作設(shè)計的主要問題也就非常清晰了,即如何設(shè)計快速平滑控制算法使得機(jī)器人從初始狀態(tài)(初始位姿,初始速度)運(yùn)動到期望狀態(tài)(期望位姿,期望速度),可記為[阮,只,眈】,[圪,珞】】j【【t,兒,見】,【吃,‰】】。如果能夠很好地控制機(jī)器人運(yùn)動到球后某一個位置,并且正方向?qū)χ?,這樣就可以很方便地讓機(jī)器人完成射門、傳球等動作。但是由于賽場形式瞬息萬變,對系統(tǒng)的實(shí)時性和算法的效率有較高的要求,且對移動機(jī)器人來說,約束為非完整性約束,也稱不可積約束,因此快速平滑地實(shí)現(xiàn)機(jī)器人的位姿控制是有一定難度的。④動作設(shè)計和實(shí)現(xiàn)可行方案很多,頗具有靈活性。精彩激烈和富于變化的足球比賽(包括人類和實(shí)際的機(jī)器人比賽)是足球機(jī)器人動作設(shè)計靈感的主要源泉。有關(guān)射門、傳插配合等動作設(shè)計既可以體現(xiàn)創(chuàng)造性,又能結(jié)合受非完整約束機(jī)器人各種軌跡規(guī)劃和控制的應(yīng)用研究,這也正是足球機(jī)器人的魅力所在。關(guān)鍵是如何在眾多可行的方案中進(jìn)行選擇和確定,這取決于一些優(yōu)化準(zhǔn)則。系統(tǒng)的實(shí)時性,系統(tǒng)的魯棒性,動作的結(jié)構(gòu)化分層設(shè)計,應(yīng)滿足動作在不斷發(fā)展的需要。當(dāng)比賽規(guī)則、車體結(jié)構(gòu)或驅(qū)動方式發(fā)生改變時,只需要改變底層動作控制。我們知道,人類的足球隊經(jīng)常進(jìn)行往返跑訓(xùn)練和體能測試,使運(yùn)動員具有良好的基本素質(zhì),再進(jìn)行如射門、傳球等技巧訓(xùn)練,最后還要不斷比賽,以增強(qiáng)隊員間相互配合能力,逐步準(zhǔn)確體現(xiàn)教練意圖。這樣隊伍在真正比賽中才能充分發(fā)揮自己的水平。對人類足球訓(xùn)練過程進(jìn)行抽象,可以將足球機(jī)器人的動作分為三類,即基本動作、技術(shù)動作以及戰(zhàn)術(shù)動作?;緞幼鲗?yīng)于運(yùn)動員的基本素質(zhì)訓(xùn)練,包括跑位(到定點(diǎn))、轉(zhuǎn)身(轉(zhuǎn)角)等:技術(shù)動作包括射門、守門、傳球以及大腳破壞等技巧性動作;戰(zhàn)術(shù)動作是指由兩個或兩個以上的機(jī)器人通過相互配合完成的動作,如一傳一射、二過一以及底線傳中等??煽梢詫⒆闱驒C(jī)器人的動作分為三類,即圖3—5動作空間組成示意圖以看出,技術(shù)動作是在基本動作基礎(chǔ)之上的,而戰(zhàn)術(shù)動作又是以技術(shù)動作為基礎(chǔ)的。圖3—5動作空間組成示意圖F追.3—5Actionspacecomposinggraph第三章RoboCIIp小型組決策子系統(tǒng)結(jié)構(gòu)分析(5)動作修正在Ibb0Cup比賽中經(jīng)常有很多限制性的規(guī)則,而且隨著水平的提高將會越來越多引入人類足球機(jī)器人比賽的~些規(guī)則,比如,越位、各種技戰(zhàn)術(shù)的犯規(guī)、以及罰點(diǎn)球、角球、任意球等。而且在比賽的過程中還將及時的對裁判盒的信息做出及時的響應(yīng)。動作修正層的作用就是對已經(jīng)分配給機(jī)器人的動作做出調(diào)整,把這個任務(wù)從動作分配層分離出來的目的是降低動作分配層的復(fù)雜性。而且動作修正層應(yīng)該是一個可擴(kuò)展的模塊,對以后新引入的規(guī)則能夠很好的擴(kuò)展其功能。(6)運(yùn)動規(guī)劃運(yùn)動規(guī)劃層是將協(xié)作意圖進(jìn)行分解細(xì)化的部分,它體現(xiàn)了群體協(xié)作與個體之間的對應(yīng),即如何通過個體的運(yùn)動來反映群體協(xié)作的整體效果。簡單的說就是針對每個機(jī)器人所分配到的角色、動作形成它們的運(yùn)動方式,因此,它注重的是個體要完成什么樣的運(yùn)動以及怎樣讓個體按我們所希望的意圖來運(yùn)動。所以,在整個機(jī)器人決策系統(tǒng)中,運(yùn)動規(guī)劃層的作用是核心的。通常,運(yùn)動規(guī)劃層包括機(jī)器人路徑規(guī)劃和機(jī)器人的動態(tài)避障,前者可以看成是全局的、靜態(tài)的規(guī)劃,而后者可以看成是局部的、動態(tài)的規(guī)劃。運(yùn)動規(guī)劃層設(shè)計要求規(guī)劃生成速度要快、控制周期之間規(guī)劃的銜接應(yīng)該連貫,規(guī)劃的運(yùn)動方式本身應(yīng)該是平滑的,并盡可能.簡潔高效。運(yùn)動規(guī)劃層使用的方法有很多,但并不意味著混合使用多種規(guī)劃方法可以產(chǎn)生好的效果。在不同規(guī)劃的選擇依據(jù)的臨界處,由于某種原因(通常是該算法固有的缺陷)使某蟓條件交替處于兩個規(guī)劃的依據(jù)范圍內(nèi),則產(chǎn)生不斷交替使用兩種規(guī)劃的情況,使機(jī)器人的運(yùn)動出現(xiàn)反復(fù)震蕩的情況。所以,應(yīng)該盡量提高規(guī)劃方法的適用范圍,減少規(guī)劃的數(shù)目。本文將使用蟻群算法進(jìn)行機(jī)器人的全局路徑規(guī)劃,其中將針對基本蟻群算法對路徑規(guī)劃研究的缺陷提出一些改進(jìn)策略。在機(jī)器人避障策略中本文將介紹滾動窗口法和切線法的避障原理,并將滾動窗口法應(yīng)用于仿真中,最后分析了該方法的仿真結(jié)果。3.3決策子系統(tǒng)軟件設(shè)計結(jié)構(gòu)分析小型組系統(tǒng)軟件設(shè)計主要包括圖像處理軟件和決策軟件,軟件結(jié)構(gòu)可以有三種,下面簡要介紹下各自的工作流程和優(yōu)缺點(diǎn)阱】【23】【24】。3.3.1單循環(huán)結(jié)構(gòu)單循環(huán)結(jié)構(gòu)的循環(huán)內(nèi)部為順序結(jié)構(gòu),其工作流程如圖3—6所示。這種結(jié)構(gòu)的特點(diǎn)在于結(jié)構(gòu)簡單,流程明了。因?yàn)樵诒荣愡^程中,只有視覺處理完數(shù)據(jù)后決策才能得到新的場地信息,這時做決策才有意義。所以從邏輯上講,視覺和決策是順序關(guān)系的,程序結(jié)構(gòu)就充分體現(xiàn)了這個關(guān)系。就軟件設(shè)計實(shí)現(xiàn)的方法而言,總體上這種結(jié)構(gòu)是一種面向過程的設(shè)計,在一些局部問題的處理上會用面向?qū)ο蟮姆椒?。不管是面向?qū)ο筮€是面向過程,都是一種方法或者說思路,可以用單一的辦法,也可以混合使用。其使用的依據(jù)應(yīng)該是系統(tǒng)本身的要求,而不是強(qiáng)求形式。2l江南大學(xué)碩士學(xué)位論文圖3—6單循環(huán)程序結(jié)構(gòu)Fig.3-6Single100pplDcedures1瞳ucture3.3.2多線程結(jié)構(gòu)這種架構(gòu)的特點(diǎn)在于視覺線程和決策線程相對獨(dú)立,各自處理自己的任務(wù),相互之間通過多線程的機(jī)制來通信。這種方案優(yōu)勢在于代碼的封裝,把完成特定功能的一些程序模塊用類的形式封裝起來,所以其代碼維護(hù)和重用性能特別好,容易發(fā)布,使得編程就象安裝零件一樣。但是多線程的方法在單CPU系統(tǒng)中操作系統(tǒng)采用時間分片的機(jī)制來實(shí)現(xiàn),并不是真正意義的并行處理,是要浪費(fèi)一定的系統(tǒng)資源的。進(jìn)程間的切換和同步要占用系統(tǒng)資源,且同步問題更為復(fù)雜,就足球機(jī)器人系統(tǒng)而言,采用這種方案的實(shí)時性不是很好,其功能結(jié)構(gòu)如圖3—7所示。主線程視覺線程決策線程甲≮宰創(chuàng)建視覺線程圖像采集讀取數(shù)據(jù)上≥以卜上≥/1卜{≥創(chuàng)建決策線程\/\廠、/圖像處理策略決策之鄉(xiāng)J鄉(xiāng)妙繼續(xù)其他工作儲存結(jié)果發(fā)送數(shù)據(jù)il圖3—7多線程程序結(jié)構(gòu)Fig.3-7Multi.1hadpI.ocedurestllJcture3.3.3定時器中斷結(jié)構(gòu)其流程和第二種很相似,只是采用的具體技術(shù)不同。其流程如圖3—8所示。這種架構(gòu)第三覃Ro枷ClIp小型組決策子系統(tǒng)結(jié)構(gòu)分析的特點(diǎn)是初始化程序啟動兩個定時器后計算機(jī)將定時地進(jìn)入處理程序。一般做成這種架構(gòu)的軟件也是面向?qū)ο蠼Y(jié)構(gòu)的。和第二種方案相似,這種方案中的視覺和決策程序都是相對獨(dú)立的,只是通過共享數(shù)據(jù)段來相互通信。除了有第二種方案的弊端以外,這種方案需要一個精確的定時器。響應(yīng)IO消息甲創(chuàng)建并啟動視覺定時器妙創(chuàng)建并啟動決策定時器凸繼續(xù)其他工作響應(yīng)視覺定時器消息圖像采集8圖像處理鈔儲存結(jié)果響應(yīng)決策定時器消息讀取數(shù)據(jù)8策略決策{≥發(fā)送數(shù)據(jù)圖3—8定時器中斷程序結(jié)構(gòu)F遮.3-81‰erintemlptprocedures仉蛐鵬3.3.4決策子系統(tǒng)軟件設(shè)計的要求從上面的分析,系統(tǒng)總體框架選擇視覺圖像辨識和決策順序結(jié)構(gòu)。決策子系統(tǒng)設(shè)計應(yīng)。滿足以下幾點(diǎn)要求:(1)減少代碼冗余,增加執(zhí)行效率,以提高系統(tǒng)的實(shí)時性。視覺圖像辨識和決策代碼執(zhí)行周期要遠(yuǎn)小于圖像采集周期;(2)建立一個結(jié)構(gòu)清晰,層次分明決策系統(tǒng)框架(F姍e),具有良好的擴(kuò)展性、可讀性;(3)提供分層結(jié)構(gòu)模型和接口,后續(xù)開發(fā)人員可以在任意層次上做工作;(4)要保證軟件的開放性、可讀性、可擴(kuò)展性和可維護(hù)性,以便持續(xù)開發(fā);(5)支持多種策略,豐富戰(zhàn)術(shù)動作,完善機(jī)器人路徑規(guī)劃,提高機(jī)器人控制精度。3.4運(yùn)動規(guī)劃研究本文的重點(diǎn)為機(jī)器人的運(yùn)動規(guī)劃的研究,從圖3.2可以看出,決策模塊的分層結(jié)構(gòu)分為上層決策系統(tǒng)和底層決策系統(tǒng)。作為上層決策系統(tǒng)包括態(tài)勢分析、隊形確定和角色分配等與實(shí)際足球比賽密切相關(guān)的決策知識模塊;而底層決策系統(tǒng)包括動作分配、動作修正、運(yùn)動規(guī)劃等與機(jī)器人小車密切相關(guān)的決策驅(qū)動模塊。將決策系統(tǒng)這樣分層有利于整個足球機(jī)器人系統(tǒng)的開發(fā),做上層決策模塊的不用關(guān)心底層的小車驅(qū)動,只需要將人類足球比賽的知識應(yīng)用到機(jī)器人系統(tǒng)中來即可,這樣做上層決策的就可以將復(fù)雜的足球知識應(yīng)用于足球機(jī)器人的隊形確定、角色分配。最后將決策的結(jié)果輸出給底層決策模塊。而底層決策系統(tǒng)將上層決策系統(tǒng)傳來的信息進(jìn)行動作的分配,江南大學(xué)碩士學(xué)位論文主要是包括圖3.5中所示的各種技戰(zhàn)術(shù)動作,通過將這些分析出來的動作進(jìn)行修正,最后輸出給運(yùn)動規(guī)劃模塊。運(yùn)動規(guī)劃作為機(jī)器人決策系統(tǒng)最底層的決策模塊起著最為重要的作用,因?yàn)樗猩蠈記Q策規(guī)劃出來的結(jié)果都要轉(zhuǎn)化為機(jī)器人小車最終的行走、踢球結(jié)果。而運(yùn)動規(guī)劃又分為機(jī)器人路徑規(guī)劃和動態(tài)的避障策略,本文將在第四章中詳細(xì)介紹機(jī)器人路徑規(guī)劃,將結(jié)合蟻群算法和柵格建模來分析機(jī)器人路徑規(guī)劃中的難點(diǎn),提出一些改進(jìn)算法并通過仿真來驗(yàn)證結(jié)果。針對機(jī)器人動態(tài)避障將在第五章中來描述,通過分析兩種避障策略并通過仿真來驗(yàn)證結(jié)果。3.5小結(jié)本章分析了小型組機(jī)器人決策子系統(tǒng)的結(jié)構(gòu)組成,詳細(xì)探討了決策系統(tǒng)分層結(jié)構(gòu)模型中的態(tài)勢分析、隊形確定、角色選擇和動作分配。最后探討了小型組服務(wù)器程序設(shè)計中軟件設(shè)計的幾種方法,并分析各種方法的特點(diǎn)和程序設(shè)計中應(yīng)該注意的問題。第四章基于改進(jìn)蟻群算法的機(jī)器人路徑規(guī)劃第四章基于改進(jìn)蟻群算法的機(jī)器人路徑規(guī)劃在智能機(jī)器人路徑規(guī)劃問題上,國內(nèi)外學(xué)者做了不少探索和實(shí)驗(yàn),提出很多方法和理論。但是每種方法和理論都有其適用的研究背景,在具體應(yīng)用時必須就所研究問題的具體背景模型選擇合適的方法,或者是自行設(shè)計一種比較合適的路徑規(guī)劃方法。本章就針對部分典型方法進(jìn)行研究和實(shí)驗(yàn),對它們在足球機(jī)器人系統(tǒng)中的應(yīng)用進(jìn)行了深入的分析和比較【25】4.1常用的運(yùn)動規(guī)劃方法4.1.1人工勢場法人工勢場法首先是由Ⅺlatib于1986年提出【261,Khatib博士在他的博士論文中首先將這種方法用于機(jī)器人操作臂的避障運(yùn)動規(guī)劃,實(shí)現(xiàn)了機(jī)械臂的實(shí)時避障。這種方法同樣適用于移動機(jī)器人的路徑規(guī)劃,許多研究者對它進(jìn)行了深入的研究和改進(jìn)。該方法的基本思想是構(gòu)造目標(biāo)位姿引力場和障礙物周圍斥力場共同作用的人工勢場,搜索勢函數(shù)的下降方向來尋找無碰路徑,這是勢場法的起源。具體方法是首先在機(jī)器人的運(yùn)動空間中了創(chuàng)建一個勢場U。該勢場由兩部分組成:一個是引力場%,方向指向目標(biāo)點(diǎn)GD口,:另一個是斥力場u。。,方向指向遠(yuǎn)離障礙物D6s細(xì)c跆方向。整個勢場U是其引力部分和斥力部分的疊加。移動機(jī)器人RD6Df就沿著合成的勢場力方向運(yùn)動,繞開障礙物,向目標(biāo)點(diǎn)運(yùn)動。從避障考慮,引力勢場作用的范圍較大,而斥力勢場只是作用在局部范圍內(nèi),方法距障礙較遠(yuǎn)的區(qū)域不受障礙斥力勢場的影響。因而,這種方法也稱為局部很多文獻(xiàn)都介紹各種不同的勢場法的勢函數(shù),一般都是關(guān)于距離的函數(shù)吸引力勢場的一般表示形式為:U二(尸)=a。||厶O)一尸(f)Il辮(4.1)其中尸(f)和匕(f)分別表示在r時刻機(jī)器人和目標(biāo)點(diǎn)的位置,11名(,)一尸O)ll代表在f時刻機(jī)器人與目標(biāo)點(diǎn)的距離,a。與朋均為可調(diào)參數(shù)。相應(yīng)的吸引力L(P)是吸引力勢場%,(尸)的負(fù)梯度:匕(P)=_v‰(尸)(4.2)類似的,斥力場產(chǎn)生的斥力為:%(尸)=一V‰(尸)(4.3)其中吒(P)的定義同樣是關(guān)于機(jī)器人和障礙物的距離的函數(shù)??偟膭菽軋鰹椋篣刪=%(尸)+‰(尸)勢場的合力為:瓦d(尸)=L(P)+%(尸)目標(biāo)點(diǎn)和障礙物對機(jī)器人產(chǎn)生的力分析如圖4—1所示:江南大學(xué)碩士學(xué)位論文圖4—1人工勢場法分析圖Fig.4-lC甜dmalityfieldofm鋤一made鋤alysis鏟印h人工勢場法的優(yōu)點(diǎn)有:(1)結(jié)構(gòu)簡單,使用方便,便于底層的實(shí)時控制,這是勢場法的一個最突出的特點(diǎn)。(2)在進(jìn)行運(yùn)動規(guī)劃時不僅考慮機(jī)器人的避障和軌跡規(guī)劃,而且也考慮了機(jī)器人的動態(tài)運(yùn)動性能,使機(jī)器人運(yùn)動更加自然和具有柔順性,規(guī)劃出來的路徑一般比較平滑并且安全。人工勢場法的缺點(diǎn)有:(1)是一種局部尋優(yōu)方法,只著眼于得到一條能夠避障的可行路徑,對路徑是否最優(yōu)并未加以考察。(2)對簡單環(huán)境很有效,但對于復(fù)雜的多障礙物環(huán)境,不合理的勢場數(shù)學(xué)方程容易產(chǎn)生局部極值點(diǎn),即在某點(diǎn)的勢場合力為零,常出現(xiàn)的現(xiàn)象是在某點(diǎn)停住而不能到達(dá)目標(biāo)點(diǎn),或者是在相近的障礙物群中不能識別路徑。(3)勢場角度不易控制,勢場角度會因?yàn)闄C(jī)器人或者障礙物等位置的稍微改變而發(fā)生較大變化,出現(xiàn)在障礙物前震蕩等現(xiàn)象。4.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年物聯(lián)網(wǎng)市場合作協(xié)議書
- 2024-2025學(xué)年廣東省深圳市羅湖區(qū)四年級(上)期末數(shù)學(xué)試卷
- (新版)初級消防設(shè)施操作員《基礎(chǔ)知識》考試題庫完整版
- 2025年書面離婚合同協(xié)議(4篇)
- 2025年五年級班主任管理工作心得體會(6篇)
- 2025年中班幼兒園教師個人年終工作總結(jié)模版(二篇)
- 2025年中草藥植物購銷合同模板(三篇)
- 2025年產(chǎn)品委托代理協(xié)議范文(2篇)
- 2025年個人木材買賣合同范文(2篇)
- 2025年個人車輛租賃協(xié)議(五篇)
- 《社區(qū)康復(fù)》課件-第一章 總論
- 上海中考英語考綱詞匯
- 【工商管理專業(yè)畢業(yè)綜合訓(xùn)練報告2600字(論文)】
- 食品加工企業(yè)安全培訓(xùn)課件
- 快修店營銷方案
- 《幼兒園健康》課件精1
- 刑事案件模擬法庭劇本完整版五篇
- 烏海周邊焦化企業(yè)概況
- 22S803 圓形鋼筋混凝土蓄水池
- 2023年開心英語四年級上冊全冊練習(xí)
- Hadoop大數(shù)據(jù)開發(fā)實(shí)例教程高職PPT完整全套教學(xué)課件
評論
0/150
提交評論