版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
移動機器人技術(shù)原理與應(yīng)用第九章
移動機器人的通信系統(tǒng)多機器人系統(tǒng)多任務(wù)及優(yōu)化分配方法移動多機器人編隊與路徑規(guī)劃方法9.1多機器人系統(tǒng)簡介9.29.3多移動機器人圍捕9.49.1多機器人系統(tǒng)簡介由多個機器人組成并可以通過彼此信息交互,能夠利用專門算法協(xié)作完成特定工作的系統(tǒng),一般稱為多機器人系統(tǒng)(Multi-RobotSystems,MRS)。多機器人系統(tǒng)的機器人在硬件組成和智能算法設(shè)計的投入上大多劣于設(shè)計為獨立完成工作的機器人,但設(shè)計多機器人系統(tǒng)的初衷卻是為了完成個體機器人不能夠完成的工作,希望利用量與協(xié)作的優(yōu)勢在具體任務(wù)中接替?zhèn)€體機器人工作。9.1.1多機器人系統(tǒng)分類按照多機器人系統(tǒng)是否具有移動能力可主要分為固定式多機器人系統(tǒng)(多機械臂)、可移動多機器人系統(tǒng)和混合多機器人系統(tǒng);同樣按照機器人的對應(yīng)運動空間,可以按照三維和二維空間運動進行直觀分類。1.按移動能力分類(1)固定式多機器人系統(tǒng)固定式多機器人系統(tǒng),近年來在工業(yè)生產(chǎn)車間大量的出現(xiàn),其中雙臂機器人常常用于模擬人類,完成協(xié)同搬運、傳遞、甚至是手術(shù)等工作。固定式多機器人系統(tǒng)大多共存在9.1.1多機器人系統(tǒng)分類一個較小的空間范圍,利用多個機械臂前端相同或不同的操作機構(gòu)完成任務(wù),其中已經(jīng)獲得廣泛應(yīng)用的如點焊多機器人系統(tǒng)。在汽車的生產(chǎn)流水線中,有非常多的環(huán)節(jié)需要多機械臂協(xié)作完成,其中點焊工藝環(huán)節(jié),存在4000-5000個焊點,因此,車身焊接質(zhì)量的優(yōu)劣以及焊接效率的高低對整車的制造起著決定性的作用。所以,點焊生產(chǎn)流程是以一種典型的多機械臂的協(xié)作需求環(huán)境,多機器人系統(tǒng)設(shè)計需要綜合考慮焊點分配、焊接路徑、機器人可達性及避免碰撞等因9.1.1多機器人系統(tǒng)分類素,對白車身側(cè)圍點焊多機器人協(xié)調(diào)焊接進行路徑規(guī)劃,以實現(xiàn)多機人焊點任務(wù)均勻分配和單機器人焊接路徑最優(yōu)的焊接要求,提高生產(chǎn)效率。點焊多機器人系統(tǒng)9.1.1多機器人系統(tǒng)分類類似人類雙臂通過協(xié)同操作將單臂不能完成的工作完成,這也是多機械臂結(jié)構(gòu)的多機器人系統(tǒng)的應(yīng)用場景。雙臂協(xié)同機械臂操作示意的生產(chǎn)過程,描述了較為常見的多固定式機器人協(xié)同協(xié)系統(tǒng),這種系統(tǒng)的存在除能夠完成單臂無法完成的搬運工作外,還能完成對目標物體位姿的調(diào)整,特別是存在不穩(wěn)定外部環(huán)境時,多機械臂系統(tǒng)的協(xié)同可以保障搬運工作局部的穩(wěn)定,這類系統(tǒng)在空、天環(huán)境經(jīng)常被應(yīng)用于保持物體的姿態(tài),提供下一步裝配、修理的基礎(chǔ)。9.1.1多機器人系統(tǒng)分類雙臂協(xié)同機械臂操作示意圖9.1.1多機器人系統(tǒng)分類雙IIWAR800機械臂協(xié)同搬運應(yīng)用右圖是一款輕型多機械裝配機器人,其被使用在了國際空間站的ROKVISS任務(wù)實驗中,借助兩個庫卡7自由度帶有關(guān)節(jié)扭矩傳感器的IIWAR800機械臂的協(xié)同操作,完成在空間站中的物體裝配。協(xié)同搬運多機械臂系統(tǒng)對于動態(tài)操作環(huán)境,具有良好的可靠性保障。9.1.1多機器人系統(tǒng)分類上圖中的雙臂機器人系統(tǒng),展示了裝配過程中對于多機器人系統(tǒng)的需求。裝配過程本身就是一個需要多方協(xié)調(diào),并將目標物確定在一定范圍內(nèi),裝配器件與被裝配器件保持相對靜態(tài)的過程。所以,多機械臂系統(tǒng)在裝配工業(yè)環(huán)境中有較多的應(yīng)用,在汽車整裝車間、水下無人管道維修以及太空維修作業(yè)等替代了大量的人工工作。其最大的特征在于通過多個機械臂之間的協(xié)調(diào),保證裝配工作空間的相對穩(wěn)定。9.1.1多機器人系統(tǒng)分類(2)移動多機器人系統(tǒng)移動多機器人系統(tǒng)一般由幾個至幾十個移動機器人組成,其可以是由異構(gòu)的移動機器人組成,但基本特征在于系統(tǒng)中機器人均可按照指令合作完成對象任務(wù),系統(tǒng)中各個機器人的基本信息,如:位置、速度、方向、目標、能量等能夠進行交互,且整體系統(tǒng)的控制方案均以多機器人交互信息作為決策參考依據(jù)。移動式多機器人按照其行動決策發(fā)出方式又可分為集中式、分布式和混合式。9.1.1多機器人系統(tǒng)分類1)集中式控制移動多機器人系統(tǒng)在早期的多機器人控制方式設(shè)計時,采用集中式控制,各個機器人將自身當前狀態(tài)按照固定通信協(xié)議模式上傳至中央處理服務(wù)器。圖中所示為集中式控制方式的機器人系統(tǒng),雖然系統(tǒng)各個機器人也存在通信的可能,但是下一時刻任務(wù)命令的決策來源于中央處理服務(wù)對各機器人狀態(tài)的評估,很明顯,當機器人數(shù)量、狀態(tài)或是執(zhí)行任務(wù)類型的增多,對中央服務(wù)器的計算能力效率提出較高的要求,更加重要的是采用集9.1.1多機器人系統(tǒng)分類中式控制方式,需要機器人與中央服務(wù)器之間具有良好的通信保證,這就制約了這種控制方式的應(yīng)用場景。集中式控制方式9.1.1多機器人系統(tǒng)分類2)分布式控制移動多機器人系統(tǒng)分布式多機器人系統(tǒng)能充分利用機器人的數(shù)據(jù)處理資源,分擔中央處理機的壓力,在靈活性、容錯性方面具有很大優(yōu)勢,分布式控制最大的優(yōu)勢在于,系統(tǒng)每個機器人作為一個獨立的個體感知環(huán)境,機器人采用的自身搭載的控制策略,結(jié)合區(qū)域內(nèi)有信息交互的機器人狀態(tài)和調(diào)整自身狀態(tài),在自身搭載的MCU中完成自己路徑規(guī)劃、沖突消解、避障等動態(tài)行為,從而降低計算系統(tǒng)的復(fù)雜度,較集中式控制方式能夠在現(xiàn)響應(yīng)的實時性具有優(yōu)勢。9.1.1多機器人系統(tǒng)分類每個移動機器人均可以按照自身搭載的控制方法完成任務(wù),也可以根據(jù)所系統(tǒng)內(nèi)不同機器人的狀態(tài)、任務(wù)等完成沖突消解、協(xié)同SLAM等任務(wù)。異構(gòu)分布式移動多機器人系統(tǒng)9.1.1多機器人系統(tǒng)分類3)混合式多機器人系統(tǒng)可以結(jié)合移動平臺的靈活性和固定平臺穩(wěn)定性,組成具有混合結(jié)構(gòu)的多機器人系統(tǒng),其所能完成的任務(wù)、效率以及穩(wěn)定性將大大的超過了固定式或移動式機器人的能力范圍,但控制過程更加復(fù)雜。圖中描述了一個分布式的移動多平臺機械臂協(xié)作系統(tǒng),該設(shè)計中將一個不能夠被單一機器人搬運的物體,采用多機器人系統(tǒng)協(xié)作進行搬運完成,該過程包含了協(xié)同操作,目標跟蹤,區(qū)域覆蓋等技術(shù)環(huán)節(jié)。9.1.1多機器人系統(tǒng)分類3)混合式多機器人系統(tǒng)混合式多機器人平臺示意圖9.1.1多機器人系統(tǒng)分類2.根據(jù)多機器人運動空間分類(1)以三維控制為主的多機器人系統(tǒng)多四旋翼組成燈光展示9.1.1多機器人系統(tǒng)分類(1)以三維控制為主的多機器人系統(tǒng)單一的四旋翼控制可以依靠人類完成,但是多機器人、群體機器人系統(tǒng)一定是需要按照事先設(shè)定好的程序完成。完成的主要功能是讓不同集合的四旋翼懸停在指定高度,利用不同高度的機器人形成二維或三維空間,簡單講就是利用四旋翼能夠懸停的特征在空中構(gòu)建出一個類似LED點陣的框架,然后通過調(diào)節(jié)四旋翼上的燈光形成不同的圖樣。9.1.1多機器人系統(tǒng)分類(1)以三維控制為主的多機器人系統(tǒng)對于群集四旋翼系統(tǒng),其設(shè)計目的重點并不在于機器人之間的合作,或者說各個四旋翼之間并不會因為彼此位置關(guān)系的變化而受影響或影響其它個體的行為。按照協(xié)同規(guī)則將多機器人作為一個整體進行控制并完成任務(wù),才是多機器人控制系統(tǒng)設(shè)計更為關(guān)心的。但是,對于空中機器人其首要解決的是自身穩(wěn)定問題,特別是其運動過程需要持續(xù)的動力支持,這對控制系統(tǒng)提出較高的要求。9.1.1多機器人系統(tǒng)分類(1)以三維控制為主的多機器人系統(tǒng)以三維空間作為應(yīng)用空間的多機器人系統(tǒng),還有目標為水下的應(yīng)用環(huán)境,與空中環(huán)境不同在于,水下環(huán)境能夠提供機器人一個無動力條件下較穩(wěn)定的靜止狀態(tài),因此,根據(jù)不同任務(wù)在不同的水下器具上增加智能設(shè)備,使其能夠自主跟隨或按照需求進行編隊、局部通信、組網(wǎng)等方式形成多水下機器人系統(tǒng),相對單個水下機器人,多機器人系統(tǒng)能夠在特定的任務(wù)中展現(xiàn)出極強的優(yōu)勢,整體工作范圍得到了擴大,整個系統(tǒng)的魯棒性得到了提升。9.1.1多機器人系統(tǒng)分類(2)二維空間特征的多機器人系統(tǒng)二維空間特征的一般將在平面運動的多機器人系統(tǒng)認為是二維特征的多機器人系統(tǒng),這其中主要包括了:輪式機器人、履帶式機器人、仿生動物足類機器人等。這些機器人本體的運動空間是相似的,但是其結(jié)構(gòu)差別較大。結(jié)構(gòu)差別主要取決于該機器人使用的地形環(huán)境,如輪式機器人,常用于鋪裝或較為平坦的道路,承載較低的物品常用于倉儲、物流的分類、園區(qū)的巡邏、變電站的無人值守與監(jiān)測等;履帶式機器人,常見用于草地、沙地等輪式結(jié)構(gòu)容易9.1.1多機器人系統(tǒng)分類被阻礙的場地,履帶式結(jié)構(gòu)移動機器人承載能力較輪式機器人大,能耗也大,常見的有拆彈、武器搭載、工程機械搭載等場景;仿生動物足類機器人,根據(jù)其仿生對象的不同足類數(shù)目也不盡相同,近年常見的有Bostonpower的雙足類人、四足機器狗、六組螞蟻、八足蜘蛛等等,其主要優(yōu)越性表現(xiàn)在不規(guī)則地形的運動,以及更加類似智能生物的外形結(jié)構(gòu),并且一部分類型機器人如機器狗,已經(jīng)在美軍的阿富汗戰(zhàn)爭中使用,用于武器搬運、戰(zhàn)地守護以及通信中繼、組網(wǎng)等。9.1.2多機器人系統(tǒng)任務(wù)分類根據(jù)執(zhí)行任務(wù)內(nèi)容的不同,多機器人系統(tǒng)任務(wù)分為:多機器人裝配、多機器人焊接、多機器人編隊、多機器人圍捕、多機器人協(xié)同SLAM、多機器人協(xié)同避障等。1.按照是否存在空間任務(wù)沖突分類(1)無空間沖突任務(wù)以多機器人系統(tǒng)的裝配任務(wù)為例,大致分為兩種,一是并行關(guān)系,系統(tǒng)中每個機器人只關(guān)心自己負責的工作內(nèi)容,兩兩機器人之間的工作沒有前后時序關(guān)系,不需要機器人之間的直接配合,這種工作方式又常常稱為并聯(lián)機器人。9.1.2多機器人系統(tǒng)任務(wù)分類
Delta并聯(lián)機器人操作示意圖9.1.2多機器人系統(tǒng)任務(wù)分類二是需要協(xié)同作業(yè),這種協(xié)同內(nèi)容又可以分為空間共享協(xié)同和工作內(nèi)容協(xié)同。工作內(nèi)容協(xié)同,以組裝過程為例,主要是需要兩個或兩個以上的機械臂,對裝配本體和裝配零件提供一個相對穩(wěn)定的作業(yè)狀態(tài),相對于并行多機器人系統(tǒng)優(yōu)勢在于,一個被裝配本體能夠在一個穩(wěn)定的空間內(nèi)被多次旋轉(zhuǎn)、平移,配合另一個機械臂操作完成一輪裝配任務(wù),這種方式可以有效減少被裝配本體的移動。9.1.2多機器人系統(tǒng)任務(wù)分類陜汽集團車廂焊接車間多機器人操作9.1.2多機器人系統(tǒng)任務(wù)分類(2)存在空間沖突的多機器人任務(wù)多機器人焊接工作是一個非常有特點的存在操作空間沖突的任務(wù),下圖所示動態(tài)調(diào)整操作序列的多機器人無碰撞運動規(guī)劃,是針對車體焊接問題進行多機械臂協(xié)同控制的范例。說明了多機器人在共享工作空間內(nèi)協(xié)調(diào)工作,能有效地提高生產(chǎn)效率和減少空間資源占據(jù),但同樣存在多機器人互斥工作區(qū)域沖突的問題。所以多機器人局部空間共享與工作區(qū)、工作端軌跡互斥是該類多機器人任務(wù)的基本特征。9.1.2多機器人系統(tǒng)任務(wù)分類多機器人共享空間任務(wù)特征示意圖9.1.2多機器人系統(tǒng)任務(wù)分類2.按照多機器人系統(tǒng)中的任務(wù)分配需求分類(1)靜態(tài)任務(wù)分配靜態(tài)任務(wù)主要出現(xiàn)在:系統(tǒng)第一次上線情況,及在任務(wù)分配初始時刻所有工位均處于未分配狀態(tài),機器人處于空閑狀態(tài);或是車間中某臺機器進行檢修,首次加入到車間生產(chǎn)系統(tǒng)中時,該并條機整機工位均處于未分配狀態(tài)。則任務(wù)分配決策過程中,每個機器人根據(jù)目標函數(shù)值,選擇最適合自己的任務(wù),如果有機器人選擇了相同的任務(wù),則它們之間呈現(xiàn)協(xié)作關(guān)系。任務(wù)執(zhí)行時,由于每個智能機器人9.1.2多機器人系統(tǒng)任務(wù)分類被認為單獨完成任務(wù)的能力有限,因此,每個機器人在時刻t只能選擇一個任務(wù)T執(zhí)行,每個任務(wù)需要由多個機器人協(xié)作且機器人處于空閑狀態(tài)才能響應(yīng)任務(wù)的請求。(2)動態(tài)任務(wù)分配在實際生產(chǎn)中存在動態(tài)情況發(fā)生時,定義動態(tài)情況為系統(tǒng)中某一時刻t有新任務(wù)的產(chǎn)生或任務(wù)丟失事件發(fā)生時,環(huán)境的動態(tài)變化會導(dǎo)致任務(wù)完成的代價發(fā)生變化,從而導(dǎo)致目標函數(shù)值的變化,故系統(tǒng)需要根據(jù)機器人的能力約束和目標值,盡量在不改變原期望的結(jié)果的情況下快速尋找最9.1.2多機器人系統(tǒng)任務(wù)分類優(yōu)調(diào)整策略。這就要求將一組任務(wù)分配給一組機器人的同時,要將能力約束與任務(wù)調(diào)度結(jié)合起來,在約束條件中建立和時間有關(guān)的目標函數(shù)找到一組任務(wù)的最優(yōu)分配給一個機器人子集,該子集將負責完成任務(wù)。3.按照機器人對任務(wù)的執(zhí)行情況分類(1)緊耦合型任務(wù)緊耦合型任務(wù)是指在系統(tǒng)中一個任務(wù)的完成需要多個機器人相互協(xié)作,且任務(wù)不能被分解。9.1.2多機器人系統(tǒng)任務(wù)分類系統(tǒng)中如果任務(wù)完成所需的機器人中有一個不能參與或出現(xiàn)故障,則任務(wù)將不能被完成。(2)松耦合型任務(wù)松耦合型任務(wù)是指在多機器人系統(tǒng)中,機器人個體之間在沒有緊密通信的情況下能夠單獨完成某項任務(wù)。一般情況下一個任務(wù)是可被分解的,這個任務(wù)的子任務(wù)可以交給具有任務(wù)執(zhí)行能力的個體單獨完成。9.2多機器人系統(tǒng)多任務(wù)及優(yōu)化分配方法任務(wù)的實時、合理分配是多機器人系統(tǒng)高效率運行的必要條件,但當環(huán)境中目標較多且任務(wù)并非單一時,快速的尋找多機器人的多任務(wù)分配的最優(yōu)值對于尋優(yōu)模型具有較大的挑戰(zhàn)。任務(wù)分配問題可以簡單的概括為用一致的策略將不同的機器人分配給相應(yīng)的任務(wù),或為一組給定的任務(wù)和機器人分配合理的目標。機器人的任務(wù)執(zhí)行獲利與消耗的數(shù)學(xué)抽象,通過任務(wù)執(zhí)行特征,定義多機器人的收益值模型,將尋求收益值模型的最優(yōu)值用于多機器人-多任務(wù)的分配中。9.2.1多機器人系統(tǒng)任務(wù)描述多機器人-多目標-多任務(wù)問題的求解,可以理解為t時刻將r個機器人分配到k個期望的目標位置執(zhí)行n個存在的任務(wù),即存在一個r×k×n三維任務(wù)求解集合,當目標、任務(wù)數(shù)增長時,用于工作的機器人數(shù)量隨之增長,造成待求解集合的數(shù)據(jù)成級數(shù)倍增長。1.目標集與任務(wù)集為了多機器人的收益值模型具有良好的普適性,不限定特定目標,將目標特征進行數(shù)字化表達。并對于同一目標存在有限種類任務(wù)需要執(zhí)行,則t時刻包含k個目標集合可表示為:9.2.1多機器人系統(tǒng)任務(wù)描述多機器人-多目標-多任務(wù)問題的求解,可以理解為t時刻將r個機器人分配到k個期望的目標位置執(zhí)行n個存在的任務(wù),即存在一個r×k×n三維任務(wù)求解集合,當目標、任務(wù)數(shù)增長時,用于工作的機器人數(shù)量隨之增長,造成待求解集合的數(shù)據(jù)成級數(shù)倍增長。1.目標集與任務(wù)集為了多機器人的收益值模型具有良好的普適性,不限定特定目標,將目標特征進行數(shù)字化表達。9.2.1多機器人系統(tǒng)任務(wù)描述對于同一目標存在有限種類任務(wù)需要執(zhí)行,則t時刻包含k個目標集合可表示為:對于第o個目標可能存在需要被執(zhí)行的任務(wù)種類描述為:t時刻全局任務(wù)集合如下所示,存在k×n個任務(wù)需求:9.2.1多機器人系統(tǒng)任務(wù)描述對于具體的第o個目標的第j個任務(wù),存在的基本任務(wù)特征進行以下定義:任務(wù)位置特征
,任務(wù)響應(yīng)需求位置,與任務(wù)被執(zhí)行位置一致,其位置特征不隨時間變化;任務(wù)價值權(quán)值
,代表當前第o個目標第j個任務(wù)被執(zhí)行的價值;待優(yōu)先級特征
,假設(shè)任務(wù)響應(yīng)等待時間越長被響應(yīng)優(yōu)先級越高,目的使等待時間長的任務(wù)可以優(yōu)先被響應(yīng)。9.2.1多機器人系統(tǒng)任務(wù)描述等待時間由上一時刻機器人組完成任務(wù)時間確定,如下:分別是t時刻獲得分配的機器人i在上一時刻t-1完成工作的操作時間和運動時間表達式,vi是第i個機器人的速度。2.多任務(wù)與機器人收益模型消耗,,表示t時刻第i個機器人執(zhí)行第o個目標第j個任務(wù)時付出的消耗,例如電量耗費,根據(jù)與分配任務(wù)的距離關(guān)系可以具體量化為:9.2.1多機器人系統(tǒng)任務(wù)描述是第i個機器人當前電量,
,
是機器人t時刻位置
與分配到第o個目標第j個任務(wù)坐標之間電量使用值和曼哈頓距離,單位米,距離可具體表示為:任務(wù)價值,對于任務(wù)來說,等待被執(zhí)行時間越長具有較高優(yōu)先級,與機器人執(zhí)行相距距離越短具有較高優(yōu)先級,即價值越高。9.2.1多機器人系統(tǒng)任務(wù)描述收益,
表示t時刻第i個機器人執(zhí)行第o個目標的第j個任務(wù)時獲得的收益,對于存在最大延遲時間限制Dlim的收益值計算:對于機器人i對應(yīng)目標-任務(wù)集合存在一個收益矩陣Hi(t),表達如下:9.2.1多機器人系統(tǒng)任務(wù)描述對于單一機器人i下一時刻的誘導(dǎo)執(zhí)行位,選擇收益值最大。對于第i機器人需要對任務(wù)集進行遍歷計算其收益值矩陣,獲得最優(yōu)值作為誘導(dǎo)位單機器人多任務(wù)尋優(yōu)示意圖9.2.1多機器人系統(tǒng)任務(wù)描述3.多任務(wù)與多機器人全局收益模型面向隨機變化的多任務(wù)需求,多機器人系統(tǒng)收益全局尋優(yōu)過程中,需要考察以下問題:(1)難以解決同一任務(wù)多個機器人的收益值相等,以及同一機器人,多個任務(wù)收益相同的情況;(2)有“無放回尋優(yōu)”風(fēng)險,即當一個機器人將某任務(wù)取走,任務(wù)集中不再有該任務(wù)用于其它機器人最優(yōu)收益評價,造成任務(wù)的局部最優(yōu)值與全局最優(yōu)值不統(tǒng)一。9.2.1多機器人系統(tǒng)任務(wù)描述(3)多個個體機器人的最優(yōu)求和,不能證明在“無放回尋優(yōu)”的多機器人多任務(wù)分配過程中是全局最優(yōu)的。需要進行所有任務(wù)的分配收益評價,獲取全局最優(yōu)值。首先,在t時刻,我們將機器人集合與多目標-多任務(wù)集合可能存在的收益值放入同一個全局收益值矩陣中。全局收益矩陣的子矩陣數(shù)為r個,與t時刻能夠進行工作的機器人數(shù)量相同。9.2.1多機器人系統(tǒng)任務(wù)描述每次對每個收益子矩陣取一個收益值,進行和值計算,則可組成全局收益值遍歷矩陣A(All)如下所示:收益值的獲取為保證目標任務(wù)被執(zhí)行的唯一性。則獲得全局最優(yōu)值(GO,GlobalOptimum):9.2.1多機器人系統(tǒng)任務(wù)描述通過上式可獲得全局最優(yōu)評價條件下的個體機器人取值,
,即對應(yīng)全局最優(yōu)第m個子收益矩陣,角標表示,第i個機器人執(zhí)行第o個目標的第j個任務(wù)。通過上述多任務(wù)-移動多機器人全局收益模型的建立,則可以根據(jù)具體的應(yīng)用對象,結(jié)合不同的任務(wù)分配尋優(yōu)方法求解多機器人系統(tǒng)的多任務(wù)最優(yōu)分配結(jié)果。9.2.1多機器人系統(tǒng)任務(wù)描述多機器人多任務(wù)尋優(yōu)示意圖9.2.2多機器人系統(tǒng)任務(wù)分配方法多機器人系統(tǒng)首要解決的問題是:在有限的時間內(nèi),目標任務(wù)分配集合能夠被提供多機器人群集合所響應(yīng)并執(zhí)行,并希望在短時間內(nèi)獲得多任務(wù)集合的分配結(jié)果最優(yōu)分配。對此,現(xiàn)有相關(guān)研究工作主要分為集中式任務(wù)分配方法和分散式任務(wù)分配方法。集中式方法中要求機器人擁有系統(tǒng)的全局信息,中央控制系統(tǒng)計算最優(yōu)或者接近最優(yōu)的決策,使多機器人系統(tǒng)效率最大化。9.2.2多機器人系統(tǒng)任務(wù)分配方法在分散式分配方法中,每個機器人都需要做出自己的決策,這使得系統(tǒng)靈活性和魯棒性更好。機器人之間可以相互協(xié)作,使系統(tǒng)的效率最大化。協(xié)商是分布式機器人相互合作的有效方式。但是一個機器人只能協(xié)商一次。如果一個機器人想要參與另一個協(xié)商,需要離線并重新編程以調(diào)整新的協(xié)商協(xié)議,即機器人不是獨立于協(xié)議的。然而,不同的環(huán)境中,機器人往往需要與不同的團隊成員完成不同的工作。9.2.2多機器人系統(tǒng)任務(wù)分配方法現(xiàn)有的分布式任務(wù)分配方法主要有三種類型:基于優(yōu)化的、基于市場和博弈論。1.基于優(yōu)化的方法根據(jù)在每個迭代步都存在矩陣等待最優(yōu)分配求解,為了能夠相對更優(yōu)的解決方案,學(xué)者們利用分布式計算、群集智能等,提出了多種優(yōu)化模型和算法。雖然基于優(yōu)化的方法具有良好的探索性和廣泛的應(yīng)用領(lǐng)域,但很難設(shè)計出合適的局部決策規(guī)則。大多數(shù)基于優(yōu)化的方法都用于集中式任務(wù)分配。9.2.2多機器人系統(tǒng)任務(wù)分配方法2.基于市場的方法拍賣算法是一種典型的基于市場的方法,它是一個迭代過程,其中比較多個機器人的出價以確定最佳報價,最后的交易由出價最高的獲得。雖然基于市場的方法具有良好的魯棒性和可擴展性,但也存在一些缺陷。如①缺乏有效的個體控制策略實際方法;②引入必要的談判和懲罰方案時表現(xiàn)不佳。9.2.2多機器人系統(tǒng)任務(wù)分配方法3.基于博弈的方法從是否存在外部權(quán)威來執(zhí)行規(guī)則的角度來看,博弈可以分為合作博弈和非合作博弈。在合作博弈中,首先將特征聯(lián)盟形成博弈,利用收益和損耗關(guān)系用于解決多自主機器人之間的任務(wù)分配問題。該方法需要考慮博弈者雙方的利益,在兩者之間達到一個均衡狀態(tài),就很難達到全局最優(yōu)或近似全局最優(yōu)。利用博弈論解決多機器人動態(tài)任務(wù)分配,需要解決兩個關(guān)鍵問題:①博弈模型效率低下;②學(xué)習(xí)算法缺乏實時性和全局優(yōu)化能力。9.2.3移動多機器人系統(tǒng)任務(wù)分配
優(yōu)化方法及應(yīng)用1.移動多機器人需求描述移動多機器人系統(tǒng)常常用于處理多目標和多任務(wù)(MRMOT),無論是已經(jīng)普及應(yīng)用的智能倉儲,還是根據(jù)特定工藝流程的進行研發(fā)車間移動多機器人系統(tǒng),都需要對其所需求的多任務(wù)、多目標進行模型的建立。紡織廠車間的生產(chǎn)方式是具有明顯多機器人系統(tǒng)需求的場景,因此以紡織生產(chǎn)車間為描述環(huán)境,進而根據(jù)實際的應(yīng)用場景進行分配方法的優(yōu)化研究。9.2.3移動多機器人系統(tǒng)任務(wù)分配
優(yōu)化方法及應(yīng)用2.車間多目標多任務(wù)的模型描述以紡織廠精梳車間為例,精梳車間機器人搬運過程中的任務(wù)分配是指在某一并條機在對上一棉卷加工完成之后,有下一個任務(wù)加工需求但工位空缺時,哪一個機器人去響應(yīng)任務(wù)的號召將精梳機加工完成的棉卷從精梳機搬運到并條機相應(yīng)工位。具體針對下圖精梳車間工藝流程中虛線框中部分的任務(wù)分配,以并條機工位作為任務(wù)對象,棉卷作為搬運對象。9.2.3移動多機器人系統(tǒng)任務(wù)分配
優(yōu)化方法及應(yīng)用精梳車間工藝流程圖傳統(tǒng)紡織車間需要人工判斷并使用推車進行棉卷的轉(zhuǎn)運和上料。并條機端M有四個工作點位M1,M2,M3,M4需要同時換料,在給并條機的上料之前需要等待精梳機加工的完成,會造成取料延誤,同時,工人就近取料也易造成遠處并條機的等待延誤時間。9.2.3移動多機器人系統(tǒng)任務(wù)分配
優(yōu)化方法及應(yīng)用將實際車間生產(chǎn)環(huán)境構(gòu)造為如圖所示的多機器人隨機分布的精梳機車間示意圖,每一個機器人只有負載一個棉卷的能力,只要并條機某一工位有任務(wù)需求則機器人就能夠響應(yīng),使得各工位之間獨立運行,換料時間互不等待。所以針對工序特征,將每個工作點位獨立作為供料對象,存在條并卷機8臺,工作點位8個/臺,充電位1個,棉卷供給機1臺,替代人工的機器人若干。9.2.3移動多機器人系統(tǒng)任務(wù)分配
優(yōu)化方法及應(yīng)用精梳車間機器分布和車間任務(wù)抽象簡化圖具體的紡織生產(chǎn)過程中的任務(wù)環(huán)境抽象簡化為如下圖所示,圖中紅色方框表示生產(chǎn)工位,T1~Tn代表存在n個任務(wù)需求(即任務(wù)分布情況),黑色圓點表示具有簡單思維判斷的智能移動機器人。9.2.3移動多機器人系統(tǒng)任務(wù)分配
優(yōu)化方法及應(yīng)用3.機器人及任務(wù)抽象描述由于多任務(wù)的完成需要移動機器人具有彼此合作、協(xié)調(diào)和談判的能力,移動機器人需要進行自身判斷和信息共享,在紡織品生產(chǎn)系統(tǒng)中,可將執(zhí)行搬運工作的移動機器人抽象成一個具有簡單邏輯判斷的機器人Agent。同時,由于從精梳機上下料的棉卷在厚度上存在一定的差異,并且任意兩個并條機的不同工作點在工作完成時間上的不同步,因此,對于順序執(zhí)行和分配僅存在于車間內(nèi)機器首次開車工作時,任務(wù)的產(chǎn)生是隨機的、個體任務(wù)9.2.3移動多機器人系統(tǒng)任務(wù)分配
優(yōu)化方法及應(yīng)用3.機器人及任務(wù)抽象描述產(chǎn)生時的機器人個體狀態(tài)也是隨機的,因此,類紡織車間棉卷搬運任務(wù)分配問題是一個動態(tài)決策問題。隨時間的變化而變化,包括環(huán)境變化,因此從實現(xiàn)的角度來看,可以看作是三個基本對象:時間、任務(wù)環(huán)境狀態(tài)信息和機器人之間的交互,所以該問題符合在時間上迭代求解。9.2.3移動多機器人系統(tǒng)任務(wù)分配
優(yōu)化方法及應(yīng)用4.基于博弈論算法的多任務(wù)分配方法實現(xiàn)(1)工位任務(wù)狀態(tài)描述在某一時刻t工位任務(wù)Ti的狀態(tài)用函數(shù)描述,該函數(shù)中posi表示任務(wù)的位置坐標信息;
時表示生產(chǎn)過程中t時刻Ti對機器人有任務(wù)請求,
時表示生產(chǎn)過程中t時刻Ti對機器人無任務(wù)請求;
表示t時刻任務(wù)Ti被某一機器人執(zhí)行后,該機器人所能得到的收益。9.2.3移動多機器人系統(tǒng)任務(wù)分配
優(yōu)化方法及應(yīng)用(2)機器人狀態(tài)在t時刻機器人Aj的狀態(tài)用函數(shù)描述,該函數(shù)中
是機器人Aj在t時刻的位置坐標信息;
表示機器人Aj在t時刻相應(yīng)的能量存儲值;vj是機器人Aj的速度值;
是t時刻機器人Aj任務(wù)分配狀態(tài)矩陣。
表示在t時刻將目標任務(wù)Ti分配給了機器人Aj;
表示未將目標任務(wù)分配給Aj,即機器人Aj處于無9.2.3移動多機器人系統(tǒng)任務(wù)分配
優(yōu)化方法及應(yīng)用任務(wù)的空閑狀態(tài)。機器人間的信息交互能力用con表示,con為n×n的矩陣,其元素conij表示機器人之間的通信網(wǎng)絡(luò)連接強度,
其中1表示強連接,0表示無連接。t時刻機器人Aj完成Ti任務(wù)的能力:公式中F是阻力常量,Pi是執(zhí)行任務(wù)Ti所需的距離代價。任務(wù)分配映射關(guān)系:,Si是對任務(wù)Ti特定的任務(wù)集合。9.2.3移動多機器人系統(tǒng)任務(wù)分配
優(yōu)化方法及應(yīng)用(3)目標函數(shù)某一時刻進行多任務(wù)分配,其目的是計算該時刻多個任務(wù)的完成收益,尋找全局收益最大化的分配,要求該時刻各個機器人全局消耗最優(yōu),任務(wù)收益最大。目標效用函數(shù)的定義如下:
表示對完成任務(wù)Ti所形成的機器人集合。9.2.3移動多機器人系統(tǒng)任務(wù)分配
優(yōu)化方法及應(yīng)用(4)面向移動多機器人的多任務(wù)分配算法以往在全連接網(wǎng)絡(luò)中,每次迭代中只選擇一個機器人(領(lǐng)導(dǎo)者)來做出決策。而本章中提出的分布式的決策算法,將紡織車間搬運機器人任務(wù)分配問題轉(zhuǎn)化為一個博弈事件,建立一個針對特定任務(wù)無需領(lǐng)導(dǎo)機制的機器人集合決策框架,當有任務(wù)需求時,其中每一個機器人會根據(jù)自己的狀態(tài)加入一個集合。1)決策過程機器人尋找一個任務(wù)工位時,需要進行博弈分析選擇策9.2.3移動多機器人系統(tǒng)任務(wù)分配
優(yōu)化方法及應(yīng)用略。系統(tǒng)初始時,定義每個機器人Aj以無序的方式移動,對于任務(wù)Ti用集合
表示機器人對該任務(wù)的偏好關(guān)系。那么對于機器人Aj來說,lij描述了它相對于任務(wù)Ti的偏好關(guān)系。偏好關(guān)系用符號‘
’和‘
’表示,機器人Aj的偏好關(guān)系可以根據(jù)任務(wù)收益從
中導(dǎo)出。9.2.3移動多機器人系統(tǒng)任務(wù)分配
優(yōu)化方法及應(yīng)用2)納什穩(wěn)定性分區(qū)的建立對機器人建立不相交分區(qū)
,如果對于任意一個機器人
,存在
,
。則稱這個分區(qū)
是Nash穩(wěn)定的。即在Nash穩(wěn)定分區(qū)中,與其他任何集合相比,每一個機器人都更傾向于其當前所在的集合。每個機器人在該分區(qū)內(nèi)無需任何形式的信息和通信技術(shù),任何機器人不得單方面偏離其目前的決定,系統(tǒng)保持一種穩(wěn)定狀態(tài)。9.2.3移動多機器人系統(tǒng)任務(wù)分配
優(yōu)化方法及應(yīng)用3)決策結(jié)果決策結(jié)果:在機器人尋找強偏好任務(wù)的決策過程中Nash均衡理論決定任務(wù)的最終分配結(jié)果。Nash穩(wěn)定分區(qū)一旦建立,任意一個機器人都不可能在其他機器人任務(wù)完成策略不變時,單方面改變?nèi)蝿?wù)完成策略增加其整體收益。即對任務(wù)目標生成了一種最優(yōu)策略組合。4)對不確定性問題的適應(yīng)將紡織車間多機器人系統(tǒng)的不確定性主要歸結(jié)為機器的機械故障、搬運機器人的動作輸出故障、噪音所造成的9.2.3移動多機器人系統(tǒng)任務(wù)分配
優(yōu)化方法及應(yīng)用通信的不確定性和傳感器的不確定性。當前主要考慮車間環(huán)境下的多任務(wù)分配問題,在任務(wù)分配過程中機器人只對任務(wù)需求作響應(yīng),即任務(wù)層面的協(xié)調(diào),而不考慮多機器人運動控制層面的協(xié)同,所以搬運機器人動作輸出的不確定性和傳感器所造成的運動上的不確定性不在本章考慮范圍;機械故障所造成的工位停工,任務(wù)需求中止,屬于任務(wù)動態(tài)的發(fā)生;另外由于任務(wù)分配很難保證每個機器人之間能夠強通信連接,因此我們將噪音所造成的通信的不確定性和傳感器信息感知的不確定性歸結(jié)9.2.3移動多機器人系統(tǒng)任務(wù)分配
優(yōu)化方法及應(yīng)用為通信失效,而針對通信失效的問題,本章多機器人博弈的分布式智能算法中,以局部信息廣播的形式做個體信息的交互,對通信具備很好的自適應(yīng)能力,具體在模型中體現(xiàn)為每個機器人只需根據(jù)自己的目標效用函數(shù)maxA選擇加入任務(wù)分區(qū)
,只需將自己的決策狀態(tài)dij廣播出去,而其他機器人只根據(jù)自身所獲得的局部信息State(t)做出決策。并同時影響其相鄰機器人。9.2.3移動多機器人系統(tǒng)任務(wù)分配
優(yōu)化方法及應(yīng)用本章任務(wù)分配算法流程圖9.2.3移動多機器人系統(tǒng)任務(wù)分配
優(yōu)化方法及應(yīng)用5)仿真實驗與結(jié)果分析I.實驗環(huán)境描述根據(jù)實際生產(chǎn)需求,本章實驗中的任務(wù)為緊耦合型任務(wù),即每個任務(wù)的完成需要多個機器人的合作,要求將m個機器人合理地分配給n個工位的任務(wù),任務(wù)的分配決策過程應(yīng)該由機器人以分布式、自組織的方式完成。II.數(shù)據(jù)初始化及實驗流程算法實現(xiàn)過程及結(jié)果:本實驗在MATLABR2016a上實現(xiàn)。實驗結(jié)果如下圖,結(jié)果圖描述用于任務(wù)(n=6)分配的多個9.2.3移動多機器人系統(tǒng)任務(wù)分配
優(yōu)化方法及應(yīng)用機器人(m=60)的分布式?jīng)Q策過程,任務(wù)分布在1000*1000的范圍,機器人分布在800*800的范圍內(nèi)。
(a)
(b)9.2.3移動多機器人系統(tǒng)任務(wù)分配
優(yōu)化方法及應(yīng)用
(c)
(d)9.2.3移動多機器人系統(tǒng)任務(wù)分配
優(yōu)化方法及應(yīng)用
(e)
(f)9.2.3移動多機器人系統(tǒng)任務(wù)分配
優(yōu)化方法及應(yīng)用
(g)
(h)任務(wù)分配迭代完成過程:(a)迭代第79次,(b)迭代第139次,(c)迭代第189次,(d)迭代第331次,(e)迭代第597次,(f)迭代第682次,(g)迭代第771次,(h)迭代第804次9.2.3移動多機器人系統(tǒng)任務(wù)分配
優(yōu)化方法及應(yīng)用上圖描述了用于任務(wù)(n=6)分配的多個機器人(m=60)的分布式?jīng)Q策過程,任務(wù)分布在1000*1000的范圍,機器人分布在800*800的范圍內(nèi)。圓表示機器人,正方形則為任務(wù),圓之間的線代表機器人的通信網(wǎng)絡(luò)。黃色機器人屬于執(zhí)行黃色任務(wù)(黃色方框?qū)?yīng)任務(wù)t4)的集合。初始時刻機器人針對任務(wù)需求決策處于隨機狀態(tài),隨著時間的推移,算法迭代,機器人之間以局部交互的方式做出對任務(wù)的臨時決策。最終經(jīng)過804次算法迭代之后,各機器人集合形成Nash穩(wěn)定分區(qū),系統(tǒng)得到穩(wěn)定的決策結(jié)果。9.2.3移動多機器人系統(tǒng)任務(wù)分配
優(yōu)化方法及應(yīng)用III.實驗結(jié)果及分析為驗證算法針對不同任務(wù)的完成效率,首先進行了弱通信網(wǎng)絡(luò)強度下不同任務(wù)需求數(shù)量下任務(wù)分配結(jié)果的比較,完成了如下機器人個數(shù)m=60,任務(wù)個數(shù)分別為n=5,6,7,8狀態(tài)下的任務(wù)分配。以算法迭代次數(shù)作為性能評價依據(jù),在相同執(zhí)行機器人數(shù)量下,任務(wù)n=5,6,7,8時任務(wù)分配完成算法迭代次數(shù)分別為722,748,767,758??梢钥闯鲈谌跬ㄐ啪W(wǎng)絡(luò)強度狀態(tài)下任務(wù)的增加對本章任務(wù)分配決策的完成效率影響并不顯著。9.2.3移動多機器人系統(tǒng)任務(wù)分配
優(yōu)化方法及應(yīng)用
(a)
(b)9.2.3移動多機器人系統(tǒng)任務(wù)分配
優(yōu)化方法及應(yīng)用
(a)
(b)相同數(shù)量機器人在不同任務(wù)數(shù)量下的完成結(jié)果:(a)任務(wù)數(shù)n=5,(b)任務(wù)數(shù)n=6,(c)任務(wù)數(shù)n=7,(d)任務(wù)數(shù)n=89.2.3移動多機器人系統(tǒng)任務(wù)分配
優(yōu)化方法及應(yīng)用不同數(shù)量級m,n下算法迭代性能結(jié)果9.2.3移動多機器人系統(tǒng)任務(wù)分配
優(yōu)化方法及應(yīng)用分別取任務(wù)數(shù)n=4,5,6,7,8的不同數(shù)量級機器人的任務(wù)分配完成性能實驗。針對緊耦合型任務(wù)中機器人數(shù)量m略多于任務(wù)數(shù)量n時算法均能快速迭代完成分配。在表結(jié)果中觀察每一行實驗數(shù)據(jù),不論機器人數(shù)量m的值取多少,對于任務(wù)數(shù)n=4、5、6、7、8算法迭代結(jié)果比較接近,不存在明顯異常情況,那么同樣可以得到如前述結(jié)果,即本章算法在同一數(shù)量級機器人情況下,每一行中任務(wù)的增加對決策的完成效率影響并不顯著。9.2.3移動多機器人系統(tǒng)任務(wù)分配
優(yōu)化方法及應(yīng)用但是,從表數(shù)據(jù)也可看出,隨著機器人數(shù)量的增加,算法中機器人需要更多的信息交互,因此算法迭代次數(shù)也會隨之增加。當n=4,m=120時、n=5,m=130時、n=6,7,8,m=135時在有限的空間內(nèi)機器人數(shù)量達到飽和,此時,當機器人數(shù)量繼續(xù)增加算法無法完成任務(wù)的分配。9.3移動多機器人編隊與路徑規(guī)劃方法任務(wù)的高效執(zhí)行需要多機器人間有效的協(xié)同,而多機器人的一致性編隊控制是解決多機器人協(xié)同的重要手段,需要多個機器人組成的團隊在向目標區(qū)域運動的過程中,個體之間保持特定的幾何形態(tài),能夠躲避環(huán)境中的障礙物,使得大規(guī)模多機器人的運動控制問題得到簡化。另一方面多機器人的編隊控制既可以解決在任務(wù)獲得之后,機器人集合在完成各自任務(wù)的過程中由于空間資源的競爭而發(fā)生的沖突;同時,又可以使多機器人在時間和空間上協(xié)調(diào)一致。9.3.1移動多機器人編隊與隊形保持1.多機器人編隊的基本方法編隊控制多個移動機器人,按照特定的要求保持個體之間的幾何關(guān)系,對比單獨控制移動機器人這種方式能夠高效的控制多機器人系統(tǒng)躲避靜或動態(tài)障礙物到達目的地并且由于機器人的編隊行進,其路徑選擇較多條機器人規(guī)劃路徑簡單、行進過程的動作統(tǒng)一可以簡化協(xié)同控制的方案。對于多機器人的編隊控制方向的研究按照采用的方法可以分為:虛擬結(jié)構(gòu)法、基于行為的啟發(fā)式方法、領(lǐng)航-跟隨方法以及基于圖論的方法等。9.3.1移動多機器人編隊與隊形保持1.多機器人編隊的基本方法(1)虛擬結(jié)構(gòu)法:虛擬結(jié)構(gòu)法的思想是將整個編隊系統(tǒng)看作一個整體,也就是一個虛擬的剛性結(jié)構(gòu),而編隊的每個成員都看作剛性結(jié)構(gòu)中相對固定的一點。當隊形進行運動時,就是整個編隊跟蹤一虛擬點的問題。相對于領(lǐng)導(dǎo)跟隨者,因為虛擬結(jié)構(gòu)法不存在領(lǐng)航者,而且可以將編隊帶來的誤差引入到系統(tǒng)中,所以可取得較高的控制精度。9.3.1移動多機器人編隊與隊形保持1.多機器人編隊的基本方法(2)基于行為的啟發(fā)式方法:基于行為法就是將多機器人編隊行為分成幾個小的動作,每個小的動作都有自己的目標控制器,而且每個動作的輸出又可以當作輸入輸送到其他動作的控制器中。通過這樣一系列的行為交互,最終實現(xiàn)編隊控制的任務(wù)。基于行為法的核心在于如何設(shè)計并選取有效的一系列行為實現(xiàn)多機器人編隊任務(wù)。9.3.1移動多機器人編隊與隊形保持1.多機器人編隊的基本方法(3)領(lǐng)航-跟隨方法:領(lǐng)導(dǎo)跟隨者就是從多機器人中選出一個作為領(lǐng)航者,而編隊中剩余的其他機器人就作為跟隨者緊跟領(lǐng)航者航行。該策略的關(guān)鍵在于它將編隊與軌跡位置的偏差進行變換。(4)基于圖論法:由于多機器人編隊控制在執(zhí)行任務(wù)過程中具有相當?shù)囊?guī)模,所以結(jié)構(gòu)是至關(guān)重要的。當多機器人由于通信、控制的原因而形成了網(wǎng)絡(luò)結(jié)構(gòu),那么就必須通過數(shù)學(xué)中的圖論將此網(wǎng)絡(luò)結(jié)構(gòu)建模成圖的形式。9.3.1移動多機器人編隊與隊形保持2.移動多機器人編隊的基本隊形多機器人編隊的基本隊形有三角形、直線形、星形、還有五個機器人組成的多邊形這幾種對稱的形狀。移動多機器人編隊基本隊形9.3.2一致性編隊模型及實現(xiàn)1.基于領(lǐng)航-跟隨方法的移動多機器人編隊模型(1)基于圖論的移動多機器人模型利用圖論基本概念對移動多機器人系統(tǒng)定義:對于n個機器人集合R={r1,r2,…,ri…,rn},定義δ=(G,E,O)為n階的加權(quán)有向圖,節(jié)點集合O={o1,o2,…,on},有向的邊E和加權(quán)鄰接矩陣的集合G=(gij)n×n。該網(wǎng)絡(luò)中的有向邊緣Eij由有序節(jié)點對(oi,oj)表示。從節(jié)點oi到節(jié)點oj在g中的有向路徑是有向網(wǎng)絡(luò)中的一個邊緣序列(oi,oj)。9.3.2一致性編隊模型及實現(xiàn)(1)基于圖論的移動多機器人模型為描述節(jié)點與邊之間的聯(lián)系,引入鄰接矩陣A,表示節(jié)點之間(或機器人與其相鄰機器人之間)的信息連通性。A中元素aij的取值如下:L=D-A表示拓撲圖的拉普拉斯矩陣,該矩陣特征值0出現(xiàn)的個數(shù)就是圖連通區(qū)域的個數(shù),獲得矩陣
。
是一個對角矩陣,該矩陣由鄰接矩陣A轉(zhuǎn)換獲得,將A矩陣的每列元素相加,并將每列元素對應(yīng)的和值放在矩陣的對角線對應(yīng)位置上得到程度矩陣D。9.3.2一致性編隊模型及實現(xiàn)(1)基于圖論的移動多機器人模型包含n個機器人的編隊系統(tǒng),機器人i的二階動力學(xué)模型可如下公式所示:t與t+1表示當前和下一時刻的時間關(guān)系,pi(t)、pi(t+1)分別表示機器人i在二維空間的位置,vi(t)、vi(t+1)表示機器人i的二維速度向量,ui(t)為機器人i輸入控制量,T為采樣周期。9.3.2一致性編隊模型及實現(xiàn)(2)基于領(lǐng)航-跟隨方法的移動多機器人編隊為達到領(lǐng)航-跟隨思想,在常規(guī)編隊一致性控制率上加入跟隨者與領(lǐng)航者的預(yù)期相對間隔誤差,使得跟隨者跟隨領(lǐng)航者運動且編隊可以達成預(yù)期的隊形運動。機器人i的輸入控制量如下式所示:
、
下標分別表示leader的t時刻的位置和速度。9.3.2一致性編隊模型及實現(xiàn)移動機器人n=5時的通信拓撲結(jié)構(gòu)圖圖中采用運算量較低的通信拓撲結(jié)構(gòu),以編隊存在5個機器人為例,領(lǐng)航者標記為leader,跟隨機器人i可以進行編號,編號數(shù)字隨機器人數(shù)量變化。這種結(jié)構(gòu)保證在有限數(shù)量的多機器人集合中,計算量較小,每個跟隨者的位置、速度與領(lǐng)航者或旁側(cè)跟隨機器人相統(tǒng)一,有助于保持隊形。9.3.2一致性編隊模型及實現(xiàn)(2)基于領(lǐng)航-跟隨方法的移動多機器人編隊編隊領(lǐng)航者(t+1)時刻的速度,在速度限制以內(nèi),由其與目標點t時刻的距離
(角標obj表示目標)和角度θ決定,根據(jù)角度θ獲得領(lǐng)航者在x,y軸速度分量,α系數(shù)受機器人加速度,電量,跟隨者合力等影響。領(lǐng)航者初始速度
,vmax為機器人運動的速度限制值。9.3.2一致性編隊模型及實現(xiàn)2.基于編隊一致性的彈簧避障模型靜態(tài)障礙物特征在于空間位置不變,在編隊向目標點運動過程中,將根據(jù)與障礙物之間的距離改變編隊的形態(tài)、速度等。(1)虛擬彈簧力模型將編隊與障礙物之間的距離關(guān)系映射為彈簧力,且由于障礙物為空間固定位置,所以編隊運行中,可以定義機器人彈簧力與離障礙物的距離成正比。9.3.2一致性編隊模型及實現(xiàn)建立在x,y軸彈簧力fx(t),fy(t)與機器人、障礙物位置距離關(guān)系如下式所示:dleader_obs(t)為t時刻leader與obstacle間的距離(角標obs表示目障礙物位置),dij(t)為t時刻機器人間的距離,(dleader_obs(t))3與(dij(t))3中冪取值表示彈性系數(shù),實驗發(fā)現(xiàn)取3次冪效果最佳,上角標x,y表示該值在x,y軸上的分量9.3.2一致性編隊模型及實現(xiàn)(2)領(lǐng)航者避障編隊在運動過程中,首先是領(lǐng)航者避障,領(lǐng)航者的避障速度與彈簧虛擬力的大小和初始速度有關(guān),在x,y方向的運行速度如下:
與
分別為領(lǐng)航者在x,y方向上的避障速度(角標a表示機器人正在避障)。9.3.2一致性編隊模型及實現(xiàn)(3)跟隨者避障在編隊運動過程中,跟隨者跟隨領(lǐng)航者向目標點運動。在跟隨者避障過程中,需要考慮與領(lǐng)航者的一致性、虛擬彈簧力的影響、領(lǐng)航者的速度等,機器人i在x,y方向的運行速度為:
與
分別為跟隨者i在x,y方向上的避障速度。9.3.2一致性編隊模型及實現(xiàn)(4)編隊一致性為保證在編隊運動過程中的一致性,跟隨者根據(jù)機器人之間的位置誤差改變速度使得跟隨機器人i與領(lǐng)航者趨于一致,模型為:
與
分別為跟隨者在x,y方向上的與領(lǐng)航者達成一致性運動時的速度,Es為領(lǐng)航者與跟隨者以及跟隨者之間的位置誤差。φ為機器人i位置誤差與x軸的夾角。9.3.2一致性編隊模型及實現(xiàn)(5)動態(tài)速度限制函數(shù)機器人速度、加速度過容高易導(dǎo)致機器人出現(xiàn)偏離編隊的情況,甚至難以回歸,但是如果對速度、加速度進行定值限制,容易降低編隊和個體機器人的靈活性,為能夠平衡兩種情況,在編隊運動中加入動態(tài)速度限制函數(shù):9.3.2一致性編隊模型及實現(xiàn)(5)動態(tài)速度限制函數(shù)
表示機器人i在t+1時刻的加速度,與該機器人距離誤差增加或減小的趨勢相關(guān),如距離誤差是增加趨勢,則ε為正值且與增加趨勢正相關(guān),加速度在下一時刻增加,反之ε為負值與距離誤差減小趨勢正相關(guān);上式保證了機器人在不超過速度限制的情況下與距離誤差變化趨勢同步變化,并以縮小距離誤差為指引。9.3.2一致性編隊模型及實現(xiàn)3.多機器人編隊算法實現(xiàn)(1)實驗構(gòu)造及數(shù)據(jù)初始化實驗物理環(huán)境為有限的二維區(qū)域,大小為30×30m2。分別構(gòu)造存在靜態(tài)、動態(tài)障礙物的仿真環(huán)境,在此環(huán)境下構(gòu)造實驗和數(shù)據(jù)初始化。仿真實驗中,定義機器人是同種類型,具備基本的導(dǎo)航、避障、通信等功能,領(lǐng)航者有且僅有1個。9.3.2一致性編隊模型及實現(xiàn)(1)實驗構(gòu)造及數(shù)據(jù)初始化數(shù)據(jù)初始化編隊中的機器人數(shù)量,n=[5,10,15,20],機器人初始位置(
)、動態(tài)障礙物初始位置(
)隨機獲得。跟隨者i,i=[1,19]分別根據(jù)實驗中不同機器人數(shù)量編號,其中障礙物長7m,寬1.6m,障礙物之間間隔4.5m,左下角的障礙物與原點間隔為4.5m,動態(tài)障礙物起點為(25,0)、(25,15),終點為(5,15)、(10,3)。9.3.2一致性編隊模型及實現(xiàn)不同實驗環(huán)境中參數(shù)初始化表9.3.2一致性編隊模型及實現(xiàn)(2)實驗結(jié)果及分析編隊系統(tǒng)的機器人數(shù)量超過20后,數(shù)據(jù)特征不明顯,所以實驗以編隊機器人數(shù)量為5、10、15、20個分別在無沖突、有沖突機器人仿真環(huán)境中進行實驗并分析結(jié)果。1)無動態(tài)障礙物環(huán)境I編隊運動軌跡分析9.3.2一致性編隊模型及實現(xiàn)
(a)n=5
(b)n=10無動態(tài)障礙物編隊運動軌跡圖I編隊運動軌跡分析9.3.2一致性編隊模型及實現(xiàn)
(c)n=15
(d)n=20無動態(tài)障礙物編隊運動軌跡圖I編隊運動軌跡分析9.3.2一致性編隊模型及實現(xiàn)I編隊運動軌跡分析當編隊中機器人數(shù)量增加后,領(lǐng)航者的路徑?jīng)]有發(fā)生變化,子圖(a),5機器人編隊機器人數(shù)量少,在編隊運行中跟隨者都和領(lǐng)航者選擇了相同的通道到達終點,子圖(b)、(c)、(d)中,10機器人、15機器人、20機器人編隊由于機器人數(shù)量的增加與車間過道較窄,所以編隊在運動過程中,明顯存在機器人選擇其它不與領(lǐng)航者相同的路徑,做出了動態(tài)的改變,且是在保證路徑長度增加最少的情況下,完成越障后形成預(yù)期隊形到達終點。9.3.2一致性編隊模型及實現(xiàn)II領(lǐng)航者與跟隨者位置誤差
(a)n=5
(b)n=10無動態(tài)障礙物環(huán)境編隊運動領(lǐng)航者與跟隨者位置誤差9.3.2一致性編隊模型及實現(xiàn)II領(lǐng)航者與跟隨者位置誤差
(c)n=15
(d)n=20無動態(tài)障礙物環(huán)境編隊運動領(lǐng)航者與跟隨者位置誤差9.3.2一致性編隊模型及實現(xiàn)II領(lǐng)航者與跟隨者位置誤差跟隨者與領(lǐng)航者的位置誤差會隨編隊機器人數(shù)量增加而增加:10機器人最大誤差比5機器人的增加44.35%;15機器人最大誤差10機器人編隊增加44.25%;20機器人時最大誤差較15機器人編隊減少9.42%。出現(xiàn)最大誤差時間隨編隊機器人數(shù)量增長而提前,說明在有限空間內(nèi)機器人數(shù)量對于誤差的產(chǎn)生有較大影響。當機器人數(shù)量增加,速度控制下的編隊機器人個體的速度保持是以擴大路徑包線為代價的,路徑包線的擴大帶來位置誤差的增加。9.3.2一致性編隊模型及實現(xiàn)2)存在動態(tài)障礙物的實驗環(huán)境在模擬環(huán)境中,增加兩個隨機運動的同類機器人作為動態(tài)障礙物,分別對5、10、15、20個機器人組成的編隊進行動態(tài)避障實驗。9.3.2一致性編隊模型及實現(xiàn)2)存在動態(tài)障礙物的實驗環(huán)境
(a)n=5
(b)n=10動態(tài)障礙物環(huán)境改進模型編隊運動軌跡圖9.3.2一致性編隊模型及實現(xiàn)2)存在動態(tài)障礙物的實驗環(huán)境
(c)n=15
(d)n=20動態(tài)障礙物環(huán)境改進模型編隊運動軌跡圖9.3.2一致性編隊模型及實現(xiàn)2)存在動態(tài)障礙物的實驗環(huán)境在不遇到障礙物時,跟隨者基本與領(lǐng)航者趨于一致,當出現(xiàn)障礙物時,編隊的隊形會被影響,但是當編隊與沖突錯過時,編隊會自行調(diào)整位置,跟隨者會快速調(diào)整與領(lǐng)航者趨于一致,最后安全到達終點。在有沖突機器人環(huán)境中,編隊也會因為機器人數(shù)量的增加而出現(xiàn)機器人路徑分岔的現(xiàn)象,這說明即使在動態(tài)障礙物環(huán)境中,編隊也會因為需要快速到達目的地而做出及時調(diào)整。9.3.2一致性編隊模型及實現(xiàn)I領(lǐng)航者與跟隨者位置誤差
(a)n=5
(b)n=10有動態(tài)障礙物環(huán)境改進模型編隊運動領(lǐng)航者與跟隨者位置誤差9.3.2一致性編隊模型及實現(xiàn)I領(lǐng)航者與跟隨者位置誤差
(c)n=15
(d)n=20有動態(tài)障礙物環(huán)境改進模型編隊運動領(lǐng)航者與跟隨者位置誤差9.3.2一致性編隊模型及實現(xiàn)I領(lǐng)航者與跟隨者位置誤差在動態(tài)障礙物環(huán)境中,動態(tài)障礙物對編隊運動會有影響,但由于較早的信息共享,機器人編隊可以避免與動態(tài)障礙物發(fā)生正面沖突,但是由于編隊機器人改變了原本的軌跡,所以跟隨著與領(lǐng)航者誤差增加。在機器人數(shù)量增加的情況編隊跟隨者會因為車間過道較窄分岔,位置誤差會因為分岔而出現(xiàn)增加的情況,所以10機器人、15機器人、20機器人最大誤差較大。9.3.2一致性編隊模型及實現(xiàn)I領(lǐng)航者與跟隨者位置誤差結(jié)合各個機器人位置誤差曲線,在編隊即將到達終點時,誤差都在減小狀態(tài)且編隊隨機器人數(shù)量增加到達終點的時間都接近,證明了系統(tǒng)在動態(tài)障礙物環(huán)境的動態(tài)調(diào)節(jié)能力。運動數(shù)據(jù)充分分享可以幫助編隊中機器人的運動規(guī)劃的更加穩(wěn)定,將編隊機器人的運動路徑控制在了可接受的范圍內(nèi)。9.4多移動機器人圍捕圍捕是指多個捕者組成團隊圍捕一個逃跑者的情況。圍捕時圍捕者之間協(xié)作完成任務(wù)。多移動機器人圍捕,指在某一環(huán)境中存在某一或某些動態(tài)或是靜態(tài)的目標,環(huán)境中可能存在不規(guī)則形狀障礙物,要求多個移動機器人在當前環(huán)境中發(fā)現(xiàn)并在一定時間內(nèi)呈一定形式的分布在目標周圍,即完成圍捕。9.4多移動機器人圍捕多移動機器人圍捕問題主要研究:1.通過多個圍捕機器人追捕目標機器人研究圍捕機器人之間協(xié)調(diào)合作問題,即在同一個目標的前提下如何平衡系統(tǒng)收益與機器人個體收益,盡可能達到全局最優(yōu)。2.圍捕系統(tǒng)在進行圍捕時如何分派相應(yīng)數(shù)量的機器人,這些機器人如何進行組織,即研究圍捕任務(wù)最優(yōu)任務(wù)分配方法。3.研究自適應(yīng)學(xué)習(xí)算法使得圍捕系統(tǒng)在面對動態(tài)環(huán)境和任務(wù)時依然能夠有效地組織圍捕團隊圍捕目標。9.4.1多移動機器人圍捕流程多移動機器人圍捕流程要分為目標搜索、目標跟隨以及目標包圍三個階段。開始執(zhí)行圍捕任務(wù)時,圍捕機器人群體以一定的搜索策略搜索實驗區(qū)域中的目標機器人,在搜索過程中如果某個圍捕機器人發(fā)現(xiàn)了目標機器人,就將估計的目標機器人位置發(fā)送給其它圍捕機器人。其它圍捕機器人逐漸向目標機器人靠近并形成一定的隊形。在其他圍捕機器人靠近目標機器人的過程中,發(fā)現(xiàn)目標機器人的圍捕機器人對目標機器人進行跟隨,防止丟失目標機器人信息。9.4.1多移動機器人圍捕流程目標搜索:目標搜索是指多機器人在實驗區(qū)域找到目標機器人的過程,搜索出目標機器人是多機器人協(xié)作圍捕任務(wù)后續(xù)工作的前提。目標跟隨:考慮到圍捕機器人發(fā)現(xiàn)目標機器人的初期,目標機器人周圍的圍捕機器人數(shù)量較少且目標機器人具有一定的移動能力,不宜直接對其包圍。為了避免發(fā)現(xiàn)的目標機器人從視野中丟失,此時以單個圍捕機器人對目標機器人的跟隨為主。9.4.1多移動機器人圍捕流程為實現(xiàn)目標跟隨的整個流程,圍捕機器人發(fā)現(xiàn)目標機器人后,在視覺相機捕獲的視頻序列中便具有了目標機器人的位置坐標等相關(guān)信息。將目標機器人在像素坐標系下實際的位置坐標與期望的位置坐標比較,以兩者之間的差值調(diào)節(jié)圍捕機器人的線速度和角速度實現(xiàn)對目標機器人的跟隨。目標包圍:圍捕機器人群體到達目標機器人附近后,首先組成一定的隊形包圍目標機器人,然后押送目標機器人使其無法在實驗區(qū)域隨意運動,從而完成圍捕。9.4.2多移動機器人圍捕存在的一些問題圍捕問題存在下列一些問題:1.逃跑者采用一種高智能的逃跑方式一般的圍捕任務(wù)都是采用比較低智能的逃跑方式,只是簡單采用局部最優(yōu)逃跑方法即遠離圍捕機器人,沒有考慮到全局逃跑最優(yōu)。設(shè)計一種高智能逃跑方式會使得圍捕問題變得更加困難和復(fù)雜。2.傳感器的不確定性機器人圍捕的時候,各機器人通信和定位都與傳感器有關(guān)系,而實際上傳感器只能保證探測點周圍的精確度,9.4.2多移動機器人圍捕存在的一些問題對很多不確定性問題不能保證。這需要建立一個不確定模型,對機器人當前的位置信息進行準確的估計。3.非同等條件下的圍捕現(xiàn)在研究圍捕大多數(shù)都是考慮到圍捕機器人和逃跑機器人,條件相當或者圍捕機器人比逃跑機器人具有優(yōu)勢性,在圍捕機器人相當于逃跑機器人處于劣勢情況下的圍捕是一個有待解決的問題,比如說圍捕機器人相當逃跑機器人,速度比較慢,視野范圍比較小,運動的機會比較少的情況,這需要建立更復(fù)雜的模型。9.4.2多移動機器人圍捕存在的一些問題4.多個逃跑者的情況未知環(huán)境下存多個逃跑時的情況仍然需要進研究,包括追捕者如何優(yōu)地形成圍捕聯(lián)盟,在盡量短的時間內(nèi)利用盡量少的總體能消耗將所有的逃跑者捕獲,這渉及到多機器人之間的聯(lián)盟及協(xié)商等問題。9.4.3多移動機器人圍捕方法1.領(lǐng)航-跟隨(leader-follower)方法leader-
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 買房賣房協(xié)議書樣本
- 小學(xué)生衛(wèi)生習(xí)慣教育主題班會《好習(xí)慣伴我成長》課件
- 八年級語文上冊《古詩十九首 庭中有奇樹》教案 新人教版
- 2024年五年級英語下冊 Unit 1 Welcome to our school Fun Facts教案 人教精通版(三起)
- 八年級物理上冊 第五章 第四節(jié) 眼睛和眼鏡教案 (新版)新人教版
- 易制爆化學(xué)品使用部門職責
- 國開(湖北)2024年秋《國學(xué)經(jīng)典選讀》形考作業(yè)1-4答案
- 汽車試驗技術(shù) 課件 項目6 整車碰撞安全性能試驗
- 租廠房合同(2篇)
- 葉公好龍課件小班
- 重大事故隱患判定標準培訓(xùn)記錄、培訓(xùn)效果評估
- 郵政末端投遞模式的優(yōu)化與創(chuàng)新
- 《醫(yī)療物品多旋翼無人機運輸技術(shù)規(guī)范(征求意見稿)》
- 心理學(xué):學(xué)前兒童發(fā)展心理學(xué)試題預(yù)測
- 艾滋病人的護理課件
- 珠海2024年廣東珠海市總工會招聘社會化工會工作者7人筆試歷年典型考題及考點附答案解析
- 2024版合同范本之二手車場地租賃合同
- 8隊淘汰賽-對陣表
- 機器學(xué)習(xí)(山東聯(lián)盟)智慧樹知到期末考試答案章節(jié)答案2024年山東財經(jīng)大學(xué)
- 汽車銷售行業(yè)常見涉稅風(fēng)險點及識別
- 水庫網(wǎng)絡(luò)安全設(shè)備升級投標方案技術(shù)標
評論
0/150
提交評論