深度解讀A-SLAM和AC-SLAM的實(shí)現(xiàn)和方法應(yīng)用_第1頁(yè)
深度解讀A-SLAM和AC-SLAM的實(shí)現(xiàn)和方法應(yīng)用_第2頁(yè)
深度解讀A-SLAM和AC-SLAM的實(shí)現(xiàn)和方法應(yīng)用_第3頁(yè)
深度解讀A-SLAM和AC-SLAM的實(shí)現(xiàn)和方法應(yīng)用_第4頁(yè)
深度解讀A-SLAM和AC-SLAM的實(shí)現(xiàn)和方法應(yīng)用_第5頁(yè)
已閱讀5頁(yè),還剩25頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

Word深度解讀A-SLAM和AC-SLAM的實(shí)現(xiàn)和方法應(yīng)用本文對(duì)過(guò)去十年中進(jìn)行的主動(dòng)SLAM(A-SLAM)研究進(jìn)行了新的回顧。論文討論了基于信息理論的方法在A-SLAM中用于軌跡生成和控制動(dòng)作選擇的公式、應(yīng)用和方法。本文廣泛的定性和定量分析強(qiáng)調(diào)了A-SLAM研究的方法、場(chǎng)景、配置、(機(jī)器人)類型、(傳感器)類型、數(shù)據(jù)集使用和路徑規(guī)劃方法。最后,論文提出了局限性并提出了未來(lái)研究的可能性。論文認(rèn)為這項(xiàng)調(diào)查將有助于研究人員了解應(yīng)用于A-SLAM的各種方法和技術(shù)。

2介紹

SLAM是一組方法,其中機(jī)器人自主定位并在導(dǎo)航時(shí)同時(shí)建圖環(huán)境。它可以細(xì)分為解決定位和建圖。定位是一個(gè)估計(jì)機(jī)器人在地圖上的姿態(tài)的問(wèn)題,而地圖則是借助于車輛上的視覺(jué)、視覺(jué)慣性和激光傳感器來(lái)重建環(huán)境。前端處理感知任務(wù),這涉及實(shí)現(xiàn)(信號(hào))處理和(計(jì)算機(jī)視覺(jué))領(lǐng)域的方法,以計(jì)算機(jī)器人環(huán)境和觀察到的特征之間的估計(jì)相對(duì)局部姿態(tài)。SLAM后端使用優(yōu)化理論、圖論和概率論來(lái)估計(jì)全局地圖和軌跡。關(guān)于SLAM方法的詳細(xì)綜述,可以參考[1]、[2]、[3]、[5]。

大多數(shù)SLAM(算法)是被動(dòng)的,其中機(jī)器人被手動(dòng)控制或朝向預(yù)定義的路線點(diǎn)行進(jìn),并且導(dǎo)航或路徑規(guī)劃算法不主動(dòng)參與機(jī)器人的運(yùn)動(dòng)或軌跡。然而,A-SLAM試圖通過(guò)提出一種導(dǎo)航策略來(lái)解決未知環(huán)境的最優(yōu)探索問(wèn)題,該導(dǎo)航策略生成未來(lái)目標(biāo)/對(duì)象位置動(dòng)作,這些動(dòng)作減少了在地圖和姿態(tài)中的不確定性,從而實(shí)現(xiàn)完全自主的導(dǎo)航和測(cè)繪SLAM系統(tǒng)。論文將在其指定的第2節(jié)中進(jìn)一步了解A-SLAM。在主動(dòng)協(xié)作SLAM(AC-SLAM)中,多個(gè)機(jī)器人在執(zhí)行SLAM時(shí)主動(dòng)協(xié)作。A-SLAM和AC-SLAM的應(yīng)用領(lǐng)域包括搜索和救援[17]、行星觀測(cè)[12]、精準(zhǔn)農(nóng)業(yè)[23]、擁擠環(huán)境中的自主導(dǎo)航[34]、水下探索[30][40][44]、(人工智能)[42]、輔助機(jī)器人[74]和自主探索[126]。

A-SLAM上算法的第一個(gè)實(shí)現(xiàn)可以追溯到[9],但最初的名稱是在[10]中起草的。然而,A-SLAM及其根源可以從人工智能和機(jī)器人探索技術(shù)創(chuàng)造的想法進(jìn)一步追溯到20世紀(jì)80年代[11]。在過(guò)去十年中,還沒(méi)有對(duì)A-SLAM進(jìn)行過(guò)綜述調(diào)查。2021年只有一篇文章在其評(píng)論文章[4]中討論了A-SLAM。在本文中,A-SLAM并不是研究的重點(diǎn),相反,從整體上看了SLAM的整個(gè)主題。之所以在這里提到它,是因?yàn)槲覀兾恼轮羞M(jìn)行的研究集中在主動(dòng)和A-SLAM上。

本文的優(yōu)勢(shì)不僅包括討論A-SLAM的內(nèi)部組成部分,還包括其應(yīng)用領(lǐng)域、局限性和未來(lái)前景,以及對(duì)過(guò)去十年A-SLAM進(jìn)行全面的統(tǒng)計(jì)調(diào)查。

3主動(dòng)SLAM簡(jiǎn)介

如前所述,SLAM是一個(gè)機(jī)器人建圖其環(huán)境并將其自身定位到該環(huán)境的過(guò)程。A-SLAM負(fù)責(zé)設(shè)計(jì)機(jī)器人軌跡,以最小化其地圖表示和定位的不確定性。其目的是在沒(méi)有外部控制器或人力的情況下執(zhí)行自主導(dǎo)航和環(huán)境探索。參考圖1,可以觀察到,在典型的SLAM系統(tǒng)中,來(lái)自傳感器(通常為激光雷達(dá)、相機(jī)和IMU)的數(shù)據(jù)由前端模塊處理,前端模塊計(jì)算特征提取、數(shù)據(jù)關(guān)聯(lián)、特征分類、迭代最近點(diǎn)(ICP)和回環(huán)閉合。ICP是一種迭代方法,它計(jì)算優(yōu)化/對(duì)齊數(shù)據(jù)點(diǎn)/特征的轉(zhuǎn)換,并用于掃描匹配方法中以建圖環(huán)境。后端模塊負(fù)責(zé)涉及束調(diào)整(B.A)、位姿圖優(yōu)化和地圖估計(jì)的高計(jì)算任務(wù)。后端模塊輸出機(jī)器人的全局地圖和姿態(tài)估計(jì)。A-SLAM可以被稱為SLAM系統(tǒng)的附加模塊或超集合,其結(jié)合了路線點(diǎn)和軌跡規(guī)劃,以及使用信息理論、控制理論和強(qiáng)化學(xué)習(xí)(RL)方法的控制模塊,以自主引導(dǎo)機(jī)器人實(shí)現(xiàn)其目標(biāo)。

在SLAM中,環(huán)境探索(以更好地了解環(huán)境)和開(kāi)發(fā)(以重新訪問(wèn)已穿過(guò)的區(qū)域以進(jìn)行回環(huán)閉合)被最大化,以獲得更好的地圖估計(jì)和定位。因此必須在勘探和開(kāi)發(fā)之間進(jìn)行權(quán)衡,因?yàn)榍罢咭笞畲笙薅鹊馗采w環(huán)境,而后者要求機(jī)器人重新訪問(wèn)先前勘探的區(qū)域。這兩個(gè)任務(wù)可能不總是同時(shí)應(yīng)用于機(jī)器人以執(zhí)行自主導(dǎo)航。機(jī)器人可能必須通過(guò)在這兩個(gè)任務(wù)之間切換來(lái)解決探索開(kāi)發(fā)困境。

A-SLAM公式

A-SLAM是在機(jī)器人必須在部分可觀察/未知環(huán)境中導(dǎo)航的場(chǎng)景中制定的,該場(chǎng)景通過(guò)在存在噪聲傳感器測(cè)量的情況下選擇一系列未來(lái)動(dòng)作來(lái)減少其狀態(tài)和地圖相對(duì)于環(huán)境的不確定性。這樣的場(chǎng)景可以被建模為[6]中討論的部分可觀測(cè)馬爾可夫決策過(guò)程(POMDP)的實(shí)例。POMDP定義為7元組。X表示機(jī)器人狀態(tài)空間,A表示動(dòng)作空間,O表示觀測(cè),T是狀態(tài)轉(zhuǎn)移函數(shù),說(shuō)明感知不確定性,是與在狀態(tài)x中采取的行動(dòng)相關(guān)的獎(jiǎng)勵(lì),考慮了折扣系數(shù),即使計(jì)劃任務(wù)具有無(wú)限的范圍,也能確保有限的回報(bào)。T和都可以使用條件概率表示為等式1和2。

機(jī)器人的目標(biāo)是選擇使每個(gè)狀態(tài)-動(dòng)作對(duì)的相關(guān)預(yù)期回報(bào)最大化的最優(yōu)策略,并且可以將其建模為等式3:

盡管A-SLAM的POMDP公式是最廣泛使用的方法,但由于它考慮了不確定性下的規(guī)劃和決策,因此它被認(rèn)為是計(jì)算昂貴的。為了計(jì)算方便,A-SLAM公式分為三個(gè)主要子模塊,它們識(shí)別潛在的目標(biāo)位置/路點(diǎn),計(jì)算到達(dá)它們的成本,然后根據(jù)效用標(biāo)準(zhǔn)選擇行動(dòng),從而減少地圖的不確定性并增加機(jī)器人的定位。

主動(dòng)SLAM的組成

為了處理A-SLAM的計(jì)算復(fù)雜性,它被分為三個(gè)主要子模塊,如圖2所示。機(jī)器人最初在地圖的當(dāng)前估計(jì)中確定要探索或利用的潛在目標(biāo)位置。地圖表示機(jī)器人使用其機(jī)載傳感器感知的環(huán)境,可分為

1)拓?fù)涞貓D:使用環(huán)境的圖形表示并提供簡(jiǎn)化的拓?fù)浔硎?/p>

2)度量地圖:以稀疏的信息點(diǎn)(地標(biāo))集合或環(huán)境的完整3D表示的形式提供環(huán)境信息(點(diǎn)云)

3)語(yǔ)義地圖:僅向機(jī)器人提供有關(guān)環(huán)境目標(biāo)(如靜態(tài)障礙物)的分段信息。感興趣的讀者可參考[1,4],詳細(xì)討論建圖方法。

一旦機(jī)器人使用上述任何方法獲得了其環(huán)境的地圖,它就會(huì)搜索潛在的目標(biāo)/對(duì)象位置進(jìn)行探索。最廣泛使用的方法之一是[7]最初使用的基于邊界的勘探,其中邊界是已知和未知地圖位置之間的邊界。使用基于邊界的探索具有覆蓋所有環(huán)境的優(yōu)點(diǎn),但缺點(diǎn)是不執(zhí)行影響機(jī)器人地圖估計(jì)的開(kāi)發(fā)任務(wù)(重新訪問(wèn)已訪問(wèn)的區(qū)域以回環(huán))。

一旦目標(biāo)位置被識(shí)別,下一步是基于從根據(jù)等式3的所有可能動(dòng)作的集合中選擇的最佳動(dòng)作的一些獎(jiǎng)勵(lì)值來(lái)計(jì)算該位置的成本或效用函數(shù)。理想情況下,該效用函數(shù)應(yīng)考慮地圖和機(jī)器人姿態(tài)的全關(guān)節(jié)概率分布,但該方法計(jì)算成本較高。由于我們對(duì)機(jī)器人和地圖都有概率估計(jì),因此可以將它們視為隨機(jī)變量,并在其估計(jì)中具有相關(guān)的不確定性。量化和表示這種不確定性最常用的兩種方法是信息理論(IT)和最佳實(shí)驗(yàn)設(shè)計(jì)理論(TOED)[64],信息理論最初由Shannon于1949年提出。在IT中,熵度量與隨機(jī)變量或隨機(jī)量相關(guān)的不確定性。更高的熵導(dǎo)致更少的信息增益,反之亦然。將隨機(jī)變量X定義為,如等式4所示。目標(biāo)是減少機(jī)器人姿態(tài)和地圖估計(jì)之間的熵,如在[8]中所闡述的。

相對(duì)熵也可以用作一個(gè)效用函數(shù),它測(cè)量概率分布的形式及其與平均值的偏差。該相對(duì)熵被測(cè)量為KL散度。概率空間X上兩個(gè)離散分布A和B的KLD可以定義為方程5:

在A-SLAM中,如果考慮信息驅(qū)動(dòng)的效用函數(shù),那么熵或KLD可以用作網(wǎng)格圖(占用網(wǎng)格圖)中目標(biāo)二進(jìn)制概率的度量?;蛘撸绻覀兛紤]任務(wù)驅(qū)動(dòng)效用函數(shù)并假設(shè)高斯分布,那么可以嘗試使用TOED來(lái)量化任務(wù)空間中的不確定性。在TOED中,A-SLAM的一組動(dòng)作的優(yōu)先級(jí)基于關(guān)節(jié)后部的協(xié)方差量。協(xié)方差越小,動(dòng)作集的權(quán)重越高。為了比較候選行動(dòng)集的矩陣,已經(jīng)為協(xié)方差矩陣定義了稱為“最優(yōu)性準(zhǔn)則”的不同函數(shù),其本征值為

1)A最優(yōu)性,其處理平均方差的最小化,如等式6所示;

2)D最優(yōu)性,處理捕獲全協(xié)方差矩陣,并在等式7中定義;

3)E最優(yōu)性,意圖最小化最大本征值,并在等式8中表示。

TOED方法要求將機(jī)器人姿態(tài)和地圖不確定性都表示為協(xié)方差矩陣,并且可能計(jì)算昂貴,特別是在基于地標(biāo)的SLAM中,當(dāng)發(fā)現(xiàn)新地標(biāo)時(shí),其大小會(huì)增加。因此,基于IT的方法優(yōu)于TOED。

一旦確定了目標(biāo)位置和到達(dá)這些位置的效用/成本,下一步就是執(zhí)行最終將機(jī)器人移動(dòng)/引導(dǎo)到目標(biāo)位置的最佳動(dòng)作。通常采用三種方法:

概率路線圖(PRM)方法表示表示機(jī)器人選擇到達(dá)目標(biāo)位置的可能路徑的(網(wǎng)絡(luò))圖。這些方法以啟發(fā)式的方式工作,可能不會(huì)給出最佳路徑,此外,機(jī)器人模型未納入規(guī)劃階段,這可能會(huì)導(dǎo)致意外移動(dòng)。RRT[51]、D*[50]和A*[57]是廣泛使用的PRM方法。論文將這些方法確定為基于幾何的方法;

線性二次調(diào)節(jié)器(LQR)和模型預(yù)測(cè)控制(MPC)等最優(yōu)控制方法用于在線或離線規(guī)劃控制路徑,同時(shí)考慮與控制努力和機(jī)器人狀態(tài)隨時(shí)間演變相關(guān)的成本;

深度強(qiáng)化學(xué)習(xí)(DRL)方法通過(guò)最大化機(jī)器人軌跡演化過(guò)程中每個(gè)狀態(tài)動(dòng)作對(duì)獲得的獎(jiǎng)勵(lì)來(lái)工作。

如前幾節(jié)所述,使用IT和TOED對(duì)選擇合適的路點(diǎn)候選進(jìn)行加權(quán)。在這些方法中,地圖和機(jī)器人路徑之間的信息增益或熵最小化指導(dǎo)了選擇這些未來(lái)候選路線的決策。為了生成這些未來(lái)候選路線的軌跡或一組動(dòng)作,采用了兩種主要方法,分別是幾何和動(dòng)態(tài)方法。這些方法包括使用傳統(tǒng)的路徑規(guī)劃器以及馬爾可夫決策過(guò)程和非線性最優(yōu)控制技術(shù)。

基于幾何的方法

這些方法將A-SLAM描述為機(jī)器人選擇最佳路徑和軌跡的任務(wù),同時(shí)減少其姿態(tài)和建圖的不確定性,以便高效SLAM在未知環(huán)境中自主導(dǎo)航。利用有限隨機(jī)航路點(diǎn)對(duì)勘探空間進(jìn)行離散化,并利用基于IT和TOED的方法(包括熵、信息增益、不確定性度量減少)部署基于Fron(ti)er的勘探以及傳統(tǒng)路徑規(guī)劃器(如RRT*、D*、A*)。

基于信息理論的方法

[20]的解決了聯(lián)合熵最小化探索問(wèn)題,并提出了RRT*[51]的兩個(gè)修改版本,分別稱為dRRT和eRRT。dRRT使用距離,而eRRT使用每行駛距離的熵變化作為成本函數(shù)。人們進(jìn)一步討論了地圖熵與覆蓋率有很強(qiáng)的關(guān)系,路徑熵與地圖質(zhì)量有關(guān)系(因?yàn)楦玫亩ㄎ粫?huì)產(chǎn)生更好的地圖)。因此,行動(dòng)是根據(jù)每行駛距離的聯(lián)合熵變化來(lái)計(jì)算的。(仿真)結(jié)果證明,這兩種方法的組合提供了最佳的路徑規(guī)劃策略。[18]中給出了信息理論方法之間的有趣比較,其中粒子濾波用作A-SLAM的后端,并部署了基于邊界的探索(邊界是訪問(wèn)和未探索區(qū)域之間的邊界)[49]以選擇未來(lái)的候選目標(biāo)位置。下面討論了用于解決勘探問(wèn)題和評(píng)估信息的這三種方法的比較:

關(guān)節(jié)熵:在目標(biāo)處獲得的信息使用機(jī)器人軌跡的熵和每個(gè)粒子攜帶的地圖的熵進(jìn)行評(píng)估,每個(gè)粒子通過(guò)每個(gè)軌跡的重要性權(quán)重進(jìn)行加權(quán)。選擇最佳勘探目標(biāo),這使聯(lián)合熵減少最大化,因此對(duì)應(yīng)于更高的信息增益;

期望地圖平均值:期望平均值可以定義為粒子集的地圖假設(shè)的數(shù)學(xué)期望值。預(yù)期的地圖平均值可以應(yīng)用于(檢測(cè))地圖上已經(jīng)遍歷的循環(huán)。由于增益的計(jì)算正在發(fā)展,這種方法的復(fù)雜性增加了;

來(lái)自策略的預(yù)期信息:KL散度[28]用于驅(qū)動(dòng)真實(shí)后驗(yàn)和近似姿態(tài)信念之間的偏差上限。除了粒子濾波的信息一致性之外,該方法還考慮了由于不一致建圖導(dǎo)致的信息丟失。

使用對(duì)各種數(shù)據(jù)集的(模擬)結(jié)果(參考表2)得出的結(jié)論是,這些方法中的大多數(shù)都不能正確解決問(wèn)題的概率方面,并且最有可能失敗,因?yàn)橛?jì)算成本高,地圖網(wǎng)格分辨率依賴于性能。

在[32]中提出了TFGSLAM,它使用空間i的幾何表示,即勘探空間由原始幾何形狀表示,并計(jì)算地圖特征的熵減少。它使用基于拉普拉斯近似的熵度量,并計(jì)算勘探和開(kāi)發(fā)收益的統(tǒng)一量化?;诟怕实缆穲D方法使用基于有效采樣的路徑規(guī)劃器,該方法具有降低控制成本(距離)和目標(biāo)之間的碰撞懲罰的成本函數(shù)。與傳統(tǒng)的柵格地圖邊界勘探相比,模擬結(jié)果顯示位置、方向和勘探誤差顯著減少。未來(lái)的改進(jìn)包括擴(kuò)展到主動(dòng)的VisualSLAM框架。

當(dāng)考慮拓?fù)渚仃噲D和計(jì)算成本較低的解決方案時(shí),可以參考[45]所采用的方法,該方法考慮了一種場(chǎng)景,即有許多先前的拓?fù)渚仃囎訄D,而機(jī)器人不知道其初始位置。提出了一種使用主動(dòng)定位和主動(dòng)建圖的開(kāi)源框架。定義了一種在主動(dòng)定位和建圖之間切換的子圖連接方法。主動(dòng)定位使用最大似然估計(jì)來(lái)計(jì)算運(yùn)動(dòng)策略,這降低了該方法的計(jì)算復(fù)雜性。

基于Frontier的探索

邊界是探索和未探索空間之間的邊界。形式上可以將邊界描述為一組未知點(diǎn),每個(gè)點(diǎn)至少有一個(gè)已知的空間鄰居。[21]提出的工作制定了一種以粒子(濾波器)SLAM為后端的混合控制切換探索方法。它使用基于邊界的探索方法,A*[57]作為全局規(guī)劃器,動(dòng)態(tài)窗口方法(DWA)反應(yīng)算法作為局部規(guī)劃器。在占用網(wǎng)格圖內(nèi),分割每個(gè)邊界,為每個(gè)段規(guī)劃軌跡,并從全局成本圖中選擇具有最高地圖段協(xié)方差的軌跡。[34]中介紹的工作涉及多個(gè)地面機(jī)器人的動(dòng)態(tài)環(huán)境,并使用基于圖形的SLAM(iSAM)[61]優(yōu)化作為SLAM后端,使用前沿探索進(jìn)行自主探索。使用基于Dijkstra算法的局部規(guī)劃器。最后,基于Shannon和Renyi熵的效用函數(shù)用于計(jì)算路徑的效用。未來(lái)的工作建議集成攝像頭并使用圖像特征掃描匹配來(lái)避免障礙物。

路徑規(guī)劃優(yōu)化

[30]提出的方法利用了圖形SLAM的圖形模型和稀疏矩陣分解之間的關(guān)系。它提出了變量排序和子樹(shù)捕獲方案,以便于快速計(jì)算由變量之間的信念變化加權(quán)的優(yōu)化候選路徑。地平線選擇標(biāo)準(zhǔn)基于先前的工作,利用擴(kuò)展信息濾波器(EIF)和高斯牛頓(GN)預(yù)測(cè)。提出的解決方案在具有姿態(tài)圖SLAM的懸停自主水下機(jī)器人(HAUV)中實(shí)現(xiàn)。[44]中介紹的工作涉及使用多波束聲納在水下環(huán)境中進(jìn)行類似的體積探測(cè)。對(duì)于有效的路徑規(guī)劃,根據(jù)姿態(tài)不確定性和傳感器信息增益來(lái)選擇重新訪問(wèn)動(dòng)作。

[39]中的使用了一種有趣的方法,該方法將路徑規(guī)劃任務(wù)處理為D*[50],具有負(fù)邊緣權(quán)重,以在定位改變的情況下計(jì)算最短路徑。這種探索方法在具有不斷變化的障礙和定位的動(dòng)態(tài)環(huán)境中非常有效。當(dāng)處理有噪聲的傳感器測(cè)量時(shí),[27]采用了一種有趣的方法,該方法提出了模糊感知魯棒ASLAM(ARAS),該方法利用基于有噪聲或傳感器信息不足的多假設(shè)狀態(tài)和地圖估計(jì)。該方法使用局部輪廓進(jìn)行有效的多假設(shè)路徑規(guī)劃,并結(jié)合回環(huán)閉合。

機(jī)器人軌跡優(yōu)化

[13]中提出的方法將A-SLAM與Ekman的探索算法[53]集成在一起,通過(guò)僅利用出現(xiàn)回環(huán)閉合的全局航路點(diǎn)來(lái)優(yōu)化機(jī)器人軌跡,然后將探索取消標(biāo)準(zhǔn)發(fā)送到SLAM后端(基于ES-DSF信息濾波[52])。探測(cè)取消標(biāo)準(zhǔn)取決于來(lái)自濾波器的信息增益的大小、回環(huán)閉合檢測(cè)以及沒(méi)有更新的狀態(tài)的數(shù)量。如果滿足這些標(biāo)準(zhǔn),則A-SLAM發(fā)送探測(cè)算法停止并引導(dǎo)機(jī)器人閉合回路。必須注意,在這種方法中,A-SLAM與由信息濾波管理的路線規(guī)劃和勘探過(guò)程分離。

最優(yōu)策略選擇

[35]中給出的定義和比較將A-SLAM表述為選擇單個(gè)或多個(gè)策略類型的機(jī)器人軌跡的任務(wù),該任務(wù)最小化目標(biāo)函數(shù),該目標(biāo)函數(shù)包括減少機(jī)器人不確定性、能耗、導(dǎo)航時(shí)間等因素的預(yù)期成本。根據(jù)定義,最優(yōu)性標(biāo)準(zhǔn)量化了機(jī)器人為提高定位精度和導(dǎo)航時(shí)間而采取的行動(dòng)的改進(jìn)。對(duì)D最優(yōu)性(與協(xié)方差矩陣的行列式成比例)、A最優(yōu)性(和協(xié)方差矩陣的軌跡成比例)和關(guān)節(jié)熵進(jìn)行了比較,并得出結(jié)論,D最優(yōu)性準(zhǔn)則更適合于提供與A最優(yōu)性相反的關(guān)于機(jī)器人不確定性的有用信息。[36]中的通過(guò)數(shù)值證明,通過(guò)使用微分表示來(lái)傳播空間不確定性,所有最優(yōu)性標(biāo)準(zhǔn)A-opt、D-opt和E-opt(協(xié)方差矩陣的最大特征值)都保持了單調(diào)性。在僅使用單位四元數(shù)的絕對(duì)表示中,單調(diào)性僅在D最優(yōu)性和香農(nóng)熵中保持。在類似的比較中,[37]中提出的工作得出結(jié)論,A-Opt和E-Opt標(biāo)準(zhǔn)在航位推算場(chǎng)景中不具有單調(diào)性。通過(guò)對(duì)差動(dòng)驅(qū)動(dòng)機(jī)器人的仿真證明,在線性里程法下,D-opt準(zhǔn)則保持單調(diào)性。

基于動(dòng)態(tài)的方法

與使用傳統(tǒng)的路徑規(guī)劃器(如A*、D*和RRT)不同,這些方法將A-SLAM表述為一個(gè)問(wèn)題,即選擇一系列控制輸入以生成無(wú)碰撞軌跡并覆蓋盡可能多的區(qū)域,同時(shí)最小化狀態(tài)估計(jì)的不確定性,從而改善環(huán)境的定位和建圖。規(guī)劃和行動(dòng)空間現(xiàn)在是連續(xù)的(與基于幾何的方法中的離散相反),并計(jì)算局部最優(yōu)軌跡。對(duì)于最佳目標(biāo)位置的選擇,使用基于幾何的方法中使用的類似方法,但現(xiàn)在使用機(jī)器人模型、潛在信息場(chǎng)和控制理論計(jì)算未來(lái)候選軌跡。線性二次調(diào)節(jié)器(LQR)、模型預(yù)測(cè)控制(MPC)[59]、馬爾可夫決策過(guò)程[60]或強(qiáng)化學(xué)習(xí)(RL)[58]用于通過(guò)矩陣來(lái)選擇最優(yōu)的未來(lái)軌跡/軌跡集,該矩陣平衡探索新區(qū)域和利用已訪問(wèn)區(qū)域進(jìn)行回環(huán)閉合的需求。

[26]使用的方法使用路徑規(guī)劃器中的強(qiáng)化學(xué)習(xí),通過(guò)結(jié)合3D控制器來(lái)獲取車輛模型。3D控制器可以簡(jiǎn)化為用于向前和向后運(yùn)動(dòng)的一個(gè)2D控制器和用于路徑規(guī)劃的一個(gè)1D控制器,其具有最大化地圖可靠性和勘探區(qū)的目標(biāo)函數(shù)。因此,計(jì)劃者有一個(gè)目標(biāo)函數(shù),使用“從經(jīng)驗(yàn)中學(xué)習(xí)方法”最大化每個(gè)狀態(tài)-動(dòng)作對(duì)的累積獎(jiǎng)勵(lì)。通過(guò)仿真表明,非完整車輛學(xué)習(xí)了虛擬墻壁跟隨行為。[42]中提出的類似方法使用全卷積殘差網(wǎng)絡(luò)來(lái)識(shí)別獲取深度圖像的障礙。路徑規(guī)劃算法基于深度強(qiáng)化學(xué)習(xí)算法(DRL)。

[19]提出了一種主動(dòng)定位解決方案,其中在位置跟蹤問(wèn)題中僅控制機(jī)器人的旋轉(zhuǎn)運(yùn)動(dòng)。自適應(yīng)蒙特卡羅定位(AMCL)粒子云被用作輸入,機(jī)器人控制命令被發(fā)送到其傳感器作為輸出。所提出的解決方案涉及點(diǎn)云的光譜聚類,從每個(gè)粒子簇構(gòu)建復(fù)合圖,并選擇信息量最大的單元。當(dāng)機(jī)器人在其不確定性估計(jì)中具有多個(gè)集群時(shí),觸發(fā)主動(dòng)定位。未來(lái)的改進(jìn)包括更多用于有效假設(shè)估計(jì)的單元,并將此方法集成到SLAM前端。在一個(gè)有趣的方法中,通過(guò)[48]控制仿生眼睛的掃視運(yùn)動(dòng)(注視中心在視野內(nèi)的快速移動(dòng))。為了利用環(huán)境中的更多特征,引入了受人類視覺(jué)系統(tǒng)啟發(fā)的自主控制策略。A-SLAM系統(tǒng)包括兩個(gè)線程(并行進(jìn)程)、一個(gè)控制線程和一個(gè)跟蹤線程??刂凭€程控制仿生眼睛運(yùn)動(dòng)到特征豐富的位置,而跟蹤線程通過(guò)選擇特征豐富(ORB特征)關(guān)鍵幀來(lái)跟蹤眼睛運(yùn)動(dòng)。

基于幾何和動(dòng)態(tài)的方法

這些方法使用前文提到的基于幾何和動(dòng)態(tài)的方法,結(jié)合了基于前沿的探索、信息理論和模型預(yù)測(cè)控制(MPC)來(lái)解決A-SLAM問(wèn)題。

在[15]中使用的方法提出了一種開(kāi)源的多層A-SLAM方法,其中第一層選擇信息性(基于Shanon熵[62]的效用標(biāo)準(zhǔn))目標(biāo)位置(邊界點(diǎn))并生成到這些位置的路徑,而第二層和第三層基于更新的占用網(wǎng)格圖主動(dòng)重新規(guī)劃路徑。非線性MPC[63]應(yīng)用于局部路徑執(zhí)行,目標(biāo)函數(shù)基于最小化到目標(biāo)的距離、控制到附近障礙物的努力和成本。這種方法的一個(gè)問(wèn)題是,有時(shí)機(jī)器人會(huì)停止并開(kāi)始局部路徑的重新規(guī)劃階段。未來(lái)的工作包括增加動(dòng)態(tài)障礙物和使用空中機(jī)器人。

而[23]和[29]中提到的一種有趣的方法提出了一種基于模型預(yù)測(cè)控制(MPC)的解決方案,以解決A-SLAM中的區(qū)域覆蓋和不確定性降低。建立了MPC控制切換機(jī)制,并將SLAM不確定性降低作為圖拓?fù)鋯?wèn)題處理,并將其規(guī)劃為約束非線性最小二乘問(wèn)題。利用凸松弛,通過(guò)凸優(yōu)化方法降低SLAM的不確定性。區(qū)域覆蓋任務(wù)通過(guò)順序二次規(guī)劃方法解決,線性SLAM用于子地圖連接。

A-SLAM的統(tǒng)計(jì)分析

表1總結(jié)了A-SLAM中使用的傳感器類型和描述。還描述了SLAM方法、路徑規(guī)劃方法和出版年份。在該表中可以得出結(jié)論,在大多數(shù)A-SLAM方法中:

i)RGB和激光雷達(dá)傳感器被用作提取點(diǎn)云和圖像特征/對(duì)應(yīng)關(guān)系的主要輸入數(shù)據(jù)源;

ii)涉及姿態(tài)圖或基于圖的SLAM方法;

iii)使用基于圖搜索的路徑規(guī)劃算法。

表2詳細(xì)說(shuō)明了A-SLAM中使用的機(jī)器人及其各自的描述。還介紹了A-SLAM的數(shù)據(jù)集、(ROS)兼容性和回環(huán)閉合。這些信息可以概括為

-i)地面機(jī)器人被廣泛使用;

ii)50%的方法中采用了回環(huán)閉合;

iii)大多數(shù)方法中僅使用了30%的ROS。

在圖3中,描述了每年A-SLAM文章的選擇和ROS的使用[128]。可以觀察到,近57%的A-SLAM文章來(lái)自過(guò)去四年。雖然ROS是機(jī)器人的流行環(huán)境,但它僅部署在30%的A-SLAM解決方案中。

從圖4中可以推斷,自2021年以來(lái),在A-SLAM實(shí)驗(yàn)中,真實(shí)機(jī)器人的使用量有所增加。在圖5和圖6中,可以得出結(jié)論,模擬和分析結(jié)果的使用逐年增加。

主動(dòng)寫(xiě)作SLAM(AC-SLAM)

在AC-SLAM中,多個(gè)機(jī)器人在主動(dòng)執(zhí)行SLAM的同時(shí)進(jìn)行協(xié)作。前文中提到的A-SLAM中使用的基于數(shù)據(jù)驅(qū)動(dòng)、信息理論和控制理論的方法也適用于AC-SLAM,同時(shí)還存在管理機(jī)器人之間的(通信)和魯棒參數(shù)交換的額外限制。這種協(xié)作可以包括交換參數(shù)、定位信息以及同質(zhì)或異質(zhì)機(jī)器人組之間的傳感器數(shù)據(jù)。除了這些參數(shù)之外,AC-SLAM參數(shù)還可以包括

a)如在[66]和[85]中提出的,合并通過(guò)添加未來(lái)機(jī)器人路徑而引起的多機(jī)器人約束,同時(shí)最小化最優(yōu)控制函數(shù)(其考慮了未來(lái)的步驟和觀察);

b)與[71]中描述的機(jī)器人的探索和重新定位(在預(yù)定義的會(huì)合位置收集)階段相關(guān)的參數(shù);

c)在[80]中使用的3D建圖信息(OctoMap);

d)路徑和地圖熵信息。如[81]中所用,以及如[82]中所述的相對(duì)熵。

AC-SLAM的網(wǎng)絡(luò)拓?fù)?/p>

網(wǎng)絡(luò)拓?fù)涿枋隽瞬煌瑱C(jī)器人之間以及與中央計(jì)算機(jī)/服務(wù)器之間如何通信和交換數(shù)據(jù)。這種通信策略可以是集中的、分散的或混合的。在在[65–67,82,83,85,86]中提出的集中式(通信網(wǎng)絡(luò))中,中央服務(wù)器/代理負(fù)責(zé)管理通信和高級(jí)計(jì)算任務(wù),而在[70,71,74,75,78,81,84]中描述的分布式網(wǎng)絡(luò)中,每個(gè)機(jī)器人管理通信并單獨(dú)計(jì)算其AC-SLAM參數(shù)。[72]中討論的混合網(wǎng)絡(luò)使用集中式和分散式方法。由于網(wǎng)絡(luò)拓?fù)洳皇潜疚牡闹饕黝},我們將對(duì)其進(jìn)行進(jìn)一步討論,并將重點(diǎn)放在AC-SLAM應(yīng)用的場(chǎng)景和應(yīng)用領(lǐng)域。典型的應(yīng)用場(chǎng)景包括協(xié)作任務(wù)分配、探索和開(kāi)發(fā)(重新訪問(wèn)已探索的區(qū)域以實(shí)現(xiàn)閉環(huán))、協(xié)作軌跡規(guī)劃/軌跡優(yōu)化以及協(xié)作定位。

協(xié)作定位

在這些方法中,機(jī)器人在自定位和其他機(jī)器人定位之間切換其狀態(tài)(任務(wù))。在[67]中提出的方法提出了一種新的集中式AC-SLAM方法,其中使用基于深度強(qiáng)化學(xué)習(xí)的任務(wù)分配算法來(lái)輔助代理完成相關(guān)觀察任務(wù)。每個(gè)代理可以選擇執(zhí)行其獨(dú)立的ORB-SLAM[127]或定位其他代理。獨(dú)特的觀測(cè)函數(shù)基于ORB-SLAM導(dǎo)出,由地圖點(diǎn)、關(guān)鍵幀和回環(huán)閉合檢測(cè)組件組成。機(jī)器人狀態(tài)之間的轉(zhuǎn)換誤差用于測(cè)量損失函數(shù)。為了學(xué)習(xí)Q值和狀態(tài)-動(dòng)作對(duì)之間的對(duì)應(yīng)關(guān)系,部署了一種新的多Agent系統(tǒng)深度Q網(wǎng)絡(luò)(MAS-DQN)。該方法的大量相關(guān)計(jì)算成本缺乏實(shí)時(shí)應(yīng)用,因此未來(lái)提出了一種分布式學(xué)習(xí)方法。

[85]中描述的方法將多機(jī)器人信念空間跨越問(wèn)題定義為機(jī)器人協(xié)作問(wèn)題,以減少狀態(tài)估計(jì)中的不確定性。機(jī)器人信念被測(cè)量為其狀態(tài)在整個(gè)組和映射環(huán)境中的概率分布。所提出的主動(dòng)定位方法可以使用未來(lái)路徑點(diǎn)的最大后驗(yàn)概率(MAP)估計(jì)來(lái)指導(dǎo)每個(gè)機(jī)器人,以通過(guò)在多機(jī)器人AC-SLAM框架中重新觀察僅由其他機(jī)器人觀察到的區(qū)域來(lái)減少其不確定性。在一個(gè)有趣的方法中,[83]中提出的方法使用了多個(gè)人形機(jī)器人多機(jī)器人系統(tǒng)(M(RS))SLAM,其中每個(gè)機(jī)器人有兩種獨(dú)立和協(xié)作的工作模式。每個(gè)機(jī)器人有兩個(gè)線程同時(shí)運(yùn)行:a)運(yùn)動(dòng)線程和b)聽(tīng)線程。在運(yùn)動(dòng)線程期間,它將通過(guò)組織者(中央服務(wù)器)使用D*路徑規(guī)劃器和基于強(qiáng)化學(xué)習(xí)(RL)和貪婪算法的控制策略計(jì)算的軌跡來(lái)導(dǎo)航環(huán)境。它還定期向組織者上傳位姿。在聽(tīng)線程期間,它將從組織者(通過(guò)ORB-SLAM)接收其更新的姿態(tài),并可能接收命令以幫助附近的其他機(jī)器人改進(jìn)其定位(鏈?zhǔn)蕉ㄎ唬?/p>

勘探和開(kāi)發(fā)任務(wù)

如A-SLAM前面所述,我們需要平衡勘探(最大化勘探區(qū)域)和開(kāi)采(重新訪問(wèn)已勘探區(qū)域以閉合環(huán)路)的需求。在AC-SLAM中,還可以通過(guò)將機(jī)器人移動(dòng)到另一個(gè)具有較少定位不確定性的機(jī)器人來(lái)實(shí)現(xiàn)開(kāi)發(fā)。在[79]中將集中式AS-SLAM探測(cè)問(wèn)題(使用基于邊界的探測(cè))描述為效率優(yōu)化問(wèn)題,其中信息增益和定位效率最大化,而導(dǎo)航成本受到懲罰。對(duì)于重新定位(開(kāi)發(fā))階段,導(dǎo)出了一個(gè)函數(shù),其中每個(gè)機(jī)器人被引導(dǎo)到一個(gè)已知的地標(biāo)或另一個(gè)具有較少定位不確定性的機(jī)器人。定義了一個(gè)自適應(yīng)的閾值標(biāo)準(zhǔn),如果機(jī)器人陷入困境,該標(biāo)準(zhǔn)可由機(jī)器人調(diào)整以逃避探索和開(kāi)發(fā)循環(huán)。為了管理有限的通信帶寬(由于集中式架構(gòu)),提出了一種會(huì)合方法,該方法在機(jī)器人超出通信范圍時(shí)將機(jī)器人重新定位到預(yù)定位置。提出的未來(lái)工作涉及使用分布式控制方案。

[126]中描述的方法在拓?fù)鋷缀慰臻g(由原始幾何形狀表示的環(huán)境)中表述問(wèn)題。最初,機(jī)器人被分配目標(biāo)位置,探索基于frontier方法,并利用切換成本函數(shù),該函數(shù)考慮到群的另一成員對(duì)機(jī)器人目標(biāo)區(qū)域的發(fā)現(xiàn)。當(dāng)目標(biāo)位于機(jī)器人不相交的探索子空間內(nèi)時(shí),成本函數(shù)從邊界轉(zhuǎn)換為基于測(cè)地線(距離)的導(dǎo)航函數(shù)。

軌跡規(guī)劃

在這些方法中,路徑熵被優(yōu)化以選擇AC-SLAM的信息量最大的路徑,并集體規(guī)劃軌跡,以減少定位和地圖的不確定性。在[81]中制定的方法中,該研究提出了一種分散的AC-SLAM方法,用于勘探行動(dòng)的長(zhǎng)期規(guī)劃,并將估計(jì)不確定性保持在一定閾值。主動(dòng)路徑規(guī)劃器使用RRT*的修改版本,其中a)由于使用了非完整機(jī)器人,所以過(guò)濾掉了不可信的節(jié)點(diǎn),b)選擇了最佳地最小化每行進(jìn)距離的熵變化的動(dòng)作。熵估計(jì)作為兩個(gè)階段進(jìn)行。首先,使用平方根信息濾波器(SRIF)更新計(jì)算短視野中的熵,并考慮機(jī)器人路徑中環(huán)路閉合的減少來(lái)計(jì)算短視野的熵。這種方法的主要優(yōu)點(diǎn)是它保持了良好的姿態(tài)估計(jì),并鼓勵(lì)環(huán)路閉合軌跡。通過(guò)與[82]提出的方法類似的方法,使用相對(duì)熵(RE)優(yōu)化方法給出了一個(gè)有趣的解決方案,該方法將運(yùn)動(dòng)規(guī)劃與機(jī)器人定位相結(jié)合,并選擇最小化定位誤差和相關(guān)不確定性界限的軌跡。計(jì)算了一個(gè)規(guī)劃成本函數(shù),其中除了狀態(tài)和控制成本之外,還包括狀態(tài)中的不確定性(EKF狀態(tài)估計(jì)器的協(xié)方差矩陣的軌跡)。在一種有趣且計(jì)算成本較低的方法中,[73]中的使用基于支持向量機(jī)(SVM)的走廊生成和基于Bezier曲線的連續(xù)細(xì)化,以及D最優(yōu)準(zhǔn)則,共同規(guī)劃軌跡,以減少基于偏序圖的SLAM中的姿態(tài)不確定性。為了降低目標(biāo)機(jī)器人的姿態(tài)不確定性,定義了一種出價(jià)策略,該策略基于最小計(jì)算成本、可行軌跡和資源友好準(zhǔn)則來(lái)選擇獲勝機(jī)器人。

AC-SLAM的統(tǒng)計(jì)分析

表3總結(jié)了主動(dòng)協(xié)作SLAM中使用的傳感器類型和描述。SLAM方法和路徑規(guī)劃方法也與出版年份一起介紹??梢缘贸鼋Y(jié)論,大多數(shù)主動(dòng)和協(xié)作的SLAM文章使用

i)RGB、激光雷達(dá)和IMU傳感器數(shù)據(jù)作為輸入;

ii)姿態(tài)圖和EKFSLAM是主要使用的方法;

iii)基于概率路線圖的方法用于路徑規(guī)劃。

表4詳細(xì)說(shuō)明了分析、模擬和真實(shí)機(jī)器人實(shí)驗(yàn)以及環(huán)境類型、協(xié)作架構(gòu)、協(xié)作參數(shù)、回環(huán)閉合和ROS框架。信息可以概括為

i)大多數(shù)文章提供了基于分析和模擬的結(jié)果,以及最多四個(gè)機(jī)器人的多機(jī)器人協(xié)作;

ii)使用了集中式和分散式協(xié)作架構(gòu);

iii)鼓勵(lì)閉環(huán),但ROS的使用受到限制。

4討論和展望

論文重點(diǎn)介紹了A-SLAM和AC-SLAM方法及其在選定研究文章中的實(shí)現(xiàn)和方法應(yīng)用。除了前面章節(jié)中介紹的定性和定量分析外,我們希望在以下章節(jié)中介紹A-SLAM問(wèn)題的局限性和未來(lái)的研究領(lǐng)域。

當(dāng)前方法的局限性

通用限制

這些限制可以被視為A-SLAM研究中持續(xù)存在的開(kāi)放問(wèn)題,可以進(jìn)一步解釋為:

停止標(biāo)準(zhǔn):由于A-SLAM在計(jì)算上很昂貴,可以討論[4]所討論的停止標(biāo)準(zhǔn),即何時(shí)停止勘探任務(wù)并切換到其他任務(wù)(如重新訪問(wèn)已勘探區(qū)域)的決定

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論