深度解讀A-SLAM和AC-SLAM的實(shí)現(xiàn)和方法應(yīng)用

上傳人：學(xué)*** IP屬地：廣東上傳時(shí)間：2023-09-23 格式：DOCX 頁(yè)數(shù)：30 大小：110.43KB 積分：15 舉報(bào) 版權(quán)申訴

深度解讀A-SLAM和AC-SLAM的實(shí)現(xiàn)和方法應(yīng)用_第2頁(yè)

深度解讀A-SLAM和AC-SLAM的實(shí)現(xiàn)和方法應(yīng)用_第3頁(yè)

深度解讀A-SLAM和AC-SLAM的實(shí)現(xiàn)和方法應(yīng)用_第4頁(yè)

深度解讀A-SLAM和AC-SLAM的實(shí)現(xiàn)和方法應(yīng)用_第5頁(yè)

已閱讀5頁(yè)，還剩25頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶(hù)提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

Word深度解讀A-SLAM和AC-SLAM的實(shí)現(xiàn)和方法應(yīng)用本文對(duì)過(guò)去十年中進(jìn)行的主動(dòng)SLAM（A-SLAM）研究進(jìn)行了新的回顧。論文討論了基于信息理論的方法在A(yíng)-SLAM中用于軌跡生成和控制動(dòng)作選擇的公式、應(yīng)用和方法。本文廣泛的定性和定量分析強(qiáng)調(diào)了A-SLAM研究的方法、場(chǎng)景、配置、（機(jī)器人）類(lèi)型、（傳感器）類(lèi)型、數(shù)據(jù)集使用和路徑規(guī)劃方法。最后，論文提出了局限性并提出了未來(lái)研究的可能性。論文認(rèn)為這項(xiàng)調(diào)查將有助于研究人員了解應(yīng)用于A(yíng)-SLAM的各種方法和技術(shù)。

2介紹

SLAM是一組方法，其中機(jī)器人自主定位并在導(dǎo)航時(shí)同時(shí)建圖環(huán)境。它可以細(xì)分為解決定位和建圖。定位是一個(gè)估計(jì)機(jī)器人在地圖上的姿態(tài)的問(wèn)題，而地圖則是借助于車(chē)輛上的視覺(jué)、視覺(jué)慣性和激光傳感器來(lái)重建環(huán)境。前端處理感知任務(wù)，這涉及實(shí)現(xiàn)（信號(hào)）處理和（計(jì)算機(jī)視覺(jué)）領(lǐng)域的方法，以計(jì)算機(jī)器人環(huán)境和觀(guān)察到的特征之間的估計(jì)相對(duì)局部姿態(tài)。SLAM后端使用優(yōu)化理論、圖論和概率論來(lái)估計(jì)全局地圖和軌跡。關(guān)于SLAM方法的詳細(xì)綜述，可以參考[1]、[2]、[3]、[5]。

大多數(shù)SLAM（算法）是被動(dòng)的，其中機(jī)器人被手動(dòng)控制或朝向預(yù)定義的路線(xiàn)點(diǎn)行進(jìn)，并且導(dǎo)航或路徑規(guī)劃算法不主動(dòng)參與機(jī)器人的運(yùn)動(dòng)或軌跡。然而，A-SLAM試圖通過(guò)提出一種導(dǎo)航策略來(lái)解決未知環(huán)境的最優(yōu)探索問(wèn)題，該導(dǎo)航策略生成未來(lái)目標(biāo)/對(duì)象位置動(dòng)作，這些動(dòng)作減少了在地圖和姿態(tài)中的不確定性，從而實(shí)現(xiàn)完全自主的導(dǎo)航和測(cè)繪SLAM系統(tǒng)。論文將在其指定的第2節(jié)中進(jìn)一步了解A-SLAM。在主動(dòng)協(xié)作SLAM（AC-SLAM）中，多個(gè)機(jī)器人在執(zhí)行SLAM時(shí)主動(dòng)協(xié)作。A-SLAM和AC-SLAM的應(yīng)用領(lǐng)域包括搜索和救援[17]、行星觀(guān)測(cè)[12]、精準(zhǔn)農(nóng)業(yè)[23]、擁擠環(huán)境中的自主導(dǎo)航[34]、水下探索[30][40][44]、（人工智能）[42]、輔助機(jī)器人[74]和自主探索[126]。

A-SLAM上算法的第一個(gè)實(shí)現(xiàn)可以追溯到[9]，但最初的名稱(chēng)是在[10]中起草的。然而，A-SLAM及其根源可以從人工智能和機(jī)器人探索技術(shù)創(chuàng)造的想法進(jìn)一步追溯到20世紀(jì)80年代[11]。在過(guò)去十年中，還沒(méi)有對(duì)A-SLAM進(jìn)行過(guò)綜述調(diào)查。2021年只有一篇文章在其評(píng)論文章[4]中討論了A-SLAM。在本文中，A-SLAM并不是研究的重點(diǎn)，相反，從整體上看了SLAM的整個(gè)主題。之所以在這里提到它，是因?yàn)槲覀兾恼轮羞M(jìn)行的研究集中在主動(dòng)和A-SLAM上。

本文的優(yōu)勢(shì)不僅包括討論A-SLAM的內(nèi)部組成部分，還包括其應(yīng)用領(lǐng)域、局限性和未來(lái)前景，以及對(duì)過(guò)去十年A-SLAM進(jìn)行全面的統(tǒng)計(jì)調(diào)查。

3主動(dòng)SLAM簡(jiǎn)介

如前所述，SLAM是一個(gè)機(jī)器人建圖其環(huán)境并將其自身定位到該環(huán)境的過(guò)程。A-SLAM負(fù)責(zé)設(shè)計(jì)機(jī)器人軌跡，以最小化其地圖表示和定位的不確定性。其目的是在沒(méi)有外部控制器或人力的情況下執(zhí)行自主導(dǎo)航和環(huán)境探索。參考圖1，可以觀(guān)察到，在典型的SLAM系統(tǒng)中，來(lái)自傳感器（通常為激光雷達(dá)、相機(jī)和IMU）的數(shù)據(jù)由前端模塊處理，前端模塊計(jì)算特征提取、數(shù)據(jù)關(guān)聯(lián)、特征分類(lèi)、迭代最近點(diǎn)（ICP）和回環(huán)閉合。ICP是一種迭代方法，它計(jì)算優(yōu)化/對(duì)齊數(shù)據(jù)點(diǎn)/特征的轉(zhuǎn)換，并用于掃描匹配方法中以建圖環(huán)境。后端模塊負(fù)責(zé)涉及束調(diào)整（B.A）、位姿圖優(yōu)化和地圖估計(jì)的高計(jì)算任務(wù)。后端模塊輸出機(jī)器人的全局地圖和姿態(tài)估計(jì)。A-SLAM可以被稱(chēng)為SLAM系統(tǒng)的附加模塊或超集合，其結(jié)合了路線(xiàn)點(diǎn)和軌跡規(guī)劃，以及使用信息理論、控制理論和強(qiáng)化學(xué)習(xí)（RL）方法的控制模塊，以自主引導(dǎo)機(jī)器人實(shí)現(xiàn)其目標(biāo)。

在SLAM中，環(huán)境探索（以更好地了解環(huán)境）和開(kāi)發(fā)（以重新訪(fǎng)問(wèn)已穿過(guò)的區(qū)域以進(jìn)行回環(huán)閉合）被最大化，以獲得更好的地圖估計(jì)和定位。因此必須在勘探和開(kāi)發(fā)之間進(jìn)行權(quán)衡，因?yàn)榍罢咭笞畲笙薅鹊馗采w環(huán)境，而后者要求機(jī)器人重新訪(fǎng)問(wèn)先前勘探的區(qū)域。這兩個(gè)任務(wù)可能不總是同時(shí)應(yīng)用于機(jī)器人以執(zhí)行自主導(dǎo)航。機(jī)器人可能必須通過(guò)在這兩個(gè)任務(wù)之間切換來(lái)解決探索開(kāi)發(fā)困境。

A-SLAM公式

A-SLAM是在機(jī)器人必須在部分可觀(guān)察/未知環(huán)境中導(dǎo)航的場(chǎng)景中制定的，該場(chǎng)景通過(guò)在存在噪聲傳感器測(cè)量的情況下選擇一系列未來(lái)動(dòng)作來(lái)減少其狀態(tài)和地圖相對(duì)于環(huán)境的不確定性。這樣的場(chǎng)景可以被建模為[6]中討論的部分可觀(guān)測(cè)馬爾可夫決策過(guò)程（POMDP）的實(shí)例。POMDP定義為7元組。X表示機(jī)器人狀態(tài)空間，A表示動(dòng)作空間，O表示觀(guān)測(cè)，T是狀態(tài)轉(zhuǎn)移函數(shù)，說(shuō)明感知不確定性，是與在狀態(tài)x中采取的行動(dòng)相關(guān)的獎(jiǎng)勵(lì)，考慮了折扣系數(shù)，即使計(jì)劃任務(wù)具有無(wú)限的范圍，也能確保有限的回報(bào)。T和都可以使用條件概率表示為等式1和2。

機(jī)器人的目標(biāo)是選擇使每個(gè)狀態(tài)-動(dòng)作對(duì)的相關(guān)預(yù)期回報(bào)最大化的最優(yōu)策略，并且可以將其建模為等式3：

盡管A-SLAM的POMDP公式是最廣泛使用的方法，但由于它考慮了不確定性下的規(guī)劃和決策，因此它被認(rèn)為是計(jì)算昂貴的。為了計(jì)算方便，A-SLAM公式分為三個(gè)主要子模塊，它們識(shí)別潛在的目標(biāo)位置/路點(diǎn)，計(jì)算到達(dá)它們的成本，然后根據(jù)效用標(biāo)準(zhǔn)選擇行動(dòng)，從而減少地圖的不確定性并增加機(jī)器人的定位。

主動(dòng)SLAM的組成

為了處理A-SLAM的計(jì)算復(fù)雜性，它被分為三個(gè)主要子模塊，如圖2所示。機(jī)器人最初在地圖的當(dāng)前估計(jì)中確定要探索或利用的潛在目標(biāo)位置。地圖表示機(jī)器人使用其機(jī)載傳感器感知的環(huán)境，可分為

1）拓?fù)涞貓D：使用環(huán)境的圖形表示并提供簡(jiǎn)化的拓?fù)浔硎?/p>

2）度量地圖：以稀疏的信息點(diǎn)（地標(biāo)）集合或環(huán)境的完整3D表示的形式提供環(huán)境信息（點(diǎn)云）

3）語(yǔ)義地圖：僅向機(jī)器人提供有關(guān)環(huán)境目標(biāo)（如靜態(tài)障礙物）的分段信息。感興趣的讀者可參考[1,4]，詳細(xì)討論建圖方法。

一旦機(jī)器人使用上述任何方法獲得了其環(huán)境的地圖，它就會(huì)搜索潛在的目標(biāo)/對(duì)象位置進(jìn)行探索。最廣泛使用的方法之一是[7]最初使用的基于邊界的勘探，其中邊界是已知和未知地圖位置之間的邊界。使用基于邊界的探索具有覆蓋所有環(huán)境的優(yōu)點(diǎn)，但缺點(diǎn)是不執(zhí)行影響機(jī)器人地圖估計(jì)的開(kāi)發(fā)任務(wù)（重新訪(fǎng)問(wèn)已訪(fǎng)問(wèn)的區(qū)域以回環(huán)）。

一旦目標(biāo)位置被識(shí)別，下一步是基于從根據(jù)等式3的所有可能動(dòng)作的集合中選擇的最佳動(dòng)作的一些獎(jiǎng)勵(lì)值來(lái)計(jì)算該位置的成本或效用函數(shù)。理想情況下，該效用函數(shù)應(yīng)考慮地圖和機(jī)器人姿態(tài)的全關(guān)節(jié)概率分布，但該方法計(jì)算成本較高。由于我們對(duì)機(jī)器人和地圖都有概率估計(jì)，因此可以將它們視為隨機(jī)變量，并在其估計(jì)中具有相關(guān)的不確定性。量化和表示這種不確定性最常用的兩種方法是信息理論（IT）和最佳實(shí)驗(yàn)設(shè)計(jì)理論（TOED）[64]，信息理論最初由Shannon于1949年提出。在IT中，熵度量與隨機(jī)變量或隨機(jī)量相關(guān)的不確定性。更高的熵導(dǎo)致更少的信息增益，反之亦然。將隨機(jī)變量X定義為，如等式4所示。目標(biāo)是減少機(jī)器人姿態(tài)和地圖估計(jì)之間的熵，如在[8]中所闡述的。

相對(duì)熵也可以用作一個(gè)效用函數(shù)，它測(cè)量概率分布的形式及其與平均值的偏差。該相對(duì)熵被測(cè)量為KL散度。概率空間X上兩個(gè)離散分布A和B的KLD可以定義為方程5：

在A(yíng)-SLAM中，如果考慮信息驅(qū)動(dòng)的效用函數(shù)，那么熵或KLD可以用作網(wǎng)格圖（占用網(wǎng)格圖）中目標(biāo)二進(jìn)制概率的度量。或者，如果我們考慮任務(wù)驅(qū)動(dòng)效用函數(shù)并假設(shè)高斯分布，那么可以嘗試使用TOED來(lái)量化任務(wù)空間中的不確定性。在TOED中，A-SLAM的一組動(dòng)作的優(yōu)先級(jí)基于關(guān)節(jié)后部的協(xié)方差量。協(xié)方差越小，動(dòng)作集的權(quán)重越高。為了比較候選行動(dòng)集的矩陣，已經(jīng)為協(xié)方差矩陣定義了稱(chēng)為“最優(yōu)性準(zhǔn)則”的不同函數(shù)，其本征值為

1）A最優(yōu)性，其處理平均方差的最小化，如等式6所示；

2）D最優(yōu)性，處理捕獲全協(xié)方差矩陣，并在等式7中定義；

3）E最優(yōu)性，意圖最小化最大本征值，并在等式8中表示。

TOED方法要求將機(jī)器人姿態(tài)和地圖不確定性都表示為協(xié)方差矩陣，并且可能計(jì)算昂貴，特別是在基于地標(biāo)的SLAM中，當(dāng)發(fā)現(xiàn)新地標(biāo)時(shí)，其大小會(huì)增加。因此，基于IT的方法優(yōu)于TOED。

一旦確定了目標(biāo)位置和到達(dá)這些位置的效用/成本，下一步就是執(zhí)行最終將機(jī)器人移動(dòng)/引導(dǎo)到目標(biāo)位置的最佳動(dòng)作。通常采用三種方法：

概率路線(xiàn)圖（PRM）方法表示表示機(jī)器人選擇到達(dá)目標(biāo)位置的可能路徑的（網(wǎng)絡(luò)）圖。這些方法以啟發(fā)式的方式工作，可能不會(huì)給出最佳路徑，此外，機(jī)器人模型未納入規(guī)劃階段，這可能會(huì)導(dǎo)致意外移動(dòng)。RRT[51]、D*[50]和A*[57]是廣泛使用的PRM方法。論文將這些方法確定為基于幾何的方法；

線(xiàn)性二次調(diào)節(jié)器（LQR）和模型預(yù)測(cè)控制（MPC）等最優(yōu)控制方法用于在線(xiàn)或離線(xiàn)規(guī)劃控制路徑，同時(shí)考慮與控制努力和機(jī)器人狀態(tài)隨時(shí)間演變相關(guān)的成本；

深度強(qiáng)化學(xué)習(xí)（DRL）方法通過(guò)最大化機(jī)器人軌跡演化過(guò)程中每個(gè)狀態(tài)動(dòng)作對(duì)獲得的獎(jiǎng)勵(lì)來(lái)工作。

如前幾節(jié)所述，使用IT和TOED對(duì)選擇合適的路點(diǎn)候選進(jìn)行加權(quán)。在這些方法中，地圖和機(jī)器人路徑之間的信息增益或熵最小化指導(dǎo)了選擇這些未來(lái)候選路線(xiàn)的決策。為了生成這些未來(lái)候選路線(xiàn)的軌跡或一組動(dòng)作，采用了兩種主要方法，分別是幾何和動(dòng)態(tài)方法。這些方法包括使用傳統(tǒng)的路徑規(guī)劃器以及馬爾可夫決策過(guò)程和非線(xiàn)性最優(yōu)控制技術(shù)。

基于幾何的方法

這些方法將A-SLAM描述為機(jī)器人選擇最佳路徑和軌跡的任務(wù)，同時(shí)減少其姿態(tài)和建圖的不確定性，以便高效SLAM在未知環(huán)境中自主導(dǎo)航。利用有限隨機(jī)航路點(diǎn)對(duì)勘探空間進(jìn)行離散化，并利用基于IT和TOED的方法（包括熵、信息增益、不確定性度量減少）部署基于Fron（ti）er的勘探以及傳統(tǒng)路徑規(guī)劃器（如RRT*、D*、A*）。

基于信息理論的方法

[20]的解決了聯(lián)合熵最小化探索問(wèn)題，并提出了RRT*[51]的兩個(gè)修改版本，分別稱(chēng)為dRRT和eRRT。dRRT使用距離，而eRRT使用每行駛距離的熵變化作為成本函數(shù)。人們進(jìn)一步討論了地圖熵與覆蓋率有很強(qiáng)的關(guān)系，路徑熵與地圖質(zhì)量有關(guān)系（因?yàn)楦玫亩ㄎ粫?huì)產(chǎn)生更好的地圖）。因此，行動(dòng)是根據(jù)每行駛距離的聯(lián)合熵變化來(lái)計(jì)算的。（仿真）結(jié)果證明，這兩種方法的組合提供了最佳的路徑規(guī)劃策略。[18]中給出了信息理論方法之間的有趣比較，其中粒子濾波用作A-SLAM的后端，并部署了基于邊界的探索（邊界是訪(fǎng)問(wèn)和未探索區(qū)域之間的邊界）[49]以選擇未來(lái)的候選目標(biāo)位置。下面討論了用于解決勘探問(wèn)題和評(píng)估信息的這三種方法的比較：

關(guān)節(jié)熵：在目標(biāo)處獲得的信息使用機(jī)器人軌跡的熵和每個(gè)粒子攜帶的地圖的熵進(jìn)行評(píng)估，每個(gè)粒子通過(guò)每個(gè)軌跡的重要性權(quán)重進(jìn)行加權(quán)。選擇最佳勘探目標(biāo)，這使聯(lián)合熵減少最大化，因此對(duì)應(yīng)于更高的信息增益；

期望地圖平均值：期望平均值可以定義為粒子集的地圖假設(shè)的數(shù)學(xué)期望值。預(yù)期的地圖平均值可以應(yīng)用于（檢測(cè)）地圖上已經(jīng)遍歷的循環(huán)。由于增益的計(jì)算正在發(fā)展，這種方法的復(fù)雜性增加了；

來(lái)自策略的預(yù)期信息：KL散度[28]用于驅(qū)動(dòng)真實(shí)后驗(yàn)和近似姿態(tài)信念之間的偏差上限。除了粒子濾波的信息一致性之外，該方法還考慮了由于不一致建圖導(dǎo)致的信息丟失。

使用對(duì)各種數(shù)據(jù)集的（模擬）結(jié)果（參考表2）得出的結(jié)論是，這些方法中的大多數(shù)都不能正確解決問(wèn)題的概率方面，并且最有可能失敗，因?yàn)橛?jì)算成本高，地圖網(wǎng)格分辨率依賴(lài)于性能。

在[32]中提出了TFGSLAM，它使用空間i的幾何表示，即勘探空間由原始幾何形狀表示，并計(jì)算地圖特征的熵減少。它使用基于拉普拉斯近似的熵度量，并計(jì)算勘探和開(kāi)發(fā)收益的統(tǒng)一量化?；诟怕实缆穲D方法使用基于有效采樣的路徑規(guī)劃器，該方法具有降低控制成本（距離）和目標(biāo)之間的碰撞懲罰的成本函數(shù)。與傳統(tǒng)的柵格地圖邊界勘探相比，模擬結(jié)果顯示位置、方向和勘探誤差顯著減少。未來(lái)的改進(jìn)包括擴(kuò)展到主動(dòng)的VisualSLAM框架。

當(dāng)考慮拓?fù)渚仃噲D和計(jì)算成本較低的解決方案時(shí)，可以參考[45]所采用的方法，該方法考慮了一種場(chǎng)景，即有許多先前的拓?fù)渚仃囎訄D，而機(jī)器人不知道其初始位置。提出了一種使用主動(dòng)定位和主動(dòng)建圖的開(kāi)源框架。定義了一種在主動(dòng)定位和建圖之間切換的子圖連接方法。主動(dòng)定位使用最大似然估計(jì)來(lái)計(jì)算運(yùn)動(dòng)策略，這降低了該方法的計(jì)算復(fù)雜性。

基于Frontier的探索

邊界是探索和未探索空間之間的邊界。形式上可以將邊界描述為一組未知點(diǎn)，每個(gè)點(diǎn)至少有一個(gè)已知的空間鄰居。[21]提出的工作制定了一種以粒子（濾波器）SLAM為后端的混合控制切換探索方法。它使用基于邊界的探索方法，A*[57]作為全局規(guī)劃器，動(dòng)態(tài)窗口方法（DWA）反應(yīng)算法作為局部規(guī)劃器。在占用網(wǎng)格圖內(nèi)，分割每個(gè)邊界，為每個(gè)段規(guī)劃軌跡，并從全局成本圖中選擇具有最高地圖段協(xié)方差的軌跡。[34]中介紹的工作涉及多個(gè)地面機(jī)器人的動(dòng)態(tài)環(huán)境，并使用基于圖形的SLAM（iSAM）[61]優(yōu)化作為SLAM后端，使用前沿探索進(jìn)行自主探索。使用基于Dijkstra算法的局部規(guī)劃器。最后，基于Shannon和Renyi熵的效用函數(shù)用于計(jì)算路徑的效用。未來(lái)的工作建議集成攝像頭并使用圖像特征掃描匹配來(lái)避免障礙物。

路徑規(guī)劃優(yōu)化

[30]提出的方法利用了圖形SLAM的圖形模型和稀疏矩陣分解之間的關(guān)系。它提出了變量排序和子樹(shù)捕獲方案，以便于快速計(jì)算由變量之間的信念變化加權(quán)的優(yōu)化候選路徑。地平線(xiàn)選擇標(biāo)準(zhǔn)基于先前的工作，利用擴(kuò)展信息濾波器（EIF）和高斯牛頓（GN）預(yù)測(cè)。提出的解決方案在具有姿態(tài)圖SLAM的懸停自主水下機(jī)器人（HAUV）中實(shí)現(xiàn)。[44]中介紹的工作涉及使用多波束聲納在水下環(huán)境中進(jìn)行類(lèi)似的體積探測(cè)。對(duì)于有效的路徑規(guī)劃，根據(jù)姿態(tài)不確定性和傳感器信息增益來(lái)選擇重新訪(fǎng)問(wèn)動(dòng)作。

[39]中的使用了一種有趣的方法，該方法將路徑規(guī)劃任務(wù)處理為D*[50]，具有負(fù)邊緣權(quán)重，以在定位改變的情況下計(jì)算最短路徑。這種探索方法在具有不斷變化的障礙和定位的動(dòng)態(tài)環(huán)境中非常有效。當(dāng)處理有噪聲的傳感器測(cè)量時(shí)，[27]采用了一種有趣的方法，該方法提出了模糊感知魯棒ASLAM（ARAS），該方法利用基于有噪聲或傳感器信息不足的多假設(shè)狀態(tài)和地圖估計(jì)。該方法使用局部輪廓進(jìn)行有效的多假設(shè)路徑規(guī)劃，并結(jié)合回環(huán)閉合。

機(jī)器人軌跡優(yōu)化

[13]中提出的方法將A-SLAM與Ekman的探索算法[53]集成在一起，通過(guò)僅利用出現(xiàn)回環(huán)閉合的全局航路點(diǎn)來(lái)優(yōu)化機(jī)器人軌跡，然后將探索取消標(biāo)準(zhǔn)發(fā)送到SLAM后端（基于ES-DSF信息濾波[52]）。探測(cè)取消標(biāo)準(zhǔn)取決于來(lái)自濾波器的信息增益的大小、回環(huán)閉合檢測(cè)以及沒(méi)有更新的狀態(tài)的數(shù)量。如果滿(mǎn)足這些標(biāo)準(zhǔn)，則A-SLAM發(fā)送探測(cè)算法停止并引導(dǎo)機(jī)器人閉合回路。必須注意，在這種方法中，A-SLAM與由信息濾波管理的路線(xiàn)規(guī)劃和勘探過(guò)程分離。

最優(yōu)策略選擇

[35]中給出的定義和比較將A-SLAM表述為選擇單個(gè)或多個(gè)策略類(lèi)型的機(jī)器人軌跡的任務(wù)，該任務(wù)最小化目標(biāo)函數(shù)，該目標(biāo)函數(shù)包括減少機(jī)器人不確定性、能耗、導(dǎo)航時(shí)間等因素的預(yù)期成本。根據(jù)定義，最優(yōu)性標(biāo)準(zhǔn)量化了機(jī)器人為提高定位精度和導(dǎo)航時(shí)間而采取的行動(dòng)的改進(jìn)。對(duì)D最優(yōu)性（與協(xié)方差矩陣的行列式成比例）、A最優(yōu)性（和協(xié)方差矩陣的軌跡成比例）和關(guān)節(jié)熵進(jìn)行了比較，并得出結(jié)論，D最優(yōu)性準(zhǔn)則更適合于提供與A最優(yōu)性相反的關(guān)于機(jī)器人不確定性的有用信息。[36]中的通過(guò)數(shù)值證明，通過(guò)使用微分表示來(lái)傳播空間不確定性，所有最優(yōu)性標(biāo)準(zhǔn)A-opt、D-opt和E-opt（協(xié)方差矩陣的最大特征值）都保持了單調(diào)性。在僅使用單位四元數(shù)的絕對(duì)表示中，單調(diào)性?xún)H在D最優(yōu)性和香農(nóng)熵中保持。在類(lèi)似的比較中，[37]中提出的工作得出結(jié)論，A-Opt和E-Opt標(biāo)準(zhǔn)在航位推算場(chǎng)景中不具有單調(diào)性。通過(guò)對(duì)差動(dòng)驅(qū)動(dòng)機(jī)器人的仿真證明，在線(xiàn)性里程法下，D-opt準(zhǔn)則保持單調(diào)性。

基于動(dòng)態(tài)的方法

與使用傳統(tǒng)的路徑規(guī)劃器（如A*、D*和RRT）不同，這些方法將A-SLAM表述為一個(gè)問(wèn)題，即選擇一系列控制輸入以生成無(wú)碰撞軌跡并覆蓋盡可能多的區(qū)域，同時(shí)最小化狀態(tài)估計(jì)的不確定性，從而改善環(huán)境的定位和建圖。規(guī)劃和行動(dòng)空間現(xiàn)在是連續(xù)的（與基于幾何的方法中的離散相反），并計(jì)算局部最優(yōu)軌跡。對(duì)于最佳目標(biāo)位置的選擇，使用基于幾何的方法中使用的類(lèi)似方法，但現(xiàn)在使用機(jī)器人模型、潛在信息場(chǎng)和控制理論計(jì)算未來(lái)候選軌跡。線(xiàn)性二次調(diào)節(jié)器（LQR）、模型預(yù)測(cè)控制（MPC）[59]、馬爾可夫決策過(guò)程[60]或強(qiáng)化學(xué)習(xí)（RL）[58]用于通過(guò)矩陣來(lái)選擇最優(yōu)的未來(lái)軌跡/軌跡集，該矩陣平衡探索新區(qū)域和利用已訪(fǎng)問(wèn)區(qū)域進(jìn)行回環(huán)閉合的需求。

[26]使用的方法使用路徑規(guī)劃器中的強(qiáng)化學(xué)習(xí)，通過(guò)結(jié)合3D控制器來(lái)獲取車(chē)輛模型。3D控制器可以簡(jiǎn)化為用于向前和向后運(yùn)動(dòng)的一個(gè)2D控制器和用于路徑規(guī)劃的一個(gè)1D控制器，其具有最大化地圖可靠性和勘探區(qū)的目標(biāo)函數(shù)。因此，計(jì)劃者有一個(gè)目標(biāo)函數(shù)，使用“從經(jīng)驗(yàn)中學(xué)習(xí)方法”最大化每個(gè)狀態(tài)-動(dòng)作對(duì)的累積獎(jiǎng)勵(lì)。通過(guò)仿真表明，非完整車(chē)輛學(xué)習(xí)了虛擬墻壁跟隨行為。[42]中提出的類(lèi)似方法使用全卷積殘差網(wǎng)絡(luò)來(lái)識(shí)別獲取深度圖像的障礙。路徑規(guī)劃算法基于深度強(qiáng)化學(xué)習(xí)算法（DRL）。

[19]提出了一種主動(dòng)定位解決方案，其中在位置跟蹤問(wèn)題中僅控制機(jī)器人的旋轉(zhuǎn)運(yùn)動(dòng)。自適應(yīng)蒙特卡羅定位（AMCL）粒子云被用作輸入，機(jī)器人控制命令被發(fā)送到其傳感器作為輸出。所提出的解決方案涉及點(diǎn)云的光譜聚類(lèi)，從每個(gè)粒子簇構(gòu)建復(fù)合圖，并選擇信息量最大的單元。當(dāng)機(jī)器人在其不確定性估計(jì)中具有多個(gè)集群時(shí)，觸發(fā)主動(dòng)定位。未來(lái)的改進(jìn)包括更多用于有效假設(shè)估計(jì)的單元，并將此方法集成到SLAM前端。在一個(gè)有趣的方法中，通過(guò)[48]控制仿生眼睛的掃視運(yùn)動(dòng)（注視中心在視野內(nèi)的快速移動(dòng)）。為了利用環(huán)境中的更多特征，引入了受人類(lèi)視覺(jué)系統(tǒng)啟發(fā)的自主控制策略。A-SLAM系統(tǒng)包括兩個(gè)線(xiàn)程（并行進(jìn)程）、一個(gè)控制線(xiàn)程和一個(gè)跟蹤線(xiàn)程?？刂凭€(xiàn)程控制仿生眼睛運(yùn)動(dòng)到特征豐富的位置，而跟蹤線(xiàn)程通過(guò)選擇特征豐富（ORB特征）關(guān)鍵幀來(lái)跟蹤眼睛運(yùn)動(dòng)。

基于幾何和動(dòng)態(tài)的方法

這些方法使用前文提到的基于幾何和動(dòng)態(tài)的方法，結(jié)合了基于前沿的探索、信息理論和模型預(yù)測(cè)控制（MPC）來(lái)解決A-SLAM問(wèn)題。

在[15]中使用的方法提出了一種開(kāi)源的多層A-SLAM方法，其中第一層選擇信息性（基于Shanon熵[62]的效用標(biāo)準(zhǔn)）目標(biāo)位置（邊界點(diǎn)）并生成到這些位置的路徑，而第二層和第三層基于更新的占用網(wǎng)格圖主動(dòng)重新規(guī)劃路徑。非線(xiàn)性MPC[63]應(yīng)用于局部路徑執(zhí)行，目標(biāo)函數(shù)基于最小化到目標(biāo)的距離、控制到附近障礙物的努力和成本。這種方法的一個(gè)問(wèn)題是，有時(shí)機(jī)器人會(huì)停止并開(kāi)始局部路徑的重新規(guī)劃階段。未來(lái)的工作包括增加動(dòng)態(tài)障礙物和使用空中機(jī)器人。

而[23]和[29]中提到的一種有趣的方法提出了一種基于模型預(yù)測(cè)控制（MPC）的解決方案，以解決A-SLAM中的區(qū)域覆蓋和不確定性降低。建立了MPC控制切換機(jī)制，并將SLAM不確定性降低作為圖拓?fù)鋯?wèn)題處理，并將其規(guī)劃為約束非線(xiàn)性最小二乘問(wèn)題。利用凸松弛，通過(guò)凸優(yōu)化方法降低SLAM的不確定性。區(qū)域覆蓋任務(wù)通過(guò)順序二次規(guī)劃方法解決，線(xiàn)性SLAM用于子地圖連接。

A-SLAM的統(tǒng)計(jì)分析

表1總結(jié)了A-SLAM中使用的傳感器類(lèi)型和描述。還描述了SLAM方法、路徑規(guī)劃方法和出版年份。在該表中可以得出結(jié)論，在大多數(shù)A-SLAM方法中：

i）RGB和激光雷達(dá)傳感器被用作提取點(diǎn)云和圖像特征/對(duì)應(yīng)關(guān)系的主要輸入數(shù)據(jù)源；

ii）涉及姿態(tài)圖或基于圖的SLAM方法；

iii）使用基于圖搜索的路徑規(guī)劃算法。

表2詳細(xì)說(shuō)明了A-SLAM中使用的機(jī)器人及其各自的描述。還介紹了A-SLAM的數(shù)據(jù)集、（ROS）兼容性和回環(huán)閉合。這些信息可以概括為

-i）地面機(jī)器人被廣泛使用；

ii）50%的方法中采用了回環(huán)閉合；

iii）大多數(shù)方法中僅使用了30%的ROS。

在圖3中，描述了每年A-SLAM文章的選擇和ROS的使用[128]?？梢杂^(guān)察到，近57%的A-SLAM文章來(lái)自過(guò)去四年。雖然ROS是機(jī)器人的流行環(huán)境，但它僅部署在30%的A-SLAM解決方案中。

從圖4中可以推斷，自2021年以來(lái)，在A(yíng)-SLAM實(shí)驗(yàn)中，真實(shí)機(jī)器人的使用量有所增加。在圖5和圖6中，可以得出結(jié)論，模擬和分析結(jié)果的使用逐年增加。

主動(dòng)寫(xiě)作SLAM（AC-SLAM）

在A(yíng)C-SLAM中，多個(gè)機(jī)器人在主動(dòng)執(zhí)行SLAM的同時(shí)進(jìn)行協(xié)作。前文中提到的A-SLAM中使用的基于數(shù)據(jù)驅(qū)動(dòng)、信息理論和控制理論的方法也適用于A(yíng)C-SLAM，同時(shí)還存在管理機(jī)器人之間的（通信）和魯棒參數(shù)交換的額外限制。這種協(xié)作可以包括交換參數(shù)、定位信息以及同質(zhì)或異質(zhì)機(jī)器人組之間的傳感器數(shù)據(jù)。除了這些參數(shù)之外，AC-SLAM參數(shù)還可以包括

a）如在[66]和[85]中提出的，合并通過(guò)添加未來(lái)機(jī)器人路徑而引起的多機(jī)器人約束，同時(shí)最小化最優(yōu)控制函數(shù)（其考慮了未來(lái)的步驟和觀(guān)察）；

b）與[71]中描述的機(jī)器人的探索和重新定位（在預(yù)定義的會(huì)合位置收集）階段相關(guān)的參數(shù)；

c）在[80]中使用的3D建圖信息（OctoMap）；

d）路徑和地圖熵信息。如[81]中所用，以及如[82]中所述的相對(duì)熵。

AC-SLAM的網(wǎng)絡(luò)拓?fù)?/p>

網(wǎng)絡(luò)拓?fù)涿枋隽瞬煌瑱C(jī)器人之間以及與中央計(jì)算機(jī)/服務(wù)器之間如何通信和交換數(shù)據(jù)。這種通信策略可以是集中的、分散的或混合的。在在[65–67，82，83，85，86]中提出的集中式（通信網(wǎng)絡(luò)）中，中央服務(wù)器/代理負(fù)責(zé)管理通信和高級(jí)計(jì)算任務(wù)，而在[70，71，74，75，78，81，84]中描述的分布式網(wǎng)絡(luò)中，每個(gè)機(jī)器人管理通信并單獨(dú)計(jì)算其AC-SLAM參數(shù)。[72]中討論的混合網(wǎng)絡(luò)使用集中式和分散式方法。由于網(wǎng)絡(luò)拓?fù)洳皇潜疚牡闹饕黝}，我們將對(duì)其進(jìn)行進(jìn)一步討論，并將重點(diǎn)放在A(yíng)C-SLAM應(yīng)用的場(chǎng)景和應(yīng)用領(lǐng)域。典型的應(yīng)用場(chǎng)景包括協(xié)作任務(wù)分配、探索和開(kāi)發(fā)（重新訪(fǎng)問(wèn)已探索的區(qū)域以實(shí)現(xiàn)閉環(huán)）、協(xié)作軌跡規(guī)劃/軌跡優(yōu)化以及協(xié)作定位。

協(xié)作定位

在這些方法中，機(jī)器人在自定位和其他機(jī)器人定位之間切換其狀態(tài)（任務(wù)）。在[67]中提出的方法提出了一種新的集中式AC-SLAM方法，其中使用基于深度強(qiáng)化學(xué)習(xí)的任務(wù)分配算法來(lái)輔助代理完成相關(guān)觀(guān)察任務(wù)。每個(gè)代理可以選擇執(zhí)行其獨(dú)立的ORB-SLAM[127]或定位其他代理。獨(dú)特的觀(guān)測(cè)函數(shù)基于ORB-SLAM導(dǎo)出，由地圖點(diǎn)、關(guān)鍵幀和回環(huán)閉合檢測(cè)組件組成。機(jī)器人狀態(tài)之間的轉(zhuǎn)換誤差用于測(cè)量損失函數(shù)。為了學(xué)習(xí)Q值和狀態(tài)-動(dòng)作對(duì)之間的對(duì)應(yīng)關(guān)系，部署了一種新的多Agent系統(tǒng)深度Q網(wǎng)絡(luò)（MAS-DQN）。該方法的大量相關(guān)計(jì)算成本缺乏實(shí)時(shí)應(yīng)用，因此未來(lái)提出了一種分布式學(xué)習(xí)方法。

[85]中描述的方法將多機(jī)器人信念空間跨越問(wèn)題定義為機(jī)器人協(xié)作問(wèn)題，以減少狀態(tài)估計(jì)中的不確定性。機(jī)器人信念被測(cè)量為其狀態(tài)在整個(gè)組和映射環(huán)境中的概率分布。所提出的主動(dòng)定位方法可以使用未來(lái)路徑點(diǎn)的最大后驗(yàn)概率（MAP）估計(jì)來(lái)指導(dǎo)每個(gè)機(jī)器人，以通過(guò)在多機(jī)器人AC-SLAM框架中重新觀(guān)察僅由其他機(jī)器人觀(guān)察到的區(qū)域來(lái)減少其不確定性。在一個(gè)有趣的方法中，[83]中提出的方法使用了多個(gè)人形機(jī)器人多機(jī)器人系統(tǒng)（M（RS））SLAM，其中每個(gè)機(jī)器人有兩種獨(dú)立和協(xié)作的工作模式。每個(gè)機(jī)器人有兩個(gè)線(xiàn)程同時(shí)運(yùn)行：a）運(yùn)動(dòng)線(xiàn)程和b）聽(tīng)線(xiàn)程。在運(yùn)動(dòng)線(xiàn)程期間，它將通過(guò)組織者（中央服務(wù)器）使用D*路徑規(guī)劃器和基于強(qiáng)化學(xué)習(xí)（RL）和貪婪算法的控制策略計(jì)算的軌跡來(lái)導(dǎo)航環(huán)境。它還定期向組織者上傳位姿。在聽(tīng)線(xiàn)程期間，它將從組織者（通過(guò)ORB-SLAM）接收其更新的姿態(tài)，并可能接收命令以幫助附近的其他機(jī)器人改進(jìn)其定位（鏈?zhǔn)蕉ㄎ唬?/p>

勘探和開(kāi)發(fā)任務(wù)

如A-SLAM前面所述，我們需要平衡勘探（最大化勘探區(qū)域）和開(kāi)采（重新訪(fǎng)問(wèn)已勘探區(qū)域以閉合環(huán)路）的需求。在A(yíng)C-SLAM中，還可以通過(guò)將機(jī)器人移動(dòng)到另一個(gè)具有較少定位不確定性的機(jī)器人來(lái)實(shí)現(xiàn)開(kāi)發(fā)。在[79]中將集中式AS-SLAM探測(cè)問(wèn)題（使用基于邊界的探測(cè)）描述為效率優(yōu)化問(wèn)題，其中信息增益和定位效率最大化，而導(dǎo)航成本受到懲罰。對(duì)于重新定位（開(kāi)發(fā)）階段，導(dǎo)出了一個(gè)函數(shù)，其中每個(gè)機(jī)器人被引導(dǎo)到一個(gè)已知的地標(biāo)或另一個(gè)具有較少定位不確定性的機(jī)器人。定義了一個(gè)自適應(yīng)的閾值標(biāo)準(zhǔn)，如果機(jī)器人陷入困境，該標(biāo)準(zhǔn)可由機(jī)器人調(diào)整以逃避探索和開(kāi)發(fā)循環(huán)。為了管理有限的通信帶寬（由于集中式架構(gòu)），提出了一種會(huì)合方法，該方法在機(jī)器人超出通信范圍時(shí)將機(jī)器人重新定位到預(yù)定位置。提出的未來(lái)工作涉及使用分布式控制方案。

[126]中描述的方法在拓?fù)鋷缀慰臻g（由原始幾何形狀表示的環(huán)境）中表述問(wèn)題。最初，機(jī)器人被分配目標(biāo)位置，探索基于frontier方法，并利用切換成本函數(shù)，該函數(shù)考慮到群的另一成員對(duì)機(jī)器人目標(biāo)區(qū)域的發(fā)現(xiàn)。當(dāng)目標(biāo)位于機(jī)器人不相交的探索子空間內(nèi)時(shí)，成本函數(shù)從邊界轉(zhuǎn)換為基于測(cè)地線(xiàn)（距離）的導(dǎo)航函數(shù)。

軌跡規(guī)劃

在這些方法中，路徑熵被優(yōu)化以選擇AC-SLAM的信息量最大的路徑，并集體規(guī)劃軌跡，以減少定位和地圖的不確定性。在[81]中制定的方法中，該研究提出了一種分散的AC-SLAM方法，用于勘探行動(dòng)的長(zhǎng)期規(guī)劃，并將估計(jì)不確定性保持在一定閾值。主動(dòng)路徑規(guī)劃器使用RRT*的修改版本，其中a）由于使用了非完整機(jī)器人，所以過(guò)濾掉了不可信的節(jié)點(diǎn)，b）選擇了最佳地最小化每行進(jìn)距離的熵變化的動(dòng)作。熵估計(jì)作為兩個(gè)階段進(jìn)行。首先，使用平方根信息濾波器（SRIF）更新計(jì)算短視野中的熵，并考慮機(jī)器人路徑中環(huán)路閉合的減少來(lái)計(jì)算短視野的熵。這種方法的主要優(yōu)點(diǎn)是它保持了良好的姿態(tài)估計(jì)，并鼓勵(lì)環(huán)路閉合軌跡。通過(guò)與[82]提出的方法類(lèi)似的方法，使用相對(duì)熵（RE）優(yōu)化方法給出了一個(gè)有趣的解決方案，該方法將運(yùn)動(dòng)規(guī)劃與機(jī)器人定位相結(jié)合，并選擇最小化定位誤差和相關(guān)不確定性界限的軌跡。計(jì)算了一個(gè)規(guī)劃成本函數(shù)，其中除了狀態(tài)和控制成本之外，還包括狀態(tài)中的不確定性（EKF狀態(tài)估計(jì)器的協(xié)方差矩陣的軌跡）。在一種有趣且計(jì)算成本較低的方法中，[73]中的使用基于支持向量機(jī)（SVM）的走廊生成和基于Bezier曲線(xiàn)的連續(xù)細(xì)化，以及D最優(yōu)準(zhǔn)則，共同規(guī)劃軌跡，以減少基于偏序圖的SLAM中的姿態(tài)不確定性。為了降低目標(biāo)機(jī)器人的姿態(tài)不確定性，定義了一種出價(jià)策略，該策略基于最小計(jì)算成本、可行軌跡和資源友好準(zhǔn)則來(lái)選擇獲勝機(jī)器人。

AC-SLAM的統(tǒng)計(jì)分析

表3總結(jié)了主動(dòng)協(xié)作SLAM中使用的傳感器類(lèi)型和描述。SLAM方法和路徑規(guī)劃方法也與出版年份一起介紹?？梢缘贸鼋Y(jié)論，大多數(shù)主動(dòng)和協(xié)作的SLAM文章使用

i）RGB、激光雷達(dá)和IMU傳感器數(shù)據(jù)作為輸入；

ii）姿態(tài)圖和EKFSLAM是主要使用的方法；

iii）基于概率路線(xiàn)圖的方法用于路徑規(guī)劃。

表4詳細(xì)說(shuō)明了分析、模擬和真實(shí)機(jī)器人實(shí)驗(yàn)以及環(huán)境類(lèi)型、協(xié)作架構(gòu)、協(xié)作參數(shù)、回環(huán)閉合和ROS框架。信息可以概括為

i）大多數(shù)文章提供了基于分析和模擬的結(jié)果，以及最多四個(gè)機(jī)器人的多機(jī)器人協(xié)作；

ii）使用了集中式和分散式協(xié)作架構(gòu)；

iii）鼓勵(lì)閉環(huán)，但ROS的使用受到限制。

4討論和展望

論文重點(diǎn)介紹了A-SLAM和AC-SLAM方法及其在選定研究文章中的實(shí)現(xiàn)和方法應(yīng)用。除了前面章節(jié)中介紹的定性和定量分析外，我們希望在以下章節(jié)中介紹A-SLAM問(wèn)題的局限性和未來(lái)的研究領(lǐng)域。

當(dāng)前方法的局限性

通用限制

這些限制可以被視為A-SLAM研究中持續(xù)存在的開(kāi)放問(wèn)題，可以進(jìn)一步解釋為：

停止標(biāo)準(zhǔn)：由于A(yíng)-SLAM在計(jì)算上很昂貴，可以討論[4]所討論的停止標(biāo)準(zhǔn)，即何時(shí)停止勘探任務(wù)并切換到其他任務(wù)（如重新訪(fǎng)問(wèn)已勘探區(qū)域）的決定

人人文庫(kù)> 全部分類(lèi)> 行業(yè)資料 > 各類(lèi)標(biāo)準(zhǔn)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

深度解讀A-SLAM和AC-SLAM的實(shí)現(xiàn)和方法應(yīng)用

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔