視覺同時(shí)定位與建圖方法綜述

上傳人：1*** IP屬地：湖南上傳時(shí)間：2024-08-15 格式：DOCX 頁(yè)數(shù)：18 大?。?17.54KB 積分：20 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩13頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

機(jī)器人領(lǐng)域作為如今熱門的研究領(lǐng)域之一受到了研究者們的廣泛關(guān)注，但是機(jī)器人的研究始終伴隨著如何使機(jī)器人能夠在陌生的環(huán)境中自主探索和行動(dòng)這個(gè)關(guān)鍵性問題。SLAM提出至今已有30多年的研究歷程，大致分為傳統(tǒng)時(shí)期、算法分析時(shí)期和魯棒性-預(yù)測(cè)性時(shí)期3個(gè)時(shí)間段。對(duì)于未知環(huán)境，為了能夠自主移動(dòng)和探索，機(jī)器人需要依靠傳感器獲取環(huán)境數(shù)據(jù)。機(jī)器人首先需要解決定位問題即明確自身位置，隨后測(cè)量自身周圍的環(huán)境信息并建立地圖，同時(shí)保存已建的地圖以備后期在該地區(qū)內(nèi)直接進(jìn)行定位和導(dǎo)航。2007年，MonoSLAM是首個(gè)利用純視覺恢復(fù)相機(jī)的移動(dòng)路徑，使用概率框架在線創(chuàng)建稀疏并持久的自然地標(biāo)地圖，同時(shí)由先驗(yàn)信息輔助系統(tǒng)完成初始化，由擴(kuò)展卡爾曼濾波法實(shí)時(shí)更新狀態(tài)。此外，相機(jī)采用恒速度運(yùn)動(dòng)模型，相機(jī)狀態(tài)的誤差用不確定性程度衡量。2008年，PTAM實(shí)現(xiàn)了跟蹤和建圖用不同線程，并可在地圖中顯示AR虛擬物體。前端采用FAST角點(diǎn)檢測(cè)算法且引入關(guān)鍵幀技術(shù)，利用極線約束法匹配特征點(diǎn)計(jì)算旋轉(zhuǎn)矩陣，后端則采用非線性優(yōu)化的BA（BundleAdjustment）方法。2014年，SVO為了在無(wú)人機(jī)高速移動(dòng)狀態(tài)下估計(jì)準(zhǔn)確位姿，采用特征點(diǎn)法和直接法相結(jié)合的方法實(shí)現(xiàn)高頻高精度里程計(jì)。直接法中摒棄傳統(tǒng)算法對(duì)圖像中少量的大補(bǔ)丁圖像塊的提取，轉(zhuǎn)而提取大量小補(bǔ)丁圖像塊。RTAB-MAP針對(duì)大場(chǎng)景稠密建圖，并提出內(nèi)存管理方法來(lái)解決大場(chǎng)景長(zhǎng)時(shí)間稠密建圖存在的回環(huán)檢測(cè)和實(shí)時(shí)性問題。2018年，設(shè)計(jì)了一個(gè)完備的運(yùn)動(dòng)狀態(tài)估計(jì)器。它是由單目和IMU組裝成的一個(gè)小巧裝置，用于度量六自由度，可以廣泛應(yīng)用移動(dòng)機(jī)器人、無(wú)人機(jī)和移動(dòng)電子設(shè)備等SLAM系統(tǒng)。DSO依靠圖像上的采樣像素生成稀疏地圖，所用模型涉及光度校正來(lái)消除曝光時(shí)間和鏡頭漸暈等影響。ORB-SLAM在PTAM基礎(chǔ)上添加了回環(huán)檢測(cè)線程，是第一個(gè)具備跟蹤、回環(huán)檢測(cè)和建圖環(huán)節(jié)的完整實(shí)例，最終準(zhǔn)確實(shí)現(xiàn)了相機(jī)的運(yùn)動(dòng)軌跡和地圖中軌跡的一致。2019年，基于模型的視覺慣性里程計(jì)VIMO正逐步取代傳統(tǒng)的視覺慣性里程計(jì)VIO，關(guān)注點(diǎn)放在作用于系統(tǒng)的外力上，把動(dòng)力學(xué)和外力結(jié)合在殘差中作為約束產(chǎn)生了一種精度較高的狀態(tài)估計(jì)器。2020年，DeepFactors建立在CodeSLAM的基礎(chǔ)上，結(jié)合深度學(xué)習(xí)重新表示已學(xué)習(xí)的緊湊性深度圖對(duì)光度誤差、重投影誤差和幾何誤差，實(shí)現(xiàn)單目相機(jī)構(gòu)建稠密地圖。一個(gè)無(wú)需配置相機(jī)參數(shù)，便可較靈活地選擇多個(gè)數(shù)量的相機(jī)組合使用，完成自適應(yīng)初始化的SLAM系統(tǒng)。語(yǔ)義NodeSLAM根據(jù)VAE和概率渲染引擎判別物體形狀及重構(gòu)多視圖物體。Vid2Curve系統(tǒng)單憑RGB視頻流也可實(shí)現(xiàn)細(xì)線條物體三維重建，摒棄傳統(tǒng)基于深度和圖像紋理，而采用基于2D曲線特征的方法抽取出骨骼曲線，沿曲線按物體寬度融合相應(yīng)半徑圓餅反映物體線條。AVP-SLAM借助對(duì)視角和光照具有魯棒性的語(yǔ)義特征構(gòu)建地下停車場(chǎng)地圖，完成了自動(dòng)泊車任務(wù)。在任一亮環(huán)境下，基于物理的深度網(wǎng)絡(luò)考慮反射、折射和內(nèi)部全反射對(duì)物體表面法線重建，進(jìn)一步實(shí)現(xiàn)透明物體的三維重建。ESVO是SLAM領(lǐng)域首次用雙目事件相機(jī)構(gòu)建的視覺里程計(jì)，在保證每幀圖像時(shí)空一致性前提下，逆深度估計(jì)附加時(shí)間戳，并采用了IRLS非線性優(yōu)化和前向合成Lucas-Kanade方法。除此之外，目前開源并且框架完備的算法有ORB-SLAM、DTAM、RGBD-SLAM、改善大場(chǎng)景下回環(huán)檢測(cè)性能的算法。綜上所述，對(duì)大量視覺算法進(jìn)行分析歸納出視覺SLAM框架涵蓋傳感器數(shù)據(jù)輸入、前端VO、后端優(yōu)化、回環(huán)檢測(cè)和建圖5個(gè)主體。圖1為視覺SLAM的算法流程。圖1視覺SLAM算法流程1前端前端視覺里程計(jì)部分實(shí)現(xiàn)對(duì)位姿的計(jì)算。計(jì)算方法大致有特征點(diǎn)法、直接法、光流法和深度學(xué)習(xí)與幀間估計(jì)4種。如圖2所示，視覺里程計(jì)要計(jì)算估計(jì)出相機(jī)各幀位姿，從初始位置（可以自定義）起，當(dāng)前位置通過和上一時(shí)刻的位置來(lái)計(jì)算，公式為。其中，為K和K+1時(shí)刻之間的相機(jī)平移和旋轉(zhuǎn)變化，可根據(jù)圖像變換的基本矩陣、單應(yīng)矩陣和SVD分解本質(zhì)矩陣計(jì)算獲得，從而恢復(fù)相機(jī)的運(yùn)動(dòng)軌跡。圖2相機(jī)運(yùn)動(dòng)軌跡1.1特征點(diǎn)法特征點(diǎn)法是在相鄰幀之間選取特征點(diǎn)并進(jìn)行匹配，然后使用RANSAC、M估計(jì)或最小中值估計(jì)等方法，盡可能濾除錯(cuò)誤匹配的噪聲點(diǎn)，最后求得位姿。介于對(duì)精度和時(shí)間的考慮，關(guān)鍵點(diǎn)檢測(cè)器和描述符組合搭配使用。檢測(cè)器算法有ORB、SIFT以及SURF等，描述符算法有BRIEF、FREAK等。由于深度圖像的取舍，前端將面臨2D-2D、3D-2D和3D-3D共3種情形，故使用特征點(diǎn)法時(shí)最主要考慮的問題是算法選擇問題和計(jì)算方法的選擇問題。（1）SIFT/SURF。SIFT/SURF算法使用基于梯度方法的HOG作為描述符，通過物體在局部區(qū)域中的強(qiáng)度梯度分布來(lái)描述物體的結(jié)構(gòu)。（2）RISK/BRIEF/ORB/KAZE/FREAK。上述算法使用二進(jìn)制Binary描述符，僅依靠圖像自身強(qiáng)度信息，將關(guān)鍵點(diǎn)周圍信息編碼成一串二進(jìn)制數(shù)。BRISK算法采用長(zhǎng)距離對(duì)和短距離對(duì)，其中長(zhǎng)距離對(duì)描述圖像補(bǔ)丁的梯度方向，而短距離對(duì)用于組成二進(jìn)制字符串來(lái)描述梯度大小。長(zhǎng)距離對(duì)搜索函數(shù)為：短距離對(duì)搜索函數(shù)為：長(zhǎng)對(duì)計(jì)算關(guān)鍵點(diǎn)方向向量公式為：短距離對(duì)組裝成二進(jìn)制串公式為：上面使用相同數(shù)量圖片及同一工程對(duì)所有可能的檢測(cè)器和描述符組合進(jìn)行性能比較實(shí)驗(yàn)。由表1各種檢測(cè)器和描述符組合的總運(yùn)行時(shí)間結(jié)果可以看出，F(xiàn)AST+BRIEF速度最快，F(xiàn)AST+ORB次之。表1中x表示當(dāng)前檢測(cè)器和描述符不能搭配使用，相應(yīng)的實(shí)驗(yàn)結(jié)果也將不存在。表2為各種檢測(cè)器和描述符組合的匹配點(diǎn)數(shù)目結(jié)果，可以看出BRISK+BRIEF匹配點(diǎn)數(shù)目最多，BRISK+SIFT和BRISK+FREAK次之。對(duì)于所有類型的幾何變換來(lái)說(shuō)，SIFT和BRISK的總體精度最高。表1各種檢測(cè)器和描述符組合的總運(yùn)行時(shí)間（單位：ms）表2各種檢測(cè)器和描述符組合的匹配點(diǎn)數(shù)目（單位：個(gè)）1.2光流法光流法是為了應(yīng)對(duì)圖像中的特征點(diǎn)難提取、紋理簡(jiǎn)單且單一的情況提出的。它是基于亮度不變的假設(shè)，即圖像中某一位置的像素其亮度在短時(shí)間內(nèi)不會(huì)變化的思想來(lái)選取圖像中某些像素點(diǎn)進(jìn)行跟蹤，最后計(jì)算出位姿。不變性假設(shè)關(guān)于時(shí)間t進(jìn)行求導(dǎo)，得：整理為矩陣形式，為：式中：代表該點(diǎn)x方向梯度，代表該點(diǎn)x方向速度；同理，。分別代表y方向梯度和速度，表示圖像隨時(shí)間的變化量。1.3直接法直接法依據(jù)灰度不變性假設(shè)，利用圖像中像素灰度值的變化來(lái)估計(jì)相機(jī)的運(yùn)動(dòng)方向。只要環(huán)境中有亮度并使得相機(jī)運(yùn)動(dòng)時(shí)圖像像素點(diǎn)有亮度的變化，直接法就能工作。因?yàn)橹苯臃ㄖ魂P(guān)注亮度變化，不關(guān)注特征信息，故效率較高。常見的塊匹配算法有NCC、SSD等。DVO在假設(shè)條件下用高斯牛頓迭代法計(jì)算相機(jī)的運(yùn)動(dòng)位姿，預(yù)測(cè)場(chǎng)景點(diǎn)深度值和深度圖提供的實(shí)際深度值之間的差異預(yù)估運(yùn)動(dòng)。LSD-SLAM是繼特征點(diǎn)法后將直接法應(yīng)用于SLAM的典型算法，省略了特征點(diǎn)提取環(huán)節(jié)，從而提高了算法效率，將圖像中梯度較大的像素點(diǎn)還原出對(duì)應(yīng)3D地圖坐標(biāo)來(lái)盡量反映場(chǎng)景物體的輪廓信息，即建立了半稠密的地圖。跟蹤線程中以歸一化的方差光度誤差最小化為目標(biāo)，對(duì)上一關(guān)鍵幀的姿態(tài)值左乘這兩個(gè)關(guān)鍵幀之間的剛體變換值，從而得到當(dāng)前關(guān)鍵幀的位姿。2后端后端優(yōu)化主要對(duì)前端的位姿值進(jìn)行優(yōu)化，盡量減少累積誤差。前端當(dāng)前建立的帶有累積誤差的局部地圖，后端會(huì)優(yōu)化當(dāng)前的地圖，避免地圖誤差越來(lái)越多。目前，最主要的后端算法包括基于濾波理論的擴(kuò)展卡爾曼濾波法和基于優(yōu)化理論的BA和圖優(yōu)化法、位姿圖法。除此之外，基于濾波理論的算法還有UKF、EIF、SEIF、PF等，基于優(yōu)化理論的算法還有非線性優(yōu)化、TORO、G2O等。2.1濾波法卡爾曼濾波器包含預(yù)測(cè)和更新兩個(gè)任務(wù)，被看作兩步驟程序。步驟1：使用上一狀態(tài)值估計(jì)下一狀態(tài)及不確定性：步驟2：使用當(dāng)前的測(cè)量值透過加權(quán)平均來(lái)更新當(dāng)前的狀態(tài)估計(jì)值：式中，表示卡爾曼增益，表示觀測(cè)模型，表示殘差。MonoSLAM的后端采用擴(kuò)展卡爾曼濾波法，相機(jī)采用恒速度運(yùn)動(dòng)模型，受瞬間外力對(duì)相機(jī)的影響，需要再更新相機(jī)運(yùn)動(dòng)狀態(tài)量。未知力度對(duì)相機(jī)瞬時(shí)作用的影響用噪聲向量表示，其中包含短時(shí)間內(nèi)外力的線加速度和角加速度產(chǎn)生的線速度和角速度。2.2優(yōu)化法BA（BundleAdjustment）目標(biāo)函數(shù)中，相機(jī)位姿變量和路標(biāo)點(diǎn)變量組成自變量，作為所有待優(yōu)化的變量。變量發(fā)生變化時(shí)對(duì)應(yīng)的增量方程為：式中，分別表示關(guān)于相機(jī)位姿和路標(biāo)點(diǎn)位置的偏導(dǎo)數(shù)。無(wú)論使用G-N方法還是L-M方法，最后都將面對(duì)增量線性方程：以G-N為例，則矩陣為：認(rèn)識(shí)到矩陣的稀疏結(jié)構(gòu)，并發(fā)現(xiàn)該結(jié)構(gòu)可以自然地用圖優(yōu)化來(lái)表示，此處引入G2O。若一個(gè)場(chǎng)景內(nèi)有5個(gè)相機(jī)位姿和2個(gè)路標(biāo)。關(guān)系結(jié)構(gòu)圖如圖3所示，以最小化下列函數(shù)為目標(biāo)，優(yōu)化所有圖中的變量：式中，表示第j個(gè)路標(biāo)點(diǎn)，表示j=N個(gè)路標(biāo)點(diǎn)分別在第i個(gè)相機(jī)下的像素坐標(biāo)，表示各路標(biāo)點(diǎn)到各相機(jī)平面的深度值。圖3關(guān)系結(jié)構(gòu)2.3位姿圖法從圖優(yōu)化知，隨著相機(jī)運(yùn)動(dòng)需加入大量路標(biāo)節(jié)點(diǎn)。路標(biāo)節(jié)點(diǎn)數(shù)量遠(yuǎn)大于位姿節(jié)點(diǎn)的數(shù)量，將嚴(yán)重降低計(jì)算效率。因此，舍棄路標(biāo)節(jié)點(diǎn)變量的優(yōu)化，只關(guān)注相機(jī)位姿變量的優(yōu)化，如圖4所示。圖4關(guān)系結(jié)構(gòu)首先根據(jù)兩幀已記錄（前端計(jì)算）的位姿得到相對(duì)位姿變換：重新根據(jù)i、j兩幀圖像利用對(duì)極幾何得到實(shí)際位姿增量，優(yōu)化的目標(biāo)為：若所有位姿節(jié)點(diǎn)之間的邊集合記做，則總體目標(biāo)函數(shù)為：3三維地圖構(gòu)建三維地圖的表達(dá)方式有深度圖（depth）、點(diǎn)云（pointcloud）、體素（voxel）和網(wǎng)格（mesh）共4種。圖5為4類三維建圖方式樣例，深度圖中每個(gè)像素表示物體距離相機(jī)平面的值。點(diǎn)云是大量點(diǎn)組成的數(shù)據(jù)集，每個(gè)點(diǎn)包含位置、顏色等信息。體素是由一個(gè)個(gè)矩形小方塊組成，類似于三維空間中的像素。網(wǎng)格由許多三角形面拼接成的多邊形以接近現(xiàn)實(shí)物體表面，每個(gè)網(wǎng)格包含三角形的頂點(diǎn)、邊和面。圖54類三維建圖方式樣例3.1深度圖Shao等人提出了一種立體視覺和陰影形狀（ShapeFromShading，SFS）算法，能夠同時(shí)生成深度圖和方向圖，但很難作用在顏色和紋理不均一的場(chǎng)景。強(qiáng)度圖像與對(duì)應(yīng)的深度信息進(jìn)行隱馬爾可夫模型（HiddenMarkovModel，HMM）建模，應(yīng)用單張圖像的3D人臉或手的重構(gòu)系統(tǒng)。Saxena等人將圖像劃分出多個(gè)區(qū)域塊，使用馬爾可夫隨機(jī)場(chǎng)（MarkovRandomField，MRF）對(duì)逐個(gè)像素塊計(jì)算出相應(yīng)參數(shù)，以描述每塊所指的3D平面位置與方向，而各個(gè)平面共同組成最后的3D場(chǎng)景。Liu等人使用有監(jiān)督的學(xué)習(xí)方法對(duì)非結(jié)構(gòu)化場(chǎng)景圖進(jìn)行深度預(yù)測(cè)，其中模型采用經(jīng)過區(qū)分訓(xùn)練的馬爾可夫隨機(jī)場(chǎng)（MRF）。受生物學(xué)復(fù)雜單元的啟發(fā)，對(duì)圖像像素之間相關(guān)性進(jìn)行編碼，從數(shù)據(jù)中學(xué)習(xí)深度和運(yùn)動(dòng)線索實(shí)現(xiàn)3-D運(yùn)動(dòng)分析。最近，使用基于SIFTFlow的KNN傳輸機(jī)制從單個(gè)圖像估計(jì)靜態(tài)背景的深度，并利用運(yùn)動(dòng)信息對(duì)其進(jìn)行增強(qiáng)，以更好地估計(jì)視頻中的運(yùn)動(dòng)前景對(duì)象。使用兩個(gè)深度網(wǎng)絡(luò)分別進(jìn)行圖像粗略預(yù)測(cè)和局部細(xì)化預(yù)測(cè)，實(shí)現(xiàn)了對(duì)單張圖像的深度估計(jì)，并提出了一個(gè)尺度不變的損失函數(shù)。提出了將語(yǔ)義對(duì)象標(biāo)簽與單眼深度特征集成在一起的方法，以提高性能，但它們依靠手動(dòng)添加的方式并使用超像素來(lái)分割圖像。建議使用基于ResNet的網(wǎng)絡(luò)結(jié)構(gòu)來(lái)預(yù)測(cè)深度。建議使用CNN結(jié)構(gòu)構(gòu)建用于深度預(yù)測(cè)的多尺度條件隨機(jī)場(chǎng)CRF。BA-Net輸入圖像使用預(yù)先學(xué)習(xí)（端到端）的深度圖生成器產(chǎn)生多個(gè)基礎(chǔ)深度圖，并通過特征量度BA將這些深度圖線性組合出最終深度。3.2點(diǎn)云Fan等人實(shí)現(xiàn)了對(duì)單圖像中單個(gè)物體以點(diǎn)云形式進(jìn)行三維重建，開創(chuàng)了點(diǎn)云生成的先例。從一張2D圖像恢復(fù)一個(gè)3D物體可能出現(xiàn)多個(gè)可能的較好結(jié)果，使得此問題不適用經(jīng)典回歸或分類方法解決，轉(zhuǎn)而研究基于點(diǎn)云表示的3D幾何生成網(wǎng)絡(luò)。網(wǎng)絡(luò)由輸入圖像和推斷的視點(diǎn)位置確定3D點(diǎn)云中的點(diǎn)位置。點(diǎn)集生成網(wǎng)絡(luò)恢復(fù)出多個(gè)可能的結(jié)果，再經(jīng)損失函數(shù)確立最終點(diǎn)云結(jié)果。圖6為系統(tǒng)的整體結(jié)構(gòu)圖。圖6系統(tǒng)結(jié)構(gòu)2D圖恢復(fù)所有可能的3D形狀：損失函數(shù)：ElasticFusion算法側(cè)重構(gòu)建清晰稠密地圖。對(duì)RGB-D相機(jī)獲取的深度圖進(jìn)行操作，相關(guān)信息融合到初始的surfel數(shù)學(xué)模型中，一步步優(yōu)化模型外形，最后使用此模型描畫場(chǎng)景。圖7展示了ElasticFusion算法的整體實(shí)現(xiàn)流程。圖7ElasticFusion算法框架流程建圖線程的兩個(gè)步驟。一是surfel模型初始化采用Deformation圖使用均勻抽樣初始化。它由許多node組成，每個(gè)node帶有和等參數(shù)來(lái)影響surfel模型進(jìn)行表面變形。二是RGB-D相機(jī)獲得深度圖像，使用內(nèi)參將深度圖轉(zhuǎn)為點(diǎn)云。點(diǎn)云和RGB彩色圖像使用跟蹤線程計(jì)算的相機(jī)幾何位姿和光度位姿，并利用OPENGL融合到surfel模型中。3.3體素3D-R2N2沒有在觀察對(duì)象之前需先匹配合適的3D形狀，以盡可能迎合2D圖像中所描述的物體。而受早期使用機(jī)器學(xué)習(xí)來(lái)學(xué)習(xí)2D到3D映射以進(jìn)行場(chǎng)景理解的工作啟發(fā)，引入深度卷積神經(jīng)網(wǎng)絡(luò)。網(wǎng)絡(luò)建立在LSTM和GRU的基礎(chǔ)上，實(shí)現(xiàn)了單視圖和多視圖的3D重建。網(wǎng)絡(luò)框架包含Encoder、3DConvolutionalLSTM和Decoder共3大部分，如圖8所示。Encoder是一種CNN結(jié)構(gòu)對(duì)輸入圖像進(jìn)行編碼；Decoder是解碼過程；3DConvolutionalLSTM是由許多LSTM單元組成的正立方體網(wǎng)格結(jié)構(gòu)，每個(gè)單元負(fù)責(zé)一個(gè)已編碼的部分并恢復(fù)出相應(yīng)體素，所有體素格組成3D物體。損失函數(shù)使用二分類交叉熵函數(shù)，決定相應(yīng)體素格狀態(tài)是否占有：圖8網(wǎng)絡(luò)框架3.4網(wǎng)格Pixel2Mesh在基于圖的卷積神經(jīng)網(wǎng)絡(luò)中輸出3D網(wǎng)格圖形。任一單圖像輸入之前，系統(tǒng)默認(rèn)同步初始化一橢圓球作為初始的物體形狀。全卷積神經(jīng)網(wǎng)絡(luò)一步一步提取2D圖像中的細(xì)節(jié)特征，同時(shí)圖卷積神經(jīng)網(wǎng)絡(luò)受圖像特征的約束將細(xì)節(jié)附加于初始的橢球體上，隨著特征數(shù)量的不斷增加致使橢球不斷形變（粗糙到細(xì)密過程），最終得到最后物體。圖9為雙網(wǎng)絡(luò)協(xié)作流程。圖9雙網(wǎng)絡(luò)協(xié)作流程4種約束網(wǎng)格形變的損失函數(shù)為：圖卷積神經(jīng)網(wǎng)絡(luò)中包含與Mesh網(wǎng)格對(duì)應(yīng)的頂點(diǎn)（V）、邊（E）和特征向量（F），定義函數(shù)如下：式中，分別表示頂點(diǎn)p在卷積前后的特征向量，表示頂點(diǎn)p的相鄰頂點(diǎn)，是待學(xué)習(xí)的權(quán)重參數(shù)。4發(fā)展趨勢(shì)當(dāng)前，視覺SLAM的發(fā)展趨勢(shì)主要涵蓋以下3個(gè)方面。4.1面對(duì)特殊材質(zhì)的透明物體的重建透明物體的重建受光反射、折射和內(nèi)部全反射等因素影響。透明物體成像的物理基礎(chǔ)是界面處的折射遵循斯涅爾定律，反射由菲涅爾方程確定。由高折射率介質(zhì)進(jìn)入較低折射率介質(zhì)界面處的入射角大于臨界角時(shí)，就會(huì)發(fā)生全內(nèi)反射。文獻(xiàn)[13]中利用了深層網(wǎng)絡(luò)學(xué)習(xí)和模擬圖像形成的物理基礎(chǔ)知識(shí)。網(wǎng)絡(luò)內(nèi)的渲染層可對(duì)最多兩次反射的折射光路進(jìn)行建模，以建立對(duì)應(yīng)于物體正反兩面投影光線的曲面法線，可在任意

人人文庫(kù)> 全部分類> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

視覺同時(shí)定位與建圖方法綜述

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

視覺同時(shí)定位與建圖方法綜述

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔