?

融合卷積注意力的激光同步定位與建圖回環檢測網絡

2024-03-04 01:52姚萬業楊振輝王祝
電力科學與工程 2024年2期
關鍵詞:回環描述符特征提取

姚萬業,楊振輝,王祝

融合卷積注意力的激光同步定位與建圖回環檢測網絡

姚萬業,楊振輝,王祝

(華北電力大學 自動化系,河北 保定 071003)

針對當前基于深度學習的回環檢測方法應對反向循環時由于尺度變化和視角變化引發特征匹配準確度低的問題,提出一種使用卷積注意力增強的激光同步定位與建圖回環檢測網絡(Convolutional attention,loop closure detection network,CA-LCDNet)。在構建局部描述符時,引入卷積注意力機制實現多尺度特征的有機融合,以增強適應性特征提取能力;用基于軟分配聚類改進的NetVLAD(Network-based visual localization with attention to descriptors)對局部描述符進行高效的聚合,獲得全局描述符?;诜瞧胶庾顑炤斶\理論實現點云幀之間的特征匹配,計算兩幀間的相對位姿。使用三元組損失訓練全局描述符,實現準確的相對位姿誤差估計。在公開數據集上進行對比試驗,在正向循環中算法準確率達到92%,在反向循環中準確率達到40%。同時,相較于原Loop closure detection network(LCDNet)算法,改進算法得到的相對位姿誤差取得了約5%的改善。

移動機器人;機器人導航;回環檢測;卷積注意力;隨機深度;深度學習

0 引言

回環檢測是指在移動機器人的同步定位與建圖(Simultaneous localization and mapping,SLAM)過程中[1],檢測機器人是否到達已訪問過的位置,以校正由于運動過程中的累積誤差而導致的定位和地圖構建的準確性下降。這項技術在機器人導航、自主探測和環境感知等領域具有廣泛的應用價值[2]。

目前關于SLAM的研究主要包括視覺SLAM[3]和激光SLAM。激光雷達SLAM不依賴圖像紋理或光照條件,具有更高的測距精度、更強的抗干擾能力以及更好的實時性[4]。

SLAM的回環檢測算法包括基于手工特征的方法與基于深度學習的方法。

基于手工特征回環檢測方法的原理是,通過比較當前掃描與先前掃描的描述符來識別回環,比如利用局部關鍵點[5]或全局手工描述符[6]等。然而,手工特征設計存在較高的主觀性,并且在處理大規模數據時面臨挑戰;這些因素制約了基于手工特征的回環檢測的能力。

用基于深度學習的回環檢測方法可以提取到高維和高級特征,這使其在回環檢測中表現出優異的性能。文獻[7]將目標檢測信息融入到詞袋模型中,利用融合相似度來判斷循環。文獻[8]提出Scan context,利用掃描上下文實現場景識別,將環境信息編碼為一個固定長度的上下文向量,使得點云數據的比較和匹配更為高效。

雖然深度學習方法通常比手工方法更快,但在處理反向循環時難以將當前點云與構建的地圖對齊。文獻[9]提出LCDNet,從多個方面考慮點云數據的特征提取和相似度計算,提高了回環檢測和點云配準的性能,能夠更好地處理反向循環。然而,該方法主要關注于單一尺度的特征提取,未充分考慮到點云數據的復雜幾何結構。鑒于點云數據的多尺度特性,可以考慮引入多尺度卷積注意力機制[10],以增強特征提取的多尺度特征能力[11],從而提高回環檢測的精度。

鑒于室外環境下激光雷達SLAM方法中存在位姿積累誤差大、反向循環處理精度不高、特征提取能力不強的問題,本文提出了融合卷積注意力的激光SLAM回環檢測網絡:首先,通過優化點云處理和特征提取,獲取具有高信息量的局部描述符;然后,引入卷積注意力機制增強特征提取的能力,使算法在突出局部特征和多尺度處理方面表現更出色;采用基于軟分配聚類改進的NetVLAD[12]算法對局部描述符進行聚合,生成全局描述符,以有助于算法更靈活地處理樣本在聚類簇之間的分布關系;最后,使用三元組損失對全局描述符進行訓練,以提高相對位姿誤差的估計準確度。

1 CA-LCDNet算法流程

CA-LCDNet算法流程如圖1所示。

圖1 CA-LCDNet算法流程

由圖1可知,算法整體分為4個部分。

1)特征提取。神經網絡引入卷積注意力模塊到原有的卷積模塊,實現對點云數據進行的特征提取、局部結構信息捕捉,得到局部描述符。

2)采用軟分配聚類替代-means聚類方法的NetVLAD聚合局部描述符,得到全局描述符。用全局描述符捕捉點云的整體結構和結構信息,并將之用于網絡訓練。

3)基于非平衡最優輸運理論(Unbalanced Optimal Transport,UOT)實現點云幀之間的特征匹配,計算兩幀間的相對位姿。

4)通過三元組損失對全局描述符進行訓練。

2 融入卷積注意力增強的特征提取

為了實現從點云數據中提取關鍵點特征,在PV-RCNN[13](Point voxel-region with convolutional neural network features)的基礎上,使用卷積注意力機制替代傳統卷積模塊,并引入隨機深度模塊,以提高算法完成特征提取任務的能力。采用基于PointNet[14](Point network)的特征學習,通過集合抽象操作對點云的局部特征進行編碼和聚合,生成局部描述符,實現關鍵點特征提取。特征提取的流程如圖2所示。

圖2 特征提取流程

2.1 點云體素化模塊

使用PV-RCNN將輸入點云劃分為空間分辨率為××的小體素。對于非空體素,采用逐點特征平均值計算的方法,將所有內部點的特征累加,進而得到該體素的特征表示。

2.2 下采樣降維模塊

首先,通過對點云數據進行密度降采樣,提取個均勻分布的關鍵點,以保留關鍵結構并降低數據量。然后,采用最遠點采樣方法,從這個關鍵點中選擇最遠的點,以確保采樣點的均勻分布。通過采用4個不同的下采樣率,即1、2、4和8,來實現點云數據的高效壓縮。

在下采樣過程中,每個下采樣率對應的稀疏特征量被視為一組特征向量。將這些特征向量從軸方向的8下采樣率的3D特征圖中垂直堆疊,并進行相應的轉換,形成2D鳥瞰特征圖。該操作的作用是在逐漸減小特征圖尺寸的同時,不損失關鍵信息,為后續處理提供更高效的數據支持。

通過采用下采樣策略,實現了細節保留與特征圖尺寸逐步減小的雙重目標。這樣的流程確保了在數據處理過程中同時保證了降維和維持關鍵信息的有效性。

2.3 深度神經網絡處理模塊

提出了一種多尺度卷積注意力MSCA(Multi-scale convolutional attention)模塊。用該模塊可在卷積編碼器環節實現多尺度特征提取,從而提升回環檢測的準確性。

卷積編碼器中,預處理后的點云將經過批量歸一化和注意力模塊的處理,從而得到具有規范化特征和強調關鍵信息的“點云表示”。然后,“點云表示”經過批量歸一化和前饋神經網絡的串行處理,在前饋神經網絡生成中間特征。

回環檢測在處理不同尺寸的圖像過程中,通過將特征金字塔[15]與深度神經網絡融合,使網絡能夠在多個尺度下提取關鍵特征。在此背景下,MSCA模塊的引入加強了模型對多尺度信息的敏感性。多尺度特征提取的作用是將一組具有不同感受野的卷積層進行組合,并將這些感受野進行融合,從而提高深度神經網絡的準確性和魯棒性。

卷積編碼器模塊的組成如圖3所示。

圖3 卷積編碼器模塊

MSCA模塊將卷積模塊用于多尺度特征提取,將卷積輸出作為注意力權重來動態加權MSCA模塊的輸入。

MSCA模塊計算過程如式(1)和式(2)所示。

MSCA模塊產生的權重用于調整特征金字塔中各個層次的特征表示,從而使神經網絡更為聚焦于特定層級的信息。

采用PV-RCNN網絡將金字塔特征圖、2D鳥瞰特征圖和輸入點云聚合成一組包含個關鍵點特征的局部描述符。

對于每個選定的關鍵點和特性金字塔的每一層,使用式(3)計算關鍵點特征。

對輸入原始點云以及2D鳥瞰特征圖執行相同操作,產生聚合的局部描述符如式(6)。

最后,在聚合的局部描述符上使用多層感知機進行降維生成最終的局部描述符,如式(7)所示。

2.4 隨機深度模塊

為降低過擬合風險并提高模型的泛化能力,在深度神經網絡的殘差結構中引入隨機深度模塊[17]。隨機深度通過概率性丟棄神經網絡中的層,模擬訓練過程中的隨機連接和隨機剪枝現象,從而減少網絡復雜性和容量。

隨機深度流程圖如圖4所示。

圖4 隨機深度流程

圖4中,前一層神經網絡的輸出為張量。將張量輸入隨機深度函數中,其每一行元素以概率被隨機刪除。在該過程中,對于每個張量的每一行,隨機深度函數決定是否以概率隨機刪除該行的元素。被保留的行繼續參與前向傳播和反向傳播的計算。在前向傳播中,輸入數據被傳遞到下一層,而在反向傳播過程中,這些保留的行參與梯度計算和參數更新。正則化的作用是通過引入額外的正則項對損失函數進行調整和優化,約束模型參數的取值范圍,從而減少過擬合風險并提高模型的泛化能力。同時,用隨機深度有效控制了模型的復雜性,使得模型具備更好的魯棒性和泛化能力。

3 全局描述符計算

使用軟分配聚類改進的NetVLAD,將特征提取過程獲得的局部描述符聚合成全局描述符。全局描述符生成流程如圖5所示。

圖5 全局描述符生成流程

在深度神經網絡中,采用軟分配聚類方法替代NetVLAD中的-means聚類方法。

軟分配聚類方法屬于聚類方法的一種,與-means硬聚類方法形成了對比。與硬聚類方法不同,在采用軟分配聚類過程中,每個樣本可以以一定的權重分布到不同的聚類簇,且不要求每個樣本嚴格分配到一個確定的簇。

軟分配定義為:

4 相對姿態估計

對此,將點云映射問題轉換為最優輸運問題,以尋找2個點云分布之間的最佳映射方式。Sinkhorn算法[19]是解決最優輸運問題的迭代算法,其原理是通過交替更新聯合概率分布的行和列,逐步找到最佳滿足Kantorovich公式的運輸方案。Kantorovich公式定義如式(10):

為一個聯合概率分布,滿足邊緣約束:

在點云映射過程中,可能有一些點在源點云中存在但在目標點云中缺失或被遮擋。對此可以在最優運輸問題的基礎上引入非平衡約束條件,建立UOT問題?;赟inkhorn算法,對原始最優輸運問題的離散Kantorovich公式進行改進,引入熵正則化項和非平衡約束條件:

參數值和并非人工設定,而是通過反向傳播算法進行學習調整。成本矩陣設置為關鍵點特征之間的余弦距離,如式(14)所示。

一旦神經網絡訓練完成,則采用基于隨機抽樣一致性(Random sample consensus,RANSAC)的配準方法替代之前的相對姿態估計模塊。

配準是指對2個或多個數據集或圖像的空間屬性進行匹配或對齊的過程,其目的在于確定空間關系,在某種程度上實現數據集或圖像的重疊或對齊。這一步驟旨在實現端到端的網絡訓練,覆蓋從特征提取到特征匹配的整個過程。具體而言,在推斷階段,通過充分利用RANSAC的強大迭代過程,獲取準確的相對姿態估計,從而替代了之前的相對姿態模塊。這種方法可在實際應用中確保RANSAC優勢的充分發揮,使算法獲得更為精準的結果。

5 全局描述符訓練

三元組損失定義如式(16)(17)所示。

式中:()為距離函數;為期望的分離閾值。

將上述3個公式進行線性組合后,得到的最終的損失函數為:

通過結合三元組損失、UOT和數據增強的方法以及反向傳播,模型得以學習生成具有獨特性和平移不變性的關鍵點特征。

6 仿真試驗與分析

6.1 硬件平臺和數據集

實驗所用硬件配置為:處理器Intel(R)Core(TM)i9-11900K@3.50GHz,操作系統為Ubuntu20.04,顯卡為NVIDIA GeForce RTX 3090,運行內存32 GB。

將各網絡訓練100個迭代輪次,每批樣本的大小為12個。使用ADAM優化器來更新網絡的權重。初始學習率為0.004,在第40和80輪迭代輪次后減半,權重衰減為5×10–6。設置關鍵點的數量為4 096,中間特征維數=640,輸出特征維數=256,NetVLAD簇的數量為64,三元組余量為0.5。Sinkhorn算法的迭代次數設置為5。

選取KITTI(Karlsure Institute of Technology and Toyota Technoligical Institute)里程計數據集[21]和KITTI360里程計數據集[22]進行試驗。

KITTI里程計數據集包括LiDAR點云和真實姿態的序列,使用SemanticKITTI數據集提供的地面真值進行對齊。序列01、02、03、04、05、09作為訓練集,序列00、06、07、08作為驗證集,其中序列08包含最多的反向循環。

KITTI360里程計數據集包含全景圖像和全景激光雷達點云數據,還提供了更全面的環境感知信息。KITTI360里程計數據集比KITTI里程計數據集包含更多的正向循環和反向循環。以序列01、02、03、04、07、08作為訓練集,序列00、05、06、09作為驗證集,其中序列09包含最多的反向循環。

準確率和召回率是衡量回環檢測模塊中相似度檢測算法性能的重要指標。在回環檢測算法中首先需要保證較高的準確率,其次盡可能提高相似度檢測模塊的召回率。

表1示出了回環檢測結果可能出現的4種情況。

表1 回環檢測結果分類

統計表1中用回環檢測算法在數據集中所得真陽性、假陽性、假陰性、真陰性結果出現的次數,并計算準確率和召回率。

6.2 對比試驗結果

圖6展示了本文算法與其他先進算法在公開數據集下的實驗對比結果。由圖6精度召回曲線觀察到,在準確率為100%時,本文算法與其他先進算法相比提高了召回率;在召回率相同時,本文算法表現出更高的準確率。曲線下的面積反映了模型在精確性和召回率之間的權衡表現,即面積越大,意味著模型在這2個方面的綜合效果越好,性能越出色。圖6結果表明,本文算法的曲線下面積超過其他先進算法,說明在回環檢測方面具有更高的精確性和召回率。

(a)KITTI數據集序列00

(b)KITTI數據集序列06

(c)KITTI數據集序列07

(d) KITTI數據集序列08

(e)KITTI360數據集序列00

(f)KITTI360數據集序列05

(g)KITTI360數據集序列06

(h)KITTI360數據集序列09

圖6 KITTI和KITTI360數據集的精度召回曲線比較

Fig. 6 Comparison of the precision recall curves of the KITTI and KITTI360 datasets

表2給出了平均精度指標的統計結果。由表2可知,相較于LCDNet算法,本文算法在正向環路中精度由86%提升至92%,反向循環中精度由36%提升至40%。相較于Scan Context算法,本文算法在正向環路中精度由82%提升至92%,在反向環路中由25%提升至40%。

表2所示結果表明,本文算法在回環檢測任務中表現出更出色的性能,能夠更準確地預測目標。

回環檢測在執行閉環校正和路徑優化方面對相對位姿產生積極影響。完成率表示對齊任務成功對準特征點的百分比,用以量化對齊過程的效果。同時,通過檢測回環事件并利用回環點位的相對位姿信息,可以有效校正路徑中的漂移誤差,提高機器人的定位準確性。因此,通過綜合考量完成率、平移誤差和旋轉誤差,能夠對2個點云之間的相對位姿估計進行綜合評估。

表2 KITTI和KITTI360數據集上平均精度比較

表3呈現了在公開數據集上進行實驗的結果,涵蓋了完成率、平移誤差以及選擇誤差。由表3可知,相對于LCDNet算法,本文算法實現了約 7個百分點的匹配成功率提升,平移誤差降低了約5%,而旋轉誤差降低了約5%。與Scan Context算法相比,本文算法實現了大約14個百分點的匹配成功率提升,平移誤差降低了約44%,旋轉誤差則減少了約80%。該結果表明本文算法能夠有效降低路徑累積誤差、提高定位準確性。

表3 KITTI和KITTI360數據集上正樣本對的完成率和相對位姿誤差比較

6.3 消融試驗

對MSCA模塊改進的特征提取和軟分配聚類改進的NetVLAD進行消融試驗。在KITTI數據集序列08上進行訓練和評估,并使用平均精度、平移誤差和旋轉誤差進行評估。

表4給出了對CA-LCDNet各個組件進行消融實驗得到的結果。

由表4可知,完整的CA-LCDNet在性能上優于消融試驗中的其他方法。MSCA模塊、軟分配聚類改進和UOT都對回環檢測效果產生了積極的影響。MSCA模塊增強了有價值的信息,同時削弱不太重要的點云像素作用。軟分配聚類模塊能夠更靈活地處理數據點屬于多個聚類的情況,從而減少模型復雜性。UOT模塊有助于確定最佳的路徑校正方法,維持路徑的一致性和準確性。

表4 CA-LCDNet不同組件的消融試驗

6.4 耗時分析

結合描述符提取、描述符比較和地圖查詢所需時間進行耗時性比較,將CA-LCDNet的運行時間與其他先進算法進行比較。

表5給出了回環檢測各個任務所需要的時間。

表5 回環檢測任務的耗時性分析

表5中,描述符提取時間包括了所需的預處理時間。描述符比較的含義是比較2個點云描述符所需的時間。在進行地圖查詢時,本文算法不需要額外的臨時函數來比較描述符,而是利用高效的Faiss(Facebook AI similarity search)庫進行相似性搜索來構建和查詢地圖。

表5實驗數據表明,所采用算法展現出的整體執行時間較為緊湊,符合實時性的應用需求;算法在效率方面呈現優越性,顯示出在給定任務背景下的高效處理能力。

7 結論

為提高特征提取能力以應對位姿累積誤差大引起的定位漂移問題,提出了一種融合卷積注意力機制的激光SLAM回環檢測網絡。在公開數據集下進行仿真試驗,得出以下結論:

1)通過引入融合卷積注意力機制的特征提取方法,獲得了更出色的精度曲線和更低的相對位姿誤差,有效提高了回環檢測的準確性,生成了更加精確的地圖。

2)消融實驗結果顯示,改進后的架構具備更強的魯棒性,有效減少了誤差積累,提高了地圖的一致性。

展望:實驗結果也表明,在激光點云存在部分重疊區域時,相對位姿誤差仍存在,后續還需針對該問題開展進一步研究。

[1] 王金科, 左星星, 趙祥瑞, 等. 多源融合SLAM的現狀與挑戰[J]. 中國圖象圖形學報, 2022, 27(2): 368-389. WANG JINKE, ZUO XINGXING, ZHAO XIANGRUI, et al. Review of multi-source fusion SLAM: current status and challenges[J]. Journal of Image and Graphics, 2022, 27(2): 368-389(in Chinese).

[2] SAEEDI S, PAULL L, TRENTINI M, et al. Neural network-based multiple robot simultaneous localization and mapping[J]. IEEE Transactions on Neural Networks, 2011, 22(12): 2376-2387.

[3] 謝曉佳. 基于點線綜合特征的雙目視覺SLAM方法[D]. 杭州: 浙江大學, 2017. XIE XIAOJIA. Stereo visual SLAM using point and line features[D]. Hangzhou: Zhejiang University, 2017(in Chinese).

[4] 韓明瑞, 周波, 錢堃, 等. 基于激光雷達的室外移動機器人三維定位和建圖[J]. 華中科技大學學報(自然科學版), 2015, 43(S1): 315-318. HAN MINGRUI, ZHOU BO, QIAN KUN, et al. 3D localization and mapping of outdoor mobile robots using a LIDAR[J]. Journal of Huazhong University of Science and Technology (Nature Science Edition), 2015, 43(S1): 315-318(in Chinese).

[5] BOSSE M, ZLOT R. Place recognition using keypoint voting in large 3D lidar datasets[C]//2013 IEEE International Conference on Robotics and Automation. Karlsruhe, Germany: IEEE, 2013: 2677-2684.

[6] HE L, WANG X, ZHANG H. M2DP: a novel 3D point cloud descriptor and its application in loop closure detection[C]//2016 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS). Daejeon, Korea (South): IEEE, 2016: 231-237.

[7] HU M, LI S, WU J, et al. Loop closure detection for visual SLAM fusing semantic information[C]//2019 Chinese Control Conference (CCC). Guangzhou, China: IEEE, 2019: 4136-4141.

[8] KIM G, KIM A. Scan context: egocentric spatial descriptor for place recognition within 3d point cloud map[C]//2018 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS). Madrid, Spain: IEEE, 2018: 4802-4809.

[9] CATTANEO D, VAGHI M, VALADA A. Lcdnet: deep loop closure detection and point cloud registration for lidar slam[J]. IEEE Transactions on Robotics, 2022, 38(4): 2074-2093.

[10] GUO M H, LU C Z, HOU Q, et al. Segnext: rethinking convolutional attention design for semantic segmentation[J]. Advances in Neural Information Processing Systems, 2022, 35: 1140-1156.

[11] 仝衛國, 蔡猛, 龐雪純, 等. 基于多尺度特征融合的超分辨率重建算法研究[J]. 科學技術與工程, 2022, 22(26): 11507-11514. TONG WEIGUO, CAI MENG, PANG XUECHUN, et al. Super-resolution reconstruction algorithm based on multi-scale feature fusion[J]. Science Technology and Engineering, 2022, 22(26): 11507-11514(in Chinese).

[12] ARANDJELOVI? R, GRONAT P, TORII A, et al. NetVLAD: CNN architecture for weakly supervised place recognition[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 40(6): 1437-1451.

[13] SHI S, GUO C, JIANG L, et al. PV-RCNN: point-voxel feature set abstraction for 3d object detection[C]//2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Seattle, WA, USA: IEEE, 2020: 10526-10535.

[14] QI C R, SU H, MO K, et al. Pointnet: deep learning on point sets for 3d classification and segmentation[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Honolulu, HI, USA: IEEE, 2017: 77-85.

[15] LIN T Y, DOLLáR P, GIRSHICK R, et al. Feature pyramid networks for object detection[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Honolulu, HI, USA: IEEE, 2017: 936-944.

[16] LEE J, RO Y M. Dual-branch structured de-striping convolution network using parametric noise model[J]. IEEE Access, 2020, 8: 155519-155528.

[17] HUANG G, SUN Y, LIU Z, et al. Deep networks with stochastic depth[C]//Computer Vision–ECCV 2016. Cham, Germany: Springer International Publishing, 2016: 646-661.

[18] JéGOU H, DOUZE M, SCHMID C, et al. Aggregating local descriptors into a compact image representation[C]//2010 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. San Francisco, CA, USA: IEEE, 2010: 3304-3311.

[19] CUTURI M. Sinkhorn distances: lightspeed computation of optimal transportation distances[J]. Advances in Neural Information Processing Systems, 2013, 26: 2292-2300.

[20] SCHROFF F, KALENICHENKO D, PHILBIN J. Facenet: a unified embedding for face recognition and clustering[C]//2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Boston, MA, USA: 2015: 815-823.

[21] GEIGER A, LENZ P, URTASUN R. Are we ready for autonomous driving? The KITTI vision benchmark suite[C]//2012 IEEE Conference on Computer Vision and Pattern Recognition. Providence, RI, USA: IEEE, 2012: 3354-3361.

[22] LIAO Y, XIE J, GEIGER A. KITTI-360: a novel dataset and benchmarks for urban scene understanding in 2D and 3D[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2022, 45(3): 3292-3310.

Loop Closure Detection Network Fused with Convolutional Attention for Lidar SLAM

YAO Wanye, YANG Zhenhui, WANG Zhu

(Department of Automation, North China Electric Power University, Baoding 071003, China)

In order to solve the problem of low accuracy of feature matching caused by scale change and visual angle change when the current loop detection method based on deep learning responds to reverse loop, a loop closure detection network (CA-LCDNet) of lidar simultaneous localization and mapping (SLAM) using convolutional attention enhancement is proposed. When CA-LCDNet constructs local descriptors, it introduces convolution attention mechanism to realize organic fusion of multi-scale features and enhance adaptive feature extraction ability. Network-based visual localization with attention to descriptors (NetVLAD), which is based on soft allocation clustering, efficiently aggregates local descriptors to obtain global descriptors. Based on the unbalanced optimal transport theory, the feature matching between point cloud frames is realized, and the relative pose between two frames is calculated. An accurate estimation of relative pose error is realized by using the triplet loss training global descriptor. Compared with the open data set, the accuracy of the algorithm is 92% in forward loop and 40% in reverse loop. Compared with the original LCDNet algorithm, the improved algorithm can rectify the relative pose error by about 5%.

mobile robot; robot navigation; loop closure detection; convolution attention; random depth; deep learning

10.3969/j.ISSN.1672-0792.2024.02.006

TP391.9

A

1672-0792(2024)02-0050-11

國家自然科學基金資助項目(61903033,U21A20486);中央高?;究蒲袠I務費專項資金資助項目(2020MS116)。

2023-10-02

姚萬業(1965—),男,教授,研究方向為移動機器人自主導航控制;

楊振輝(1999—),男,碩士研究生,研究方向為深度學習、移動機器人導航與建圖;

王祝(1991—),男,副教授,研究方向為機器人自主控制、多機器人協同。

王祝

猜你喜歡
回環描述符特征提取
基于結構信息的異源遙感圖像局部特征描述符研究
嘟嘟闖關記
基于AKAZE的BOLD掩碼描述符的匹配算法的研究
基于Daubechies(dbN)的飛行器音頻特征提取
透 月
Linux單線程并發服務器探索
利用CNN的無人機遙感影像特征描述符學習
Bagging RCSP腦電特征提取算法
學習“騎撐前回環”動作的常見心理問題分析及對策
基于MED和循環域解調的多故障特征提取
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合