?

基于人工神經網絡的避障算法實踐探索*

2023-06-06 08:04嚴嘉浩

智庫時代 2023年16期

關鍵詞：掩碼移動機器人激光雷達

嚴嘉浩

（浙江同濟科技職業學院）

隨著機器人在不用應用領域的蓬勃發展，人們的生產生活中出現了各類功能多樣的通用型或專用型機器人，部分機器人的工作區域跟操作人員或者普通人出現的位置可能出現較多重合，因此，機器人在場地內運動時需要避開人體的移動軌跡，即實現機器人對人體的避障運動。

機器人運動中實現對人體避障的檢測方式有基于激光雷達的[1]、基于超聲測距的[2]、基于帶深度信息的視覺方案的[3]，也有純視覺方案的[4]，以上方案在不同方面或者程度上具有一定局限性，主要有傳感器成本較高、算法較為復雜、對機器人所處環境有一定要求（例如純視覺方案的機器人避障算法不能良好處理強光或弱光環境），因此，本文提出了一種基于視覺和激光雷達方案的機器人避障算法，通過基于DFANet[5]的圖像語義分割算法得到分割掩碼后，將其與單線激光雷達測得的數據融合，將代表人體移動位置的信息寫入機器人運動路徑規劃模塊，最終實現機器人在預設場景中的避障行駛。

一、基于神經網絡的圖像語義分割算法

（一）圖像語義分割

圖像語義分割[6]一直是醫學圖像、自動駕駛領域的研究熱點。在圖像處理的粒度上圖像分割可歸為兩種不同類別：一類是將圖片中所有像素點歸為可解釋的對象，即為語義分割，比如將圖片中出現的全部人體標記為“人體”，所有出現的“人”都屬于同一個標簽；二是實例分割[7]，即將圖片中的某類標注為不同子標簽，例如，在某張圖片中出現多個人體，將他們標記成不同顏色的單個個體，但其所屬大類標簽依然為“人體”。

（二）基于DFANet 的圖像語義分割算法

雖然目前語義分割網絡結合多尺度圖像的輸入，引入了金字塔結構[8]、殘差結構[9]、級聯特征融合等方式，在圖像理解方面取得了相當高的準確率，但其具有的網絡結構較深、參數過多的特點使得語義分割模型的訓練較慢，并且在特定領域，尤其是自動駕駛方面，因為其前向推理速度較慢，它們的落地依然有著一定局限。因此，本文使用基于DFANet 的圖像語義分割算法，以輕量級骨干網為基礎，使用子網聚合和子階段聚合的方式進行特征的聚合區分，大幅減少了模型參數量但仍能獲取足夠的感受野，在模型前向推理速度和圖像分割性能上取得了兩者的平衡。DFANet 的輕量級骨干網使用Xception[10]模塊作為主要結構，并為取得最大的感受野在其尾部加入全連接注意力模塊；子階段聚合模塊通過融合了不同粒度的特征表示，將尺寸相同的各層結果組合，可以提供高層結構細節信息和感受野的傳遞。最后通過卷積和上采樣構成的解碼器得到不同粒度的圖像分割結果。

（三）模型優化

由于本文算法最終部署在Nvidia Jetson TX2 上，其為英偉達公司推出的一款嵌入式AI計算設備，其算力、功耗受限，前向推理能力弱，如直接運行基于DFANet 的圖像語義分割算法，則其FPS 有限，因此需要對基于DFANet 的語義分割算法進行在部署端，即在邊緣計算設備Nvidia Jetson TX2 上的模型加速。本文使用針對英偉達圖形處理單元的高性能深度學習推理優化器和運行時加速庫TensorRT作為模型優化方式，其優化原理可分為對網絡模型的裁剪和數據精度校準：對網絡模型的裁剪可分成在垂直方向上調整網絡（將卷積層、偏置層、激活函數層融合）、在水平方向上調整網絡（將輸入參數相同和進行操作相同的過程融合）以及減少concat 拼接層；數據精度校準的含義為在模型訓練時采用精度稍高的FP32 或FP16，部署后推理時采用精度相對較低的FP16 或INT8量化精度。

（四）結果分析

本文使用的訓練平臺為單卡3080，測試平臺及邊緣計算平臺為Nvidia Jetson TX2，cuda-10.2，cuDnn-8.4，TensorRT 8.5，PyTorch 1.0.0，訓練及測試數據集來源于cityscapes[11]，圖像尺寸1024*512。實驗結果如表1 所示，使用網絡模型裁剪+數據精度校準方式比在TX2 上直接使用PyTorch 框架進行分割快52%，并且平均IOU 基本沒有損失。在cityscapes 數據集中，mIOU(class)表示在19 類小類別上的分割精度，mIOU(category)表示大類上的分割精度，如汽車、自行車為2 種小類別，但其對應的大類都為車。

表1 模型優化結果（1024×512 分辨率）

二、基于人工神經網絡的避障算法實現

本文基于人工神經網絡的避障算法基于機器人操作系統（Robot Operating System,ROS）實現，ROS 的產生是為了解決機器人內部各結構之間的溝通協調問題，以實現機器人對環境的感知并最終完成機器人預定的整體功能，其核心思想是將機器人的不同軟件功能做成不同的節點（node），不用節點間通過通信協議互相傳遞消息，并且其節點可全部位于同一臺主機，也可分布于不同機器之上。

基于人工神經網絡的避障算法軟件總體設計如圖1 所示，主要分為環境傳感器、圖像分割模塊、數據融合模塊等與傳感器相關的信息處理部分，及與機器人運動相關的代價地圖、全局/局部路徑規劃模塊及運動控制模塊。

圖1 軟件總體設計

算法的整體流程為：在已經建立起所需要的環境地圖后，在rviz 中使用2d Navigation Goal 設定移動機器人的目的點，或者在不方便使用可視化界面使用鼠標選取目的點時，可以在程序中創建節點以發布action 消息（在ROS 機器人操作系統中，消息分為topic 話題、service服務、action 動作3 種基本類型）；在此期間移動機器人通過搭載的單線激光雷達獲取與周圍環境的測距信息，并將計算得到的LaserScan 消息發布到sensor話題中；同時機器人搭載的RGB攝像頭獲取尺寸為1920*1080的圖像并將其發布到camera 話題；數據融合模塊通過同時訂閱sensor 及camera 話題，獲取其上的消息，將其中的激光雷達數據跟單目視覺攝像頭數據進行處理后，得到環境中人體的位置及移動速度，將其包裝成People 消息發布到對應的人體話題；局部代價地圖中的social_navigation_layer 通過訂閱人體話題，使用高斯分布調整人體周圍的代價，在全局代價地圖的基礎上獲得局部代價地圖，引導移動機器人的局部路徑規劃，將機器人所需要的運動控制信息發布到cmd_vel 話題；最終與邊緣計算平臺Nvidia Jetson TX2 物理連接的下位機Teensy，通過訂閱cmd_vel 話題得到機器人所需要的運動控制消息，最終通過控制其引腳上的電平實現對移動機器人方向舵機和油門的控制。

軟件總體設計中的圖像分割模塊即為運行在Nvidia Jetson TX2 上經優化的基于DFANet 的圖像語義分割算法，其調用opencv 將獲取的圖像resize 為1024*512 尺寸，輸出結果為與輸入尺寸一致1024*512 分辨率的分割掩碼，其掩碼包括需要區分的人體、地面（可行駛區域）等。

本文的數據融合模塊主要處理來自圖像分割模塊的掩碼信息及來自單線激光雷達的數據。由于本位需要獲得信息為人體在場景中的精確位置信息，單獨的圖像分割得到的人體位置掩碼或者單獨的激光雷達數據并不能提供我們所需要的信息，因此，需要將人體分割掩碼及激光雷達數據作對齊處理。本文實現的操作為：在該幀時間中獲取雷達數據，將人體分割掩碼存在的區間按照標定轉換至極坐標空間，在此區間內的雷達探測數據標記為測得的距離人體精確信息，最后將人體位置信息發送到人體消息話題以供其他模塊使用。

社會活動導航層是本文實現的根據人體位置信息實現避障的主要規劃器，其為局部代價地圖上本文設計的一個插件，主要通過訂閱人體消息話題，以高斯分布的方式調整在場景中出現的人體周邊代價，其代價隨人體移動方式而變化，例如當人體靜止時，其周圍高斯代價分布為圓形；當人體朝某個方向運動時，人體運動方向上的高斯代價將會增加。社會活動導航層的設置使得移動機器人的運動過程能盡量避免影響場景中的人體活動。

本文中基于人工神經網絡的避障算法實現了場景中視覺信息的讀取，使用優化后的基于DFANet 圖像語義分割算法得到人體分割掩碼，將其與單線激光雷達數據對齊獲得人體位置信息，在局部代價地圖中添加社會活動導航層，設置人體周圍的高斯代價，使移動機器人的運動盡量遠離人體的移動趨勢方向，最終實現了移動機器人在已擁有地圖信息情況下在場景中的避人避障運動，到達指定目標點。

三、進一步研究

由于本文使用的圖像分割方式是圖像語義分割而并不是實例分割，因此當場景中出現多個人體時，會將其標簽為同一類，在將掩碼與單線激光雷達的數據結合獲取人體位置與速度信息時，只能將圖像中連續的人體歸為同一個個體進行運動軌跡的預測，因此在嵌入式平臺的視覺傳感器獲取到的圖像中出現重疊人體時，機器人的避障軌跡并不能得到良好規劃。因此，本文后續將使用實例分割算法，使分割得到的人體能被標記成不同個體，從而更準確估計多人場景中的人體運動路徑，完成機器人在多人場景中的避障行駛。

四、結語

隨著科技的不斷發展，人類生活中出現了越來越多且功能不同的機器人，并且機器人在人的活動場所出現得越來越頻繁，已影響到人類的正常工作和生活。為了使機器人在場所中的運動過程中盡量不對人產生干擾，需要對機器人的運動軌跡作出調整，使其不干擾人類的正?；顒?。本文使用激光雷達和基于神經網絡的圖像分割算法實現了機器人對人體的良好規避，具有廣泛的應用前景。

【相關鏈接】

浙江同濟科技職業學院（Zhejiang Tongji Vocational College of Science and Technology），簡稱同濟學院，位于浙江省杭州市，是一所由浙江省水利廳舉辦的公辦全日制普通高等院校，浙江省唯一一所水利類職業院校，2014 年入選全國水利教育示范院校，是全國水利高等職業教育示范院校、水利部首批水利行業高技能人才培養基地、全國文明單位。

浙江同濟科技職業學院前身是1959 年成立的浙江水電技工學校和1984 年成立的浙江水利職工中等專業學校。1996 年3 月，浙江水電技工學校和浙江水利職工中等專業學校聯合辦學。2007 年經浙江省人民政府批準正式更名為浙江同濟科技職業學院。

猜你喜歡

掩碼移動機器人激光雷達

手持激光雷達應用解決方案

北京測繪(2022年5期)2022-11-22

移動機器人自主動態避障方法

北京航空航天大學學報(2022年6期)2022-07-02

法雷奧第二代SCALA?激光雷達

汽車觀察(2021年8期)2021-09-01

低面積復雜度AES低熵掩碼方案的研究

通信學報(2019年5期)2019-06-11

基于激光雷達通信的地面特征識別技術

中國交通信息化(2019年1期)2019-03-26

基于激光雷達的多旋翼無人機室內定位與避障研究

電子制作(2018年16期)2018-09-26

基于布爾異或掩碼轉算術加法掩碼的安全設計*

通信技術(2018年3期)2018-03-21

基于Twincat的移動機器人制孔系統

制造技術與機床(2017年3期)2017-06-23

基于掩碼的區域增長相位解纏方法

浙江大學學報（工學版）(2015年4期)2015-03-01

基于掩碼的AES算法抗二階DPA攻擊方法研究

電子設計工程(2015年20期)2015-01-29

智庫時代2023年16期

智庫時代的其它文章: 改革創新背景下思政課的滿意度驅動因素研究; 《建筑材料》課程思政教學探索與實踐研究*; 以“家國情懷、職業素養、個人修養”為主線的課程思政教學改革與實踐*
——以《老年護理》課程為例; 地方高校實驗室建設與管理的思考
——以凱里學院為例; 課程思政在專業課程中的融合與創新初探*
——以《數字合成與特效技術》為例; 基于典型生產過程教學實踐*
——以校園環境噪聲監測項目為例

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合