?

智能識別與空間定位技術在高速鐵路車站的應用研究

2024-03-11 02:38趙俊清
鐵道運輸與經濟 2024年2期
關鍵詞:單目候車室標定

邊 原,趙俊清

(1.中鐵電氣化局集團有限公司 設計研究院,北京 100166;2.中鐵電氣化局集團有限公司信息中心,北京 100036)

0 引言

設施設備管理是建筑全生命周期管理的重要組成部分,信息化已成為其發展趨勢[1-2]。其中智能識別與空間定位技術是設施設備管理信息化主要技術,室內定位技術是指在室內環境中實現位置定位,目前主要采用無線通信、基站定位、慣導定位、動作捕捉、圖像識別等多種技術形成室內位置定位的依據,實現人員、物體等在室內空間的位置監控[3-4]。

隨著我國高速鐵路快速發展,高速鐵路車站的數量與規模不斷擴大,各種應急情況也不可避免地會發生。根據高速鐵路車站內流動性設施設備特點,需利用固定攝像頭的空間定位算法,實現對特定設施、設備的空間位置信息自動化提取。傳統的利用固定攝像頭的單目測距方法有對焦測距法、散焦測距法,但這2 種方法對于攝像設備的精度要求很高,測量的精度主要決定于測量儀器。而目前市場上使用固定式相機的空間定位方法,主要是通過定位系統中的對比數據庫來進行定位,在對比數據庫中記錄著特定物體到固定式相機的相對距離以及在該位置時相機成像數據中的該物體的像素尺寸,兩者之間為一一對應關系。當需要進行目標定位時,通過比對數據庫中的物體像素尺寸和待測圖像中物體像素尺寸,找到符合的大小,來進行近似的距離的判定。如果數據庫中沒有與物體在攝像機平面內的實時狀態完全對應的數據,在估算距離的時候會產生大量誤差,精確度不是很高,并且每一個攝像機都需要連接1 個單獨的控制器(數據庫),無法做到數據的統一管理。

上述定位方式由于成本較大、需重新施工等因素使其難以實現,傳統運維管理方法已逐漸不能滿足高速鐵路車站復雜環境下的需要,基于智能識別與空間定位技術的運維管理方法,作為一種新思路,具有廣泛的應用前景,故研究設計一種基于單目攝像機的特定設備設施空間定位系統,利用人工智能深度學習的方式來解決特定設備設施空間定位的問題。

1 基于單目相機的特定設備設施空間定位技術研究

1.1 單目相機特定設備設施空間定位方法設計

監測設備設施是否發生位移,需要對所監測的物體進行實時測距,測距的首要任務是目標檢測,車站場景下受外界環境因素(光照、陰影、天氣和噪聲等)的干擾,并存在行人與物體之間、物體與物體之間的遮擋等問題,都極大地增加了各類目標檢測的難度。當前的目標檢測都是基于區域級信息的,但距離測量需要精確的像素級信息,因此提高目標檢測的精度至關重要。隨著深度學習技術的不斷發展,圖像識別技術的研究成果包括RCNN 系列、YOLO、SSD 系列等,在檢測的精度和速度上獲得了較大的提升?;诖?,設計一種基于深度學習的單目相機場地內特定設備識別定位方法,使用深度學習的方法來進行物體監測,對特定物體的錨框定位做到像素級,用圖像像素坐標還原的方式進行精準定位。

高速鐵路車站BIM運維管理系統與單目相機空間定位技術融合如圖1 所示,通過圖像智能識別和特定空間定位模塊,實現設備空間位置信息的獲取,能夠幫助基于BIM技術的車站運營管理系統實現特定設備、設施的實時位置監測,配合模型自動更新技術能夠實現運維模型與現實世界的實時統一,保持運維模型信息的實時有效性。

圖1 高速鐵路車站BIM運維管理系統與單目相機空間定位技術融合Fig.1 Integration of BIM Operation and Maintenance Management System with monocular camera spatial positioning technology in high speed railway stations

1.2 圖像識別技術

圖像識別技術包括R-CNN,Fast R-CNN,Mask R-CNN,只看一次的快速檢測網絡(You Only Look Once,YOLO)和BoderDet 等經典的目標檢測算法,根據高速鐵路車站現場情況和實際需求,選定YOLO 和BoderDet 檢測速度快、適合實時應用的模型來進行特定設備設施的識別。

(1)YOLO。YOLO 是一種經典的單階檢測器,其將檢測目標的任務變成對目標區域預測及對類別預測的回歸問題,該方法利用單個神經網絡直接預測物品邊界和類別概率,從而實現端到端的物品檢測[5],實現快速地對標定目標進行檢測,并且能夠達到較高的準確率。YOLO 可分為YOLO V1,YOLO V2,YOLO V3,YOLO V4,YOLO V5,YOLOX等,本研究主要參考了YOLO V5和YOLOX模型。①YOLO V5為一種單階目標檢測模型[6],是基于YOLO V4 做了部分新的改進,使得預測速度和精度都得到了極大的提升;②YOLOX 是一種高性能檢測器[7],是將解耦頭、數據增強、無錨點以及標簽分類等目標檢測領域的新進展與YOLO進行了有效的組合,從而使其平均精度(AP)、預測速度都得到提升。

(2)BoderDet。大量的研究結果發現對于只使用1 個點的特征去預測框的分類和回歸是不夠的,通常的做法是確定物體邊界框上的4 個極限點來確定,邊界極限點特征對物體定位確實有非常重要的作用。BoderDet 是基于無錨框目標檢測算法(Fully Constitutional One-Stage Object Detection,FCOS)檢測架構[8-9],在特征金字塔的預測中加入BAM 模塊。首先進行初步bbox 預測和初步分類預測,然后將初步bbox 預測輸入到BAM 模塊得到Border 分類預測和Border bbox預測,預測使用1×1卷積,最后統一2 種結果進行輸出。BoderDet 提供了一套簡單、通用的方法來獲取極限點的特征,為目標檢測領域中檢測框特征表達提供了一個全新的思路。

1.3 單目相機空間定位技術

單目相機空間定位是一種利用單個攝像頭獲取場景信息并通過計算機視覺算法來估計相機位置的技術。在計算機視覺和機器人領域,單目相機空間定位被廣泛應用于無人駕駛、增強現實、機器人導航等領域。單目相機空間定位技術主要分為相機標定和坐標還原2個步驟。

(1)相機標定。為確定空間物體表面某點的三維幾何位置與其在圖像中對應點之間的相互關系,需要建立相機成像的幾何模型,幾何模型參數就是相機參數[10]。進行攝像機標定的目的就是求出相機的內、外參數,以及畸變參數。采用棋盤格標定板完成相機標定,得到相機的內參矩陣,并建立以地面為平面的真實坐標系。棋盤格標定板是最常見的相機標定方法,它由黑白相間的正方形組成,棋盤格的對角線交點形成一個共用角點。使用棋盤格標定板,可以通過拍攝多張帶有棋盤格的圖像,并在圖像中標記棋盤格的角點,從而計算相機的內、外參數。

(2)坐標還原。通過標定板獲得相機的內、外參數,根據內外參數通過公式從像素坐標轉換為世界坐標。坐標還原流程如圖2 所示,通過平移、尺寸伸縮、投影等方法完成坐標映射,將視頻照片中的物體的像素坐標還原為世界坐標下的真實坐標。

圖2 坐標還原流程Fig.2 Coordinate restoration process

2 圖像識別技術應用實驗

通過在高速鐵路車站現場調研,獲取車站內部流動性設備設施種類、位置、尺寸數據,確認現場攝像頭數量、分布密度、朝向、種類等信息。獲取現場車站空間大小、空間排布、三維結構等相關數據,根據這些數據制作檢測識別數據集,實現特定設備設施的識別。

2.1 數據集制作流程及類別統計

從某高速鐵路車站監控系統中獲取候車室監控的視頻數據,并按照視頻抽幀、視頻轉成圖片、圖片去重、光影去噪、圖像標注的流程進行數據整理,構建高速鐵路車站候車室內特定流動性設備設施的數據集。數據集中總共標注了1 704 張圖片,使用水平檢測框進行標注,參考現場環境設備的實際流動性,共標注座椅、花盆、廣告牌、充電箱4 類設備設施,數據集中各類設備設施的樣本標記數量如表1所示。

表1 數據集中各類設備設施的樣本標記數量個Tab.1 The number of labeled samples for various types of equipment and facilities in the dataset

2.2 檢測及識別結果

參考YOLOX 訓練的數據集,得到候車室流動性設備設施的數據集訓練AP 結果如圖3 所示。從圖3 顯示的結果中可以看出YOLO 的訓練模型在迭代23~30 次后,座椅、廣告牌、充電箱3 種設備的AP收斂很快,而花盆仍然處于0.6左右,除了現場樣本數量不均衡因素以外,考慮是由于花盆在圖像中所占的像素點太少造成的檢測精度過小,故考慮采用BorderDet 進行訓練,利用其能夠加強特征點的識別率來解決現場存在大量小體積、少像素點的待檢測物體的識別問題。

圖3 候車室流動性設備設施的數據集訓練AP結果Fig.3 The training Average Precision (AP) results for the dataset of mobility equipment and facilities in the waiting room

更換BorderDet 為訓練模型,得到候車室流動性設備設施的檢測及識別結果如圖4 所示,對于體積小、外輪廓形狀規則的待監測物體(如花盆等),以及體積大、外輪廓形狀復雜的被監測物體(如座椅)都能夠很好地被識別出來。實際運營場景中會發生人員遮擋待監測物體,基于此進行檢測,得到候車室座椅有遮擋情況下的檢測識別結果如圖5 所示,可以看出,即使在有人員或物體遮擋的情況下,檢測識別模型仍然能夠有效預測出所有的待檢測物體特征點,能夠準確地識別出物體的種類和數量,并且完好地用檢測框圈定待檢測物體。

圖4 候車室流動性設備設施的檢測及識別結果Fig.4 The detection and recognition results of mobility equipment and facilities in the waiting room

圖5 候車室座椅有遮擋情況下的檢測識別結果Fig.5 The detection and recognition results of seating facilities in the waiting room under occlusion conditions

3 空間定位技術應用

3.1 實驗結果與誤差分析

為了在車站候車室現場取樣實驗之前證實空間定位方法的有效性,在開闊的室內模擬環境中,進行了被監測物體特征點回歸世界坐標的實驗,待檢測物體設定為一個20 cm×20 cm 的紙箱子,模擬定位實驗如圖6所示。實驗中一共取樣15個點,監測點為紙箱正面左下角角點。模擬定位實驗結果如表2 所示。由表2 可知,如果預測點在標定板上面以及2 m以內的附近,能夠比較精準地從圖片中預測出被測物體在現實坐標系下的位置信息,誤差平均能夠控制在10 cm 以內;反之如果預測點距離標定板越遠,預測結果的誤差就越大。

表2 模擬定位實驗結果Tab.2 Simulated localization experiment results

圖6 模擬定位實驗Fig.6 Simulated localization experiment

因此,若對整個候車室的場景進行標定時,需將1 個相機視野進行空間劃分,進行多次標定,在不同的標定網格內的空間位置預測都是通過該網格的坐標體系來進行表達,再通過每一次標定時標定板原點之間的實際相對位置關系復原整個相機視野空間并統一坐標體系,用這種多次標定的方法來減小統一相機視野內的誤差。

3.2 車站候車室內的標定工作

以某高速鐵路車站為例,對其候車室內的標定工作主要分為2 部分,即對車站內候車室進行相機標定和不同相機視野的空間坐標系建立。①對車站候車室建立13 個不同的相機視野,每個視野內進行2 次標定,每一次標定可以覆蓋周圍6 組座椅,并且對每次標定板的原點位置進行了測量與記錄;②不同相機視野的空間坐標系建立中,分別建立對應的以地面為平面的現實世界坐標系,將所有單獨坐標系根據其原點的相對位置整合成一個完整的以地面為平面的候車室世界坐標系,將每個被測目標所得到的對應相機世界坐標系的坐標通過該坐標系原點與統一坐標系原點之間的向量,可以獲得被測目標在候車室統一坐標系下的精準定位。

3.3 標定及定位結果

基于標定結果,對候車室統一坐標系原點。①取縱坐標為10~15 m距離處的2組座椅進行定位,定位點均為座椅的接地角點,根據預先測量好的座椅尺寸,定位數據接地點之間定位坐標的差值與預先測量的座椅長度、寬度數值的誤差分別為1 cm和4 cm;②取縱坐標為20~25 m 距離處的2 組座椅進行定位,定位點均為座椅的接地角點,根據預先測量好的座椅尺寸,定位數據接地點之間定位坐標的差值與預先測量的座椅長度、寬度數值的誤差分別為3 cm和1 cm;③取縱坐標為40~45 m距離處的2 組座椅進行定位,定位點均為座椅的接地角點,根據預先測量好的座椅尺寸,定位數據接地點之間定位坐標的差值與預先測量的座椅長度、寬度數值的誤差分別為1 cm和4 cm。因此所有2 m內范圍的標定誤差都在5 cm以內。

對于所有的標定結果進行完定位測試后發現,由于在標定時標定板及其周圍2 m以內的空間將相機視野完全覆蓋,而所有相機視野又能夠完整覆蓋整個候車室,因此整個候車室的空間定位誤差應控制在5 cm 以內,能夠滿足日常運維的模型定位誤差需求。

4 基于單目相機的特定設備設施空間定位系統

研究如何實現基于單目相機特定設備設施的空間定位,整個過程分為5 個階段:①進行圖像數據的獲取以及預處理,得到關鍵幀數據,將全部關鍵幀數據經行標注并訓練;②經過目標檢測階段,通過已經訓練好的數據集,利用目標檢測特征庫進行目標檢測,得到目標檢測結果;③根據已得到的檢測結果進行特定設備的空間定位。在前期進行了定位標定分區、世界坐標校準,根據檢測到的特定設備接地特征點的像素點信息轉化后即可得到空間坐標;④進行數據異常預測,根據時序數據庫獲取目標歷史位置,根據相鄰幀的對比,判斷檢測目標是否發生位移;⑤將檢測框、檢測信息、定位信息等數據渲染到結果視頻畫面中,并輸出數據表單。根據上述5 個階段,設計基于單目相機的特定設備設施空間定位系統。

系統的架構設計使用成熟的MVC 三層架構,系統分為前端展示層、業務邏輯層和數據層,系統架構如圖7 所示。前端展示層包括對目標的檢測、識別和定位結果顯示等;業務邏輯層包括視頻數據預處理、深度學習模型訓練、深度學習模型構建、特定設備目標定位、特定設備目標識別、特定設備目標檢測,以及數據接口等;數據層包括訓練模型使用的樣本數據和監控攝像頭傳輸的實時數據。其中最核心的模塊就是目標檢測模塊和目標定位模塊,目標檢測模塊可判定待檢測設備,目標定位模塊可獲取待檢測設備的空間坐標,基于2 個模塊可實現特定設備設施的空間定位。

圖7 系統架構Fig.7 System architecture

(1)目標檢測模塊。目標檢測的算法流程主要分為模型訓練階段和目標實時檢測階段2部分。在模型訓練階段,利用已有的特定設備訓練樣本的數據,通過樣本預處理,利用高效率模型進行訓練建模,獲取各種特定設備的目標檢測特征庫,提供給實時目標檢測階段使用。實時檢測階段主要完成實時監控視頻的視頻分割、視頻預處理、目標實時檢測等。

(2)目標定位模塊。目標定位算法流程分為2 個階段,前期對每個單目攝像頭對應目標的物理坐標進行計算和存儲,并建立物理坐標和像素坐標的映射關系。根據目標定位算法結果,實時計算該目標在視頻中的像素坐標,再根據目標檢測算法檢測到目標的面積變化,通過像素坐標和物理坐標可以得到目標的三維物理坐標,實現目標實時定位。

5 結束語

通過實驗方法對智能目標識別與空間定位技術在高速鐵路車站的應用進行了驗證,結果表明其與現有技術相比,具有改造成本低、匹配正確率高、定位準確等優點。鐵路BIM 綜合運維管理系統中引入智能識別與空間定位技術[14-15],有助于實現鐵路設備設施BIM 模型位置自動實時更新,保持運維模型實時與現實場景一致。未來仍需繼續改進檢測識別以及空間定位性能,同時擴大該方法使用場景,提升基于BIM 模型運維管理的實用性。

猜你喜歡
單目候車室標定
使用朗仁H6 Pro標定北汽紳寶轉向角傳感器
一種單目相機/三軸陀螺儀/里程計緊組合導航算法
車站秀
關于候車室商業網點的優化建議
單目SLAM直線匹配增強平面發現方法
基于勻速率26位置法的iIMU-FSAS光纖陀螺儀標定
基于CAD模型的單目六自由度位姿測量
船載高精度星敏感器安裝角的標定
基于單目立體視覺的三坐標在線識別技術研究
基于Harris-張正友平面標定法的攝像機標定算法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合