?

基于YOLOv5算法的調車作業車廂檢測技術研究

2024-04-23 13:33陳文軒王發剛
時代汽車 2024年7期
關鍵詞:調車車廂特征

陳文軒 王發剛

摘 要:本文研究了調車作業過程中,利用機器視覺技術輔助調車作業司機進行目標車廂識別的作業過程。利用YOLOv5算法,采集調車作業常見環境下包含待掛車廂目標的圖像,在LabelImg中進行標注,通過數據訓練,得到車廂檢測識別系統。并在調車作業中進行實驗測試,獲得了較高的檢測精度。本技術可以輔助調車員進行車廂識別的作業,提高了作業效率與安全性。

關鍵詞:調車作業 車廂檢測

1 引言

鐵路調車作業是鐵路運輸行業的重要環節,通過人工攀爬車廂進行瞭望的摘掛車廂作業具有一定的局限性,作業環境危險性高。隨著人工智能技術的發展,將機器視覺應用到調車作業中,輔助人工作業,實時檢測需要連掛的車廂位置,并將采集到的待掛車廂前方視頻信息實時傳送到機車駕駛室,輔助調車司機確定目標車廂的實時位置,提高了作業效率和安全性[1]。

傳統的視覺目標檢測技術通過對目標顏色、紋理及邊緣等特征的分析,區分目標物體和背景。由于檢測過程受到復雜背景、光照強度及目標物體移動等因素的影響,使得檢測精度較低,檢測過程穩定性較差。

對于調車作業車廂目標的檢測,運用回歸思想的YOLO算法,是目前檢測精度及檢測速度相對較高的方法。YOLO算法通過數據標注定位,特征提取及數據訓練等方式,實現了高精度的檢測。所以,本文使用YOLOv5算法來檢測調車作業車廂的位置信息[2]。

2 YOLOv5算法介紹

YOLOv5 算法是基于 YOLOv4 的版本,為提高檢測速率和精確度而開發的一種目標檢測算法。目前分為YOLOv5s、YOLOv5m、YOLOv5l、YOLOv5x四個模型。依據調車作業移動性強的特點,本文選取模型體積較小的YOLOv5s模型。YOLOv5算法基本結構組成為輸入部分(Input)、骨干網絡部分(Backbone)、頸部(Neck)和預測(Prediction)四個部分。

2.1 輸入部分

輸入部分通過獲取包含目標信息的圖像,進行Mosaic數據增強技術使得目標圖像的數據集多樣化,同時降低了對計算機硬件的要求,提高了模型對目標信息的識別能力。通過自適應圖片縮放及自適應錨框計算等方式統一了待檢測的圖像尺寸和形狀,進而提高了檢測的準確率[3]。如圖所示,為輸入部分處理后的標準圖像模型,圖像像素大小為608*608。

2.1.1 Mosaic數據增強

Mosaic數據增強技術通過將四張圖像進行隨機縮放、隨機裁剪以及隨機排布,使得每張圖像上都包含對應的框,拼接后形成一張全新的圖像,重新定義新圖像的坐標值,進而豐富了圖像的信息,以此作為訓練數據,進行數據的訓練。此方法提高了魯棒性和泛化能力,增強效果圖如下所示。

2.1.2 自適應圖片縮放

在目標車廂檢測過程中,由于攝像機變焦的影響,采集到的圖像尺寸大小不統一。通過將原始車廂圖像統一縮放到一個標準尺寸下,并對原始圖像自適應地添加最少因縮放產生的黑邊,保證圖像目標信息的完整性,再送入檢測網絡,以此提高檢測的效果。例如,將采集到的900*700分辨率的圖像進行縮放裁剪處理,根據坐標點參數剪裁超出范圍的部分,縮放為標準的YOLOv5中608*608分辨率的圖像。

2.1.3 自適應錨框計算

目標信息錨框的大小影響檢測準確度的高低。自適應錨框計算方法會根據采集的數據集的不同,自動地計算并調整檢測初始錨框的大小和形狀,用于確定目標所在的可能位置。

通過數據訓練,模型結合初始錨框的位置信息,給出預測框,并與目標信息真實框進行對比,計算兩者差距,然后對網絡參數進行反更新、迭代、對邊框位置進行調整等操作。使用 VGG 網絡按照 AnchorBox 錨框對不同大小的目標進行 16 倍的輸入,即輸入畫面上的一個點對應一個16×16的方塊區域,也就是特征畫面上的一個點,對應于輸入圖像上的一個16×16的正方形區域。根據原始定義的Anchor,以特征圖像上的一點為中心,可以在原圖上生成9種不同形狀不同大小的邊框,如下圖所示。

2.2 骨干網絡部分

YOLOv5的骨干網絡主要用于提取圖像中目標特征信息。骨干網絡主要由FOCUS結構、CBS結構、BOTTLENECKCSP結構以及SPP結構等組成。

FOCUS結構是為了降低特征的維度,保留有效信息而縮小圖像的一種特殊的方式。FOCUS 結構通過切片操作將高解析度特征圖進行拆分,拼接成若干個特征圖,這些圖的解析度較低。例如,將原始大小的640×640×3的圖像,輸入FOCUS結構后采用切片操作轉換為320×320×12的特征圖,經過拼接后,再進行卷積操作,最后得到320×320×64的特征圖。CBS結構通過卷積的方式獲取目標的特征[4]。CSP結構是將原始輸入劃分為兩個分支,對分支分別進行卷積操作,使得通道數減半,進而學習更多的特征。SPP結構在局部特征和總體特征上實現了一體化。

2.3 頸部

頸部主要實現特征信息融合的作用。Neck采用FPN和PAN結合的結構,利用圖像金字塔的思想,FPN 首先在原始圖像之上構建圖像金字塔。然后在圖像金字塔的每一層都提出不同的特征,最后進行相應的預測,從而達到改善車廂檢測的效果。PAN通過自底向上方向的路徑增強方式,縮短了不同層次之間特征信息的路徑,進而提高了大目標的檢測效果。

2.4 預測部分

利用損失函數衡量目標預測信息和標簽標定信息的差距,當差距越小時,損失函數越小,說明目標檢測準確率越高。用來預測的損失函數為定位損失(box_loss)、置信度損失(object_loss)和分類損失(class_loss)三部分的加權和。預測部分對加工后的特征信息進行預測,并根據損失函數優化參數的加權和[5]。

3 車廂檢測過程

目標車廂檢測主要任務是將調車車廂設定為檢測的目標,利用YOLOv5算法的原理,如下圖所示,通過配置檢測程序所需的計算機環境,采集包含調車車廂目標信息的圖像,利用標注工具標注圖像中的車廂目標信息,獲得標注的類別和坐標結果,在深度學習框架中進行模型訓練,獲得模型數據后,在調車作業環境中,進行實時目標的檢測測試。

3.1 環境配置

使用并激活anconda虛擬環境,下載安裝cpu版本的PyTorch深度學習框架,并安裝對應的依賴包,同時安裝QT圖形化的界面開發軟件,完成檢測環境的配置。

3.2 數據采集與標注

本文通過采集調車作業過程中車廂的實際圖像,自建實驗數據集。得到包含待掛車廂目標信息的圖像2000張,分辨率為1080*720。數據集如下圖所示,包含了復雜環境下的調車作業圖像。將得到的數據集以隨機分配的方式,分解為模型訓練集、數據驗證集和數據測試集。

安裝并設置LabelImg軟件,標注含有目標車廂的圖片,并將標注的結果進行保存,標注的信息包括標簽的種類,目標框中心點的坐標值。

3.3 模型訓練

本系列試驗進行機器學習訓練的操作系統為Centos7.9,CPU為Xeon(R) Sliver 4214,充足的顯存為試驗的順利進行提供了保障,并縮短了機器學習的時間。深度學習框架選擇了Pytorch1.7,程序語言為Python3.7。

3.4 應用測試

利用車廂檢測系統,在調車作業線路上進行實時視頻檢測,改變相機不同的角度和移動速度,觀察并記錄檢測過程和結果。

4 結果與分析

本實驗測試圖片2000張,視頻數據大小為1G,統計檢測精度達90%,基本滿足調車作業的環境需求。本技術可以輔助調車作業人員,提高提高調車作業過程的效率和安全。

課題:廣西高校中青年科研基礎能力提升項目《圖像處理技術在調車作業中的應用研究》項目資助,項目編號:2021KY1399。

參考文獻:

[1]王順利,鄧灼志,殷勇等.鐵路車站取送調車仿真實驗研究[J].實驗室科學,2024,27(01):17-20+25.

[2]段蘊桔.編組站貨運調車協同監控系統設計與應用[J].鐵道貨運,2024,42(01):37-43.

[3]張瑤,陳姚節.改進YOLOv8的水面小目標檢測算法[J/OL].計算機系統應用,1-10[2024-03-13].

[4]徐慧智,郝東升,徐小婷等.基于深度學習的高速公路小目標檢測算法[J/OL].吉林大學學報(工學版),1-12[2024-03-13].

[5]陳冬冬,任曉明,李登攀等.基于改進的YOLOv5s的雙目視覺車輛檢測與測距方法研究[J].光電子·激光,2024,35(03):311-319.

猜你喜歡
調車車廂特征
六號車廂
如何表達“特征”
不忠誠的四個特征
CTC與STP結合的調車作業控制方案
客車調車作業管理的探討
增設調車信號機 防止調車越出站界
抓住特征巧觀察
一種調車防護應答器的設計
SSAB Hardox悍達450材料輕型自卸車廂體測試報告
QMI汽車夏季維護:雨季車廂除異味
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合