?

基于YOLOv5 的鐵路接觸網異物檢測模型初步研究

2024-03-15 10:15趙仲瑜唐偉忠張文輝牛超群

鐵路計算機應用 2024年2期

關鍵詞：鳥窩輕質接觸網

趙仲瑜，唐偉忠，張文輝，蒲偉，牛超群

（中國鐵路蘭州局集團有限公司，蘭州 730000）

接觸網沿鐵路線路上空架設，為列車輸送運行所需電流。因常年暴露在野外露天環境中，接觸網上容易附著鳥窩、風箏和塑料等異物，造成接觸網短路和受電弓故障，是影響列車運行安全的主要隱患之一。為保證列車安全運行，在列車開行前，需要檢查接觸網上是否有異物附著。目前，接觸網異物排查主要依賴高頻率的人工巡檢，作業效率較低，耗費人力物力，且人工目視檢查容易因疲勞導致漏檢。

目標檢測是計算機視覺領域的一個基礎性研究課題，研究用于識別和定位輸入圖像中已知特定的某個或多個物體的圖像處理方法。目前，基于深度學習模型的目標檢測已成為研究熱點，我國鐵路領域已開展了不少研究。徐鑫等人[1]對YOLO（You Only Look Once）v5 模型的目標框損失函數和檢測尺度加以改進，用以檢測鐵路軌道上侵入的行人及動物；李興鑫[2]構建了基于CNN 算法的、能夠理解特定場景的鐵路異物入侵檢測方法，用于檢測鐵路軌道上的侵入異物?；谏疃葘W習模型的目標檢測為接觸網異物自動檢測提供了一種可行方法，通過接觸網圖像訓練深度學習模型，使其能夠識別圖像中的異物，區分異物類型，確定異物位置。為實現鐵路接觸網異物自動檢測，國內相關研究人員在這方面開展了積極探索。蔣欣蘭等人[3]使用人工標注的鳥巢樣本圖像對YOLOv3 深度網絡進行訓練，生成鳥巢識別模型，并使用改進的直線段檢測算法（LSD，Line Segment Detector）確定待檢測的接觸網圖像中感興趣區域（ROI，Region of Interest），即圖像中可能存在鳥巢的區域，將選定的ROI 區域輸入到訓練好的鳥巢識別模型進行目標檢測，由于大幅縮小了異物目標檢測的搜索范圍，能夠快速、準確地檢測鐵路接觸網上的鳥巢；王科理等人[4]將YOLOv3和Faster RCNN 兩種模型用于接觸網鳥窩檢測，對比實驗表明，Faster RCNN 的檢測精度高于YOLOv3，但速度低于YOLOv3；王曉紅等人[5]在接觸網鳥窩檢測中，對YOLOv5s 模型加以改進，將特征提取網絡由CSPDarknet 替換為Efficient Net-B4 網絡，提高了檢測精度和速度。

鳥窩和輕質異物（如風箏、塑料等）是2 類最常見的接觸網上附著的異物。本文采用3 種神經網絡模型來識別接觸網上附著的鳥窩和輕質異物，包括基本YOLOv5 模型、YOLOv5+坐標注意力（CA，Coordinate Attention）改進模型、YOLOv5+ConvNext Block 改進模型，利用標注好的接觸網圖像對這3 種模型進行實驗分析。

1 基于YOLOv5 的鐵路接觸網異物檢測模型

1.1 相關圖像處理模型

1.1.1 YOLOv5 模型

YOLO 系列算法[6]是目標檢測的經典算法，其主要特點是速度快、精度高。YOLOv5 模型[7]是YOLO 系列算法之一，它引入輕量級模型設計理念，可通過各種優化方法對其進行改進，能夠在保持高性能的同時，實現高精度小尺寸目標檢測。YOLOv5模型結構主要包括4 部分：輸入端、backbone 部分、neck 部分、輸出端，其簡要結構如圖1 所示。

圖1 YOLOv5 模型簡要結構示意

在利用原始圖像數據進行模型訓練時，先通過輸入端進行圖像預處理，將原始圖像數據經RGB 灰度轉換之后，可得到一個三維的數值矩陣CHW，如圖2 所示。圖2 中，C 代表通道維度，通常為3，HW 代表了空間維度，H 為高度，W 為寬度，通道維度關注圖像各個點的顏色、明暗等信息，空間維度關注圖像每個像素點與周圍像素點的關聯關系。

圖2 原始圖像數據經RGB 灰度轉換為CHW 數值矩陣

backbone 部分具有較強的計算效率，用于完成圖像數據的特征提取，其核心網絡是Focus 網絡和CSP1 網絡；其中，Focus 網絡主要負責對圖像進行切片操作，CSP1 網絡主要負責特征提取。

neck 部分包含的CSP2 網絡用于融合來自不同特征圖層次的信息，以得到更豐富的特征表達。

最后，通過輸出端的CONV 網絡對圖像數據進行卷積運算，將運算結果帶入Focal Loss 損失函數，以得到不同尺度的特征圖，Focal Loss 損失函數可緩解目標檢測中類別不平衡的問題。在得到不同尺度的特征圖之后，再進行非極大值抑制（NMS，Non-Maximum Suppression）處理，用于篩選邊界框，去除冗余的檢測框，得到最終的檢測結果。

1.1.2 坐標注意力機制

坐標注意力（CA，Coordinate Attention）機制，又稱為CA 注意力機制，是一種深度學習技術，常用于處理序列數據，可對圖像、音頻等信息進行選擇和歸納。

CA 注意力機制模塊[8]可根據需要靈活嵌入到其它深度學習網絡中。例如，將CA 注意力機制模塊嵌入到網絡模塊A、B 之間，對應的復合網絡結構如圖3 所示。網絡模塊A 的輸出作為CA 注意力機制模塊的輸入，CA 注意力機制模塊的輸出又作為下一個模塊B 的輸入。

圖3 嵌入CA 注意力機制的復合網絡結構示例

將CA 注意力機制用于處理圖3 中生成的CHW數值矩陣時，能夠同時考慮通道維度和空間維度的關系，并通過學習自適應地調整通道權重，使模型更關注有用的通道信息，抑制不重要的通道。CA 注意力機制模塊在通道維度上通過常規卷積操作調整權重，在空間維度上將輸入經過Residual 網絡一分為二，分別進行寬度W 方向和高度H 方向的平均池化操作，然后將池化后的特征圖拼接在一起，進行BatchNorm 網絡和Non-linear 網絡計算，再接著通過Conv2d 網絡進行卷積運算，運算結果再利用sigmoid激活函數和Re-weight 網絡，去調整CA 注意力機制模塊的權重參數，計算得到的最終結果輸出到下一個網絡模塊B。

1.1.3 ConvNext 網絡

ConvNext 網絡[9]是在Swin Transformer 結構上改進得到的一種卷積神經網絡，具有更高準確率和更快計算速度，且具有模塊化的優點，便于嵌入到其它模型中。ConvNext 網絡主要由DownSample 模塊和Block 模塊構成，其核心是Block 模塊。例如，將ConvNext 網絡嵌入到網絡A、B 之間，形成的一個復合網絡，其簡要結構如圖4 所示。

圖4 ConvNext 網絡結構示意

網絡A 的輸出先經過DownSample 模塊處理，得到處理結果a，主要作用是過濾掉冗余特征，減少參數數量，保留關鍵信息。之后，處理結果a 復制成2 份，其中一份處理結果a1 先通過深度卷積層，計算結果利用Layer Norm 技術進行歸一化處理，以使網絡更快地收斂；然后通過2 個大小一致的Conv2d 網絡進行卷積運算，并利用Layer Scale 對圖像進行縮放，接著使用Drop Path 對輸出結果進行正則化處理，以防止模型過擬合。最后，計算結果與另外一份未經過處理的處理結果a2 疊加在一起，得到ConvNext 網絡的輸出作為下一層網絡B 的輸入。

1.2 接觸網異物檢測模型

本文研究采用基本YOLOv5 模型、YOLOv5+CA 改進模型、YOLOv5+ConvNext Block 改進模型來檢測2 類接觸網異物：鳥窩和輕質異物（如風箏、塑料等）。

改進模型的基本結構大致如圖5 所示，將CA注意力機制模塊與ConvNext Block 模塊分別嵌入到YOLOv5 模型中neck 部分的第一個concat 層之后。

圖5 YOLOv5 改進模型基本結構示意

2 數據集與標注

本文選取230 張原始的接觸網圖像，利用圖像標注工具對這些圖像進行標注，作為實驗用數據集，用于訓練和測試接觸網異物檢測模型。鳥窩主要出現在接觸網支架上，多為橢球形，輕質異物主要為漂浮物，質地較輕，多懸掛在弓網上面。230 張原始圖像中，部分圖像成像質量較低，有的圖像含有多種異物目標。

圖像標注使用開源labelImg 軟件，將原始接觸網圖像標注為VOC 標簽格式，類別標簽0 代表鳥窩（nest），1 代表輕質異物（abnormal），將標注好的圖像保存為xml 文件。標注示例如圖6 所示。

圖6 鳥窩（nest）標簽標注

為方便模型訓練，還需要將標注生成的xml 格式文件轉換為txt 文件。在txt 文件中，第1 個值為異物類別標簽，其余4 個值分別為經過歸一化處理后的圖像標注框的中心點坐標（x，y）及寬（w）和高（h），將這些值與圖像作為實驗用數據集。

3 實驗分析

3.1 實驗環境與模型參數設置

實驗環境配置如表1 所示。

表1 實驗環境

3.2 模型參數設置

按照大約8∶2 的比例，將實驗用數據集（230張圖像）劃分訓練集與測試集，其中187 張圖像用作訓練集，43 張圖像用作測試集。

在模型訓練過程中，為了避免出現局部最優的可能性，使用隨機梯度下降算法（SGD，Stochastic Gradient Descent）作為模型優化器。此外，為了加快模型收斂速度，將Yolo 官方提供的基于COCO 數據集訓練的預訓練權重作為初始權重，3 種模型相關參數設置如表2 所示。

表2 3 種模型相關參數

3.3 模型評價指標

采用精確率（Precision）、召回率（Recall）、交并比（IoU）、平均準確率（mAP，mean Average Precision）作為本文所研究算法的性能評價指標，對訓練后的模型進行評價，對比分析這3 種模型檢測鳥窩和輕質異物的效果。

對于機器學習的分類問題，TP 表示正類判定為正類，TN 表示負類判定為負類，FP 表示負類判定為正類，FN 表示正類判定為負類。

Precision 指正確預測為正的樣本占全部預測為正的樣本的比例，即

Recall 指正確預測為正的樣本占全部實際為正的樣本的比例，即

對于目標檢測深度學習模型，除了需要檢測出目標所屬種類，還需要判定目標的位置。在進行模型訓練前，對樣本中的目標進行標注，得到標注框A。在應用模型進行目標檢測時，會生成檢測框B。IoU表示A 和B 的交集和并集的比值，用于衡量A 和B兩個區域的重疊程度，即

平均精度（AP，Average Precision）是模型檢測一個類別的PR（Precision-Recall）曲線與Recall 軸所圍成的面積。PR 曲線圖可反映樣本整體預測的效果，mAP 是全部類別下的AP 的均值，用于衡量模型檢測所有目標的平均精度。mAP@0.5 表示IoU 設為0.5 時的平均精確度，mAP@0.5:0.95 表示IoU 從0.5到0.95，步長為0.05 時的平均精確度。mAP 的值越大，代表檢測框的位置更加準確。

3.4 結果分析

YOLOv5 模型、YOLOv5+CA 改進模型、YOLOv5+ConvNext Block 改進模型實驗結果對比見表3。

表3 3 種模型實驗結果對比

由表3 可知：

（1）對于總體樣本（all），YOLOv5+ConvNext改進模型在Precision、Recall、mAP 指標上均優于YOLOv5 模型和YOLOv5+CA 改進模型，Precision和Recall 比YOLOv5 模型分別提高7.7% 和8.5%，mAP@0.5 提高8.1%；YOLOv5+CA 改進模型效果次之，Recall、mAP@0.5:.95 均貼近YOLOv5+ConvNext改進模型，YOLOv5 模型的檢測效果最差。

（2）從不同類型目標的預測結果來看，3 種模型識別鳥窩（nest 標簽）的Precision 略高于輕質異物（abnormal 標簽），且識別鳥窩的Recall 低于輕質異物，表明這3 種模型檢測鳥窩的Precison 相對較高，其中 YOLOv5+ConvNext Block 改進模型識別鳥窩的檢測效果最好。計算生成YOLOv5+ConvNext Block改進模型的PR 曲線圖，如圖7 所示。當召回率達到0.9 附近時，精確率與召回率處于比較平衡的位置，超過該值之后，精確率大幅下降。鳥窩樣本曲線與Recall，Precision 軸相交的面積要大于輕質異物樣本曲線，也從另一個方面表明：YOLOv5+ConvNext Block 改進模型檢測鳥窩的效果較好。

圖7 YOLOv5+ConvNext Block 改進模型的Precision 和Recall關系曲線

（3）圖8 給出了一個小尺寸目標檢測結果示例，圖中的接觸網上懸掛著一個體積較小的塑料薄膜，YOLOv5 模型和YOLOv5+CA 改進模型均未檢測出（對應于圖8（a）），圖8（b）為YOLOv5+ConvNext Block 改進模型的檢測結果圖，相較于其它兩種模型，YOLOv5+ConvNext Block 改進模型能夠更好地檢測出小尺寸目標，且置信度為0.69，處于一個較高水平。

圖8 YOLOv5 模型與YOLOv5+ConvNext Block 改進模型的檢測結果對比示例

4 結束語

本文在YOLOv5 算法的基礎上，構建基于深度學習的接觸網異物檢測模型，利用包含鳥窩和輕質異物的接觸網圖像數據集，對比分析YOLOv5 模型、YOLOv5+CA 改進模型和YOLOv5+ConvNext Block改進模型的識別效果。實驗結果表明，在識別和定位鳥窩和輕質異物2 種常見的接觸網異物方面，本文提出的2 種改進模型相對于YOLOv5 模型具有更好的性能，且YOLOv5+ConvNext Block 改進模型在檢測小尺寸異物方面的能力較強。

本文通過建模實驗，初步探討了利用基于深度學習的目標檢測技術實現鐵路接觸網異物檢測的可行性。本文研究采用的接觸網圖像數據集僅包含鳥窩和輕質異物2 類常見異物，對3 種模型的識別效果的對比分析只限于這兩類異物。魯棒性和計算復雜性是目標檢測的兩大挑戰，考慮到技術的實用化，后續研究將在豐富和擴充接觸網圖像數據集的基礎上，在提高模型識別更多類型目標能力的同時，進一步研究提高模型的計算效率，加快推動鐵路接觸網異物檢測技術的成功應用。

猜你喜歡

鳥窩輕質接觸網

掛在墻壁上的鳥窩

幼兒畫刊(2023年6期)2023-07-18

怎一個“輕質”了得

中學生數理化·自主招生(2022年9期)2022-05-30

為開通打下基礎！這條國際鐵路完成接觸網平推驗收

云南畫報(2021年10期)2021-11-24

輕質高強堇青石多孔陶瓷的制備與表征

陶瓷學報(2021年4期)2021-10-14

關于重芳烴輕質化與分離的若干思考

科學家(2021年24期)2021-04-25

接觸網設備“運、檢、修”分離改革的探討

上海鐵道增刊(2017年3期)2018-01-22

小學生導刊(2017年22期)2017-07-19

創新作文(小學版)(2016年3期)2016-11-11

高速鐵路接觸網研究進展

西南交通大學學報(2016年3期)2016-06-15

接觸網避雷器接地系統分析

現代工業經濟和信息化(2016年4期)2016-05-17

鐵路計算機應用2024年2期

鐵路計算機應用的其它文章: 基于超橢球Markov 的列車控制中心剩余使用壽命預測; 鐵路售票廳排隊叫號系統設計與實現; 鐵路綜合視頻分轉發中間件的設計與實現; 云平臺的負載預測及彈性伸縮方案研究; 朔黃鐵路貨場智慧平臺建設方案研究; 基于AnyLogic 的地鐵站臺客流引導方式優化

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合