?

改進的目標檢測算法在司機室場景的應用

2024-04-01 06:41
電視技術 2024年1期
關鍵詞:司機準確率智能

屈 波

(國能包神鐵路集團信息技術服務分公司,內蒙古 鄂爾多斯 017000)

0 引言

現有軌道交通綜合分析室中,大部分還是依靠人工分析司機室的視頻,判斷司機是否有無違規行為。機車運行中常發生的違規項行為有離開座椅、打盹、玩手機等,會對行車安全產生巨大隱患。本文針對司機室智能分析系統中的智能檢測模塊進行優化改進,提升檢測算法在復雜的場景下的準確率,提出了一種YOLOv8-DR(YOLOv8-Driver)方法。該方法在原有的YOLOv8 基礎上引入了坐標注意力機制(Coordinate Attention,CA)[1],抑制無關特征干擾,增強高關聯區信息特征提取能力,增加了一個大尺度檢測頭分支,更好地捕捉玩手機等小目標的細節信息,減少檢測模型在分析模糊和遮擋圖像時的誤判,以期為機車司機室場景的檢測提供有效解決方案。

1 司機室智能分析系統

人工分析視頻速度慢,每日無法完成約兩千個小時的視頻文件分析。司機室智能分析系統由計算機分析視頻,可大大提升分析效率,減少人力資源消耗,節約成本,可實現當天視頻文件全覆蓋分析。該系統部署于多顯卡服務器上,24 h 不間斷全自動分析,輸出異?;蜻`章行為,最終由相關工作人員核查司機行車過程中否有違規[2]。如圖1 所示,司機室智能分析系統使用服務器和客戶端模式的整體架構。其中,服務器上的智能檢測模塊是整個分析系統的核心部分,檢測算法的準確率是整個系統準確性的關鍵因素之一。通過不斷優化和改進模型,可以提高模型的準確性和可靠性,從而提升整個系統的性能。

圖1 司機室智能分析系統框架圖

2 目標檢測算法的改進

原有的智能檢測模塊采用YOLOv8 網絡檢測目標。雖然該網絡檢測效果好,但在司機室復雜場景下表現不佳,特別是對小目標的檢測準確率低。本文提出的方法如圖2 所示。

圖2 YOLOv8-DR 網絡結構

2.1 小目標檢測頭的增加

YOLOv8 的骨干(backbone)網絡主要用于提取圖像特征,通過C2f 獲取圖像匯總的信息特征;頭部網絡一般由頸部和檢測頭組成,用于特征融合和目標推理預測。本文在頭部網絡中增加了小目標檢測分支[3](圖2 中虛線部分),增加的特征圖大小為160×160,用來解決模型對小目標檢測準確率不佳的問題[4]。小目標檢測頭結構增加了CA 模塊,C2f模塊可以使得梯度流信息更加豐富,在其后面接一個CA 模塊,更有助于特征信息定位[5]。

2.2 CA 注意力機制模塊

機車司機室的環境復雜多變,為了提高模型對目標的有效檢出能力,本文在YOLOv8 的頸部網絡中增加了注意力機制,目的是增強目標的特征表達。注意力機制從大量數據信息中挑選出一少部分特征信息,過濾不重要的信息,關注提取的部分信息。注意力機制有空間注意力機制,有通道注意力機制,也有兩者結合的。傳統的注意力機制如SE 的缺點是不能提取特征圖上位置信息。另一種注意力機制CBAM,通過在通道上進行全局池化來引入位置信息,但這種方式只能捕獲局部的信息,對長范圍依賴的特征獲取顯得力不從心[6]。CA 模塊是一種新穎、高效的注意力機制,通過在通道注意力中嵌入位置信息,使網絡獲得更有效的信息,避免更多計算開銷的增加。CA 模塊使用起來非常方便靈活,可以插入網絡的多個位置,且不會造成過多的參數量和計算量。其結構如圖3 所示,通過平均池化,再對空間信息變換進行編碼,最后在通道上以加權的方式將空間信息進行整合。

圖3 CA 注意力機制模塊

對于給定的輸出數據x,經過殘差模塊之后,先使用(H,1)和(1,W)的池化核,分別在X方向和Y方向對通道進行池化計算,計算公式為

式中:h表示為高度,c表示特征通道數。另一個方向可表示為

式中:w表示為寬度。式(1)和式(2)是相互垂直的兩個空間方向匯聚特征信息,最終得到的是一對方向感知的特征圖。兩個公式合起來的編碼公式為

式(3)中的zc不僅將目標全局空間信息壓縮到通道描述符中,而且保存了目標特征的位置信息。

獲得全局感受野并編碼精確的位置信息后,需要充分利用上述信息,將兩個方向的權重gh和gw合并成權重矩陣,CA 模塊的最終輸出y可以表示為

CA 模塊的每個權重都包含了通道間信息、橫向空間信息和縱向空間信息,能夠幫助網絡更準確地定位目標信息,增強識別能力。

2.3 YOLOv8-DR 部署應用

改進后的檢測算法重新進行訓練,訓練后進行模型轉換部署,最后進行模型推理。如圖4 所示,智能檢測模塊主要包括訓練、部署及推理3 個子模塊。訓練子模塊根據系統提供的數據集對網絡參數學習更新;部署子模塊可以在保證準確率不降低的前提下提升模型的推理速度;推理子模塊是對圖像數據提取特征,并預測分類和坐標位置。檢測項點的結果會上傳至客戶端輸出項點模塊,經過人工的核驗,最終統計成為報表形式呈現于客戶端上。

圖4 智能檢測模塊流程

3 實驗設計與分析

3.1 環境與評價指標

本文使用的數據集為司機室場景數據集,數據集的劃分按照7 ∶2 ∶1 的比例,其中訓練集大約6 萬張。試驗所用的系統為Windows10,中央處理器(Central Processing Unit,CPU)型號為Intel i5-8500 CPU @ 3.00 GHz,圖形處理器(Graphics Processing Unit,GPU)型號為RTX3060,顯存12 GB,使用PyTorch 版的深度學習框架,GPU 加速框架庫為TensorRT。

評價指標主要包括:精確度(Precision)用P表示,召回率(Recall)用R表示,平均精度均值用mAP50,計算公式分別為

式中:NTP表示模型預測為正樣本且實際是正樣本的檢測框數量,NFP表示模型預測為正樣本但實際是負樣本的檢測框數量,NFN表示模型未能檢測到的實際樣本數量,N是樣本類別總數,mAP50表示交并比(Intersection over Union,IoU)閾值設置成0.5的平均精度均值。

3.2 消融實驗

本文設計了消融實驗,用來驗證網絡改進的可行性和有效性。試驗方案是將未進行任何改動的YOLOv8 網絡作為基準,將小目標檢測頭分支添加到網絡中,命名為YOLOv8-MinHead,將CA 模塊加入到網絡模型中,命名為YOLOv8-CA,與同時增加兩個模塊的YOLOv8-DR 網絡模型進行比較分析。對比結果如表1 所示。由于向網絡模型中新增加了模塊層,這會導致整個模型的參數量增大,從而影響模型的檢測速度,YOLOv8-MinHead 和YOLOv8-CA 的檢測速度都比YOLOv8-DR 的速度快。YOLOv8-DR 雖然增加了計算量,但提高了目標檢測的準確性,相比YOLOv8 模型,準確率、召回率和平均精度均值分別提升了4.6%、3.8%、3.4%。

表1 增加小目標檢測頭與CA 模塊對模型性能的影響

3.3 對比實驗

為驗證YOLOv8-DR 模型對司機室場景的檢測效果,選擇目前檢測準確率較高的YOLO 系列模型進行改進對比試驗,比對模型有YOLOv5-DR(YOLOv5 中同時增加檢測頭和CA 模塊)、YOLOv7-DR(YOLOv7 中同時增加檢測頭和CA 模塊)兩個檢測模型。試驗結果如表2 所示,YOLOv8-DR 雖然推理速度最慢,但效果是最好的。在速度滿足實時性要求的情況下,YOLOv8-DR 提升了模型對目標空間位置信息的感知能力,提高了檢測的準確性。

表2 不同模型在測試集上的性能對比

3.4 實際應用分析

在實際現場用YOLOv8-DR方法進行部署測試。使用相同的司機室視頻數據,采用不同的智能檢測模塊(模型不同),進行智能分析系統對視頻的分析。圖5 所示為司機室智能分析系統運行界面,對視頻數據進行實時監測和分析。通過對視頻數據的分析,系統可以對司機人員的行為進行智能識別和分類,如玩手機、待機打盹、姿態不端等不規范行為。

圖5 司機室智能分析系統運行界面

統計一周的結果顯示。以前舊模型的項點準確率為62.7%,YOLOv8-DR 模型的項點準確率為76.2%。

圖6 是客戶端顯示的一周項點平均準確率統計結果。根據統計數據分析,YOLOv8-DR 模型相比舊模型在項點平均準確率上提高了13.5%,表明YOLOv8-DR模型在實際應用中具有更高的準確性。準確率的提高表明該方法在處理復雜場景和不同類型的數據時更加可靠準確,為進一步應用推廣提供了有力的依據。

圖6 統計準確率

4 結語

本文提出的改進目標檢測算法檢測精度高,滿足實時性要求,對圖像檢測中目標的相互遮擋、特征點少等問題有所改善,是提高司機室場景中項點準確率的一個積極進展,不僅有助于提高駕駛操作的安全性,還能規范駕駛操作人員的習慣,對機車安全運行具有重大的意義。

猜你喜歡
司機準確率智能
乳腺超聲檢查診斷乳腺腫瘤的特異度及準確率分析
不同序列磁共振成像診斷脊柱損傷的臨床準確率比較探討
2015—2017 年寧夏各天氣預報參考產品質量檢驗分析
畫與理
老司機
老司機
智能前沿
智能前沿
智能前沿
智能前沿
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合