?

基于YOLOv5s的智能口罩佩戴檢測系統的設計與實現 許少軍

2024-04-06 12:49唐浩博曹領
電腦知識與技術 2024年3期
關鍵詞:深度學習

唐浩博 曹領

關鍵詞:YOLOv5s;口罩識別;深度學習

中圖分類號:TP18 文獻標識碼:A

文章編號:1009-3044(2024)03-0032-04

0 引言

人工檢查是否佩戴口罩存在一定的局限性,并且效率較低,因此對佩戴口罩進行自動實時識別是更好地解決問題的方法,尤其在工業生產、醫療健康等領域應用較為廣泛。結合目前計算機視覺和人工智能的圖像處理及目標檢測技術已廣泛應用于各種圖像及視頻場景。計算機視覺技術也愈發成熟,越來越多的領域都在引入智能化,智能口罩佩戴檢測也應該在各領域中發揮它的作用。

本文展示的是基于 YOLOv5s 改進的戴口罩實時檢測系統,能夠實現圖片檢測,實時檢測。以深度學習為基礎的目標檢測是目前比較主流的一種目標檢測計劃?,F階段主流優秀的目標檢測算法主要分為兩類,一類是基于 Region Proposal 的 Two stage 目標檢測算法,雙階段目標檢測算法過程主要將檢測分為生成候選框和檢測識別兩個過程,并提取生成的候選框的信息。它利用卷積神經網絡完成目標檢測和目標識別,主流的網絡模型有 SPPNET、Fast RCNN、Faster RCNN、R-FCN等。第二類是以回歸問題為基礎的 One Stage 目標檢測算法,將全過程統一,同時使用具有結構簡單、運算速度快等優點的 CNN 進行特征提取和回歸,是單一階段目標檢測算法過程。典型的網絡模式有 YOLO、SSD、DSSD、Cornernet 等。正是由于 One stage 和 Two stage 這兩種算法的差異,使得兩者在性能上也存在差異,前者在檢測精度和檢測定位精度上占據優勢,后者則在檢測速度上占據優勢。

1 項目的設計與實現

1.1 YOLOv5網絡框架的搭建

YOLOV5 根據其網絡框架深度和寬度主要分為YOLOv5s、YOLOV5M、YOLOV5L、YOLOV5X 四個版本,而 YOLOv5s是這幾個版本中寬度最小、深度最小的特征圖網絡,因此它有更快的檢測速度,更適用于小型嵌入式系統。不同網絡框架的對比如表1所示:

YOLOV5 的模型結構主要分為4個部分,分別是Input 輸入端、Backbone Basic Network、Neck Network 和 Prediction 輸出層。

1) Input輸入端可以對輸入的圖像進行自適應圖片縮放、數據增強、錨框等處理后將結果輸入back?bone基礎網絡。

2) Backbone Basic Network 包含 CSP 架構與FOCUS架構。其中在 YOLOV5 中的 FOCUS 模塊,是圖片進入 Backbone 之前的切片操作。YOLOv5s 的CSP 結構設計有2種。

3) Neck Network 由csp2_x 網絡來代替普通的卷積網絡,使網絡特征融合的能力得到了加強。

4) Prediction 輸出層包括 Bounding Box Regres?sion Loss 和 NMS。其中的 GIOU_LOOSS 被用在了YOLOv5 中,用于制作 Bounding Box 的損失函數。在目標檢測的后處理過程中,使用加權 NMS 的方式來篩選許多目標框。YOLOv5s的網絡架構如圖1所示。

3) 在預測中,使用非最大抑制(NMS)的加權方法NMS,利用 GeneralizedIoU(GioU)Loss作為 BBOX 的損失函數。如式(1) 所示。

1.2 數據集的制作

數據集包含 4 000 張不同場景下佩戴面具和未佩戴面具的人面圖片,通過旋轉裁剪這些圖片來實現數據集的增強后,使用 Labelimg 對圖片進行標記,將人面的位置標注在圖片中的長方形框標上,并將人面的類別標注為佩戴口罩和未佩戴口罩,之后標注為 YOLO 格式(YOLO 格式),這里將數據集按照 8:1:1 來對訓練集(train. txt)、測試集(test. txt)和驗證集(val. txt)進行劃分。訓練集用來訓練模型以及確定參數;而驗證集是為了確定超參數的網絡結構和調整模型而設計的。

1.3 模型的訓練與環境的配置

本次實驗在Windows操作系統下完成,采用Py?Torch 的框架,Python 3.8 的版本環境,GPU 型號為RTX3080。

2 模型檢測的改進

2.1 目標檢測算法的改進

早期的對象調查都是以滑動窗口的方式產生目標建議框,本質上與窮舉法并無差異。而 Fastr-CNN的出現,解決了冗余計算這一棘手問題。Fastr-CNN 增加了簡化的SPP 層,使其培訓和測試過程融為一體。SPP 層架構如圖 2 所示。

Fastr-CNN 使用 SelectiveSearch 生成目標候選框架,但速度仍無法達到實時要求。FasterR-CNN 則直接利用 RPN(注冊網絡)網絡生成目標候選框架。RPN 輸入任意像素點的 RAW 影像,輸出若干個對應目標坐標資訊與信心的矩形區域。從 R-CNN 到 FasterR-CNN,是將傳統檢測的3 步整合到同一深度網絡模型中的一個合并過程。R-CNN 原則框架如圖 3 所示:

基于回歸算法的 YOLO 和 SSD 檢測模型,讓檢測領域再上一個新臺階。其中,以 YOLO 和 SSD 兩種方式為代表的檢測方式真正達到了立竿見影的效果。

2.2 對于YOLOv5本身檢測的改進

1) 自適應圖片縮放改進。YOLOv5s代碼中對自適應圖片縮放進行改進,使得YOLOv5的檢測速度能有所提升。

2) 圖片素材強化。抓取的圖片進行素材強化,擴大圖片的數量如旋轉裁剪圖片,增加無目標背景圖片清晰的高速網絡,通過背景和目標的對比,區分出圖片中微小的物體,什么是無目標背景,什么是目標。

3) 減少網絡層數。避免多層卷積核混合后分不清多個小目標的情況發生。在圖像縮放的過程中盡可能少地添加黑邊,來提高模型的推理速度。步長適當減小,避免過多的提取小目標像素點。

4) 將圖片切分為多張圖片,對每張圖片進行單獨檢測然后匯總,可以增強對多目標的檢測。

3 應用場景及意義

智能口罩檢測系統在于節省人力、提高效率、智能提醒、信息化監控。在以下場景中有重要作用:

1) 工業領域。用于保護勞動者呼吸系統,防止其吸入有害粉塵、煙霧、氣體等顆粒物,減少工作場所的安全隱患。舉例如下:

粉塵口罩:用于防止吸入粉塵、花粉、灰塵、煤塵等。

化學防護口罩:用于防止工人吸入有害氣體和蒸汽。

2) 醫療領域。醫務人員在醫療過程中需要佩戴口罩,而智能檢測口罩可以幫助醫院檢測醫務人員佩戴口罩的情況,保證醫務人員的防護措施達標,起到保護醫務人員和患者身體健康的作用。舉例如下:

預防醫務人員感染:醫務人員容易接觸病人的體液、血液等分泌物,在診治病人呼吸道感染性疾病及手術過程中,戴口罩可有效預防病人呼吸道感染。防止患者感染疾病的發生。在醫院中,患者一般要長時間待在醫療環境里,戴上口罩可以有效地防止患者呼吸道感染傳染給他人,包括醫務人員和其他患者。

保護手術區域:在手術期間,醫生需要保持一定的清潔度和衛生,佩戴口罩可以防止口腔和鼻腔的細菌進入手術部位,從而避免手術感染。

防止病毒傳播:在面對一些高度傳染性病毒,例如SARS、禽流感、新冠肺炎等時,佩戴口罩,可以在一定程度上防止醫務人員和患者感染。

3) 交通運輸領域。盡管疫情的情況已經好轉,我們已經不用時時刻刻佩戴口罩,但在一些特殊場合仍需要佩戴口罩,特別是現在“二陽”與甲流的特殊時期。

綜上,口罩檢測依然有十分重要的作用。此系統能夠實時監測畫面中的人臉,并將其分為:戴口罩、不戴口罩兩類,并且在具體場景中,可以有相應作用,其特點是靈活運用,適用面較廣。

4 性能分析及測試結果

4.1 混淆矩陣

混淆矩陣是將分類問題的預測結果進行匯總,說明在預測時,哪個部分會被分類模型所混淆。它不僅可以讓我們了解分類模型中所犯的錯誤和正在發生的錯誤是怎樣的類型,同時也克服了分類精確度所造成的限制(regence)。還可以得到辨識度的信息,該模型口罩的辨識度達到了0.86,人的辨識度在0.97。如表2、圖4所示。

4.2 測試數據

在對數據進行訓練后,準確度(Precision) 、平均識別精度均值(MAP)、召回率(Recall)等參考量可以較直觀地判斷出所采用的模型對圖片的辨識度。TP:分類器預測結果為正樣本,實際也為正樣本,即正樣本被正確識別的數量;FP:分類器預測結果為正樣本,實際為負樣本,即誤報的負樣本數量;FN:分類器預測結果為負樣本,實際為正樣本,即漏報的正樣本數量。

4.3 檢測結果

針對場景中的不同需求,本次設計涵蓋了圖片檢測、視頻檢測和實時檢測三大功能,且可以實現單一目標檢測、多目標檢測、較遠距離中小目標的檢測。檢測實例如圖6所示。

5 結束語

本設計針對口罩佩戴檢測的問題以及提高口罩佩戴檢測的效率,提出了一種基于YOLOv5s的口罩佩戴檢測系統。本系統提出一種改進的YOLOv5s算法,使用數據集相關數據對模型進行訓練。訓練結果達到了預期的精度,模型的檢測精度和速度同時均衡,達到了預期規定的實時性檢測目標,同時,模型的檢測精度和速度也達到了預期。此系統滿足嵌入式終端設備的部署要求,希望在今后的學習中,在保證模型檢測精度和速度均衡的前提下,進一步提高模型的精度,同時進一步優化網絡結構、各種參數,使算法更出色。

【通聯編輯:唐一東】

猜你喜歡
深度學習
從合坐走向合學:淺議新學習模式的構建
面向大數據遠程開放實驗平臺構建研究
基于自動智能分類器的圖書館亂架圖書檢測
搭建深度學習的三級階梯
有體驗的學習才是有意義的學習
電子商務中基于深度學習的虛假交易識別研究
利用網絡技術促進學生深度學習的幾大策略
MOOC與翻轉課堂融合的深度學習場域建構
大數據技術在反恐怖主義中的應用展望
深度學習算法應用于巖石圖像處理的可行性研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合