?

面向實時目標檢測的Faster R?CNN 算法

2023-08-09 23:21曹宏徙
計算機應用文摘 2023年15期
關鍵詞:目標檢測實時性

摘 要:文章討論了目標檢測在計算機視覺領域中的重要性,并介紹了目標檢測算法的 2 種主要類型:傳統計算機視覺方法和基于深度學習的方法。隨著深度學習技術的發展,基于深度學習的目標檢測算法逐漸成為主流,并取得了較好的效果。然而,為進一步提高 Faster R-CNN 在目標檢測方面的性能,文章結合鯨魚優化算法對Faster R-CNN 網絡進行優化,并使用 PASCAL VOC 2012數據集對網絡性能進行測試。實驗結果表明,基于鯨魚優化算法的 Faster R-CNN 網絡性能明顯優于標準 Faster RCNN 網絡?;诖?,深度學習的目標檢測算法將在未來有更廣泛的應用和更好的效果。

關鍵詞:Faster R-CNN;目標檢測:實時性

中圖法分類號:TP391文獻標識碼:A

1 引言

目標檢測是計算機視覺領域的一項重要任務,其主要作用是在圖像或視頻中自動識別并定位感興趣的目標物體。目標檢測在許多應用中都具有重要作用,如自動駕駛、醫學影像分析領域等。

現有的目標檢測算法主要分為2 類:傳統計算機視覺方法的算法和基于深度學習的算法。傳統計算機視覺方法主要基于圖像特征提取和分類器構建,如Haar 特征[1] 、HOG 特征[2] 、SIFT 特征[3] 等。而基于深度學習的算法主要基于卷積神經網絡和其變種,如Faster R?CNN[4] 、YOLO[5] 等。隨著深度學習技術的不斷發展,基于深度學習的目標檢測算法逐漸成為主流,并取得了較好的效果。這些算法不僅具有較高的檢測準確率,還具有較快的檢測速度,能夠滿足實時應用的需求。

隨著技術的不斷發展,其應用范圍將會越來越廣泛。為了進一步提高Faster R?CNN 在目標檢測方面的性能,本文結合鯨魚優化算法對Faster R?CNN 網絡進行優化,并采用數據集PASCAL VOC 2012 對網絡性能做了測試,實驗結果表明,基于鯨魚優化算法的Faster R?CNN 網絡性能明顯優于標準Faster R?CNN網絡。

2 Faster R?CNN 網絡與鯨魚優化算法

2.1 Faster R?CNN 網絡架構

Faster R?CNN 是目標檢測領域中比較先進的一種網絡結構,其架構主要包括卷積層、RPN 網絡、ROI池化和全連接層。其中,卷積層用于提取圖像的特征,RPN 網絡用于生成候選區域,ROI 池化用于對候選區域進行特征提取,全連接層用于對候選區域進行分類和回歸。Faster R?CNN 的基本架構如圖1 所示。

(1)卷積層。

本文的Faster R?CNN 使用了深度卷積神經網絡來提取圖像的特征。常用的卷積神經網絡有VGG[6] 、ResNet、Inception 等,這些網絡可以提取不同層次的特征。本文將ResNet 卷積神經網絡作為特征提取器。

(2)RPN 網絡。

RPN 是Faster R?CNN 中的一個關鍵模塊,其作用是生成候選區域,即物體可能出現的位置。RPN 網絡是一個小型的卷積神經網絡,其輸入為卷積特征圖,輸出為多個候選區域。具體而言,RPN 網絡通過滑動窗口的方式在特征圖上滑動,每個位置生成多個不同大小和長寬比的錨框,然后對每個錨框進行分類和回歸,得到每個錨框的置信度和偏移量,最后根據置信度選擇一定數量的候選區域。

(3)ROI 池化。

ROI 池化是指Faster R?CNN 對候選區域進行特征提取的操作。對于每個候選區域,ROI 池化將其劃分成固定大小的網格,然后在每個網格上進行最大池化操作,將每個網格內的最大值作為該網格的特征表示。最后將所有網格的特征拼接起來,作為該候選區域的特征表示。

(4)全連接層。

Faster R?CNN 的最后一層是全連接層,用于對候選區域進行分類和回歸。具體而言,全連接層首先將每個候選區域的特征表示通過一層全連接層映射到一個固定長度的向量,然后分別對該向量進行分類和回歸,得到物體類別和位置信息。

2.2 鯨魚優化算法

鯨魚優化算法是一種新興的基于仿生學的全局優化算法,其靈感來源于鯨魚的群體行為。鯨魚優化算法通過模擬鯨魚的游動行為,對搜索空間進行探索和優化,以找到最優解。算法的基本流程如下:

(1)初始化種群,包括鯨魚的位置和速度;

(2)計算每條鯨魚的適應度;

(3)根據適應度更新最優解;

(4)根據當前最優解和鯨魚的位置更新鯨魚的速度和位置;

(5)重復步驟(2) ~(4),直至達到停止準則。

鯨魚優化算法的關鍵在于鯨魚的游動行為。在該算法中,鯨魚的游動行為被抽象成3 種基本的行為,分別是旋轉、俯沖和泡沫聚集。

旋轉行為是指鯨魚在游動過程中繞著自身旋轉的行為,可用公式(1)表示;俯沖行為是指鯨魚在游動過程中向下俯沖的行為,可用公式(2)表示;泡沫聚集行為是指鯨魚在游動過程中圍繞著一些食物源聚集的行為,可用公式(3)表示。

2.3 針對R?CNN 的優化策略

在Faster R?CNN 中,鯨魚優化算法的優化策略主要體現在損失函數的優化上。該算法可以用來優化模型的分類損失和回歸損失。在分類損失方面,本文使用該方法來優化模型的權重參數,以提高分類準確率。具體而言,可以將分類損失作為鯨魚優化算法的目標函數,然后再搜索最優的權重參數:

其中,θc 表示分類損失的權重參數,Lc 表示分類損失函數。在回歸損失方面,本文使用該算法來優化模型的邊界框回歸系數,以提高目標檢測的準確率,優化回歸損失的邊界框回歸系數:

其中,θr 表示回歸損失的邊界框回歸系數,Lr 表示回歸損失函數。需注意的是,由于該方法只能使用歷史數據進行優化,因此在進行優化時,需要使用已有的訓練數據進行訓練,并將訓練得到的模型作為初始解來進行優化。此外,為了避免過擬合,還需要對其進行一定的正則化處理。

3 實驗與討論

3.1 數據集

PASCAL VOC 2012 數據集是一個廣泛使用的圖像識別和目標檢測數據集,其圖像來源于真實世界中的場景,具有一定的多樣性和復雜性,主要用于評估計算機視覺算法的性能。該數據集包含20 個常見類別的物體(如人、車、飛機等),每個類別有大約1 000張圖像,其中包含了物體的位置和類別標簽信息。PASCAL VOC 2012 數據集的部分圖片如圖2 所示。

3.2 測試結果

針對PASCAL VOC 2012 數據集,本實驗使用基于鯨魚優化算法的Faster R?CNN 算法和標準FasterR?CNN 算法對物體進行分類,并將準確率、召回率和F1 值作為評價指標。實驗結果如表1 所列。

從表1 中可以看出,基于鯨魚優化算法的FasterR?CNN 算法在準確率、召回率和F1 值上均優于標準Faster R?CNN 算法。

3.3 結果分析

基于算法結構和實驗結果可知,Faster R?CNN算法通過引入Region Proposal Network(RPN)來生成候選區域,并使用卷積神經網絡(CNN)對這些候選區域進行分類和定位,使它在目標檢測任務中具有較高的準確率和速度,但是在處理大規模數據集時,其性能可能會受到限制?;邛L魚優化算法的Faster R?CNN 算法通過引入鯨魚優化算法來優化Faster R?CNN 算法中的超參數,從而提高了算法的性能,實驗結果表明,基于鯨魚優化算法的Faster R?CNN 算法在PASCAL VOC 2012 數據集上具有更高的準確率、召回率和F1 值。此外,基于鯨魚優化算法的Faster R?CNN 算法通過優化超參數,理論上具備更好的泛化能力,且可以處理更大規模、更復雜的數據集。

4 結束語

目標檢測算法是計算機視覺領域的一項核心技術,它的主要任務是在圖像或視頻中檢測出特定目標的位置和數量,并對其進行分類。一個好的目標檢測算法應該既能夠準確地檢測出目標,又能夠盡可能地找到所有真實目標。本文為了提高Faster R?CNN 算法的精度,首先對其結構進行了系統性分析,然后使用鯨魚優化算法對其進行優化。針對PASCAL VOC2012 數據集的實驗表明,目標檢測算法提高了目標檢測精確度以及實用性。另外,目標檢測算法還需要具備對遮擋和尺度變化的魯棒性,這也是本研究下一步要做的內容。

參考文獻:

[1] 甘玲,朱江,苗東.擴展Haar 特征檢測人眼的方法[J].電子科技大學學報,2010,39(2):247?250.

[2] 尚?。冢龋希?特征的目標識別算法研究[D].武漢:華中科技大學,2012.

[3] 藺海峰,馬宇峰,宋濤.基于SIFT 特征目標跟蹤算法研究[J].自動化學報,2010,36(8):1204?1208.

[4] REN S,HE K,GIRSHICK R,et al.Faster R?CNN:Towardsreal?time object detection with region proposal networks[ J]. IEEE transactions on pattern analysis and machineintelligence,2017,39(6):1137?1149.

[5] JIANG P,ERGU D,LIU F,et al.A Review of Yolo algorithmdevelopments[J].Procedia Computer Science,2022,199:1066?1073.

[6] 包嘉欣,田秋紅,楊慧敏,等.基于膚色分割與改進VGG 網絡的手語識別[J].計算機系統應用,2020,29(6):47?55.

作者簡介:

曹宏徙(1987—),碩士,工程師,研究方向:網絡安全、計算機視覺。

猜你喜歡
目標檢測實時性
基于規則實時性的端云動態分配方法研究
基于虛擬局域網的智能變電站通信網絡實時性仿真
航空電子AFDX與AVB傳輸實時性抗干擾對比
視頻中目標檢測算法研究
行為識別中的人體運動目標檢測方法
移動機器人圖像目標識別
基于P3電位的目標檢測研究
一種車載Profibus總線系統的實時性分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合