?

基于視覺注意機制的行人檢測方法

2015-05-15 08:08張艷軍鄧永生
科技視界 2015年15期
關鍵詞:亮度行人顏色

張艷軍 鄧永生 田 甄

(重慶郵電大學自動化學院,中國 重慶400065)

0 引言

行人檢測是智能交通和駕駛輔助系統的重要組成部分??焖贉蚀_的檢測行人可以輔助司機提高行車安全,或者為智能車輛實現安全駕駛和自主導航提供關鍵技術,因此,這個課題近年來備受關注。

基于視覺的行人檢測方法可以分為三大類:基于模板型、基于模型與基于學習型?;谀0逍褪且源_定人體模板作為匹配初始條件,但人體的模板求解比較復雜;基于模型是采用建立好的模板在圖像上進行匹配,從而完成車輛檢測,該算法容易受光線變化、行人的姿態變化的影響,并對模板依賴較大,而且行人的姿態太多,統一建模困難;基于學習型的方法是通過提取人體的各種特征,然后利用模式識別的方法進行分類,其中基于梯度方向直方圖(Histogr am of Oriented Gradient,簡稱HOG)的特征描述行人的方法最為主流,但是提取的人體特征向量維數較大,使得計算量較大,嚴重影響了實時性,加上線性SVM作為弱分類器進行級聯訓練,雖然節省了時間,但需要在整個圖像區域匹配,影響了實時性與精確性。

針對以上的不足,本文引入了視覺注意機制,將模擬人類視覺注意機制的目標檢測方法引入到行人檢測中。在傳統的注意模型[1]中加入形狀特征描述,提取顏色、亮度和形狀等特征[2],將各個特征通過一定的特征合并策略將各注意圖合并成一張顯著圖,以定位出行人檢測區域。然后在行人檢測區域利用行人訓練得到的分類器進行檢測。

1 基于注意機制的檢測模型

人類視覺系統指導注意力分配的因素[3]有兩個:自底而上的注意和自上而下的注意。其中,自下而上的注意,也稱為數據驅動的注意選擇,是最具代表性的是基于特征整合理論的顯著性檢測模型。

該模型的基本思想是,輸入一幅圖像,通過線性濾波提取視覺特征中的亮度、顏色和方向三種特征,通過邊緣檢測得到的邊緣圖形成對應的形狀注意圖,在多種尺度下通過高斯金字塔、中央周邊差和歸一化處理,形成相對應的亮度特征圖、顏色特征圖和方向特征圖。這些特征圖先經過特征內部的競爭,形成顏色、亮度、方向的關注圖,然后通過特征之間合并生成最終的顯著圖,再經過生物學中贏者取全WTA(Winners Take All)網絡,提取行人檢測區域。

自底向上的數據驅動模式采用的是Saliency Tool模型。設r、g、b分別對應于輸入圖像的紅、綠、藍信道,于是可得灰度圖L=(r+g+b)/3,及高斯金字塔I(σ)。為了從強度中分離出色度信號,使用I來歸一化r、g、b信道。因為亮度非常低的色度變化是覺察不到的,所以歸一化僅在灰度大于全圖最大的1/10位置上進行,而其他位置的r、g、b值則被賦為0。

歸一化后建立4個寬調諧的顏色通道:紅色R=r-(g+b)/2,綠色G=g-(r+b)/2,藍色B=b-(g+r)/2和黃色Y=(g+r)/2-|r-g|/2-b,負值則置為0。進一步根據這些顏色通道可建立4個高斯金字塔,可得具有方向選擇性的實Gabor金字塔O(σ,θ)。

考慮3種特征,亮度、顏色和朝向。若中央周邊差操作為Θ。

在人類視覺系統中,該特征是由對暗中央亮周邊或亮中央暗周邊敏感的神經元來檢測的。神經元在被一種顏色所激勵的同時,被另一種顏色所抑制,而在感受野的周邊則相反。在人類的視皮層中,共有4種空間和顏色秸抗,分別為紅/綠、綠/紅、藍/黃和黃/藍顏色對。

其中,N(·)為特征圖的歸一化算子;⊕為逐點求和。

關于朝向特征,用θ∈{0°,45°,90°,135°}這4個方向的Gabor濾波器對亮度圖進行濾波,得到方向圖。

其中,O(c,θ)為實Gabor金字塔。

最后,將3種特征進行合并,生成顯著圖,再根據WTA機制找到顯著圖中的興趣區域,映射回原圖,得到目標區域。

2 基于HOG與SVM分類器相結合的行人檢測方法

方向梯度直方圖[4](Histogram of Oriented Gradient,HOG)特征是一種在計算機視覺和圖像處理中用來進行物體檢測的特征描述子。它通過計算和統計圖像局部區域的梯度方向直方圖來構成特征。通過檢測窗口對整幅圖像的整體信息轉換為組向量數據集,即HOG特征向量,最后通過支持向量機(Support Vector Machine,SVM)判斷人與非人。

2.1 HOG特征計算

HOG特征的計算過程如下:

1)灰度化(將圖像看作一個x,y,z(灰度)的三維圖像);

2)采用Gamma校正法[4]對輸入圖像進行顏色空間的標準化(歸一化);目的是調節圖像的對比度,降低圖像局部的陰影和光照變化所造成的影響,同時可以抑制噪音的干擾;

筆者曾先后在2個班級進行基于BOPPPS教學模式的課堂設計實踐,結果表明在講解藥物不良反應章節時,應用該模式能提高學生主動學習的積極性,教學效果有效提高。傳統教學模式以教師講授為主,學生被動接受課堂知識,照本宣科和死記硬背對提升學生的綜合能力無益。有研究顯示,BOPPPS教學法在調動學生主觀能動性、提高綜合分析能力及理論考試成績等方面均明顯優于傳統教學法[6]。BOPPPS為臨床藥理學的課程教學提供了一種簡潔、有效的設計模式。但是在實踐中如何合理地運用,需要教師不斷摸索和思考。

3)采用簡單的梯度算子下[-1,0,1]平方向Gh和垂直方向Gv的梯度值;

4)計算梯度方向θ(x,y);

5)將圖像劃分成小cells(例如6*6像素/cell);

6)統計每個cell的梯度直方圖(不同梯度的個數),即可形成每個cell的descriptor;

7)將每幾個cell組成一個block(例如3*3個cell/block),一個block內所有cell的特征descriptor串聯起來便得到該block的HOG特征descriptor。

8)將圖像image內的所有block的HOG特征descriptor串聯起來就可以得到該image(你要檢測的目標)的HOG特征descriptor了。這個就是最終的可供分類使用的特征向量了。

2.2 SVM分類器

支持向量機將向量映射到一個高維的空間里,在這個空間里建立有一個最優超平面。在分開數據的超平面的兩邊建有兩個互相平行的超平面。把待分類訓練數據設為{Xk,Yk}其中取代表訓練樣本HOG特征向量,Xk代表樣本種類(人用l,非人用-1)。首先通過函數將Xk映射到一個高維的空間里,然后用判斷函數尋求最優超平而進行分類。本文應用臺灣大學林智仁副教授等開發設計的快速有效的SVM模式識別的軟件包。

其中,對于那些與人體樣本十分相似的非人樣本,在初始訓練中,很難分辨,容易誤判,需要對其結果進行再次訓練,得到負樣本集。這樣可以提高檢測率。

3 實驗結果與分析

為了對本文的算法進行有效的評估,選取了三段校園里拍攝的視頻圖像,攝像頭在拍攝過程中存在一定程度的抖動,增加了檢測的難度,使得檢測結果更具有效性。從每段視頻中截取了20幀視頻圖像進行了實驗分析,檢測結果如圖1所示。

對上述實驗結果分析可知,本文算法可以較好的完成行人檢測任務。

4 結束語

本文提出了一種基于視覺注意機制的交通標志檢測方法。在傳統視覺注意機制模型提取顏色、亮度、朝向特征的基礎上,增加形狀特征,根據顯著程度找到感興趣區域。實驗結果表明,該方法克服了由于顏色分割的不完善造成的形狀檢測失誤的缺點,在對各個特征之間相互獨立檢測的同時,又考慮亮度和朝向特征在檢測中所起的作用。注意機制在目標與背景顏色相近時提取顯著圖的效果較差,并且本文方法整體的實時性較差。因此,今后將對這兩方面進行改進。

[1]馮松鶴,郎叢妍,須德.一種融合圖學習與區域顯著性分析的圖像檢索算法[J].電子學報,2011(10).

[2]許言午,曹先彬,喬紅.行人檢測系統研究新進展及關鍵技術展望[J].電子學報,2008(05).

[3]田廣,戚飛虎.移動攝像機環境下基于特征變換和SVM的分級行人檢測算法[J].電子學報,2008(05).

[4]杜友田,陳峰,徐文立,李永彬.基于視覺的人的運動識別綜述[J].電子學報,2007(01).

猜你喜歡
亮度行人顏色
亮度調色多面手
基于斬波調制的LED亮度控制
人生的亮度
特殊顏色的水
行人流綜述
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合