?

基于SVM的交通視頻分類優化

2017-02-27 15:37張偉郝泳濤
電腦知識與技術 2016年31期
關鍵詞:參數優化模式識別數據挖掘

張偉+郝泳濤

摘要: 當前智能交通數據挖掘研究的重點在于如何設計有效的挖掘算法。該文對特定的不同環境下的高速公路視頻進行分析處理,提取出整體的特征屬性,選取了SVM分類方法,基于所提取出的特征屬性對交通視頻進行分類。同時使用啟發式的遺傳優化SVM參數,尋求最優參數,相比于傳統方法,提高了分類準確率。

關鍵詞:模式識別;數據挖掘; SVM;遺傳算法;參數優化

中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2016)31-0179-04

Abstract: Current intelligent transportation data mining research focuses on how to design an effective mining algorithm. The project achieved the classification of video-based traffic congestion. This was done by using the average rate of population density and population. Based on the extracted feature values, we used the popular data mining algorithms SVM classification methods to carry out on the training and testing data classification and prediction and compared the accuracy of classification. Finally, genetic algorithms was used to heuristic SVM classification parameters to obtain the optimal parameters of SVM.

Key words:Pattern Recognition;Data Mining;SVM;Genetic Algorithm;Parameter Optimization

隨著城市的高速發展,城市公路交通擁堵以及效率不高等,已成為城市發展面臨的共同問題。智能交通系統(ITS)是將先進的科學技術有效地綜合運用于交通運輸、服務控制和車輛制造,加強車輛、道路、使用者三者之間的聯系,從而形成一種保障安全、提高效率、改善環境、節約能源的綜合運輸系統。

城市交通相關的數據挖掘技術的研究是數據挖掘技術領域最活躍的研究方向之一。交通數據挖掘的主要目的是尋找交通數據中的規律,為智能交通系統的設計提供技術支持,有利于緩解交通擁擠、優化交通路網運行,促進交通健康穩定發展。

1 研究現狀

隨著圖像處理技術的不斷發展, 利用機器視覺相關技術來進行車輛檢測有望取代傳統方式成為現代智能交通系統的重要組成部分。

傳統的方法大部分是基于對個別車輛的檢測和計算?;旧厦總€車輛是被隔離跟蹤的,通過分析它的運動軌跡來估算交通流量、車輛速度和停放的車輛。一些作者還使用斑點尺寸、三維模型、外形和紋理特征進行車輛分類[1]。然而,大多數的現有工作通常會在擁擠的情況下(例如交通擁堵)失效,原因是運動對象有嚴重的閉塞性?;旧?,在傳統方法中,交通是通過在情景中被檢測車輛的數量分類的,但是在非常擁堵的情景中,兩個或兩個以上的車輛的斑點可能會重疊,這會造成車輛計數錯誤。因此,當運動對象(例如,人或車輛)的密度增加時,傳統方法的精確度趨于下降。

2 目標特征屬性提取

2.1人群密度估算

背景相減法是運動目標檢測中比較常用的一種方法。把攝像頭捕捉的圖像第一幀作為背景,以后的每一幀都減去背景幀,然后將計算結果中每一像素的值和一個預先設定的閾值進行比較,若結果大于閾值,這個點是前景點,否則這個點為背景點[2]。

兩種常用的背景估計方法:

1)統計平均法

2)統計直方圖法

2.2人群密度獲取

在實驗中,交通監控視頻中的人群密度估算是通過背景相減法進行的。人群密度是通過計算由多層背景相減法獲得的前景掩膜的像素數決定的。每個視頻幀都會進行此過程。首先,為防止或至少減小外部不相關的對象的影響,要設置感興趣區域,這在運動分割和密度估算中是需要考慮的。交通人群密度是由在每個視頻中平均的密度變化來估算的。如遇視頻流或冗長的視頻,密度估算可以由N幀的塊來決定。對于每個塊,該系統會預測出人群密度。

2.3 人群速度估算

實驗中選擇傳統的KLT (Kanade-Lucas-Tomasi)跟蹤方法進行人群跟蹤。選擇KLT跟蹤的主要動機是它的高速的性能,能夠獲得實時結果。

人群跟蹤由兩個步驟組成。首先,給定兩個連續的幀,從第一幀中提取一定數量的特征點并存儲在內存中。在接下來的步驟中,所存儲的特征點在連續的幀內被跟蹤。一些特征點可能會在跟蹤的過程中丟失(目標進入/離開現場)。在這種情況下,如果特征點的數量小于閾值T,該算法將會在下一幀中提取新的特征點[3]。一個特定特征點在某些幀的位移表示人群運動矢量。然而,許多的運動矢量可能為零長度,因為一些特征點在幀內是靜止的。也可能由于噪聲的存在、背景為動態的以及人群運動太小等原因,運動矢量可能很短。為了減少這一問題對人群速度估算的影響,運動矢量長度小于閾值T的將會被過濾掉[4]。

3.3 構建特征向量

4 交通擁堵分類

4.1數據預處理

4.1.1數據集概要

該數據集包含了254個白天西雅圖高速公路監控視頻。所有的視頻都是由一個單一的固定攝像頭所記錄的,共計20分鐘。該數據集包含了多樣性的交通模型,例如輕型、中型和重型擁堵,而且有各種天氣條件下的(如晴天,下雨,陰天)。每個視頻有42-52幀,這些幀的分辨率為320x240,是按每秒10幀(fps)錄制的。該數據集還提供了描述每個視頻序列的手工標記的地面實況。表1顯示了數據集的概要。

4.1.2數據預處理

4.2支持向量機

4.2.1 SVM原理

SVM方法是一個有監督的學習模型,通常用來進行模式識別、分類以及回歸分析,對獨立測試集的測試誤差較小[5]。SVM方法通過一個非線性映射,把樣本空間映射到一個高維特征空間中,使得在原來的樣本空間中非線性可分的問題轉化為在特征空間中的線性可分的問題。

SVM方法應用核函數的展開定理,不需要知道非線性映射的顯式表達式,由于是在高維特征空間中建立線性學習機,所以與線性模型相比,不但幾乎不增加計算的復雜性,而且在某種程度上可以避免“維數災難”。

4.2.2 SVM核函數

選擇不同內積核丞數,就可以生成不同的SVM,這樣也就形成了不同的算法。日常的核函數主要有三類[6]:

1)多頊式核函數

2)徑向基函數(RBF)

3)S形核函數

4.3 SVM數據分類

4.3.1使用線性內核函數

通過上面的對比,可以看出,對于此數據集采用徑向基函數作為SVM分類器的核函數,最終的分類準確率最高。

5 SVM分類參數優化

雖然采用了SVM來進行交通視頻分類,最終得到了較為滿意的結果。但使用SVM進行交通視頻分類預測時,調用不同的核函數需要改變相關的參數才能獲得相對理想的分類準確率。

5.1 K-CV交叉驗證

交叉驗證是用來驗證分類器性能的一種統計方法,其思想是在某種意義下將原始數據進行分組,一部分作為訓練集,另一部分作為驗證集。首先用訓練集對分類器進行訓練,再利用驗證集來測試訓練得到的模型,以此來作為評價分類器的性能指標[7]。

5.2遺傳算法優化SVM參數

5.2.1遺傳算法

遺傳算法(Genetic Algorithm)是模擬達爾文生物進化論的自然選擇和遺傳學機理的生物進化過程的計算模型,是一種通過模擬自然進化過程搜索最優解的方法。在遺傳算法中,通過編碼組成初始群體后,遺傳操作的任務就是對群體的個體按照它們對環境適應度(適應度評估)施加一定的操作,從而實現優勝劣汰的進化過程。從優化搜索的角度而言,遺傳操作可使問題遺傳過程的解,一代又一代地優化,并逼近最優解。

利用遺傳算法對SVM參數進行優化的整體算法過程如圖5所示:

5.3實驗仿真

對訓練集進行CV意義下的準確率作為遺傳中的濕度函數值,先進行數據提取和預處理,然后利用遺產算法對處理數據進行最佳參數尋找,參數的選擇結果及預測結果如下:

在CV的意義下,通過使用網格劃分來尋找最佳參數的方式雖然能夠找到全局最優解,但是如果想在更大的范圍內尋找最佳的參數會很耗費大量時間。通過使用啟發式的遺傳算法不需要必遍歷網格內的所有參數點,也可以找到群居最優解,最終提高了分類預測的準確率。

6 結束語

智能交通數據挖掘研究的重點在于設計有效合理的挖掘算法,難點主要有兩面:首先由于交通數據的特殊性,現有的大部分數據挖掘算法無法直接高效的應用在大規模交通數據處理中;另一方面,需要根據領域知識來設計專門的數據挖掘算法,否則處理結果可能無法滿足應用本身的需求。本文在選定了視頻特征提取方法后,對不同的目標追蹤方法進行了比較,選擇了合適的追蹤方法;然后使用SVM算法,根據提取的特征屬性對交通視頻進行分類,通過比較分類的準確性,選擇合適的分類器。最后利用啟發式的遺傳算法對SVM參數進行了優化,提高了分類的準確率。

參考文獻:

[1] 王漢斌. 基于視頻的目標檢測與跟蹤技術研究[D].南京航空航天大學, 2009.24(19):21-24.

[2] 王圣男, 郁梅, 蔣剛毅. 智能交通系統中基于視頻圖像處理的車輛檢測與跟蹤方法綜述[J]. 計算機應用研究, 2005, 22(9):9-14.

[3] 韓超. 視頻車輛檢測技術背景及國內外研究現狀[J].無線互聯科技, 2012 (3):103-103.

[4] Andrews Sobral L O, Schnitman L, De Souza F. Highway Traffic Congestion Classification Using Holistic Properties[C]//Proc. International Conference on Signal Processing, Pattern Recognition and Applications, 2013.

[5] 范昕煒.支持向量機算法的研究及其應用[D].杭州:浙江大學, 2003.

[6] 王睿.關于支持向量機參數選擇方法分析[J].重慶師范大學學報:自然科學版, 2007, 24(2):36-38.

[7] 趙春暉, 陳萬海, 郭春燕. 多類支持向量機方法的研究現狀與分析[J].智能系統學報, 2007, 2(2): 11-17.

[8] 平雪良,徐榮禮,孔俊,等. 基于空間劃分的海量數據K鄰近新算法[J].華南理工大學學報: 自然科學版, 2007, 35(5):65-69.

[9] 賈銀山, 賈傳熒. 一種加權支持向量機分類算法[J].計算機工程,2005,31(12): 23-25.

[10] Keerthi S S, Lin C J.Asymptotic behaviors of support vector machines with Gaussian kernel[J]. Neural computation,2003,15(8):1667-1689.

猜你喜歡
參數優化模式識別數據挖掘
基于并行計算的大數據挖掘在電網中的應用
淺談模式識別在圖像識別中的應用
第四屆亞洲模式識別會議
一種基于Hadoop的大數據挖掘云服務及應用
第3屆亞洲模式識別會議
電氣設備的故障診斷與模式識別
基于GPGPU的離散數據挖掘研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合