?

基于SVM與神經網絡組合模型的短時交通流預測研究

2022-08-31 19:46劉君
電腦知識與技術 2022年17期
關鍵詞:支持向量機神經網絡

摘要:為提高短時交通流預測的數據擬合能力,提出基于支持向量機(SVM)與神經網絡的組合預測模型SVM-BPNN、SVM-RBFNN。結合實際道路的短時交通流數據,將組合模型與其他典型預測方法實驗對比。結果表明,本文提出的組合模型SVM-RBFNN預測精度更高,在短時交通流量預測方面具有明顯優勢。

關鍵詞:短時交通流;神經網絡;支持向量機

中圖分類號:TP311? ? ? 文獻標識碼:A

文章編號:1009-3044(2022)17-0006-03

短時交通流預測常用方法有歷史平均、神經網絡、深度學習、回歸分析等[1],但因交通流影響因素復雜,近年來,組合預測模型成為短時交通流預測的研究熱點。目前將統計回歸模型、神經網絡、遺傳算法等組合用于交通流預測已有部分成果,傅成紅等構建基于深度學習的短時交通流量預測模型[2];文獻[3]采用SVR與ANN進行預測研究,證明組合預測效果更好[3]。

神經網絡模型存在依賴大樣本、容易陷入局部極小等問題[4]。支持向量機以統計理論為基礎,在解決小樣本模型識別中優勢明顯,但對于大數據樣本問題容易發生維數災難[5]。本文根據支持向量機結構風險最小化和神經網絡的非線性泛化能力,提出一種基于支持向量機與神經網絡的組合預測模型預測短時交通流。

1 短時交通流主要參數

引起交通流變化的因素很多,其中主要包括交通流量、車速、車流密度、道路占有率等代表性特征參數[6]。交通流量表示單位時間內通過某一道路截面的車輛數。是反映道路系統交通變化的重要參數,若[T]時間內通過的某一道路截面的車輛數為[N],則交通流量[Q]定義為:

Q=N/T

車速通常指汽車在單位時間內的行駛距離,一般包括區間和時間平均速度。假設某一路段長為[L],[n]輛車通過該路段用時分別為[t1,t2,…,tn],則區間平均速度定義為[v1=nL/i=1nti],時間平均速度定義為:[v1=1ni=1nvi]

車流密度刻畫路段在某時刻的車輛數。若長度為L的路段在某一時刻共有N輛車,則車流密度表示為:

H=N/L

道路占有率指汽車占用道路比重,主要反映道路的擁堵程度。某一觀測路段L上有n輛車長分別為[l1,l2,…,ln],則道路的空間占有率為:

[Rs=i=1nliL]

2 支持向量回歸機

支持向量機(SVM)在處理小樣本非線性問題時有比較好的效果。假設[xi∈Rn][yi∈Rn]分別為模型輸入值與輸出值,線性回歸的主要目標是找到輸入與輸出之間的線性關系[f(x)=ωx+b]。短時交通流量預測即通過最優估計尋找回歸函數[f(x)=(αi-αi*)K(x,xi)+b],其中x為交通流量影響因素,[K(x,xi)]表示核函數,[ω]和b的值通過如下凸二次優化問題求解:

[minω,b,εZ=12ω2+Ci=1n(ξi+ξi*)],[s.t.f(x)-yi≤ε+ξiyi-f(x)≤ε+ξi*ξi≥0,ξi*≥0,i=1,2,…,n]

上式中C為懲罰因子,用來刻畫間隔帶之外數據的罰數,ε為不敏感損失系數,[ξi、ξi*]為松弛變量。

在上式引入拉格朗日乘子構建拉格朗日方程:

[L(ω,ξi,ξi*)=12ω2+Ci=1n(ξi+ξi*)-i=1nαi(ε+ξi-yi+ωxi+b)][-i=1nαi*(ε+ξi+yi-ωxi-b)][-i=1nβiξi-i=1nβi*ξi*,i=1,2,…,n]

令式中各參數偏導數為0,并引入核函數,可將問題轉化為對偶問題:

[minαi,αi*M=12i=1n(αi-αi*)(αj-αj*)K(xi,xj)+εi=1n(αi+αi*)-i=1nyi(αi-αi*)]

[s.t.i=1n(αi-αi*)=0,αi≥0,αi*≤C/n,]

求解出[ω,b],即可得回歸函數:[f(x)=(αi-αi*)K(x,xi)+b]。常用核函數有線性、多項多、徑向基核函數等,本文使用徑向基核函數:

[K(x,xi)=exp(-x-xi2/σ2)]。

3 人工神經網絡

BPNN和RBFNN因其強大的容錯及自適應能力被廣泛應用于各個領域。在短時交通流預測中,BPNN結構包含輸入層、隱含層、輸出層,在訓練過程中通過自學獲得輸入、輸出數據間的對應關系,通過正向傳播信號、反向傳播誤差,不斷修正各層間權值。

假設[X=[x1,x2,…,xn]]為模型輸入向量,[Y=[y1,y2,…,yt]]為輸出值,隱含層各單元輸入為[D=i=1sWijX-bj],其中W表示輸入層與隱含層神經元間的連接權重,bj為偏置。激勵函數采用Sigmoid函數:

[f(x)=11+e-x]。

RBFNN在短時交通流預測也有廣泛應用,其隱層基采用Gauss函數連接網絡,確定了徑向基函數的中心點就能確定隱含層的連接關系。RBF具有局部逼近特點,在分類、收斂速度等方面優勢明顯,激活函數為:

[G(x)=exp(-x2/2σ2)]

其中[x2]為歐氏范數,[σ2]為方差。

4 基于SVM與神經網絡的組合模型

單項預測模型有各自的優勢,但也存在一定的局限性,Yu等人提出混合預測思想,構建組合預測模型獲得更為精準的預測效果[3]。但是因交通數據量大,SVM在預測中容易發生維數災難,BPNN及RBFNN也容易出現局部極小問題?;诖?,本文提出一種基于SVM與神經網絡的組合模型,結合單項模型的優點,提高整體預測精度和可靠性。

組合模型中需根據實際情況確定各模型最優權重值,本文采用經典組合方式,通過模型對上一時段的預測均方誤差確定組合權重,預測誤差越大相應權值越小,加權組合預測表達式為:

[y(t+1)組合=a?(t+1)svm+(1-a)y(t+1)]

其中a、1-a為組合模型的權重值,當[y(t)-y(t)-?(t)svm-?(t)=0]時,a=0.5;否則,[a=y(t)-y(t)/[y(t)-y(t)+?(t)svm-?(t)]],即不同單項預測模型之間有近似的絕對誤差時采用平均線性組合,否則采用最優組合方法確定權重值。[y(t+1)組合]為組合模型預測值,[y(t)-y(t)]、[?(t)svm-?(t)]分別為上一時段單項模型預測絕對誤差。

5 實驗結果分析

5.1數據來源

由于交通流量是反映道路交通情況的重要指標,本文采用美國明尼斯達州德盧斯大學網站提供的交通流量數據,該數據集描述了羅切斯特某環路每天的交通流量情況,采樣間隔為5分鐘,每天的數據長度為288。以2018年12月1日~20日數據為訓練樣本,2019年1月1~10日數據為測試樣本集,共有訓練樣本5750個,測試樣本2860個。

5.2數據預處理

樣本數據集的預處理是提高預測精度的重要部分,車道檢測數據受檢傳感器、通訊設備等不確定性因素影響,會導致樣本數據的冗余、缺失、存在噪聲等情況,對數據預處理后能夠有效調整異常數據和降噪,提高模型預測效果。本文采用限幅濾波法處理樣本的異常數據:

[xi*=E(x)+D(x),ifxi-E(x)+D(x)>μxi,ifxi-E(x)+D(x)≤μ]

其中[xi*]為更新數據,[E(x)]、[D(x)]分別為數學期望和方差。

5.3評價指標

設[yt]為時間段[t]的交通流量預測值,[yt]為交通流量實際值。選用平均絕對百分比誤差(MAPE)和均方誤差(MSE)為誤差分析評價指標。

(1)[MAPE=1nt=1nyt-ytyt?100%];

(2)[MSE=1nt=1n(yt-yt)2];

MAPE和MSE表示某一時間段的預測誤差,n為整個預測周期的時間段個數。

5.4預測值與實際值對比

采用Matlab分別建立基于SVM和BP神經網絡、RBF神經網絡的短時交通流量組合預測模型,對同一組數據進行預測。SVM采用徑向基核函數,懲罰系數C=2,不敏感損失系數ε=0.001;BP神經網絡學習速率0.01,激活函數采用Sigmoid函數,組合模型[y(t+1)組合=a?(t+1)svm+(1-a)y(t+1)]中權重值[a=0.35]。

與單項預測模型對比,組合模型預測精度高于常規單項模型,SVM-BPNN和SVM-RBFNN兩種組合模型的平均絕對百分比誤差(MAPE)分別為5.4%、4.1%,均方誤差(MSE)分別為10.31、9.14(見表1),準確率最大為86.4%,預測值的絕對誤差均控制在[10-2]量級。說明組合預測模型具有較好的非線性時間序列特征數據的學習能力,綜合兩種模型的優點,預測精度和預測能力明顯優于單項預測模型,其中SVM-RBFNN預測平均絕對百分比誤差最小。

5.5預測精度與單項模型對比

在訓練集與測試數據完全相同的情況下,分別運用支持向量機(SVM),BP神經網絡(BPNN),徑向基神經網絡(RBFNN)三種經典模型單獨對實際道路交通流量數據進行預測。結果表明,三種模型單獨預測值的MAPE分別為10.32%、16.27%、13.89%(見圖1),并發現在引入上、下游路段交通流數據后,SVM的交通斷面流量預測精度大約提高6%,但仍低于組合模型。相比之下組合預測模型能夠綜合單項模型的優勢,在收斂速度、精確度等方面均優于單項預測模型。

6 結論

構建組合模型對短時交通流量進行預測,利用最優組合原理將支持向量機與人工神經網絡進行組合,并通過對原始數據的預處理,改進單項模型的預測性能和預測準確度。實驗結果表明,基于支持向量機(SVM)與BP神經網絡的組合模型(SVM-BPNN)以及SVM與徑向基神經網絡(SVM-RBFNN)的組合預測模型,能夠綜合單項模型的優點,降低模型對歷史數據的依賴,其中SVM-RBFNN預測效果最好,預測誤差MAPE平均控制在10%以內,結果優于單項預測模型,適合用于短時交通流預測。

參考文獻:

[1] 劉學剛,張騰飛,韓印.基于ARIMA模型的短時交通流預測研究[J].物流科技,2019,42(12):91-94,102.

[2] 傅成紅,楊書敏,張陽.改進支持向量回歸機的短時交通流預測[J].交通運輸系統工程與信息,2019,19(4):130-134,148.

[3] Yu B,Wang Y T,Yao J B,et al.A comparison of the performance of ann and svm for the prediction of traffic accident duration[J].Neural Network World,2016,26(3):271-287.

2016 林海濤.面向短時交通流量預測的神經網絡算法研究[D].南京:南京郵電大學,2016.

[5] 沈洋,戴月明.支持向量機多分類技術研究[J].數字通信世界,2019(6):116-117.

[6] 楊文臣,李立,胡澄宇,等.不利天氣對公路交通安全及交通流的影響研究綜述[J].武漢理工大學學報(交通科學與工程版),2019,43(5):843-849,854.

收稿日期:2022-02-10

基金項目:本文系2020年廣州城建職業學院校級科研項目-自然科學項目“面向短時交通流量預測的神經網絡組合預測算法研究”(2020Yzk07)成果;2019年廣東省教育廳省級質量工程教育教學改革與實踐項目(GDJG2019254);2019廣東省職業技術教育學會第三屆理事會科研項目重點立項課題(201907Z10)

作者簡介:劉君(1983—),男,副教授,碩士,研究方向為群與圖、數學建模。

猜你喜歡
支持向量機神經網絡
神經網絡抑制無線通信干擾探究
基于改進支持向量機的船舶縱搖預報模型
基于支持向量機的金融數據分析研究
基于神經網絡的拉矯機控制模型建立
復數神經網絡在基于WiFi的室內LBS應用
基于支持向量機回歸和RBF神經網絡的PID整定
基于神經網絡分數階控制的逆變電源
基于GA-BP神經網絡的光伏陣列MPPT研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合