?

基于WT-SLSTM 模型的交通流預測研究

2023-12-07 01:35席一丹白惠君周曉淵韓峰宇
山西交通科技 2023年4期
關鍵詞:車流量交通流預測值

張 瑞,席一丹,白惠君,周曉淵,韓峰宇

(太原工業學院,山西太原 030008)

0 引言

交通事故是一種嚴重的公共安全問題,對人民生命財產安全和社會穩定造成了巨大的影響。在當前交通管理的實踐中,交通流預測是實現交通管控和優化交通系統運行的關鍵技術之一。交通流是指一定時間內通過道路或交通網絡的車輛數量、速度和密度等交通參數的總體表現。通過對交通流進行預測,可以為路線規劃、交通管理等方面提供決策支持。

自20世紀開始,部分國家開始投入大量精力對交通管控技術進行研究,于是,交通流預測的各種模型也就應運而生。目前,常用的預測模型主要包括傳統統計學模型、機器學習模型、深度學習模型。傳統統計學模型應用于交通流時間較早,包括時間序列模型(Time-Series Model)、卡爾曼濾波模型(Kalman Filtering Model)等。徐翠翠等人[1]使用ARIMA 模型進行城市交叉路口交通流預測建模,該模型能夠準確地預測早高峰和晚高峰時段的交通流。為了提高交通流預測的準確性,楊紫煜等人[2]提出了一種新的方法,根據卡爾曼濾波理論,利用重構后的相位作為卡爾曼濾波的初始值進行預測。然而,由于統計學模型依賴于先驗知識設定模型的參數,其算法結構相對簡單,不能夠深入挖掘交通流的深層次特征信息。與此相比,機器學習模型在處理非線性、非平穩序列方面具有優勢。何祖杰等人[3]提出了一種基于IGWO-SVM 的短期交通流預測模型,通過與實際數據進行對比分析,結果表明該模型具有良好的預測能力。

深度學習是現在研究的焦點,自2010年以來熱度增長迅速。深度學習模型應用于許多領域,包括空氣污染預測[4]、股票市場預測[5]、物理[6]等。循環神經網絡模型(Recurrent Neural Network,簡稱RNN)[7]在序列預測任務中取得了顯著的成績。Hochreater 和Schmidhuber[8]提出了長短期記憶(Long Short term Memory,簡稱LSTM)神經網絡來解決RNN 的梯度爆炸和梯度消失問題。李雪梅等人[9]使用基于雙向長短期記憶網絡(Bi-direction Long Short Term Memory,簡稱Bi-LSTM)的預測模型利用雨天和非雨天、工作日和非工作日影響因子分別對交通流進行預測,并與LSTM 進行比較,結果表明Bi-LSTM 的預測效果較好。滕騰等人[10]采用堆疊式長短期記憶網絡(Stack Long Short Term Memory Network,簡稱SLSTM)模型對長期狀態進行處理。在SLSTM 模型中,存在多個隱藏LSTM 層,每層包含多個LSTM 單元,上層的LSTM 結構輸出一個隱藏狀態序列,輸入到下一層結構中,可以更好地捕捉信息。李楷等人[11]提出了一種SLSTM 神經網絡來對交通流進行短期預測,結果表明所提出方法優于常用的機器學習和經典的LSTM 方法。

然而,交通流的預測受到許多因素的影響。Niam Archana 等人[12]通過利用過去和當前的交通和天氣信息捕捉交通和降雨數據之間的時空相關性,得出降雨對道路交通流預測具有影響。Attallah Mustafa 等人[13]提出了一種實時高分辨率天氣雷達數據與交通流數據融合的預測模型,通過與無天氣雷達數據模型對比,得出天氣因素對交通流預測有較大影響。由于交通流的復雜性和不確定性,預測模型存在著預測精度不高和預測滯后等問題,因此需要尋求更加高效和精確的交通流預測方法,學者們對此問題展開了廣泛的研究。劉兵等人[14]采用物聯網與大數據相結合的模型,提高了預測精度,減小了預測滯后。陸百川等人[15]分析了交通流的時空特征和數據特征,建立了空間鄰接矩陣;其次,通過時空相關性函數量化不同時間延遲對交通的影響,并結合神經網絡構建了交通流預測模型,使預測結果更加精準。

盡管交通流預測已經取得了一定的成果,但其預測精度和預測滯后等問題仍然需要提高和改進。為了解決這些問題,本文提出了WT-SLSTM(Wavelet Transform and Stacked Long Short Term Memory)模型。具體而言,首先,采用小波變換將最初的短時交通流分解成在各個尺度空間和小波空間上的時間序列信號;接著,將各個時間序列信號傳遞到SLSTM 神經網絡模型中,在調整學習率、滯后時間和批量大小等參數的基礎上進行預測;最后,將各信號的預測值進行小波重組,得到最終預測值。為了證明WT-SLSTM 模型的優越性,本文對北京市出租車車流量數據進行了預處理,并使用預處理后的數據進行訓練和預測;從常用評價指標和折線圖兩個方面對預測性能進行了比較。試驗結果表明,WT-SLSTM 模型優于基準模型,極大地提高了交通流預測的精度。

1 模型說明

1.1 SLSTM 模型

LSTM 神經網絡模型是RNN 的一種重要變體,由Hochreater 和Schmidhuber 于1997年首次提出。相比于傳統的RNN 模型,LSTM 神經網絡模型引入了輸入門f(t),遺忘門i(t)和輸出門o(t),以實現更好的信息處理和傳遞能力。在神經網絡的訓練過程中,通過門結構增添和遺忘信息,不同的神經網絡可以通過其單元狀態上的門結構來選擇性地記住或遺忘哪些信息。f(t)、i(t)、o(t)分別對t時刻時上一單元的隱藏狀態ht-1和當前輸入xt進行初步特征提取。LSTM 模型單元運算包括以下幾個步驟:首先,在遺忘門中輸入信息并激活函數來選擇要丟棄的信息,公式如式(1):

然后,輸入門i(t)決定哪個狀態要更新,將該狀態與tanh激活函數所生成的向量c'(t)相加,計算公式如式(2)~式(4):

最后,輸出門產生最終輸出,計算公式如式(5)、式(6):

式中:Wf、Wt、Wo、Wc表示遺忘門、輸入門、輸出門和記憶單元的權重系數矩陣;bf、bt、bo、bc表示遺忘門、輸入門、輸出門和記憶單元的偏置條件。

1.2 SLSTM 模型

在2015年,Dyer 等學者[16]提出了SLSTM 模型,該模型是LSTM 模型的改進形式,由多個LSTM 層和一個Softmax 函數組成。由于單一的LSTM 神經網絡在提取時間序列數據方面的能力有限,所以通常將多個LSTM單元組合起來進行訓練以提高模型的精度。隨著層數的增加,輸入觀察時間的抽象級別也增加。此外,多個LSTM 單元的輸入值和輸出值之間僅有一些微小的區別,在本質上仍然是一致的。相比于傳統的LSTM,SLSTM 不僅考慮當前時刻的輸入值,還考慮了上一時刻的輸入值。因此,SLSTM 模型的隱藏層更加深入,比LSTM 內部的記憶單元更有助于預測。其3 層時序結構如圖1所示。

圖1 3層LSTM 時序結構

1.3 小波變換

小波變換是一種基于多尺度分析的信號處理方法,其基本思想是通過取樣頻率和多分辨率分析確定原信號的近似空間Vj,以便更好地反映原信號的各種信息。通過對原信號進行分解,得到近似部分Ca1和細節部分Cd1。然后可選取近似部分或細節部分繼續分解。小波變換的原理圖如圖2所示。如果需要對原信號進行數據壓縮,則可以舍棄值比較小的Cdj-1分量,這不會明顯改變原信號的特征,但可以大大提高數據壓縮的效果。當Cdj-1分量被修改完成后,需要重構算法重新組裝被過濾或壓縮的信號。

圖2 小波變換原理圖

1.4 WT-SLSTM 模型

本文提出了一種新穎的混合WT-SLSTM 模型,用于預測短時交通流。該模型結合了數據分解手段和SLSTM 神經網絡,可以分為3 個主要部分:數據分解、子信號預測和小波重組。圖3 展示了整體預測框架。

圖3 WT-SLSTM 模型流程圖

首先,為了降低原始交通流數據的復雜度,同時提高預測精度,采用小波分解方法將原始交通流數據分解成k個子信號。接下來,每個子信號對應于一個通道,并利用SLSTM 神經網絡分別預測各個子信號。在此過程中,調整SLSTM 神經網絡的參數,并選擇最佳擬合模型。最后,每個子信號的預測值被重構以實現最終的短時交通流預測。具體而言,每個子信號輸出一個m維向量,采用小波重組獲得最終交通流預測值。

1.5 模型預測性能度量指標

為了更準確地評估模型的預測能力和驗證方法的有效性,本文采用平均絕對誤差(Mean Absolute Error,記作MAE)、均方根誤差(Root Mean Square Error,記作RMSE)、平均絕對百分比誤差(Mean Absolute Percentage Error,記作MAPE)和相關系數(Coefficient of determination R squared,記作R2)作為預測性能指標。每個評估指標的計算公式如式(7)~式(10):

2 實證分析

2.1 數據預處理

本文采用北京市出租車軌跡數據,時間跨度為一周。數據采樣時間間隔為100 s,選取東經116.4°至116.408°,北緯39.9°至39.906°的區域。為了確保數據的可預測性,夜間車流量幾乎為零的時間段已被剔除。最終整理出該區域周一至周四每天從第10 000 s 至76 400 s 所對應的車流量數據,如圖4所示。

圖4 時間-車流量折線圖

鑒于車流量數據在不同時段有不同數量級,為消除對預測結果的影響,將其進行標準化,公式如式(11)所示:

式中:mean(x)是樣本均值;std(x)是樣本標準差。

2.2 模型分析

經過預處理后,將車流量數據按照10∶1 的比例劃分為訓練集和測試集。首先,將訓練集輸入到SLSTM模型中,隱藏層狀態變量的維度為128,學習率為0.001,迭代次數為200 次,使用PMSprop 優化器進行訓練。預測結果與測試集數據進行比較,采用MAE、RMSE、MAPE、R2作為指標對模型進行綜合評估。預測結果表明,MAE、RMSE和MAPE的值分別為2.44、3.02 和19.87,R2的值為0.12,擬合效果較差。

為了解決單個SLSTM 模型預測效果差的問題,引入小波變換,以此優化SLSTM 模型。于是,基于深度學習TensorFlow 框架,建立WT-SLSTM 神經網絡模型。首先,對數據進行小波分解。將訓練集分解為近似部分Ca1和細節部分Cd1,再將Ca1分解為近似部分Ca2和細節部分Cd2,繼而將Ca2分解為近似部分Ca3和細節部分Cd3。分解結果如圖5所示。接著,分別將Ca3,Cd1,Cd2和Cd3分別輸入SLSTM 神經網絡模型進行訓練和預測。模型輸入為各個小波分量,輸出層為各分量預測值,滯后時間為4,時間步長為1,學習率為0.001,迭代次數為200 次,使用PMSprop 優化器進行訓練。最后,將各小波分量預測值進行小波重組,并進行反標準化,從而得到出租車車流量的最終預測值。

圖5 小波變換預測結果

預測過程結束后,將預測結果和測試集數據進行比較,選取MAE、RMSE、MAPE、R2為度量指標來綜合評估預測結果。為了驗證WT-SLSTM 模型的有效性,將其與基準模型進行對比,包括決策樹(DT)、隨機森林(RF)、LSTM、SLSTM 模型。評估結果如表1所示??傮w上,深度學習模型(LSTM、SLSTM、WT-SLSTM)優于機器學習模型(DT,RF)。在深度學習模型中,加入了小波變換后預測效果得到了顯著提升。WT-SLSTM 模型與SLSTM 模型相比,MAE、RMSE、MAPE分別減小了49.18%,49.66%,9.47%,R2提升了6.41 倍;與LSTM 模型相比,MAE、RMSE、MAPE分別減小了50.59%,50.48%,10.18%,R2提升了8.55 倍。因此,WT-SLSTM 模型擬合效果優于基準模型。

表1 預測性能評價表

為了進一步驗證WT-SLSTM 模型的預測性能,繪制實際值和預測值的對比曲線圖,如圖6所示。DT、RF、LSTM 和SLSTM 模型的預測曲線存在滯后現象和偽峰現象。相比之下,WT-SLSTM 模型修正了這種現象,預測效果更佳。然而,同時也觀察到WT-SLSTM 模型的預測峰值低于觀測值。隨著預測時間的增加,模型逐漸難以預測出與觀測值高度一致的值,這可能是由于出租車扎堆現象較為少見所致。一方面,為了準確預測,模型需要大量的觀測數據;另一方面,出租車扎堆現象并不常見,因此WT-SLSTM 模型難以學習到某些極端峰值,導致低估預測結果。

圖6 對比折線圖

綜上所述,WT-SLSTM 模型的預測效果明顯優于其他基準模型,具體表現在預測誤差小、與真實值數據匹配度高、擬合程度更好。對于傳統的LSTM 模型,SLSTM 模型提取和儲存數據的效果更好、預測精度更高。然而SLSTM 模型對時間序列數據的提取能力有限,本文通過加入小波變換來彌補該問題。小波變換可以覆蓋整個頻域,對時間頻率的局部化進行分析,還能通過伸縮平移運算對信號逐步進行多尺度細化。本文利用其高頻處時間細分、低頻處頻率細分的特點,再結合SLSTM 模型,從本質上分析了交通流序列的頻率構成,提高了預測精度,獲得了較好的預測效果。

3 結語

本文結合小波變換與SLSTM 神經網絡模型,對北京市出租車車流量進行預測研究。實證結果顯示,與基準模型相比,WT-SLSTM 模型的預測效果明顯提升,預測值更加接近真實值。因此,本文提出的WT-SLSTM 神經網絡模型在交通流預測方面效果較好,性能更加穩定,可以更好地掌握交通動態,為交通部門制定和實施政策提供參考。

猜你喜歡
車流量交通流預測值
加拿大農業部下調2021/22年度油菜籽和小麥產量預測值
±800kV直流輸電工程合成電場夏季實測值與預測值比對分析
法電再次修訂2020年核發電量預測值
交通流隨機行為的研究進展
路內停車對交通流延誤影響的定量分析
參考答案
具有負壓力的Aw-Rascle交通流的Riemann問題
高速公路重大節假日免費車流量金額算法研究與應用
一種新型多車道車流量檢測算法
考慮車輛間博弈行為的交通流
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合