?

基于時空圖卷積網絡的城市交通流預測模型

2023-05-12 00:52路佳玲魏志成
關鍵詞:鄰接矩陣交通流卷積

路佳玲 魏志成 田 多

(河北師范大學計算機與網絡空間安全學院1) 石家莊 050024) (河北師范大學河北省網絡與信息安全重點實驗室2) 石家莊 050024)

0 引 言

近年來,國內智能交通系統(intelligent transportation system, ITS)發展迅速,交通預測作為ITS的重要內容,正在受到學者們的廣泛關注.準確的交通流量預測可以提高城市居民出行效率,加強城市交通管理水平.

交通流量的預測方法主要分為模型驅動和數據驅動兩大類.模型驅動方法由于模型固定,預測結果通常會不盡人意,因此人們已將預測的重點轉變為數據驅動方法[1-2].數據驅動方法包括統計分析模型和機器學習模型兩大類.歷史平均模型(historical average, HA)和自回歸綜合移動平均模型[3](autoregressive integrated moving average, ARIMA)是統計分析模型的經典方法,算法簡單,易于實現.然而這種模型會受到時間序列平穩性假設的限制,因此無法有效的預測具有高度非線性和復雜性特征的交通數據.常用的機器學習方法包括K近鄰、隨機森林、支持向量回歸(support vector regression, SVR)等,與統計分析模型相比,機器學習模型通??梢赃_到較好的預測效果.

機器學習模型通常架構淺易,在處理大規模、高復雜度的數據時,會顯得稍有不足.面對高度非線性和復雜性的交通數據,深度學習方法展現出巨大的優勢.Ma等[4]采用長短期記憶網絡(long short-term memory, LSTM)進行交通速度預測.Zhang等[5]結合天氣條件數據,采用門控循環單元(gate recurrent unit, GRU)預測城市交通流.Vijayalakshmi等[6]基于注意力機制,使用卷積神經網絡(convolutional neural network, CNN)和LSTM進行交通流預測.

交通數據包含了空間信息,具有非歐幾里得的拓撲結構[7].然而傳統的深度學習方法無法很好的處理非歐幾里得數據.近年來,圖卷積神經網絡[8-9](graph convolutional network, GCN)越來越多的被用于交通預測任務中.GCN將一組節點及節點間關系構成的圖作為輸入,從而提取出節點間的空間關聯性.Yu等[10]提出了時空圖卷積網絡(spatio-temporal graph convolutional network, STGCN)預測交通速度.Guo等[11]使用注意力機制并結合GCN和標準二維卷積預測交通流.Zhao等[12]結合GCN和GRU進行交通預測.

現有的基于GCN的交通流預測模型通常將研究重點放在網絡層的結構上,而忽略了鄰接矩陣的構建.在圖卷積網絡中,鄰接矩陣的質量對網絡性能的好壞有很大的影響.文中提出一種預測城市交通流的多因子圖構建時空圖卷積網絡(multi-factor graph construction spatio-temporal graph convolutional network, MFGC-STGCN),從節點間交互交通流數量、交互時間代價、流出交通流相似度三個角度出發,構造更精確的鄰接矩陣.并用實例驗證了模型的預測性能.

1 交通流預測問題定義

將交通網絡定義為無向圖G=(V,E,A),其中V為節點集;E為邊集;A∈RN×N為圖G的加權鄰接矩陣.文中將研究區域柵格化為N個地塊,對應于V中的N個節點.每個節點記錄了地塊的交通流量.

2 MFGC-STGCN交通流預測模型

2.1 模型框架

針對城市的復雜交通流,文中提出了MFGC-STGCN模型進行交通流預測任務.此模型從時間和空間兩個維度提取交通流的時空特征,從而提高預測精度.MFGC-STGCN模型結構見圖1.模型由兩個模塊組成,一個是構建加權鄰接矩陣的模塊,一個是圖卷積網絡模塊.利用交通數據計算節點之間的關聯,得到圖的加權鄰接矩陣A,并將其作為空間卷積層的輸入.空間卷積層基于GCN提取空間特征,時間卷積層基于門控線性單元(gated linear units, GLU)提取時間特征.其間還通過一維卷積層再次提取時間特征,在時間軸上進行降維.

圖1 MFGC-STGCN結構框架

(1)

2.2 交通數據圖表示

w2×Pearson(Oi,Oj)

(2)

(3)

設w1=w2=0.5.

(4)

2.3 時間卷積層

時間卷積層使用GLU提取城市交通流的時間動態特征.模型共有兩個時間卷積層,以第一個為例,結構見圖2.Xl∈RN×H×Cin為第一個時間卷積層的輸入;Cin為輸入通道數,第一個時間卷積層的Cin=1.Xl+1∈RN×(H-Kt1+1)×Cout為第一個時間卷積層的輸出,也是空間卷積層的輸入;Cout為輸出通道數.對Xl進行一維卷積,卷積核?!蔙Kt1×Cin×2Cout,得到輸出Xl′∈RN×(H-Kt1+1)×2Cout.將Xl′分為相同大小的兩部分,一部分使用殘差連接,另一部分使用sigmoid函數進行激活.然后計算兩部分輸出的Hadamard乘積,從而得到第一個時間卷積層最終的輸出Xl+1.

圖2 時間卷積層結構

第二個時間卷積層的輸入為Xl+3∈RN×(H-Kt1-Kc+2)×Cin,輸出為Xl+4∈RN×(H-Kt1-Kc-Kt2+3)×Cout.Kc為一維卷積層的卷積核寬度,Kt2為第二個時間卷積層的卷積核寬度,H-Kt1-Kc-Kt2+3=1.

2.4 空間卷積層

gθ*Gx=UgθUTx

(5)

式中:卷積核gθ=diag(θ),參數θ∈RN;*G為圖卷積操作;UTx為信號x的圖傅里葉變換.

當圖規模較大時,對L進行特征分解的計算量大,因此引入切比雪夫多項式.

(6)

空間卷積層在第一個時間卷積層之后,首先將第一個時間卷積層的輸出Xl+1和鄰接矩陣A輸入至空間卷積層.空間卷積層的輸入為Xl+1∈RN×(H-Kt1+1)×Cin,其中Cin為空間卷積層的輸入通道數,也等于第一個時間卷積層的輸出通道數.空間卷積層同樣采用了殘差連接.將輸入Xl+1經過切比雪夫圖卷積得到的結果與輸入Xl+1相加,然后經過ReLU激活函數,得到輸出Xl+2∈RN×(H-Kt1+1)×Cout.

2.5 一維卷積層

一維卷積層在空間卷積層之后.它再次提取時間特征,對數據在時間軸上進行降維.一維卷積層的輸入經過卷積核寬度為Kc的卷積操作,時間步由H-Kt1+1變為H-Kt1-Kc+2.最后使用Dropout正則化防止過擬合.Dropout正則化是深度學習領域最受歡迎的正則化技術,它會在迭代過程中以一定的概率隨機選擇神經元使其失活,從而降低神經元之間的依賴性.

3 實驗與評估

3.1 數據準備

使用2018年3月石家莊二環范圍的網約車OD數據作為數據集.在對原始數據進行預處理后,每一條記錄包括上車位置和下車位置(經度和緯度)、上車時間和下車時間6個字段.將研究區域柵格化為340個地塊,以15 min為時間間隔,地塊流量定義為地塊內上車量與下車量之和.選取歷史數據的前70%作為訓練集,其余為驗證集和測試集.此外,對實驗數據進行了z-score歸一化.

3.2 參數設置

MFGC-STGCN模型除第一層的輸入通道數和最后一層的輸出通道數為1,其余通道數均設置為64.σ設置為0.3,H設置為12,K、Kt1、Kc均設置為3,Kt2設置為8.模型訓練的批次大小為32,優化器為AdamW.學習率初始值為0.001,并隨著訓練過程不斷衰減.

3.3 評價指標

使用平均絕對誤差(mean absolute error, MAE)和均方根誤差(root mean square error, RMSE)評價模型性能.兩個指標為

(7)

(8)

3.4 實驗結果與分析

將文中的模型MFGC-STGCN與HA、FNN、LSTM、GRU、STGCN等模型進行對比,見表1.由表1可知:MFGC-STGCN在所有模型中表現出最佳的預測效果.傳統的統計分析模型HA由于無法分析復雜的交通數據,預測效果最差.基于深度學習方法的模型預測結果均優于HA.結合了GCN的STGCN和MFGC-STGCN優于深度學習模型.其中MFGC-STGCN的MAE較STGCN降低了0.223,RMSE降低了0.309.

表1 不同模型預測性能對比

選取五個流量較大的地塊,對它們不同時間段平均流量的預測結果進行可視化,見圖3.由圖3可知:MFGC-STGCN和STGCN模型的擬合程度較好.其中,文中算法MFGC-STGCN的擬合效果最好,預測值和真實值誤差最小.LSTM、GRU、FNN的擬合效果相對較差.特別是FNN,在流量較低的時間段,預測值普遍比真實值偏高,在流量較高的時間段,預測值普遍比真實值偏低.

圖3 不同模型預測效果可視化

圖4為MFGC-STGCN和STGCN模型的預測誤差.預測誤差指在對應時間點所有地塊預測值與真實值的絕對誤差之和,文中對縱軸進行了歸一化.由圖4可知:在絕大部分時間點中,MFGC-STGCN的誤差明顯小于STGCN.圖5為隨著訓練輪次增加,測試集MAE的變化曲線.MFGC-STGCN和STGCN的MAE初始值接近,但相比之下MFGC-STGCN的收斂速度更快.在40~100輪次,MFGC-STGCN的MAE下降迅速.所有試驗在Windows操作系統(Intel(R) Core(TM) i5-6500 CPU @ 3.20 GHz)上運行.與STGCN相比MFGC-STGCN訓練速度更快,MFGC-STGCN訓練1個epoch大約需要51 s,STGCN訓練1個epoch大約需要95 s.

圖4 不同模型的預測誤差可視化

圖5 測試集MAE隨訓練輪次的變化

4 結 束 語

文中提出的MFGC-STGCN模型可以有效的挖掘交通數據的時空信息,MFGC-STGCN模型從時間和空間兩個維度提取交通流的特征,預測效果明顯優于僅提取時間特征的經典模型.同時,MFGC-STGCN模型與同樣提取交通流時空特征的STGCN模型相比,使用的參數數量更少,訓練速度更快,預測準確率更高.但在現實生活中,天氣情況、社會事件等外部因素對交通流量具有一定的影響.后續研究將MFGC-STGCN模型融合一些外部因素,進一步提高預測精度.

猜你喜歡
鄰接矩陣交通流卷積
輪圖的平衡性
基于3D-Winograd的快速卷積算法設計及FPGA實現
從濾波器理解卷積
基于傅里葉域卷積表示的目標跟蹤算法
交通流隨機行為的研究進展
基于鄰接矩陣變型的K分網絡社團算法
路內停車對交通流延誤影響的定量分析
具有負壓力的Aw-Rascle交通流的Riemann問題
Inverse of Adjacency Matrix of a Graph with Matrix Weights
一種基于卷積神經網絡的性別識別方法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合