?

面向高速公路服務區流量預測的動態時空圖神經網絡

2024-01-05 07:21滕志偉段洪琳王振華蔡燦金尚泰
關鍵詞:交通流量服務區注意力

滕志偉,段洪琳,王振華,蔡燦,金尚泰

(1. 招商新智科技有限公司,北京 100073;2. 北京交通大學 電子信息工程學院,北京 100044)

高速公路服務區保障了人們的安全出行和舒適出行,并且可以給出行者提供諸多便捷服務。服務區的服務能力高低不僅影響高速公路的通行效率,還影響著人們的出行體驗。因此,提升高速公路服務區的管理水平和服務質量,可以滿足出行者的多種需求,提升出行感受。

交通流量是描述高速公路服務區交通狀態的重要參數。 通過對服務區駛入車流量的預測,可以讓服務區管理部門提前預知需要多大的服務能力來應對將要到達的車輛,在低峰期減少人員和資源浪費,高峰期對高速公路上的車輛進行合理的疏導。交通流量預測是智能交通領域的一個研究熱點,已經有很多方法被用于交通流量預測。最初的研究者利用傳統的時間序列分析模型預測交通流量,Williams 等人[1]充分考慮了交通流量的周期性特點,基于ARIMA(Auto-Regressive Integrated Moving Average)預測交通流量。Lu 等人[2]基于交通流量序列中的格蘭杰因果關系,利用VAR(Vector Auto-Regression)預測交通流量。由于交通流量序列的復雜性和非線性特征,對交通流量序列的動態性做出線性相關性假設的模型無法取得理想的效果。為此,一些研究學者基于非線性模型描述交通流序列,以實現對未來交通流的預測。 王科偉等人[3]利用相空間重構的方法對多維交通流量時間序列數據進行了重構,基于混沌理論預測交通流量。張培林等人[4]針對路網中相鄰斷面(如收費系統中的門架)間的關聯性,構建了高維混沌時間序列模型預測交通流量。這些基于非線性理論的預測模型通常比線性模型的效果更好,但是他們的表現很大程度上依賴于大量的特征構造,而特征構造通常是比較耗時的。 為此,很多研究基于深度神經網絡預測交通流量[5-7]。 Zhang 等人[8]利用長短期記憶循環神經網絡預測交通流量。王體迎等人[9]利用門控循環神經網絡對交通流量進行預測。雖然已有很多工作研究了交通流量預測,但是對于高速公路服務區的流量預測還存在一些挑戰。

首先,盡管基于循環神經網絡或者卷積神經網絡的方法可以捕獲交通流量數據中存在的動態性,但其建模的動態性相對于輸入數據在時間維度上的變化是不變的,這將限制模型的預測能力[10]。注意力機制[11]可以建模流量數據在時間維度的動態相關性,但是難以捕獲流量序列中的局部趨勢性,為此,本文構造了感知趨勢性變化的多頭注意力模塊,以動態地捕獲流量序列中的動態性。

另外,高速公路服務區屬于高速公路網中的一部分,駛入服務區的車流量與路網中其他斷面的流量具有空間相關性,比如高速公路服務區上游斷面的流量增大,駛入服務區的車流量也可能增大。為捕獲路網系統中不同位置交通流量的空間相關性,一些基于圖神經網絡[12-16]的方法被用于交通流量預測,但是,由于不同位置的流量序列具有其獨特的屬性,比如在相同時間段的變化范圍,變化幅度可能是不同的,因此高速公路網中的交通流量具有空間異質性[17]?;趫D卷積的方法利用靜態的圖結構建模不同位置流量的空間相關性,難以建??臻g異質性,為此,本文利用動態圖神經網絡捕獲路網中的空間異質性,實現更準確的流量預測。

為實現準確地預測駛入高速公路服務區的車流量,本文提出一種動態時空圖神經網絡(Dynamic Spatial-Temporal Graph Neural Network,DSTGNN),通過動態圖神經網絡建模駛入服務區車流量與其他斷面流量的動態空間相關性和異質性。 在時間維,構造感知趨勢性變化的多頭注意力模塊,對流量序列在時間維度上的動態性進行建模。 最后,本文通過實驗說明了提出方法的有效性。

1 相關理論

1.1 問題定義

本小節給出高速公路流量預測問題的形式化定義。

(1)高速公路路網。將高速公路路網定義為一個有向圖G= (V,E),其中V是|V|=N個節點的集合,每個節點代表高速公路上的一個斷面處的檢測點(如收費系統中的門架)或者服務區。E是|E|=M條邊的集合,表示節點間的連接關系。

(2)圖信號矩陣。 在第t個時間間隔內,觀測到高速公路路網G上的信號用矩陣Xt=(xt,1,xt,2,…,xt,N)T∈RN×C表示,其中xt,v∈RC表示第t個時間間隔內節點v的C個觀測量的取值。ft=表示第t個時間間隔內,高速公路路網G上N個節點處觀測到的流量序列。

(3)駛入服務區車流量。根據服務區(節點i)所在路段的鄰接上下游斷面檢測點得到通行車輛的軌跡數據,在各個時間間隔t計算經過服務區所在路段的車輛通行時間,若車輛通行時間大于最長通行時間,則將該車輛計入駛入服務區的流量。其中,最長通行時間由服務區所在路段長度和路段最低限速計算得到。

(4)交通流量預測。 給定歷史Th個時間片的時空圖信號矩陣χ= (Xt-Th+1,Xt-Th+2,…,Xt) ∈RN×C×Th,測未來Tp時間片內的流量矩陣F=(ft+1,ft+2,…,ft+Tp) ∈RN×Tp。 本文在訓練和驗證中預測所有節點的交通流量,在測試中只預測服務區的駛入車流量。

1.2 注意力機制

注意力機制的優勢在于可以根據不同的模型輸入動態地從輸入中抽取出更為關鍵的信息,從而學習到更準確有用的信息應用于下游模型。交通流量數據在空間維度的相鄰的節點之間或者在時間維度的相鄰時間片之間的相關性是動態變化的,可以通過注意力模塊去學習流量數據在時間維度的動態相關性。

注意力機制的核心思想是使用查詢向量和鍵值向量,將值向量映射成一個輸出向量。 注意力機制使用查詢向量和鍵值向量為每一個值向量計算出一個重要性權重,然后將值向量加權求和得到最終的輸出向量,形式化的表示如下:

其中,Q是查詢向量;K是鍵值向量;V是值向量;dmodel為向量的維度。

1.3 圖卷積神經網絡

服務區所在高速公路網的結構是非歐式的,即路網的局部輸入維度可變,并且局部輸入的排列具有無序性,此時常規的卷積網絡已無法適用路網對應的圖結構,可以基于圖卷積神經網絡建模服務區所在路網的交通流量數據。

由于二維卷積在歐式空間中使用卷積核去捕獲空間維度的局部特征,因此其無法處理非歐氏空間圖結構類型的數據。為了能有效學習圖結構數據的空間維度特征,將圖信號矩陣通過傅里葉變換轉化到譜域中,在譜域中定義與卷積核算子等價的對角化線性算子,對經過傅里葉變換后的圖信號矩陣在譜域中實現卷積運算。傅里葉變換需要對通過鄰接矩陣和度矩陣計算得到的拉普拉斯矩陣分解,一般采用切比雪夫多項式去近似替換該操作。ChebNet 圖卷積運算[18]使用切比雪夫多項式近似將圖卷積的操作限制在了K階鄰域內,定義如下:

其中,θk∈RK是待學習的參數;x∈RN是N個節點某一特征的圖信號矩陣;是歸一化的拉普拉斯矩陣,是矩陣L的最大特征值。矩陣,A為圖的鄰接矩陣,D∈RN×N是一個對角矩陣,其對角線上元素的取值為。 切比雪夫多項式以遞歸的形式定義為Tk(x) = 2fTk-1(x) -Tk-2(x),其中T0(x) =1,T1(x) =x。 Welling 等人[19]僅使用一階鄰居簡化了ChebNet 中的卷積操作,提出了GCN 模型:

其中,σ是非線性激活函數;W∈RC×F是卷積核的參數矩陣;對于本文研究的有向圖,A=表示圖節點間的交互關系;為圖鄰接矩陣,。

2 基于動態時空圖神經網絡的服務區流量預測模型

本文提出了一種動態時空圖神經網絡模型應用于高速公路服務區車流量預測,如圖1(a)所示。 該模型基于編碼器-解碼器結構,其中,編碼器和解碼器都由具有相同結構的動態時空相關性建模模塊(圖1(b))堆疊而成。

圖1 DSTGNN 模型架構

2.1 動態時空相關性建模模塊

2.1.1 感知趨勢性的多頭自注意力

多頭自注意力機制是一種常用的注意力機制的實現方式,它可以從不同的子嵌入空間中提取有用的信息,與單頭注意力機制相比,多頭自注意力機制可以學習到更豐富的信息,其形式化表示如下:

其中,h為注意力頭數;為作用于Q、K、V的映射矩陣;WO為輸出映射矩陣。多頭自注意力機制可以用于建模交通流量數據中復雜的動態相關性。然而,多頭自注意力機制最初被提出時是用于處理離散的數據,比如單詞,其并不能很好地建模連續數據中的局部趨勢性信息,因此,在應用其建模交通流量數據時,難以捕獲到序列中局部的趨勢性變化。為更好地學習到交通流量在時間維度上的動態相關性,本文使用感知趨勢性變化的多頭自注意力機制在時間維度建模流量數據的局部上下文信息。利用一維卷積運算替換公式(4)中對查詢向量和鍵值向量執行的映射運算。由于卷積運算可以將局部上下文信息用于計算嵌入表示的輸入,因此模型可以感知到交通流量序列中局部的趨勢性變化模型。感知趨勢性的多頭自注意力機制(Trend-Aware Multi-Head Self-Attention,TAMHSA)具體定義為:

2.1.2 空間動態圖卷積

DSTGNN 模型使用動態圖神經網絡捕獲駛入服務區的交通流量與路網中斷面交通流量在空間維度的動態性和異質性。圖卷積網絡通過聚合節點間的信息學習各個節點的嵌入表示。在第l個動態時空相關性建模模塊中,基于感知趨勢性的多頭自注意力的輸出,圖卷積運算表示為:

動態圖卷積網絡通過自注意力機制動態地計算節點間的空間相關性。給定感知趨勢性的多頭自注意力輸出的節點嵌入表示,空間相關性權值矩陣St∈RN×N的計算定義為:

其中,St中的元素Sij表示節點i和節點j的相關性強度。得到空間相關性權值矩陣St后,可通過哈達瑪乘積運算將其用于調整靜態的權值矩陣A,具體計算為:

2.2 時空位置嵌入表示

2.2.1 時間維位置嵌入表示

在時間維度的感知趨勢性的多頭自注意力模塊中,輸入序列的動態性完全由自注意力機制建模。由于自注意力機制的運算中利用加權求和函數建立輸入和目標值之間的相關性,其無法感知序列中的順序性。 然而,時間序列的順序性信息對于準確的服務區駛入車流量預測是非常重要的,比如,在預測中午11 點至12 點駛入服務區的車流量時,10 點至11 點的交通流量信息通常會比9 點至10 點的交通流量信息更具有指導性。 因此,本文使用位置嵌入表示[20]建模輸入序列在時間維度的順序信息。在輸入序列的第p個位置,時間維位置嵌入表示的每一維取值d,1 ≤d≤dmodel表示為:

2.2.2 空間維位置嵌入表示

在2.1.2 中,DSTGNN 模型使用動態圖神經網絡建模高速公路網中不同位置交通流量序列的動態相關性。 然而,高速路網中的服務區或其他斷面節點擁有一些靜態的空間屬性,比如服務區與上下游斷面節點的鄰接關系,服務區與上下游斷面節點的距離等。這種靜態的空間屬性不隨時間變化,在一定程度上解釋了不同位置交通流量序列的空間異質性。融合服務區和斷面節點的靜態空間屬性有助于準確的交通流量預測。 為此,本文在譜域中執行對圖信號矩陣的卷積,學習圖結構數據的空間維度特征。具體的,對每個節點維護一個空間嵌入表示矩陣。然后對其執行圖卷積計算得到空間維度的位置嵌入表示矩陣ESP。

時間維度和空間維度的位置嵌入表示矩陣ETP和ESP與輸入圖信號矩陣χ(0)相加,使得模型感知到輸入序列在時間維度的順序性和空間維度的靜態屬性,以實現更準確的交通流量預測。

2.3 編碼器-解碼器

DSTGNN 模型基于編碼器-解碼器結構,其中,編碼器和解碼器都由具有相同結構的動態時空相關性建模模塊堆疊而成。在動態時空相關性建模模塊中通過殘差連接和層標準化保障深度網絡模型的有效性。首先,基于全連接層和時空位置嵌入表示將原始輸入χ∈RN×C×Th轉化為高維嵌入表示χ(0)∈RN×dmodel×Th,其中dmodel>C。然后通過由L個動態時空相關性建模模塊堆疊而成的編碼器將輸入序列映射為,基于編碼器的輸出χ(L),解碼器利用另外L′個堆疊的動態時空相關性建模模塊生成輸出序列Y(L′)=,最后通過一個全連接層將Y(L′)映射到輸出F。DSTGNN 可以通過反向傳播實現端到端的訓練,以最小化預測值和真實值之間的平均絕對誤差。

3 實驗結果及分析

實驗使用桂林市路網區域基于收費系統數據處理得到的交通流量數據,所選區域共包含36 個斷面和5 個服務區,時間范圍從2022 年1 月1 日到1 月29 日共計29 天。觀測量為交通流量,因此C= 1。以一小時為單位聚合駛入服務區和斷面的交通流量。按6∶2∶2 的比例劃分訓練集、驗證集和測試集,使用訓練集的均值和標準差對所有數據進行歸一化,輸入Th= 12 個時間步的數據,使用前文所述模型預測Tp= 1 個時間步駛入服務區的交通流量。

3.1 評價指標

為驗證本文提出的模型的預測性能,本文選取了回歸任務常使用的平均絕對誤差(Mean Absolute Error,MAE)、均 方 根 誤 差(Root Mean Squared Error,RMSE)和平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE),其公式如下所示:

3.2 基準線模型

選取了以下的基準線模型與本文提出的模型進行對比:(1)ARIMA[1],一種建模時間序列中相關性和趨勢性的預測模型;(2)SVR[21],一種使用支持向量機對時間序列進行擬合并實現回歸分析的機器學習模型;(3)LSTM[8],循環神經網絡,能很好地挖掘數據中的時序信息與語義信息。

3.3 參數設置

本文使用Pytorch 框架訓練模型,節點嵌入表示維度dmodel= 64,感知趨勢性的注意力模塊的頭數h= 8,編碼器的層數L和解碼器的層數L′都設置為3,卷積核的大小設置為3,訓練時批量大小設置為64,初始學習率設置為0.003,每10步衰減30%,早停步數設置為15。

3.4 實驗結果分析

按上述使用不同的方法在相同場景下進行預測,結果如表1 所示。

表1 不同方法在數據集上實驗結果比較

如表1 所示,DSTGNN 模型在各項評價指標中均能得到比其他模型更加優異的預測結果。ARIMA、SVR、LSTM 只捕獲了交通流量序列在時間維度的信息,建模能力有限,并沒能取得較好的預測效果。 而DSTGNN 模型在高速公路服務區車流量預測中獲得了比傳統方法更好的預測結果,這是因為DSTGNN 模型不僅建模了流量數據在時間維度的動態相關性,還建模了駛入服務區車流量與其他斷面車流量在空間維度的動態相關性和異質性。

為了更全面地分析本文模型(DSTGNN)的優勢,本文對各模型在桂林路網中一個服務區從1月24 日23:00 到1 月25 日23:00 時間區段的流量預測值進行了可視化,如圖2 所示。圖2 橫坐標表示時間,范圍為0~24 h??v坐標為流量值。從圖2 中可以看出DSTGNN 模型的預測值與真實值更接近,取得了更好的預測效果。

圖2 各模型的預測值和真實值對比

3.5 消融實驗分析

為進一步分析模型各個組件的作用,本文設計了原模型DSTGNN 的四個變體模型進行消融實驗,下面將這四個變體與DSTGNN 進行比較,變體模型的描述如下:

(1)DSTGNN_wo_TE:在DSTGNN 基礎上,不使用時間維位置嵌入表示。

(2)DSTGNN_wo_SE:在DSTGNN 基礎上,不使用空間維位置嵌入表示。

(3)DSTGNN_wo_TA:在DSTGNN 基礎上,使用多頭自注意力機制替換感知趨勢性的多頭自注意力機制。

(4)DSTGNN_wo_DG:在DSTGNN 基礎上,使用公式(3)中的GCN 代替空間動態圖卷積。

消融實驗的結果如表2 所示,首先,在不使用時間維位置嵌入表示(DSTGNN_wo_TE)或空間維位置嵌入表示(DSTGNN_wo_SE)的情況下,實驗效果都有明顯下降,這表明模型通過感知輸入序列在時間維度的順序性和空間維度的靜態屬性,可以實現更準確的交通流量預測。 其次,在不能感知時間維度的局部趨勢性變化時(DSTGNN_wo_TA),模型的效果也有所下降,這說明僅用多頭自注意力機制建模動態相關性具有一定的局限性。 最后,用GCN 替換動態圖卷積計算后,模型效果下降,說明通過動態圖卷積建模高速公路網中駛入服務區的交通流量和其他斷面交通流量的動態相關性和異質性有助于提升預測準確度。

表2 消融實驗結果

4 結論

本文提出了一種動態時空圖神經網絡模型應用于高速公路服務區流量預測,該模型在建模服務區和斷面交通流量在時空維度的動態相關性的同時,融合了輸入數據在時間維度的順序性和空間維度的靜態屬性。將本模型同其他常用的預測方法在相同數據集相同預測場景下進行了實驗,實驗結果表明本模型在預測效果上達到了最優。但該方法依然存在一些優化空間,比如還可以考慮其他外部因素,如節假日等特殊時期對服務區車流量的影響,合理地量化這些因素,實現更準確的流量預測可以作為優化模型的方向。

猜你喜歡
交通流量服務區注意力
基于AIoT+GIS的智慧服務區構建
讓注意力“飛”回來
高速公路服務區信息技術的應用
基于XGBOOST算法的擁堵路段短時交通流量預測
基于GA-BP神經網絡的衡大高速公路日交通流量預測
“揚眼”APP:讓注意力“變現”
建言高速公路服務區實現“雙提升”
A Beautiful Way Of Looking At Things
基于復合卡和ETC的交通流量采集研究
MLFF系統在交通流量控制中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合