?

考慮稀疏特性的城市軌道交通短時OD時空預測方法

2023-11-13 07:57李浩然許心越李建民張安忠
鐵道科學與工程學報 2023年10期
關鍵詞:客流時空動態

李浩然,許心越,李建民,張安忠

(北京交通大學 軌道交通控制與安全國家重點實驗室,北京 100089)

城市軌道交通作為一種高效便捷的出行方式,在公共交通中扮演重要角色,其在高速發展的同時,客流擁擠、服務水平下降等問題日益顯著[1-2]。城市軌道交通OD 需求可以很好地揭示乘客在軌道交通路網上的時空分布,有助于運營部門調整列車運行、減緩客流擁擠、提升乘客服務質量[3-4]。因此,如何準確、快速地預測城市軌道交通短時OD 需求成為了運營部門做出科學運營策略急需解決的問題。目前,城市軌道交通短時OD 預測方法主要包括傳統統計模型和機器學習模型這2類。傳統模型包括狀態空間模型[5-6]、回歸模型[7]等。姚向明等[5]基于狀態空間模型實現了城市軌道交通OD預測,具有一定的適用性。陳志杰等[6]提出一種新的狀態空間模型實現不同粒度OD 的預測,提高了OD 預測的準確性。SILVA 等[7]將自回歸模型引入OD 預測中,實現了倫敦市地鐵OD 的預測。機器學習模型包括卡爾曼濾波[8]、神經網絡模型[9]等。高夢琦[8]將卡爾曼濾波與長短期記憶神經網絡結合,實現了波動OD 數據預測。LIU 等[9]集成多源數據,利用遞歸神經網絡對OD 進行預測,具有較高的預測精度。然而,以上預測方法存在以下3個方面不足:1)對于大規模路網的動態高維度OD,無法滿足短時OD預測的時效性[10];2)OD矩陣的稀疏性導致預測結果受噪音影響較大[11],預測精度不高;3)未考慮OD需求的時空相關性[12]。為解決OD數據的高維性和稀疏性,有研究引入矩陣分解方法進行OD預測[13-14]。LIU等[13]構建了矩陣分解方法對OD 實現預測,提高了預測的效率。張竣偉等[14]采用非負矩陣分解方法對北京市道路OD 進行預測,具有較強的解釋性。GONG等[15]開發了一種矩陣分解模型,用于預測地鐵系統的OD 矩陣,加強了預測的適用性。NOURSALEHI 等[16]提出了一種離散小波(Discrete Wavelet Transformation,DWT)的矩陣分解方法提取OD 矩陣中多分辨率空間特征,提升稀疏OD 預測精度。但以上研究對OD 間的時間相關性考慮不足,導致預測效果存在一定的局限。動態模式分解(Dynamic Mode Decomposition,DMD)作為一種對時間相關性具有良好提取效果的矩陣分解方法,已受到廣泛關注[17-18]。KWAK 等[17]應用動態模式分解實現了高速公路路網矩陣旅行時間的時序預測。CHENG 等[18]提出一種基于動態模式分解的矩陣分解方法實現OD 矩陣的預測,具有較高的預測精度。綜上,本文建立基于時空分解和動態模式分解的混合預測模型(Prediction Model based on Spatio-Temporal Decomposition and Dynamic Mode Decomposition,STDMD),實現OD 矩陣的準確快速預測。具體地,采用動態模式分解方法實現動態時序預測模型的構建,對OD 矩陣進行降維去噪,解決OD 矩陣的高維性和稀疏性。針對OD 矩陣在空間維度上的特征復雜特性,使用離散小波分解,實現OD 需求時空相關性的刻畫。相比于現有模型,在預測精度上和計算時間上均具有優勢。

1 基于時空分解和動態模式分解的短時預測模型

1.1 問題描述

城市軌道交通網絡中,OD 客流為車站與車站間的客流需求量,定義xi,j,t為在t時刻單位時間間隔內由站i進站至站j出站的客流量,可以將一個路網中的所有OD對的客流量通過一個矩陣Xt進行表示:

其中:N為城市軌道交通路網中地鐵站的數量。

OD 客流在時間維度上具有長期的周期性特征,如工作日存在早晚高峰特征等,并且具有短期的自相關性,客流需求會受到前序客流的影響。在空間維度上由于車站之間的影響,OD 對上的客流會受到其他OD 對的客流影響,這些影響通常是復雜難以直接捕獲的[12]。同時,路網OD 客流矩陣具有高維度和稀疏性,矩陣中路網中大部分的客流集中于小部分的OD 對上,其他OD 對上客流處于較小的狀態,致使OD 預測受噪音影響較大,導致時效性與準確性下降[11],并且由于智能卡數據只有出行完成才可記錄,實時的OD 客流無法實時獲取[10]。本文對未來路網OD 客流序列=[Xt+1,…,Xt+T]進行預測,其中T是預測步數。針對以上特性,從歷史長期路網OD 客流序列Xlong=[Xt-H,…,Xt]中提取長期時間周期性,其中H是長期OD 數據長度;從短期路網OD 客流序列Xshort=[Xt-h,…,Xt]中提取短期時間相關性,其中h是短時前序長度。在預測過程中對OD 矩陣進行分解,解決OD 矩陣的高維度和稀疏性導致的預測困難問題,引入實時進站量Zt作為協變量彌補實時OD 無法獲取的缺陷:

通過式(1)的映射關系f2引入進站量對OD 需求進行分解和時序預測,通過f1將短期時序數據與歷史長期時序數據結合,實現未來15 min 粒度路網站間OD客流序列的準確、快速、實時預測。

1.2 基于時空分解和動態模式分解的預測原理

1.2.1 離散小波變換

對于二維OD 矩陣,行和列被視為一維信號,離散小波變換能夠將OD 矩陣變換為一系列的小波系數并將這些系數進行高效地壓縮和儲存。與傅立葉變換相比,小波具有多分辨率和正交性,多分辨率能夠通過放大和縮小分析圖像,捕捉不同的時間和頻率變化,正交性意味著子矩陣之間具有完全不同的特征,這些特征通常是原始矩陣中常常被忽視的特征。

設I?RM×N為二維矩陣,二維離散小波變換計算公式如下:

其中:φm,n表示不同尺度和位置的尺度函數;表示不同尺度和位置的小波函數。

二維矩陣經小波變換處理后每個級別獲得4個子帶,其中3 個子帶圖像WLH,WHL和WHH分別是沿水平、垂直和對角線方向的圖像。離散小波分解放大了不同頻率子帶的特征,可凸顯稀疏矩陣中難以提取的特征,有利于提高預測準確性。

1.2.2 動態模式分解

由于矩陣的稀疏性,導致小規模OD 客流受噪音影響較大,且矩陣維度高,計算復雜,本文針對OD 矩陣稀疏性和高維性采用DMD 進行OD 矩陣的預測。動態模式分解可將非線性的系統用線性的模式和特征值來描述,可將復雜的矩陣特征分解為低秩的時空特征,通過矩陣的秩截斷降低系數矩陣和數據矩陣的維度,降低求解難度,減少噪音的影響。

首先構建預測模型,對離散小波分解后的矩陣的各子矩陣進行拉伸,變換為一維向量:

其中:為離散小波變換后的子矩陣元素,c={WLL,WLH,WHL,WHH};l為矩陣的長寬,即車站數量。

動態模式分解的預測模型為:

為求解該模型,首先拓展數據至訓練數據長度L:

對YL進行秩截斷奇異值分解(Truncated Singular Value Decomposition,TSVD):

對系數矩陣和客流矩陣進行以下變換:

同理對進站客流協變量進行變換,經過以上變換,可將預測模型等價轉換為:

其中:是的偽逆。

最后通過變換得到子矩陣預測結果:

動態模式分解通過系數矩陣和數據矩陣的變換,減少數據維度,避免了由于矩陣的高維性導致的求解計算困難,通過秩截斷保留主要特征向量,減少了數據的噪聲影響,同時實現時間序列預測。

1.3 地鐵網絡短時OD混合預測模型

本文建立基于時空分解和動態模式分解的混合預測模型,模型分為時空分解模塊、動態模式分解預測模塊和分解重構模塊。在時空分解模塊中,針對OD 需求的長期周期特性融合時間序列分解(Seasonal Decomposition of Time Series by Loess,STL)[19]分離出周期變化量。針對OD 需求在空間維度上特征復雜難以提取的特性,對周期分離后的OD 矩陣,在空間上通過DWT 有效地提取矩陣空間上的信息。在動態模式分解預測模塊中,考慮客流需求的短期自相關性,針對OD 需求的高維度和稀疏性特點,通過DMD 對OD 矩陣秩截斷降噪和降維,實現稀疏矩陣的準確快速預測,同時引入進站量對模型進行修正。最后,通過分解重構模塊將OD矩陣進行還原。方法框架如圖1所示。

圖1 基于時空分解和動態模式分解的混合預測模型Fig.1 Prediction model based on spatio-temporal decomposition and dynamic mode decomposition

第1 部分將OD 矩陣序列進行時空分解?;陂L期的歷史OD 矩陣序列,通過STL 分解提取客流長期時間特征,得到客流周期分量LtS,對周期分量進行延展即可得到周期預測量?;诙唐贠D矩陣序列,通過STL 分解提取客流短期時間特征,得到客流趨勢分量LtT,之后將趨勢分量矩陣進行離散小波變換,得到客流趨勢子分量,:

第2 部分對趨勢子分量進行動態模式分解預測。結合當前時段進站量Zt,構建基于向量自回歸的預測模型。采用動態模式分解方法對客流矩陣進行分解降維,減少計算維度,同時對矩陣中的主要特征進行提取,剔除部分噪音影響。最終預測得到趨勢預測子分量。

該模塊的輸入輸出即為:

第3部分對各預測分量進行重構。通過離散小波逆變換,客流趨勢預測子分量重構得到客流趨勢預測量,結合周期分量延展得到的周期預測量,將得到預測結果:

2 案例分析

2.1 數據描述

為驗證算法與模型的有效性,以北京地鐵1號線和2 號線的38 個車站進行案例研究,選取2018年6 月1 日—6 月30 日的工作日總計20 d,5:30—23:30 的AFC 數據作為研究時間范圍,采用15 min時間間隔粒度進行實驗,前15 d 用于模型的求解計算,最后5 d 用于結果預測,將預測結果與真實數據進行對比,對模型的性能進行檢驗。

2.2 模型預測過程

首先對通過時空分解模塊案例車站矩陣進行分解,以四惠站—建國門站OD 為例,如圖2 所示。通過STL 分解分離出各OD 對在時間維度上的趨勢分量與周期分量,分別考慮OD 客流量的短期特征與長期特征。對時序分解得到的短期趨勢分量矩陣,通過離散小波變換在空間上對矩陣進行分解,如圖3所示。子帶中體現出了原始數據中由于數據稀疏性而易被忽視的空間特征,從而提升預測精度。

圖2 時間維度分解Fig.2 Decomposition in time dimension

圖3 空間維度分解Fig.3 Decomposition in spatial dimension

通過動態模式分解預測模塊對各趨勢分量序列進行預測,得到各預測分量,最終通過重構模塊得到最終預測結果。選取多種類OD 對的預測結果如圖4 所示,包含了多種車站,如郊區車站(蘋果園)、交通樞紐站(四惠站)、旅游車站(鼓樓大街站)以及商業區車站(建國門)等,同時這些OD 對包含了單線內OD和跨線OD,具有一定的代表性。

圖4 多種類OD對的客流量Fig.4 Passenger flow of different OD pairs

2.3 預測結果分析

2.3.1 整體預測效果分析

對于評價指標,本文采用絕對平均誤差(MAE)、均方根誤差(RMSE)和加權平均絕對百分比誤差(WMAPE)來評價模型的預測精度,定義為:

為了評價本文模型的性能,選用以下模型作為基準模型進行對比分析。

1) HA,歷史平均。利用歷史同期數據對下一時刻進行預測。

2) ConvLSTM,卷積長短期記憶網絡。LSTM長短期記憶網絡的改進模型,對數據特征有更好的提取效果。

3) VAR,向量自回歸。該模型把系統中每一個內生變量作為系統中所有內生變量的滯后值的函數,將單變量自回歸模型推廣到由多元時間序列變量組成的“向量”自回歸模型。

4) TRMF,時間正則化矩陣分解。TRMF 是一種矩陣分解模型,它對每個時間因子施加自回歸(AR)過程。

5) STDMD-STL。從本文模型中去除周期特征部分。

6) STDMD-DWT。從本文模型中去除數據多分辨率特提取部分。

對于下一時段的OD 客流量整體預測結果如表1所示。

表1 各模型預測結果對比Table 1 Comparison of prediction results of models

可以看到在整體的預測結果上,本文模型在各項評估指標上均優于其他基準模型。對比Conv-LSTM 此類非線性模型,本文模型在MAE,RMSE和WMAPE 上分別降低了0.086,0.683 和0.023,說明該模型具有不遜色于非線性模型的特征提取能力。本文模型相較于VAR 此類線性模型,MAE,RMSE 和WMAPE 分別降低了0.299,0.934和0.08,說明該模型通過秩截斷,在降低噪聲影響方面具有較好的效果。對比TRMF 模型,本文模型也有更好的性能。

同時,將本文模型與分別去除周期特征分解和多分辨率特征分解的2 個模型進行比較,2 類特征均有利于提高精度預測精度,其中周期特征對預測結果具有較大的影響,說明該模型可對周期特征進行充分的挖掘。

為了對模型的效果進行更細致的評價,對OD客流量根據大小分為3 類進行拆分對比分析,OD等級劃分如表2所示。

表2 OD等級劃分Table 2 Gradation of OD demand

對于不同等級的下一時段的OD 預測結果如表3 所示。從表3 可觀察到,本文模型對高OD 需求以及中OD 需求的預測精度具有顯著提升作用,均優于基準模型,特別是相比于ConvLSTM 以及VAR,本文模型在高OD 需求的WMAPE 下降了50%以上。同時,本文模型在低OD 需求的預測上也有較好的表現,效果接近于ConvLSTM 和STDMD-STL。從表3 還可以觀察到,STDMD-STL 模型在不同等級的OD 需求中的表現差異較大,本文模型與之相比,在高、中、低OD 需求的WMAPE分別下降了0.265,0.131 和上升了0.011,在低OD需求具有優秀效果的同時,在高OD 需求和中OD需求的表現不佳,這進一步說明了本文模型對于低OD 需求的特征提取具有較強的作用,以及STL模塊在該模型中對于中、高OD 需求的特征提取具有顯著效果。

表3 不同OD等級下各模型預測結果對比Table 3 Comparison of prediction results of models under different OD grades

2.3.2 離散小波變換模塊效果分析

本節對DWT 分解的作用進行分析,從整體效果和單個OD 對效果2 個方面解釋DWT 對特征提取的作用。

首先,從整體預測效果角度分析。通過表3預測結果可知,對比STDMD-DWT,本文模型對3類OD 的預測性能均有提升,對于高、中、低3 類OD 的RMSE 分別降低了1.5%,0.9% 和0.8%,WMAPE 分別降低了1.4%,1.1%以及0.2%。說明本模型在加入DWT 后,OD 需求在各等級的預測性能均有提升。

進一步,從單個OD 對分析,以蘋果園站—五棵松站OD 對為例進行詳細分析。如圖5 所示為本文模型預測值與STDMD-DWT 模型預測值與真實值曲線??捎^察高OD需求部分時間為5:30—8:30,此時本文模型與STDMD-DWT 模型無明顯差距,本文模型和STDMD-DWT 模型的MAE 分別為8.484 和8.508,降低了0.28%。在低OD 需求部分對應時間為12:00—15:00,此時可觀察到本文模型相比于STDMD-DWT 模型具有更好的擬合效果,本文模型和STDMD-DWT 模型的MAE 分別為2.903 和5.233,降低了44.53%。由上可知,DWT在本文模型中針對呈鋸齒狀的平峰時段的低OD 需求可以獲取更多的特征以提升預測精度。

圖5 高峰平峰時段不同模型在OD對的預測結果對比(蘋果園站—五棵松站)Fig.5 Comparison results of OD pair during the peak period and the flat period (Pingguoyuan—Wukesong)

2.3.3 動態模式分解模塊效果分析

本節分析動態模式分解對OD 預測效果的影響,從模型求解與預測時間以及預測效果2個角度解釋動態模式分解對減少噪音影響以及減少計算時間的作用。將本文模型與時空分解+VAR(ST+VAR)預測以及時空分解+ConvLSTM(ST+ConvLSTM)預測結果進行詳細對比。

首先,在預測精度層面,本文模型在整體上優于基準模型,如表1所示,說明動態模式分解在預測效果上具備良好性能。同時,本文以木樨地站—東四十條站為例進一步說明動態模式分解對提升預測精度的作用。如圖6所示,本文模型相比ST+VAR模型在平峰時段的預測上更加平滑,說明動態模式分解通過矩陣秩截斷可去除矩陣中的噪音部分,提升模型的抗干擾能力。而ST+ConvLSTM 模型在預測上的糟糕表現也是源自于矩陣中的噪音,這進一步說明了動態模式分解對于預測精度的提升源自于對噪音的屏蔽去除。

圖6 對比模型在OD對預測結果對比(木樨地站—東四十條站)Fig.6 Comparison results of OD pair (Muxidi—Dongsishitiao)

在模型求解與預測時間層面,本文模型在模型求解時間以及預測時間上均優于基準模型,如表4 所示。相比于ST+VAR 模型,本文模型最大的區別在于對矩陣進行了特征值截斷,大幅度降低了矩陣的維度,從而減少了計算時間,在模型求解時間上縮短了44.8%,在預測時間上縮短了95.6%。而相比于ST+ConvLSTM 模型,本文模型充分發揮了線性模型求解速度快的優勢,相比于深度學習小時級別的模型求解時間,本文模型快速求解的優點可實現模型的快速更新迭代,模型求解成本較小,更適用于實際應用。

表4 不同模型的求解預測時間Table 4 Solution time and prediction time of different models

2.4 魯棒性分析

本節對本文模型的魯棒性進行測試分析,選用其他數據集對模型進行驗證。以杭州地鐵80 個車站為研究對象,數據集為杭州地鐵2019 年1 月1日—1 月25 日,每天5:30—23:30 期間30 min 粒度的AFC 刷卡數據,選取前10 個工作日作為訓練集,隨后4 個工作日作為驗證集,最后5 個工作日設定為測試集與預測結果進行對比。

預測結果如表5所示,結果表明,本文模型的預測效果在不同數據集上優于各基準模型。在數據集1 上,相比于ConvLSTM,SVR,本文模型的MAE 分別下降了0.686 和0.89,RMSE 值分別下降了0.945和2.964,表明本文模型對于不同線路上的OD 預測效果具有優勢。在數據集2 上,相比于ConvLSTM 和SVR,本文模型的MAE 分別下降了0.686 和0.89,RMSE 值分別下降了0.945 和2.964,表明本文模型在不同的軌道系統以及不同時間粒度的數據集上具有較好的預測性能。綜上所述,本文模型具有較強的魯棒性。

表5 杭州數據集上各模型預測結果對比Table 5 Comparison of prediction results of models on Hangzhou data set

3 結論

1) 針對地鐵OD 客流數據維度高、數據稀疏的特點,提出面向稀疏數據的城市軌道交通短時OD時空預測方法,可以準確快速地預測地鐵OD 需求矩陣。相比于HA,VAR,ConvLSTM 等模型,本文模型在預測精度與模型求解時間上均處于優勢。

2) 引入動態模式分解預測,在保留矩陣特征的同時,大幅減少矩陣維度,減少噪聲對矩陣稀疏部分的干擾,提高了本文模型的應用性。

3) 分別使用北京地鐵和杭州地鐵的OD 數據驗證本文提出的模型,驗證了本文模型的魯棒性。

地鐵OD 矩陣內車站自身具有屬性,后續可深入研究OD 對中的車站屬性對客流量的影響,并與本文模型結合,提高模型的泛化能力。

猜你喜歡
客流時空動態
客流增多
國內動態
國內動態
跨越時空的相遇
國內動態
鏡中的時空穿梭
動態
玩一次時空大“穿越”
時空之門
基于自學習補償的室內定位及在客流分析中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合