?

軌道交通站點聚類及其對客流預測的影響分析

2023-12-28 02:54戶佐安鄧錦程楊江浩趙妍
交通運輸系統工程與信息 2023年6期
關鍵詞:進站高峰客流

戶佐安,鄧錦程,楊江浩,趙妍

(1.西南交通大學,a.交通運輸與物流學院,b.綜合交通大數據應用技術國家工程實驗室,c.綜合交通運輸智能化國家地方聯合工程實驗室,成都 611756;2.成都信息工程大學,資源環境學院,成都 610225)

0 引言

隨著城市結構不斷升級,城市軌道交通已成為大中城市不可或缺的公共出行工具。截止2022年底,我國城市軌道交通累計投運車站總數達5875座,年客運量達193.02 億人次[1]。城市軌道交通車站不僅是其網絡的關鍵節點,也是城市結構的重要構成,站區出行活動與土地利用具有深度耦合關聯,受出行活動和土地利用的演化與交互作用,各站點特性具有顯著性差異,對站點進行精細化分類,進而精準推測不同類型站點的客流演化趨勢,為車站精細化運營管理及周邊設施建設提供參考。

城市軌道交通站點聚類方面,涉及特征提取和聚類方法等內容。特征提取類型可以分為客流特征、土地利用特征和網絡特征等??土魈卣髦?,一類是,從時序數據中計算指標進行刻畫,例如,尹芹等[2]關注客流的形態特征和結構特征,計算進出站峰值、偏度、不均勻系數及高峰小時系數等指標;李子浩等[3]關注客流的時間分布特征,提取不同時段客流比例、不同天數客流比例和換乘客流比例等特征。另一類是,直接對時序數據近似表示,進行降維處理,并保留局部特征,例如,ZHANG 等[4]引入符號集合近似(Symbolic Aggregate approximation,SAX)方法對時序數據有效降維,并建立基于小波變換和SAX 的多變量時間序列的兩階段聚類模型。土地利用特征通過計算站點輻射區興趣點(Point of Interest,POI)統計指標表征用地強度、均勻性以及多樣性等。網絡特征通過計算網絡性質指標反映交通能力,例如,高勃等[5]以度和介數兩個物理拓撲指標以及客運量為特征對站點和區間進行分類。一些研究組合了上述特征,例如,XU 等[6]基于客流和土地利用雙重視角提取特征,包括基于時序數據的統計特征、基于動態時間規整(Dynamic Time Warping,DTW)的時序類型特征、基于POI 數據的統計特征和環路位置特征;ZHOU 等[7]基于網絡和客流雙重視角提取特征,其中,網絡方面,提取度和介數中心性等特征,客流方面,從進站客流、出站客流和基于PageRank 算法的通過流中提取特征。聚類方法可以分為基于劃分的聚類、基于層次的聚類和基于模型的聚類等?;趧澐值木垲惓R姺椒ㄓ蠯-means及其衍生算法,例如,蔣陽升等[8]采用K-means++算法,通過肘部法則確定簇數?;趯哟蔚木垲惓R姺椒ㄓ蟹至研秃湍坌蛯哟尉垲?,例如,LI等[9]采用凝聚型層次聚類,并以赤池信息量準則確定簇數?;谀P偷木垲惓R姺椒ㄓ懈咚够旌夏P秃蜕窠浘W絡模型聚類,例如,李清嘉等[10]采用高斯混合模型聚類,并用期望最大算法求解,通過貝葉斯信息判別標準確定簇數。

客流預測方面,目前,多數研究試圖開發復雜模型充分挖掘站點間時空關系,以提升預測性能,這需要大量數據用于訓練,以增強模型的表達能力。在有限的數據集下如何提升簡單模型的預測性能是值得探索的問題,對于常態客流而言,其具有較強的平穩性,即在一定時間范圍內,出行模式相對穩定,同一站點未來客流變化與歷史客流呈現相似的趨勢,通過聚類使用相關性強的數據將更好地訓練預測器。已有研究表明,結合聚類方法對數據集進行預處理有效提升了預測性能,例如,ZHANG等[11]通過聚類算法將具有多變量特征的日期劃分為不同的簇,并為每個簇建立具有注意力的Seq2Seq 模型預測風能,驗證了聚類與預測方法結合使用,提高了預測準確性;SHAHZADEH 等[12]通過3種特征提取方式對用戶進行聚類,并為每個集群訓練神經網絡模型預測用電負荷,相比于單獨的預測模型,聚類后均顯著提高了預測精度;ZHANG等[13]通過兩步聚類模型對軌道交通站點進行聚類,通過相似性和平穩性測試推薦各簇預測粒度,并驗證了基于集群的LSTM 優于獨立的LSTM 模型。聚類雖然降低了樣本量和訓練模型泛化能力,但增強了數據集的相關性,對于平穩性強的數據集而言,聚類后再預測的思路具有普遍有效性,在一定預測期內有助于提升模型性能。

依托大數據和結合機器學習方法解決軌道交通站點分類及客流預測問題是研究趨勢所在,站點聚類方面,目前,研究多從客流層面挖掘特征,然而,站點間時空異質性是多層面因素作用的結果,鮮有研究綜合多源數據,提取多類特征實現站點精細化分類;客流預測方面,目前,研究多從捕獲時空相關性入手提升預測性能,關于站點聚類對于客流預測性能的效用探討較少?;诖?,本文統籌考慮地鐵刷卡數據、POI 數據以及地鐵網絡數據,客流層面,除考慮客流時間分布特征外,還考慮出行模式及日期類型差異等;土地利用層面,從POI 數據中挖掘站點輻射區用地強度和均衡性指標;網絡特征方面,從站點自身特征和影響能力考慮,提取度中心性、接近中心性和介數中心性指標,基于K-means++聚類算法對站點精細分類,并揭示不同類型站點多維度特性。在此基礎上,建立多元時序預測模型,設計簇內聯合預測和整體聯合預測策略,探究站點聚類對客流預測性能的影響。

1 數據處理與特征提取

1.1 地鐵刷卡數據處理與客流特征提取

使用2022 年5 月23 日~29 日連續一周以近鄰節假日成都市地鐵刷卡數據,并做如下預處理:

(1)刪除冗余和錯誤的刷卡記錄,剔除刷卡記錄不完整的站點,最終選擇262個軌道站點作為研究對象。

(2)以6:30-22:30 為研究時段,1 h 為時間間隔統計進出站客流,共16個時段,構建各站點進出站時序序列。

(3)為避免站點間客流差異大和站點進出站客流不均衡問題,將進出站時間序列拼接后,采用Min-Max方法按站點歸一化處理,構建各站點進出站差值時間序列。

考慮客流的時變特征,各站點客流在時間分布上存在差異,主要體現于不同時段和不同日期。為刻畫不同時段進出站客流分布的差異性,計算各站點各時段進站和出站客流占比,由于工作日與周末各自出行模式相對固定,其客流分布具有較強的一致性,為避免維度災難,計算工作日與周末各時段客流占比的平均值。計算式為

各站點承擔的客運量存在差異,為刻畫各站點吸引和產生客流量的差異性,計算工作日和周末各站點進出站客流量占全部站點進出站客流量比例,計算式為

此外,站點差異不僅反映在客流時間分布和客運量上,還體現于出行活動模式,在客流層面,表現為進站與出站的時變差異。為刻畫各站點出行活動模式差異,基于進出站差值時間序列,計算各站點各時段的累計客流差,計算式為

通過對工作日的累計客流差平均值進行聚類,分析各類站點在工作日出行活動模式的差異,如圖1所示。類型1的站點全天進出站客流處于相對均衡狀態;類型2 和類型3 的站點表現為早高峰出站集群增加,晚高峰進站集群增加,這類站點呈現出明顯的工作地通勤特征,其中,類型2 的站點在平峰期恢復穩定,進出站客流處于均衡狀態,類型3 的站點在平峰期略有波動;類型4 的站點早高峰進站集群增加,而晚高峰無明顯進出站集群現象,類型5 和類型6 的站點表現為不同程度的早高峰進站集群增加和晚高峰出站集群增加,呈現出明顯的居住地通勤特征。

圖1 6類站點工作日累計客流差平均值的時間分布Fig.1 Time distribution of average cumulative passenger flow difference on weekdays at 6 types of stations

上述特征以常規一周的客流數據提取,而一些站點的客流特征在節假日更加凸顯,例如,風景區輻射站點引發客流聚集。為刻畫日期類型差異引起的客流特征差異,計算節假日各站點各時段客流占比、累計客流差和各站點客流總量占比等指標。

1.2 POI數據處理與土地利用特征提取

為與客流數據在時間上保持一致性,使用2022年高德地圖的POI數據和OpenStreetMap的軌道交通站點線網數據。其中,影響出行活動的POI分為12類,包括:餐飲、公司企業、購物、交通設施、金融、酒店住宿、科教文化、旅游景點、商務住宅、休閑娛樂、醫療保健和運動健身。

為刻畫站點輻射區的土地利用水平,需建立站點緩沖區作為站點輻射區,站點輻射范圍一般根據10 min 步行距離設置,本文將緩沖區半徑設為800 m[14]。計算站區各類型POI 數量與均值之比反映站區的用地強度,優勢度指數反映站區的用地均衡性程度,計算式為

式中:Zj為站點j輻射區的土地優勢度指數;為站點j輻射區第c類POI占比;u為POI類型總數。

出行活動和土地利用具有深度耦合關聯。不同類型POI與不同時期客流空間分布如圖2所示。

圖2 不同類型POI與不同時期客流空間分布Fig.2 Spatial distribution of different types of POIs and passenger flow in different periods

圖2(a)和圖2(c)為商務住宅和公司企業兩類POI在各站區的分布情況??傮w來看,市中心站區兩類POI 均密集,此外,商務住宅在大部分軌道交通線路端部站區較為密集,公司企業密集區呈現由市中心向四周拓展的特點,且向南拓展最為顯著。圖2(b)和圖2(d)為工作日7:30-8:30 站點進出站客流的空間分布情況。對比圖2(a)和圖2(d)發現,7:30-8:30 進站客流分布與商務住宅密集區空間分布類似,7:30-8:30出站客流分布與公司企業密集區空間分布類似。此外,服務類POI密集的站區更能吸引周末客流,圖2(e)和圖2(f)分別為站區餐飲、購物和休閑娛樂這3 類POI 總數的空間分布情況,以及站點周末出站平均小時客流的空間分布情況,兩者空間分布類似,說明餐飲、購物和休閑娛樂這3類POI密度高的站區對周末客流有一定的吸引作用,即使站點離市中心區較遠。

站區城市功能中的差異會在特定時段體現于其服務的客流層面上,但具有時空異質性,即客流與土地利用性質的關聯性在時空上存在差異,例如,工作日就業類用地密度高的區域出行活動強度大,非工作日服務類用地密度高的區域出行活動強度大,土地利用特征能夠更好反映站區的城市功能,因此,辨析站點類型時融合土地利用特征是有效的。

1.3 網絡特征提取

根據成都市地鐵網絡構造拓撲圖,記為G=(V,E),其中,V代表站點的集合;E代表邊的集合,若站點j和站點n在任意一條地鐵線路上相鄰,則構造邊ej,n,j,n∈V。

網絡特征能有效地刻畫站點的連通性和重要性。先考慮站點自身特征,提取度中心性(Degree Centrality,DC)和接近中心性(Closeness Centrality,CC)兩個指標。DC 用來刻畫站點鄰居的數量,反映乘客在站點可選擇的出行方向。CC考慮站點與其他站點的接近度,即到其他站點的平均最短距離,反映站點在整個網絡中的連通性。計算式為

式中:Dj和Cj分別為站點j的度中心性和接近中心性;為站點j的度;dj,n為站點j和站點n的最短路徑距離;N為站點數。

此外,除了站點自身特征以外,站點對其他站點的影響能力也應納入考慮。例如,多個OD(Origin-Destination)對的最短路徑經過同一個站點,則這個站點承擔的運輸功能至關重要,若其失效會影響大量站點的客流狀態。提取介數中心性(Between Centrality,BC)指標,用來刻畫站點在客流傳播時的影響能力,即網絡中所有節點對最短路徑中經過某個節點的條數。計算式為

式中:Bj為站點j的介數中心性;nmn為站點m和站點n的最短路徑數;為站點m和站點n的最短路徑且經過站點j的條數。

站點的網絡特征差異一定程度上反映在進出站以外的客流層面上,例如,度中心性和介數中心性大的站點會產生更多的換乘客流和形成高斷面客流,因此,辨析站點類型時,融入網絡特征能更好地刻畫其承擔的運輸功能。

2 特征降維與聚類分析

綜上所述,從多源數據中提取了166個特征刻畫站點間多層面異質性,其中,包括:工作日、周末和節假日不同日期類型下的150個客流特征,13個土地利用特征和3 個網絡特征。實現站點精細分類及分析的整體思路如圖3 所示,包括:特征提取與降維、聚類和結果分析,其中,結果分析包含客流分布分析、特征指標分析和預測分析。

圖3 站點聚類及分析框架Fig.3 Framework for station clustering and analysis

2.1 特征降維

由于提取的特征數和樣本量接近,為提高聚類效果,降低冗余特征的影響,采用主成分分析(Principal Component Analysis,PCA)實現特征降維。PCA通過對協方差矩陣進行特征分析,選擇主成分方向以保留大部分方差信息。PCA 的主要步驟如下:

(1)對樣本所有特征進行Z-score 標準化處理,消除各特征量綱的影響,假設標準化處理后的特征矩陣為X=[x1,x2,…,xp] ∈RN×p,其中,p為特征的個數,xp為全部站點的第p個特征。

(3)對樣本的協方差矩陣進行特征分解。

(4) 選擇最大的q個特征值對應的特征向量W=[w1,w2,…,wq] ∈Rp×q,其中,wq為第q個特征值對應的特征向量,將特征矩陣X映射到W構成的q維空間中,即新特征矩陣為X'=[Xw1,Xw2,…,Xwq] ∈RN×q。

2.2 K-means++聚類算法

K-means 算法以簇內誤差平方和(the Sum of Squares due to Error,SSE)為目標,采用歐式距離作為相似性度量,將數據劃分為預定義的K簇。K-means++算法改進了初始聚類中心的選取策略,核心思想是選取距離盡可能遠的樣本作為初始聚類中心,以提升聚類的準確性[15]。K-means++算法需預先確定簇數,本文通過綜合考慮SSE、輪廓系數(Silhouette Coefficient,SC)和Davies-Bouldin 指數(Davies-Bouldin Index,DBI)等指標確定,其中,SSE反映簇內樣本與簇中心的緊密程度,SC和DBI反映簇內密集程度和簇間分散程度,計算式為

式中:ct為第t簇中心;S1,S2和S3分別為SSE,SC和DBI 指標值;Ot為第t簇樣本集合;O為全部樣本集合;nt為第t簇樣本的個數;z為簇數;為樣本o與第t簇中心ct距離的平方;ao為樣本o與簇內其他樣本的平均距離;bo為樣本與最近簇樣本的平均距離;σt為第t簇樣本到簇中心的平均距離;為第t簇中心ct與第x簇中心cx的距離。

2.3 客流分布及特征指標分析

各評價指標隨簇數的變化趨勢如圖4所示,當簇數為10時,SSE下降趨勢變緩,且SC和DBI均處于較優值,因此,將站點劃分為10簇最合理。根據聚類結果,繪制各簇站點不同日期類型客流比例時間分布曲線如圖5所示,每個時段以箱線圖反映簇內不同站點的波動情況。各簇特征指標熱力圖如圖6 所示,包括:各類型POI 數量與均值之比的占比、POI總數與均值之比、度中心性、介數中心性和接近中心性。

圖4 不同簇數對應的評價指標曲線Fig.4 Evaluation index curves corresponding to different cluster numbers

圖5 各簇不同日期類型進出站客流比例時間分布Fig.5 Time distribution of proportion of inbound and outbound passenger flow of different date types in each cluster

圖6 各簇特征指標熱力圖Fig.6 Heat map of characteristic indicators of each cluster

簇1~簇4 站點在工作日呈現不同程度的進站早高峰和出站晚高峰的單峰潮汐特點,其中,簇4站點高峰特征最為顯著,進站早高峰小時中位數客流比例達到28.52%,出站晚高峰小時中位數客流比例達到24.62%,且早高峰進站持續時間長,為7:30-9:30,此類站點居住導向特征明顯;在周末和節假日,高峰特征均明顯減弱,其中,簇1站點在節假日呈現出站早高峰,但高峰時段向后推移,為9:30-10:30,簇2 和簇3 站點以彈性出行需求為主,較為均勻地分布于各時段,其客流分布差異主要體現在節假日出站,簇4站點在節假日和周末均出現出站晚高峰,且持續時間相較于工作日延長,為17:30-20:30。

結合站區土地利用和站點網絡性質分析,總體而言,簇1~簇4站點土地開發強度和網絡性質處于較低水平,其中,簇1站點購物消費用地占比高,對于周末和節假日客流具有一定吸引力,但此類站點接近中心性最低,說明此類站點基本位于線路端部車站,客流吸引范圍較??;簇2和簇3站點建成環境較為類似,各類用地均衡,滿足多樣化出行需求;簇4站點餐飲美食、科教文化、商務住宅和運動健身等用地占比高,因此,在居住返程客流和環境吸引客流共同作用下容易造成客流聚集。

簇5和簇6站點在工作日呈現不同程度的出站早高峰和進站晚高峰的單峰潮汐特點,其高峰特征均顯著,其中,簇5和簇6站點出站早高峰小時中位數客流比例達到33.42%和32.17%,且簇6 站點早高峰出站持續時間長,為7:30-9:30,此兩類站點工作導向特征明顯;在周末和節假日,高峰特征均明顯減弱,其中,簇5 站點在周末和節假日呈現與工作日相似的單峰潮汐特點,相較于周末,高峰特征在節假日被進一步削減,而非高峰時段客流比例進一步增加,簇6站點在周末和節假日出站呈現與工作日相反的高峰特征,說明此類站點能吸引除工作以外出行目的的客流。結合站區土地利用和站點網絡性質分析,總體而言,簇5和簇6站點土地開發強度和網絡性質處于較高水平,其中,簇5 站點建成環境綜合化水平高,公司企業、金融機構和酒店住宿等用地占比高,且此類站點接近中心性處于較高水平,說明此類站點土地開發完善,城市中心功能顯著。簇6站點就業相關要素用地優勢顯著,公司企業和金融機構占比最高,且此類站點介數中心性處于最高水平,此類站點在工作日軌道交通服務使用率高,承載著大量通勤客流和換乘客流。

簇7和簇8站點在工作日呈現相對均勻的早晚高峰雙峰特點,進出站客流分布類似,其中,簇7站點早高峰進出站客流略高于晚高峰,簇8站點進出站早晚高峰客流均衡,進站早晚高峰小時中位數客流比例分別為15.53%和12.91%,出站早晚高峰小時中位數客流比例分別為14.09%和13.21%。此兩類站點既具有居住導向特征,又具有工作導向特征,在高峰時段產生和吸引相近的客流,形成通勤客流的錯位出行;在周末和節假日,高峰特征均明顯減弱,簇8 站點進站呈現穩步遞增趨勢,并在夜間持續弱高峰,出站非高峰時段客流比例顯著增加,說明此類站點服務于頻繁的夜間出行和彈性出行。結合站區土地利用和站點網絡性質分析,總體而言,簇7 和簇8 站點土地開發強度和網絡性質處于中等水平,其中,簇7無顯著優勢用地類型,公司企業和商務住宅用地均衡,簇8 餐飲美食、旅游景點和休閑娛樂等用地占比高,此兩類站點網絡連通性較好,站區用地多樣化程度高,生活及生產功能完備,滿足多樣化出行目的。

簇9 站點進站無明顯高峰特征,且工作日、周末和節假日進站客流分布相似,各時段客流比例波動較小,工作日出站出現早高峰特征,周末以及節假日出站整體呈現早高峰后逐步減緩趨勢。結合站區土地利用和站點網絡性質分析,此類站點交通設施用地占比高,且度中心性、介數中心性處于較高水平,說明此類站點具有一定的區位優勢,交通便捷性好,站區通過多種交通方式聚集和疏散客流,一般為大型交通樞紐。

簇10 僅1 個站點,即春熙路站,此站點客流強度大,客流分布和土地利用不同于其他簇??土鞣植挤矫?,在工作日呈現就業導向單峰客流特征,在周末和節假日,進站呈緩慢增長趨勢,在晚間到達峰值,但無明顯減緩趨勢,出站客流比例在8:30-18:30持續穩定;此站點土地開發強度大,網絡性質處于較高水平,商業業態成熟,購物消費、酒店住宿、旅游景點和休閑娛樂等用地占比高,在周末和節假日各時段均能吸引相對穩定的客流,承擔著重要的交通功能。

3 基于站點聚類的客流預測分析

由于站點特征具有多樣性,聚類將相似度高的站點合并為簇,有效降低數據噪聲和增強數據規律,基于此,設計簇內聯合預測和整體聯合預測實驗,探究預測性能的變化,簇內聯合預測將同一簇特征相似的站點分別訓練模型,整體聯合預測將全部站點訓練一個模型,即簇內聯合預測值輸出與相似性站點的歷史時序相關,而忽略特征差異大的站點;整體聯合預測值輸出與所有站點的歷史時序相關。選擇多層感知器(Multi-Layer Perception,MLP)、長短時記憶(Long Short Term Memory,LSTM)和時間卷積網絡[16](Temporal Convolutional Network,TCN)這3 種時序預測模型進行測試,其中,MLP 由兩個隱層和RELU 激活函數組成,隱層單元數均設置為32;LSTM由LSTM層和全連接層構成,其中,LSTM 層的隱層單元數被設置為32;TCN由TCN層和全連接層構成,其中,TCN層中卷積核大小設置為3,卷積核數量設置為16,卷積層數設置為3。

為保證數據量充足,使用262 個站點2022年5月16日~20日和23日~27日連續兩周工作日刷卡數據,以5 min 為間隔統計各站點進站客流量作為預測數據集,前8 d 的數據作為訓練集,后2 d 的數據作為測試集,通過當前時刻前12 個時間步的客流值預測未來1 個時間步的客流值。預測數據集只包含工作日進站客流信息,因此,考慮工作日進站相關客流特征、土地利用特征和網絡結構特征對站點重新聚類,劃分為5 簇。用均方誤差(Mean Squared Error,MSE)作為訓練的損失函數,并用平均絕對誤差(Mean Absolute Error,MAE)和均方根誤差(Root Mean Squared Error,RMSE)評估模型的性能,計算式為

式中:E1,E2和E3分別為MSE,MAE 和RMSE 指標值;yj為站點j客流的實際值;為站點j客流的預測值。

(1)各簇預測性能對比

各簇和總體的預測性能指標總結如表1所示,總體而言,相較于整體聯合預測,簇內聯合預測策略對3 種模型預測性能均有改進,MLP 改進率較高,RMSE降低了15.63%,MAE降低了8.40%,TCN改進率相對較小。3種模型對于各簇和總體的改進率如圖7 所示,其中,MLP 和LSTM 對各簇均有改進,TCN對簇3和簇5 有改進,且各模型對簇4和簇5的改進均顯著,保持了一定的一致性。說明通過對站點聚類,聯合相關性強的站點進行預測,這種間接捕獲空間相關性的方式對于提升預測性能是有益的。

表1 不同模型不同策略下各簇和總體預測性能Table 1 Each cluster and overall prediction performance under different models and different strategies

圖7 簇內聯合策略對各簇預測性能的改進率Fig.7 Improvement rate of intra-cluster joint strategy on prediction performance of each cluster

(2)不同時段預測性能對比

對于出行者和管理者,高峰時段的客流預測更受關注,對出行規劃和運營調度具有重要意義。因此,需對比高峰時段(7:30-9:30,17:30-19:30)和平峰時段預測性能。高峰和平峰時段預測性能指標總結如表2 所示,總體而言,通過簇內聯合預測策略改善了3種模型高峰時段的預測性能。圖8對比了簇內聯合預測對于高峰和平峰時段預測性能的改進率,相較于平峰時段,MLP 和LSTM 在高峰時段的改進率更佳,RMSE 分別降低了18.37%和12.24%,MAE分別降低了9.25%和7.92%。在工作日,大多數站點客流分布差異主要體現于早晚高峰,通過簇內聯合預測捕獲更多的相似的高峰特征信息。

表2 不同模型不同策略下各時段預測性能Table 2 Forecast performance of each time period under different models and different strategies

圖8 簇內聯合策略對不同時段預測性能改進率Fig.8 Improvement rate of intra-cluster joint strategy for forecasting performance in different time periods

(3)典型站點預測性能對比

選擇兩個典型站點分析預測性能。第1 個是天府三街站,是典型的就業導向型站點,如圖9(a)所示,此站點呈現晚高峰特點,由于站點的特征顯著,平峰無明顯波動,各模型擬合效果均較好。從17:30-19:30 來看,相較于整體聯合預測,簇內聯合預測均獲得了更優的效果;第2 個是火車北站,是典型的交通樞紐站點,如圖9(b)所示,此站點呈現早晚雙峰特征,但在平峰時段波動較大,客流分布規律不顯著,從11:30-13:30 來看,相較于整體聯合預測,簇內聯合預測更能捕獲客流的波動。因此,簇內聯合預測策略能夠有效提升不同特征站點的預測性能。

圖9 典型站點預測值與真實值對比Fig.9 Comparison of predicted value and actual value of typical stations

4 結論

以成都市軌道交通站點為案例,本文得到的主要結論如下:

(1)充分挖掘多類特征能夠獲得更加精細化的聚類結果,考慮全部客流特征時劃分為10簇,僅考慮工作日進站客流特征時劃分為5簇,說明客流特征差異會體現于日期類型和出行活動模式。站區土地利用及站點網絡特征會在一定程度上反饋站點客流出行模式,居住型單峰潮汐特征站點土地利用和網絡性質處于較低水平,工作型單峰潮汐特征站點土地利用和網絡性質處于較高水平,職住錯位型雙峰特征站點土地利用和網絡性質處于中等水平,結合土地利用及站點網絡特征分析能進一步提升聚類結果的可解釋性,未來可以進一步量化站區用地特征、站點網絡特征與客流特征之間的關系,并結合其他出行方式數據深入探討城市建成環境與多模式出行間的交互關系。

(2)與整體聯合預測相比,通過聚類將特征相似度高的站點集群后訓練模型,有效提升了預測性能,整體上看,各模型均方根誤差平均降低9.04%,平均絕對誤差平均降低4.94%,MLP和LSTM模型對高峰時段預測性能的改善優于平峰時段,且各模型能有效提升不同客流特征站點的預測性能,但各模型對于簇內聯合和整體聯合訓練策略的響應具有差異,其中,MLP 模型改善顯著,TCN 模型無明顯改善,MLP 模型通過簇內聯合預測與LSTM 和TCN模型通過整體聯合預測的性能接近,結合聚類使高偏差模型取得了更佳的性能,相比于開發一個復雜模型充分挖掘所有站點信息而言,簇內聯合預測方式簡單且有效。

猜你喜歡
進站高峰客流
客流增多
病毒病將迎“小高峰”全方位布控巧應對
石慶云
進站口上下行載頻切換時引起ATP制動問題分析
春運期間北京西站共有154.8萬人次刷臉進站
地心游記(四)一位向導
基于自學習補償的室內定位及在客流分析中的應用
雨天早高峰,自在從容時。
人工免疫算法在電梯客流時段劃分的應用
重慶軌道交通三號線列車進站警示功能接口電路的分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合