?

大數據環境下基于職住地識別的公交通勤行為判斷與特征分析

2023-12-29 13:29孫世超呂豪
上海海事大學學報 2023年4期
關鍵詞:居住地刷卡高峰

孫世超, 呂豪

(大連海事大學交通運輸工程學院,遼寧 大連 116026)

0 引 言

國內外長期實踐表明,優先發展公共交通,尤其在早晚高峰時段吸引更多的城市居民使用公共交通出行是緩解城市交通擁堵、改善城市空氣質量的有效途徑[1]。為此,了解并準確掌握城市居民的公交通勤需求和通勤出行特征,是進一步合理規劃公交基礎設施建設、改善公交服務質量的重要前提。

問卷調查法和大數據分析法是當前獲取公交通勤行為特征的兩種主要方法。問卷調查法主要通過被調查人群的主觀描述來獲取數據,但通常受制于數據采集成本較高、樣本規模有限、數據采集間隔較長等問題;大數據分析法更具經濟性(數據來源于公交刷卡數據和公交車輛GPS數據)、覆蓋的樣本規模較大、數據采集間隔較短,能夠支持長期且動態的公交通勤行為跟蹤分析,可更為全面地反映公交通勤需求的實時變化。因此,近年來許多學者利用公交信息化數據開展公交通勤行為識別及特征分析研究。李軍等[2]采用出行鏈匹配方法推算出乘客下車站點,根據出行鏈的出行次數和出發時間標準差識別公交通勤行為。王月玥[3]利用公交刷卡數據與公交車輛GPS數據的匹配關系,結合出行鏈結構確定乘客上下車站點,根據相似出行鏈的時空特征判別公交通勤行為。李淑慶等[4]利用上述研究中上下車站點的匹配及公交通勤行為識別方法得到公交通勤出行鏈,以重慶市主城區為例分析了公交通勤行為特征。翁劍成等[5]基于個體出行數據,利用最大刷卡間隔、出行天數等特征建立公交通勤行為判別規則,提取乘客的公交通勤出行鏈。

然而,上述方法存在一個潛在的問題,即識別出的高頻出行鏈雖具有與公交通勤行為相似的時空特性,但未必是居住地與工作地的連線,這樣的識別結果在分析職住分離等一些公交通勤行為特征時可能與真實情況不符。為此,另一部分學者考慮從職住地兩端出發,從分析乘客的職住地入手,通過識別職住地進一步提取乘客公交通勤行為特征。陳君等[6]采用乘車頻次統計和空間聚類方法識別公交通勤乘客的居住地和工作地。劉曉等[7]根據乘客整體和個體的出行規律識別乘客下車站點,結合出行時間鏈和地點-時間-時長(position-time-duration, PTD)模型識別乘客的公交通勤行為。彭飛等[8]基于包含上下車站點信息的公交大數據,從乘客在早晚高峰時段的首次出行站點中挖掘乘客的職住地并根據時空信息匹配公交通勤出行鏈??梢钥闯?大多數研究對出行鏈的提取或者職住地的識別需要下車站點的參與,但除了少數城市采用“兩票制”收費模式外,多數城市普遍采用“一票制”收費模式,刷卡信息不包含下車站點信息?;诖祟悢祿难芯客ǔ=柚萝囌军c推算方法進行下車站點識別,識別率在59%~79.5%范圍內[2-5,9],較低的識別率不能保證提取的公交通勤出行鏈的完整性和職住地識別的準確性。

針對上述問題,利用公交信息化數據開展基于職住地識別的公交通勤行為分析方法研究。具體來說,該方法將公交刷卡數據與公交車輛GPS數據在交通小區級別下進行融合,通過分析乘客的公交出行頻率、乘坐時間規律以及在早晚高峰時段首次乘車位置的穩定性等,對乘客的居住地和工作地進行識別,繼而分析公交通勤需求特征。相比于上述文獻中所采用的方法,本文方法不依賴于乘客的下車站點推算,因此避免了下車站點識別準確度不高的問題;本文方法是基于乘客在早晚高峰時段的首次出行站點進行職住地識別的,無須對乘客的多線換乘情況進行判斷,為不完備數據環境下的公交通勤行為特征分析提供理論方法支持。

1 數據基礎

1.1 公交基礎數據

公交刷卡數據和公交車輛GPS數據是研究的基礎數據,其構成見表1。目前,我國大部分城市公交系統仍使用“一票制”收費模式,在該模式下公交刷卡數據只能記錄乘客的上車信息。由于我國大部分公交系統的信息化建設是分階段進行的,所以公交刷卡數據和公交車輛GPS數據是采用不同的設備采集的,刷卡數據中并不包含乘車位置信息,而該信息記錄于公交車輛GPS數據中。

表1 基礎數據構成

1.2 乘車位置獲取及其與交通小區匹配方法

乘車位置獲取及其與交通小區匹配流程如圖1所示,其中:t1為刷卡記錄時刻;t2為刷卡車輛的GPS記錄時刻;Δt=|t1-t2|;Δtmin=min{Δt}。

圖1 乘車位置獲取及其與交通小區匹配流程

(1)乘車位置獲取。讀取一條刷卡記錄,讓刷卡記錄時刻分別與對應車輛的所有GPS記錄時刻相減,得到時間差序列。通常,GPS設備的數據最大采集時間間隔小于60 s,當存在某個時刻使時間差最小且小于60 s時,將該時刻對應的坐標(x,y)作為乘客該次乘車位置。

(2)交通小區匹配。交通小區具有同質性,即其內部存在相似的交通強度或交通狀態[10]。因此,利用交通小區的這一特性,將乘客的乘車位置與交通小區進行空間匹配,獲取交通小區級別下乘客的公交出行行為信息,見表2。

表2 乘客公交出行行為時空信息

2 乘客職住地識別算法

公交通勤出行通常存在著較強的規律,如公交通勤時間、出行地點相對固定等,因此假設如下:①公交通勤乘客在工作日早晚高峰時段存在高頻出行。②乘客的居住地為高頻首次出行地。③公交通勤乘客的工作地為工作日晚高峰時段的高頻首次出行地。④公交通勤乘客的每日通勤行為表現為早高峰結束前從居住地出發到達工作地,晚高峰開始后從工作地出發到達居住地。

基于以上假設,結合乘客職住地的時空聯系,可以分別對乘客i的居住地和工作地建立識別規則,步驟如下:

步驟1提取乘客在早晚高峰時段的首次出行小區。為排除乘客偶然出行對職住地識別的干擾,文獻[5-7]對連續5個工作日內出行天數不少于3 d的乘客進行公交通勤行為分析。若乘客i平均每周出行天數不少于3 d,提取其首次出行小區集合。若乘客i平均每周在工作日晚高峰開始后有不少于3 d的出行記錄,提取其在晚高峰開始后的首次出行小區集合。

步驟2設置乘客潛在居住地和工作地。遍歷乘客i的首次出行小區集合,提取出a個小區作為乘客i的潛在居住地,需滿足:當其為首次出行小區時,每周出行天數>1 d。遍歷乘客i在晚高峰開始后的首次出行小區集合,提取出b個小區作為乘客i的潛在工作地,需滿足:當其為晚高峰開始后的首次出行小區時,每周出行天數>1 d。

步驟3根據出行時空聯系確定居住地和工作地。遍歷乘客i在工作日期間的出行記錄,若乘客i在第j個工作日的首次出行地為潛在居住地且在早高峰結束前出行,以及該日在晚高峰開始后首次出行地為潛在工作地,則該潛在居住地為乘客的居住地,該潛在工作地為乘客的工作地,將其分別放入居住地和工作地集合。

乘客職住地識別算法流程如圖2所示,其中:H1為乘客i的首次出行小區集合;W1為乘客i在晚高峰開始后的首次出行小區集合;te為工作日晚高峰的開始時刻;H2為乘客i的潛在居住地集合;W2為乘客i的潛在工作地集合;th為乘客i在第j個工作日的首次出行時刻;tm為工作日早高峰結束時刻;H3為乘客i的居住地集合;W3為乘客i的工作地集合。

若乘客居住地(工作地)集合中出行小區僅有一個,則該出行小區可直接作為乘客的唯一居住地(工作地)。若乘客居住地(工作地)集合中出行小區個數大于一個,且當這些出行小區質心之間的距離小于某個閾值時,則對于該乘客來說,這些出行小區可以視為其居住地(工作地),可將其聚合為一個小區(龍瀛等[11]的研究中,選取站點的平均間距作為該閾值,本研究是在交通小區級別下進行的,因此閾值選取為最鄰近交通小區質心的平均距離,即2 km);若乘客居住地(工作地)集合中出行小區個數大于一個,且這些出行小區質心之間的距離大于該閾值,則認為該乘客可能存在多個居住地(工作地)或不存在固定居住地(工作地)。

現有研究中,職住地的識別往往是相互割裂的,對乘客的居住地和工作地分別建立識別算法,得到的公交通勤出行鏈缺少時空完整性。本文對居住地的識別是基于乘客潛在工作地小區,提取出乘客當日的出行鏈,進一步找到乘客居住地的,保留了乘客公交通勤出行鏈兩端的時空聯系。

3 應用案例分析

3.1 研究區概況

選擇某市2019年4月15—28日的公交刷卡數據和公交車輛GPS數據對乘客的公交通勤行為進行分析。該市多數路段無自行車道,公交運營系統完善,居民通常選擇公交車作為主要出行交通工具,且公交刷卡率達到91.5%,能夠大幅度覆蓋常住人口中乘坐公交車的樣本總體,這為研究提供了可靠的數據支撐。數據包含10個連續工作日,共有有效出行記錄1 267.2萬條,其中工作日出行記錄有1 032.8萬條。該市共有交通小區561個,選取其中557個交通小區作為研究區域。

獲取乘車位置后,將其與交通小區進行匹配,得到乘客乘車位置與所在交通小區的匹配率(達到97.2%)。繪制出不同交通小區的每日客流量,見圖3。

圖3 不同交通小區的每日客流量分布

根據刷卡數據,以1 h為間隔對工作日不同時段(時段1表示0:00—1:00,時段2表示1:00—2:00,以此類推)出行人數分布進行展示,見圖4。由圖4可知,8:00—10:00為該市公交乘客早高峰出行時段,17:00—20:00為晚高峰出行時段。

圖4 工作日不同時段的出行人數分布

3.2 乘客職住地識別算法應用

3.2.1 提取潛在居住地和潛在工作地

為確定潛在居住地集合中出行小區個數a和潛在工作地集合中出行小區個數b,需結合公交乘客的具體出行情況進行分析。以該市的公交乘客出行為例,對所有乘客的首次出行小區集合和晚高峰開始后(17:00后)的首次出行小區集合中的出行小區個數進行分析,結果見圖5。圖5顯示:①94%的乘客擁有1~6個首次出行小區。如果考慮乘客的重復出行(出行次數≥2的首次出行小區),那么99%的乘客擁有1~3個首次出行小區。因此,選擇出行頻率排在前3位的首次出行小區作為潛在居住地,就足以包含乘客的高頻出行小區,即a=3。②97%的乘客擁有1~6個17:00后的首次出行小區。如果考慮乘客的重復出行(出行次數≥2的晚高峰開始后首次出行小區),那么96%的乘客擁有1~2個17:00后的首次出行小區。因此,選擇出行頻率排在前2位的17:00后的首次出行小區作為潛在工作地,即b=2。

(a)早高峰時段

3.2.2 乘客職住地識別算法結果分析

應用乘客職住地識別算法,共識別出13.9萬名擁有職住地的乘客,共計422萬條出行記錄。將識別出職住地的乘客作為通勤乘客,未識別出職住地的乘客作為非通勤乘客。

對通勤乘客在早高峰結束前(10:00前)與晚高峰開始后(17:00后)的出行行為進行分析,結果見表3。第1類結果中,11.2萬名乘客只有1個居住地和1個工作地,可直接作為他們的居住地和職住地。第2~4類結果中,2.7萬名乘客的居住地或工作地并不是其在兩個高峰時段的最高頻首次出行地,此部分乘客占通勤乘客總數的20%,若直接將乘客在早晚高峰時段的最高頻首次出行地作為職住地則會引起較大的識別誤差。通過進一步分析發現,其中有2.6萬名乘客的居住地或工作地不只有1個,對集合內滿足質心距離小于等于2 km的出行小區進行聚合,得到:有2.2萬名乘客擁有唯一職住地;另有0.4萬名乘客的職住地集合內的出行小區質心距離大于2 km,該部分乘客可能存在多個居住地(工作地)或無固定居住地(工作地)。最終,識別出13.5萬名具有唯一職住地的公交通勤乘客。

表3 乘客職住地識別算法結果分析

作為對比,利用文獻[5]中的方法,將一周中最大刷卡間隔大于7 h、出行天數達到3 d以上的乘客作為通勤乘客,滿足最大出行間隔的前后兩次出行行為視為乘客的通勤行為,運用下車站點推算方法補全通勤出行鏈后,共得到90萬條通勤出行記錄。將文獻[5]的方法與本文方法識別出的通勤乘客取交集后得到126 161名乘客;提取該部分乘客在早高峰結束前從居住地出發,且當日晚高峰開始后從工作地出發的出行記錄作為乘客通勤出行鏈,共得到159萬條通勤出行記錄??梢钥闯?基于下車站點的通勤識別方法在同一數據源環境下識別出的通勤出行鏈完整性較差,這主要是因為在本研究數據環境下下車站點識別率只有56%。

3.3 乘客出行時空特征分析

以1 h為間隔,對具有唯一職住地的通勤乘客和非通勤乘客的出行進行分析,不同時段下出行人數占比見圖6。由圖6發現,該市通勤乘客和非通勤乘客在工作日和周末的出行模式存在顯著差異:通勤乘客在工作日早高峰時段(8:00—10:00)和晚高峰時段(17:00—20:00)的出行人數占比達到79%以上,且在11:00—17:00的出行人數占比達到13.4%;通勤乘客在周末的出行仍存在明顯的雙峰分布,但在11:00—17:00的出行人數占比達到31.5%,說明一部分乘客在周末存在以休閑娛樂等為目的的出行;非通勤乘客在工作日和周末不同時段的出行較為均衡。

(a)工作日

基于乘客的居住地識別結果在交通小區級別下對通勤乘客的平均通勤距離進行分析得到,平均通勤距離為5.7 km,標準差為3.9 km,約72%的乘客的通勤距離在2~8 km范圍內,20%的乘客的通勤距離在8 km以上。居住于不同交通小區的乘客的平均通勤距離如圖7所示,通勤距離由城市外圍到城市中心逐漸遞減。

圖7 不同交通小區的平均通勤距離

4 結 論

利用某市連續兩周的公交刷卡數據,在交通小區級別下建立乘客職住地識別算法,對公交乘客的通勤行為進行識別分析。

與基于出行鏈的公交通勤行為識別方法相比,本文方法識別和提取出的通勤出行鏈更具完整性。在建立乘客職住地識別算法時,延續了職住地之間的時空聯系,能有效識別出一日之內使用公共交通往返于職住地的通勤行為。一些研究直接將乘客在早晚高峰時段的最高頻首次出行地作為乘客的居住地或工作地,從實例分析結果看,會使15.6%的通勤乘客的出行鏈識別錯誤或缺失,進一步分析發現此部分乘客中有78%的乘客在早晚高峰時段的最高頻首次出行地與識別出的居住地或工作地高度相關,根據空間位置進行聚合后保留了該部分乘客的通勤客流,提升了該部分乘客通勤出行鏈的完整性。

本文研究能夠為交通規劃部門了解通勤行為特征、發展城市智慧交通提供方法上的參考。不足之處在于:本文研究是在交通小區級別下進行的,雖然提高了乘客上車站點的匹配率,但不可避免地會降低空間分辨率;數據源存在單一性,僅對某市公交通勤行為進行了實例分析。隨著公共交通大數據的不斷豐富,未來將利用更多城市的公共交通信息化數據對本文方法的可靠性和泛化能力進行驗證。

猜你喜歡
居住地刷卡高峰
病毒病將迎“小高峰”全方位布控巧應對
石慶云
鳥類居住地
Binturong熊貍
麋鹿&大象
刷卡
雨天早高峰,自在從容時。
成長日記
山東:符合條件外來人口可在居住地申請低保
刷臉就可以購物
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合