?

基于手機信令數據的城市區域居民出行OD預測模型

2023-12-28 02:54胡寶雨劉學
交通運輸系統工程與信息 2023年6期
關鍵詞:四環人口數量哈爾濱市

胡寶雨,劉學

(東北林業大學,土木與交通學院,哈爾濱 150040)

0 引言

隨著大數據時代的到來,越來越多的城市規劃者將大數據的理論和方法應用于實踐中,大數據賦能交通發展受到廣泛關注。近幾十年來,隨著數據采集技術的發展,第五代(5G)移動通信技術的成熟,大數據方法在交通運輸中的應用迅速增加,為交通領域創新發展帶來了新的機遇。傳統居民出行調查存在成本高、耗時耗力、準確性低等問題,隨著信息化的發展,手機信令數據憑借大規模、實時性和高精度的優勢,能夠提供更為全面和準確的出行信息,逐漸成為智能交通領域研究的主要數據源之一,從海量的手機數據中提取出行信息逐漸成為國內外大數據分析領域的研究熱點。利用手機信令數據建立有效的OD預測模型,對于優化城市交通規劃和提高出行效率具有重要意義。

空間出行OD預測模型最早是由引力模型[1]而來,近年來Zhao Z.等[2]利用大數據研究網絡空間和物理空間相關性,后來Simini 等[3]以美國郡間通勤為背景利用從西歐國家的移動電話數據庫中提取的每小時行程數據提出了輻射模型,該模型是第一個無參數模型,通過輸入各地的人口數量,就能夠預測地點間的交通出行量。一些研究者又對輻射模型進行推廣,提出基于時間成本的輻射模型[4]、輻射選擇模型[5]等。在預測城市內部出行時,Yan等[6]使用包括阿比讓移動電話用戶數據集在內的4 個數據集,提出人口權重機會模型預測個體出行目的地選擇行為。Zhao 等[7]使用網絡簽到數據開發了一個基于記憶效力的隨機游走模型。進一步地,Yan等[8]使用包括科特迪瓦全國移動電話數據集在內的4個數據集,將人口權重機會模型與隨機游走模型相結合得到了適用于不同空間尺度的個體群體統一模型。Forghani 等[9]使用意大利電信數據集,通過識別網絡中的社區結構,對輻射模型人口權重機會模型進行改進。受輻射模型的啟發,Sim等[10]以個體社交互動規則建立了一個社交關系模型。倪玲霖等[11]以杭州市移動手機信令數據為基礎建立了居民OD 出行量影響的空間自相關模型。李自圓等[12]利用手機信令數據分析了長三角城際出行規模和空間分布特征。Liu等[13]使用包括移動用戶數據在內的數據集進一步將個體選擇社交對象的行為擴展到個體選擇目的地行為中,建立了機會優先選擇模型。在考慮輻射模型中謹慎性傾向和機會優先選擇模型中探索性傾向后,Liu等[14]將這兩種傾向作為參數建立了一個統一機會模型。Schl?pferd 等[15]使用5 個移動電話數據集揭示了一個簡單而強大的縮放定律,構建了一個個體移動模型。

綜上所述,大多數空間出行OD 預測模型都依賴于大數據,尤其是手機信令數據,以更準確地捕捉出行行為的模式,模型著重考慮地理空間之間的關聯性以預測出行目的地或流動量。這反映了空間出行的本質特征。本文旨在利用手機信令數據獲得的群體出行數據,基于城市居民實際出行選擇行為提出一種適用于城市內居民出行目的地的選擇機制,傳統的預測模型如輻射模型、機會優先選擇模型等具有無參數的特點,但僅基于人口信息,沒有充分考慮個體的興趣和偏好,本文引入人口數量和興趣點(POI)數量兩類數據,建立一個地點機會選擇模型,該模型能夠更準確地預測居民出行的目的地選擇,數據獲取較為容易,模型適用性較高,能為城市交通規劃提供依據。

1 研究區域與數據來源

1.1 研究區域及劃分

本文以哈爾濱市四環路(即繞城高速)內部城區作為研究區域探索居民出行OD 規律。為研究不同范圍規律特征,基于路網特征和用地性質將該區域按二環、三環、四環分別劃分出501、829、995 個交通小區。為了在不同尺度更好地觀察哈爾濱市城區居民出行規律,分別將上述交通小區合并成46、76、99個交通中區,如圖1所示。不同尺度的交通區劃分有助于更精確地理解不同區域內的出行情況。比如,交通小區劃分可以幫助我們了解某個具體街區的出行狀況,而交通中區則能描述更廣闊范圍的出行狀況。另外通過對不同尺度的交通區域進行比較,為城市交通規劃提供重要的參考依據。

1.2 手機信令數據

OD數據來源于聯通智慧足跡平臺的手機信令數據,分別提取2019年5月10日(工作日)和5月18日(休息日)哈爾濱市城區內產生的居民出行數據,與劃分的交通小區進行匹配,分別得到工作日411539條出行數據,休息日385232 條出行數據。數據包括7 個字段:start_id,start_lng,start_lat,end_id,end_lng,end_lat,weight。其中,start_id為用戶出行起點小區編號,start_lng 為起點小區經度坐標,start_lat 為起點小區緯度坐標,end_id 為用戶出行終點小區編號,end_lng,end_lat分別為終點小區的經、緯度坐標,weight 為起終點小區之間產生的出行數量(將聯通用戶數外推到全量人數),表1 展示了哈爾濱市2019 年5 月10 日(工作日)的部分出行OD 數據。為進一步探尋哈爾濱市四環出行特征,以2019年5月10日為例分別繪制交通小區和交通中區OD出行量T的概率密度函數圖,如圖2所示,結果表明,城市內區域居民群體出行量遵循厚尾冪律分布。這也就意味著在哈爾濱市四環交通中存在明顯的集聚效應,即少數區域內發生大量出行次數遠遠超過其他區域,這種現象可以解釋為在哈爾濱市城區中存在一些核心區域吸引了大量的出行需求和交通流量。這種分布特性對于城市規劃和交通管理具有重要的指導意義。

表1 OD數據示例Table 1 Example of OD data

圖2 哈爾濱市四環內OD出行量T 概率密度分布Fig.2 Probability density distribution of OD traffic volume T in fourth ring road of Harbin

人口數據通過聯通智慧足跡平臺提取得到各交通小區的人口數量信息,由此進一步得到各交通中區人口數量信息。定義di為某區域第i個交通小區的相對人口密度,借助ArcMap 將四環范圍內995個交通小區相對人口密度采用幾何間隔分類法分為8級,如圖3所示,哈爾濱市城區人口從中心區域向四周逐漸減少,呈現明顯的“中心-四周”擴散分布,人口多集中在松花江以南的二環區域內。

圖3 哈爾濱市四環內相對人口密度分布圖Fig.3 Distribution of relative population density in fourth ring road of Harbin

式中:mi為交通小區i居住人口數(人);Si為交通小區i的面積(km2)。

1.3 POI數據

POI(Point of Interest)即興趣點,泛指互聯網電子地圖中的點類數據,基本包含名稱、地址、坐標、類別這4個屬性。本文借助百度地圖API接口獲得哈爾濱市POI 點數據,所有POI 點被分為14 個大類:餐飲美食、公司企業、購物消費、交通設施、金融機構、酒店住宿、科教文化、旅游景點、汽車相關、商務住宅、生活服務、休閑娛樂、醫療保健、運動健身,具體如表2所示。將POI數據與劃分的交通小區進行匹配,進而與合并后的交通中區進行匹配,得到哈爾濱市不同范圍的POI 分布情況。圖4 展示了POI 在四環交通小區上的分布,發現POI 點分布與人口密度分布具有一致性,進一步表明哈爾濱市為中心放射型城市特征。

表2 交通小區POI類型分類數據示例Table 2 Examples of traffic community POI categorization data

圖4 哈爾濱市四環內POI分布圖Fig.4 Distribution of POI in fourth ring road of Harbin

2 OD預測模型

2.1 輻射模型

輻射模型的基本假設是當出行者選擇目的地時,首先評估這些地點提供的機會效益z,用人口數量表示每個地點的機會效益,機會效益是從分布p(z)中隨機選擇的。然后出行者將選擇距離最近的高于起始地機會效益的地點作為目的地,故位置j可以作為目的地的概率為

式中:j為終點交通區號;Qij為當起點為i地,j地可以作為目的地的概率;mj為終點j交通區的人口數量;sij為i、j兩地之間人口數量之和(不包含i、j兩地)。

位置i的出行者選擇位置j作為目的地的概率為

式中:M為所有交通區的人口數量之和。

2.2 機會優先選擇模型

機會優先選擇(OPS)模型的基本假設是出行者不僅可以選擇機會效益高于起點的最近地點,還可以選擇機會效益高于起點機會效益和介入機會效益的其他地點,機會效益同樣用人口數量表示,故位置j可以作為目的地的概率為

位于位置i的出行者選擇位置j作為目的地的概率為

式中:Sij為i、j之間所有交通區的人口數量之和(包含i、j兩地)。

2.3 地點機會選擇模型

隨著公共交通方式穩定發展與私家車的普及,出行距離已不再是制約人類城市內區域出行的重要因素。在城區內居民目的地選擇主要基于兩個準則:一是優先選擇去往人口數量更多的地區;二是優先選擇去往POI 數量更多的地區,如圖5 所示。即目的地點的吸引能力分別與該地的人口數量和POI 數量成正比,如圖6 和圖7 所示。概括來說,人們總會優先選擇去往比自身所在地效益更大的地區,這里的效益分別由人口數量和POI數量來表示。

圖5 城市居民出行目的地選擇示意圖Fig.5 Schematic diagram of travel destination choice for urban residents

圖6 交通小區吸引量關系圖Fig.6 Attractive volume relationship in traffic cells

圖7 交通中區吸引量關系圖Fig.7 Attractive volume relationship in traffic mid-zones

因此,本文考慮出行者所在地的機會效益與目的地的機會效益,構建地點機會選擇模型(Position Opportunity Selection Model,POS),在新模型中假設:出行者更傾向于去往比自身所在地效益更大的目的地。此時位置j可以作為目的地的概率為

由式(6)~式(8)可得

式中:hi為起點i交通區的POI 數量;hj為終點j交通區的POI數量

則位置i的出行者選擇位置j作為目的地的概率為

故從位置i去往位置j的出行量為

式中:Tij為以i交通區為起點j交通區為終點的交通出行量;Oi為i交通區的交通出行產生總量。

3 結果分析

3.1 吸引能力分析

不同區域的交通吸引能力分析可以提供有關城市交通系統和城市規劃的關鍵信息,對于優化資源分配、改善交通流動性,提高居民生活質量具有重要意義。定義xj為第j個交通區的交通吸引能力,通過對比不同模型得到的出行預測數據來評估預測模型的準確性。圖8 展示了哈爾濱市四環內99個交通中區的吸引能力預測分布圖??偟膩碚f:工作日的交通吸引能力高于休息日,松花江以南的吸引能力高于松花江以北的吸引能力;POS模型與OPS模型在吸引能力預測上與真實值略有偏差,基本可以正確反映某區域的交通吸引能力,而輻射模型預測值與真實值對比偏差較大。把實際交通吸引能力高于預測值的區域稱為高交通吸引區,這些區域具有特殊的吸引力因素,例如就業機會、商業中心等;把實際交通吸引能力低于預測值的小區稱為低交通吸引區,表明這些地區存在可改進的問題,例如交通基礎設施、公共交通服務或者城市規劃方面。從POS模型預測結果來看,在哈爾濱市城區外緣-四環路上有部分高交通吸引區,暗示了城市擴張和郊區化趨勢,隨著城市不斷擴大,新的住宅區域出現在城市邊緣,土地相對便宜且可供開發,這可能會導致更多人居住在城市的外圍區域;而二環區域內有部分低交通吸引區,這表明哈爾濱市中心城區交通狀況有待改進。

分析不同區域的交通吸引能力有助于城市規劃者針對性改善交通基礎設施以滿足需求,更有效地規劃道路、公共交通線路和交通信號以減少交通擁堵。了解不同區域交通吸引能力差異可以幫助城市管理部門公平地分配資源,確保各個區域都能獲得適當的交通服務和基礎設施投資。

3.2 出行距離分布

探究城市居民出行距離分布對城市交通規劃具有重要意義,了解城市居民的出行距離分布可以更好地規劃交通系統、優化城市布局以及改善交通運輸效率。掌握居民出行距離分布變化趨勢,可以根據實際需求優化配置公共交通,提高交通服務能力和質量,滿足居民出行需求。

本文對POS 模型預測得到的出行距離和實際出行距離分別在不同時間、不同范圍上進行比較。圖9 展示了交通中區POS 模型預測距離與實際出行距離的分布情況,可以看出,隨著出行距離變遠,預測值越來越接近真實值。同時對真實值概率密度p(d)進行擬合分析,結果服從高斯分布,并且發現,隨著區域的擴大規律性越來越明顯。哈爾濱市四環內出行距離遵循高斯分布說明,在該區域中,較短的出行距離相對較常見,而較長的出行距離相對較少見。在市區范圍內,一方面人們更傾向于進行短途出行,例如去商場、上班、學校等,因此這些較短出行距離的頻率更高,呈現出高斯分布的特征;另一方面,較長出行距離相對較少,這是由于在該區域中心城區分布的機會數量較多,而四周區域機會數量較少,周邊區域的出行總量較少,導致長距離出行概率較低。另外,對比真實值和預測值的擬合曲線發現,在工作日隨著出行距離變長,預測值曲線先低于真實值曲線而后略高于真實值曲線,這說明在短距離出行中個體的出行距離更加多樣化。

圖9 不同時間不同范圍出行距離分布Fig.9 Travel distance distribution of different ranges at different times

3.3 OD預測精度分析

使用S?rensen 相似性指數(SSI)比較POS 模型和傳統輻射模型、OPS模型的OD預測準確性。SSI是用于對比兩個樣本之間相似性的統計工具,結果越接近1,其預測精度越高,在這里修改該指數來衡量模型的準確度。其中,e為出行網絡的有效連邊(兩個交通區之間有出行量即算作一條有效連邊),n為交通區內出行產生的所有連邊數,為預測出行量,Tij為實際出行量。結果表明,POS模型精度較輻射模型和OPS 模型在不同尺度均有很大提升。如圖10(a)、(c)所示,對比二、三、四環交通小區預測結果發現,POS模型在工作日SSI分別為0.69、0.68、0.67,休息日SSI 分別為0.72、0.70、0.69;OPS模型工作日SSI 分別為0.55、0.55、0.54,休息日SSI分別為0.54、0.52、0.51;輻射模型工作日SSI分別為0.12、0.09、0.09,休息日SSI 分別為0.12、0.10、0.09。在交通小區中,POS模型較OPS模型預測精度提高了13%~18%、較輻射模型預測精度提高了57%~60%。如圖10(b)、(d)所示,對比二、三、四環交通中區預測結果發現,POS 模型在工作日SSI 分別為0.83、0.81、0.75,休息日SSI 分別為0.81、0.80、0.75;OPS 模型工作日SSI 分別為0.66、0.65、0.66,休息日SSI分別為0.64、0.60、0.58;輻射模型工作日SSI 分別為0.26、0.21、0.17,休息日SSI 分別為0.26、0.20、0.17。在交通中區中,POS模型較OPS模型預測精度提高了9%~20%,較輻射模型提高了55%~60%。

圖10 SSI預測精度對比Fig.10 Comparison of SSI prediction accuracy

分析發現,不同模型的交通中區預測精度均高于交通小區預測精度,這是因為交通中區通常是城市交通密集、道路規模較大的地區,擁有更多的數據和監控設施,交通流量更大,數據量更豐富。相比之下交通小區的尺度較小,交通情況變化可能不夠明顯或難以預測。此外,交通小區內部的交通流動性也較低,受到周邊交通影響較大,因此準確預測交通情況可能會面臨更大的挑戰。這與交通流預測模型[16]在重交通流和中等交通流條件下預測效果良好,而在低交通流條件下表現不佳的結論相符。圖6 和圖7 也表明,在交通中區目的地點吸引量與人口數量和POI數量相關更高,這是導致交通中區預測精度高于交通小區預測精度的直接原因。還發現,不管是交通小區還是交通中區,SSI都會隨研究區域的擴大而有所下降,尤其是POS模型較為明顯,說明該模型在適用范圍上有所限制。

式中:ISSI為SSI的值。

為了更好地比較不同模型預測結果的準確度,定義預測值與實際值的相對誤差為Aij。根據Aij的取值,將相對誤差分為4 個等級:A 準確(Aij≤0.3)、B比較準確(0.3<Aij≤0.5)、C不太準確(0.5<Aij≤1)、D不準確(Aij >1),如表3所示。結果表明,POS模型在交通中區的預測相對誤差集中在A、B兩級,其中交通中區A、B兩個等級之和基本能達到0.6 以上,交通小區A、B 兩個等級之和基本能達到0.45以上,POS模型誤差率在A等級中的占比明顯優于OPS 模型和輻射模型,模型準確度大大提高。

表3 相對誤差占比Table 3 Percentage of relative error

4 結論

本文利用聯通智慧足跡提取到的手機信令數據中的OD 出行數據、人口數據和利用百度API 接口得到的POI點數據,分析哈爾濱市四環城區內空間結構以及居民出行分布特征,得到的主要結論如下:

(1)通過對哈爾濱市四環區域內相對人口密度分布和POI分布的分析,揭示了該城市的空間結構特征和交通出行量的分布規律。首先,哈爾濱市四環區域內的人口密度和POI分布呈現出中心-四周放射型特征。這意味著城市的中心地帶聚集了更多的人口和商業設施,而隨著距離中心區域的距離增加,人口和商業設施的數量逐漸減少。這一結論與其他城市的研究結果相似,中心-四周放射型是許多城市的共性特征。其次發現,哈爾濱市四環區域內的交通出行量遵循冪率分布。這意味著少數區域承載了大部分出行交通流量,而大部分區域的交通流量相對較少。這一結論有助于城市規劃者更好地理解城市交通流量的分布規律,并制定更有效的交通管理和規劃措施。

(2)通過對哈爾濱市四環區域內人口數量、POI數量和交通吸引量的相關性分析發現,人口數量和POI數量與交通吸引量呈正相關關系,這意味著人口數量和商業設施數量越多的地方,交通吸引量越大。由此提出一種地點機會選擇(POS)模型,該模型的基本假設是出行者選擇目的地的概率與目的地處的人口成正比,與起點和目的地人口總數成反比,與目的地處的POI成正比,與起點和目的地POI總數成反比。該模型為無參數模型,與經典輻射模型和機會優先選擇(OPS)模型相比,POS 模型能更好地描述城市區域尤其是中心城區居民目的地選擇的行為模式。該模型輸入僅需各地點人口數量和POI 興趣點數量,兩種數據獲得較為容易,有利于節約城市交通出行需求預測成本。

(3)將提出的地點機會選擇(POS)模型預測數據與已有的輻射模型和OPS 模型以及真實數據值進行吸引能力預測對比,POS模型和OPS模型與真實值的差距不大,可以較為準確地預測區域內的交通吸引能力。通過POS模型與真實值的對比發現,哈爾濱市外圍存在高交通吸引區,而城市中心存在低交通吸引區,為改善區域交通基礎設施提供建議。

(4)對真實數據集和POS預測數據集的出行距離進行擬合分析得到,哈爾濱市四環內居民出行距離服從高斯分布。在擬合分析中發現,休息日的真實出行距離與預測出行距離的擬合曲線基本吻合,而在工作日真實值略高于預測值,這意味著在工作日的出行情況中,個體的出行距離相對更多樣化。

(5)對模型OD預測精度分析,使用相似性指數SSI 將POS 與傳統的輻射模型和OPS 模型對比,POS 模型SSI 值在不同層面均高于其他兩個模型。進一步使用相對誤差驗證模型準確性,并將其分為4 個等級:A 準確、B 比較準確、C 不太準確、D 不準確,POS模型在A、B兩個等級的占比之和均高于其他兩個模型,體現了該模型的優越性與準確性。

猜你喜歡
四環人口數量哈爾濱市
哈爾濱市天豐工具研究所
失而復得的玉桂葉
“六步四環”單元教學靶向課堂提質
黑龍江省哈爾濱市方正縣第一中學校
創新“四雙四環”模式 打造課程思政樣板
我國60歲以上人口數量首超15歲以下人口
2020年前俄人口數量將增至1.475億
四環醫藥迎來春天
哈爾濱市市政工程設計院
“十三五”期間江西省老齡人口數量預測
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合