?

基于模體和復雜網絡的成都市交通旅客出行研究

2024-03-11 02:39宋浩男
鐵道運輸與經濟 2024年2期
關鍵詞:模體站點旅客

徐 進,宋浩男

(1.西南交通大學 經濟管理學院,四川 成都 610031;2.西南交通大學 綜合交通大數據應用技術國家工程實驗室,四川 成都 610031;3.西南交通大學 四川省服務科學與創新重點實驗室,四川 成都 610031)

0 引言

交通運輸在人口流動中起著重要作用[1-2]。截至2021年底,我國鐵路運營里程超過15萬km,其中高速鐵路超過4 萬km。2020 年新冠疫情爆發以前,我國民用航空客運量占總人口比重不斷上升,民航業發展迅速,2019年,我國民用航空客運量占總人口數的47%。隨著高速鐵路線路和車站的不斷建設,不同地區之間的可達性不斷增加,經濟蓬勃發展[3]。隨著鐵路和航空客運量的增加,描述和發現鐵路和航空旅客的流動特征和模式變得更加重要[4-5]。近年來,使用復雜網絡方法對鐵路和航空網絡的研究有所增加,其研究表明,我國鐵路和航空復雜網絡具有小世界和無標度分布的特點[5-7]。當前的研究描述鐵路復雜網絡的拓撲屬性,從整個網絡分析鐵路和航空網絡的可達性和脆弱性[8],并為交通網絡的建設提供強有力的理論支持[9-10]。雖然當前有關交通復雜網絡的研究取得較好進展,但目前對鐵路和航空網絡的研究大多基于對整個建成網絡的分析,基于個體出行的鐵路和航空出行網絡的特征仍有待探索。

個人的移動軌跡可以表示為出行序列,序列內包含個人依次訪問的地點集合,從而可以獲得個人流動性特征[11-13]。雖然可以從出行序列抽取個人的出行特征,但單個行程序列包含重復訪問的位置。例如,在旅行者的旅行序列中,如果a地點和b地點之間有多個往返行程,則該序列將包含多個a→b,這種重復的行程軌跡對于描述行程特征是多余的[14]。因此,在描述旅行特征時,僅使用旅行序列并不能有效消除冗余訪問。解決該問題的更好方法是將個人行程提取為有向圖。一些學者通過將數千人的運動軌跡構建為復雜網絡,提取個人日?;顒拥?7個獨特模體(motif)[15],這些獨特的模體代表由不同類型的個人每天訪問的地方組成的完整行程。然而,雖然鐵路和航空旅行具有與日常旅行不同的其他特征,但在一段時間內,其仍然表示個人旅行。將模體研究方法應用于鐵路和航空出行,可以獲得更多鐵路和航空旅客的出行特征。

研究嘗試從以下2 點對既有研究進行拓展。一是構建旅客出行模體識別模型,對鐵路和航空出行旅客的出行特征進行刻畫,直觀反映不同出行群體的出行模式;二是構建鐵路旅客出行網絡(RRTN)和航空旅客出行網絡(RATN),基于相關拓撲指標量化出行網絡結構,發掘旅客出行的整體模式和演化特征。

1 出行模體模型及網絡結構特征

1.1 出行模體模型構建

每日出行可以相對全面的方式獲得個人的出行序列,因為可以基于移動電話的信令數據輕松定位個人旅行序列。然而,從鐵路旅行記錄中獲得的旅行序列通常相對不完整,因為乘客在出發或返回時可能會選擇鐵路或航空以外的交通方式,如公共汽車、私家車等。交通模式的這種變化可能導致在出行序列中從同一起點到同一目的地的重復記錄,其可以被提取為(A→B,A→B)。此外,對于長途旅行和訪問更多地點的乘客,在鐵路旅行序列中,最后一次旅行的終點站和下一次旅程的起點站也可能不一致,例如(A→B,C→D)。

為了解決上述問題,研究提出以下鐵路出行序列提取規則。①如果2 個相鄰行程的起點和終點相同,則2個行程將合并為一個行程,然后添加到行程序列中;②如果旅行者2 次相鄰旅行的目的地和出發地不同,則將在2 次相鄰旅程之間添加從前一目的地到下一目的地的旅行鏈接。對于提取規則①,研究考慮合并相鄰的重復始發站和目的站,旅客在2 個相同地點之間出行時,可能會在出發時選擇鐵路,而返回時選擇其他出行方式,對于這種單向鐵路選擇構成的序列,進行序列的簡化,即旅行序列(A→B,A→B)將轉換為(A→B);提取規則②等同于行程序列的完成,即行程序列(A→B,C→D)將轉換為(A→B→C→D)。

在將旅行數據轉換為序列之后,需要提取各個旅行主題,生成的基序對應于有向圖。模體提取和同構判定如圖1所示。在圖1中,3名乘客通過不同的車站,并且有向圖的組成存在一些差異。然而,這些有向圖彼此同構。因此,需要確定每個乘客的旅行有向圖的同構,以獲得唯一的旅行模體。步驟如下。①通過上述的提取規則提取序列后,將序列中出發地和目的地的名稱轉換為數字序列號,生成包含該序列的有向圖。②將所有乘客的這些圖保存到列表中,并對每個圖執行主題提??;對于具有相同旅行模式但不同圖形結構的乘客,圖同構匹配(VF2)算法設計為選擇指定的有向圖作為這些乘客的主題,也就是說,具有相同旅行模式的乘客具有相同的主題。最終生成的基序表示為mij,其中i表示構成基序的節點數,j表示當前節點數下基序的序列號。例如,m21表示節點數量為2的第一個基序。

圖1 模體提取和同構判定Fig.1 Motif extraction and isomorphism determination

1.2 網絡結構特征

構造用于鐵路和航空出行的加權有向網絡G=(V,E,w)。其中,節點V表示旅客通過的所有車站;邊E表示站點之間的客流和方向;w表示每個邊緣的重量,即從一個站點流向另一個站點的乘客數量。研究選擇以下復雜網絡分析指標來描述鐵路和航空出行網絡的拓撲特征。

(1)節點度ki。節點度表示節點與網絡中其他節點之間連接的邊數。節點度越大,連接邊的數量越高。

式中:nij表示節點i和節點j之間存在一條邊。

(2)節點強度si。節點強度表示網絡中連接到一個節點的其他節點的總權重。

式中:wij表示節點i與節點j之間的連接權重。

(3)同配系數r。同配系數衡量復雜網絡中節點與其他節點之間的關聯度。同配網絡表明,網絡中具有較大度的節點之間存在較強的連接趨勢。相反,異配網絡意味著具有大程度的節點和具有小程度的節點之間存在強烈的連接趨勢。-1 ≤r≤1,當r≥0時表示網絡呈現同配性,反之則呈現異配性。

式中:M表示網絡邊的數量;αe,βe表示連接到第e條邊的節點的程度。

(4)聚類系數Ci。聚類系數表示復雜網絡中的節點與其相鄰節點的連接程度。對于鐵路出行網絡,節點的聚類系數表示車站與其相鄰車站之間的連接程度。整個網絡的聚類系數表示為所有節點的聚類系數的平均值。

式中:Ei表示節點i的連接邊的數量。

(5)網絡效率E。網絡效率表示整個網絡的平均效率,通常用于描述整個網絡的平均接近度和魯棒性。網絡效率也是衡量復雜網絡中節點間信息交換的必要指標。網絡效率越高,節點間交互消耗的能量就越少,網絡上的信息傳輸就越有效。

式中:εij表示節點i和節點j之間的效能;Dij表示節點i和節點j之間的距離。

式中:N表示網絡中的節點個數。

2 旅客出行模體分析

研究基于四川省成都市2015—2018 年鐵路和航空旅客出行數據,根據旅客出行模體識別方法,分析鐵路和航空旅客的出行模體。選取出現頻率大于1%的出行模體作為高頻出行模體,得到關于鐵路和航空的高頻出行模體分布。

2015—2018 年鐵路高頻出行模體如圖2 所示。2015—2018年鐵路高頻出行模體大約占總體出行模體的75%以上,包含了鐵路出行的絕大部分出行方式。出行模體的節點構成不超過4 個,表示旅客的出行活動大多是基于2~4 個地區之間的重復往來。2 節點構成的鐵路出行模體包含一個地點到另外一個地點的單次出行(m21)和往返出行(m22);2 個節點的單次出行說明該部分出行群體在一年之內只進行了一次鐵路出行,對鐵路出行方式的依賴較??;2015年的出行模體中,單次出行頻率與往返出行的頻率之差最大,隨著年份的增加,兩者頻率的差距逐漸變小,其中2017 年的往返出行旅客數量甚至高于單次出行旅客的數量,說明該地區旅客出行中對鐵路出行方式選擇在逐年增加。3節點構成的模體中,3個出行地點之間的順序出行(m31)和一個地點與其他2 個地點的往返出行(m33)的出行頻率較高,其中2015 年與2018 年的鐵路出行的旅客大多進行基于m31 的出行,其余年份大多進行基于m33 的出行。4 節點構成的鐵路出行模體中旅客的出行模體主要為4 個節點的順序訪問,但終點和起點并不相同,表示旅客可能在返回出行起點時選擇了其他交通工具。觀察不同年份3節點模體和4節點模體的數量,可以發現2015—2017年鐵路旅客的3節點出行模體其出現頻率要高于2018年,而4節點模體中2018年出行模體的出行頻率則高于其他3 年,且出行模體更為復雜(m43),說明鐵路旅客的出行模體在逐漸復雜,對鐵路出行方式的選擇更多。

圖2 2015—2018年鐵路高頻出行模體Fig.2 High frequency travel motif of railway from 2015 to 2018

2015—2018 年航空出行高頻模體如圖3 所示。2 節點構成的模體所包含的2 個地點之間的往返出行(m21)頻率最高,從起點到終點的單向單次出行(m22)較少。與鐵路出行的2 節點模體出現占比比較,可以發現鐵路出行中存在2 種出行模體出現頻率差距較大的情況,而航空出行中這種差距很小,最大差距不到5%。同時航空出行中2 節點出行模體的出行占比最高,這說明航空出行的旅客主要分為常往返于固定地點的旅客和只進行一次航空出行的旅客。同樣在2 節點出行模體中,隨著年份增加,2 種出行模體的頻率差距越來越小,這可能表明航空出行方式對出行旅客的吸引力逐步下降,這與鐵路出行形成相反的對比。3 節點出行模體中的高頻出行模體與鐵路出行類似,主要為一個地點到另外一個地點的往返出行(m31)和3 個節點之間的順序出行(m32)。4節點出行模體中占比最高的出行模體為3 個節點之間的順序訪問和2 個節點之間的往返(m41),可以看作是m21 與m32 出行模體的組合。

圖3 2015—2018年航空出行高頻模體Fig.3 High frequency travel motif of airlines from 2015 to 2018

結合上述分析,可以發現成都市鐵路和航空旅客出行的主要模式為2 節點的出行,隨著年份增加,鐵路出行對旅客出行的吸引力變大,而航空出行對旅客出行的吸引力變小。3 節點的高頻出行模體在2 種出行方式中較為相似,但鐵路出行中旅客更多選擇順序訪問3 個地點,而航空出行的旅客更傾向于從起點到2 個其他地點之間的多次往返,顯示了鐵路和航空出行方式的差異。4 節點出行模體中鐵路的模體數量要多于航空,但從其中的高頻模體中可以發現航空出行模體更加完整,存在旅客從出發到返回的路徑,這也說明航空旅客在較復雜的出行模式中對航空出行方式的依賴度較高。

3 RRTN和RATN拓撲分析

在旅客出行分析中,研究基于成都市鐵路和航空旅客的實際出行記錄,將旅客訪問過的站點作為節點,旅客在站點之間的實際出行活動作為連邊,構建鐵路旅客出行網絡和航空旅客出行網絡。與一般鐵路和航空復雜網絡不同的是,研究構建的出行網絡是基于該地區旅客實際訪問的站點和實際出行活動,而不是所有的建成站點和開通的運營線路。

基于拓撲指標,計算不同年份下鐵路和航空出行網絡的拓撲特征,2015—2018年鐵路和航空出行網絡拓撲指標如表1 所示。觀察不同年份的網絡平均度,可以推測網絡中站點之間平均的連接數量,同時鐵路出行網絡的平均度整體而言大于航空出行網絡。平均強度方面,可以看出出行網絡中旅客在相同站點之間的出行次數較多;2 種不同的出行網絡相比,航空出行網絡的平均強度遠大于鐵路出行網絡,這可能是由于航空線路較少并且航空旅客出行次數較多;同時隨著年份增加,不同類型出行網絡的平均強度在逐步增加。研究計算得到不同網絡的同配系數均小于0,說明鐵路出行網絡和航空出行網絡均具有異質性且航空出行網絡的異質性明顯,大規模站點往往會選擇和小規模站點相連接,說明該地區的旅客可能存在較多的大規模站點和小規模站點之間的出行。通過出行網絡聚類系數的計算結果,可以發現2 種出行網絡均具有較大的聚類系數,旅客在出行站點之間的出行活動構成的網絡結構十分緊密;同時航空出行網絡的聚類系數更高,這可能是由于航空出行速度較快,旅客較遠距離的出行只需要進行1 次乘坐,而鐵路可能存在中途換乘的情況,使得鐵路出行網絡中站點的連接緊密程度劣于航空出行網絡。

表1 2015—2018年鐵路和航空出行網絡拓撲指標Tab.1 Topological indicators of railway and air travel network from 2015 to 2018

2015—2018 年鐵路出行流向如圖4 所示,結合表1 和圖4,可以發現成都市的鐵路出行網絡結構較為穩定,旅客在不同年份的出行流向類似;大多表現為省內的出行;省外出行大多分布在周邊省份與東南沿海地區,西北部地區的出行流向較少。2015—2018年航空出行流向如圖5所示,可以發現2015—2018 年期間該地區的航空出行流在逐漸增加,旅客出行所覆蓋的范圍逐漸增加,航空網絡平均強度的增長反映了這一事實;與鐵路出行不同,航空出行中旅客的出行地點更為分散,西北地區也有明顯的出行流向。

圖4 2015—2018年鐵路出行流向Fig.4 Railway travel flow from 2015 to 2018

圖5 2015—2018年航空出行流向Fig.5 Airline travel flow from 2015 to 2018

結合出行網絡的拓撲特征和出行流向,可以發現成都市鐵路出行的網絡結構已經趨于穩定,鐵路出行人群的出行流向已經固定。而航空出行的網絡結構經歷一定的發展后也逐步趨于穩定。鐵路出行網絡中的出行流向大多集中于我國東南部發達地區和周圍地區,而航空出行網絡中的出行流向相較于鐵路出行更為分散。

4 RRTN和RATN效率分析

4.1 基于節點隨機失效的效率分析

隨機失效下的RRTN 和RATN 的效率分析過程如下。隨機從網絡中移除站點和對應的連邊,重新計算網絡效率,直到網絡中節點被全部移除。對2種網絡進行20次重復移除過程,得到2種網絡效率的平均變化率,基于隨機失效的RRTN 和RATN 效率變化如圖6 所示。圖6a 表示RRTN 效率的變化,可以看到不同年份的網絡效率變化趨勢類似,網絡中大部分節點對整體出行的影響很小,并且當節點移除數量超過1 200 時,網絡效率有大幅提高。不同年份中,2018年網絡效率存在最大值,說明2018年鐵路旅客更多出行在小范圍網絡中。圖6b 所示RATN效率的變化具有類似特征。

圖6 基于隨機失效的RRTN和RATN效率變化Fig.6 Efficiency change of RRTN and RATN based on random failure

4.2 基于節點蓄意破壞的效率分析

基于網絡中節點介數中心性的計算,按照計算結果從大到小的順序移除對應站點,直至網絡中不存在節點?;谛钜馄茐牡腞RTN 和RATN 效率變化如圖7所示。蓄意破壞下,中樞節點被最早移除,網絡連通性受到極大影響,網絡效率逐漸降低至0,但在圖7a中,2016和2018年的RRTN中,當網絡中大多數節點被移除后,網絡效率有部分提高,說明這2年鐵路旅客出行中可能存在特定地區的出行。

圖7 基于蓄意破壞的RRTN和RATN效率變化Fig.7 Efficiency change of RRTN and RATN based on intentional destruction

5 結束語

研究設計基于模體的旅客出行特征識別方法,對成都市旅客的出行特征進行有效抽取,發現鐵路和航空旅客的出行特征相較日常出行較為簡單,鐵路對旅客的吸引力逐年增大。通過觀察網絡中出行人口的出行流向,分析旅客出行的流動規律,鐵路出行人口的流向較為穩定,東南部地區流向較多,西北部較少;航空出行人口的流向逐漸發展并趨于穩定,出行流向不斷向外擴展,出行流向較為分散。2 種網絡的效率一般,只在一定的區域內流動性較好。研究從模體識別和復雜網絡角度出發,對了解人口出行特征有重要意義。此外,研究僅使用了基礎的拓撲特征和網絡效率分析方法,對于出行網絡的其他特征還有待進一步討論。

猜你喜歡
模體站點旅客
非常旅客意見簿
基于Matrix Profile的時間序列變長模體挖掘
基于Web站點的SQL注入分析與防范
2017~2018年冬季西北地區某站點流感流行特征分析
植入(l, d)模體發現若干算法的實現與比較
我是人
基于網絡模體特征攻擊的網絡抗毀性研究
首屆歐洲自行車共享站點協商會召開
怕被人認出
給小旅客的禮物
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合