?

基于云計算的城市軌道交通數據可視化方法及案例研究

2021-02-25 07:48曹惠茹成海秀劉永鑫陳鳳宜詹錫隆
計算機應用與軟件 2021年2期
關鍵詞:客流量預處理客流

曹惠茹 成海秀 劉永鑫 陳鳳宜 詹錫隆

1(廣州工程技術職業學院信息工程學院 廣東 廣州 510075)2(華南理工大學計算機科學與工程學院 廣東 廣州 510006)3(深圳大學計算機與軟件學院 廣東 深圳 518060)4(中山大學南方學院 廣東 廣州 510970)

0 引 言

隨著城市規模的不斷增加,城市軌道交通成為越來越多城市居民出行的首選[1-3]。運用云計算、大數據等信息技術對城市軌道交通客流量的數據進行分析,研究城市軌道交通客流量變化態勢成為當前研究的熱點。以此為依據對規劃城市軌道交通進行建設與運營,不僅會降低城市軌道交通建設與運維成本,而且為城市居民的出行帶來更多便利[4-6]。城市軌道交通客流的數據可視化,成為上述工作的關鍵步驟之一。因此,對城市軌道交通客流進行可視化研究是城市軌道交通數據分析的重要環節,具有重要意義。

針對城市交通數據可視化問題,國內外從不同的層面展開相關研究。文獻[7]設計了一種基于GPS的出租車軌跡數據的三維動態可視化方法,建立了基于時空雙重控制的粒子系統,構建了城市大尺度三維場景中GPS軌跡的模擬移動模型。文獻[8]為解決公共自行車數據可視化系統的性能問題,整合Web服務器集群、數據庫集群、緩存框架服務器的集群架構,構建基于該架構的公共自行車數據可視化系統。文獻[9]先后采用數據預處理、匹配技術、聚集計算等將車輛運行狀態轉化為道路通行信息,實現公路交通的數據可視化。文獻[10]分析了珠三角地區公交系統位置數據丟失的空間分布特征,然后采用數據可視化技術對目標城市的交通數據進行了數據可視化,證明所提方法可以有效地提高數據質量。文獻[11]使用快速增量模型樹漂移檢測方法來分析和預測英國交通人流量,同時在所開發的預測系統的基礎上,將生成的傳感器點內的交通流狀態預測在真實的地圖仿真中可視化。上述文獻對交通層面的數據可視化進行了研究,然而針對城市軌道交通票卡數據流可視化研究偏少。同時城市軌道交通數據存在數據量巨大、種類繁多、數據實時性高等特點,對數據可視化提出新的挑戰與要求[12-13]。

針對城市軌道交通數據的特點和城市軌道交通客流量新挑戰,本文提出基于云計算的城市軌道交通客流量數據可視化解決方案。將城市軌道交通客流數據按時間段進行分表處理、建立索引數據集合;刪除冗余、錯誤數據實現對數據篩選和清洗處理;對城市軌道交通客流數據進行了可視化設計;以目標城市為例,對可視化系統進行了驗證,并對客流規律進行了分析。

1 基于云計算的城市軌道交通數據系統框架

云計算采用簡化接口,將海量計算任務通過通信網絡分發到多個并行計算機上進行處理,以提高數據處理的實時性[3,14-15]。用戶訪問分布式服務器可以減小延時,增強訪問的實時性。為此,本文設計了如圖1所示的基于云計算與數據存儲的城市軌道交通客流數據系統框架。該框架主要包括用戶端、云服務器、管理中心三個模塊。用戶端是指訪問城市軌道交通數據庫移動端,主要以出行的客流人群為主體。云服務器用于處理、存儲城市軌道交通數據,具體分為客戶、中心數據存儲和計算三種類型的服務器。管理中心主要負責對整個系統的管理和運維。首先,為降低網絡安全風險,保護核心數據,采用中心服務器和客戶服務器模式完成用戶端的數據訪問。其次,以用戶提供高效的數據訪問服務為目標,在城市不同位置部署客戶服務器,采用高速網絡與中心數據服務器建立高效連接,進而構建高效的分布式客戶服務器集群。

圖1 基于云計算服務器的城市軌道交通數據系統框架

(1)

從數據流的角度,基于云服務器城市軌道交通數據系統總的工作過程,可以從數據上傳和下發進行描述。首先,城市軌道交通系統通過相應的裝置,收集用戶出行信息,并通過通信網絡將數據上傳至本地客戶服務器。本地服務器周期性地將數據傳輸給中心數據存儲服務器,進而完成數據上傳。其次,當用戶需要訪問相關交通數據時,客戶服務器從中心數據服務器訪問相關數據,并在本地進行數據備份存儲,然后將用戶需要數據下發至用戶端,進而完成數據的下發。

2 軌道交通數據處理與可視化設計

2.1 系統概述

本系統主要用于對城市軌道交通客流量的可視化,方便對城市軌道交通客流量的各類數據進行分析,直觀地分析出數據蘊含的規律。圖2為城市軌道交通數據可視化總體設計過程??傮w上來講,該過程分為原始數據讀取、數據預處理、數據可視化三個主要步驟。

圖2 系統設計過程

2.2 數據預處理

數據預處理與數據可視化是該系統重要模塊。從數據存儲服務器中讀取的原始數據,為不同人群(ID)的刷卡時間(h)和進出站點記錄(data),其數據字段包括站點信息、消費人群、出入站點時間、乘車次數等關鍵性數據信息。在數據預處理階段要對原始數據進行數據清洗,并且轉換成JSON格式進而實現數據的可視化。根據數據特性,從多層次、多角度分析設計最終以Web頁面形式進行效果展示。

在數據預處理層面,針對城市交通原始數據會存在缺失值、重復值等問題,在使用之前需要進行數據預處理。數據預處理沒有標準的流程,通常針對任務和數據集屬性的不同而不同。數據預處理的常用流程為:去除唯一屬性,處理缺失值,屬性編碼,數據標準化正則化,特征選擇,主成分分析。如圖3所示,針對城市城軌交通數據的特點,采用如下所述的步驟進行數據預處理。

圖3 數據預處理過程

不失一般性,記數據集合為D={d1,d2,…,dn},數據di={ID,datai,hi}。首先刪除缺失值、重復值的數據,數學描述如下:

(2)

式中:i≠j∈n。然后,按照讀取數據ID,按時間為單位對數據進行分表處理,并建立索引。記datai={ds1,ds2,…,dsm}即數據di信息datai包含m個字段,DS為所需信息字段。將需要用到的DS包含在索引中,查詢時只返回所需的字段,將不需要字段進行查詢并且刪除,從而實現對數據預處理。其數學描述如下:

datai=datai-dsjdsj∈DS,i∈m

(3)

2.3 數據可視化設計

城市軌道交通數據可視化是該系統的最后環節,直接面對用戶端。通過對數據不同角度的分析和展示,以數據可視化形式展示了各種客流信息,進而為用戶出行、城市軌道交通管理等提供參考依據。

圖4為城市軌道交通數據可視化過程示意圖??傮w來講,該過程可以分為數據檢索、數據統計、數據圖形內核調用、數據展示等步驟。具體來說,其關鍵步驟描述如下:

圖4 數據可視化過程

Step1計算服務器根據可視化目標的具體要求,從數據存儲服務器中讀取與該目標相關,并通過預處理后的完整數據集。

Step2以可視化目標為出發點,采用數據ID為關鍵字對統計數據關鍵信息進行檢索。

Step3完成上述步驟,建立檢索結果表,并進行結果存儲。

Step4基于數學統計方法,調用ECharts統計模塊內核,完成對客流關鍵信息的數據統計。

Step5根據Step4的統計結果,建立統計客流數據與可視化圖形之間的映射關系。

Step6調用ECharts中相應圖形的內核模塊,按照不同統計結果,最終完成城市軌道交通數據可視化。

3 應用案例與分析

3.1 城市軌道交通數據案例實現

以南方某城市軌道交通數據為案例,采用第2節所述方案進行了數據可視化實現。數據集為該城市2015年1月至2月的9條地鐵線路乘客上下站點共計750 000條數據。對該數據集合進行清洗后以小時為單位對數據進行分表處理,進而建立客流小時統計表。然后對處理后的表進行格式轉化,形成適合ECharts的JSON數據格式。最后,以客流站點熱力圖和統計客流量為目標進行可視化。

該案例的城市軌道交通數據可視化系統提供總覽、線路對比和單線統計三種模式??傆[模式采用地理數據可視化的熱力圖形式呈現所有站點的客流信息。首先以時間單位統計各個線路、站點客流量,利用不同的明亮程度表示各個站點不同路段擁堵程度(稀疏/正常/擁擠),如圖5所示。在多線路對比模式下,在單位時間內對多條城市軌道交通線路的數據進行統計,然后采用柱狀圖的形式呈現不同線路的客流量。單線統計模式下,分別呈現選中線路各種客流量信息,其中包括該線路客流類型、各換乘站點日客流量、早晚高峰Top5出站點、一周內客流量變化等方面的信息。

圖5 城市軌道交通客流量可視化系統界面

3.2 基于數據可視化的城市軌道客流分析

圖6展示了城市軌道交通客流量在各個站點分布情況。用熱力圖來展示不同站點在一段時間內的總體客流量,從暗到亮來表示客流量密集程度,灰色表示客流量較小,亮的區域表示客流量較大。同時可將地圖進行放大和縮小,從整體到局部了解不同站點的客流量的分布情況??梢钥闯?,分布在商業密集區或居民區站點的客流較大。

圖6 城市軌道交通客流量熱力圖

客流量高峰期的計算定義:早高峰時間為上午7點至9點,晚高峰時間為下午5點至7點半。因此將客流量數據按小時進行分類,提取各換乘站點與早、晚高峰熱門站點數據并轉換成JSON格式,進而以圖形化形式展示出來,如圖7所示。從早、晚高峰客流量餅形圖可以看出,早高峰站點1、3、4為前三,晚高峰時站點1、站點3客流量依然較大,而第三熱門站點則由站點5替代早高峰的站點4;而從換乘站點日客流量情況可以看出,左上方柱狀表示日客流量在60 000以下的站點,而左下方柱狀則為日客流量60 000以上的站點,且站點R和站點S為日流量最大的兩個站點。因此,根據早、晚高峰以及各換乘站點日客流量情況分析,可合理調配相關工作人員以應對突發事故的處理。

圖7 城市軌道交通熱門換乘站點和早晚高峰熱門出站點

圖8為一號線各站點平時客流與高峰期客流的對比,可以看出,同一線路時高峰期的客流量明顯高于平時的客流量,尤其突出表現在站點9、站點14、站點15、站點16。通過圖中右上角下拉三角位置還可以選擇查看不同線路的平時客流量與高峰期客流量的對比圖。而上述站點均為換乘站點,說明換乘站點的客流量較大。

圖8 城市軌道交通同一線路不同站點對比圖

4 結 語

本文以大數據環境下的城市軌道交通票卡數據流實時客流態勢圖的可視化為研究對象,基于云計算平臺提供了一種城市軌道交通大數據可視化分析方法,搭建了實用化的應用平臺并提供南方某城市應用案例。首先,基于云計算構建了城市軌道交通數據系統框架。其次,將城市軌道交通客流數據按時間段進行分表處理、建立索引數據集合,刪除冗余、錯誤數據,實現對數據篩選和清洗處理。最后,以目標城市為案例構建了城市軌道交通數據可視化終端,同時分析了城市軌道交通客流規律。實驗結果表明,該數據可視化方法的可行性高,同時表明分布在商業密集區或居民區站點、換乘站點、早晚高峰的客流較大。該研究為城市軌道交通的規劃和列車運營提供了可靠的依據,通過交通狀態的判別, 減緩交通壓力,均衡交通量分布, 從而提高城市軌道交通路網的利用效率和安全性。

猜你喜歡
客流量預處理客流
預處理對醫用外科口罩用熔噴布顆粒過濾性能的影響
手術器械預處理在手術室的應用
污泥預處理-厭氧消化體系的能源經濟性評價
基于數據挖掘的景區客流量預測模型研究
城市軌道交通節假日期間大客流行車組織思考與實踐
基于大小交路套跑對地鐵不均衡客流的可靠性分析
污泥預處理及其在硅酸鹽制品中的運用
地鐵開,玩起來
基于灰色預測理論在交通樞紐客流量的實際應用
基于灰色預測理論在交通樞紐客流量的實際應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合