?

鐵路客票系統中大數據技術應用探析

2024-04-06 12:49顧浩
電腦知識與技術 2024年3期
關鍵詞:數據分析大數據鐵路

顧浩

關鍵詞:鐵路;大數據;數據分析;信息化;數據應用

中圖分類號:TP391 文獻標識碼:A

文章編號:1009-3044(2024)03-0069-03

0 引言

隨著我國高鐵行業的快速發展,高鐵建設逐步邁向國際市場,作為我國立于世界之林的一張明信片,不斷地完善高鐵系統,推廣我國高鐵事業發展,是至關重要的。依靠信息化的高速發展,鐵路系統可與旅客數據管理平臺、公安系統、機場、汽車站、港口等交通系統以及智慧城市相關系統對接[1],為旅客提供全面、便捷、安全、可靠的出行服務。我國高鐵建設基本已覆蓋100萬人口以上城市,由此可以看出,采用鐵路出行的旅客較多,客流量占公共出行的比例較大,高鐵作為旅客出行的交通方式之一,從售票、進站、檢票、乘車、離站等過程,會產生大量的數據,面對所產生的海量數據,采集、存儲、加工、分析、應用等方面是亟待解決的問題。以客票系統產生的數據為例,本文從數據采集到應用過程進行探析,并對鐵路數據管理系統進行簡述,提出建議及意見,合理地開發鐵路旅客產生的數據信息,更好地為旅客出行服務。

1 大數據

1.1 大數據概述

大數據是近年來信息技術領域的一大熱門話題。它指的是那些數據量巨大、類型多樣、處理速度快,且具有較高價值的數據集合。隨著數字化時代的到來,大數據的應用場景越來越廣泛,對各行各業的發展產生了深遠的影響。個人計算機的普及,數據量開始呈現爆炸式增長。物聯網、云技術、分布式處理、存儲技術等領域的突破,推動了大數據技術的發展。同樣在鐵路行業高速發展過程中,旅客每年出行的數量巨大,因此對所產生的巨量信息的加工處理存儲等均需進一步探討。對于鐵路旅客出行所涉及大數據的應用價值主要體現在以下幾個方面:

1) 它能夠幫助鐵路單位更好地了解客戶需求,預測市場趨勢,從而制定更加精準的服務。

2) 大數據分析能夠提高鐵路行業的運營效率,減少不必要的成本。

3) 大數據還能幫助鐵路實現智慧出行,提高旅客出行的滿意度。

隨著大數據技術的發展,同樣面臨著一些挑戰,對于數據信息的有效存儲和檢索,數據隱私及安全的保障,海量數據信息的提取加工利用等,這些都是大數據技術需要解決的問題。

1.2 鐵路行業大數據

鐵路行業高速發展,旅客出行數據量呈倍數增長,產生了一系列與旅客出行相關的數據。IBM公司提出大數據的5V 特征:Volume(大量)、Variety(多樣)、Veracity(真實性)、Value(價值)、Velocity(高速),這些特征在大數據的發展中不斷被印證。

鐵路行業在數據獲取過程中,大多是大量的、分散的、片段化的、相對獨立的、雜亂無章的,僅從單一的數據信息無法推斷出信息背后的緣由,這種情況下形成了數據孤島,為打破這種數據孤島問題,則需要對數據進行統一管理,找出相互關聯的數據信息,進行對比判斷,經過人工或計算機分析,得出數據背后的本質信息,將獲取的結果應用于現實生活中。

2 客票系統

鐵路行業的旅客出行產生了大量數據,并且獲取數據信息的途徑較多,主要包含客票系統、旅服系統、辦公系統等,本文以客票系統獲取數據為例加以闡述。

目前,鐵路客票系統主要分為車站級、路局級和鐵路總公司三個級別,旅客數據信息獲取主要從車站前端設備進行采集??推毕到y常見的前端設備主要包括:窗口售票機、自動售取票機、網絡售票設備(手機)、實名制閘機、檢票閘機、手持檢票機、人工檢票等。每一級均可設置旅客數據管理平臺,但所獲取、存儲、分析的數據量不同。車站級主要獲取本站旅客相關數據,路局級主要獲取分析該局內包含所有車站內客票相關的數據信息,鐵路總公司則對全國鐵路旅客客票信息進行把控。根據不同級別的數據信息,分析得出的結論所應用場景也各不相同。

3 數據處理流程

圖2為數據處理流程示意圖。

3.1 數據采集

客票數據是指與旅客售檢票相關的系統所能獲取的各種數據信息集合。通過上述所說的客票系統前端設備,對旅客身份及出行信息進行收集,可以為存儲、處理、分析、應用數據信息打下良好的基礎,客票系統中每個前端設備均有不同的功能。

售票機:包含全功能自動售票機、非現金自動售票機、自動取票機、退票機、窗口售票機等一系列與售取退票相關的設備,隨著電子客票的推廣,以及第三方支付的成熟,人們對于現金的使用量逐漸減少,因此售票機中紙幣的功能不斷弱化,取而代之的是電子支付方式。

未來對于旅客購票信息的采集都將有新的改革。

檢票機:包含實名制自動檢票機、電子客票自動檢票機、手持檢票機。實名制自動檢票機是用于旅客進入候車廳的第一道屏障,對旅客的車票、人臉、二維碼等信息進行識別,核驗旅客是否購票,車票信息與本人是否一致,乘車時間是否在規定的時間內進站候車等。電子客票自動檢票機則是對已候車旅客所購買的車票與所要乘車的車次進行比對,確保旅客不會因一些特殊的原因乘錯車次。手持檢票機是車站人員利用手持終端對旅客的車票及身份信息進行核驗,可進行移動檢票。

通過前端設備內的傳感器,對旅客身份、車票等信息進行識別,利用鐵路內專用客票網絡傳輸所采集的信息,發送至票務數據庫進行存儲。

3.2 數據存儲

數據信息的存儲主要經歷了三個階段:傳統的信息存儲、計算機信息存儲、網絡信息存儲。傳統的信息存儲方式大多通過數字、文字和圖像存儲在紙質介質中,這種方式存量大、保存周期長,但是傳送信息速度慢,查詢檢索也不方便。計算機信息存儲方式是將信息存儲在硬盤、光盤等介質中,存取速度極快,存儲的數據量較大,但與網絡隔絕,因此異地查詢效率也有待提高。網絡信息的存儲方式是將傳統的數據庫向分布式數據庫轉型,具備了傳統數據存儲及計算機信息存儲兩種方式的優點,使得用戶在查詢檢索方面的應用更加高效便捷。

對于海量的旅客數據信息,可采用分布式存儲方式,hadoop作為行業內十分優秀的分布式存儲系統。其核心部分主要是HDFS(存儲系統)和MapReduce (計算框架)。將客票信息通過M/R作業切分成若干個獨立的信息塊,由Map任務以完全并行的方式處理??蚣軙ap的輸出先進行排序,然后把結果輸入給Reduce任務,作業的輸入和輸出數據都會被存儲在HDFS中,整個框架負責任務的調度和監控以及失敗任務的重新執行。對于存儲后的信息可通過ETL 將數據經過抽?。‥xtract) 、清洗轉換(Transform) 之后加載(Load) 到數據倉庫的過程,目的是將企業中的分散、零亂、標準不統一的數據整合到一起,對這些數據信息特征進行判斷分析,為客票數據信息決策提供依據[2]。

3.3 數據分析

數據分析是將上述存儲于數據倉庫中的數據進行算法分析。hdfs用于存儲大型數據,hive提供結構化數據,spark提供集群計算,然后spark SQL或者Py?thon調用spark進行計算。算法由Python或其他語言進行提供,計算后的結果再存儲于其他的數據庫中,由報表或者圖形化頁面進行展示,也可以供應用分析進行使用[3]。

以Python為例,利用Python對結構化數據庫中的數據信息進行數據分析,通常采用pandas、numpy和natplotlib.pyplot等模塊進行數據分析,如圖3所示。

利用Python對數據進行分析,首先,導入pandas、numpy、math等模塊,通過mean()函數求得平均值,var()函數求得方差,std()函數求得標準差。至于獲取數據中的最大最小值則更為簡單,將數據存儲到list數據中,直接利用max(list)獲取最大值,min(list)獲取最小值。通過對這些數據的分析,可得出不同的結論。例如:可以分析不同天數相同時段旅客的數量或是同一天不同時段旅客的數量,也可以分析同一車次在不同時間段旅客乘車的數量等信息等。

3.4 可視化展示

科學計算可視化的誕生為數據可視化奠定了重要基礎[4]??茖W計算可視化實現把計算過程中所涉及的和所產生的數字信息轉變為直觀的,以圖像或圖形信息為表示方式,隨著時間和空間變化的物理現象或物理量呈現在研究者面前,使他們能觀察到基礎模型,即看到傳統意義上不可見的事物或現象,同時還提供與模擬和計算的視覺交互手段[5]。簡而言之,常規的數據可視化則是對數據進行聚類、歸類、離散等方式進行處理,通過柱形圖、餅圖、條形圖、折線圖、散點圖等方式將數據信息進行展現,使得數據更加直觀地展現在用戶面前,用戶根據以往的經驗對圖形及數據信息分析,以此對旅客出行目的進行判斷,最終對提高旅客出行滿意度做決策。

數據分析也為數據可視化、直觀化打下了很好的基礎。通過Python 中Matplotlib 模塊進行數據可視化,導入matplotlib.pyplot模塊,通過read_csv()函數讀取需要進行處理的數據文件,將數據文件中的內容顯示出來。通過subplots 獲取坐標系,通過bar(name,value)方法,傳入橫坐標名稱和值,生成柱狀圖,scatter()生成散點圖,plot()生成折線圖等。最后使用plt.show()方法展示圖像。

4 客票數據信息實際應用

4.1 車站級客票數據信息

面對車站級的海量數據,通過數據分析,可以對旅客、車站工作人員、車站產品的應用等實現資源的合理分配。

對于旅客購買車票信息的顯示,為決策者呈現對應時間段,對應車次旅客的數量,挖掘圖表所包含的信息,一方面做到為旅客合理安排進站時間和候車區域,另一方面判斷旅客所需檢票的時間節點,提前或延遲開放檢票口,做到在規定的時間內完成對旅客檢票工作。

為滿足旅客的服務需求,同樣可以通過購票信息的反饋,對車站工作人員進行合理的人員安排,盡量做到優化人力資源配置。在旅客眾多的候車區域安排較多的工作人員做引導,減少該區域可能產生的候車問題。通過對車站工作人員的管理,合理安排工作時間、休息時間,在提高旅客出行服務滿意度的同時,增強車站工作人員的忠誠度。

車站新產品的投入使用,大多是為滿足車站現場需求而研發應用的。近年來檢票閘機的大規模投入使用,在減少車站工作人員的工作量同時,也提高了旅客出行效率。從紙質車票到電子車票,都在實現資源最優化配置。因此通過車站級的數據分析,推進車站信息化的建設,提高旅客出行的舒適度。

4.2 路局級客票數據信息

我國共有18個鐵路局,不同的車站歸屬不同的路局管理,不同的鐵路線路以及車站的分散情況也各不相同。通過分析路局內各車站旅客出行信息,一方面可以對各車站客流量情況進行判斷,緩解線路方面的客流壓力,合理安排列車時間表,優化該鐵路局內資源配置。另一方面可以將數據上傳至鐵路總公司級別,為國家鐵路信息化的建設提供基礎數據,起到承上啟下的作用。

4.3 鐵路總公司客票數據信息

鐵路總公司管理著全國所有旅客出行的數據以及購買車票信息,通過對這些信息的收集、存儲、加工、處理,統籌規劃我國鐵路行業的建設與發展,增強鐵路信息化程度,提高城市建設繁華程度以及人民的生活水平等。通過數據挖掘、大數據分析,找尋旅客出行相對較少的省、市,發掘潛在影響因素,推動該地區鐵路建設,最終達到提升出行效率,提高生活質量的目的。

5 總結

我國作為崛起的大國,城市信息化的建設仍需不斷進行。數據的獲取至最終的應用都體現著一個城市乃至一個國家信息化進程,信息化從依附于農業、工業、第三產業到現在已發展為獨立的信息化產業,從軍用到民用,信息化都在擴大對各行各業的影響,國際局勢中信息化的不斷發展反映著信息化是不可逆轉的趨勢。目前發達國家已處于信息源核心,我國正處于吸收信息階段,為了盡快追趕發達國家的步伐,我國需要規劃信息化戰略,結合我國實際情況,將理論與實踐相結合,最終在信息化的道路上走出一片天地。

【通聯編輯:唐一東】

猜你喜歡
數據分析大數據鐵路
沿著中老鐵路一路向南
鐵路通信線路維護體制改革探索與實踐
新常態下集團公司內部審計工作研究
淺析大數據時代對企業營銷模式的影響
基于大數據背景下的智慧城市建設研究
無人機在鐵路工程建設中的應用與思考
GSM-R在鐵路通信中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合