?

基于BP神經網絡的公交站點短期客流量預測研究與應用

2022-07-06 08:15張衛榮王英存王金鳳
現代信息科技 2022年3期
關鍵詞:客流量BP神經網絡公共交通

張衛榮 王英存 王金鳳

摘? 要:該項目依托濰坊市科技發展計劃項目,對該市部分運營公共汽車連續一個月的用戶消費記錄和車輛GPS數據進行研究,并充分考慮了節假日、天氣變化等因素對客流量的影響,旨在建立一套公交站點客流量預測模型并將其應用于智能公交管理系統,從而有效預測客流量爆發點和未來各個時段客流量走勢,為線路網絡規劃和公交車站的設置提供科學依據,其應用價值尤其體現在提高乘客出行體驗和優化公交管理流程方面。

關鍵詞:BP神經網絡;公共交通;客流量;預測

中圖分類號:TP18? ? ? ? ? 文獻標識碼:A文章編號:2096-4706(2022)03-0067-04

Research and Application of Short-Term Passenger Flow Prediction of Bus Stations Based on BP Neural Network

ZHANG Weirong, WANG Yingcun, WANG Jinfeng

(Weifang Vocational College, Weifang? 262737, China)

Abstract: Relying on Weifang City science and technology development plan project, this project studies the user consumption records and vehicle GPS data of some operating buses in the city for one month in a row, and fully considers the impact of holidays, weather changes and other factors on passenger flow, aiming to establish a set of passenger flow prediction model of bus stations and apply it to intelligent public transportation management system, so as to effectively predict the breakout point of passenger flow and the trend of passenger flow in various periods in the future, and provide scientific basis for line network planning and the setting of bus stations. Its application value is especially reflected in the aspects of improving passenger travel experience and optimizing the public transportation management process.

Keywords: BP neural network; public transportation; passenger flow; prediction

0? 引? 言

傳統公交系統核心功能在于公交信息管理,制定公交調度策略時常根據人工調查方式。人工調查耗費成本較大且樣本有限,無法全面準確地掌握公交乘客出行規律。隨著物聯網、大數據等新一代信息技術的發展,大量車載終端、路邊檢測設備源源不斷的自動反饋海量實時動態公交數據。公交企業僅僅利用傳統數據處理方法對這些變化快、覆蓋面廣、隱藏價值高的海量公交數據進行淺層挖掘是不能真正實現公交線路優化和客流量引導的。

本項目設計和改進的BP神經網絡算法對未來客流量進行預測,有效預測客流量爆發點和未來各個時段客流量的走勢,為公交運力分配策略提供數據支持。系統充分考慮了節假日、天氣變化等因素對客流量的影響,能夠提高對于特殊節日和天氣影響下的客流預測精度。以期實現公交企業對公共交通資源的科學調度和客流量引導進而為乘客提供個性化服務。

1? 相關理論基礎

1.1? 特征工程

雖然特征工程既耗時又費力,但也是整個機器學習系列任務中最不可缺失的。原始數據必然包括大量噪聲和冗余,特征工程的目的就是在最大限度保留原始數據內在規律的前提下通過更高效的特征表示減少數據不確定因素,便于后續計算。具體的特征工程實現步驟為:首先,數據清洗是將原始數據的異常數據進行清除,對于可以通過觀察就能發現的異常值可以直接舍棄,另外還有一些算法和公式可以對異常值進行判斷。其次,數據預處理是缺失值處理、歸一化、特征編碼等過程的總稱,能夠簡化冗余信息。再次,特征選擇能夠保證機器學習的算法輸入是有意義,進而保證模型訓練的有效性。最后,如果特征選擇產生的特征矩陣過大,需要進行降維處理以減少計算量,降低計算時間。常用的降維方法有主成分分析法(PCA)和線性判別分析(LDA)等。

1.2? 神經網絡

從人工智能的角度看,具有非線性激活函數的神經元是神經網絡的基本單元,將大量神經元進行連接就形成了一個高度非線性的模型,神經元之間的連接需要進行加權,權重的確定可以通過梯度下降等方法不斷訓練。神經網絡模型的訓練過程就是根據數據確定權重和每個神經元閾值的過程。

設a表示神經元的活性值,z表示神經元輸入,f(·)為激活函數,是一個簡單的連續可導的非線性函數,可以增強神經網絡的表示能力和學習能力。則,

設神經元接收輸入個數為d,表示輸入,表示權重,b為常量。則,

很多結構簡單的神經元通過協作連接形成一個神經網絡,可以實現復雜的功能。前饋網絡由輸入層、隱藏層、輸出層組成,神經元之間不存在同層連接和跨層連接。輸入層接收由向量或者向量序列表示的外界輸入,隱藏層可以有多層并實現信息加工,輸出層輸出結果。前饋網絡是一個有向無環路圖,前饋網絡信息向前朝一個方向傳播,可以通過簡單的非線性函數多次擬合實現,其結構單一,比較容易實現,包括全連接前饋網絡和卷積神經網絡等。

2? 實現過程

2.1? 數據采集

目前,濰坊市共有公交線路99條,其中市區線路80條,郊區線路13條,城際線路(指濰坊市轄縣級市間線路)6條。濰坊市主城區共有公交車1 497輛,公交年客運量11 653.4萬人次。本項目通過公交車輛的GPS監控設備和刷卡支付設備實現對部分運營公交車輛連續一個月的車輛GPS數據和用戶消費數據的自動采集,共計1 400萬余條記錄。

獲取數據后首先進行數據清洗去除異常值,在數據清洗后,通過車輛GPS數據與用戶刷卡數據的線路編號、車輛編號和時間等字段進行關聯匹配,將用戶數據補充了上車站點名稱、站點編號、線路方向等相關信息。由于公交車只采取乘客上車單次刷卡模式,為判斷出下車站點的位置,項目組主要利用了刷卡人公交出行對稱特征。對于多次刷卡的乘客則假設在連續的兩次刷卡記錄中,后一次刷卡記錄的上車站點是上一次出行的下車站點。數據采集篩選策略如圖1所示。

濰坊市全天公交出行總次數約為14萬人次,常規人工調查抽樣率一般為3%。而基于上述有效數據篩選策略,項目組獲取的有效用戶公交出行OD記錄約3萬條,數據采集手段采樣率大于20%并遠高于常規手段。

2.2? 特征選擇

原始數據清洗后,需要整理公交線路信息、站點信息、乘客消費信息。對缺失值進行填充并除去重復值,如站點名稱可以用站點編號代替,那我們僅保留站點編號即可,然后使用pandas和matplotlib查看各類數據及其特征。根據生活經驗可以歸納出,節假日、天氣、線路類型、卡類型可能影響客流量,而這些因素又會影響短時公交站點客流量預測結果,進一步我們可以進行實際分析。設計日統計和小時算法,按每日和每小時統計客流量,可以肯定,工作日大致相同,每天早晚各有一個客流量高峰,周末客流量有所下降,且周末早晚高峰不明顯。

分析天氣特征對客流量產生的影響。為了方便后續計算,使用天氣特征。首先對降雨狀況、風向、風力、氣溫進行數據標注,計算各個特征與客流量的相關系數,即特定數據與客流量的協方差與特定數據標準差*客流量標準差的商。結果表明,氣溫與客流量呈負相關;風力與客流量呈正相關;風向與客流量不相關;在不考慮節假日和出行人群類型的情況下,降雨狀況與客流量相關性不大,但我們還是將降雨狀況作為一種輸入特征進行后續計算。

根據給定的輸入參數:INPUT[日期(eg:20200901),時段(eg:8),節假日情況(周末or其他節假日)天氣情況(降雨),最高溫度,風力]。輸出未來客流量的預測值:OUTPUT[Passenger_flow/h]。數據包括客流量歷史數據、天氣數據、節假日數據。提取7維特征值。

2.3? 模型搭建

我們選用BP神經網絡(Back Propagation Network)即誤差反向傳播神經網絡作為模型。BP算法可以優化多層前向神經網絡的權系數,其本質是按照誤差函數的負梯度方向采用非線性規劃的快速下降方法修改權系數,BP神經網絡結構如圖2所示。

給定訓練集,,d為輸入層數據特征個數,l為輸出層神經元個數,隱層神經元個數為q,輸出層第j個神經元閾值為θj,隱層第h個神經元閾值為γh,xi與bh之間的連接權值為vih,bh與yj之間的連接權值為ωhj。設bh輸入為,yj輸入為。

假設隱層和輸出層激活函數為Sigmoid函數,則:

函數兩側求導,則:

f′(x)=f(x)(1-f(x))

假設訓練例(xk,yk)的輸出為,則:

均方誤差為:

對上式求βj的偏導數即為輸出層神經元的梯度項,設為gj,則:

類似可得隱層神經元的梯度項eh:

基于梯度下降策略的BP算法調整參數是以目標負梯度為方向,對于誤差Ek,設學習率為μ,則有ωhj的更新:

,,

最后得到:

同理可得

,

BP算法具體流程為:

輸入:訓練集,驗證集Ⅴ,學習率μ,正則化系數λ,網絡層數L,神經元數量m(1),1≤l≤L.

隨機初始化權值W,閾值b;

repeat

對訓練集D中的樣本隨機重排序;

for n=1……N do

從訓練集D中選取樣本;

前饋計算每層凈輸入直到最后一層;

計算輸出層神經元的梯度項gj;

計算隱層神經元的梯度項eh;

反向傳播計算每層的誤差,更新連接權ωhj與閾值θj,?γh;

end

until 神經網絡模型在驗證集Ⅴ上的錯誤率不再下降;

輸出:連接權與閾值確定的多層前饋神經網絡

模型網絡采用7維的特征值向量作為輸入參數,兩層64節點的隱含層,隱含層采用“sigmod”激活函數,輸出層是1維的客流量數值。

將數據分為n個集合,其中測試集1個,訓練集n-1個。為防止一次訓練產生的過擬合,通過構造交叉檢驗的模型計算模型平均得分,評價模型綜合情況。

2.4? 預測效果

使用訓練集訓練模型,并可以定義輸出每小時客流量的訓練值與實際值,輸出單條線路節假日每小時客流量預測數據,輸出單條線路工作日每小時客流量預測數據。

通過對濰坊市公交客流量數據分析發現,客流量受到節假日、天氣等因素的影響。本項目綜合考慮上述因素,建立公交客流量預測模型。結果表明,本預測模型能夠有效地應用于公交站點的客流量預測情景。

3? 應用效果

JeeSite是基于多個優秀開源項目的高性能JavaEE快速開發平臺,后端整合了Spring框架和MyBatis/Hibernate框架,實現了系統業務邏輯和數據持久層訪問操作;前端以BootStrap為基礎。本項目設計實現了公交站點客流量短時預測并基于JeeSite進行模型部署,用戶輸入線路、時間、天氣、溫度系統就可以直觀的展示客流量預測曲線,如圖3所示。

客流量可視化界面能夠對不同站點和系統總體客流量進行分析,更主要的是針對不同公交線路實現了日客流量統計折線圖。用戶輸入或選擇日期、天氣、氣溫等影響客流量預測的條件,系統后臺根據輸入的條件進行計算,進而能夠準確實現對不同線路和站點客流量的短時預測。

4? 結? 論

本項目利用大數據平臺和物聯網技術實現數據采集和存儲,研究分析了利用公交數據和天氣數據抽取影響公交客流的數據特征并形成特征集;通過設計和改進的BP神經網絡等算法實現對公交站點未來客流量的預測;基于JeeSite實現系統應用層的數據訪問和展示。項目旨在為公交運力分配策略提供數據支持,以提升城市公交系統綜合發展水平為基點,落實“公交優先”的城市發展戰略,促進城市科學規劃和現代化建設水平。本項目的實現,節省了人工調研成本,提高了公共交通系統的運營效率和系統可靠性,進而提升了公共交通相對于私家車和網約車的總體競爭力和吸引力。

本項目雖然在提升公共交通現狀方面取得了一定的效果,但因實際條件限制,還存在很多需要更加深入研究的工作待后續進行改進和擴展。

參考文獻:

[1] 姚望.蘇州市道路交通擁堵問題與對策研究 [D].蘇州:蘇州大學,2019.

[2] 陳家蓉.基于大數據的城市智能公交管理系統的設計與實現 [D].西安:長安大學,2017.

[3] 梅珊.基于數據挖掘的城市公共交通客流分析及應用研究 [D].武漢:武漢郵電科學研究院,2017.

[4] 李震宇.機器學習對相變和臨界指數的研究 [D].杭州:浙江大學,2019.

[5] 胡志新,王濤.改進遺傳算法優化BP神經網絡的雙目相機標定 [J].電光與控制,2022,29(1):75-79.

[6] 孫璐.基于多源數據的海灣型城市公共交通出行需求與空間結構關系研究 [D].青島:山東科技大學,2020.

[7] 李艾玲,張鳳荔,高強,等.基于自適應時間戳與多尺度特征提取的軌跡下一足跡預測模型 [J].計算機科學,2021,48(S2):191-197.

[8] 喬儼.基于JEESITE平臺的醫療設備信息管理系統的設計與實現 [D].濟南:山東大學,2020.

[9] 李美,楊培,楊冬梅.城市智能公共交通服務系統發展現狀研究 [J].藝術品鑒,2018(6):102-103.

作者簡介:張衛榮(1989.03—),男,漢族,山東萊蕪人,大數據專任教師初級,碩士研究生,研究方向:云計算與大數據技術。

猜你喜歡
客流量BP神經網絡公共交通
城市軌道站點公共交通一體化銜接分析
地鐵開,玩起來
基于灰色預測理論在交通樞紐客流量的實際應用
基于灰色預測理論在交通樞紐客流量的實際應用
在未來,我們不需要路
二次規劃在城市公共交通系統工程中的應用
復雜背景下的手勢識別方法
BP神經網絡在軟件質量評價中的應用研究 
BP神經網絡算法在數值預報產品釋用中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合