?

基于ARIMA-BP組合模型的鐵路行車事故數預測

2023-06-20 05:23徐國權張佳慧
關鍵詞:行車殘差差分

徐國權,張佳慧,況 堅

基于ARIMA-BP組合模型的鐵路行車事故數預測

徐國權,張佳慧,況 堅

(華東交通大學 交通運輸工程學院,江西 南昌 330013)

為更精確預測鐵路行車事故數,在ARIMA模型與BP神經網絡模型的基礎上,利用ARIMA模型分析鐵路行車事故數的線性部分;利用BP神經網絡分析影響鐵路行車事故數的非線性部分,如設備狀況、管理狀況、運輸量等,構建了ARIMA-BP神經網絡拉格朗日乘數法加權組合預測模型和ARIMA-BP殘差修正組合模型,并對4種模型的預測精度進行比較。研究表明,ARIMA-BP神經網絡殘差修正組合模型預測精度最高,可為鐵路部門了解事故發生趨勢、有效預防事故、合理制定對策提供一定參考。

鐵路行車事故數;拉格朗日乘數法;殘差修正;組合預測

對于鐵路運輸來說,安全是其最基本的要求,同時也是實現鐵路整體運行的基本保證。為有效預防事故,合理制定對策,鐵路部門有必要準確把握行車事故率的演變規律。

目前,研究事故的預測方法通常分為單項預測和組合預測。單項預測在交通運輸領域使用比較廣泛,如時間序列預測法、灰色預測法、神經網絡預測法等。文獻分析表明,神經網絡預測法因其自適應性、自組織性較好以及學習能力很強而被廣泛使用。如唐陽山等[1]、姚琪等[2]、陳海龍等[3]、王小凡等[4]通過建立神經網絡模型來對交通事故進行非線性預測;時間序列預測法因其可以在時間序列中找出變量變化特征、趨勢以及發展規律等特點同樣較常使用,如蔣宏等[5]、王文博等[6]利用時間序列方法對交通事故進行預測;張天瑞等[7]通過ARIMA自回歸模型預測軸承振動信號未來短期內變化情況,將預測結果輸入XGBoost模型進行故障分類預測,實現滾動軸承故障識別,提高預測準確率;胡劍波等[8]基于LSTM神經網絡模型并在一定的經濟增長預期下推導預測出我國碳排放強度變化趨勢,同時,建立 ARIMA-BP 神經網絡模型作為驗證模型對碳排放強度進行直接預測;Tu等[9]針對邊際分布模型,提出自回歸綜合移動平均-廣義自回歸條件異方方矩-t(ARIMA-GARCHt)模型,以捕捉風力發電的時間序列特征; Yan等[10]在QoS預測模型的基礎上擴展了ARIMA模型,以同時有效地預測多個QoS值;QIU等[11]基于時空立方體(STC)分析了WRB中降水極端值的時空變化,然后利用長短期記憶(LSTM)網絡、自回歸綜合移動平均(ARIMA)和混合集成經驗模態分解(EEMD)-LSTM-ARIMA模型預測了降水極端值。比較而言,單一的BP神經網絡預測模型容易忽視事故事件序列存在的線性關系,且預測結果穩定性相對較差;單一的時間序列模型雖然能夠反映事故時間序列變化的總體趨勢,但卻無法結合某些事故的多因素特點進行預測。因此,不少學者采用組合預測模型對交通事故進行預測,如范中洲等[12]建立灰色BP神經網絡組合的預測模型對水上交通事故進行組合預測;胡立偉等[13]建立灰色BP神經網絡組合模型對交通事故車型分擔率進行預測,并得出了組合模型預測最好的結果。此外,灰色預測模型預測具有一定發生規律的數據相對來講較為準確。胡哨剛等[14]建立灰色預測模型預測鐵路一般類事故,并對模型的精度進行分析。徐東星等[15]利用灰色關聯分析方法對水上交通事故數進行預測?;疑A測模型在處理較少的特征值數據時,能夠解決歷史數據少以及可靠性低等問題,但只適合近似于指數增長的預測。

相較于其他的時間序列模型,ARIMA模型簡單,可較好地捕捉鐵路事故的線性關系。LIDA等[16]首次結合ARIMA模型和AN模型,以改進時間序列的預測。BP神經網絡預測方法是一種解釋性預測方法[17],適合于求解內部機制復雜的問題,針對影響鐵路事故的發生有各種復雜因素的特點,BP神經網絡可較好地捕捉影響鐵路事故發生的非線性關系。本文意圖結合2種模型的優點,建立ARIMA-BP神經網絡加權組合預測模型對鐵路行車事故數進行定量預測,借助歷史數據探究鐵路行車事故數隨年份發生的規律。

1 模型構建

1.1 ARIMA模型預測事故線性部分

文獻分析表明,ARIMA模型是目前較為廣泛使用的時間序列模型,它是針對平穩時間序列數據進行預測建模的一套方法[18]。該模型能夠對所有的歷史時間序列進行客觀分析,識別數據中的季節性和趨勢性特征,能夠描述數據樣本隨時間變化的趨勢[19]。故本文先利用ARIMA模型對鐵路行車事故數的歷史數據進行線性預測。

假設行車事故數為非平穩時間序列,其可通過階差分成為平穩的時間序列x,則ARIMA模型的表達式如式(1)所示。

式中:x為平穩時間序列;為自回歸階數;為為移動平均階數;0為常數;w(=1,2,…)為自回歸系數;ε為白噪聲序列;θ(=1, 2, …)為移動平均系數。

本文用EViews11軟件對鐵路行車事故數線性部分進行ARIMA建模。由于適用ARIMA模型進行預測的時間序列必須是平穩非白噪聲序列,因此,首先需要對行車事故數據進行平穩性檢驗,若為不平穩序列,則需對數據進行差分處理,并確定差分階數,一般情況下,差分的階數不會超過2;其次,根據模型的自相關系數(ACF)和偏自相關系數(PACF)確定參數、,并采用最小二乘法對ARIMA模型進行參數估計;最后通過滾動的單步預測計算實現短期預測[18]。

1.2 BP神經網絡分析事故非線性部分

本文所構建的BP神經網絡有輸入層、輸出層和隱含層3層結構,其結構圖如圖1所示,其基本公式如式(2)所示。

圖1 BP神經網絡結構

式中:1,2,…,n為BP神經網絡的輸入層;1,2,…, w為輸入層的對應權重;為偏置值;為激活函數。

BP神經網絡是通過不斷調整神經網絡的權值和閾值,使網絡輸出的均方誤差和最小,其核心是網絡的前向傳導與誤差的逆向反饋。

文中BP神經網絡的輸入層為鐵路行車事故的時間序列,輸出層節點數為1,將預測的下一年數據作為已知數據繼續進行滾動預測。選擇tansig函數作為隱含層神經元的激勵函數。隱含層節點數由式(3)確定。

式中:為輸入層節點數,為輸出層節點數,∈[1,10]。

1.3 拉格朗日加權組合預測模型構建

本文將上述兩種單一預測模型進行線性組合,利用拉格朗日乘數法求解權系數。將單個模型的預測結果乘以相對應的權系數并求和。

假設鐵路行車事故數有組,按照如下步驟進行預測。

(1)對行車事故時間序列進行平穩性檢驗,確定差分階數,利用自相關系數和偏自相關系數確定參數、,利用ARIMA模型對行車事故進行預測,得到鐵路行車事故預測結果1j。

(2)確定BP神經網絡的輸入層節點數,隱含層節點數和輸出層節點數,確定激活函數,對鐵路行車事故數進行滾動預測,得到鐵路行車事故預測結果2j。

(3)權系數利用拉格朗日乘數法確定。目標函數設置為使所有組合預測模型的殘差平方和最小,如式(4)所示。

通過公式(4)確定1j、2j的權重1和2。

ARIMA-BP組合預測模型的預測結果Y如式(5)所示。

1.4 殘差優化組合模型構建

為了提高預測精度,本文通過對歷史鐵路行車事故案例進行整理分析,建立了鐵路行車事故預測指標體系。

影響鐵路行車事故數的主要因素有3個:管理狀況包括本年度傷亡人數、上一年度鐵路行車事故數,設備情況包括國家鐵路運營里程、國家鐵路客車擁有量,運輸量包括鐵路客運量、鐵路旅客周轉量,如圖2所示。

圖2 鐵路行車事故指標選取體系圖

1.5 殘差組合預測模型過程

(1)對行車事故時間序列進行平穩性檢驗,確定差分階數,利用自相關系數和偏自相關系數確定參數、,利用ARIMA模型對行車事故進行預測,得到鐵路行車事故預測結果1j。

2 實例驗證

2.1 數據來源與數據預處理

由于部分公開數據缺失以及新冠疫情的突然爆發,故本文選取2002年至2018年數據進行建模說明。根據2003—2019年《中國鐵道年鑒》所統計的2002—2018年的全路行車事故數,如表1所示;以及國家統計局官網和國家鐵路局《鐵路安全情況公告》公布的2002年至2018年的鐵路客運量、鐵路旅客中轉量、鐵路運營里程,國家鐵路客車擁有量以及鐵路行車事故死亡人數,如表2所示。

從數據上直觀來看,2008年前后行車事故發生的數量急劇下降,這是由于我國在這期間高度重視鐵路的建設,鐵路交通的安全性也隨之提升??紤]到ARIMA模型對數據平穩性的嚴重依賴,本文將2008年之前的數據作為異常值按照均值原則并利用公式(7)對其進行預處理,以降低樣本差異性。

表1 2002—2018年中國鐵路全路事故數

年份事故數年份事故數 20021192220112087 20031264020122575 20041192120132395 20051121920143025 2006920820153782 2007503820161992 2008296720171588 2009261120181612 20102470

表2 2002—2018年鐵路客運量、鐵路運營里程、鐵路運輸事故死亡人數、鐵路客車擁有量、鐵路旅客周轉量

年份鐵路客運量/萬人鐵路營業里程/萬km鐵路運輸事故死亡人數/人鐵路客車擁有量/輛鐵路旅客周轉量/億人·km 20021056067.198217394384969.40 2003972607.308530404874788.61 20041117647.447992413535712.20 20051155837.547375403286061.96 20061256557.715749426596622.12 20071356707.803143442437216.31 2008146192.987.972932450767778.60 2009152451.198.551808493547878.89 2010167609.029.121568503918762.18 2011186226.079.321566547319612.29 2012189336.859.761463577219812.33 2013210596.9210.3113365684110595.62 201423046011.1812326062911241.85 201525348412.110376770611960.60 2016281405.2312.49327087212579.29 2017308379.3412.78987336213456.92 2018337494.6713.178577319914146.58

式中:為經過預處理后的新數據,h為原始時間序列數據。

2.2 ARIMA預測模型

經過預處理后的我國鐵路行車事故時間序列變化趨勢整體向下,如圖3所示。

該數據進行顯著性檢驗結果如表3所示,可以看出,該序列為非平穩序列。

對非平穩序列進行回歸,往往容易出現“偽回歸”現象,從而影響研究結果,因此需要通過一定的途徑對原始時間序列進行平穩性處理。

二階差分后的時間序列如圖4所示,可以看出其是在0.00左右有規律的上下波動。

二階差分后的顯著性檢驗結果如表4所示,可以刊出Prob.*≤5%,而Prob.*小于5%的水平為平穩序列。綜上所述,我們可以得出二階差分后的時間序列是平穩時間序列的結論,所以取=2。

圖3 2008—2018年鐵路運輸事故數變化趨勢

表3 原始數列顯著性檢驗結果

T統計量Prob.* 增強Dickey檢驗統計量-1.1309380.6761 測試臨界值1% level-3.920350 5% level-3.065585 10% level-2.673460

圖4 二階差分后的時間序列

表4 二階差分后顯著性檢驗結果

T統計量Prob.* 增強Dickey檢驗統計量-3.9577230.0119 測試臨界值1% level-4.057910 5% level-3.119710 10% level-2.701103

事故時序序列經過二階差分后時間序列的自相關和偏相關圖如圖5所示。

圖5 事故時序序列經過二階差分后時間序列的自相關和偏相關圖

自相關性(ACF)決定自回歸(AR)階數,偏相關性(PACF)決定滑動平均(MA)的階數,、檢驗結果如表5所示。

表5 、檢驗結果

VariableCoefficientStd.Errort-StatisticProb. AR(1)-0.50555850.470114-2.7847000.0480

ARIMA(1,2,0)模型中的參數是最佳的,用ARIMA(1,2,0)模型對鐵路運輸全路段事故數進行擬合,獲得鐵路運輸全路段事故預測數據見表6。

2.3 預測模型及其預測結果

(1)BP神經網絡預測模型

首先,將事故序列進行最大最小值歸一化處理;其次,確定神經網絡結構—輸入層節點數為11,隱含層節點數為7,輸出層節點數為1,最大訓練次數為50 000,學習速率為0.05,目標誤差為0.001;最后,進行滾動預測。

(2)加權組合預測模型

利用拉格朗日乘數法求解權系數的方法確定權系數,計算得到兩種單一模型的權重分別為1/2,并將ARIMA模型預測得出的數據與BP神經網絡模型預測出來的數據進行加權處理,得到加權組合模型的預測結果。

(3)殘差優化組合預測模型

以上模型預測結果如表6所示。

表6 2012—2018年事故數真實值、ARIMA預測值、BP神經網絡預測值、ARIMA-BP加權組合預測值、ARIMA-BP殘差修正預測值

年份事故數真實值ARIMA預測值BP神經網絡預測值加權預測殘差預測 201323952622256425932516 201430252552255325523295 201537823245254428943408 201619924474253535043258 201715881489252820081570 20181612483252116821727

3 模型評價

為驗證四種模型的預測精度,我們分別對ARIMA模型、BP神經網絡預測模型、ARIMA-BP加權組合模型、ARIMA-BP殘差修正模型的預測結果進行分析評價。4種預測模型的預測值與真實值對比如圖6所示。

圖6 4種預測模型的預測值與真實值對比

從圖中可以看出組合預測模型的預測結果比單一預測模型的預測結果更好。

為進一步分析兩個組合模型的預測精度,本文采用平均絕對值誤差(MAE)和均方根誤差(RMSE)分別對4種模型的誤差和穩定性進行分析,如表7所示。

表7 4種預測模型的誤差值

模型MAERMSE ARIMA模型824.501155.31 BP神經網絡模型711.83794.64 加權組合模型593.50765.82 殘差修正模型360.67554.33

從表中可以看出,ARIMA-BP神經網絡殘差修正組合模型是明顯優于加權組合預測模型,并且從圖3來看,ARIMA-BP神經網絡殘差修正組合預測模型預測結果隨時間變化的趨勢與實際的變化趨勢最為接近。由此可見,經過殘差修正的ARIMA-BP神經網絡預測模型更能反應未來鐵路運輸事故數的變化趨勢。

4 結論

本文將4種預測模型進行對比。結果表明,ARIMA-BP神經網絡殘差修正組合預測模型對鐵路運輸事故數具有更好的預測效果。

(1)BP神經網絡能較好地對影響鐵路行車事故數的非線性部分進行解釋性預測,但網絡的推廣能力較差,并且若要提高模型的預測精度,則需反復對神經網絡的權重進行調整。

(2)依托國家鐵路2002—2018年期間來發生事故數的歷史數據,即鐵路運輸事故數的線性部分,利用ARIMA模型去擬合預測,可以較好掌握鐵路行車事故數發生的規律。由于影響鐵路行車事故數發生的因素具有很強的非線性特性,利用BP神經網絡模型非線性映射能力去分析影響鐵路事故發生的非線性因素,如設備狀況、管理情況等,可以彌補ARIMA模型只能進行線性預測的不足。

(3)ARIMA-BP神經網絡殘差修正組合預測模型的預測結果表明,鐵路行車事故數整體呈現下降趨勢,這歸功于我國國家鐵路在設備技術上精進,在人員管理上的嚴謹。若要進一步降低鐵路行車事故數的發生,鐵路相關部門則需在安全生產技術上加大創新力度。

[1] 唐陽山, 葛麗娜, 黃子龍, 等. 基于BP神經網絡的交通事故預測方法研究[J]. 遼寧工業大學學報: 自然科學版, 2016, 36(1): 27-30.

[2] 姚琦, 王林山. 基于BP神經網絡的交通事故預測[J]. 濱州學院學報, 2016, 32(6): 45-53.

[3] 陳海龍, 彭偉. 改進BP神經網絡在交通事故預測中的研究[J]. 華東師范大學學報: 自然科學版, 2017(2): 61-68.

[4] 王小凡, 朱永強. 基于灰色BP神經網絡模型的道路交通事故預測[J]. 白城師范學院學報, 2019, 33(6): 36-40, 51.

[5] 蔣宏, 方守恩, 陳雨人, 等. 基于時間序列和灰色模型的交通事故預測[J]. 交通信息與安全, 2012, 4: 93-98.

[6] 王文博, 陳紅, 韋凌翔. 交通事故時間序列預測模型研究[J]. 中國安全科學學報, 2016, 26(6): 52-56.

[7] 張天瑞, 周福強, 吳寶庫, 等. 基于ARIMA和XGBoost的滾動軸承故障預測模型研究[J]. 制造技術與機床, 2022(4): 176-182.

[8] 胡劍波, 羅志鵬, 李峰. “碳達峰”目標下中國碳排放強度預測——基于LSTM和ARIMA—BP模型的分析[J]. 財經科學, 2022(2): 89-101.

[9] Qingyu Tu, Shihong Miao, Fuxing Yao, et al. Forecasting Scenario Generation for Multiple Wind Farms Considering Time-series Characteristics and Spatial-temporal Correlation[J]. Journal of Modern Power Systems and Clean Energy, 2021, 9(4): 837-848.

[10] Yan Chao, Zhang Yankun, Zhong Weiyi, et al. A Truncated SVD-Based ARIMA Model for Multiple QoS Prediction in Mobile Edge Computing[J]. Tsinghua Science and Technology, 2022, 27(2): 315-324.

[11] QIU Dexun, WU Changxue, MU Xingmin, et al. Spatial-temporal Analysis and Prediction of Precipitation Extremes: A Case Study in the Weihe River Basin, China[J]. Chinese Geographical Science, 2022, 32(2): 358-372.

[12] 范中洲, 趙羿, 周寧, 等. 基于灰色BP神經網絡組合模型的水上交通事故數預測[J]. 安全與環境學報, 2020, 20(3): 857-861.

[13] 胡立偉, 張婷, 郭鳳香, 等. 基于灰色BP神經網絡的道路交通事故車型分擔率預測及其預防策略研究[J]. 武漢理工大學學報: 交通科學與工程版, 2018, 42(3): 388-392, 397.

[14] 胡哨剛, 孔祥芳, 曠利平, 等. 基于灰色理論的鐵路交通一般事故數據預測模型[J]. 交通科技與經濟, 2021, 23(4): 27-31.

[15] 徐東星, 尹勇, 張秀鳳, 等. 長江干線水上交通事故的灰色分析與預測[J]. 中國航海, 2019, 42(2): 59-65.

[16] LIDA B, RODRíGuez NIBALDOR, CECILIA M. Smoothing strategiescombined with ARIMA and neural networks to improve theforecasting of traffic accidents[J]. The Scientific WorldJournal, 2014(11): 1-12.

[17] 班福忱, 吳丹, 黑月明. 基于自適應過濾與BP神經網絡的城市時用水量組合預測模型[J]. 給水排水, 2017, 53(11): 107-111.

[18] 徐超, 項薇, 等. 基于ARIMA與自適應過濾法的組合預測模型研究[J]. 計算機應用與軟件, 2018, 35(11): 296-300, 320.

[19] 孫斌, 陳思伶, 杜麗慧. 極端事件下鐵路貨運量預測——基于ARIMA模型[J]. 華東交通大學學報, 2021, 38(2): 67-72.

Forecast of Railway Transportation Accidents Based on ARIMA-BP Combined Model

XU GUO-quan, ZHANG Jia-hui, KUANG Jian

(School of Traffic and Transportation Engineering, East China Jiaotong University, Nanchang 330013, China)

In order to more accurately predict the number of railway traffic accidents, on the basis of the ARIMA model and the BP neural network model, the ARIMA model is used to analyze the linear part of the number of railway traffic accidents; the BP neural network is used to analyze the nonlinear part that affects the number of railway traffic accidents, such as equipment condition, management status, transportation volume, etc., the ARIMA-BP neural network lagrange multiplier method weighted combination prediction model and ARIMA-BP residual correction combination model are constructed. The prediction accuracy of the four models is compared. The results show that the ARIMA-BP neural network residual correction combined model has the highest prediction accuracy. This research can provide a reference for railway departments to understand the trend of accidents, effectively prevent accidents, and formulate reasonable countermeasures.

number of railway accidents; lagrangian multiplier method; residual correction; combined forecast

10.15916/j.issn1674-3261.2023.03.007

U298

A

1674-3261(2023)03-0174-06

2022-04-12

國家社會科學基金項目(17BJY140)

徐國權(1969-),男,江西豐城人,副教授,碩士。

責任編輯:陳 明

猜你喜歡
行車殘差差分
基于雙向GRU與殘差擬合的車輛跟馳建模
數列與差分
基于殘差學習的自適應無人機目標跟蹤算法
基于遞歸殘差網絡的圖像超分辨率重建
夜間行車技巧
吉普自由光行車制動易熄火
平穩自相關過程的殘差累積和控制圖
基于差分隱私的大數據隱私保護
調度調整在地鐵行車組織中的應用
相對差分單項測距△DOR
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合