?

基于大數據與機車畫像的貨運鐵路調度運行風險預警方法研究

2024-01-03 04:43常建和姚志遠付上源
大連交通大學學報 2023年6期
關鍵詞:機車貨運標簽

常建和,姚志遠,付上源

(1.包神鐵路集團機務分公司,陜西 神木 719300;2.安徽安為科技有限公司,安徽 合肥 230000)

鐵路調度指揮系統是一個由多個部門和學科組成的綜合管理體系,不僅包括安全監控、綜合維修、旅客服務,還包括移動設備、運輸組織等[1]。構成調度指揮系統的各因素間存在著強烈的耦合關系,各因素間的細微差異都會影響系統的可靠性,輕則造成運行不穩定,運輸組織秩序混亂,嚴重時會引發嚴重的交通事故[2]。在高速鐵路發展迅猛的今天,如果出現重大運行事故,不但會對設備造成損害,旅客和工作人員的人身安全、財產安全也會受到威脅,還會對社會的穩定和國家形象產生不利的影響[3]。因此,提高行車調度指揮系統的可靠性是非常必要的,必須結合調度指揮系統的可靠性理論,對貨運鐵路調度運行風險進行預警,達到及時控制貨運鐵路調度運行風險的目的。

張錦等[4]從人-機-管-環的視角出發,構建了鐵路施工過程中的風險預警體系,根據風險預警的等級劃分原則,以可拓理論為基礎,構建了風險預警模型,采用層次分析和熵值法相結合的方法,確定了預警目標與預警級別之間的相關性。以川藏鐵路工程為實例,對該模型進行了應用,結果顯示,該模型能夠對川藏鐵路的風險進行預警,但該方法的虛報率較高。韓忻辰等[5]考慮到傳統方法無法預測突發事件的發生時間,根據列車進站和出站的時間,計算列車的延誤時間總和,以最小延誤時間為目標函數,構建了列車調度模型,在交互環境下,利用Q-learning算法求解了調度模型,最后通過仿真試驗,驗證了該模型在鐵路動態調度中的實用性。但該方法考慮的風險模式較單一,導致虛報率及誤報率均較高。

基于以上研究背景,本文將大數據與機車畫像相結合,設計一種貨運鐵路調度運行風險預警方法,從而有效控制貨運鐵路調度系統在運行過程中的風險。

1 預警方法設計

1.1 鐵路調度運行風險數據聚類

考慮到貨運鐵路調度運行風險缺乏一定的規律性,需要對風險數據進行聚類處理,及時控制鐵路調度的運行風險。機車畫像是在大數據背景下產生的[6],利用貨運機車的行為特征和屬性,將其抽象為一個標簽化的模型,通過建立標簽體系為貨運機車賦予標簽,以標簽的形式描述貨運鐵路調度運行的真實狀態。

機車畫像利用貨運機車使用、檢修、整備等各個方面的資料,根據其對應的構造,制成貨運機車的畫像標簽,標準化地表示貨運機車的調度和運行。

在鐵路調度運行風險聚類處理之前,先建立貨運機車標簽與機車畫像的關系,見圖1。

圖1 貨運機車標簽與機車畫像的關系

根據建立貨運機車標簽與機車畫像的關系,利用大數據技術采集鐵路調度過程中產生、消除和替代的運行數據[7],獲取調度運行風險數據標簽,可表示為:

(1)

式中:Ri為第i個貨運鐵路調度系統的風險指標;N為調度運行風險的數量;Rop為風險數據標簽,下標o表示自定義屬性,p表示功能屬性。

數據聚類的方法有很多,當無法獲取貨運機車標簽的類別劃分時,利用機車畫像與機車標簽的關系,可以得到貨運機車調度運行風險的標簽。利用大數據技術挖掘貨運鐵路調度運行風險數據[8],并對其進行聚類處理,步驟如下:

Step1:對于包含m個貨運鐵路調度運行風險樣本的數據集Ω={u1,u2,…,um},在數據集中選取H個風險樣本作為聚類處理的中心ei,那么貨運鐵路調度運行風險的聚類類別為:

Q={q1,q2,…,qh}

(2)

Step2:在數據集Ω中,計算風險樣本數據ui與H個聚類處理中心ei之間的距離,并根據機車畫像對應的標簽類別,將該風險樣本劃分到最小距離的聚類中心所對應的類別中。

Step3:當所有風險樣本都完成遍歷之后,再一次計算每類風險樣本的聚類中心ei,表示為:

(3)

將式(3)計算的聚類中心作為貨運鐵路調度運行風險在下一次聚類中的類別中心點。

Step4:返回Step2,重新執行Step2和Step3的操作,直到各個類別風險數據的聚類中心不再變化。

當風險數據處于歐式空間時,采用χ*作為風險數據聚類處理的目標函數,χ*的值越小,說明聚類類別Qi中風險數據的一致性越高。要想使風險數據的聚類效果達到最優[9],需要保證χ*的值足夠小,χ*值可以通過式(4)計算得到:

(4)

利用貨運機車標簽與機車畫像的關系,獲取貨運鐵路調度運行的風險數據標簽,結合大數據技術挖掘貨運鐵路調度運行風險數據,通過計算每類風險數據的聚類中心,完成鐵路調度運行風險的聚類處理。

1.2 檢測貨運鐵路調度運行風險

貨運鐵路調度運行風險經過聚類處理之后,先提取貨運鐵路調度運行風險的特征,提高貨運鐵路調度運行風險檢測的效率。貨運鐵路調度系統在運行過程中,受到多種因素的影響[10],會出現調度運行風險,對于風險程度較低、信噪比較高的調度運行風險數據,通過量化處理,可以得到風險數據的量化形式:

La=φmin·σmax

(5)

式中:φmin為調度運行風險的最小特征;σmax為風險數據的最大信噪比。

要想提取出風險數據的有效特征,需要利用大數據技術去除風險數據的冗余特征[11],根據風險發生的概率,預測貨運鐵路調度運行風險的分布特征,即:

(6)

式中:ψ為風險分布的加權值;ζi為風險發生的概率。

根據貨運鐵路調度運行風險的分布特征,對風險特征進行挖掘,并分析風險數據的函數特征,表示為:

(7)

式中:U為風險數據的特征集合;Ki為支持度計算系數。

通過以上計算,挖掘貨運鐵路調度運行風險的特征,根據風險數據的特征,對貨運鐵路調度運行風險進行檢測,步驟如下:

Step1:對貨運鐵路調度運行風險的特征進行歸一化處理[12]:

(8)

式中:yi為風險特征;ymin為最小特征值;ymax為最大特征值。

Step2:確定貨運鐵路調度運行風險等級。

Step3:引入激活函數,計算風險數據在大數據分析中的輸出矩陣。

Step4:利用輸出矩陣,建立貨運鐵路調度運行風險檢測模型。

Step5:利用Step4的貨運鐵路調度運行風險檢測模型,檢測貨運鐵路調度運行風險。

利用大數據技術去除風險數據的冗余特征,根據貨運鐵路調度運行風險的分布特征,挖掘貨運鐵路調度運行風險的特征,并結合歸一化處理,檢測貨運鐵路調度運行風險。

1.3 構建貨運鐵路調度運行風險預警模型

根據鐵路調度運行風險的檢測結果,對風險數據進行篩查和采集,結合標準化處理[13],構建風險預警模型,在貨運鐵路調度系統I上,發生Ni次運行風險的概率函數可以用泊松分布表示:

(9)

式中:χi為調度系統中設定運行風險發生的估計值,該值可以描述成規定調度時間內運行風險發生概率的函數值,可利用式(10)表示:

χi=exp(ε0+ε1xi1+…+εkxik)

(10)

式中:ε0,ε1,…,εk為鐵路調度系統運行的常數項;xi1,…,xik為運行風險的變化參數。

在貨運鐵路調度系統I中,ξ為運行風險變量,那么運行風險頻率的伸縮系數可以通過式(11)計算:

(11)

式中:?ij為貨運鐵路調度系統I中運行風險變量ξ的取值。

根據運行風險頻率的伸縮系數[14],在不同風險等級下,計算貨運鐵路調度運行的風險因子,表示為:

(12)

式中:J為風險等級;λ*為運行風險的高危系數;tc為貨運鐵路的調度時間。

利用貨運鐵路調度運行風險因子,給出風險的統計函數:

(13)

式中:φ和β分別為風險預警的形態參數和標準參數。

根據貨運鐵路調度運行風險的統計情況[15],構建貨運鐵路調度運行風險預警模型,表示為:

(14)

式中:Pa,b為貨運鐵路調度運行風險的波動情況;S*為風險等級。

貨運鐵路調度運行風險預警模型構建完成之后,利用大數據技術檢驗貨運鐵路調度運行風險預警模型的擬合優度,檢驗結果與風險檢測結果的熵值越接近1,說明模型的擬合優度越高,即:

Q=-2[-log(Gh)]-log(Gs)

(15)

式中:log(Gh)為風險預警模型的對數似然函數值;log(Gs)為無效預警模型的對數似然函數值。

綜上所述,本文利用泊松分布定義了鐵路調度運行風險的概率函數,根據運行風險頻率的伸縮系數,計算貨運鐵路調度運行的風險因子,基于運行風險的統計情況,構建貨運鐵路調度運行風險預警模型。

2 試驗分析

2.1 試驗數據來源

為了驗證本文方法在貨運鐵路調度運行風險預警中的性能,以某貨運鐵路調度系統為研究對象,進行以下試驗過程:

(1)數據收集

利用各種傳感器和監測設備,對鐵路運輸過程中的車輛、鐵路設施、天氣等相關數據進行收集,生成運行風險數據庫,作為試驗樣本。在數據庫中,隨機抽取3 586份運行風險數據,選擇其中的1 000份作為測試樣本,2 586份為訓練樣本。將1 000份測試樣本劃分為10組,原始試驗數據見表1。

表1 原始試驗數據

(2)數據清洗

對收集到的數據進行篩選、去重、異常值處理、缺失值填充等清洗工作[16],確保數據的準確性和完整性。

(3)特征提取

分析和處理清洗后的數據,提取其中的特征信息,如列車時刻表、運行速度、載重情況等。

(4)數據更新

不同方法根據歷史數據和實時數據,各自更新參數。

(5)風險評估

對當前運輸情況進行評估,如風險避免、轉移、減輕、承擔等方案,得出風險等級。

(6)風險預警

根據風險等級和對應的預警方案,對潛在風險進行預警,如風險根本原因、風險因素、風險控制策略等,確定優先解決的重點風險,提示相關人員及時采取措施避免或減輕風險。

2.2 試驗平臺

為了準確對貨運鐵路調度運行風險進行預警,及時控制風險的發生,借助www.onlinedown.net測試平臺,搭建的試驗平臺見圖2。

將表1的試驗數據導入上述試驗平臺,利用本文方法對不同風險模式下的貨運鐵路調度運行風險進行預警。

2.3 風險預警

在對貨運鐵路調度運行風險預警之前,當風險值超過0.5時,風險數據的聚類效果達到最優,文中方法才能檢測到風險數據。由此,基于表1的10組樣本,利用本文方法檢測不同風險模式下的貨運鐵路調度運行風險數據,風險預警結果見圖3。

圖2 試驗平臺

圖3 風險預警結果

根據圖3的結果可知,采用本文方法能夠檢測不同風險模式下的風險數據,與實際值相比,差距較小即二者擬合度較高,表明對風險數據預警的準確率更高。

2.4 性能對比

為了對幾種方法的性能進行對比,引入文獻[4]中基于可拓理論的預警方法和文獻[5]中基于Q-learning的預警方法,測試貨運鐵路調度運行風險預警的虛報率,結果見圖4。

圖4 貨運鐵路調度運行風險預警的虛報率

從圖4的結果可以看出,采用基于可拓理論的預警方法和基于Q-learning的預警方法,貨運鐵路調度運行風險預警的虛報率均在20%以上。采用本文方法時,可以將風險預警的虛報率控制在5%以內,在3種方法中最低,說明本文方法能夠降低貨運鐵路調度運行風險的虛報率。

圖5為貨運鐵路調度運行風險預警的誤報率。從圖5可知,在貨運鐵路調度運行風險預警的誤報率方面,本文方法可以控制在8%以內,基于Q-learning的預警方法誤報率為14%~20%,而基于可拓理論的預警方法,其誤報率超過了20%,由此說明本文方法在貨運鐵路調度運行風險預警的誤報率較低,在誤報率方面具有更好的性能。

圖5 貨運鐵路調度運行風險預警的誤報率

3 結論

本文將大數據與機車畫像應用到貨運鐵路調度運行風險預警方法設計中,經過試驗測試發現,該方法在貨運鐵路調度運行風險預警中,可以降低風險預警的虛報率和誤報率。但是本文的研究還存在很多不足,在今后的研究中,希望可以考慮到客運鐵路調度運行存在的風險,從而保證客運鐵路調度運行的安全與穩定。

猜你喜歡
機車貨運標簽
大連機車
重載機車牽引計算仿真系統開發及其應用
基于CTC3.0系統機車摘掛功能的實現
無懼標簽 Alfa Romeo Giulia 200HP
波音公司試飛電動垂直起降貨運無人機
不害怕撕掉標簽的人,都活出了真正的漂亮
AT200大型貨運無人機實現首飛
一種機車聯接箱工藝開發
標簽化傷害了誰
貨運之“云”
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合