?

基于CEEMDAN與KFCM聚類的轉轍機退化狀態識別方法

2023-02-15 18:50張友鵬魏智健
中國鐵道科學 2023年1期
關鍵詞:轉轍機道岔分量

張友鵬,張 迪,楊 妮,魏智健

(1.蘭州交通大學 自動化與電氣工程學院,甘肅 蘭州 730070;2.武漢地鐵集團有限公司 武漢地鐵運營有限公司,湖北 武漢 430070)

隨著鐵路線路數量、運營里程以及行車密度的不斷增加,鐵路信號設備在保證行車安全和提高行車效率方面發揮著越來越重要的作用。轉轍機作為鐵路信號設備室外三大件之一是重要的線路轉換設備,它通過缺口檢查、判斷尖軌與基本軌是否密貼以確保列車安全通過道岔。由于轉轍機安裝于室外,受雨雪等各種自然條件及震動、沖擊等外界因素的影響較大,其故障率在鐵路信號設備中居高不下。據統計發現,道岔轉換設備故障占所有信號設備故障總數的40%以上[1]。目前,鐵路現場主要通過設備周期性巡檢以及電流曲線和功率曲線對道岔狀態進行人工分析,這些方法都依賴于工作人員的現場經驗,易造成道岔設備維修不足或維修過剩等問題[1]。在理論研究方面,對于轉轍機狀態的研究主要集中于故障狀態的診斷以提高診斷的速度和準確率,而關于轉轍機在使用壽命內由正常到失效整體狀態的研究還較少。因此,有必要對轉轍機的退化狀態展開研究,為現場設備的維護與更換提供參考意見,從而降低故障發生的概率。

國內外學者在提高轉轍機故障診斷的準確率和效率方面取得了一些研究成果。2015 年,肖蒙等人[2]提出一種基于粗糙集的高效貝葉斯網絡故障診斷模型,由推理算法求解各類故障發生的概率。2016 年,Vileiniskis 等人[3]通過單類支持向量機(OCSVM)方法對道岔轉換設備故障進行分類診斷學習,建立完整的故障診斷模型。2018 年,黃世澤等人[4]采用比較待測電流曲線與模板電流曲線弗雷歇距離的方法,根據相似度函數進行故障模式診斷。這些學者將轉轍設備故障數據與機器學習算法相結合,能夠對轉轍機各類故障進行準確識別。但是以上研究只能將轉轍機狀態簡單劃分為正常和故障2 種狀態,無法描述轉轍機由正常到故障的整個退化過程,難以實現對故障的超前預判。

因此,一部分學者開始在轉轍機退化狀態識別與故障預測領域展開研究。2017 年,伏玉明等人[5]采用模糊綜合評判法對轉轍機健康狀況進行綜合評估。2018 年,戴乾軍等人[6]將轉轍機的退化過程按照全生命周期進行劃分,利用動態粒子群算法優化隱半馬爾科夫(HSMM)模型,實現對轉轍機的故障預測。2019 年,候大山[7]將道岔設備故障分為突發故障和緩變故障,針對緩變故障構建性能退化指標并搭建緩變故障預測模型。2020年,高利民等人[8]利用自組織特征映射神經網絡(SOM-BP)對轉轍機功率曲線特征參數進行多次聚類學習,得到6 種轉轍機退化樣本數據,實現對道岔設備退化狀態的識別。以上文獻雖然對轉轍機退化狀態進行了劃分,但仍存在評估過程中參考相關專家經驗,導致評估結果具有一定的主觀因素,且退化特征之間缺乏相關性分析,無法表征轉轍機壽命退化的整個過程。2022 年,武曉春等人[9]提出一種基于小波包分解與GG 聚類相結合的退化階段劃分方法,構建退化性能指標;魏文軍等人[10]將轉轍機運行狀態分為健康、亞健康、故障、嚴重故障4 種類型,但相關文獻都沒有明確轉轍機退化狀態識別相對應的轉轍機故障類型。目前關于轉轍機退化狀態的相關研究仍然較少。

本文提出一種自適應白噪聲完備經驗模態分解方法(Complete Ensemble Empirical Mode Decom?position with Adaptive Noise,CEEMDAN)與核模糊C 均值聚類(Kernel-based Fuzzy C-Means clustering,KFCM)相結合的轉轍機退化狀態識別方法,通過CEEMDAN 算法選取各固有模態函數(Intrinsic Mode Functions,IMFs)分量的能量密度作為特征向量集,并通過KFCM 算法進行無監督聚類,從而實現對轉轍機轉換過程中阻力異常退化狀態階段的準確劃分,對轉轍機故障由正常到退化的整個過程進行描述。

1 轉轍機功率曲線

信號集中監測系統(CSM)是監測鐵路信號設備狀態的綜合監測平臺,可以實時記錄設備數據,為鐵路現場維護工作提供參考依據[11]。CSM通過道岔采集單元對轉轍機動作過程中的電流、電壓、功率等數據進行實時采集。

1.1 功率曲線數據來源

交流轉轍機數據采集主要通過在A,B,C 三相電路中并聯電壓采集配線、串聯電流采集互感器得到轉轍機動作過程中相應的電壓和電流值,并將電壓、電流輸出至功率采集單元經過隔離采樣、A/D 轉換、編碼傳輸后輸出轉轍機動作過程中的功率值[12]。

三相交流轉轍機采集系統示意圖如圖1 所示。圖中:1DQJ 和1DQJF 分別為轉轍機1 啟動繼電器和1 啟動復示繼電器,采集系統通過斷相保護器(DBQ)前級端子11,31 及51 點的配線采集三相電路電壓;三相電流采集互感器采用互感方式穿芯采集三相電路電流。

圖1 三相交流轉轍機采集系統

完成電壓、電流采集后,功率采集單元每40 ms 計算1 次有功功率,將動作過程中的采樣點順次記錄形成電流曲線和功率曲線。由于電流曲線只能反映轉轍機動作過程中電流值的變化情況,而功率曲線不僅能反映三相電流電壓值的大小,更能反映轉轍機轉動過程中的阻力變化,所以選擇轉轍機功率曲線數據作為數據源。

1.2 正常動作功率曲線

同一個轉轍機正常轉動過程中4 個不同時刻的功率曲線如圖2 所示。由圖2 可以看出:4 條功率曲線都表示道岔能夠無故障正常轉換到位,但不同時刻的4條正常功率曲線并不相同,存在一定的差異;在轉轍機正常轉動過程中,啟動解鎖階段由于三相電動機轉動克服較大阻力,所以功率值急劇上升,阻力大小不同則功率峰值會有所不同;4 條曲線功率峰值依次為2.514,2.230,2.358 及2.488 kW,若在啟動階段道岔尖軌與基本軌之間密貼太緊而解鎖不良,可能會出現啟動功率過高的現象,若道岔密貼不足啟動功率過低,或信號集中監測系統40 ms 的采樣周期無法捕捉到轉轍機啟動解鎖的峰值,避開了峰值采集點,又可能會造成功率曲線峰值的消失[10]。在轉換階段,轉轍機動作桿拉動道岔尖軌到達指定位置,正常情況下道岔轉換過程平穩,正常的轉轍機功率曲線應較平直。但若道岔轉換過程中由于滑床板缺油等情況引起轉換阻力異常,從而導致道岔轉換受阻?;舶迥Σ磷枇Φ拇笮∨c轉轍機動作功率曲線的波動程度具有相關性,功率曲線的波動程度反映了轉轍機轉換期間所受摩擦阻力的大小變化,具有退化過程[13-14]。若發現轉轍機轉換階段功率值發生偏差而不及時調整,可能會導致道岔無法正常轉換[15]。

圖2 不同時刻正常動作功率曲線

大部分故障發生前,功率曲線雖會出現異常波動但與正常曲線無明顯差異,監測人員可能會忽略這些細微的變化而錯過最佳維修時間。若直至道岔出現故障才進行維修,不但增大維修成本,而且可能會影響行車安全與行車效率。如果對具有退化趨勢的故障進行退化狀態識別研究,進行針對性維修,可以提高鐵路現場在日常維護中的維修效率。

2 特征提取

2.1 CEEMDAN算法

EMD(經驗模態分解,Empirical Mode De?composition)將原始信號按照高頻到低頻的順序分解為一系列固有模態函數,從而反映非平穩信號的局部特征。但EMD 在分解過程中會出現模態混疊的現象,對信號分解產生干擾。為了克服模態混疊,EEMD(集成經驗模態分解,Ensemble Em?pirical Mode Decomposition)對原始信號添加高斯白噪音,利用EMD 濾波器的二元濾波器組特性填充整個時頻空間以減少模態混合,但是EEMD 在對信號加噪的過程中可能會產生一定的虛假分量,影響后續的信號分析。為此,CEEMDAN在EEMD的基礎上加以改進,在每次分解中加入成對的高斯白噪聲并進行平均運算,解決白噪聲從高頻到低頻的傳遞問題,從而抑制模態混疊和假分量的產生,更適用于對非線性、非平穩信號進行時頻分析,而轉轍機功率曲線信號非線性、非平穩的特點與CEEMDAN 算法的適用范圍相匹配,因此選擇CEEMDAN提取轉轍機功率曲線信號特征。

CEEMDAN算法計算過程如下。

(1)用k表示第k階模態分量,k=1 時,令轉轍機功率曲線信號p(t)=r0(t),r0(t)為待分解信號,向p(t)中添加高斯白噪聲Ni(t),添加i(i=1,2,…,I)次得到疊加信號xi(t)為

(2)對xi(t)進行EMD分解,獲得I個IMF分量c0i(t)。

(3)對c0i(t)集合平均得到第1 階IMF 分量c1(t)為

(4)計算第1階余量r1(t),計算式為

(5)向1 階余量中繼續添加i次白噪聲E(Ni(t)),得到新的待分解信號Yi(t),計算式為

(6)對Yi(t)進行EMD 分解得到IMF 分量c1i(t),并集合平均得到第2 階IMF 分量c2(t),計算式為

(7)當k=2,3,…,K時,第k階余量rk(t)計算式為

第k+1階IMF分量ck+1(t)計算式為

(8)將k依次遞加,重復步驟(5)—步驟(7),當余量為單調函數時停止分解,得到最終分解結果為

2.2 CEEMDAN能量熵

信號在不同頻率下能量幅值會發生相應的變化,為了反映這種變化,可以在CEEMDAN 分解之后計算各IMF分量的能量分布[16]。

通過對非線性信號進行CEEMDAN 分解可以得到T個IMF 分量,通過熵值計算可以得到相應的能量E1,E2,…,ET。假設最后分解余量忽略不計,由CEEMDAN 分解的正交性可知,分解后的IMF 分量能量之和等于原式功率信號的總能量,從而得到功率信號在頻率域上的能量分布。CEEMDAN能量熵HEN定義為

其中,

式中:pi為第i個本征模函數的能量占總能量E的比重;Ei為第i個本征模函數的能量。

3 退化狀態聚類識別

3.1 KFCM算法

轉轍機結構復雜,其退化過程具有模糊、隨機的特點,且其功率信號非平穩非線性。KFCM 算法為無監督聚類算法且核函數的引入更適用于處理非線性數據,具有在沒有人為干預條件下通過數據特征尋找潛在數據結構[17],從而將數據劃分為不同退化階段的能力,可以很好地解決轉轍機功率數據退化階段劃分的問題。

KFCM 算法通過核函數將數據通過非線性映射Φ:X→H:Φ(x)=y,將特征映射至高維特征空間,由高維特征空間的線性函數對數據集進行劃分,相比于FCM 算法能夠更精確地進行樣本聚類。

(1)給定原始特征數據集X,聚類個數c,收斂精度ε,由FCM算法初始化聚類中心v0;

(2)定義vi(i=1,2,…,c)為第i個聚類中心,uij(i=1,2,…,c;j=1,2,…,n)為第j個樣本第i類的隸屬度函數,KFCM目標函數為

式中:U={uij};v={v1,v2,…,vc};m為加權指數;為Φ(xj)到Φ(vi)之間距離的平方;K(xj,vi)為高斯核函數;σ為平滑程度參數。

(3)由拉格朗日乘子法得到U,v的迭代表達式為

3.2 聚類效果評估

為了分析KFCM 算法分類的準確度,采用分類系數F和平均模糊熵H進行聚類效果評估。

分類系數為隸屬度的均方值,F越接近1,聚類效果越好。

平均模糊熵反映了隸屬度分布所蘊含的信息熵的大小,H越接近0,聚類效果越好。

3.3 轉轍機退化狀態劃分

以S700K 轉轍機退化狀態為研究核心,以其使用壽命內功率曲線數據為研究對象,構建轉轍機退化狀態識別模型,具體流程示意圖如圖3 所示。首先通過CEEMDAN 算法將功率曲線數據展開為多個IMFs,根據其能量密度獲得特征向量集;其次由KFCM 聚類算法進行轉轍機退化狀態劃分;最后通過分類系數和平均模糊熵對KFCM 算法聚類效果進行綜合評估,證明所提方法的有效性。

圖3 退化狀態劃分示意圖

4 試驗驗證及結果分析

4.1 特征提取

為驗證基于CEEMDAN 算法與KFCM 聚類算法進行轉轍機退化狀態研究方法的可行性,對某鐵路公司1 臺發生轉換阻力異常故障的轉轍機進行研究,向前回溯該發生故障的轉轍機3 個月內的正常動作功率曲線數據共434條進行分析驗證。

由CSM 采集的轉轍機動作過程功率曲線作為數據源,通過CEEMDAN 算法進行模態分解并得到能量熵特征。相關系數越大,與原始信號的相關性越高,越能反映原始信號的物理信息,所以通過計算各IMF 分量的相關系數大小確定IMF 分量的個數為8 個。由于每組數據前6 個IMF 能量幅值較高,第6 個以后的能量幅值很小,所以選取前6 個IMF 分量的能量熵作為退化狀態識別數據特征集見表1。

表1 特征參數數據集

4.2 退化狀態劃分

通過KFCM 聚類算法對轉轍機從正常到失效的整個過程進行研究,由退化狀態研究各類參考文獻[9,18]可知,退化狀態通常劃分為3~5 個退化階段。本文將CEEMDAN 分解得到的特征向量進行PCA 降維后得到二維特征向量A1,A2,通過KF?CM 聚類算法對于聚類數目c分別取3,4,5 時進行無監督聚類,KFCM 參數設定為:m=2,?=0.000 01。KFCM 聚類圖如圖4 所示。圖中:P1和P2分別為聚類中心的橫坐標與縱坐標;紅色圓圈為聚類中心。由圖4可知:當c=4時,聚類簇之間的間隔更大,聚類劃分效果更好。通過分類系數和平均模糊熵對于c分別取3,4,5 時的聚類效果進行評估,結果見表2。

圖4 KFCM 聚類等高線圖

表2 聚類效果評估分析

由表2 可知:當c=4 時分類系數為0.956 2,更接近1,平均模糊熵為0.056 1,更接近0,因此c=4 更能展示不同退化狀態之間的特征差異,同種特征之間的差異也最小,所以分為4類時的聚類效果最好。

通過現場調研并與相關技術人員交流溝通,將轉轍機的4種退化過程劃分為正常、輕微退化、中度退化、嚴重退化4個階段,并通過聚類結果對該轉轍機各個退化階段的功率曲線進行分析以證明該聚類算法的有效性,各個退化階段的功率曲線如圖5所示。

圖5 S700K轉轍機各退化狀態功率曲線

由圖5 可知:正常狀態轉轍機功率曲線較平穩;輕微退化狀態功率曲線會產生小幅度波動;中度退化狀態功率值明顯高于輕微退化狀態;而嚴重退化狀態轉轍機因為受摩擦阻力較大而在轉換階段出現了明顯凸起,與聚類結果一致。

4類狀態聚類中心坐標見表3。

表3 KFCM聚類中心坐標

為了驗證本文所提方法的有效性,除去訓練聚類模型所用到的434 條轉轍機正常轉換功率曲線數據,從故障發生前3個月的轉轍機功率曲線數據中繼續等間隔抽取100 條使用壽命內轉轍機功率曲線數據構成測試數據集,對聚類模型的聚類準確性進行分析驗證,最終測試樣本的分類準確率達到95.6%。由于測試數據集中有小部分樣本數據位于2 種退化狀態的邊界位置,對于2 個聚類簇的隸屬度都不高,難以界定屬于何種退化狀態,對于分類準確度有一定的影響,所以仍有4.4%的數據未能準確識別。

不同聚類算法在聚類數目c=4 時的聚類識別結果以及相應的分類系數與平均模糊熵見表4。通過選擇在退化狀態識別領域應用較廣泛的FCM 算法[19]和GK 算法[20]進行比較分析。由于FCM 算法對初始聚類中心較敏感,GK 算法對于球類數據聚類更加有效。由表4 可知:相較于FCM 算法和GK 算法,KFCM 算法聚類效果更佳,具有一定的優越性。

表4 不同聚類方法退化狀態識別比較

5 結語

針對S700K 交流轉轍機運行狀態與其動作功率曲線之間的關系,提出時頻分析與能量熵相結合的S700K 轉轍機退化狀態核模糊聚類分析方法。該方法以轉轍機轉換過程中阻力異常故障的退化發展過程為具體研究對象,根據轉轍機在不同性能退化狀態下功率信號能量分布的差異,利用CEEM?DAN 將非線性功率曲線數據分解成不同的IMF 分量,并根據IMF 分量的能量密度獲得特征向量集,實現轉轍機功率曲線典型特征信息的表征,并在S700K 交流轉轍機退化狀態聚類識別過程中采用KFCM 無監督聚類算法進行聚類,降低主觀經驗對于聚類結果的影響,無需對模型進行訓練即可實現退化狀態識別。

試驗結果表明該方法能夠較好地劃分轉轍機性能退化各個階段的不同狀態,識別準確率達到95.6%,對于鐵路現場轉轍設備的故障預判以及維修維護具有一定的指導意義。

猜你喜歡
轉轍機道岔分量
帽子的分量
一種新型交流轉轍機控制電路在地鐵中的應用
S700K-C轉轍機防水解決方案探討
中低速磁浮道岔與輪軌道岔的差異
一物千斤
場間銜接道岔的應用探討
既有線站改插鋪臨時道岔電路修改
便攜式轉轍機轉換力測試儀
論《哈姆雷特》中良心的分量
S700K轉轍機保持力測試方法探討
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合