張瑞婷, 翟 雙, 程 超, 曹文松
(長春工業大學 計算機科學與工程學院, 吉林 長春 130102)
高速列車因其快速舒適的優點,逐漸成為人們出行的首選工具,列車的安全也與人們的生命財產安全關聯愈發緊密。雖然列車事故發生概率較低,但是因其速度快、乘客多,一旦發生事故往往會造成巨大損失。而牽引系統作為高速列車的核心,如何準確、快速地檢測出其故障顯得尤為重要[1]。
故障檢測技術依照傳統分類方法可分為三類:基于模型分析方法[2-6]、基于信號分析方法[7-8]和基于數據驅動方法[9-12]。近年來,基于數據驅動方法尤其是多變量統計方法因其易于實現被廣泛應用在高速列車牽引系統的故障檢測方法中[9-12]。
主元分析方法(Principal Component Analysis, PCA)是多元統計方法中最經典的方法。文獻[13]在PCA和核方法的基礎上提出一種改進的深度主元分析方法(Deep Principal Component Analysis, DePCA),在深度學習基礎上設計一種分層統計模型來提取多層數據特征。PCA的應用要求數據滿足高斯分布和線性相關,顯然實際列車運行的情況下很難滿足。
為了解決非高斯問題,引入獨立主元分析方法(Independent Component Analysis, ICA),ICA設計的初衷是為了解決經典雞尾酒問題(盲源分離問題)[14]。文獻[15]將ICA和PCA相結合,可以同時提取多變量過程的高斯信號和非高斯信號。ICA方法通過盡量去除數據間的相關性解決非高斯問題,但同時也使其很難達到最優效果。
考慮到故障信息有明顯的時間相關性,慢特征分析方法(Slow Feature Analysis, SFA)被引入故障檢測領域[16]。文獻[16]將SFA應用于高速列車齒輪系統,考慮早期故障對齒輪系統的影響,提出基于海靈格距離的解決方案。
文中基于對多元統計方法和高速列車牽引系統的研究,設計一種基于概率相關的改進SFA方法(Probability Related Slow Feature Analysis, PRSFA),并在仿真平臺加以驗證,結果表明,PRSFA有效提高了故障檢測性能。主要工作如下:
1)提出SFA與KLD結合的方法,降維篩選出時間序列的慢速特征,利用故障信息的時間相關性,計算離線與在線慢特征的概率分布距離實現故障檢測。
2)將文中所提方法應用于中南大學的列車牽引控制模擬仿真系統,與已有算法進行對比,結果表明,改進的SFA算法具有更低的誤報率和漏報率,有效提高了故障檢測性能。
考慮CRH2型高速列車,其電氣原理如圖1所示。
圖1 CRH2型牽引系統電氣原理圖
(a) SFA (b) PRSFA
CRH2型高速列車牽引系統主要由牽引控制器、牽引電機、三電平逆變器、牽引變壓器、濾波器等組成,采用的控制策略為空間矢量脈寬調制,在設定了給定的牽引速度后,控制單元可以通過基于空間矢量脈寬調制策略調整三電平逆變器的門控制信號來控制牽引系統[17]。
CRH2型高速列車的牽引系統安裝了如速度傳感器、電壓傳感器、電流傳感器等不同類型傳感器,用于監控列車運行狀態。根據故障發生位置,一般將高速列車的牽引系統故障分為電機故障、傳感器故障、變流器故障、控制單元故障等。監控單元通過比較在線采樣和預先設定的閾值來監測故障,然后激活自動保護系統,現實中,由于存在誤報和漏報的可能,監測單元可能無法正確監測故障,仍需要大量人力沿線排查。因此,盡可能降低誤報率和漏報率尤為重要。
Kullback-Leibler 散度[18]用于測量兩個概率分布之間的差異,文中使用KLD度量慢特征矩陣概率分布之間的距離。對于關于隨機變量x的兩個連續概率分布函數g0(x)和g1(x),它們的KL散度通常表述為
(1)
DKL(g1‖g0)越小,代表概率分布函數g0(x)和g1(x)越相似,DKL(g1‖g0)≥0,當且僅當g0(x)=g1(x)時,DKL(g1‖g0)=0。
由于KL散度是一個非對稱的度量,從g0(x)到g1(x)的KLD不一定與從g1(x)到g0(x)的KLD相同,不適用于距離測量,實際應用中我們采用其改進的對稱形式
(2)
當概率密度函數g0(x)和g1(x)服從正態分布,即g0(x)~N(μ0,σ0),g1(x)~N(μ1,σ1),DKL(g1‖g0)可計算為
DKL(g1‖g0)=
(3)
在數據非高斯的情況下,σ1和μ1可由滑窗計算為
(4)
慢特征算法的核心思想是從變化速度較快的時間序列信號中提取出變化最為緩慢的特征,也是一種特征提取和降維的方法。
對于牽引系統中傳感器輸入數據X(t),將其歸一化得到數據矩陣為
x={x1,…,xm},x∈RN×m,
(5)
式中:N----樣本數;
m----變量數。
對x的協方差矩陣進行SVD分解,
〈xxT〉t=UΛUT,
(6)
式中:〈·〉t----在時間序列的均值。
數據矩陣x的白化過程可以表示為
(7)
白化過程的目的在于消除數據之間的相關性,根據
(8)
(9)
s=xW,
(10)
其中W=QpT,同時,z的協方差矩陣可以計算為
〈zzT〉t==pΣpT,
(11)
式中:Σ----特征值矩陣,Σ={ζ1,…,ζm}。
一般認為慢特征s可分為主元部分sr和殘差部分sd, 其中,sr主要包含牽引系統狀態變化的主要信息,而sd包含較多噪聲信息。
(12)
當s為非高斯,其核函數計算為
(13)
K(·)----核函數。
η可為
(14)
由此,根據慢特征的概率密度分布,式(12)可以進一步寫為
(15)
基于PRSFA,新的T2統計量為
(16)
式中:kir,kid----分別表示訓練數據的主元部分sr和殘差部分sd的KL散度,kir∈RM,kid∈RMe;
Φr,Φd----分別表示kir和kid的協方差矩陣;
M,Me----分別表示主元部分和殘差部分的樣本數量,m=M+Me。
(17)
(18)
故障判別如下:
為了驗證提出方法的有效性,文中采用中南大學針對某類高速列車牽引控制系統(TDCS)建立的模擬仿真系統TDCS-FIB2.0進行仿真實驗。電路參數見表1。
表1 仿真平臺電路參數
基于仿真平臺注入四種傳感器故障,在信噪比30 dB,窗長n=30的條件下進行仿真。
第一類故障f1為傳感器,輸出值偏離正常值。
第二類故障f2為短路故障,相電壓傳感器輸出值為0。
第三類故障f3為增益故障,輸出信號成比例增強。
第四類故障f4為沖擊故障,傳感器的輸出值在某個時刻發生沖擊,默認沖擊值為100。
每組數據采集20 000個樣本,第10 000個樣本時注入故障,其中第四類故障f4較為特殊,第10 000個數據時傳感器輸出值受到沖擊,沖擊于第12 000個數據結束。
表2 檢測性能對比表%
故障f1注入時,如圖 2所示。
故障f2注入時,如圖 3所示。
(a) SFA (b) PRSFA
(a) SFA (b) PRSFA
故障f3注入時,如圖 4所示。
故障f4是一個傳感器沖擊故障,如圖 5所示。
(a) SFA (b) PRSFA
在第10 000個數據時傳感器輸出值受到沖擊,第12 000個數據時沖擊結束,SFA方法和文中提出方法均能表現出其特性,而文中方法顯然在故障檢測性能上表現更好。
從圖表中可以明顯看出,四種故障使用SFA方法和文中提出方法均能成功被檢出,并具有較低時延。相較于SFA方法,提出的基于概率相關慢特征方法在成功檢出故障的同時具有更低的FAR(誤報率)和MAR(漏報率),并且文中方法很好地將MAR降低到0,有效地提高了故障檢測性能。
對高速列車牽引系統和數據驅動的故障檢測方法展開研究,提出PRSFA方法用以減少牽引系統故障檢測中漏報和誤報問題。文中將KLD散度引入到故障檢測方法中,在SFA提取到數據慢特征的基礎上,用KL散度計算慢特征的概率密度函數的KL散度距離,充分利用牽引系統故障數據的時間相關性,其有效性在中南大學設計的牽引系統仿真平臺的測試中進行了驗證。與傳統SFA方法相比,文中提出方法有更好的檢測性能,更低的FAR和MAR,更加適用于高速列車牽引系統的故障檢測。文中工作為高速列車牽引系統的故障檢測問題提出一種可執行方案,同時也為后續研究其牽引系統的壽命預測等方面提供了一個新思路。