?

基于局部離群因子的列車衛星定位故障檢測方法

2023-11-13 07:58王韋舒上官偉劉江姜維
鐵道科學與工程學報 2023年10期
關鍵詞:離群鄰域局部

王韋舒,上官偉, ,劉江, ,姜維,

(1.北京交通大學 電子信息工程學院,北京 100044;2.北京市軌道交通電磁兼容與衛星導航工程技術研究中心,北京 100044)

隨著衛星導航技術與鐵路運輸系統的深度融合,基于衛星導航的列車運行系統已經成為下一代列車運行控制系統的重要發展方向。全球衛星導航系統(Global navigation satellite system,GNSS)具有全天候、全天時、高精度的定位特性,能夠為列車運行提供精準的位置服務,有助于降低對地面軌旁設備的依賴,降低運營維修成本[1]。然而,衛星信號傳播過程中容易受到鐘跳、鐘漂、軌道參數建模誤差等的影響而產生階躍故障或斜坡故障[2]。這對于安全苛求的列車運行控制系統而言是難以容忍的,必須采取相應的處理手段保障衛星導航定位結果的可靠性。故障檢測是保障用戶端實現空間位置可靠解算的重要技術,其基本原理是利用統計假設檢驗的方法對冗余觀測信息進行一致性檢驗,識別可能引起較大定位誤差的故障衛星,進而保障定位結果的可靠性[3]。目前,故障檢測方法根據歷元量測信息的使用可分為快照式和序貫式。經典的快照式方法主要包括偽距比較法[4]、最小二乘殘差法[5]和解分離法[6]??煺辗▋H僅采用當前時刻的觀測值,對階躍故障有較好的檢測性能,但對于斜坡故障敏感性較低。而序貫法充分利用了多個歷元數據之間的關聯性,對緩慢增長的斜坡故障具有較好的檢測效果。序貫法以濾波估計算法為基礎,在狀態估計中,濾波跟蹤誤差的存在使得新息量不能真實的反應實際故障偏差,如何降低跟蹤誤差的影響,提高濾波新息的準確度將有助于提升階躍故障或者斜坡故障檢測的性能[7]。一些學者相繼提出了信號權重法、魯棒估計策略和滑動窗口法等用于提高故障檢測準確率和識別速度。ZIEBOLD 等[8]構建了基于載波噪聲比的權重模型引入到擴展卡爾曼濾波估計過程中調整量測協方差矩陣,降低故障量測的影響以提高檢測性能。陳含智等[9]采用滑動窗口法計算濾波新息,實時估計觀測噪聲方差矩陣,進而重構故障檢測量,考慮了動態噪聲對故障檢測準確率的影響。ZHANG 等[10]在滑動窗口法基礎上,引入魯棒濾波估計理論對濾波增益矩陣進行自適應調節,進一步提高故障檢測性能。上述方法都重在考慮觀測噪聲方差矩陣對于新息檢驗量的影響,通過提高觀測噪聲的準確度,進一步提升故障檢測效果。然而,無論是快照法還是序貫法,在進行一致性檢驗中均假設觀測殘差或者新息服從卡方高斯分布來進行故障檢測,這在列車實際運行環境中將面臨一個重大的挑戰。列車運行中觀測信號受到電離層時延或多徑干擾將不再服從高斯分布[11]。單純地假設觀測新息服從某一概率分布模型來檢測是否發生故障并不能與時變的運行環境相匹配。因此,既有的故障檢測算法在列車運行中會面臨不可避免的性能水平下降問題,帶來較大的安全隱患。除了基于統計分布的故障檢測,基于密度的異常檢測隨著大規模數據挖掘的研究深入而逐漸受到研究人員廣泛關注,局部離群因子(Local outlier factor,LOF)作為典型的密度異常檢測方法,通過比較當前數據點與其近鄰數據的密度差異來識別異常數據,不受數據分布不確定性問題的制約。在此思路下,本文提出了一種基于局部離群因子增強的故障檢測方法,通過現場數據對所提方法進行驗證分析,為時變衛星定位觀測環境下的故障檢測提供了新思路。

1 基于局部離群因子的衛星定位故障檢測框架

1.1 系統框架

本文算法由數據感知、狀態估計和故障檢測3個部分組成。在數據感知模塊,衛星接收機用于提供原始的觀測偽距和列車運行過程中的星歷數據,慣性導航系統用于感知列車的加速度和角速度信息,這2種定位傳感器的感知信息將通過濾波算法用于估計列車位置。在信息融合模塊,結合慣性導航方程得到的位置信息和衛星接收機提供的星歷數據獲取預測偽距,將其和衛星接收機的觀測偽距聯合共同構建量測方程,進一步通過擴展卡爾曼濾波進行狀態估計,獲取的估計誤差將反饋給慣性導航系統定位結果。在進行狀態估計前,衛星導航提供的觀測信息首先需要通過故障檢測模塊進行檢測,如果濾波新息的局部離群因子大于檢驗限值,則表明當前觀測量受到運行環境因素的影響存在故障,需要重新更新量測方程后進行狀態估計。具體框架如圖1所示。

圖1 算法框架圖Fig.1 Framework of the proposed algorithm

1.2 狀態估計模型

在信息融合中,需要首先構建組合系統的狀態方程和量測方程??紤]衛星導航接收機鐘差、鐘漂誤差和慣性導航系統陀螺儀和加速度計的量測誤差等,設置17維的狀態估計量,具體表示為

式中:(δφx,δφy,δφz)為地心地固坐標系下3 個方向姿態誤差,(δvx,δvy,δvz) 為三軸速度誤差,(δx,δy,δz)表示3 個方向位置誤差,(εx,εy,εz)表示陀螺儀的三軸漂移誤差,(γx,γy,γz)表示加速度計的三軸隨機誤差,(bclk,)為等效鐘差距離誤差和等效鐘漂距離誤差。

進一步地,將慣性導航系統誤差方程與衛星導航系統誤差方程結合,設計組合系統的狀態方程為

Fk-1為狀態轉移矩陣,由k-1 時刻GNSS 和INS 的誤差傳播模型組成。wk-1為服從均值高斯分布的過程噪聲,相應地協方差矩陣記作Qk。

進一步考慮衛星導航接收機的偽距觀測量ρGNSS和慣性導航系統推算得到的預測偽距ρINS,確定觀測矩陣為

組合系統的量測方程可以表示為

Hk表示組合系統的量測矩陣,vk表示服從零均值高斯分布的量測噪聲,相應的協方差矩陣記作Rk。

利用當前時刻觀測量和前一時刻慣性導航的狀態預測能夠估計當前時刻列車的狀態信息,具體過程如下。

1) 狀態一步預測:

2) 一步預測誤差協方差矩陣:

3) 濾波增益矩陣:

4) 狀態估計:

5) 誤差協方差矩陣更新:

2 局部離群因子基本原理

局部離群因子方法通過衡量觀測數據的局部密度來發現異常數據[12]。其賦予每個數據點一個表征其離群程度的因子,這個因子實質上反映了該數據對象與其特定鄰域范圍內其他數據對象之間的相對密度關系。通過衡量數據點的局部密度,尋找差異化最顯著的點來識別異常數據。局部離群因子的一些重要基本概念如下。

定義1數據p的第K距離

數據集D中,數據點p和數據點q之間的距離表示為dis(p,q)。對于任意正整數N,數據p的第K距離記作Kdis(p),需滿足下述2個條件:

1) 在數據集D中至少有除p點之外的N個數據點Q,滿足dis(p,Q)≤dis(p,q);

2) 在數據集D中至多有除p點之外的N-1 個數據點Q,滿足dis(p,Q)

定義2數據p的第K距離鄰域

數據p的第K距離鄰域是指數據集內所有與p的距離不超過Kdis(p)的數據對象的集合,表示為:

定義3可達距離

可達距離是用來度量2 個數據點之間的距離,數據點q到點p的可達距離為:

定義4局部可達密度

數據點p的局部可達密度是K距離鄰域內數據點到p的平均可達距離的倒數,鄰域內數據點總數記作M,則局部可達密度可表示為:

局部可達密度反應了限定鄰近空間內數據點的聚合程度,如果一個數據與周圍數據有著顯著差異,則相同的K值下,其K距離鄰域的覆蓋范圍較廣且涵蓋的數據較少。異常數據點p落在其鄰域數據點第K距離鄰域內的可能性較小,即對于p的K距離鄰域內的數據點q而言,數據點q到p的可達距離reach_dis(p,q)取兩點之間真實距離的可能性遠遠大于q的第K距離。如果數據點p無顯著性偏差,則reach_dis(p,q)取q的第K距離可能性更大。由此可知,一個潛在異常的數據點其可達距離之和數值較大,計算得到的局部可達密度較小。

定義5局部離群因子

進一步,可根據數據點p及其鄰域點的局部可達密度計算p的局部離群因子

對于一個具有M個鄰域點的數據點p而言,若p存在偏差,計算得到的局部可達密度較小,而其鄰域點的可達距離整體差異性較小,計算得到的局部可達密度較大,因此,偏差數據的局部離群因子較大。相反,如果p與周圍數據點差異性較小,則不同數據點之間的局部可達距離之和沒有顯著變化,局部密度較為均勻,由此得到的局部離群因子比較接近。

3 基于局部離群因子增強的故障檢測方法

基于局部離群因子增強的故障檢測法(Local Outlier Factor-based Enhanced Fault Detection,LOFEFD)是根據密度異常檢測思想所設計,其不依賴于數據集的任何先驗知識,無需提前假定數據集的分布情況,聚焦于數據點與其鄰域數據的密度分布情況。而傳統的基于濾波理論的故障檢測是建立在統計分布理論基礎上,其故障檢測準確率受到假定數據分布模型的約束,當預設分布模型不合理時,將會發生嚴重的漏檢。

LOF-EFD 主要劃分為建立歷史數據集和故障檢測2個部分。建立歷史數據集的目的是通過分析正常條件下衛星信號的觀測數據來獲取控制限。衛星觀測數據質量受到衛星仰角、載噪比等多種因素的影響[13]。較高的仰角不易受到周圍建筑等的遮擋,而較低的仰角則容易受到多徑效應的影響導致量測質量下降。載噪比從信號接收的強度度量所觀測數據的質量情況,受到環境干擾的觀測信號載噪比總是低于正常觀測條件中的。因此,在構建歷史數據集的過程中,通過每一顆衛星的仰角和載噪比衡量對應時刻的數據質量,選擇未受到外界干擾的衛星觀測數據構建檢驗統計量。大多數情況下,當觀測衛星的仰角低于20°并且載噪比低于35 dB-Hz 時,其數據質量嚴重下降,不再用于定位解算過程[14]。

因此,利用狀態估計過程中滿足約束條件的衛星觀測量構建歷史數據集:

其中,n為正整數,表示數據集樣本量,yn由新息和新息協方差矩陣組成,可以表示為:

式中:Δzk為系統實際觀測量與濾波器狀態預測值之差,即新息,Sk為新息協方差矩陣。進一步,通過計算每一個數據樣本與其他數據之間的歐式距離Ed(ya,yb),a,b=1,2,…,n,將X映射到距離數據空間Οn×n。

由定義1 和定義2 可知,一個樣本的第K距離值可以看作是其鄰域的最大展開半徑。按距離從小到大重新排列數據空間On×n,根據設置的鄰域范圍K值,確定每個時刻樣本點的近鄰點,將其近鄰點組成的集合記作N(y)。第K+1 個近鄰點與樣本點yi的歐氏距離即為yi的第K距離,記作Kdis(yi)。

2 個樣本點并不總是互為近鄰點,需結合距離數據空間和每個樣本點的第K距離,才能夠得到鄰域點到yi的可達距離。定義近鄰域點ym?N(y)到yi的可達距離為:

通過遍歷集合N(y),能夠得到yi對應的局部可達密度:

利用每個樣本點的局部可達密度,根據公式(13)可以計算得到歷史數據集中樣本的局部離群因子,記作集合Г{LOF(y1) LOF(y2) … LOF(yn)}。局部離群因子僅僅是反應了每個樣本點的離群程度,為實現故障檢測的目的,利用核密度估計方法估計正常樣本局部離群因子的控制限。對于給定的集合Г,變量y的概率密度函數如下:

其中,G是核函數,通常采用的是高斯核函數。h為平滑參數。

對于給定的誤警率,取常用值0.01[5],置信限值TLOF能夠通過如下得到

故障檢測過程主要是對當前觀測量進行分析,通過與控制限比較判斷其是否受到不確定因素干擾,而存在較大偏差或異常。對于一個新樣本點ynew而言,其與歷史數據集各個樣本之間的歐氏距離空間需要首先被構建,進而通過設置的最大鄰域值尋找相應的近鄰域集Ynew,根據式(22)計算近鄰域點yold?Ynew與ynew之間的可達距離:

利用式(12)得到當前新數據點的局部可達密度,進一步可得到當前數據點的局部離群因子:

通過比較當前局部離群因子與控制限值的大小,能夠判斷是否存在故障。如果LOF(ynew)TLOF,則表示當前觀測量與正常數據存在顯著差異,存在故障。

4 驗證與分析

本文采用西部低密度鐵路列車真實行駛數據對所提出的故障檢測算法進行測試和驗證。車上安裝有諾瓦泰SPAN-FSAS 分體式組合導航定位系統,用于采集衛星原始觀測量和慣性導航數據,并提供高精度的真實位置參考。列車行駛區段位于“日喀則―拉薩”,行駛速度為107~116 km/h,行駛過程中可見衛星數共8 顆,水平精度因子在0.6左右。實驗設備安裝情況如圖2所示。

圖2 實驗設備Fig.2 Experimental devices

用于實驗驗證的數據時間長度為500 s,參與解算的衛星編號分別為10,14,18,22,25,26,31 和32。為充分驗證本文算法在不同故障類型下的性能,將采集數據劃分為2 部分,0~250 s 用于構建歷史數據集,250~500 s用于監測是否存在故障數據。針對典型故障類型,在檢測數據的不同時段分別加入不同大小的階躍故障和斜坡故障,并與基于濾波新息的故障檢測算法(Filter innovation-based fault detection,FIFD)[15]和自主完好性監測外推法 (Autonomous Integrity Monitored Extrapolation,AIME)[16]進行比較。

4.1 階躍故障下檢測性能分析

為驗證不同算法在階躍故障下的檢測性能,在101~150 s 向可見衛星G32 的偽距觀測中添加15 m的階躍故障,圖3所示為階躍故障場景下不同算法的檢測結果??紤]到基于局部離群因子增強的故障檢測法是架構于K最近鄰思想,鄰域參數的選擇影響著數據點的相對密度表征程度。為了選擇合適的鄰域值,首先選擇20,30,40 和50 不同鄰域值進行故障檢測比較。從圖3中可以發現,在故障檢測區域,不同鄰域值下檢驗統計量均超過了檢驗閾值。對于一個較小的鄰域值而言,在無故障區域,會發生一定程度的誤檢。而隨著鄰域值增大40,無故障時間段正常數據的局部密度趨于穩定,當鄰域值繼續增大到50 時,并無明顯變化。因此,選擇40 作為鄰域范圍進一步分析算法性能。在故障檢測區域,FIFD 算法的檢驗統計量一直未超過檢測閾值,AIME 算法僅有部分時刻檢驗統計量超過了檢測閾值,故障檢測率為38%,相比上述2 種算法,本文所提算法分別提高了100%和62%,具備更強的檢測能力。

圖3 不同算法的故障檢驗量Fig.3 Fault detection statistics with different methods

進一步分析故障檢測能力與位置估計之間的影響,圖4顯示了15 m 故障偏差作用下3種算法的水平位置誤差變化情況。從圖中可知,由于FIFD算法未能及時檢測出故障衛星,在故障發生期間其水平位置誤差隨著故障持續時間而不斷增大,均方根誤差為3.24 m。AIME 算法在故障注入初期能夠檢測出故障,剔除故障量測的影響,但隨著故障檢測量低于檢驗閾值,定位性能也隨之發生明顯的劣化,位置估計誤差逐漸緩慢增大,均方根誤差為2.54 m。相較于FIFD 和AIME,由于檢測能力帶來的差異,LOF-EFD 算法的均方根誤差為2.07 m,分別降低了36.1%和18.5%。對故障發生期間定位結果進行統計分析,結果如表1所示。

表1 15 m階躍故障下不同算法定位精度Table 1 Positioning accuracy of different methods under step faults (15 m)

圖4 水平位置誤差變化情況Fig.4 Variation of horizontal position error

為探究算法對不同階躍故障的檢測敏感度,向可見衛星G32的偽距觀測中依次注入9~27 m 的階躍偏差,每種算法的故障檢測率變化情況如圖5所示。從圖中可知,LOF-EFD 能夠識別更微小的故障偏差,當偽距偏差增加到9 m 時,便能夠相繼識別出故障,而AIME 和FIFD 算法需要在偽距偏差增加到13 m和21 m時才能識別出來。

圖5 不同階躍故障下故障檢測率對比Fig.5 Comparison of fault detection rate under different step faults

4.2 斜坡故障下檢測性能分析

為驗證本文算法在斜坡故障下的檢測性能,在101~150 s 內向可見衛星G32 的偽距中添加以0.5 m/s速率增長的緩變斜坡故障,3 種算法的檢驗統計量如圖6 所示,閾值1 為對照算法獲得的檢驗閾值,閾值2 為LOF-EFD 獲得的閾值。故障發生期間,隨著緩變故障的不斷增大,3 種算法的檢驗統計量均逐漸上升,并在故障結束前超過了檢驗閾值,但每種算法檢測到故障的時間延遲不同。局部離群因子增強的故障檢測法計算得到的檢驗統計量在124 s 超過檢驗閾值,隨后一直保持在閾值之上,時延為23 s;AIME算法在第135 s首次識別出故障,相比LOF-EFD 滯后了11 s,故障檢測率為34%,而FIFD 算法在臨近故障發生期結束,即第144 s 才開始識別出來故障,相比所提的算法延后了20 s,故障檢測率僅為14%。與FIFD 和AIME 相比,LOF-EFD 方法分別提升了40%和20%,故障檢測率達到了54%,能夠更加及時的識別出來緩變故障。

圖6 不同算法的故障檢測量Fig.6 Fault detection statistics with different methods

圖7進一步給出了在該種斜坡速率故障條件下3 種算法的定位誤差變化情況。從圖中可知,在故障發生初期由于故障偏差較小,對于定位估計沒有產生影響,隨著故障的不斷增大,3 種算法得到的水平位置誤差都開始呈現上升趨勢,由于LOFEFD 能夠較早的檢測到故障量測,其定位誤差在短暫的增大后下降到正常情況;而AIME 和FIFD算法的定位誤差受到斜坡故障的影響時間較為持久,分別在135 s 和144 s 達到最大定位誤差2.84 m和4 m。對3 種算法在故障發生期間水平位置誤差進行統計分析得,LOF-EFD,AIME 和FIFD 的均方根誤差分別為2.14,2.34 和2.79 m,相比FIFD和AIME 方法,LOF-EFD 在均方根誤差上分別降低了28.6%和9%。故障發生期間定位統計分析結果具體如表2所示。

表2 斜坡故障下不同算法定位精度Table 2 Positioning accuracy of different methods under ramp faults

圖7 水平位置誤差變化Fig.7 Variation of horizontal position error

為探究算法對不同速率斜坡故障的檢測敏感度,向可見衛星G32 的偽距觀測中依次注入0.5,1,1.5,2 和2.5 m/s 的斜坡故障,每種算法的故障檢測率變化情況如圖8所示。從圖中可知,相比較另外2 種對比算法,LOF-EFD 具有更高的檢測率,且能夠識別更小速率的斜坡故障偏差,具備更強的故障檢測性能。

圖8 不同斜坡速率故障下故障檢測率對比Fig.8 Comparison of fault detection rate under ramp rate fault

5 結論

1) 考慮列車衛星定位故障檢測階段通常假設濾波新息服從確定分布進行一致性檢驗,本文在濾波新息故障檢測法的基礎上,引入密度異常檢測思想,構造了基于局部離群因子增強的故障檢測方法,消除了傳統檢驗統計量對數據需滿足卡方高斯分布的假設要求,突破了確定統計分布假設帶來的性能約束。

2) 所提算法對于階躍故障和斜坡故障2種不同類型故障均具有較強的敏感性,能夠檢測出較小的故障。在階躍故障中,當故障偏差超過9 m 時,本文算法可以相繼識別出來,而FIFD 和AIME 方法需要在偽距偏差增加到13 m 和21 m 時才能開始識別出來。在0.5 m/s 速率的斜坡故障中,相比FIFD 和AIME 方法,故障檢測延遲時間分別縮短了20 s和11 s。

3) 所述方法重點聚焦于衛星導航信號在受外界環境干擾條件下發生異常時的故障檢測,尚未考慮慣性導航系統故障時對組合定位系統狀態估計的影響。為此,后續工作將進一步探究組合定位系統各導航定位源的故障機理,對故障來源進行有效區分、識別和排除。

猜你喜歡
離群鄰域局部
局部分解 巧妙求值
非局部AB-NLS方程的雙線性B?cklund和Darboux變換與非線性波
稀疏圖平方圖的染色數上界
基于鄰域競賽的多目標優化算法
關于-型鄰域空間
局部遮光器
吳觀真漆畫作品選
離群數據挖掘在發現房產銷售潛在客戶中的應用
離群的小雞
應用相似度測量的圖離群點檢測方法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合