?

基于時序圖推理的設備剩余使用壽命預測

2024-02-03 10:41劉雨蒙王宏安
自動化學報 2024年1期
關鍵詞:時序關聯傳感器

劉雨蒙 鄭 旭 田 玲 王宏安

隨著高新技術的發展和生產工藝的進步,一大批科技含量高、結構復雜的設備已經投入到我國工業和國防等領域.但設備中某些部件在運行過程中由于疲勞磨損、腐蝕、老化等原因,設備性能的退化將無法避免,一旦因性能退化造成設備失效,可能會引起事故和不必要的人員傷亡,造成災難性的后果以及重大的經濟損失[1-2].剩余使用壽命(Remaining useful life,RUL)預測作為設備故障預測與健康管理(Prognostics and health management,PHM)的關鍵技術之一[3-5],可以在設備性能退化初期對其RUL 進行精確的預測,為運維人員的預防性維修和備件訂購等活動提供指導性依據[6],較大程度上減少不必要的停機時間,避免事故的發生,進而有效保障設備的安全性和可靠性,并提高任務的完成率[4,6].

當前,對RUL 預測技術的分類包括基于機理模型的預測方法、基于數據驅動的預測方法以及基于機理模型和數據混合驅動的預測方法[7-8].傳統的以專家經驗為主的機理模型RUL 預測方法通過設備的失效機理,結合設備先驗知識構建數學模型,并利用實時采集的監測數據,實現對設備的RUL預估[9].常見的用于RUL 預測的機理模型包括Paris 模型、Forman 模型以及在兩個模型基礎上進行各種改進的模型[10].但隨著設備或系統的結構復雜性變高以及設備運行環境的多樣性,故障模式和失效機理也變得更為復雜,導致難以建立精確的機理模型.

近年來,隨著傳感器技術的革新,獲取設備的狀態監測數據變得愈發容易[11-12].這也給數據驅動的RUL 預測方法提供了契機,可以緩解機理模型對復雜設備建模困難的問題[13-14].同時,由于深度學習技術迅速發展,在各個領域的數據分析任務中都展示出超越性.采用深度學習的RUL 預測方法可以不依賴設備或系統的機理知識,實現退化特征的自動提取,進而實現端到端的RUL 預測[15].目前,普遍采用的深度學習方法進行RUL 預測主要包括以下幾類: 卷積神經網絡(Convolutional neural network,CNN)、循環神經網絡(Recurrent neural network,RNN)、時間卷積網絡(Temporal convolutional network,TCN)及Transformer 模型[16].

具體而言,卷積神經網絡基于不同大小的感受野組合,學習同一時間段內不同感知節點間的關聯關系,從中發現設備退化狀態,進而預測其RUL[17].Babu 等[18]首次提出基于CNN 的RUL 預測模型,通過卷積層和池化層來捕獲傳感器信號特征,結合多層感知機(Multilayer perceptron,MLP) 對軸承RUL 進行預測.Li 等[19]進一步采用時間維度的卷積層和池化層自動學習多維時間序列特征,并利用前饋神經網絡對RUL 進行預測.卷積神經網絡能夠關注不同傳感器節點間的關聯關系,發現其退化特征信息,但對時序特征的提取能力不足,不利于預測設備RUL 這一具有顯著時序特性的任務.

為此,大量研究人員[20-21]采用RNN 模型或長短時記憶網絡 (Long short-term memory,LSTM)[22-25]等改進方法進行設備的RUL 預測.例如,Zheng 等[22]提出了LSTM-FNN 模型用于預測航空發動機RUL,模型在LSTM 層上新增了一個前饋神經網絡用于提升模型預測性能.康守強等[25]提出了SAE-LSTM 滾動軸承RUL 預測模型,利用改進SAE 對滾動軸承振動信號實現無監督的特征提取,并將提取出的深層特征作為滾動軸承的性能退化特征.同時,通過引入Bi-LSTM 以實現滾動軸承過去和未來信息的充分利用,從而完成滾動軸承當前壽命預測.然而,LSTM 或者門控循環單元 (Gated recurrent unit,GRU)等循環神經網絡模型處理較長歷史數據效率較低.針對此類問題,部分研究人員[26-28]利用TCN 中的因果卷積來學習更深層的特征,獲得更大的感受野,以便模型能夠更好地學習序列的時間相關性.如Chen 等[26]采用TCN 對航空發動機RUL 進行預測,性能得到了提升.

為了更好捕獲時間序列數據中的長期依賴關系,并自主發現設備發生退化的關鍵時間點,部分學者[29-31]采用Transformer 模型實現對設備的RUL預測.例如,Mo 等[29]提出了一種基于預訓練模型的預測框架,以Transformer 模型中的編碼器作為模型主干,通過自注意力機制,挖掘不同傳感器的感知數據規律關聯,以及與RUL 的關聯關系,實驗結果表明該方法能夠顯著降低預測誤差.然而,Transformer 模型仍未能利用設備在運行過程中的各部件的狀態變化趨勢,其具體體現為無法學習不同傳感器關聯關系的變化規律.從而為圖神經網絡特別是基于時序圖神經網絡的RUL 預測模型提供了動機.

綜上所述,當前深度學習模型主要關注各傳感器局部時間范圍的關聯,未考慮在一個較長周期內各傳感器之間的關聯關系模式及其影響、變化情況.實際上,不同傳感器節點之間的感知數據存在一定的關聯,如正關聯、負關聯、傳遞關聯等.而在設備運行的不同階段,關聯性也會隨之改變,預示著設備性能的退化.以飛行器工作為例,在其運行早期,相近的部件之間可以保持振動模式的一致性、傳遞性;而隨著工作架次的累積、部件的老化和結合部的松動,這種一致性會逐步減弱,并預示著潛在的設備故障的出現.為此,利用不同傳感器節點間關聯關系的模式規律、演變趨勢,同樣能夠反映出設備的穩定性變化,進而為設備RUL 預測提供更加充分的佐證.

為此,本文提出一種基于多變量分析的時序圖推理模型(Multivariate similarity temporal knowledge graph,MSTKG),能夠充分利用傳感器運行狀態耦合關系及其變化趨勢,挖掘其中蘊含的設備性能退化信息,用于設備RUL 精確預測.通過構建多個連續時間切片內的傳感器節點關系圖,并基于連續的圖結構進行表示學習,充分發現設備各部件間的狀態時空關聯,刻畫不同傳感器節點間關聯關系的變化過程.該模型能夠預測未來時刻的節點屬性、關聯以及整體信息,從而作為設備RUL 預測的分析依據.

本文主要貢獻如下:

1) 提出一種基于圖推理的剩余使用壽命預測框架,能夠利用不同傳感器關聯關系的變化趨勢,發現設備性能退化,從而預測RUL;

2) 設計一個時序圖卷積神經網絡,通過聚合不同傳感器節點的特征值,實現節點關系的表征學習,該結果可以用于壽命預測、節點相關性預測等多個任務;

3) 基于基線數據的大量實驗分析表明,所提出的方法能夠更加準確地預測設備的RUL.

本文內容組織如下: 第1 節介紹RUL 預測的任務描述和問題定義;第2 節介紹用于感知數據表示和RUL 預測的多變量分析時序圖推理模型;第3 節介紹實驗設置與結果分析;第4 節為本文總結.

1 剩余使用壽命預測問題描述

本節對RUL 預測任務進行描述,包括運行設備的基礎系統設定以及壽命預測的問題形式化定義.

1.1 設備工作狀態感知系統基礎設定

本文所提出的模型主要面向具備多種工況、在不同部件集成了多個傳感器的設備進行剩余壽命預測.具體地,假設運行中的設備在不同部分共集成了N個傳感器,定義為 {S1,S2,···,SN}.每個傳感器以t0頻率進行數據采集,記錄其所在部件的工作狀態參數,如振動幅度、溫度、風速等.所有的感知數據形成數據集合{{d11,d12,···},{d21,d22,···},···,{di1,di2,···},···,{dN1,dN2,···}},其中,d ij表示第i個傳感器在第j個運行時刻采集的感知數據.一般地,本文所提出的預測模型允許感知數據屬于不同類型,也允許傳感器節點擁有不同的采集頻率.針對不同類型的感知數據、不同采集頻率,采用歸一化分析與數據對齊方法,實現數據預處理.

傳感器節點將采集到的感知數據傳輸至中央節點,進行數據分析.具體地,假設設備在工作T個運行時刻后出現故障,則在任意輪次T0,設備的RUL記為 |T-T0|.

1.2 剩余壽命預測問題定義

RUL 預測問題定義為: 通過對多個傳感器的感知數據進行分析,估計設備可以正常運行的時間長度.

2 基于多變量分析的時序圖推理模型

本節創新性地提出了用于設備RUL 預測的多變量分析時序圖推理模型,能夠充分挖掘多傳感器時序特征和傳感器間關聯關系的演變趨勢.主要介紹傳感器節點關聯關系時序圖構建、關聯特征學習網絡設計、感知數據時序特征編碼以及RUL 預測損失函數設計.

2.1 模型概述

提出基于多變量分析的時序圖推理模型,用于RUL 預測.模型整體結構如圖1 所示,主要由3 個部分組成.時序圖構建模塊將每個傳感器的感知數據劃分為若干時間片,每個時間片對應一個關聯圖,圖中節點間的關聯關系由該時間片內的感知數據決定.多個時間片形成按時序排列的節點關聯圖序列.節點關聯特征學習模塊采用局部循環編碼網絡,分別針對傳感器節點時空關聯演變特征和原始感知數據信息進行建模與表示學習,從前一模塊輸出的關聯圖序列中學習設備的狀態特征.最后,采用回歸模型將設備狀態特征映射到連續空間中,實現RUL 預測.

圖1 MSTKG 模型結構圖Fig.1 Structure of MSTKG model

2.2 時序圖構建

布置在設備各部分的傳感器節點,可以通過數據感知的方式,記錄設備不同部分的運行狀態.而不同時段、相近傳感器節點的感知數據關聯關系,能夠刻畫設備各部分間的耦合狀態.這一狀態本身及其變化,隱含著設備穩定性、性能退化情況,可以作為設備健康情況的評估依據.為此,設計時序圖結構,實現不同時段下傳感器節點的關聯表示.具體而言,時序圖結構定義如下:

定義1.假設G={G1,G2,···,GK}為一個時序圖序列,其中,Gi={Vi,Ei}為對應第i個時段的時序圖,Vi表示第i個時段的節點集合,記為Vi={vi1,···},Ei表示節點集合Vi間的關聯,其中eijk∈Ei表示v ij與v ik間的關聯類型.

時序圖模型能夠刻畫節點在不同時段的關聯關系,從而建模其變化趨勢,為RUL 預測提供相關信息.具體構建過程如下: 將時序圖中節點定義為各個傳感器,即

為便于記錄,略去時間段下標,簡記為{v1,v2,···,vN}.時序圖中邊的定義方式如下:

假設任意兩個節點間存在關聯性,通過邊的權值表示.具體地,針對e ijk,即第i個時間段內傳感器vj與vk的關聯,首先截取數據子序列

其中,P為一個時間段的時間長度.對于每一對數據子序列Dji與Dki,首先采用min-max 方法對感知數據進行歸一化處理,并采用動態時間歸整 (Dynamic time warping,DTW) 算法兩兩計算數據子序列之間的相似度,作為節點關聯性度量

Sim是子序列之間的相似度,DTW 是一種常用的序列距離度量方法,能夠衡量兩個序列的模式相似度,并允許存在模式的偏移和拉伸.如圖2 所示,DTW 方法會自適應地尋找兩個序列的最佳匹配模式.

圖2 DTW 示意圖Fig.2 Illustration of DTW

DTW 度量方法能夠刻畫兩個序列間的模式關聯性,并且不受時間偏移的影響,能夠更好地表示傳感器節點間的狀態關系,如振動在設備不同部分的傳遞情況以及振動周期變化等.同時,本文所提出的預測模型同樣適用于余弦相似度等關聯度量方法.具體計算過程中,DTW 通過動態規劃方法,找到兩個序列的最近距離匹配模式,并計算出距離,動態規劃計算公式為

其中,D TWi,j代表時間序列 {x1,x2,···,xi}與{y1,y2,···,yj}之間的DTW 距離,對應于時序圖中的Dji與Dki,abs 為絕對值函數.假設時間序列x的總長度為N,y的總長度為M,則x與y的DTW距離為 D TWN,M,該距離具有速度無關性,即不會受到時間序列形狀伸縮的影響.

隨后,對同一時間段內所有節點對計算其感知數據子序列的DTW 距離,并對相似度進行歸一化處理.將相似度取值范圍均勻劃分為Nr個區間,分別標記為 {R1,R2,···,}.針對每一對傳感器節點,通過將相似度歸入相應的區間,并采用相應區間標識,實現從連續相似度到離散關系的轉化.DTW相似度的歸一化計算及關系類別轉化公式如下

其中,N ormalizedSim為歸一化后的相似度,T0為輸入數據中的最后一個時刻,N為傳感器個數;Nr為劃分出的區間個數,即關系數目,為向下取整,eijk為第i個時間段內節點vj與vk之間的關系,max,min分別表示最大值和最小值函數.

基于上述方法,構建出用于RUL 預測的時序圖序列G={G1,G2,···,GK},作為推理模型的輸入.

2.3 節點關聯特征學習網絡

節點關聯特征學習網絡基于傳感器感知數據和時序圖結構進行特征學習,主要包含兩個特征維度:傳感器節點關聯的時序特征和原始感知數據的時序特征,本節將分別針對這兩個部分的模塊設計進行介紹.

2.3.1 傳感器節點關聯特征編碼

提出局部循環編碼器,基于同一時段不同傳感器、以及傳感器在不同時段的狀態關聯關系,通過傳感器節點狀態表示,學習關聯特征變化趨勢,為RUL預測提供依據.其輸入為前一步驟構建的時序圖序列G={G1,G2,···,GK},以及圖中各個節點的隨機初始化特征.

采用圖卷積網絡(Graph convolutional network,GCN),從節點數據相關性角度對時序圖中的信息進行聚合,并在多個時間片段之間使用GRU 進行演化,學習傳感器節點不同時間段的關聯關系變化.

首先,在每一個時間段內,GCN 通過如下公式聚合多個關系以及多跳傳感器鄰居節點的信息,形成目標傳感器節點的特征表示

其次,在多個時間段之間使用兩個GRU: 實體GRU 和關系GRU,進行演化特征的學習,刻畫傳感器節點在設備運行過程中的狀態變化情況,即關聯關系變化趨勢.

GRU 是一種基于門控機制的循環神經網絡,通過組合多種不同作用的門結構,對時序數據進行建模,能夠支撐節點不同時段的狀態特征傳遞.具體計算公式如下

針對實體GRU,其具體演化特征表示公式如下

通過上述GCN 和GRU 模塊的計算,最終的輸出為傳感器節點特征矩陣和關聯特征矩陣,實現基于時序圖序列全面表示傳感器節點之間在空間、時間上的狀態變化及關聯.

2.3.2 感知數據時序特征編碼

時序圖主要用于刻畫傳感器節點間的狀態變化,重點利用了感知數據所蘊含的關聯關系.然而,感知數據中固有的對設備運行狀態變化趨勢的記錄,同樣可以為RUL 預測提供依據.為此,在時序圖推理的基礎上,引入對原始感知數據的編碼和時序特征學習.

具體地,在實體GRU 和關系GRU 對實體嵌入和關系嵌入進行演化學習時,引入原始傳感器數據,擴充特征語義.實體GRU 的特征聯合公式改進如下

基于上述編碼,將原始感知數據融入特征表示,并結合GRU 充分學習其時間變化特性,支撐RUL 預測.

2.4 剩余使用壽命映射及損失函數

在RUL 映射部分,通過回歸分析,利用時序圖推理所得的傳感器節點特征Ht和傳感器關聯特征Rt,獲得對設備RUL 的預測.

回歸分析主要包含兩個步驟:

原始特征拼接: 將特征矩陣轉化為一維向量,支持后續回歸分析,其具體公式為

其中,f latten(·) 為向量扁平化操作.

RUL 估值分析: 將一維特征輸入單層神經網絡,輸出RUL 預測值,其公式為

最后,RUL 預測任務的損失函數為均方根誤差(Root mean square error,RMSE),損失函數如下

其中,Dtest為測試數據集.

3 實驗分析

本節主要對所提出的模型進行實驗分析.首先,對基線數據進行介紹,并結合數據特點進行數據預處理和特征選擇.其次,介紹本實驗的實驗設置、對比算法和預測結果的評價指標.然后對本文提出的模型與對比算法的結果進行分析,并通過消融實驗對模型中不同組合進行分析.最后,選取測試集中兩個發動機單元進行案例分析,驗證模型的有效性.

3.1 數據準備

在CMAPSS (Commercial modular aeropropulsion system simulation)數據集上進行實驗測試,驗證模型的有效性.CMAPSS 數據集來自于第一屆PHM 國際會議[32],由名為C-MAPSS 的渦扇發動機仿真模型建立,通過仿真模型模擬渦扇發動機退化過程.其內部根據不同的設置可以分為FD001、FD002、FD003 和FD004 四個數據子集.每個數據子集包括訓練數據集和測試數據集,訓練集為發動機從初始狀態運行到完全失效的數據集合,測試集為發動機的退化數據集合.

每個數據子集是由26 個參數構成,其中第一個參數為發動機編號,第二個參數為時間編號,第三個參數到第五個參數為運行狀態,最后21 個參數為發動機重要的傳感器監測數據,重點用于發動機RUL 預測,如表1 所示.

表1 CMAPSS 傳感器數據描述Table 1 The description of CMAPSS sensor data

數據集涉及6 種運行狀態和2 種故障模式,根據不同的運行狀態和故障模式進行分類,如表2 所示.FD001 和FD003 分別只在一種狀態下運行,FD002 和FD004 分別在6 種狀態下運行.其中,FD001 和FD002 數據集中只包含高壓壓氣機故障,FD003 和FD004 包含了兩種故障模式,分別為高壓壓氣機故障和發動機風扇故障.

表2 CMAPSS 數據集中4 個子集的細節信息Table 2 Detailed information of four subsets of CMAPSS dataset

在數據預處理階段,由于傳感器數據具有不同的取值范圍,采用min-max 歸一化方法對傳感器數據進行歸一化處理,其公式為

其中,d ij表示第i個傳感器在第j個運行時刻采集的感知數據,表示歸一化后的傳感器數據,T為設備運行的最后一個時刻,N為傳感器個數.

圖3 為FD001 1 號發動機傳感器監測數據歸一化處理后的非零結果,由于部分傳感器監測數據在歸一化后數值為零,意味著這些監測數據在整個生命周期中非常穩定,甚至為常量,這些傳感器在RUL 預測中沒有提供有用的信息.因此,實驗選取了14 個具有顯著波動的傳感器監測數據作為輸入,包括編號為2、3、4、7、8、9、11、12、13、14、15、17、20 和21 的傳感器.

圖3 FD001 1 號發動機傳感器監測數據Fig.3 Sensor monitoring data for engine unit 1 of FD001

此外,與其他模型不同,本文所述模型需要對時序數據進行采樣來構造時序圖.采樣窗口以固定的步長在每一個數據單元內滑動采樣,并且將窗口內最后一個時間戳的RUL 作為生成的知識圖譜快照的RUL 標簽.

最后,由于系統在運行初期不會發生退化,故系統退化在其生命周期的早期階段可以忽略不計,本文參照文獻[4],采用分段線性模型為數據集打上RUL 標簽,即對RUL 的最大上限值設定為125,(R ULmax=125).

3.2 實驗設置及對比算法

3.2.1 實驗設置

在PyTorch 1.6.0 和DGL 0.5.2 上實現了所提出的基于多變量分析的時序圖推理模型.基于多組參數的測試結果擇優選擇,將采樣窗口長度L設定為5,步長S設定為1,關系數目R設定為10,并將RULmax設定為125.隨機選取數據集(FD001、FD002、FD003、FD004)的80%和20%分別作為訓練集和測試集.

對于時序圖編碼部分,將嵌入維數d設定為100,GCN 中的層數設定為2,dropout 率設定為0.2,時序圖歷史的長度m設定為7,在演化過程中對梯度進行歸一化處理.使用Adam 進行參數學習,其學習率設定為0.001,并且使用梯度裁剪來避免梯度爆炸.

最后,在回歸分析階段,使用一個單層的帶偏置MLP 進行RUL 的預測.

3.2.2 對比算法

分別選取基于卷積網絡、循環神經網絡和編碼解碼機制的代表性模型作為對比算法.

CNN (2016)[18]、CNN-FNN[19]沿時間維度對傳感器數據進行卷積操作,利用FNN 對RUL 進行預測.

DCNN-FNN[33]使用空洞卷積CNN 替換上述工作中的CNN,擴大卷積核的感受野來提高模型的預測精度.

LSTM-FNN[22]使用LSTM 直接對傳感器數據進行建模,以自回歸的方式訓練模型,并且通過FNN 提高RUL 的預測精度.

RBM-LSTM-FNN[30]在LSTM 之前附加了一個受限玻爾茲曼機,以無監督的方式進行預訓練,自動從未標記的原始訓練數據中提取退化相關的特征.

Autoencoder[21]通過無監督的方式訓練一個雙向LSTM,對健康指數(Health index,HI)曲線進行建模,然后結合基于相似度的曲線匹配技術以及零中心規則來計算RUL.

GCU-Transformer[29]通過卷積門控提取局部特征,利用Transformer 的編碼層對高維傳感器數據以及局部特征進行編碼,最后使用單層神經網絡解碼得到RUL.

3.2.3 評價指標

本實驗采用RMSE 和Score 指標作為RUL 預測任務的性能指標.RMSE 定義如下

其中,N為測試單元的數目.Score 指標通過縮放,讓偏向于預測更少剩余壽命的模型獲得更好的評價,其定義如下

其中,ei表示第i個測試樣本上的預測值與真實值的差值.考慮到剩余壽命預測時,偏小的預測結果可以供操作人員提前應對,引發的后果更輕,因此,Score 指標可以作為RMSE 的補充.

3.3 剩余使用壽命預測結果分析

表3 展示了本文模型MSTKG 以及對比算法在CMAPSS 的4 個子集上進行RUL 預測的結果.具體地,由于4 個數據子集規模不同,采用加權平均方法計算結果均值.結果表明,MSTKG 在FD002和FD004 上的性能優于最先進的模型.針對RMSE指標,性能在FD002 和FD004 上的提升分別為0.89 和1.29,并且在4 個子集的平均性能上提升了0.58.針對Score 指標,MSTKG 模型在FD002和FD004 上的提升分別為1 044.09 和455.4,并且在4 個子集的平均性能上提升了671.9.

表3 CMAPSS 數據集實驗性能對比Table 3 Comparison of experimental performance on the CMAPSS dataset

觀察可知,與Autoencoder 類似,MSTKG 在工作條件復雜、發動機樣本數量更多的數據子集上取得了更好的效果.對于最復雜的FD004 數據集,它共有12 種設置: 6 種運行工況以及2 種故障模式.所提出的模型通過時序圖學習模塊,隱式地表征學習設備各部件狀態的關聯變化,從而擴充了更多的特征維度,可以更加全面地表征設備的整體運行狀態,進而在復雜的數據集上取得最佳表現.

此外,針對4 組數據子集,進一步將MSTKG對數據集中每一個發動機單元的RUL 預測值與真實RUL 值進行比較.RUL 預測結果如圖4 所示,圖4(a)~4(d) 分別為FD001、FD002、FD003、FD004 每個數據子集全部發動機單元的RUL 預測結果,其中發動機編號按照實際RUL 大小降序排列.

圖4 FD001~FD004 RUL 預測結果Fig.4 Prediction results of RUL on FD001~FD004

通過觀察分析可知,MSTKG 在4 個測試集上的結果類似: 針對RUL 較大的測試單元,預測的誤差較大;而針對RUL 較小的發動機單元,預測的誤差較小,預測結果更接近真實值.

具體而言,針對RUL 較大的測試單元,其運行時間較短,設備運轉狀態良好,傳感器難以有效記錄與設備退化相關聯的特征,無法精確估計設備的RUL.但同時,MSTKG 的預測值與真實值的差值相對穩定 (在4 個測試集上均為25 左右),反映出MSTKG 模型在早期的預測穩定性較好.

針對 RUL 較小的測試單元,其運行時間較長,設備各部件出現退化,會體現在傳感器節點的關聯變化.而MSTKG 能夠充分利用這一特點,提升預測精度,特別是針對FD002 和FD004 兩組工況更加復雜的測試集,MSTKG 仍能維持穩定的預測精度,性能優于基于卷積神經網絡及循環神經網絡的方法[29].

為進一步比較MSTKG 針對不同測試單元的性能,在表4 中分組統計了針對4 個測試集前30%、后70% 測試單元的結果.可見,MSTKG 模型的RUL 預測性能表現有較大提升,RMSE 的變化分別為-4.27、-6.63、-3.48、-4.42,印證了MSTKG對感知數據中蘊含的設備各部件關聯變化信息的利用能力.

表4 階段性RUL 預測均方根誤差Table 4 Phased RUL prediction RMSE

3.4 消融實驗

本節通過消融實驗,驗證分析節點關聯特征學習模塊中,各個特征維度對RUL 預測的貢獻程度.具體而言,分別分析傳感器關聯關系的演變特征、傳感器關聯關系的靜態特征、原始感知數據特征對壽命預測性能的影響.這三類特征分別刻畫了傳感器關聯變化信息、關聯關系語義信息、感知數據語義信息.表5 展示了在FD002 數據子集中的消融實驗結果,可以得到如下結論:

表5 FD002 數據子集上對不同結構的消融研究Table 5 Experimental ablation study on different structures on FD002

1) Ours w/o relation evolution,該消融結構移除了關系嵌入的演化模塊,即僅使用靜態關系嵌入.在FD002 數據子集上,RMSE 性能降低了2.54.這表明動態關系嵌入能夠更好地捕獲設備狀態變化,亦即利用傳感器的關聯變化信息可以提升模型的壽命預測性能.

2) Ours w/o relation,該消融結構僅使用關系演變信息,忽略關聯關系本身的語義信息,并且在回歸層也不引入靜態關系嵌入.在FD002 數據子集上,RMSE 性能降低了2.18.這驗證了節點間關聯關系固有的特征信息,對于RUL 預測同樣有影響,并且其影響程度略低于關系的演變特征.

3) Ours w/o origin input,該消融結構不再將原始數據輸入用于實體嵌入和關系嵌入演化的GRU,即不考慮感知數據中蘊含的語義信息.在FD002 數據子集上,RMSE 性能降低了0.99,反映出引入原始數據信息能夠提升RUL 預測結果.

3.5 案例分析

分析傳感器節點關聯與設備RUL 的對應關系,分別選取FD003 測試子集中的39 號和47 號發動機單元進行分析,結果如圖5 所示.

圖5 FD003 中39 號和47 號發動機單元預測結果分析Fig.5 Prediction results analysis of unit 39 and unit 47 engines on FD003

FD003 測試子集中的39 號發動機單元的RUL 如圖5(a)所示,RUL 的預測值由120 逐步下降至20,接近真實RUL.同時,可以發現傳感器節點的關聯關系逐步由高度相關向雜亂無關變化,即圖中表示弱關聯關系的比例逐漸增加(圖5(b)中的0~4 和圖5(c)中的0~3).因此,可以反映出設備各個部件隨著性能退化,其緊密的耦合關系也難以維持.而MSTKG 模型能夠充分利用這一信息,學習節點特征,進行RUL 預測.

FD003 測試子集中的47 號發動機單元的RUL如圖5(d)所示,RUL 的預測值維持在105~110 之間,未出現顯著的性能退化.同時,可以發現傳感器節點的關聯關系也維持在一個相對穩定的范圍.例如圖5(e)中,關聯類型為5~9 的強關聯節點對比例始終維持在0.6 左右.而圖5(f)中,三種關聯程度的占比同樣較為穩定,弱、中、強關聯的節點對比例接近3:4:3.而MSTKG 模型能夠發現節點關聯穩定性,進行較為平穩的RUL 預測.

此外,進一步進行測試分析,觀察在發動機運行的不同階段節點之間關聯依賴的分布變化,以FD004 中的229 號發動機單元為例,其特征變化如圖6 所示.在發動機運行的早期,無論是時間二階段劃分還是四階段劃分,傳感器特征之間的依賴性較強,特征間的DTW 距離相對較小、比較平穩,趨近于平均分布.隨著時間的推移和設備剩余壽命的下降,較小的關系,即較小的DTW 距離,數量逐漸變少,表明特征之間的依賴性逐漸減弱.與之相對,較大的關系逐漸增多,設備特征間整體關聯趨向于無序.MSTKG 模型能夠表征這種關系依賴變化,并將其應用于壽命預測中.

圖6 FD004 229 號發動機單元關聯依賴分析Fig.6 Association dependence analysis of unit 229 engine on FD004

綜上,本文所提MSTKG 方法能夠充分利用傳感器節點狀態關聯關系及其演變情況,發現設備不同部件的退化情況,支撐RUL 預測,其精度在復雜工況下優于現有最佳方案.

3.6 參數分析

最后,測試并分析不同參數設置下預測模型的性能變化.具體地,以FD004 數據子集為對象,分別測試不同時間窗口長度(即單個窗口包含的感知數據序列長度)、相鄰時間窗口的數據跨度以及時間窗口個數3 個參數對模型性能的影響,測試結果如表6 所示.可見,不同的參數設置會對模型的預測性能產生一定的影響.例如增加窗口的個數,會造成模型性能的先升后降,即RMSE 從24.32 改進到21.37、20.86,隨后退化到22.06.這表明模型的特征表示能力存在上限,引入過多的時間窗口會造成特征空間無法充分刻畫時序特征,需要進一步擴充特征向量的維度.同時,當序列長度設置為1 時,模型的輸入數據未蘊含足夠的時序特征信息,進而使得模型性能出現明顯的下降,這也驗證了模型能夠有效利用感知數據的時序特征信息.此外,通過第3組和第5 組參數的比較,可見增加窗口的長度或者增加相鄰窗口間的感知數據跨度,均會導致模型預測性能的下降.

表6 不同參數設置的模型預測性能Table 6 Model prediction performance with different parameter settings

4 結論

本文提出了一種基于多變量分析的時序圖推理模型的設備RUL 預測方法.該模型以設備各部分傳感器節點的感知數據為輸入,分別從傳感器工作狀態的關聯及演化關系、傳感器原始感知數據的變化趨勢等角度,估計設備可以健康工作的剩余時長.模型首先將不同傳感器的感知數據劃入多個時間窗口,并針對每個窗口構建節點關聯圖,構成時序圖序列.隨后,采用圖卷積神經網絡學習傳感器節點特征,并通過門控循環單元實現不同時間窗口間節點狀態的傳遞.在預測部分,解碼得到的時序圖特征通過多層映射回歸分析,預測其對應的RUL 估計值.基于基準數據的實驗結果表明,所提出的模型能夠提升預測的精度,特別是針對工況較復雜的設備.

猜你喜歡
時序關聯傳感器
康奈爾大學制造出可拉伸傳感器
不懼于新,不困于形——一道函數“關聯”題的剖析與拓展
基于Sentinel-2時序NDVI的麥冬識別研究
簡述傳感器在物聯網中的應用
“一帶一路”遞進,關聯民生更緊
“傳感器新聞”會帶來什么
跟蹤導練(三)2
奇趣搭配
基于FPGA 的時序信號光纖傳輸系統
智趣
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合