?

基于LSTM-CNN 的雙路徑滾動軸承故障診斷

2024-01-10 17:05景斯桐吳東升
沈陽理工大學學報 2024年1期
關鍵詞:故障診斷卷積軸承

景斯桐,吳東升

(沈陽理工大學自動化與電氣工程學院,沈陽 110159)

滾動軸承是機械運轉的核心部件,據文獻[1]估計,40% ~70%的電磁驅動系統故障是由軸承故障引起的。 軸承損壞后會在軸承部件故障區域的振動信號中產生脈沖響應,因此振動信號常作為診斷軸承故障的主要指標[2-4]。

傳統的軸承故障診斷一般過度依賴于專家經驗提取故障特征,難以避免因主觀因素導致的分類錯誤。 深度學習方法的出現為軸承故障診斷提供了新的思路,通過深度學習,可從原始數據中自動提取感興趣信息,確保決策的魯棒性。 文獻[5 -6]將一維輸入信號重構為二維特征矩陣,并將簡單的二維卷積神經網絡(CNN)應用于該特征矩陣,用以對軸承損傷進行分類;文獻[7]采用復雜的預處理方法將時域信號轉化為灰度圖像,實現了更深的二維CNN 診斷三個不同數據集的軸承故障;文獻[8]提出了一種完全基于數據驅動、不依賴于模型自濾波過程的變分模態分解方法(VMD),消除了指數的直流偏移,并與經驗模態分解(EMD)進行了比較;文獻[9]提出了基于變分模態分解的多尺度排列熵(VMD-MPE)和基于粒子群優化的支持向量機(PSO-SVM)相結合的方法診斷軸承故障;文獻[10]提出了在現有希爾伯特- 黃(HHT) 過程中加入傅里葉變換(FFT),研究結果表明了在HHT 中使用頻域方法的有效性,證明了FFT 在分析故障軸承非平穩振動信號中的無效性;文獻[11]提出了FFT 及時間抽取(DIT)相結合的方法,并用XGBoost 模型驗證了診斷效果;文獻[12]提出了一種能夠處理原始振動信號的一維CNN,并使用擴張卷積和殘差連接提高對噪聲和域移動的魯棒性,但增加了調整模型參數的復雜性;文獻[13]提出了一種擴展深度卷積神經網絡(EWDCNN)和長短時記憶網絡(LSTM)相結合的方法,提升了一維卷積的精確度,但串聯結構及多層參數也增加了模型訓練的難度。

實際情況中,因為系統很少允許零件運行到故障狀態,并且全卷積網絡不具有從運行數據中捕獲原始時間信息的遠程依賴能力,當以高采樣頻率對振動信號進行采樣時,由于信號中有關聯部分相應的距離較遠,該問題表現更加明顯。 此外,卷積路徑相對較淺的性質也限制了網絡捕捉低級特征的能力。 對時序振動信號進行信號處理雖避免了人工提取特征的主觀性,但會使原始振動信號中的時序特征部分被遺棄,造成特征缺失;同時,將振動信號轉化為二維矩陣輸入卷積網絡,不可避免地丟棄了部分特征數據,并添加了部分冗余特征,使二維CNN 網絡的優勢變為劣勢;一維卷積網絡(WDCNN)雖以較大卷積核對一維振動信號直接進行特征提取,同時減少噪聲干擾,但其對振動信號中的時間信息敏感度不強。

為更好解決上述問題,本文提出一種新的時間序列數據故障檢測與診斷的深度學習模型。 該方法直接作用于原始時態數據,避免了人工特征提取或噪聲去除的需要。 首先,網絡設計成包含深度卷積路徑和LSTM 路徑的雙路徑結構,深度卷積路徑用于特征提取、學習輸入信號特征的復雜表示形式,LSTM 路徑用于幫助網絡捕獲大量跨度長的動態時間特征,實現遠距離依賴關系的建立;其次,使用注意力機制使網絡更聚焦關鍵信息,以提高最終的診斷精度。

1 相關理論

1.1 CNN

CNN 是一種前饋神經網絡,其結構包括多個卷積層、池化層和輸出層。 卷積層負責執行特征提取任務,池化層用于降低數據維度并保留關鍵信息,而輸出層則根據提取到的深層特征進行預測以獲得期望的輸出結果。 CNN 的基本結構如圖1 所示。

圖1 CNN 基本結構Fig.1 Basic structure of simple CNN

由圖1 可知,每個卷積階段均包含一組卷積濾波器和池化層。 卷積濾波器通過一組權重與輸入數據進行卷積,然后應用非線性激活函數從輸入數據中提取高級特征;池化操作是對提取到的特征進行降維處理,減小其空間尺寸,同時通過壓縮特征來凸顯主要信息。 隨著輸入數據在卷積階段從左至右的傳遞,網絡逐漸學習到與特定問題更相關的特征。

1.2 LSTM

LSTM 循環神經網絡架構如圖2 所示,通過引入記憶細胞和門控機制以提高從長輸入序列中學習特征的能力,克服訓練普通循環神經網絡(RNN)的困難。 多個LSTM 單元連接在一起,排除了普通RNN 體系結構中常見的梯度消失問題。

圖2 LSTM 循環神經網絡架構Fig.2 LSTM recurrent neural network architecture

t時刻LSTM 狀態的計算公式為

式中:xt為輸入向量;ft為遺忘門在t時刻的激活向量;it為輸入門在t時刻的激活向量;ot為輸出門在t時刻的激活向量;ct為t時刻的記憶細胞激活向量;ht為t時刻的隱藏狀態激活向量;Wf、Wi、Wo為各自門的輸入內核;Uf、Ui、Uo為各自門的循環內核;bf、bi、bo、bc為偏差;σ為Sigmoid 激活函數;tanh 為雙曲正切激活函數。

1.3 注意力機制

通過注意力機制可以加強LSTM 對于遠距離依賴信息的捕捉能力,摒棄不關鍵信息,加快網絡模型訓練速度。 其公式為

式中:X代表輸入;Y代表輸出;s表示權重分配;Conv1D 表示一維卷積;GAP 表示全局平均池化。

2 基于LSTM-CNN 的雙路徑故障診斷模型

2.1 模型結構

本文提出的LSTM-CNN 雙路徑滾動軸承故障診斷模型結構如圖3 所示。

由圖3 可見,深度卷積路徑包含五個卷積階段用于特征提取、一個降維階段用于壓縮提取到的特征矩陣。 每個卷積階段包括:一組1D 卷積濾波器,從輸入信號中學習有意義的特征;整流線性單元激活函數(ReLU),將非線性引入網絡;批歸一化模塊[14]通過減少內部協方差偏移優化訓練過程;最大池化模塊對輸入進行下采樣,增強局部平移不變性和特征映射。

深度卷積路徑的第一個卷積層使用寬濾波器,抑制輸入信號中的高頻噪聲并捕獲長距離依賴關系。 其余卷積層使用較小的卷積核,使卷積路徑能夠獲取輸入信號的深層特征。 此外,在LSTM 路徑的RNN 模塊之前,添加了一個1D 卷積層,抑制輸入信號中的高頻噪聲,有助于學習有用的特征以輸入到RNN 模塊。

雙路徑架構中的RNN 模塊主要負責捕捉跨越多個時間步長的動態時間特征,LSTM 路徑學習到的全局時間特征可以彌補卷積路徑感受野的局限性。 注意力模塊篩選關鍵特征,并將重新分配權重的特征向量傳送到全連接層。 最后,特征向量與Softmax 函數結合,提高分類結果的準確性。

2.2 模型訓練

為了在訓練中更新模型權重,使用隨機梯度下降優化器(SGD),并使用類別交叉熵函數評估網絡的訓練和驗證損失。 類別交叉熵函數將模型輸出預測的分布向量與一個真值標簽向量進行比較,模型的輸出越接近該向量,該次訓練的損失就越低。 在訓練過程中,采用Recurrent dropout 函數[15]和Standard dropout 函數[16]來減少過擬合現象,提高模型的泛化能力。 在RNN 單元中,輸入和隱藏狀態均以0.1 的概率應用Recurrent dropout,該Recurrent dropout 僅針對更新單元狀態的部分,以使某些元素在長期記憶中不再起作用。為了防止過擬合,在卷積路徑和LSTM 路徑上,模型在級聯之前均以0.5 的概率應用Standard dropout,從而隨機丟棄部分神經元。

3 實驗結果及分析

3.1 實驗數據集

為驗證本文提出的LSTM 和CNN 雙路徑模型在故障診斷應用中的有效性,使用凱斯西儲大學軸承數據中心的基準軸承故障數據集。 具體故障描述見表1。

表1 軸承故障描述Table 1 Description of bearing failures

由于深度學習模型需要大量數據進行訓練,但在故障狀態下機器很難長時間運行,可用的數據較少。 為此,使用數據增強方法擴充訓練數據集,降低過擬合風險。 具體方法為采用滑動窗口技術從輸入序列中提取多個重疊樣本,每個輸入序列增強后被賦予與原始輸入序列相同的故障標簽,使模型能更好地學習和識別故障。

3.2 模型參數

LSTM-CNN 雙路徑滾動軸承故障診斷模型參數如表2 所示。

表2 LSTM-CNN 雙路徑滾動軸承故障診斷模型參數Table 2 Parameters of LSTM-CNN dual-path rolling bearing fault diagnosis model

LSTM 路徑由128 個RNN 模塊組成,因此在捕捉長期動態信號的能力和學習復雜性之間能取得良好的平衡。

3.3 實驗結果分析

為了驗證提出的LSTM-CNN 雙路徑滾動軸承故障診斷模型的準確度,將其與SVM[17]、MLP、CNN、LSTM、WDCNN[18]五種方法進行實驗比較。 所有實驗均在相同環境和相同數據集下進行,實驗結果如表3 所示。

表3 SVM、MLP、CNN、LSTM、WDCNN 與LSTM-CNN 滾動軸承故障識別率對比Table 3 Comparisons of SVM,MLP,CNN,LSTM,WDCNN and LSTM-CNN rolling bearing fault recognition rates

由表3 可知,LSTM-CNN 診斷模型的識別效果好于對比模型。 深度學習方法明顯優于傳統的機器學習故障診斷方法,并且因為數據結構的特殊性,LSTM 網絡比CNN 網絡診斷效果更優,這得益于LSTM 能夠接受可變長度的輸入并具有強大的對于時間的建模能力。 而WDCNN 模型因具備更深層次的卷積結構,并且相比于LSTM 來說,具有更少的參數量,可以保證尺度、移位和軸承故障檢測失真不變性。 本文提出的LSTM-CNN 雙路徑模型,很好地結合了CNN 和LSTM 的優點:一維卷積在進行特征提取時信息不丟失,還能過濾數據,消除噪聲干擾,提供給RNN 模塊可靠的序列數據;雙路徑模型結構既能實現深卷積結構捕獲可靠的、復雜的輸入信號特征,還能通過RNN 模塊對大量的遠距離、跨越時間的動態特征進行有效提??;通過注意力機制,針對級聯后的特征進行權重的重新分配,最終提升了電機軸承故障診斷識別率。

在模型訓練過程中,網絡會隨迭代過程記錄模型的故障識別準確率和損失。 實驗比較了LSTM-CNN 雙路徑模型和WDCNN 次優模型,訓練過程準確率曲線如圖4 所示。

圖4 訓練過程準確率曲線Fig.4 Accuracy curves of training process

由圖4 可知,基于雙路徑的LSTM-CNN 模型在60 次迭代后準確率接近100%,相較于單路徑的WDCNN 模型,呈現明顯優勢。

損失曲線代表模型的收斂速度,LSTM-CNN的損失曲線如圖5 所示。

圖5 LSTM-CNN 的損失曲線Fig.5 Loss curves of LSTM-CNN

由圖5 可見,基于雙路徑的LSTM-CNN 模型的收斂速度很快,相比WDCNN 模型能更好地擬合數據的真實標簽,表明該方法能直接在振動信號中學習更加全面的特征。

LSTM-CNN 模型故障分類的混淆矩陣如圖6所示。 圖中:B 代表球斷層;IR 代表內圈故障;OR代表外圈故障。 圖6 中縱坐標對應的每行數據代表此類別故障被錯誤判斷為其他類別故障的百分比,橫坐標對應的每列數據則代表其他類別故障被錯誤判斷為該類故障的百分比。

圖6 LSTM-CNN 混淆矩陣Fig.6 LSTM-CNN confusion matrix

由圖6 可知,除故障大小為0.007 英寸的內圈故障和故障大小為0.007 英寸的球斷層故障外,網絡取得了接近100%的故障識別精度,表明基于雙路徑的方法能夠較為準確地判斷故障的位置及損傷情況,具有良好的故障分類能力。

4 結論

本文提出了一種基于LSTM-CNN 的雙路徑軸承故障診斷模型,模型能直接對原始振動信號進行處理,實現端到端的故障診斷,結論如下。

1)引入較寬的一維卷積,有效地抑制了原始輸入信號中的高頻噪聲。

2)設計雙路徑結構,結合LSTM 路徑在時間維度上提取的不同信息特征和深卷積路徑提取的局部特征的優勢,與單獨的LSTM 模型和CNN 模型相比,本模型具有更好的準確性。

3)引入注意力機制,對關鍵信息更加關注,使得在同等內存條件下,模型訓練收斂速度更快,減少故障診斷的資源投入。

猜你喜歡
故障診斷卷積軸承
軸承知識
軸承知識
基于3D-Winograd的快速卷積算法設計及FPGA實現
軸承知識
軸承知識
從濾波器理解卷積
基于傅里葉域卷積表示的目標跟蹤算法
因果圖定性分析法及其在故障診斷中的應用
一種基于卷積神經網絡的性別識別方法
基于LCD和排列熵的滾動軸承故障診斷
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合