?

基于堆疊稀疏判別自編碼的滾動軸承智能故障診斷方法

2024-03-12 03:21曾夢潔李舜酩李冉冉李家誠徐坤
軸承 2024年3期
關鍵詞:特征提取約束故障診斷

曾夢潔,李舜酩,2,李冉冉,李家誠,徐坤

(1.南京航空航天大學 能源與動力學院,南京 210016;2.南通理工學院 汽車工程學院,江蘇 南通 226002;3.西北工業大學 無人系統技術研究所,西安 710072)

作為旋轉機械的關鍵部件,滾動軸承的運行狀態對機械的健康運轉具有重要影響。 為減小機械故障維護成本和不必要的設備損耗,研究滾動軸承的故障診斷方法十分必要[1]。傳統故障診斷方法主要是基于振動信號的處理分析,隨著智能診斷方法的發展,深度學習成為故障診斷應用的研究方向。深層網絡相比于淺層網絡能夠取得更好的診斷結果:文獻[2]提出了基于多傳感器信息融合的軸承故障診斷模型,采用一維卷積神經網絡(1DCNN)對某航空發動機軸承故障振動數據進行特征提取與分類,獲得了比其他淺層網絡更優的診斷性能:文獻[3]提出了一種基于循環神經網絡的時變工況下軸承智能故障診斷框架,利用長短期記憶(LSTM)網絡存儲和傳輸分類信息,同樣獲得了優于傳統神經網絡故障診斷方法的結果。

深度學習模型是由數據驅動的模型,能夠自動標記數據并學習數據特征。簡單的有監督模型易受數據輸入和參數調整的影響,無監督模型則具有良好的特征挖掘能力,常用于特征提取和數據聚類。自編碼網絡(Auto Encoder,AE)是無監督模型中的典型方法,已經廣泛應用于各種領域,由于自編碼的結構特性而能夠在無需標簽的情況下對數據規律進行深入分解并實現特征提取和數據降維。文獻[4]提出了一種批量歸一化自編碼器的新網絡用于滾動軸承智能故障診斷,能夠在軸承原始振動信號中提取顯著特征并解決轉速波動下的故障診斷問題。文獻[5]開發了一種稱為變體稀疏過濾的無監督稀疏特征學習方法,能夠學習具有最佳稀疏分布的特征,準確識別滾動軸承單一故障和復合故障。

盡管無監督學習在數據特征提取方面具有良好的發揮,但所提取特征未必是有利于分類的特征。為增強模型性能,將有監督模型特點與無監督模型特點相結合的半監督模型獲得了青睞:文獻[6]提出了一種分層稀疏人工神經網絡,將動態時間窗口與堆疊稀疏自編碼相結合構建了動態稀疏堆疊自動編碼器 (DSSAE)并對動態故障數據進行分類,仿真表明DSSAE的性能優于稀疏自編碼和堆疊稀疏自編碼;文獻[7]提出了一種增強深度自編碼網絡,采用最大相關熵代替均方誤差作為自編碼器的損失函數,加入稀疏懲罰項和嵌入非負約束因子的收縮懲罰項進一步減小重構誤差,通過灰狼優化算法自適應地選取網絡關鍵參數,試驗結果表明該方法具有更強的特征提取能力與穩定性,對變工況下的軸承振動數據也能達到較高的識別精度;文獻[8]針對旋轉機械傳感器信號樣本有限從而影響深層網絡模型訓練學習的問題,提出一種結合改進殘差自編碼網絡與類自適應方法的故障診斷模型以應對小樣本數據,結果表明該模型能夠在微量標記振動數據的不同工況下有效提高故障診斷準確率。

在現有研究中,較少學者針對數據類的結構特性展開分析,而關注數據的結構特性能夠增加特征差異并提高分類性能。文獻[9]提出了一種基于保留局部和全局特征結構的堆疊稀疏自編碼用于故障檢測,能夠使數據盡可能地保留結構特征但并未從特征差異化角度考慮數據分類;文獻[10]提出了一種新的半監督自動編碼器(判別式自動編碼器)提取特征并用于故障診斷,通過最大化來自不同類別的樣本中心之間的距離,判別式自動編碼器能夠為最終診斷提取更多有用的表示,但該方法未考慮數據的結構特性;文獻[11]提出了一種用于滾動軸承故障診斷的特征距離堆棧自動編碼器(FDSAE),具有比現有方法更強的特征提取能力和更快的網絡收斂速度,但由于距離懲罰項的限制,該方法的泛化性較差:上述方法從不同角度考慮了數據的結構特性,從數據結構層面增強了自編碼網絡的性能,但仍存在一定的局限性,針對不同的應用場景仍有改進空間。

為增強自編碼方法的特征提取能力和診斷穩定性,本文結合稀疏自編碼(Sparse AE,SAE)的特性構建堆疊稀疏自編碼(Stacked SAE,SSAE),利用KL散度約束深層網絡神經元稀疏激活度以防止網絡過擬合,結合半監督機制改進傳統網絡并利用標簽信息微調提升模型分類性能,在上述基礎上充分考慮數據類的結構特性,提出一種堆疊稀疏判別自編碼(Stacked Sparse Discriminative Autoencoders,SSDAE)智能故障診斷算法,從類幾何特征和類數據特征2個角度出發充分發掘數據的深層規律,以解決復雜工況下滾動軸承故障診斷結果不理想的問題,實現可靠的滾動軸承智能故障診斷。

1 堆疊稀疏自編碼基本理論

自編碼網絡是一種3層無監督神經網絡模型,最大特點是令輸出y等于輸入x,利用網絡編碼層和解碼層實現對輸入信號的重構,尋找能夠簡要表示原始數據的深層規律。AE模型結構如圖1所示。

圖1 AE模型結構圖

將預處理后的信號數據輸入已經建立的AE模型中,通過隱藏層的編碼函數(一般選用Sigmoid函數)對輸入數據x進行編碼處理,獲取與隱藏層節點維數一致的簡化特征向量,即將原始m維數據映射至隱藏層的n維向量;再通過隱藏層的解碼函數(一般選用Sigmoid函數)對簡化特征向量進行解碼處理,實現對原始數據的重構,即將n維簡化特征向量映射至輸出層的m維數據y。當批樣本數為N時,其重構誤差為

(1)

(2)

(3)

(4)

式中:N為批樣本數;n為隱藏層中神經元的個數;β為稀疏權重因子。

SAE能夠很好地實現數據降維和特征提取,但僅采用單層隱藏層時數據重構能力存在較大限制,往往難以提取特征復雜數據更核心的特征規律。堆疊稀疏自編碼網絡通過堆疊連接多個SAE結構,逐層分析原始數據的深層特征,多個隱藏層能夠層次性的提取數據規律,增強自編碼網絡的特征提取能力。傳統SSAE模型的損失函數為

(5)

盡管SSAE與SAE的損失函數差異不大,但深層網絡能夠比單層網絡提取更多的特征。另外,SSAE的多層稀疏激活度約束能夠充分利用SAE的特性去除高維干擾而提取低維特征,增強自編碼網絡的魯棒性[12]。3層的傳統SSAE網絡如圖2所示,利用上一層隱藏層的輸出訓練下一層SAE,并將最后一層的簡化特征向量通過Softmax函數進行分類,可驗證網絡的有效性[13]。

圖2 SSAE模型結構圖

2 堆疊稀疏判別自編碼方法

2.1 半監督堆疊稀疏自編碼

為增強無監督模型的分類能力,引入半監督學習模式改進傳統的堆疊稀疏自編碼網絡。半監督堆疊稀疏自編碼(Semi-supervised SSAE,SesSSAE)借助深層的編碼器和解碼器無監督的對數據信息進行重構,同時利用KL散度限制深層隱藏層神經元的稀疏激活度,最后采用交叉熵進行有監督限制,對最后一層隱藏層(即特征層)進行分類調整,以完成特征提取和分類的功能。交叉熵函數ECE和SesSSAE的損失函數為

(6)

(7)

SesSSAE充分利用無監督的學習優勢,在訓練過程中添加標簽信息,采用交叉熵函數作為有監督懲罰項,實現對原有神經網絡的分類性能調整,從而提高自編碼網絡的特征提取能力和數據分類性能,增強智能故障診斷算法的準確性和泛化性。

2.2 樣本結構特征約束

由于神經網絡的黑匣子特性,盡管其擁有強大的特征提取能力,但神經網絡所提取特征的含義仍未有明確解釋。為增強自編碼網絡所提取特征的可解釋性以及有效性,本文采用樣本結構特征約束對網絡特征重構過程進行約束。樣本結構特征約束主要分為類幾何特征約束和類數據特征約束2個方面:類幾何特征約束主要從數據可視化角度增強數據特征差異,類數據特征約束主要從數據結構角度保留原有數據結構特征。

類幾何特征主要指數據點在平面上的幾何特性。將樣本數據降至二維并將其以散點形式可視化于平面上,能夠清晰地看出數據的類內聚合性和類間分離性,概括稱為類幾何特征。為量化數據的類幾何特征,引入如圖3所示的擬合圓測量法。

圖3 擬合圓測量法

對于任意在二維平面的一簇散點,都存在一個可以將這簇散點全部圍住的半徑最小的圓,這個圓可以近似描述所包圍散點的特征,稱為擬合圓。通過擬合圓的半徑近似衡量類內半徑,通過擬合圓圓心之間的距離近似衡量類間距離,依據這一思想,假定有M個類,第i類有Nci組數據di,則第i類的類擬合中心點δi與類半徑ri的定義為

(8)

(9)

與此同時,當共有M個類時,類內聚合半徑Rc與類間聚合距離Dc分別定義為

(10)

(11)

為更好地衡量數據的類幾何特性,構造類幾何特征的懲罰項Lcg作為損失函數的一部分,以此約束特征重構方向,即

Lcg=Rc/Dc。

(12)

與類幾何特征不同,類數據特征主要考慮數據原本的結構特性,希望盡量保留數據原有的結構信息。方差是衡量數據信息結構的主要指標,能夠反映樣本在數據層面的差異性。對于存在的Ns組樣本x,方差S(x)可以表示為

(13)

類數據特征分為類內數據特征和全局數據特征。類內數據特征對每個類的原始樣本和重構樣本的方差進行差異衡量,保證網絡對不同故障種類的重構適應性。全局數據特征對全部樣本數據與全部重構特征的方差進行差異限制,保證訓練過程整個網絡的重構穩定性。假設N組樣本中共有M個類,第i類有Nci組數據di,類內數據特征和全局數據特征分別表示為

(14)

(15)

式中:f(·)為對樣本數據取特征層特征;xi為N組樣本中的第i組樣本數據。

通過方差范數對全局樣本的重構數據進行約束,保證網絡特征重構的穩定性和方向性。類數據特征在損失函數中的懲罰項Lcd為

Lcd=Fc+Fg,

(16)

樣本結構特征約束從特征可解釋性和有效性角度出發,在幾何角度和數據角度約束特征的重構方向,增強自編碼網絡所提取的特征的可靠性和分類性。因此,樣本結構特征懲罰項的損失函數Lc為

Lc=μ1Lcg+μ2Lcd,

(17)

式中:μ1,μ2分別為幾何權重因子和數據權重因子。

2.3 基于SSDAE的滾動軸承故障診斷

為解決復雜工況下旋轉部件故障診斷精度不理想、穩定性差的問題,本文提出主要由SesSSAE結構和樣本結構特征約束組成的SSDAE智能故障診斷方法,其完整結構如圖4所示:首先,基于傳統SSAE模型,引入半監督訓練機制利用標簽信息對特征分類結果進行微調,彌補無監督機制的缺陷;然后,結合樣本結構特征約束,從類幾何特征和類數據特征角度對網絡訓練過程進行約束,限定重構特征的重構方向,在保證重構數據完整性的同時增強特征差異;最后,將提取的特征經過Softmax分類器進行分類并輸出故障診斷結果。

圖4 堆疊稀疏判別自編碼框架圖

SSDAE智能故障診斷方法的詳細參數見表1,其完整損失函數為

(18)

表1 SSDAE模型具體參數

SSDAE智能故障診斷方法的流程如圖5所示,主要診斷步驟如下:

1)采集振動數據,利用數據增強的方式獲取樣本,將時域信號轉換為頻域信號。

2)將獲取的樣本劃分成訓練集和測試集。

3)網絡參數初始化,設定關鍵超參數,如網絡層數、神經元個數、迭代步數、批大小等。

4)將訓練集輸入至SSDAE網絡中進行批訓練,計算損失函數值,由梯度下降法迭代更新網絡權重。

5)當滿足閾值停止迭代,保存網絡參數。

6)將測試集輸入訓練完成的SSDAE模型中進行測試,進行故障診斷和故障識別。

3 試驗驗證

3.1 數據集描述

選取美國凱斯西儲大學(CWRU)的滾動軸承數據集進行SSDAE算法驗證,試驗軸承型號為SKF 6205,選擇采樣頻率48 kHz的驅動端信號作為試驗數據,樣本集的詳細劃分見表2,樣本集A/B/C/D均包括4個工況(0,1,2,3 HP分別對應1 797,1 772,1 750,1 730 r/min)下各10種軸承故障類型,每種故障各600組樣本。采用小樣本長度重疊采樣的數據增強模式以增加樣本數量,每組樣本的長度均為600,隨機抽取25%的樣本作為測試集,余下劃分為訓練集。

表2 CWRU樣本集A/B/C/D的詳細劃分

3.2 樣本結構特征約束驗證

采用t-SNE降維可視化方法對提取的特征層進行降維分析,直觀地對比不同約束條件下所提取的特征,從而驗證本文所提樣本結構特征約束的有效性。在參數相同的情況下,選擇以下4種方法進行對比分析:1)本文所提SSDAE;2)SSDAE_NOLc,在本文所提方法的基礎上去掉樣本結構特征的約束項;3)SSDAE_NOLcg,在本文所提方法的基礎上去掉類幾何特征的約束項;4)SSDAE_NOLcd,在本文所提方法的基礎上去掉類數據特征的約束項。

4種方法在樣本集B測試集上的特征層的t-SNE可視化結果如圖6所示:1)在沒有類幾何特征約束的情況下(圖6a),盡管在類數據特征影響下各類別的聚攏性較好,但各類間的差異較大,類分離性仍有增強的空間;2)在沒有類數據特征約束的情況下(圖6b),數據的類間分布相對均勻,但各類內部的數據分布較為分散,體現了類幾何特征對數據類內分布間距的約束作用;3)對比圖7c和圖7d可知,有樣本結構特征約束情況下(圖6d),各類在二維平面上的數據分布變得更加均勻分散,增強了不同故障特征的差異性,對于單組類別,圖6d的類別更加的緊湊,散點分布較為勻稱,證明所提SSDAE方法具有良好的特征提取性能。

(a) SSDAE_NOLcg

3.3 對比分析

選取4種相關的方法(LGSSAE[9],FDSAE[11],DisAE[10]和BNAE[4])進行對比分析以研究SSDAE方法的故障診斷性能。分別在4組樣本集上進行試驗,每種方法在每組樣本集的測試結果選擇10次結果的均值以避免試驗結果存在的隨機性。

由表3的試驗結果可知:BNAE的表現較差,最高平均準確率僅85.07%;LGSSAE和FDSAE表現相差不大,均在樣本集A上取得了最高平均準確率,分別為88.45%和92.87%,盡管FDSAE的最高平均準確率高于LGSSAE,但LGSSAE的標準差更小,即其穩定性優于FDSAE方法;DisAE取得了較好的診斷效果,最高平均準確率達97.25%,而且標準差數值較小,體現了良好的穩定性;本文SSDAE方法的標準差與DisAE相差不大,同樣表現出了較高的穩定性,而SSDAE方法的最低平均準確率也高達98.80%,表現出良好的準確性。

表3 不同方法在測試集上的平均準確率

為更直觀地分析這幾種方法的診斷效果,選取其在樣本集D上連續的10次試驗結果進行分析,如圖7所示:SSDAE和DisAE具有良好的穩定性,各次試驗的準確率相差不大;與其他4種方法相比,SSDAE方法展現出了最優的診斷準確率,體現了該方法的準確性和穩定性。

3.4 可視化分析

為進一步分析SSDAE方法的性能,將其在樣本集D上的第10次試驗結果可視化,混淆矩陣如圖8所示:所有類型的故障均在訓練集上實現了100%的準確率,說明該方法對數據有較強的學習能力;測試集中,雖然故障類型1,2,3,6,7有個別錯分的數據,但其余故障類型則實現了100%的準確率,說明SSDAE能夠對數據特征進行良好的識別,實現可靠的故障診斷。

(a) 訓練集

4 結論

本文提出了一種可用于復雜工況下旋轉機械部件故障診斷的堆疊稀疏判別自編碼智能故障診斷算法,通過CWRU數據集的試驗驗證得到如下結論:

1)半監督機制能夠改良傳統無監督網絡,增強網絡分類性能。

2)所提出的樣本結構特征約束機制能夠從樣本幾何特征角度和樣本數據結構角度約束特征重構的方向,增強自編碼網絡的特征提取能力。

3)SSDAE方法在多組樣本集的多次試驗中均取得了良好的故障診斷準確率,具有較強的可靠性和穩定性。

猜你喜歡
特征提取約束故障診斷
“碳中和”約束下的路徑選擇
約束離散KP方程族的完全Virasoro對稱
基于Daubechies(dbN)的飛行器音頻特征提取
Bagging RCSP腦電特征提取算法
因果圖定性分析法及其在故障診斷中的應用
適當放手能讓孩子更好地自我約束
基于MED和循環域解調的多故障特征提取
基于LCD和排列熵的滾動軸承故障診斷
基于WPD-HHT的滾動軸承故障診斷
高速泵的故障診斷
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合