?

基于MR-DCA的滾動軸承微弱故障診斷

2024-04-11 07:03肖乾李楷文周生通汪寒俊賓浩翔常運清
華東交通大學學報 2024年1期
關鍵詞:注意力機制卷積神經網絡

肖乾 李楷文 周生通 汪寒俊 賓浩翔 常運清

摘要:【目的】針對滾動軸承微弱故障難以識別的問題,提出了一種基于MR-DCA的滾動軸承故障診斷方法?!痉椒ā坷米畲笙嚓P峭度解卷積以及共振稀疏分解的方法對輸入樣本進行預處理,可以有效地濾除原信號中的噪聲,突出故障沖擊成分。將所獲得的故障分量的二維時頻圖以及原始信號作為網絡的訓練樣本,經兩個特征學習模塊后,使用注意力機制對輸入特征進行篩選,通過權值重分配可以有效地提高模型計算效率和識別精度。為了驗證模型性能,使用某大學的滾動軸承微弱故障數據進行故障診斷分析,同時開展消融實驗,對診斷模型各個模塊的有效性進行驗證?!窘Y果】結果表明,所提出的方法識別準確率更高,且具有更快的訓練速度和迭代速度?!窘Y論】所提模型在進行滾動軸承微弱故障診斷時可以實現良好的診斷性能。

關鍵詞:最大相關峭度解卷積;共振稀疏分解;卷積神經網絡;注意力機制

中圖分類號:TH133;U270.1 文獻標志碼:A

本文引用格式:肖乾,李楷文,周生通,等. 基于MR-DCA的滾動軸承微弱故障診斷[J]. 華東交通大學學報,2024,41(1):113-119.

Research on MR-DCA Based Diagnosis of Weak

Faults of Rolling Bearings

Xiao Qian, Li Kaiwen, Zhou Shengtong, Wang Hanjun, Bin Haoxiang, Chang Yunqing

(Key Laboratory of Conveyance and Equipment of the Ministry of Education of China, East

China Jiaotong University, Nanchang 330013, China)

Abstract: 【Objective】The MR-DCA based rolling bearing fault diagnosis method is proposed for the problem that rolling bearing weak faults are difficult to identify. 【Method】The input samples are pre-processed by using the maximun correlated kurtosis deconvolution and resonance-based sparse signal decomposition, which can effectively filter out the noise of original signal and feature the fault impact components. The obtained two-dimensional time-frequency diagrams of the fault components and the original signal are used as the training samples of the network, and after two feature learning modules, the input features are filtered by using the attention mechanism, and the model computational efficiency and recognition accuracy can be effectively improved through weight reassignment. In order to verify the model performance, a rolling bearing weak fault dataset is used for fault diagnosis analysis, while ablation experiments are carried out to verify the effectiveness of each module of the diagnostic model. 【Result】The results show that the proposed method has higher recognition accuracy, faster training speed and faster iteration speed. 【Conclusion】The proposed model can achieve good diagnostic performance in the diagnosis of rolling bearing weak faults.

Key words: maximun correlated kurtosis deconvolution; resonance-based sparse signal decomposition; convolutional neural networks; attention mechanism

Citation format:XIAO Q, LI K W, ZHOU S T, et al. Research on MR-DCA based diagnosis of weak faults of rolling bearings[J]. Journal of East China Jiaotong University, 2024, 41(1):113-119.

【研究意義】軸承發生微弱故障時,會產生周期性的沖擊,但由于環境噪聲的干擾,從原始信號中分離出故障特征并不容易[1]。如何在軸承早期故障時期實現故障特征的提取并準確識別,是滾動軸承診斷中的關鍵問題。

【研究進展】傳統的時域分析和頻域分析方法往往假設信號平穩且線性,然而微弱故障信號往往呈現非線性、非平穩和非高斯分布的特征,因此難以實現良好的診斷效果[2]。由于故障信號往往表現為沖擊信號,Mcdonald[3]提出了一種最大相關峭度解卷積(maximun correlated kurtosis deconvolution, MCKD)算法并成功實現了齒輪箱故障的診斷。該方法適合對周期沖擊進行分離,是較為典型的盲解卷積方法。然而該方法對于微弱故障信號效果不佳,且解卷積效果依賴于算法參數的選取[4]。在此基礎上,Cui等[5]將VMD和MCKD方法結合實現了對滾動體故障的診斷。宋宇博等[6]將改進的EMD方法與MCKD結合實現了對滾動軸承早期故障的提取。李政等[7]在強噪聲環境下使用MCKD與改進EWT結合的方法實現了滾動軸承早期故障識別。以上改進方法均有效提升了MCKD方法在微弱故障診斷方面的性能,為了實現最佳診斷效果,MCKD方法通常與其他算法結合使用。

共振稀疏分解(resonance-based sparse signal decomposition, RSSD)是Selesnick[8]提出的一種可以將信號平穩循環成分與故障沖擊分離的算法,適用于對降噪信號進行進一步故障分離。孫占龍[9]研究了RSSD方法在滾動軸承故障診斷方面的應用。張守京等[10]使用改進的RSSD方法精確實現軸承復合故障診斷。周飛燕等[11]利用RSSD算法實現了齒輪箱的故障診斷。這些方法都有效實現了對故障沖擊信號的分離,但在強噪聲環境下,RSSD方法并不能實現良好的故障特征分離效果。

卷積神經網絡(convolution neural network, CNN)具有自適應挖掘數據深層次特征的特性,可以實現針對抽象特征的分類識別。趙小強等[12]利用CNN實現了強噪聲工況情況下的滾動軸承故障診斷。雷春麗等[13]利用改進的CNN實現了小樣本情況下的滾動軸承故障診斷。然而上述方法都是從單一的時域或頻域進行特征學習,模型魯棒性不強,可能影響診斷精度。Wang等[14]提出了一種分別將小波系數和原始信號作為雙通道CNN輸入的方法,實現了煤礦生產中的微震事件檢測。Song等[15]則利用雙通道CNN對空間光譜特征進行融合,實現了高光譜圖像的分類。張龍等[16]則提出一種雙通道CNN-GRU模型實現了齒輪箱的故障診斷?!娟P鍵問題】然而進行雙通道CNN模型往往計算量大,且有可能因為特征冗余引起過擬合,注意力機制由于其可以對輸入特征進行自適應篩選的特性,在復雜樣本的CNN模型訓練中體現出獨特優勢。

【創新特色】基于上述原因,本文提出一種時頻特征結合的滾動軸承微弱故障診斷方法。通過MCKD與RSSD結合對微弱故障信號進行降噪重構,將重構信號時頻圖以及一維原始信號分別輸入雙通道CNN進行深度特征提取,然后結合注意力機制對時頻特征進行重篩選,最后對滾動軸承微弱故障進行分類,并通過某大學微弱故障實驗數據驗證了提出方法的有效性與優越性。

1 診斷模型與基本理論

1.1 診斷模型

滾動軸承微弱故障往往在時域上表現為能量低強度弱的沖擊信號,為了實現對微弱故障的分離與診斷,本文提出了一種智能診斷模型。模型主要由兩個階段組成,分別是對輸入樣本進行預處理的MCKD-RSSD方法以及開展分類的改進的雙通道CNN模型。模型的診斷流程如圖1所示。

1.2 MR方法

最大相關峭度解卷積本質上是一個濾波算法。在計算過程中,以濾波信號的相關峭度值作為目標函數,利用一個有限沖擊響應濾波器f獲得相關峭度最大時的濾波信號。由于算法突出了信號中的沖擊成分,可以有效地對原信號進行噪聲的濾除,適用于開展后續研究。

共振稀疏分解可以將復雜的信號分解成平穩循環成分和瞬態沖擊成分,瞬態沖擊成分中包含大量故障信息,對其進行特征提取所得的樣本適用于作為深度學習網絡的訓練樣本。但滾動軸承微弱故障信號強度低,強烈的環境噪聲會掩蓋原信號中的沖擊成分,因此共振稀疏分解難以在信噪比低的情況下實現良好的分離效果。

針對以上分析,本文提出將MCKD與RSSD兩種方法結合,并使用粒子群算法分別對兩種算法的參數進行尋優,以實現最好的降噪與微弱故障分離效果。

1.3 改進的雙通道CNN模型

本文通過注意力機制,針對雙通道特征進行權值重分配,有效避免了由于特征冗余引起的過擬合問題,提升了模型的訓練速度以及識別準確率。

1.3.1 注意力機制

為了對診斷模型的融合輸出[H=h1,h2,…,hn]使用注意力機制重賦權值,引入查詢向量q,然后通過權值函數[sh,q]計算查詢向量q和每個輸入[hi]之間的相關性,得出一系列的權值。接下來使用Softmax對這些權值進行歸一化,歸一化后的結果便是查詢向量q在各個輸入[hi]上的注意力分布[a=a1,][a2,…,an],其中每一項數值和原始的輸入[H=h1,][h2,…,hn]一一對應。[ai]計算式如下

根據注意力分布a可以有選擇性的從輸入信息H中提取關鍵信息,DCA架構采用的提取方式為軟性注意力機制,即根據注意力分布對輸入信息進行加權求和,最終結果Context為在識別中對分類結果影響更大的特征。其計算式為

1.3.2 DCA模型架構

將雙通道CNN的輸入以注意力機制的方式相結合,提出一種雙通道融合模型的卷積神經網絡模型DCA(dual-channel CNN combined attention mechanism),模型同時具有對時間和空間的特征處理能力。DCA的結構如圖2所示。對原始信號使用MR方法處理的過程中,無法保證所濾除的全部為噪聲信號,可能部分故障信息也被過濾,因此將原信號及MR方法處理獲得的二維時頻圖共同作為DCA模型的輸入。

DCA模型中每個通道包含兩個特征學習模塊,模塊由卷積層、Dropout層和最大池化層組成。其中上通道的輸入信號為原始信號,因此為一維卷積,輸入樣本的形狀為5 121×1。下通道的輸入信號為二維時頻圖像,因此為二維卷積,輸入樣本的形狀為64×64。在特征提取模塊中,兩個卷積層之間的卷積核數量是不同的。卷積層有16個大小為10的卷積核,第二個卷積層有8個大小為10的卷積核。兩個卷積層的激活函數設為ReLU。Dropout層被添加以防止過擬合,速率設置為0.5。為了降低特征維數,提高計算效率,提取更多的信號判別特征,在架構中加入最大池化層以實現微弱故障特征的放大。最大池化層設置大小為2,步幅為2。經過最大池化層后,連接兩個通道的輸出。經注意力機制進行特征權值重分配后最終輸出預測結果。優化算法為Adam,學習率為0.001,損失函數為二元交叉熵。

2 滾動軸承微弱故障數據集

本文采用某大學的滾動軸承微弱故障樣本進行實驗,使用的數據采集儀器為CoCo80,采樣頻率為25.6 kHz,NSK6203型電機軸承,故障軸承位于電機驅動端與齒輪箱的同步帶連接處,加速度傳感器通過磁體底座部署在電機驅動端蓋中。

在本實驗中,通過加工具有確定損傷直徑和深度的單點缺陷量化故障損傷程度,微弱故障形式統一為寬度2 mm,深度0.5 mm的微裂紋,并模擬了總共3種故障以及正常狀態。其中故障位置包括內圈、外圈以及滾動體3種位置。本實驗使用的滾動軸承如圖3所示,其中圖3(a)為外圈故障,圖3(b)為內圈故障,圖3(c)為滾動體故障,圖3(d)為正常狀態。

在本次實驗中,每種樣本采集8次,每次采集時間為20 s,去除在電機啟動加速時間段的信號,獲得每種故障類型的樣本共500個。每種類型的數據隨機抽取250個,按照80%和20%的比例劃分訓練集和測試集。訓練集樣本共有800個,測試集樣本共有200個。

3 實驗結果與討論

3.1 實驗結果

根據第1節中所提出的診斷模型,使用MR方法對輸入信號進行降噪重構,并對重構信號使用短時傅里葉變換得到低共振分量二維時頻圖如圖4所示。其中,M1為外圈故障,M2為內圈故障,M3為滾動體故障,M4為正常狀態??梢园l現,經處理所獲得的二維時頻圖像,可以觀察到多條水平清晰的條紋,說明經處理獲得的信號有效分離出了特征頻率并且在整個信號的持續時間均穩定存在。由此可以確定,噪聲信號被有效濾除,微弱故障沖擊得到有效凸顯。

將經MR方法處理得到的二維時頻圖以及一維原始信號進行重構,以適應DCA訓練格式。重構后模型上通道的輸入為5 121×1的原始信號樣本,下通道的輸入為64×64的二維時頻圖。試驗環境設置如下:Windows 10 64位操作系統,運行內存為16 GB,顯卡為NVIDIA Quadro P600,程序語言為Python 3.6,程序運行環境為TensorFlow 2.1.0。訓練時單次訓練迭代大小、批大小、Adam算法學習率分別為30,100,0.001。為了充分利用訓練數據集,嚴格評價DCA的學習性能,采用10倍的分層k-fold交叉驗證。

繪制程序首次運行時,訓練樣本與驗證樣本的損失函數以及準確率隨著訓練迭代的變化曲線,如圖5所示??梢园l現,在前10次迭代中,訓練樣本與驗證樣本的損失函數值迅速下降,模型快速擬合;隨后損失函數下降趨勢減緩,在第20次訓練迭代后兩損失曲線幾乎重合,下降斜率趨近于0,并在第23次迭代后停止下降,此時損失函數值停止下降且接近于0,模型完成收斂。而訓練樣本與驗證樣本準確度曲線在前15次訓練迭代中迅速上升,準確度值接近0.98。在第18個單次訓練迭代后準確度曲線重合,斜率為0,值達到最大0.981。

為了直觀地顯示模型診斷效果,使用混淆矩陣將測試集分類結果可視化,如圖6所示。為了避免結果的偶然性,對輸入數據進行10次隨機重組,每次劃分不同的訓練集以及測試集,取10次診斷的平均結果作為模型的最終準確率。最終計算得出10次診斷的平均準確率為98.1%,證明本文方法具有很好的分類性能,且模型的魯棒性與泛化能力優異。

3.2 消融實驗與結果討論

為了探索注意力機制和MR方法對識別準確性和效率的貢獻,本節開展了一項消融研究。分別構建了3個診斷模型,第1個模型為將未經過MR方法處理過的時頻圖像及原始信號分別作為DCA輸入。第2個模型則為將經過MCKD-RSD處理過的時頻圖及原始信號作為不加入注意力機制的傳統雙通道CNN輸入(MR-DC)。第3個模型為沒有MR方法處理且未加入注意力機制的雙通道CNN模型,分別比較這3個模型的性能。

分別將測試集輸入到訓練好的模型中,為避免結果的偶然性,多次訓練模型并開展診斷,取10次診斷的平均結果作為模型的最終準確率。計算得MR-DC模型、DCA模型以及DC模型的平均診斷精度分別為90.6%,87.1%以及80.1%。

為了進一步對比4種模型的性能,分別對4個模型統計其單次訓練時間以及達到收斂的迭代次數,本文以準確率不再變化作為模型收斂的判據。結果見表1。

由表1可知,所提出的MR-DCA模型在3個指標上的表現都明顯優于其他3個模型。對于MR-DC模型,輸入的樣本時頻圖具有更小的噪聲,且原信號中的平穩循環成分被濾除,微弱故障沖擊成分明顯,相對于沒有經過MR方法處理的樣本,具有更加明顯的特征,有效地提升了識別的準確性。而對于DCA模型,由于注意力機制的存在,可以自適應地對融合特征進行重賦權,對于結果影響不大的特征權值被降低,加快了模型的訓練時間,同時減少了達到收斂所需要的迭代次數。因此,本文提出的MC-DCA模型,在去除噪聲和平穩循環成分保留微弱故障沖擊的基礎上,通過注意力機制減少了輸入特征的冗余,并通過權值重分配保留了對識別結果影響更大的特征,節省了算力的消耗,提升了整體診斷效率。

4 結論

1) 提出了一種基于MR-DCA的滾動軸承微弱故障診斷方法。首先通過MR方法對DCA模型的輸入進行重構,有效實現了對原始信號的降噪重構以及微弱故障的凸顯。同時在雙通道CNN模型的基礎上加入注意力機制,增強了模型的特征提取能力和整體計算效率,提高了診斷模型的精度。

2) 通過消融實驗驗證所提出方法的優越性,分別將本文提出的MR-DCA模型與MR-DC、DCA、DC模型對比,并對實驗結果進行討論。結果表明,本文所提出的方法識別準確率更高,且具有更快的訓練速度和迭代速度。

參考文獻:

[1]? ?劉湘楠, 趙學智, 上官文斌. 強背景噪聲振動信號中滾動軸承故障沖擊特征提取[J]. 振動工程學報, 2021, 34(1):202-210.

LIU X N, ZHAO X Z, SHANGGUAN W B. The impact features extraction of rolling bearing under strong background noise[J]. Journal of Vibration Engineering, 2021, 34(1): 202-210.

[2]? ?張菀. 基于信號稀疏表示的滾動軸承微弱故障特征提取方法研究[D]. 南京: 東南大學, 2018.

ZHANG W. Study on weak fault feature extraction of rolling element bearing based on signal sparse representation[D]. Nanjing: Southeast University, 2018.

[3]? ?MCDONALD G L, ZHAO Q, ZHOU M J. Maximun correlated kurtosis deconvolution and application on gear tooth chip fault detection[J]. Mechanical Systems and Signal Processing, 2012(33): 237-255.

[4]? ?張龍, 蔡秉桓, 熊國良, 等. 小波濾波與最大相關峭度解卷積參數同步優化的軸承故障診斷[J]. 振動工程學報,2021, 34(6): 1313-1322.

ZHANG L, CAI B H, XIONG G L, et al. Bearing fault diagnosis based on synchronous optimization of wavelet filter and MCKD parameters[J]. Journal of Vibration Engineering, 2021, 34(6): 1313-1322.

[5]? ?CUI H J, GUAN Y, CHEN H Y. Rolling element fault diagnosis based on VMD and sensitivity MCKD[J]. IEEE Access, 2021 (9): 120297-120308.

[6]? ?宋宇博, 劉運航, 朱大鵬. 自適應UPEMD-MCKD軸承故障特征提取方法[J]. 振動與沖擊, 2023, 42(3): 83-91.

SONG Y B, LIU Y H, ZHU D P. Adaptive UPEMD-MCKD rolling bearing fault feature extraction method[J]. Journal of Vibration and Shock, 2023, 42(3): 83-91.

[7]? ?李政, 張煒, 明安波, 等. 基于IEWT和MCKD的滾動軸承故障診斷方法[J]. 機械工程學報, 2019, 55(23): 136-146.

LI Z, ZHANG W, MING A B, et al. A novel fault diagnosis method based on improved empirical wavelet transform and maximum correlated kurtosis deconvolution for rolling element bearing[J]. Journal of Mechanical Engineering, 2019, 55(23): 136-146.

[8]? ?SELESNICK I W. Resonance-based signal decomposition: A new sparsity-enabled signal analysis method[J]. Signal Processing, 2012, 91(12):2793-2809.

[9]? ?孫占龍. 基于共振稀疏分解的滾動軸承故障診斷方法研究[D]. 北京: 北京交通大學, 2017.

SUN Z L. Study on fault diagnosis of rolling element bearings based on resonance-based sparse decomposition[D]. Beijing: Beijing Jiaotong University,2017.

[10] 張守京, 慎明俊, 楊靜雯, 等. 改進的共振稀疏分解方法及其在滾動軸承復合故障診斷中的應用[J]. 中國機械工程, 2022, 33(14): 1697-1706.

ZHANG S J, SHEN M J, YANG J W, et al. Improved RSSD and its applications to composite fault diagnosis of rolling bearings[J]. China Mechanical Engineering, 2022, 33(14): 1697-1706.

[11] 周飛燕, 金林鵬, 董軍. 卷積神經網絡研究綜述[J]. 計算機學報, 2017, 40(6): 1229-1251.

ZHOU F Y, JIN L P, DONG J. Review of convolutional neural network[J]. Chinese Journal of Computers, 2017, 40(6): 1229-1251.

[12] 趙小強, 張亞洲. 利用改進卷積神經網絡的滾動軸承變工況故障診斷方法[J]. 西安交通大學學報, 2021, 55(12): 108-118.

ZHAO X Q, ZHANG Y Z. Improved CNN-based fault diagnosis method for rolling bearings under variable working conditions[J]. Journal of Xi'an Jiaotong University, 2021, 55(12):108-118.

[13] 雷春麗, 夏奔鋒, 薛林林, 等. 基于MTF-CNN的滾動軸承故障診斷方法[J]. 振動與沖擊, 2022, 41(9): 151-158.

LEI C L, XIA B F, XUE L L, et al. Rolling bearing fault diagnosis method based on MTF-CNN[J]. Journal of Vibration and Shock,2022, 41(9): 151-158.

[14] WANG Y J, QIU Q, LAN Z Q, et al. Identifying microseismic events using a dual-channel CNN with wavelet packets decomposition coefficients[J]. Computers & Geosciences, 2022, 166: 105164.

[15] SONG H F, YANG W W, DAI S S. Using dual-channel CNN to classify hyperspectral image based on spatial-spectral information[J]. Mathematical Biosciences and Engineering, 2020, 17(4): 3450-3477.

[16] 張龍, 甄燦壯, 易劍昱, 等. 雙通道特征融合CNN-GRU齒輪箱故障診斷[J]. 振動與沖擊, 2021, 40(19): 239-245.

ZHANG L, ZHEN C Z, YI J Y, et al. Dual-channel feature fusion CNN-GRU gearbox fault diagnosis[J]. Journal of Vibration and Shock, 2021, 40(19): 239-245.

第一作者:肖乾(1977—),男,博士,教授,江西省“井岡學者”特聘教授。研究方向為軌道車輛運行品質分析與評價,軌道車輛運維裝備研究與開發,CAX/VR/AR。E-mail: jxralph@qq.com。

通信作者:李楷文(1997—),男,碩士研究生,研究方向為齒輪箱故障診斷。E-mail: 490819906@qq.com。

猜你喜歡
注意力機制卷積神經網絡
面向短文本的網絡輿情話題
基于自注意力與動態路由的文本建模方法
基于深度學習的問題回答技術研究
基于LSTM?Attention神經網絡的文本特征提取方法
基于注意力機制的雙向LSTM模型在中文商品評論情感分類中的研究
InsunKBQA:一個基于知識庫的問答系統
基于卷積神經網絡溫室智能大棚監控系統的研究
基于深度卷積神經網絡的物體識別算法
深度學習算法應用于巖石圖像處理的可行性研究
基于深度卷積網絡的人臉年齡分析算法與實現
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合