?

1DAMCNN方法在滾動軸承故障診斷中的應用

2022-12-20 15:43段浩明王嬈芬
噪聲與振動控制 2022年6期
關鍵詞:空洞故障診斷卷積

段浩明,王嬈芬

(上海工程技術大學 電子電氣工程學院,上海 201620)

在各類旋轉機械中,軸承占有極大比重,軸承是旋轉機械中最關鍵的零件之一,在旋轉機械發生故障時,軸承故障較為常見。一旦發生故障,輕則造成經濟損失,重則造成人員傷亡。為了避免上述情況的產生,軸承的狀態監測以及故障診斷顯得尤為重要。

傳統的智能診斷方法一般都需要先借助于信號處理技術對采集到的信號進行預處理[1],之后人為提取故障特征并通過分類器進行診斷,比如通過支持向量機(Support Vector Machine,SVM)、反向傳播神經網絡(Back Propagation Neural Network,BPNN)和隨機森林(Random Forest,RF)等來實現軸承故障類型識別。謝志謙等[2]提出一種基于自適應噪聲的完備經驗模態分解與本征模態函數(Intrinsic Mode Function,IMF)樣本熵結合的滾動軸承故障特征提取方法。王建國等[3]針對傳統解調分析難以提取軸承故障信息的這一弱點,提出了一種將變分模態分解與最大相關峭度解卷積相結合的滾動軸承故障診斷方法。而上述這些淺層機器學習的故障診斷方法,人工特征提取步驟繁瑣,且對方法參數要求較高。其特征選擇過程十分依賴于專家經驗,無法針對不同任務和數據自動進行特征選擇,并未能實現端到端的故障診斷。為了彌補上述缺點,越來越多的學者研究如何將深度學習理論[4]應用在工業領域中。

卷積神經網絡(Convolutional Neural Networks,CNN)依靠本身具有自適應提取數據特征的能力,近年來在各個方面得到了廣泛的應用。宮文峰等[5]提出了一種基于改進的卷積神經網絡滾動軸承故障快速智能診斷方法,使用全局均值池化技術代替傳統卷積神經網絡的全連接部分;Zhao 等[6]提出了一種卷積雙向長短期記憶網絡,解決了不同工況條件下軸承的故障診斷;Zhang等[7]提出圖像與卷積神經網絡相結合的軸承故障診斷方法,將一維振動信號通過傅里葉變換轉化為二維圖像作為卷積神經網絡的輸入;曲建嶺等[8]設計了基于一維卷積神經網絡的軸承故障診斷算法,實現了“端到端”的故障診斷模式;張偉[9]提出了一種基于直接對時域振動信號進行處理的卷積神經網絡故障診斷方法;吳春志等[10]使用一維卷積網絡進行齒輪箱的故障診斷,實現對故障特征自動提取和分類。

軸承故障產生的情況較為復雜,有時會涉及多種工況。而傳統的卷積神經網絡診斷模型在復雜工況環境下,由于網絡感受野范圍有限,難以提取更多的故障特征信息,無法做出準確的診斷與分類。同時,想要充分利用卷積神經網絡來有效地提取各種復雜的隱藏特征,往往需要提供大量的數據樣本對模型進行訓練。但旋轉機械發生故障時的樣本數據與正常狀態下數據相比較少,使得訓練樣本比例變小時,卷積神經網絡的特征提取和診斷效果變差。

綜合上述分析,在提取故障特征時,往往是需要的上下文信息越多,需要的卷積核感受野越大。為了改進普通卷積的感受野范圍有限的不足,特此將空洞卷積[11]引入到故障診斷中,利用空洞卷積在不增加額外計算量的同時還能擴大感受野范圍的特性,實現對故障特征的提取。并將普通卷積與空洞卷積進行融合,捕獲更加全面的特征信息,通過普通卷積補全空洞卷積留下的盲點。為了充分利用提取到的特征信息,通過加入通道注意力增強故障特征信息的表達能力。在此基礎上,建立了應用于滾動軸承故障診斷領域的端到端深度神經網絡模型。

1 基本理論

1.1 空洞卷積

空洞卷積與普通卷積相比,僅在后者的基礎上增加零填充,并通過設置不同大小的擴張率(Dilation Rate),在不增加額外計算量的同時擴大卷積核感受野。感受野的計算如式(1)所示。

式中:lk為當前層網絡感受野大小,lk-1為前一層網絡感受野大小,fk代表該層卷積核尺寸,Si代表i層步長。卷積核大小為3、步長為1的一維空洞卷積如圖1所示,兩端為填充部分。

圖1 空洞卷積

圖1(a)表示擴張率為1時的空洞卷積,此時空洞卷積也就是普通的一維卷積,卷積的感受野大小為3。圖1(b)表示擴張率為2 的空洞卷積,此時卷積的感受野大小為5。通過調整不同大小的擴張率,就可以獲得不同尺寸的感受野,進而可以獲取多尺度上下文信息。與一維空洞卷積等效的普通卷積核大小的計算公式如式(2)所示。

式中:Fk代表與空洞卷積等效的卷積核大小,fk為真實卷積核大小,d為擴張率。

1.2 注意力機制

在計算機視覺領域的深度學習網絡中引入注意力機制,可以提高模型的特征提取能力,從而達到提高圖像分類或目標檢測等任務準確性的效果。針對故障診斷問題故障類別多且變化不顯著的特點,本文將Wang等[12]提出的通道注意力(Efficient Channel Attention,ECA)引入該領域,借此來提高模型對關鍵特征信息的提取能力。詳細結構如圖2所示。

圖2 通道注意力

圖2 中,X∈RW×H×C代表輸入特征,W、H和C分別為特征的寬度、高度和通道維數;GAP代表全局平均池化(Global Average Pooling),它的作用是沿著空間維度對每一個通道進行特征壓縮,得到各通道的權重值,其計算如式(3)所示:

式中:y代表壓縮生成后的權重,Xc(i,j)為輸入特征X中第i行第j列的元素。通道間的信息交互可以通過卷積操作實現,其中卷積核的大小代表通道信息間交互的覆蓋范圍。其計算如式(4)所示:

式中:Conv1D表示一維卷積,k為卷積核尺寸,σ(?)為Sigmoid 激活函數。其中k的大小與通道維數C有關,且通道間信息交互的范圍(卷積核k)與通道維數C成正比,表明二者存在非線性映射關系。通常通道維數C常被設置為2的指數倍,故采用以2為底的指數函數來表示這種非線性映射關系。其計算如式(5)所示:

式中:當給定通道維數C時,卷積核的大小k計算如式(6)所示:

式中:|t|odd表示奇數t,γ和b為給定參數。

2 模型設計

2.1 混合卷積

空洞卷積通過稀疏采樣擴大感受野,使得鄰近各子集卷積之間信息交流不充分,存在局部信息丟失問題。而普通卷積由于卷積核感受野范圍有限,存在對全局信息把握不充分的問題。為了解決以上問題,將普通卷積和空洞卷積進行組合,設計了一種混合卷積(Mixed Convolution,MixConv),它主要包含3條分支,分別是左邊分支代表擴張率大小為d的空洞卷積(Dilated Convolution,DConv),右邊分支代表普通的標準卷積(Standard Convolution,SConv),中間分支代表自身的恒等映射,具體結構如圖3所示。

圖3 混合卷積

每個卷積層的濾波器個數不同,目的是獲取更多的特征信息,在卷積操作后面,加入批標準化層(Batch Normalization,BN)和非線性激活函數層(Rectified Linear Unit,ReLU),提高模型泛化性。各分支的輸出特征經過Concat操作進行通道維度上的拼接。這樣設計的好處是既增大了普通卷積的感受野范圍,又解決了空洞卷積局部信息丟失的問題。同時由于每個分支特征尺度不同,經過Concat 操作后,最終得到的輸出特征是多尺度特征,充分利用了上下文信息多尺度特征的優勢。當模型的輸入特征為Y時,則3 個分支經過Concat 融合特征操作后的輸出特征YC數學表達式如式(7)所示。

式中:YD為左邊分支得到的輸出特征,YS為右邊分支得到的輸出特征,⊕代表維度拼接操作。

2.2 模型結構

1DAMCNN 模型結構如圖4 所示,主要包含16層,由4 層混合卷積(MixConv)、4 層通道注意力(ECA)、3 層最大池化(MaxPool)、1 層普通卷積(SConv)、1 層全局池化(GAP)、2 層全連接(Fully Connected,FC)和Softmax 分類層構成。模型輸入(Input)為信號長度,輸出(Output)為類別標簽。擴張率為d時,網絡層的輸出尺寸如表1所示。

表1 網絡模型中尺寸變化

圖4 1DAMCNN模型

3 試驗數據分析結果

3.1 數據來源

為了驗證本文方法的有效性,選用美國凱斯西儲大學滾動軸承故障數據集作為實驗數據進行仿真實驗。選用采樣頻率為12 kHz的驅動端故障振動信號數據,包含軸承在735 W、1 470 W和205 W 3種負載工況下的振動信號,各負載工況按照電機轉速進行界定,依次分別為1 772rmin、1 750rmin 和1 730rmin。每種負載工況存在3種類型故障,分別是滾動體故障、外圈故障和內圈故障。為了模擬不同的故障程度,每種故障類型包含3 種不同的故障直徑,分別為0.177 8 mm、0.355 6 mm 和0.533 4 mm,總計是9 種故障狀態。因此,外加一種正常狀態,共計有10種類型的標簽。

3.2 數據增強

原始故障振動信號數量有限,而樣本較少容易發生過擬合,為了提高模型的泛化能力,本文使用重疊采樣的方法對數據進行增強,原理如圖5 所示。該方法使用固定大小的窗口按照設定的步長在信號序列上滑動并采樣,即每一段振動信號與它的后一段信號之間存在部分的重疊,使得分割的數據量增加,從而達到數據增強的目的。

圖5 滑動窗口重疊采樣

3.3 數據處理

在數據處理過程中,對于不同故障類型信號,首先按照順序截取一半的信號長度用于生成訓練樣本,取剩下的另一半信號長度用于生成測試樣本。然后使用3.2 節所描述的重疊采樣方法對訓練樣本進行數據增強,窗口大小設置為2 048,滑動步長設置為100,而測試樣本以相同大小的窗口按順序滑動生成,不進行數據增強,中間沒有重疊部分。處理后的實驗數據集如表2 所示,其中數據集A、數據集B和數據集C 代表軸承在735 W、1 470 W 和2 205 W 3種負載工況下產生的振動信號數據集,每種負載下分別包含6 000 個訓練樣本和250 個測試樣本。數據集D 為3 個不同數據集的并集,一共是18 000 個訓練樣本和750個測試樣本。

表2 實驗軸承數據集

3.4 仿真結果與分析

本文仿真環境在Python 環境下利用深度學習框架Keras 搭建,仿真平臺配置為Intel i5-9400F CPU 2.90 GHz,16 G內存,Win1064位操作系統。輸入的一維振動信號長度為2 048,批次大小為32,模型訓練過程中采用早停法(Early Stopping)策略,保存最優模型的各層權重。使用自適應矩估計優化器(Adaptive Moment Estimation,Adam)進行梯度下降優化,學習率設置為3×10-4,迭代次數為100,為了減小模型過擬合的風險,在全連接層后使用Dropout[13],Dropout率設置為0.5。

3.4.1 擴張率對故障識別準確率的影響

對于空洞卷積來說,通過調整擴張率d的大小可以獲得不同尺度的感受野,從而使MixConv 獲得更多不同尺度的特征信息,豐富故障信號中的特征多樣性。在數據集A下探討空洞卷積擴張率對故障識別準確率的影響,其他實驗參數保持不變,僅改變擴張率d的大小。重復進行5次仿真,取平均準確率和訓練時間作為評價指標。實驗結果如表3 所示。分析可知當空洞卷積擴張率d為2時,本文所提模型效果最好,平均識別準確率達到99.92%,訓練時間相比擴張率為1的情況僅僅增加了24 s。因此,后續均選用擴張率d為2的空洞卷積。

表3 不同擴張率的實驗結果

3.4.2 不同負載下模型的故障診斷效果

利用表2中的滾動軸承數據集A、B和C對搭建好的1DAMCNN 模型進行訓練和測試,據此來驗證所提模型對不同負載工況下的故障診斷效果。在相同仿真條件下,重復進行5次仿真,以消除算法隨機性對仿真過程造成的影響,Max/Min表示最大/最小值,STD為標準差(Standard Deviation)。

仿真結果如表4 所示,可以發現本文所提方法表現優秀,在不同數據集下多次實驗均達到了99%以上的診斷準確率,且標準差較小,說明該模型表現穩定。

表4 不同數據集的診斷準確率/(%)

圖6為1DAMCNN在不同數據集下的十分類混淆矩陣,橫坐標為真實故障標簽,縱坐標為預測故障標簽。從圖6(b)和圖6(c) 可以看出,1DAMCNN 在10種類型中預測標簽與真實標簽一致,分類準確率達到100%。說明模型在復雜故障情況下能夠實現自適應特征提取,且能準確分類。觀察圖6(a)可知,只有1 個錯誤分類,該錯誤為故障程度分類錯誤而非故障類型分類錯誤,其他標簽分類完全準確。說明本文所提方法無需復雜繁瑣的人工提取方法,就能夠實現自適應提取特征并準確識別細膩微小特征,達到了防止人工提取特征對診斷過程造成干擾的目的,體現出自身的優勢。

圖6 十分類混淆矩陣

依托該數據集,已經有不少學者對故障診斷問題進行了研究[13-17],提出人工特征提取結合傳統神經網絡的分類模型AF-SVM與AF-BPNN、卷積神經網絡結合長短時記憶網絡的分類模型CLSTM、通道注意力結合卷積神經網絡的分類模型SECNN 和二維圖像結合卷積神經網絡的分類模型GCNN,將本文所提方法的仿真結果與上述文獻中的方法進行比較。對比結果如表5所示,AVG表示平均準確率。

表5 不同方法的對比結果/(%)

通過表5 可以看出,6 種不同的方法對于3 種數據集都有較高的診斷精度。其中,本文所提模型綜合表現最優,診斷精度達到99.97 %。其中,AFBPNN 模型診斷精度較低,但也達到了90 %以上。說明所有模型對顯著故障特征均有一定程度的識別能力。對比分析各模型的診斷精度,發現結合傳統神經網絡進行診斷的模型診斷精度最低,主要原因是傳統的人工提取特征方法由于適用性不強和表達能力較弱,導致泛化能力表現均不如深度卷積神經網絡模型。1DAMCNN 模型與之相比,精度提升了3.9%。在4種深度神經網絡模型中,CLSTM模型診斷精度最低,這是因為該模型卷積感受野范圍有限,未能利用到更廣層次的數據特征。1DAMCNN 與SECNN 相比,雖然同樣引入了通道注意力,但1DAMCNN引入的額外參數少很多。GCNN在將一維信號轉化為二維圖像的過程中,原始信息存在一定量的丟失,診斷精度略遜于1DAMCNN。而在本文所提出的方法中,輸入為原始一維振動信號,不存在信息丟失的問題,并通過引入空洞卷積和通道注意力,擴大了卷積核感受野范圍,有效提取了多尺度故障特征信息,使診斷精度有了進一步的提升。

3.4.3 模型的特征提取能力

考慮到實際生產環境中,軸承故障樣本的數據量遠少于正常樣本,對于軸承故障診斷的識別,模型在小樣本下的表現也極其重要。于是本文設置了小樣本量下的仿真實驗,據此驗證1DAMCNN 在少量樣本條件下對故障信號的特征提取能力,且對結果進行評估。分別從數據集D 選用樣本量為60、90、300、900、1 500、9 000和18 000個訓練樣本對模型進行訓練,測試樣本始終為750 個。并通過控制實驗變量法,進行對比實驗的研究。構造SVM分類器作為基準進行對比。與1DMCNN 相比,1DCNN 中沒有引入空洞卷積構造的混合卷積,1DMCNN中沒有引入注意力機制,其他的實驗參數完全相同,具體結果如表6所示。各評價指標通過重復實驗5次得到,表中*/*表示分類精度的平均值和標準差。

從表6 可以看出,當只有60 個訓練樣本時,1DAMCNN 的識別準確率最高為88.10 %,1DMCNN 的識別準確率超過80%,而1DCNN 的識別準確率只有29.65%,未超過基準SVM的準確率,表現較差。主要原因是1DCNN 卷積感受野范圍有限,無法獲取到更多特征,而1DMCNN 引入空洞卷積構造的混合卷積后,擴大了卷積感受野,使準確率得到較大提升。當增加到90 個樣本時,1DAMCNN的識別準確率超過96 %,1DMCNN 超過了91 %,1DCNN 表現與基準持平;當樣本量個數為900 時,1DAMCNN識別準確率超過99%,這說明隨著樣本量的增加,樣本內部隱含的潛在共性特征逐漸凸顯出來,訓練出來的模型表現越好。

表6 不同樣本量的實驗結果/(%)

當訓練樣本從9 000個增加到18 000個,可以看出各模型的準確率雖然也在提升,但提升較小。這種現象表明,要想進一步提升準確率,需要增加大量的訓練樣本,同時也增加了模型訓練的計算成本,卻只帶來了微小的準確率提升。而本文提出的1DAMCNN 方法只需要極少量樣本,就能起到很好的識別效果,從經濟學的角度考慮,既減少了計算成本,同時也省去了一部分的時間成本。

同時為了探究樣本個數對模型特征提取能力的影響,利用t-SNE(t-Distributed Stochastic Neighbor Embedding)降維技術[18],對測試集D 在1DAMCNN模型中最后一個全連接層下的隱藏特征,進行降維并將其可視化,可視化結果如圖7 所示。因篇幅有限,故展示了訓練樣本量大小為60 和900 時的特征可視化結果。

從圖7(a)、圖7(b)和圖7(c)中可以看出,相同故障類別的特征向同一個中心點聚集,不同故障類別的特征相距較遠。1DCNN特征提取能力較差,各類型較為混亂,未能很好區分開。而引入混合卷積的1DMCNN通過提高模型的感受野,增強模型對于特征信息的表達能力。使得分類效果得到很大提升。1DAMCNN 后續引入注意力機制,增強各通道之間的信息交流,改善了空洞卷積可能造成的特征冗余問題。與圖7(d)、圖7(e)和圖7(f)對比可以看出,隨著樣本量的增多,類與類之間的距離逐漸變遠,并且各類型形成簇的范圍越來越小,這說明基于該模型不同故障特征的可分性逐漸變強,同樣驗證了1DAMCNN具有強大的故障特征提取能力。

圖7 樣本量為60和900時的特征可視化

4 結語

本文提出一種改進的端到端滾動軸承故障診斷方法—1DAMCNN。運用該方法可以直接從原始振動信號中提取特征并完成分類,無需任何振動信號的預處理過程。通過對美國凱斯西儲大學滾動軸承故障數據集進行試驗研究,驗證了該方法的有效性和準確性。并得到以下結論:

(1)采用空洞卷積構建的混合卷積替換了傳統CNN 中的卷積層,擴大了卷積感受野范圍,提升了故障診斷準確率。

(2)引入注意力機制ECA,通過調整特征通道的重要性,使模型聚焦于具有更多有效特征信息的通道,增強對于關鍵故障特征提取能力。

(3)相較于其他診斷方法,該方法表現出更強的自適應能力,準確率達到99.97%。并通過小樣本量條件下對比實驗,進一步證實了所提方法的有效性,該方法對滾動軸承故障診斷具有一定的實用價值。

猜你喜歡
空洞故障診斷卷積
基于包絡解調原理的低轉速滾動軸承故障診斷
基于3D-Winograd的快速卷積算法設計及FPGA實現
鍛造過程中大截面塑料模具鋼中空洞缺陷的閉合行為
卷積神經網絡的分析與設計
從濾波器理解卷積
數控機床電氣系統的故障診斷與維修
基于傅里葉域卷積表示的目標跟蹤算法
空洞的眼神
因果圖定性分析法及其在故障診斷中的應用
用事實說話勝過空洞的說教——以教育類報道為例
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合