?

DCGAN結合CNN診斷不均衡小樣本的滾動軸承故障

2022-12-20 15:43胡益嘉張溟晨張毅杰
噪聲與振動控制 2022年6期
關鍵詞:類間訓練樣本軸承

施 杰,胡益嘉,王 森,張溟晨,張毅杰

(1.云南農業大學 機電工程學院,昆明 650201;2.昆明理工大學 機電工程學院,昆明 650500)

近年來,我國機械化水平不斷提高,軸承作為旋轉機械設備中的關鍵零件,存在易損害、故障率高等問題[1-2]。在實際工程應用中,采集到的軸承非平穩振動信號含有大量故障信息,但這些樣本存在著數量較少且類間數量不均衡的問題,極大影響了軸承故障診斷效果[3]。因此,在小訓練樣本和故障類間數據不均衡的情況下,研究滾動軸承故障智能診斷問題具有重要意義。

一般非平穩信號應該首先進行預處理以提高其診斷效果。小波變換(Wavelet Transform,WT)、集合經驗模態分解(Ensemble Empirical Mode Decomposition,EEMD)和變分模態分解(Variational Mode Decomposition,VMD)等,是學者們針對非平穩信號預處理所提出的方法。WT是通過將時間信號變換為時頻信號,來對信號的局部特性進行分析,但存在信號冗余的問題[4]。Wu等[5]提出的EEMD算法是在信號中加入定量均勻高斯白噪聲以消除模態混疊現象,但加入白噪聲的大小和次數是依靠經驗來決定,因此缺乏自適應性。隨后,Dragomiretskiy等[6]又提出了VMD算法,將信號放入變分模型中進行自適應分解,從而達到降噪的效果。VMD具有嚴密的數學理論基礎,相比EEMD、WT 等能有效避免模態混疊現象的產生[7-10],但VMD 算法也存在參數無法自適應設置的問題。

在故障診斷方法上,目前大多采用支持向量機(Support Vector Machine,SVM)[11]、BP 神經網絡[12]、卷積神經網絡(Convolution Neural Network,CNN)等機器學習模型。但這類模型會因訓練樣本數據量過少或故障類間數據不均衡,而影響診斷精度和魯棒性。針對這一問題,通常采用幾何變換的方式擴充訓練樣本,但這會使得樣本缺乏多樣化,不能表征全部樣本特征。Goodfellow等[13]為消除傳統擴充方式的弊端,于2014年提出了一種無監督學習模型即生成對抗網絡(Generative Adversarial Network,GAN)。GAN通過生成網絡與判別網絡的相互博弈來學習樣本特征并生成輔助樣本。隨后,又提出了深度卷積生成對抗網絡(Deep Convolution Generative Adversarial Network,DCGAN)。DCGAN與GAN 不同之處在于采用了深層卷積網絡來代替多層感知機,以增強模型對樣本特征的挖掘能力,同時穩定了模型訓練過程。

綜上,本文針對小訓練樣本且故障類間數據不均衡的情況,研究了基于DCGAN 與GA-CNN 的軸承故障診斷方法。首先,在信號預處理方面采用遺傳算法(Genetic Algorithm,GA)來改進VMD。以信息熵作為適應度函數,通過GA尋優來解決VMD中本征模態分解個數k和二次懲罰因子a難以自適應確定的問題。再根據平均峭度指標對經VMD 分解后的本征模態分量(Intrinsic Mode Function,IMF)進行重構,采用連續小波變換將重構信號轉換為二維時頻信號。然后,構建DCGAN 網絡將通過預處理獲取的小批量時頻信號作為訓練樣本,通過對抗生成輔助樣本。同樣采用GA 算法對CNN 進行優化(Convolution Neural Nnetwork Optimized by Genetic Algorithm,GA-CNN),即將交叉熵損失函數作為GA尋優的適應度函數,從而解決學習率和批量大小等超參數相互影響導致模型難以收斂的問題。最后,再將對抗生成的樣本放入GA-CNN 中進行訓練,構造軸承故障智能診斷方法。采用美國西儲大學軸承試驗數據(Case Western Reserve University,CWRU)和XJTU-SY軸承試驗數據來驗證該方法的有效性。

1 變分模態分解改進算法

1.1 變分模態分解

VMD 算法先要將解析信號經過Hilbert 變換混合得到預估頻率中心,再把每個模態的頻譜調制到相應的基頻帶。計算基頻帶中解調信號梯度的平方L2范數,得到k個固有模態分量以及各模態分量的頻率中心,估計各固有模態分量的帶寬,得到約束變分模型如式(1)所示。最后,引入懲罰因子a構造Lagrange函數對變分模型進行求解,得到最優解,完成VMD分解。

式中:f(x)為原始信號;k為IMF 分解個數;{μk}={μ1,μ2,…,μk}為VMD 分解后的k個IMF 分量;{ωk}={ω1,ω2,…,ωk}為各IMF頻率中心。

VMD具體步驟:

2)根據VMD算法公式更新μk和ωk;

3)根據λn+1(ω)=λn(ω)+τ(f(ω)-)更新λn+1;

1.2 遺傳算法

在處理復雜的非線性問題時,GA因能模擬生物界的選擇和遺傳機制,并且具有良好的全局尋優能力而被廣泛應用[14]。相比其他優化算法,GA成熟的收斂性分析方法及信息傳遞機制更適合處理噪聲信號,所以選擇GA 作為VMD 算法的尋優算法。在GA運算過程中,以選擇和交叉方式對種群進行全局化搜索,通過變異算子產生接近最優解的新個體。根據種群內個體適應程度評價個體優劣,在不斷迭代的過程中尋找到最優染色體。

1.3 信息熵適應度函數

信息熵反映了系統的復雜程度,在采用GA 算法對VMD進行參數尋優時,如果分解后的IMF分量中含有與故障相關的周期性沖擊特征,則信號中包含信息有效性越大,信息熵越小。因此,將尋找最小信息熵作為GA算法尋優目標。

式中:H(x)為信息熵;xi(i=1,2,3,…,n)為信源的n個狀態;Pi(i=1,2,3,…,n)為各狀態的概率。

1.4 基于GA改進的VMD算法

VMD 需要預先設定IMF 分解個數k以及二次懲罰因子a,若參數選擇過小,會出現模態混疊的現象。反之,則會造成過分解以及運算量變大[15]。若僅通過人為經驗來設定兩個參數,分析結果將存在很大的偶然性和隨機性。因此本文采用遺傳算法對變分模態分解(Optimization of Variational Mode Decomposition by Genetic Algorithm,GA-VMD)的關鍵參數進行尋優,把最小信息熵作為GA 的適應度函數,以種群中每個個體適應度大小評價其優劣程度。通過選擇、交叉和變異操作,將適應度較高的[k,a]組合遺傳到下一代,最終自適應地篩選出參數的最優組合。GA-VMD 特征提取方法具體實現步驟如下:

(1)獲取原始振動信號;

(2)初始化GA 算法基本參數:種群個數Np、最大遺傳代數N、交叉概率Px、變異概率Pm等;

(3)建立最小信息熵適應度函數;

(4)利用GA 算法尋優VMD 中的分解個數k和懲罰因子a;

(5)將GA確定的最優k和a值用于VMD分解,即實現GA-VMD算法。

2 智能故障診斷模型

2.1 基于GA優化的CNN模型

CNN 是帶有卷積結構的深層前饋式神經網絡模型,其采用局部感受野和權值共享的方式使網絡具有一定的穩定性[16]。本文以AlexNet 網絡為基礎進行優化。首先,由于訓練樣本較少,所以將C1層、C3層、C5至C7層卷積核都縮小一倍。然后,為了防止過擬合現象的出現,在全連接層引入DropOut 對神經元進行隨機失活。最后,通過Softmax 診斷出故障類型。同時,CNN模型對學習率和批處理大小這兩個參數十分敏感,設置不當會導致模型訓練時間過長且不易收斂。目前,兩參數大多依靠經驗或遍歷算法來設定[17]。因此,本文采用GA 算法用于CNN模型中兩參數的尋優,將最小交叉熵損失作為尋優目標,以實現GA-CNN 算法,改進后的模型結構如表1所示。

表1 GA-CNN模型參數

2.2 深度卷積對抗生成網絡模型

DCGAN 是通過判別網絡和生成網絡之間相互博弈,從而最終達到“納什均衡”的無監督深度學習模型[18]。模型由生成網絡和判別網絡組成,生成網絡將隨機噪聲通過反卷積變為具有故障特征的樣本;判別網絡通過與真實樣本進行比對得到最優生成網絡;再將多維隨機噪聲放入網絡中獲取生成樣本。DCGAN 模型在生成和判別網絡中均采用深度卷積網絡結構,并對每層網絡采用批歸一化操作,增強了模型對局部特征的提取能力。同時,為了解決訓練過程中生成網絡梯度消失的問題,分別使用LeakRelu函數和Tanh函數來代替Relu函數,以提高訓練過程的穩定性[19]。DCGAN 生成和判別網絡模型如式(3)。因此,本文采用DCGAN 模型來解決小訓練樣本及故障類間不均衡所造成診斷效果不佳的問題。

式中:z為生成網絡的輸入噪聲;x為真實樣本;G(z)為生成網絡的輔助樣本;D(G(z))為判別樣本真實程度的概率。

2.3 基于DCGAN 與GA-CNN 的軸承故障診斷方法

首先,該方法采用GA-VMD 和CWT 對故障信號進行特征提取,將一維振動信號轉換為二維時頻信號。然后,將時頻信號作為DCGAN 模型的訓練樣本,通過對抗生成輔助樣本。最后,利用GA 對CNN模型中的學習率和批處理大小進行尋優,找到最優超參數組合。從而建立起適應小訓練樣本及故障類間不均衡條件下的故障診斷模型。具體步驟如下:

(1)獲取軸承振動信號;

(2)按照1.4 小節設置GA-VMD 算法參數。通過最小信息熵目標函數來對選擇、交叉、變異操作后的個體進行評估,獲得VMD最優參數組合[k,a],再進行GA-VMD分解;

(3)根據峭度準則選擇大于平均峭度的IMF分量進行信號重構,并通過CWT把重構信號變換為二維時頻信號;

(4)構建DCGAN模型的生成和判別網絡,將時頻信號作為真實樣本放入模型中,并根據判別網絡結果提取出最優生成網絡,得到輔助樣本;

(5)設置GA-CNN的遺傳參數,通過GA算法尋優找到CNN 模型中學習率和批處理大小的最優組合;

(6)通過輔助樣本對GA-CNN模型進行訓練和驗證。

3 試驗驗證

3.1 試驗平臺與數據

本文采用CWRU[20]和XJTU-SY[21]滾動軸承數據集進行試驗驗證。CWRU數據集是通過電火花加工的方式在SKF6205-2RS 軸承的外圈、內圈和滾動體上分別加工出不同故障程度的凹槽來模擬故障。數據集是在12 kHz的采樣頻率、1 730 r/min轉速、2 HP載荷下采集了4 種軸承狀態數據。通過252C33 加速度傳感器獲取到LDK UER204 軸承在2 250 r/min 轉速,11 kN 徑向力下的全壽命振動周期信號組成XJTU-SY數據集。在25.6 kHz的采樣頻率下,對滾動軸承狀態數據進行采集。CWRU 和XJTUSY 滾動軸承數據集的理論故障特征頻率如表2所示。

表2 2種數據集故障特征頻率/Hz

3.2 GA-VMD算法實現

試驗中以CWRU 數據集中內圈故障信號為例來說明GA-VMD算法的有效性,其余故障信號分析方法相同。首先,在GA 算法中建立最小信息熵適應度函數,利用GA 對VMD 算法中的參數k和a進行優化。根據文獻[22]初始化GA算法參數:Np=40、N=500、Px=0.7、Pm=0.5;根據文獻[23]設置k取值范圍在[2,15]之間,a取值范圍在[200,2 000]之間。GAVMD 進化過程如圖1 所示,當進化到第234 代時即可獲得最小信息熵適應度函數值,其對應的最優[k,a]組合為[7,185 0]。然后,對故障信號進行VMD分解,并計算各階IMF分量峭度值如表3所示,得到平均峭度為3.117 2。將大于平均峭度的IMF進行信號重構[24],隨后對其進行包絡譜分析。GA-VMD 重構信號包絡譜如圖2 所示,主要頻率成分包括29 Hz、157 Hz 及其2 倍頻和3 倍頻,這分別與理論轉頻29.17 Hz 和內圈故障頻率157.94 Hz 相接近。由此可證明依據GA-VMD 算法能有效判斷出是內圈故障。

圖2 GA-VMD重構信號包絡譜

表3 經VMD分解后各階IMF分量峭度值

圖1 GA-VMD進化過程圖

為進一步驗證GA-VMD 在特征提取方面的優勢,將其與EEMD 方法進行比較。把相同的軸承內圈故障信號采用EEMD進行特征提取。首先,設置EEMD 中總體平均次數NE=50,加入的高斯白噪聲幅值Nsted=0.5。然后,故障信號經過EEMD分解得到13 階IMF 分量,計算出各階IMF 分量峭度值如表4所示。其平均峭度為3.480 1。將大于平均峭度的IMF 分量進行信號重構和包絡分析,EEMD 重構信號的包絡譜如圖3 所示。與GA-VMD 重構信號的包絡譜相比較,雖然可以找到一些故障相關頻率成分,但譜圖中的高頻特征頻率不突出,而且譜線干擾過多,降噪效果較差。

圖3 EEMD重構信號包絡譜

表4 經EEMD分解后各階IMF分量峭度值

同時,GA-VMD與EEMD相比不會出現模態混疊的現象,經EEMD 分解后的內圈故障信號前3 階IMF 幅值譜如圖4 所示。從圖4(a)和圖4(b)中可以看到,經EEMD分解后IMF1和IMF2分量間模態混疊現象嚴重。在圖4(a)和圖4(c)中,IMF1和IMF3之間也存在模態混疊現象。圖5為內圈故障信號經GAVMD 分解后的前3 階IMF 幅值譜??梢钥吹礁髂B之間故障頻率不同,相互不存在模態混疊現象。綜上所述,GA-VMD算法優于EEMD方法。

圖4 經EEMD分解后前3階分量幅值譜

圖5 經GA-VMD分解后前3階分量幅值譜

3.3 基于DCGAN與GA-CNN的故障診斷方法

首先,通過GA-VMD 方法和CWT 獲取軸承振動信號的二維時頻圖。其次,構建DCGAN 模型并初始化參數:批處理大小Batch_size=16;最大迭代次數N=400;學習率LG=0.001、LD=0.002;噪聲維度NZ=100;判別網絡和生成網絡的更新步長Step=1:5。將二維時頻圖作為真實樣本放入DCGAN 中,通過對抗生成故障輔助樣本。

然后,根據表1構建GA-CNN模型并初始化GA參數:設Np=50、N=200、Px=0.7、Pm=0.1;學習率Lr范圍在[0.001,1]之間;批處理大小Batch_size 在[20,100]之間。最后,以最小交叉熵作為GA適應度函數的尋優目標對CNN 模型進行改進。DCGAN 與GA-CNN 故障診斷方法流程圖如圖6 所示。

圖6 DCGAN與GA-CNN故障診斷方法流程圖

3.3.1 GA-CNN模型有效性驗證

為了驗證GA-CNN 模型的有效性,根據CWRU 數據集(故障直徑0.177 8 mm,負載2 Hp,轉速1 750 r/min)、XJTU-SY 數據集(轉速2250 r/min,徑向力11 kN)中的信號對滾動軸承進行分析。首先,分別將信號采用GA-VMD 分解并重構。然后,對重構信號進行CWT,得到4種健康狀態下各200個樣本,按照7:3的比例將其劃分訓練集和測試集。最后,分別把訓練樣本放入CNN、VGG19 和GA-CNN 模型中進行訓練,通過測試樣本來檢驗模型精度。如圖7(a)所示,在CWRU 數據集下3 種模型平均診斷精度分別為93.97 %、70.67 %和97.95%。由于利用GA對CNN模型進行全局尋優,得到學習率Lr和批處理Batch_size 的最優組合為[0.001,32]。所以,GA-CNN 模型精度相比CNN 和VGG19 模型分別提高了3.98 %和27.78 %。如圖7(b)所示,在CWRU數據集下3種模型平均診斷精度分別為80.81 %、73.05 %和97.12 %。因為基于GA找到CNN模型中學習率Lr和批處理Batch_size的最優組合為[0.002,23],所以GA-CNN 模型精度相比CNN和VGG19模型分別提高了16.31%和24.07%。兩組試驗驗證了GA-CNN 模型具有良好的魯棒性和泛化能力,減少了參數設置對人為經驗的依賴。

圖7 CNN、VGG19與GA-CNN模型診斷精度對比

3.3.2 小樣本下模型有效性驗證

目前,對小樣本定義尚未有統一標準[25]。本文嘗試將3.3.1 小節中數據量的10 分之一定義為小樣本數據量。由于VGG19 模型在原始數據量下不僅故障診斷精度均低于CNN和GA-CNN模型,而且訓練時間較長。因此,試驗僅在CWRU 數據集下對DCGAN+GA-CNN 模型進行小樣本數據有效性驗證。試驗中采用3.3.1小節中相同的軸承信號,同樣得到4種健康狀態下共80個樣本,按照7:3的比例將其劃分為訓練集和測試集。將訓練集分別放入GACNN 和DCGAN+GA-CNN 模型進行訓練。如圖8所示,GA-CNN和DCGAN+GA-CNN模型的平均診斷精度分別為67.54%和95.30%。在小訓練樣本條件下,由于DCGAN+GA-CNN模型是通過對抗生成輔助樣本來進行訓練,所以其診斷精度比GA-CNN模型大幅領先27.76%。由此可證明,在訓練小樣本情況下,DCGAN+GA-CNN 模型可以有效提升診斷精度,且訓練過程穩定。

圖8 小樣本下GA-CNN與DCGAN+GA-CNN模型診斷精度對比

3.3.3 故障類間不均衡、小樣本下模型有效性驗證

為驗證在小樣本及故障類間不均衡樣本下DCGAN+GA-CNN 模型的有效性,需要構建類間不均衡樣本。試驗中采用與3.3.2 小節中相同處理方法產生試驗信號,取出由20 個內圈故障樣本、30 個外圈故障樣本、40個滾動體故障樣本及50個正常狀態樣本構成的故障類間不均衡樣本,按照7:3的比例將其劃分訓練集和測試集。試驗中將訓練集分別放入GA-CNN和DCGAN+GA-CNN模型中進行訓練。如圖9所示。GA-CNN和DCGAN+GA-CNN模型的平均診斷精度分別為69.13%和95.22%。在小樣本及故障類間不均衡樣本下,由于DCGAN+GA-CNN模型通過DCGAN方法對故障類間不均衡樣本進行擴增,有效增強了模型診斷能力,避免了模型誤診現象的發生。所以其診斷精度比GA-CNN 模型大幅領先26.09%。

圖9 小樣本及故障類間不均衡下GA-CNN與DCGAN+GA-CNN模型診斷精度對比

4 結語

本文針對滾動軸承訓練樣本數據較少且故障類間樣本不均衡導致診斷效果不佳的問題,將信號處理方法、尋優算法與深度學習模型相結合提出了一種GA-VMD+DCGAN+GA-CNN 的智能故障診斷方法。

(1)GA-VMD 方法實現了VMD 中IMF 分解個數k和懲罰因子a的自適應確定。經過GA-VMD處理后的軸承故障信號與經EEMD 處理后的信號相比,避免了模態混疊現象且降噪效果明顯。

(2)GA-VMD+DCGAN+GA-CNN 方法可以有效解決由于小訓練樣本及故障類間不均衡而導致模型診斷效果不佳的問題。與傳統樣本擴增方式相比,DCGAN 的輔助樣本不僅能夠表征真實樣本特征且更具多樣性。通過GA對CNN模型中超參數進行組合尋優,可以有效提高模型診斷精度,減少對人為經驗的依賴。

(3)本文是在實驗室環境中采集試驗數據,這與實際生產環境中采集的數據相比存在一定差異。同時,GA算法中種群個數NP、最大遺傳代數N、交叉概率Px和變異概率Pm等參數還需要根據先驗知識或者人為經驗設定,這些問題還需要進一步研究。

猜你喜歡
類間訓練樣本軸承
軸承知識
軸承知識
軸承知識
軸承知識
基于OTSU改進的布匹檢測算法研究
基于貝葉斯估計的多類間方差目標提取*
人工智能
基于類間區分度的屬性約簡方法*
基于改進最大類間方差法的手勢分割方法研究
寬帶光譜成像系統最優訓練樣本選擇方法研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合