?

奇異值分解與移移學習在電機故障診斷中的應用

2017-04-21 10:24沈飛陳超嚴如強
振動工程學報 2017年1期
關鍵詞:遷移學習特征提取故障診斷

沈飛 陳超 嚴如強

摘要:針對變轉速、變負載條件下的電機故障診斷問題,提出了一種基于自相關矩陣奇異值分解(Singular ValueDecomposition,SVD)的特征提取和遷移學習分類器相結合的診斷方法。對于Hankel矩陣提取的奇異值向量,設計了平均曲率區分度指標來描述特征差異性,遷移學習TrAdaBoost算法通過迭代過程中調節輔助振動數據的權重來幫助目標數據學習,提升了分類正確率,同時利用向量夾角余弦進行可遷移度檢測從而避免負遷移。試驗結果表明,SVD無需利用故障先驗知識,具有通用性,且遷移學習相比傳統機器學習在目標振動數據較少條件下性能得到顯著提升。

關鍵詞:故障診斷;奇異值分解;遷移學習;可遷移度;特征提取

中圖分類號:THl65+.3;TPl81

文獻標志碼:A

文章編號:1004-4523(2017)01-0118-09

DOI:10.16385/j.cnki.issn.1004-4523.2017.01.016

引言

變工況環境、無法直接測量以及新故障類型等條件往往導致電機故障診斷中目標故障數據量較少甚至無法獲得,訓練故障數據與目標故障數據分布特性不同等情況的發生。而AdaBoost迭代算法,K最近鄰分類算法(KNN)等傳統機器學習分類方法均以訓練數據與測試數據具有相同的分布特征且數據量足夠為前提,將不再適用。

為克服外在因素的影響,在故障特征提取方面,Yang等人提出了一種基于變量預測分類(VPM-CD)的故障模型,將局域均值分解(LMD)和階次跟蹤分析相結合用于變轉速滾動軸承振動故障特征的提取,模型能有效區分軸承故障狀態;Borghesani等針對變工況情況利用倒譜分析對信號進行預白化處理,用于自適應損傷識別;陳小旺等人推廣了一種迭代廣義同步壓縮變換方法,有效改善了同步壓縮變換分析頻率時變信號時的時頻可讀性,并應用于變工況下行星齒輪箱的故障診斷,但是現有方法大多基于故障特征的已知先驗知識,如故障頻率、噪音干擾等,在通用性方面有所欠缺。在故障分類方面,Guyon等針對訓練與目標故障數據的不同分布特征提出因果挑戰算法,并利用權重特征排列的支持向量機(sVM)算法進行分類;Bassiuny等人以希爾伯特邊緣譜為輸入特征,建立學習矢量量化(LVQ)網絡模型,上述方法均取得了良好的診斷效果,但其實質仍是改進的機器學習,未能克服其算法局限性。

遷移學習近年來受到機器學習領域的廣泛關注,其具備學習先前任務的知識和技巧并應用到新任務的能力。傳統機器學習中,學習任務之間是相互獨立的,當兩者數據分布不同時,在訓練集訓練好的學習系統無法取得滿意表現,需要進行重新訓練。而在遷移學習中,雖然源任務和目標任務不同,但可以從不同源任務的不同數據中挖掘與目標任務相關的知識并幫助目標任務的學習,其已在文檔分類、計算機視覺、搜索排序等領域得到了應用。本文借鑒遷移學習在其他領域的成功應用,利用相鄰或常規故障數據幫助少量目標故障數據分類,提出一種新的電機故障診斷方法。同時,采用自相關奇異值分解(SVD)的電機故障特征提取方法,為遷移學習提供不依賴先驗知識,且具備一定物理意義的特征,奇異值特征的普適性與遷移策略的靈活性,使得電機故障診斷能夠有效克服變轉速變負載帶來的物理條件變化的影響,增強診斷通用性,降低成本;同時通過精確計算遷移學習的可遷移度,從而幫助輔助數據的選取,有效避免負遷移。

3.實驗研究與性能分析

3.1實驗條件與參數

實驗數據來自美國凱斯西儲大學電機軸承數據中心,振動信號由圖2所示的電機軸承測試系統測得,系統包括電機(左),測力計(右)以及控制電路。數據通過16通道的加速度計采集,采樣頻率12kHz,測試實驗條件與參數如表1所示,包括變轉速與變負載時不同故障程度與故障位置的振動數據采集。

3.2基于SVD的特征提取與性能分析

根據SVD特征提取原理,對表1實驗條件的電機軸承數據進行特征提取,試驗測得不同電機軸承故障的無冗余向量維數Q在127~164之間波動,表明有效故障特征與冗余噪音的區分邊界較為模糊,故Hankel矩陣維數選取M=N=Q=150。

所得奇異值特征向量的平均曲率曲線如圖3所示,圖3中不同電機軸承故障對應點間的平均曲率間距反映特征區分能力,故有如下結論:

1)故障類型的量變與質變間存在差異,圖3(b)中,健康軸承(0mm)與故障軸承的平均曲率問距大于故障軸承內部間距;

2)故障類別的本質存在差異,圖3(c)中,三類外圈故障問平均曲率間距小于外圈與其他故障部位間距;

同時奇異值特征向量的平均曲率隨維數遞減,即維數Q越小,軸承故障分類能力越強。然而維數越小,包含的有用信息量越少,故根據式(4)進行特征選取,如下:

電機軸承故障直徑的區分度D4與分類性能指標參數q的比值曲線如圖4所示。圖4表明,特征維數從150降低至50時,其分類性能提升達29.53%(0vs.0.356mm),至少提升11.67%。表2給出了故障直徑診斷目標的分類性能指標參數表??梢?,當Dk/g大于0.893時,診斷統計正確率達99.9%。圖4中2組曲線滿足正確率要求,3組曲線不能滿足該要求(即無論維數如何選取,診斷精度均低于99.9%),而0.178mm和0.356mm兩類故障區分性能在維數為96達到目標效果(點①),故選取特征維數96,此時兼顧診斷正確率、信息量以及計算量要求。

3.3遷移學習試驗與性能分析

3.3.1可遷移度試驗與性能分析

試驗中目標振動數據采用等比例故障樣本,輔助振動數據的分布比例如表3所示;變轉速與負載時試驗參數設置如下:1)目標數據:1797,1772,1730r/min轉速樣本;2)輔助數據:1750r/min轉速樣本,其單故障奇異值向量相似度如表4所示。變試驗對象參數設置如下:1)目標數據:驅動端樣本;2)輔助數據:風扇端樣本,其單故障奇異值向量相似度如表5所示。

根據表4和表5,可以得到如下結論:

1)變轉速與負載時振動數據對電機軸承故障診斷的影響小于變試驗對象的影響(即表4所示的單故障相似度整體大于表5),是由于來自不同試驗對象的輔助數據與目標數據共性較小。

2)變轉速與負載對內圈故障的影響略大于其他故障類型,而變試驗對象對各故障部位的影響較為平均,是由于變轉速的輔助與目標數據只對與轉速相關的故障類型影響較大,而變試驗對象對所有故障類型產生影響。

3)無論是變轉速、變電機負載還是變試驗對象,其影響均隨著故障程度(直徑)的增大而增大,即呈正相關。

故在引入輔助數據時,合理分配輔助數據的故障比例尤為重要,根據表3和式(10),計算變轉速與負載、變試驗對象的目標和輔助數據的綜合相似度值,如表6所示。

根據綜合相似度值列表,設置遷移學習參數如下:1)目標振動數據樣本:50組;2)輔助振動數據樣本:50和250組;3)迭代次數:20次。設置KNN機器學習參數如下:1)目標振動數據樣本:50,100,150,200和250組;2)迭代次數:20次。比較故障診斷正確率,得到可遷移度閾值st,統計列表如表7所示。表7表明:輔助數據較少時,診斷性能的提升需要與目標數據更大的相似度,輔助數據較多時,閾值上升緩慢,更有助于st選取。實施遷移學習之前,綜合相似度Sw與st相比較,若Swt,則導致負遷移,應重新選取輔助數據樣本。

3.3.2遷移學習試驗與性能分析

遷移學習參數設置如下:1)目標振動數據樣本:50組;2)輔助振動數據樣本:50和250組;3)迭代次數:20;4)測試振動數據樣本:300組,5)均值統計:10次。利用表6提供的輔助數據組合對1:1與1:5比例條件的目標振動數據進行故障診斷,得到故障部位和故障直徑的診斷結果,如表8和圖5所示。

根據圖5,計算綜合相似度與診斷正確率曲線的相關系數分別為0.85和0.95,表明電機軸承故障的遷移學習分類結果與輔助數據選取顯著相關,輔助數據與目標數據共性越大,越有利于故障診斷。同時表8和圖5表明,在目標數據與輔助數據比值為1:1的基礎上再注入4倍輔助數據有助于增強學習效果。最后注意到,故障部位的學習條件比故障直徑診斷更為苛刻,后者即使在綜合相似度低于0.75時仍能保證100%的正確率,故St應當按照前者選取。

為了進一步驗證目標數據量與兩者比值對診斷性能的影響,筆者又進行了相關研究,圖6描繪了不同數據量和比值的故障部位診斷正確率曲線,可以得到如下結論:

1)目標數據與輔助數據比值為1:1時遷移學習的診斷效果最差,比值增大時效果較好??紤]到遷移學習中輔助數據樣本多于目標數據樣本,故其優勢體現在曲線前端。

2)目標數據量越多,診斷正確率越高,100組數據的正確率平均比10組數據提升17.19%,但學習數據越多,計算量越大,所需時問越長,故兩者應適中選取。

本文同時對傳統機器學習與遷移學習進行性能比較,機器學習采用KNN算法,參數設置如下:1)目標振動數據樣本:50,100,150,200和250組;2)迭代次數:20;3)測試振動數據樣本:300組;4)均值統計:10次。其診斷正確率如表9所示,遷移學習采用5倍輔助數據,兩者性能比較如圖7所示,可以發現:

1)當目標數據量較大時,兩者均能達到很好的性能;當目標數據量較小時,機器學習無法診斷,而遷移學習仍能保證85%以上的正確率,在10倍標識數量(50組)時遷移學習較機器學習診斷性能提升12.69%。

2)兩者故障直徑分類性能均優于故障部位分類性能,說明遷移方法對不同診斷目標性能同時提升。

就復雜度而言,雖然基于TrAdaBoost算法的遷移學習在KNN機器學習的基礎上增添了權值調整,帶來一定的計算量,但相比其性能的提升是值得的。但電機軸承目標振動數據足夠時,無遷移學習的必要。

為進一步驗證遷移學習方法的適用性和通用性,對比遷移學習在大幅變轉速條件下的應用優勢,本文利用電機模擬試驗平臺進行試驗,如圖8所示。實驗條件包括:1)轉速:20,30,40,50Hz;2)電機故障類型:轉子不平衡(UBM)、轉子彎曲(BRM)、斷條(BRB)和健康(HEA);3)采樣頻率:20 kHz。

由表10可以得到如下結論:

1)當目標數據不足時,不論是轉速恒定點還是變化點,遷移學習對機器學習的診斷性能提升均較為明顯(約25%);目標數據充足時,轉速變化點的提升性能(16.45%)優于轉速恒定點(3.44%),即轉速變化點振動特性不一致時,即使增加目標數據量,機器學習性能也無法顯著提升;

2)大幅變速和小幅變速實質是針對不同測試時刻而言,并且可以看出,電機轉速幅值變化對機器學習診斷性能影響較大(m=40時診斷正確率相差4.34%),而對遷移學習算法影響較?。╩=40時兩者均為91.00%)。

電機試驗證明,變轉速時遷移學習比機器學習更具優勢,后者若將振動特征不同的輔助數據并入目標數據,其不但沒有幫助,反而誤導診斷結果,而遷移學習則對診斷性能產生正向效應。

4.結論

本文結合奇異值特征提取與遷移學習策略提出一種電機故障診斷方法,結論如下:

1)自相關奇異值分解方法能夠有效提取電機故障微弱信號特征,其不依賴于先驗知識,更具通用性,所提特征便于計算區分度和可遷移度,特征選取兼顧信息量、計算量以及診斷性能的平衡。

2)遷移學習策略利用輔助數據的權重調整幫助少量目標數據的學習,相比傳統機器學習,變轉速、變負載及變試驗對象條件的少數據量診斷性能提升明顯,且前兩者對診斷性能的影響小于后者,同時輔助數據的選取條件、目標與輔助數據比值條件等對學習性能的影響較大。

3)遷移學習相比傳統機器學習的優勢在于,若引人振動特征不同的輔助數據,前者將提升診斷性能,后者則誤導診斷結果。

猜你喜歡
遷移學習特征提取故障診斷
風力發電機組齒輪箱軸承故障診斷分析
基于EMD和SSAE的滾動軸承故障診斷方法
基于MED—MOMEDA的風電齒輪箱復合故障特征提取研究
從認知角度探討大學英語網絡教學模式
基于曲率局部二值模式的深度圖像手勢特征提取
一種基于遷移極速學習機的人體行為識別模型
大數據環境下基于遷移學習的人體檢測性能提升方法
基于R8C的汽車OBD通用故障診斷儀設計
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合