?

壓縮感知字典遷移重構的小樣本軸承故障診斷

2024-05-07 02:15孫潔娣趙彬集溫江濤時培明
振動與沖擊 2024年5期
關鍵詞:源域字典故障診斷

孫潔娣,趙彬集,溫江濤,時培明

(1.燕山大學 信息科學與工程學院,河北 秦皇島 066004;2.燕山大學 河北省信息傳輸與信號處理重點實驗室,河北 秦皇島 066004;3.燕山大學 河北省測試計量技術及儀器重點實驗室,河北 秦皇島 066004)

現代大型機械和設備日益復雜化、智能化,滾動軸承作為齒輪箱、動力機械等旋轉機械的關鍵部件,其故障會造成巨大的經濟損失甚至帶來嚴重的生命威脅。

近年來,傳統的故障診斷方法已逐步發展到智能診斷階段,基于深度學習的故障診斷方法已成為當前的熱點[1-2]。旋轉機械智能故障診斷研究自深度學習引入后,擺脫了傳統方法對專業知識及診斷經驗的過度依賴,通過構建深度神經網絡以及對大量樣本數據的充分學習,取得了優越的診斷性能。學者們研究了多種基于深度網絡模型的診斷方法[3-5],大量研究成果在采用實驗室或公開數據庫的數據驗證時都獲得了很好的效果。深度模型的良好性能依賴于故障類別明確、有標簽樣本充足的可靠數據集,然而在實際工業環境中,工況變化復雜難以預知,采集的新測試樣本與訓練樣本分布差異較大;且監測過程中采集的多為正常狀態樣本,特定故障類型的有效標簽樣本極少甚至缺失,這些都造成嚴重的可學習數據信息不充足的情況,因此深度神經網絡方法在面臨“小樣本、變工況”復雜場景識別時,性能受到極大影響,嚴重限制了此類方法在實際中的應用。為此,學者們從不同角度為解決小樣本智能故障診斷問題進行了廣泛研究。

近年來,遷移學習的發展為小樣本分類問題提出了新的思路。不同工況下數據的邊際分布存在差異,這就導致故障診斷理論算法與工程應用之間存在著障礙。特征遷移學習通過使域分布差異最小化[6-7]獲取域間共享特征來消除這種障礙。分布差異通常由最大均值差異(maximum mean discrepancy,MMD)[8]指標來衡量,學者們提出的多種MMD改進算法[9-10]能更好地衡量域間差異,獲得更佳的域不變特征提取效果。在提升分布差異函數性能的同時,優化域對齊算法可進一步改善域不變特征。Wu等[11]提出了一種深度強化傳輸卷積神經網絡來解決分布差異問題,能夠自主學習故障樣本與相應標簽之間的潛在關系。Yin等[12]提出基于遷移動態自動編碼的學習框架,通過提取數據的動態特征,再用遷移學習解決不同場景下的模型自適應問題。Si等[13]提出了一種具有力矩匹配的無監督深度傳輸網絡,利用灰度時頻圖像作為網絡輸入,并采用兩種自適應方法來減少分布差異。通過分析文獻發現,目前的特征遷移方法主要關注如何分析信號來尋找域不變特征,為此構造的深度神經網絡通常較為復雜,訓練時間較長,用于縮小域差異的優化函數構造不易,尋找目標域和源域共享的域不變特征一直是研究的重點和難點。

對故障樣本進行擴充從而改變數據不平衡狀態是另一個解決小樣本故障診斷問題的研究方向。此類方法通過對原始一維時域故障信號進行反轉、縮放、拼接等多種操作生成新樣本,在增加樣本量的同時盡可能保證新生成樣本的主要故障特征與原始信號相似[14-15];更為常用的做法是利用可變長度的時間窗進行重疊切分來增加訓練樣本量,此類數據增強方法[16-20]樣本變換方式簡單,但擴充的數量較少,故障樣本多樣性不足,不利于深度網絡學習,為此學者們研究了基于過采樣插值的數據合成方法,最為經典的就是合成少數類過采樣技術(synthetic minority oversampling technique,SMOTE)及其變體方法[21]。此類方法在真實樣本基礎上利用線性插值方法合成新樣本,緩解了隨機過采樣方法帶來的過擬合問題。但基于SMOTE的方法合成的樣本質量較低,容易降低數據特征的整體穩定性。自適應合成采樣(adaptive synthetic sampling,ADASYN)方法[22]通過細化原始SMOTE的樣本合成規則,提高了合成樣本的質量,但易受到合成規則的影響。

利用生成式對抗網絡[23](generative adversarial network,GAN)來產生新樣本是目前的另一大類方法。GAN通過生成與真實數據相似的假數據,盡可能地捕捉給定真實數據的分布,生成信號可與原始信號具有相同的分布,在一定程度上緩解了數據不足的問題[24]。目前,GAN已成為故障診斷領域解決數據不足問題的主流方法,Zhang等[25-26]采用GAN方法生成新的樣本以擴充訓練數據集,并將其用于訓練故障診斷模型,提升了模型的泛化性能。但GAN類方法會受到梯度消失、模態崩潰等影響,易導致生成的數據相似度不高;且當只有少量真實一維信號樣本的情況下,對樣本內在的有效信息學習能力不足,生成的信號質量不佳。

增加小類別樣本數量是解決數據不平衡問題的有效方法。當前多數方法主要針對故障樣本的時域信號進行處理,僅采用少量樣本、集中在時域生成的方法易受原信號影響,出現生成信號質量不高、樣本重疊、泛化等問題。GAN類方法存在訓練困難、生成樣本多樣性不足等問題,且若需要生成多種不同類型的故障數據需要重新進行網絡訓練和調整。如何從本質上挖掘不同類型樣本內在的有效故障信息,從多個角度生成樣本信號,在增加數量的同時豐富樣本多樣性,具有重要的理論研究和應用意義。

近年來發展起來的壓縮感知(compressed sensing,CS)理論,將傳統的對信號采樣轉化為對信息的采樣,通過變換空間投影方法實現了對原始信號有效信息的獲取。壓縮感知變換得到的是一種新的變換域信號,它以新的形式包含了原時域信號的全部有用信息[27]。采用不同的重構方法對同一采集結果進行逆向變換后,可以得到含有相同有效信息但時域表征略有差異的重構信號。這一獨特的性質為解決機械故障診斷領域面臨的數據不平衡問題提出了新的思路!基于字典學習的重構算法因其良好的重構性能和靈活的字典構造方法,在軸承故障領域得到了較為廣泛的研究[28-29]。Wang等[30]提出了一種有較深且共享結構的字典學習方法,采用有特征傳遞的字典層,通過共享結構學習不同類別的共同特征,提取特征后用于故障診斷。Zhao等[31]提出了一種新的數據融合驅動的稀疏表示學習框架,通過融合策略消除每個故障類字典中原子共享中不重要的特征,進一步提高了融合字典的可辨別性,可用于小而不平衡的樣本的故障診斷。Chen等[32]提出了一種多尺度交替方向乘法的字典學習,可用于軸承故障診斷的故障脈沖提取和特征增強。利用字典學習方法獲取源域故障字典,將其遷移至目標域后結合壓縮感知重構方法生成目標域樣本信號,達到擴充樣本量、解決小樣本分類問題的目的。

針對實際軸承故障診斷中,有標簽數據極少的小樣本情況嚴重影響深度網絡模型的識別性能的問題,本文將壓縮感知重構與特征遷移學習結合,提出了一種新的基于字典遷移的壓縮感知重構數據增強方法。文中首先對典型故障信號進行學習生成原始故障字典,再通過遷移學習方法獲得目標域遷移字典,最后通過壓縮感知重構生成目標域新樣本信號,在此基礎上訓練深度神經網絡模型,實現小樣本軸承故障診斷。文中采用廣泛使用的智能診斷網絡驗證了所提出的方法,結果表明本文方法可在獲得域不變特征基礎上,實現數據的增強和多樣性的充實,且診斷性能較好。

1 相關理論概述

1.1 常用的數據增強方法

在軸承故障診斷領域,常用來進行一維故障振動樣本增加的方法包括滑動窗重疊切分、線性插值以及GAN方法。

傳統的方法主要采用固定長度的窗對獲取的一維振動信號進行重疊切分,此類方法處理簡便,速度快,且通過調整重疊率可以進行不同程度的樣本擴充。不足之處包括僅對部分數據進行重復,未考慮對故障信息的影響;另外受重疊率影響,擴充的數據量有限。

SMOTE作為一種結合臨近樣本生成新樣本的過采樣技術,通過計算歐氏距離得到每個少數類樣本的一些鄰居樣本。再隨機從最近K個鄰居中選取擴增倍數個鄰居樣本,并按照以下公式分別與原樣本構建一個新的樣本。

(1)

此類方法有效緩解了隨機過采樣引起的過擬合問題,由于算法簡單而得到廣泛應用。然而在選擇最近鄰樣本時存在一定的隨機性,且關鍵參數K值確定困難,難以保證增強效果的穩定,還易出現分布邊緣化問題。

生成對抗網絡利用生成器和判別器之間博弈的結果[33]、在判別器的監督下由生成器生成樣本。如果生成數據的分布能夠與真實的數據分布吻合,那么判別器將被最大限度地混淆。在數據增強領域,由于一維數據變換方式單一,GAN生成數據的多樣性不如二維信號豐富,同時其模型訓練中出現的梯度消失會使生成的樣本與實際樣本相差較大,模式崩潰則將導致最終生成的樣本固化,缺乏多樣性。訓練時需要大量的標記樣本作為模型的輸入,但生成樣本的質量難以控制,且訓練時間較長。

1.2 基于字典學習的壓縮感知重構

由Candes等[34]提出的CS在實際工程應用領域得到廣泛應用。

YM×1=ΦM×NXN×1

(2)

這少量的測量Y中包含了信號X的全部有用信息,觀測信號M與原信號長度N之間的維數差異可定義為壓縮比(compression ratio,CR)

(3)

結合測量矩陣,采用不同的優化算法可由壓縮采集結果重構出原信號。字典學習類重構算法以數據的稀疏性為前提,用少量字典原子線性組合的方式表示數據的絕大部分信息,其目標函數如式(4)。

(4)

2 本文提出的算法

實際軸承故障診斷中,因小樣本問題導致深度神經網絡類故障識別方法性能受到較大影響。本文以壓縮感知故障信息提取為基礎,結合字典學習和域間遷移,提出一種基于學習字典原子遷移重構的數據增強方法,解決小樣本故障識別問題。首先利用源域數據通過小波包字典優化算法生成特定字典,之后利用目標域樣本微調表示系數生成遷移字典,再通過遷移字典生成更多有目標域特征的新樣本,用生成的新樣本訓練深度神經網絡故障識別模型,可實現高準確度的軸承故障診斷。圖1為本文方法的整體處理過程。

圖1 本文方法的整體處理過程

2.1 源域特定字典生成

結合軸承故障信號特性生成特定的字典,能夠更好地描述信號。小波包分解是軸承故障信號分析中的有效方法,本文采用小波包分解字典優化方法來生成源域特定字典。首先對小波包分解結果進行優化,再采用已優化的小波包字典分解方法獲得初始化基礎字典[37],最終通過K-SVD學習生成優化的分解字典。具體的字典構建過程如圖2所示。

圖2 小波包字典優化算法流程

第一階段小波包變換矩陣初始化,小波包基函數提取低通和高通濾波器序列,再通過零值擴展、循環移位、合并矩陣和矩陣相乘等操作,形成最終的小波包變換矩陣。第二階段是字典原子更新,優化具有普適性的小波包初始字典,可通過結合故障信號特征進一步提高表示系數的稀疏程度,該算法的詳細過程如下。

步驟1輸入先驗信息構建小波包基函數。

步驟2構造小波包分解矩陣和重構矩陣,并將小波包重構矩陣作為初始小波包字典。

步驟3輸入訓練樣本數據、構建小波包初始字典和設置K-SVD參數。

步驟4初始小波包字典通過K-SVD算法優化,轉化成優化小波包字典。

對于本文研究的一維振動信號,若長度為N的信號中只有T0個元素是非零的,那么本文中將其稀疏度用非零元素的個數T0來表示。

2.2 目標域遷移字典生成

目前多數研究中源域信號來自實驗室,能提供大量故障樣本,而目標域由于是真實場景數據,故障樣本極度缺乏。在共享表示系數的基礎上,將源域字典向目標域進行遷移,生成遷移字典,再結合表示系數生成目標域信號,可以實現目標域樣本擴充。

本文引入在線字典學習中的字典更新方法來實現字典遷移,可在保證源域表示系數基本不變的前提下生成目標域字典。

以生成的源域特定字典和源域表示系數為基礎,目標域真實樣本為信息輸入,固定表示系數,優化源域字典使其轉化成含有目標域信息的遷移字典。

微調表示系數,繼續優化目標域遷移字典,使其對目標域樣本有更佳的分解效果。

具體過程見算法1。

算法1遷移的字典更新算法要求:x為目標域樣本,λ∈RR(正則化參數),Do∈RRN×k(初始字典),T(迭代次數)。1:A0∈RRk×k←0,B0∈RRN×k←0(重置“過去”信息)。2 At←At-1+αtαTt3 Bt←Bt-1+xtαTt4 使用算法2計算DtDt?arg minD∈C1t∑ti=112xi-Dαi22+λαi1()= arg minD∈C1t12Tr(DTDAt)-Tr(DTBt)()5 結束:返回Dt(學習詞典)。

在線字典學習方法可以單獨更新字典。具體過程見算法2。給定一個表示系數矩陣,通過字典更新算法獲得一個近似的字典。無須設置超參數和調整學習率,且運行時間較短。

為了避免字典在更新過程中收斂過快,本文采用正交追蹤匹配算法[38]來微調表示系數,它在每一次迭代中計算原子內積的殘差,選擇局部最優原子,然后用原始信號的逐步逼近來計算該原子的系數。通過小波包字典優化算法生成的字典能夠與源域樣本很好的匹配,與表示系數結合后生成重構的信號與原始信號誤差極小。K-SVD可得出指定稀疏度的稀疏表示系數,正交追蹤匹配算法也關注信號的稀疏度。正交追蹤匹配算法通過在字典中原子與表示系數正交,通過殘差值促進表示系數更新,其更新迭代次數取決于表示系數稀疏度。正交追蹤匹配算法通過局部獲取表示系數值,得到指定稀疏度的表示系數。這既保證表示系數這一域共享特征的基本不變,也促進了字典的進一步更新。

算法2稀疏編碼更新要求:D=[d1,…,dk]∈RRN×k(輸入字典),樣本x。初始化:初始殘差,支撐索引集,迭代初始值j=1。迭代過程:在第T0?k取整次循環中執行(1)~(3)。(1) 尋找支撐索引:λk=arg maxi=1,…,Nrk-1,di。(2) 將尋找到的最相關字典元素的索引加入索引集:Λk=Λk-1∪{λk}。(3) 更新殘差:rk=x-DΛk(DTΛkDΛk)-1DTΛkx。輸出:支撐索引集Λk=Λk-1,稀疏系α^=(DTΛkDΛk)-1DTΛkx返回到字典學習更換稀疏編碼。

通過以上的字典更新過程,實現了源域字典向目標域字典的遷移,生成了遷移字典。用共享表示系數與遷移字典可生成具有目標域特征樣本。

2.3 目標域樣本擴充

實際故障診斷中目標域數據來自真實場景,本文的目標域字典生成后,需要少量有標簽的目標域樣本提供目標域信息,促使字典重構樣本時能夠更好地向目標域遷移,為此提出用稀疏表示分類算法先篩選目標域標簽真實樣本,再進行新樣本生成。

首先將用于字典學習的由源域樣本組成的過完備字典作為基函數,然后通過自適應追蹤算法從字典中找到少量的原子,最后通過線性組合的方式擬合目標信號[39]。其目標函數如式(5)所示。

(5)

式中:α為表示系數;λSRC為正則化平衡參數。本文采用的正則化最小化方法為最小絕對值收縮和選擇因子算法,可解決L1-范數回歸問題,即最小化α={αj}。

(6)

其中∑|αj|≤s,此算法可以選擇和縮減變量,作為一個凸函數算法,計算較為方便。先計算表示系數,再通過殘差值判斷測試樣本y標簽的真實性,篩選規則可用式(7)表示

(7)

通過殘差值來判斷目標域樣本與源域樣本的差異程度,殘差值較小的樣本更接近標簽樣本,能夠更好地被同類源域樣本稀疏表示,可遷移性更好。

通過小波包字典優化算法創建源域字典和表示系數,再通過字典遷移方法生成目標域遷移字典。大量有標簽的源域表示系數與目標域遷移字典相乘會生成大量具有目標域特征的樣本,完成小樣本下目標域樣本的數據擴增,采用生成的新樣本來訓練深度智能故障識別模型,可實現準確的故障識別。

3 實驗情況概述

本文選用西儲大學(Case Western Reserve University,CWRU)軸承數據中心[40]和機械故障預防技術軸承數據中心[41](Mechanical Fault Prevention Technology,MFPT)的實驗數據來進行驗證。CWRU實驗數據由6205-2 RS JEM SKF深溝球軸承測量信號組成,該信號的軸承負載分別為0 hp、1 hp、2h p、3 hp。本文選取0 hp負載數據作為源域,負載為3 hp數據作為目標域,假設目標域信號處于小樣本情況,而源域故障信號較為充足并已標注。需識別的類型包括正常數據(Normal,N)、軸承內圈故障(inner failure,IF)、滾動元件故障(rolling failure,RF)和外圈相對位置重合區(6點方向的中心位置,outer failure,OF),樣本長度1 024。參數如表1所示。

表1 CWRU訓練集參數

MFPT軸承數據選取0.235 dm滾筒直徑和1.245 dm間隔直徑的軸承實驗結果,識別的類型包括正常數據(N)、軸承內圈故障(IF)、滾動體故障(RF)和外圈相對位置復合故障(OF)。標簽0和1的樣本在270 lbs負載下,輸入軸頻率為25 Hz,采樣率為97 656 Sa/s;其他的采樣率為48 828 Sa/s,輸入軸頻率為25 Hz。目標域數據是由負載為50和300 lbs的兩種外圈故障、50和250 lbs的兩種內圈故障和270 lbs下健康和外圈故障數據共六種故障組成。源域數據參數詳如表2所示。

表2 MFPT訓練集參數

4 本文方法的數據增強效果分析

4.1 生成樣本的時頻域質量評估

本文分別選取CWRU中的40個樣本、MFPT中的50個樣本作為目標域真實樣本。源域樣本通過字典學習,獲得共享表示系數組,與遷移字典相乘可以逼近目標域真實樣本。

對于一維時域振動信號,本文用歸一化均方誤差和皮爾遜相關系數來衡量目標域樣本生成的效果。圖3和4分別為源域信號、真實樣本及生成樣本結果。此處以某個內圈及外圈故障信號的生成結果為例,圖3給出兩種故障信號的時域波形。

(a) 內圈故障

從內圈和外圈故障的目標域生成信號的時域結果能夠看出,由源域信號經遷移重構后生成的信號與目標域信號相似性較高;生成的內圈故障與真實內圈故障信號的皮爾遜相關度系數可達到98.75%,歸一化均方誤差3.83%;外圈故障的皮爾遜相似度系數可達到99.05%,歸一化均方誤差3.06%。

為了進一步衡量生成信號的質量,圖4給出圖3中各信號的頻域結果。

(a) 內圈故障

從圖4(a)和(b)能夠看出,真實信號和生成信號在頻域上較為相似。遷移重構后的樣本與目標域原始樣本的平均Pearson相似系數為0.979 7±0.021,NMSE為0.073 9±0.239。

KL(Kullback-Leible)散度可用于衡量兩個概率分布之間相似性,為此本文用KL散度來衡量不同數據增強方法產生的數據與原始數據之間的差異程度。本文方法、SMOTE和GAN生成的內圈與外圈故障數據與原始數據分布的KL散度值如表3所示。

表3 KL散度測量值

與其他數據生成方法相比,本文方法生成的IR和OR故障信號在數據分布上與原始信號更為相似。本文方法生成的所有類別的故障數據與原始數據的平均KL散度為0.608。

由以上的實驗結果可知,本文數據增強方法生成的信號從時域和頻域都能與目標域信號較為相似,說明在遷移字典基礎上生成新樣本的方法是可行且有效的。

4.2 生成信號的故障特征頻率分析

軸承故障信號的特征頻率是識別故障類型的關鍵信息。此部分評估本文方法生成的目標域樣本特征的保留情況。此處以西儲數據負載為3 hp轉速為1 730 r/min的目標域內圈故障原始信號為例,采用EEMD分解結合包絡譜的方法分析其特征頻率。分析結果如圖5所示。

(a) 原始故障信號的包絡譜結果

由圖5(a)的結果可以看到,原始信號與生成信號的包絡譜較為相似,表明二者的主要特性相似;圖5(b)中,由EEMD分解后的IMF分量及其對應的分量譜可以看出,部分生成信號與原始信號存在一定差異。源域字典建立后,故障信號可唯一地用字典原子與表示系數的組合來描述,因此源域樣本的多樣性使得表示系數也具有多樣性;當目標域遷移字典生成后,表示系數與目標域字典重構生成的信號也具有多樣性,既具有目標域的特征,但又與真實目標域樣本不盡相同。

4.3 生成樣本的特征分布

為驗證遷移重構生成樣本的合理性以及目標域數據在分類時的判別性,本小節將真實樣本以及不同增強算法生成的樣本進行特征提取結果的可視化,即將新樣本集輸入至卷積網絡中提取特征后用T-SNE進行可視化。各種方法生成樣本的特征分布散點圖如圖6所示。

圖6 各種方法生成樣本特征分布圖

由圖6可知,本文方法生成的樣本具有更大的類間距離和更小的類內距離,更有利于提高故障診斷準確率。

5 數據增強對故障診斷效果的影響

5.1 測試網絡簡介

本文提出的數據增強方法主要用于解決標簽樣本不足情況下的軸承故障診斷,提高小樣本情況下深度神經網絡方法的診斷準確率,為了測試本文增強方法生成的樣本對于故障診斷效果的影響,此處給出采用常用的深度網絡來進行故障分類的結果。

CNN作為一種性能優良的神經網絡,在故障診斷領域得到了廣泛的應用?,F有研究結果表明其網絡深度對于復雜信號的學習和分類效果有一定影響,因此本文采用了深度不同的兩種卷積網絡來驗證本文生成樣本的有效性,分別為層數較少的一般卷積網絡以及稠密網絡(DenseNet)。本文構造的一般卷積網絡結構如圖7所示。

圖7 一般CNN網絡結構

CNN主要由卷積層、最大池化層和分類器層構成。卷積層和最大池化層用于特征學習。分類器層通過學習的特征將樣本分為不同的類別。

本文用于驗證的另一種卷積神經網絡為稠密網絡,其參數如表4所示。

表4 稠密網絡參數

DenseNet采用密集連接機制:即互相連接所有的層,每個層都會接受其前面所有層作為其額外的輸入。密集連接機制使每個層都會與前面所有層在通道維度上連接在一起,并作為下一層的輸入,直接連接來自不同層的特征圖,可實現特征重用,提升效率。

5.2 數據增強方法對小樣本診斷的性能改善

基于深度學習的智能診斷方法在實際應用中面臨小樣本情況,嚴重影響深度網絡模型的識別性能。文中提出的數據增強方法能夠生成具有故障信號特性的新樣本,可用于訓練深度網絡,且效果較好。本節通過統計實驗結果看到本文方法對小樣本情況下網絡診斷性能的改善。

選取MFPT數據集的數據進行實驗,診斷網絡為前文的一般CNN網絡,采用數據集中的真實故障樣本訓練網絡后進行診斷,圖8中淺色柱狀結果為不同數量樣本訓練后的多次診斷平均準確率及標準差。由結果可以看到,當訓練樣本量減少時,診斷性能下降明顯,即同樣的診斷網絡在故障樣本較少時,診斷效果會受到嚴重影響。圖中的深色柱狀統計結果為采用本文的數據增強算法,將訓練樣本量增加后的診斷結果,可以看到診斷效果有了明顯改善。

圖8 本文增強方法與不同數量真實樣本訓練網絡后的診斷準確率統計

5.3 不同增強算法的診斷結果及分析

本文從壓縮感知有效信息提取及重構的思想出發,通過將源域故障字典遷移生成目標域遷移字典,并結合表示系數可在目標域產生大量樣本,改善目標域有效樣本缺乏的情況。為了驗證本文方法的效果,分別采用本文方法增強的樣本與常用數據增強算法生成的樣本來訓練兩種測試診斷網絡,并分析診斷性能。對比的增強方法為:重疊采樣、SMOTE及GAN方法,采用不同的數據增強方法構成的訓練樣本集主要包括:

(1) 源域:大量有標簽源域樣本數據。

(2) 真實樣本:少量有標簽目標域樣本數據。

(3) SMOTE,GAN和本文方法:采用這些方法將少量有標簽目標域樣本數據擴充到同等規模。

(4) 真+源:真實樣本和源域樣本的數據組合。

(5) 本+源:本文方法生成的數據和源域數據的組合。

所有數據都進行相同的預處理之后,按照上述組合構成訓練數據集訓練診斷網絡提取特征,后續進行故障診斷。

為避免隨機因素影響,進行15次故障診斷實驗,統計平均診斷準確率和偏差如圖9所示。

(a) CWRU數據集結果

由圖9和表5的診斷結果看到,由于源域和目標域信號差異較大,直接用源域樣本訓練模型去識別目標域故障,識別準確率不高;采用SMOTE、GAN及本文方法進行數據增強后,識別準確率有了較大改善,且用本文方法增加的樣本訓練識別網絡,診斷效果好于使用其他兩種。

表5 不同數據增強方法診斷準確率統計

綜合以上結果可以發現,一方面,采用淺層CNN網絡由于較淺的網絡特征提取能力不足,當源域與目標域信號差異較大時,識別性能一般;另一方面本文所提方法與其它數據增強方法相比,相同數量的標簽樣本訓練的深度模型,在診斷準確率提升上有較大優勢。通過數據增強的目標域新樣本和源域樣本組成更大規模的數據集可使診斷準確度進一步提升。本文提出方法在CWRU數據集上的診斷準確率比真實樣本高2%左右,比其他數據增強方法高1%以上;在MFPT數據集中比真實樣本高3.5%左右,比其他數據增強方法高3%以上。

采用同樣的訓練樣本集來訓練稠密網絡,實驗的結果如圖10所示。

(a) CWRU數據集結果

由圖10和表6的稠密網絡診斷結果可以看到,本文方法依然有效。另一方面稠密網絡通過更深的網絡結構以及密集連接處理,緩解梯度消失問題,加強了特征傳播和復用,提升了診斷性能。

表6 不同數據增強方法準確率統計

由以上結果可以看到,本文提出的數據增強方法不僅能夠有效增加樣本量,并且通過有效信息的提取、學習及遷移,在目標域和源域之間尋找到內在聯系,使得不同軸承故障的本質特征得以有效傳遞,生成的樣本更加有利于深度網絡的學習。

6 結 論

針對實際軸承故障診斷中,有效的故障樣本稀缺產生的小樣本故障識別問題,本文提出基于壓縮感知學習字典遷移的數據增強算法。該方法通過優化小波包的字典學習方法獲取源域字典,并結合少量的真實目標域進行遷移構建目標域遷移字典,最終在目標域生成大量新樣本,完成小樣本下目標域信號的數據增強。采用常用的深度診斷網絡測試結果表明,在不同深度的診斷網絡上都獲得了較好的性能。與常用的數據增強方法相比,本文方法從新的視角關注對深度故障特征的挖掘和逆向遷移重構,生成的數據時域雖有差異但都含有軸承故障的特定信息,從而改善了生成樣本的多樣性,為解決小樣本故障診斷問題提出新的思路,有一定的理論研究和實際應用價值。

猜你喜歡
源域字典故障診斷
多源域適應方法綜述
開心字典
開心字典
基于參數字典的多源域自適應學習算法
我是小字典
正版字典
因果圖定性分析法及其在故障診斷中的應用
可遷移測度準則下的協變量偏移修正多源集成方法
基于LCD和排列熵的滾動軸承故障診斷
基于WPD-HHT的滾動軸承故障診斷
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合