?

基于流形特征域適配的滾動軸承故障診斷

2024-03-19 07:07周宏娣
振動與沖擊 2024年5期
關鍵詞:源域流形故障診斷

周宏娣,黃 濤,李 智,鐘 飛

(湖北工業大學 機械工程學院,武漢 430068)

軸承是旋轉機械中的關鍵零部件之一,其通常在變工況、多工況條件下運行,極易發生故障,一旦出現故障,輕則影響整個系統的穩定運行,重則造成經濟損失和安全事故[1-2]。因此,實現軸承在復雜工況下的故障診斷具有重大的工程意義[3]。

工程實際中獲取的設備狀態信號通常正常狀態居多、標簽稀缺且故障信息不全,導致智能診斷算法性能受限[4]。遷移學習[5]能夠復用舊知識解決新場景下的新問題,彌補目標域的典型故障信息缺失等問題,被廣泛應用于跨工況條件下的故障診斷[6]。Dong等[7]結合深度學習的特征提取能力,以統計分布和幾何空間聯合調整適配兩域分布,解決了變工況條件下故障診斷效果差的問題。曹潔等[8]提出了一種改進殘差網絡的領域自適應故障診斷方法。Pan等[9]提出遷移主成分分析(transfer component analysis,TCA)算法,在公共子空間中可最小化源域和目標域間的差異,田威威等[10]將TCA應用于滾動軸承故障識別。上述方法通過域分布適配以解決變工況下的故障診斷問題,取得了較好效果。然而,當兩域特征分布差異較大時,僅進行域分布適配難以應對軸承在多工況條件下產生的復雜分布差異[11]。

數據流形局部幾何結構中具有潛在的判別性信息,在進行域適配時對數據固有流形特征挖掘,可應對變工況下產生的復雜分布差異,被廣泛應用于故障診斷[12-13]。Wang等[14]在無監督領域自適應中引入流形對齊,從而減小源域與目標域的分布位移和結構偏移。沈長青等[15]通過在格拉斯曼流形中構建測地線流式核(geodesic flow kernel,GFK),提取故障信息相關流形特征,來減小數據之間的分布不一致和扭曲。劉海寧等[16-17]在子空間中對故障特征進行流形特征變換,從而減小域間特征偏移。上述方法利用流形學習獲取特征表示,但在模型跨域故障識別時,僅對源域與目標域進行域分布對齊,未從局部和全局角度定量評估特征之間相關性,無法有效解決特征扭曲與域間數據偏移的問題。

針對以上問題,本文提出一種基于流形特征域適配(manifold feature domain adaptation,MFDA)的滾動軸承故障診斷方法。首先,利用源域數據無監督地生成與目標域具有相似分布的中間域,構建與源域、中間域和目標域相關的公共子空間。在公共子空間中,利用基于拉普拉斯特征映射(Laplacian Eigenmaps,LE)的局部生成差異度量保留數據流形局部幾何結構,減小數據間局部域差異,避免特征扭曲與發散;其次,采用最大均值差異度量對數據進一步對齊,從全局角度最小化中間域和目標域間的分布差異,保證數據之間局部與全局結構的一致性。最后,通過迭代更新樣本特征偽標簽,以最小二乘法為分類器實現滾動軸承的跨域故障識別。在三個滾動軸承數據集進行試驗,驗證了所提方法的有效性和優良泛化性能。

1 流形特征域適配

圖1 流形特征域適配示意圖

1.1 局部生成差異度量

在原始空間中,源域和目標域特征分布不一致,直接對原始數據進行遷移可能會導致數據扭曲,可以通過投影矩陣將其映射到一個公共子空間上,利用源域無監督的生成一個與目標域具有相似分布的中間域φ(XGT),并以基于LE的局部生成差異度量(local generative discrepancy metric,LGDM)保留數據流形局部幾何結構,從局部角度減小域間差異,提高中間域φ(XGT)和目標域φ(XT)的分布一致性,φ(XGT)和φ(XT)之間的局部聯系可定義為

(1)

式中:DGT和DT為中間域和目標域的分布;Wp,q為鄰接矩陣W。Wp,q為

(2)

(3)

1.2 最大均值差異度量

最大均值差異(maximum mean discrepancy,MMD)能在數據全局分布中有效評估數據分布偏差。因此,本文以最大均值差異度量(maximum mean discrepancy metric,MMDM)從全局角度最小化中間域和目標域間的分布差異,DGT和DT的MMDM(DGT,DT)為

(4)

(5)

式中,1表示全1向量。投影后的中間域為ΦTφ(X)T·φ(XS)Z。因此,MMDM為

(6)

1.3 低秩約束正則化

(7)

1.4 流形特征域適配

通過以上分析,流形特征域適配共包含局部生成差異度量、最大均值差異度量和低秩約束正則化三項。結合式(3)、(6)和(7)流形特征域適配的目標函數為

(8)

式中,τ和λ1為折衷系數。為防止出現平凡解,令PTP=ΦTKΦ=I。

本文在流形特征域適配的基礎上通過變量交替優化的策略獲取最優傳輸矩陣Z和投影矩陣P,利用特征值分解方法求解變量Φ,采用非精確增廣拉格朗日乘子(inexact augmented Lagrange multiplier,IALM)[18]和隨機梯度下降方法求解變量Z。因此,式(8)可表示為

(9)

式中:J為輔助變量;1為全1矩陣;R1為滯后乘數;μ為懲罰參數。參數求解如下。

1.4.1 求解參數Φ

固定變量J和Z,對式(9)進行重構,通過特征值分解,獲取第k次迭代的解Φk,計算過程中將Φk(:,i)設為零,即:

(10)

式中,Φk(:,i)為Φk中第i個最小特征值的最小特征向量。

1.4.2 求解輔助變量J

固定參數Z和Φ。去除式(9)中與J無關的項,通過K+1次迭代后得到JK+1

(11)

1.4.3 求解傳輸矩陣Z

固定變量J和Φ,對(9)進行重構,去除與Z無關的部分,利用梯度下降算子求解Z,獲取最優值。第K+1迭代的解ZK+1為

ZK+1=ZK-α·?(Z)

(12)

式中:?(Z)為梯度;α為梯度下降系數。具體求解過程如下

(13)

本文所提方法主要是對相關變量J,Z和Φ的迭代優化,其求解需要輸入源域數據XS和目標域數據XT,折衷系數τ和λ1。具體步驟如下:

步驟1輸入源域數據XS和目標域數據XT,折衷系數τ和λ1。

步驟2根據式(3)在再生核希爾伯特空間中計算KT=φ(X)Tφ(XT),KS=φ(X)Tφ(XS),K=φ(X)Tφ(X),X=[XS,XT]。

步驟3初始化變量J和Z,即J=Z=0。

步驟4固定Z根據式(10)使用特征值分解方法求解Φ。

步驟5步驟五固定Φ使用IALM求解Z。固定Z,根據式(11)更新優化J;固定J,根據式(13)求解優化參數Z。

步驟6求解滯后乘數R1:R1=R1+μ(Z-J)。

步驟7求解懲罰參數μ:μ=min(μ×1.01,maxμ)。

步驟8檢查收斂性,輸出變量Z和Φ。

2 基于流形特征域適配的滾動軸承故障診斷

基于流形特征域適配的滾動軸承故障診斷方法包含以下四部分:數據采集、特征提取、流形特征域適配、故障識別:

(1) 采集不同工況下滾動軸承振動信號;

(2) 通過數據預處理提取樣本29維時域和頻域特征,構建源域訓練樣本集和目標域測試樣本集,其詳細公式見文獻[20-21];

(3) 根據式(8)構建流形特征域適配模型,迭代優化變量Φ,Z和J,輸出Φ,Z;

(4) 在子空間中通過投影矩陣和傳輸矩陣獲取中間域和新的目標域;

(5) 迭代更新數據偽標簽,然后利用最小二乘法進行分類,獲取最終診斷結果。

所提故障診斷方法流程如圖2所示。

圖2 故障診斷流程圖

3 試驗和分析

3.1 試驗數據

為了驗證所提方法的有效性,對同一設備下的跨域故障診斷試驗進行分析,數據來源于課題組滾動軸承振動測試臺,如圖3所示。試驗軸承為NSK 6205,包括5種滾動軸承運行狀態:正常、內圈故障和外圈故障(故障直徑:0.2 mm、0.5 mm)。在轉速為1 800 r/min和2 400 r/min中采集不同徑向載荷(0、600 N)下每種軸承的振動信號,采樣頻率10 240 Hz。數據集中每類工況包含100個樣本、樣本長度為1 024點。

圖3 滾動軸承試驗臺

根據負載和轉速不同設置4種不同工況,分別標記為A、B、C、D,具體信息如表1所示。此外,為驗證模型在復雜工況下的泛化性能,設置單域遷移(源域和目標域為單一工況)和多域遷移(源域和目標域中具有多工況)試驗對模型性能進行驗證。單域遷移試驗中,源域和目標域數據集每類100個共500樣本;多域遷移試驗中,AB、BC等每類100個共1 000個樣本,ABC等每類100個共1 500個樣本。

表1 滾動軸承數據集

3.2 參數設置

3.3 試驗結果分析

同一設備下7種方法的跨域故障識別結果如表2、3所示。由表2可知,在單域遷移中,所提方法的平均識別率達到98.21%。由表3可知,在特征分布復雜的多域中,所提方法的平均識別率可達96.69%。隨著工況復雜程度的提高,本文方法診斷精度仍高于KNN,SVM和其他五種遷移學習方法。原因在于:機器學習方法直接基于原始數據訓練模型進行測試,泛化效果差,分類能力低。遷移學習方法中,GFK經過特征選擇與變換,減小了數據差異,但未進行域分布對齊,出現過適配,影響了分類效率;TCA和SSTCA直接對數據進行分布對齊,導致分布不一致的數據間出現特征扭曲,診斷精度下降;TLPP基于相關假設構建數據先驗結構,傳遞相關信息,最小化域間分布差異,但特征發散未解決,不利于樣本區分;DANN僅考慮源域和目標域之間的相似特征,在數據中難以保證特征空間的對齊。本文方法在域分布對齊前以源域生成和目標域具有相似分布的中間域,從局部角度保留數據間的深層判別性信息,避免了特征扭曲,減小了數據間的偏移。

表2 單域不同算法對比結果

表3 多域不同算法對比結果

為了深入探究本文所提方法和相關對比方法的工作機制,隨機選取遷移任務BC→AD,利用t-分布鄰域嵌入(t-distribution stochastic neighbor embedding,t-SNE)算法對各遷移學習方法進行特征可視化,并以散點圖呈現,如圖4所示。由圖4可知,幾種遷移學習方法經域適配后,大部分故障類別區分較明顯,但同類故障聚合性差,且正常和外圈0.5 mm樣本重疊,故障難以區分。由圖4(f)可知,所提方法的樣本聚類效果明顯,數據可分性更強。原因在于:本文所提方法通過域生成和分布對齊,以中間域將源域和目標域對齊,增強了領域間相似性、判別性信息,降低了差異性信息對故障識別結果的影響,使故障特征可分性和代表性更高。

(a) GFK

同時,為了驗證域生成和分布對齊的有效性,如圖5所示,以B→ACD任務為例,對比了不同方法在不同樣本數量下的準確率。其中,源域數據集中每類故障樣本量由15遞增至100,目標域數據集中每類故障樣本量為100。由圖可知,所有方法的診斷性能均隨著樣本數的增加而有所提高。此外,所提方法在樣本數為35時便可以達到穩定狀態,其他方法的準確率雖隨著樣本數增加而呈現上升趨勢,但診斷性能均低于所提方法。原因在于本文方法可避免源域和目標域之間的轉換誤差以提高模型的泛化能力。

圖5 不同方法的準確率對比

3.4 參數分析

高斯核參數的影響著中間域的生成,進而影響故障診斷效果,因此有必要對的敏感性進行討論。隨機挑選4個遷移任務(A→B;C→B;A→BCD;AC→BD)在不同高斯核σ參數下進行試驗,結果如圖6所示。由圖6可知,各任務的識別準確率隨的增大呈下降趨勢,其識別精度在[0,1]范圍內雖有波動,但整體擁有較高水平。對于其他參數,本文通過遍歷尋優獲取最優參數組合以提高模型的性能。

圖6 高斯核σ參數敏感性

3.5 計算效率分析

為了進一步分析所提方法計算效率,隨機挑選2個遷移任務(C→A;BD→AC)對所提方法、GFK、TCA、SSTCA與TLPP的時間復雜度進行討論。結果如圖7所示。各任務的計算時間隨樣本數增加而增加,但所提方法的計算時間除GFK外均少于其他方法,原因在于GFK只處理數據局部域信息,大大加快與簡化了計算過程,而本文所提方法在處理數據局部信息的同時,處理數據全局信息,導致計算復雜度增加,計算時間較長。

4 泛化性能試驗

4.1 試驗數據構建

為了分析所提方法的泛化性能,將其應用于不同設備下的跨域故障識別。試驗研究對象為深溝球軸承。數據來源于凱斯西儲大學軸承數據中心(Case Western Reserve University,CWRU)[27]、機械故障預防技術學會(MFPT)[28]和課題組滾動軸承試驗臺(ZC),數據集分別以E、F和G表示,每個數據集選取正常(N)、內圈故障(IR)和外圈故障(OR)三種類型,每類以1 024個樣本點截取100個樣本,具體信息如表4所示。設置多域遷移試驗方案,其中E、F、G各300個樣本,EF、FG、EG各600個樣本,EFG各900個樣本。

表4 軸承工況信息

4.2 試驗結果分析

表5和圖8分別為跨域診斷結果和G→EFG t-SNE圖。由結果可知,所提方法在不同設備下的跨域故障識別的平均識別率可達99.86%。GFK雖然在子空間中通過特征選擇與變換可獲取明顯分類效果,但未進行域分布對齊,導致GFK較所提方法低4.01%。面對數據分布差異更大時,TCA和SSTCA僅考慮邊緣分布對齊,數據之間偏移更大,特征扭曲更為嚴重,導致所提方法平均識別準確率較TCA高12.06%,較SSTCA高11.30%。TLPP雖然基于相關假設構建數據先驗結構,最小化域間分布差異,傳遞相關信息,但未考慮類內和類間距離,不利于樣本區分,使得所提方法識別準確率較TLPP高11.77%。DANN雖然具有較強的自適應能力,但在不同設備下,域間數據差異大,其診斷性能大幅度下降,導致DANN較所提方法低9.46%。對比圖8,面對數據分布差異復雜時,所提方法通過域適配和域生成減小域間差異,并保留局部幾何結構中的判別性信息,提高了數據類內緊密性和類間可分性。

表5 跨域診斷結果

(a) GFK

5 結 論

在本文中運用MFDA對跨工況下滾動軸承進行故障識別,旨在解決多工況下復雜分布數據在原始空間進行分布對齊時,出現的特征扭曲和發散問題。優勢在于:

(1) 利用源域數據以無監督的方式生成一個與目標域具有相似分布的中間域,并利用局部生成差異度量保留數據流形局部幾何結構中潛在的判別性信息,不僅能夠避免數據扭曲與發散,還能夠從局部角度提高源域與目標域之間的分布一致性。

(2) 通過最大均值差異度量對數據進一步對齊,從全局角度最小化數據間的分布差異,在面對多工況下產生的復雜分布差異時仍能取得很好的效果。

(3) 基于MFDA框架建立的故障識別模型診斷能力強,經過單域和多域試驗驗證了所提方法具有優良的魯棒性、泛化性能和工程實際應用價值。

猜你喜歡
源域流形故障診斷
多源域適應方法綜述
基于參數字典的多源域自適應學習算法
緊流形上的Schr?dinger算子的譜間隙估計
迷向表示分為6個不可約直和的旗流形上不變愛因斯坦度量
Nearly Kaehler流形S3×S3上的切觸拉格朗日子流形
因果圖定性分析法及其在故障診斷中的應用
可遷移測度準則下的協變量偏移修正多源集成方法
基于多故障流形的旋轉機械故障診斷
基于LCD和排列熵的滾動軸承故障診斷
基于WPD-HHT的滾動軸承故障診斷
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合