?

動態增殖流形學習算法在機械故障診斷中的應用

2014-05-16 07:01湯寶平
振動與沖擊 2014年23期
關鍵詞:流形約簡降維

宋 濤,湯寶平,鄧 蕾

(重慶大學機械傳動國家重點實驗室,重慶 400044)

動態增殖流形學習算法在機械故障診斷中的應用

宋 濤,湯寶平,鄧 蕾

(重慶大學機械傳動國家重點實驗室,重慶 400044)

針對現有的批量式流形學習算法無法利用已學習的流形結構實現新增樣本的快速約簡的缺點,提出增殖正交鄰域保持嵌入(Incremental Orthogonal Neighborhood Preserving Embedding,IONPE)流形學習算法。該算法在正交鄰域保持嵌入算法基礎上利用分塊處理思想實現新增樣本子集的動態約簡。從原始樣本中選取部分重疊點合并至新增樣本,對重疊點和新增樣本子集不依賴原始樣本使用正交鄰域保持嵌入(ONPE)進行獨立約簡獲取低維嵌入坐標子集,并基于重疊點坐標差值最小化原則,將新增樣本低維嵌入坐標通過旋轉平移縮放整合到原樣本子集中。齒輪箱故障診斷案例證實了IONPE算法具有良好的增量學習能力,在繼承ONPE優良聚類特性的同時有效提高了新增樣本約簡效率。

增殖流形學習;正交鄰域保持嵌入;動態約簡;分塊處理;故障診斷

流形學習以其良好的非線性維數約簡能力成功應用于機械故障診斷領域[1-2]。但是機械設備故障診斷更多時候需要長期在線監測,樣本數據會不斷的動態增加。而現有流形學習算法大多采用批處理模式,即一次性獲取全部樣本進行約簡。每新增一個樣本時,需要將新增樣本合并到原有的樣本中,全部樣本重新進行流形學習以實現維數約簡,而無法利用原有樣本的訓練結果。隨著樣本數量的增大,運算復雜度將迅速提高,耗時過長,不具備動態數據處理能力。由于這一缺陷,增量流形學習成為了流形學習一個重要研究方向[3-5]。增量流形學習算法利用已經學習過的樣本的低維流形結構處理新增樣本,避免已訓練樣本的重復學習,從而提高新增樣本處理效率。然而,增量流形學習算法每次只能處理一個新增樣本[6-7],多個樣本逐點更新計算代價依然很高,難以滿足大量新增數據動態處理需求。

增殖學習是利用分塊處理方法將大的數據集分為各個小的數據子集,分別約簡后再進行整合,該思想無需逐點處理新增樣本,能提高大量樣本動態添加處理效率。如曾憲華等提出一種動態增殖LLE算法[8],但該算法要求數據子集必須是相鄰或重疊的,否則,低維流形會出現較大扭曲或是無法整合,限制了該算法的實際應用。本文構建一種增殖正交鄰域保持嵌入算法(Incremental Orthogonal Neighborhood Preserving Embedding,IONPE)。對于新增樣本子集,從原有樣本集中提取各類數據中心點合并至新增樣本子集,使得兩個樣本集存在重疊點,再對重疊點和新增樣本子集采用ONPE進行約簡,基于重疊點在兩個樣本集中的低維嵌入坐標差值最小化原則對新增樣本低維嵌入流形進行旋轉平移縮放變換,將新增樣本整合到原有樣本子集中。重疊點的存在能避免增殖LLE所述問題,從而實現新增樣本集的快速有效降維。

1 增殖正交鄰域保持嵌入算法

正交鄰域保持嵌入是基于近鄰關系保持嵌入改進的一種正交化降維方法[9],通過迭代計算正交基函數得到數據的低維嵌入坐標,在降維過程中保持數據點的局部幾何信息。

1.1 正交鄰域保持嵌入

設原始高維樣本集為X={x1,x2,…,xn}∈RD,其中樣本數為n,特征維數為D,,降維后的特征集為Y={y1,y2,…,yn}∈Rd,即降維后的維數為d,其中d<D,則Y=ATX,其中A∈RD×d,為變換矩陣。ONPE算法求解過程分為如下三步:

(1)非奇異處理。在不損失任何信息的條件下將數據點xi投影到PCA子空間,并丟棄對應于特征值0的成分,使得矩陣XXT為非奇異,方便后續處理,設PCA投影矩陣為APCA。

(2)構建鄰接圖。對X中任一節點xi,找出距離最近的k個鄰域節點xj,從xi到xj連一條有向的邊,設權值為Wij,每個節點xi可通過它的k個最近鄰線性重構,Wij反映了其近鄰點對xi的重構貢獻。

(3)計算ONPE正交投影向量?;谏鲜銮蠼獾臋嘀稻仃嘩,構建低維嵌入坐標的重構誤差函數,通過迭代求取求解正交投影向量為AONPE,則ONPE變換矩陣為A=APCAAONPE。

1.2 增殖正交鄰域保持嵌入

ONPE算法具有良好的聚類特性,適用于模式識別的前端處理。但每新增一個樣本時,需要對所有樣本重新進行非奇異處理、構建鄰接圖并計算正交投影向量,存在大量的重復運算,算法復雜度高,不適用于動態樣本集添加。增殖正交鄰域保持嵌入對于新增樣本子集,可不依賴原始樣本,采用ONPE進行獨立降維,再將降維后的低維數據集進行適當的平移旋轉縮放變換,整合到原始樣本集中,算法具體過程如下:

1.2.1 重疊點選取

為了使新增子集降維后的流形與原樣本集有效的整合,本文從原樣本集中選取部分樣本點合并至新增樣本集,使兩個樣本子集存在重疊點,基于重疊點在兩個樣本集中的低維嵌入坐標差值最小化原則對新增樣本低維嵌入流形進行整合變換。重疊點的選取遵循兩個原則:

(1)重疊點個數g大于低維流形維數d,保證后續平移旋轉縮放變換有全局最優解;

(2)重疊點覆蓋原有樣本集低維嵌入流形各個區域,避免出現扭曲。

假設原樣本集包含s種數據類別,本文從這s種數據中分別選取p個中心點作為重疊點,

式中(d+1)/s取整,每類數據的中心點的計算方法:

1.3 復雜度分析

ONPE的計算復雜度主要是由構建鄰域圖和計算正交變換矩陣決定。設原始樣本個數為m,新增樣本個數為n。對于批量處理方式,需處理樣本個數為n1=n+m,構建鄰域圖的時間復雜度為O(n1logn1)[10],計算ONPE正交變換矩陣需要求解n1×n1矩陣的特征值和特征向量,時間復雜度為O),總體時間復雜度為T1=O(n1logn1+)。本文的增殖ONPE算法的計算主要包含n2=m+g個樣本的ONPE降維和增殖變換。增殖變換涉及到(d+1)×g維矩陣廣義逆求解,時間復雜度約為O[(d+1)3+g3],增殖變換總體時間復雜度為T2=O[n2logn2++(d+1)3+g3],由于n2,g,d ?n1,所以一般情況下T2?T1,即增殖算法的運算效率遠遠高于批量算法。

2 基于增殖ONPE的機械設備故障診斷流程

在機械設備狀態監測過程中,增殖ONPE能快速地對新增樣本集進行降維處理,進而進行模式識別,判斷機械設備運行狀態。其流程如圖1所示。該診斷流程包括如下幾個步驟:

(1)收集機械設備不同狀態的多組振動信號數據,作為原始訓練樣本,使用時頻域分析提取其高維特征,并使用ONPE流形降維方法進行降維獲取原始樣本低維嵌入坐標,并保存高維特征子集。

(2)設備狀態監測過程中提取多組測試信號數據,通過分析取獲取測試樣本的高維特征子集,并依據上述重疊點選取方法從原始樣本高維特征子集中選取部分樣本并入新增樣本子集。

(3)對新增樣本子集和重疊點使用ONPE進行維數約簡,獲取新增樣本低維嵌入坐標子集。使用增殖ONPE變換將新增樣本低維嵌入坐標子集整合到原始樣本中,得到所有樣本低維嵌入坐標全集。

(4)使用K近鄰分類器對新增樣本進行模式識別,判斷機械設備當前狀態。

圖1 基于增殖ONPE的機械設備故障診斷流程圖Fig.1 The fault diagnostic process of machinery equipment based on IONPE

3 齒輪箱故障診斷案例

3.1 應用對象

應用美國預測與健康管理協會提供的齒輪箱故障振動數據并使用本文增殖ONPE算法進行故障診斷測試。該測試中所用齒輪箱結構如圖2所示。

圖2 齒輪箱結構圖Fig.2 The structure of gearbox

齒輪箱由輸入端至輸出端經過兩級減速,在齒輪箱輸入軸和輸出軸分別安裝一個振動加速度傳感器同步采集振動加速度信號,型號為Endevco(10mv/g),同時安裝一個轉速計采集轉速信號,10脈沖/轉。三個傳感器的采樣頻率均為66,666.67 Hz(200 kHz/3)。實驗在不同轉速和不同負載工況下進行,輸入軸轉速包括1 800 r/min、2 100 r/min、2 400 r/min、2 700 r/min、3 000 r/min五種工況,每種轉速下又分為高負載和低負載有種工況,每種工況下分別有8種不同的故障或正常狀態。

3.2 齒輪箱故障診斷

本文選用轉速3 000 r/min、低負載下齒輪箱輸出軸端的振動信號進行故障診斷測試,取6種不同的齒輪箱故障狀態振動信號數據,每種故障狀態可能是單一故障或者復合故障,齒輪箱不同的故障對應的各個零部件狀態如表1所示。其中32 T、96 T、48 T、80 T分別對應輸入軸齒輪、中間軸齒輪1、中間軸齒輪2、輸出軸齒輪,IS、ID、OS分別指輸入軸、中間軸、輸出軸。

表1 齒輪箱故障狀態Tab.1 The fault status of gearbox

上述6種齒輪箱故障狀態對應的振動信號時域波形如圖3所示。每種狀態分別取30組數據作為原始訓練樣本,樣本長度為4 096點,每組數據分別提取時域標準差、有效值、峰值、偏度值、峭度值,頻域幅值均值、幅值方差、幅值偏度、幅值峭度、幅值一階中心距、幅值二階中心距作為高維特征向量。另外每種狀態分別取30組數據作測試樣本,提取上述時頻域特征值作為高維特征向量,并使用本文的增殖ONPE算法對測試樣本進行降維,最后使用KNNC進行模式上識別。為驗證本文方法的有效性,本文同時采用批量ONPE算法和增殖LLE算法作約簡進行對比測試。ONPE約簡方法中構建鄰域圖的近鄰參數均設置為K=12,為使降維結果可視化,低維嵌入維數均設置為d=3。IONPE算法中由于數據類別為6種,故每類只需選取1個中心點,即重疊點個數g=6。三種方法的低維嵌入坐標如圖4所示。降維后進行模式識別的準確率以及降維過程耗時如表2所示。

圖3 齒輪箱不同故障振動信號Fig.3 The vibration signals of different gearbox faults

圖4 不同降維方法低維嵌入坐標Fig.4 The low-dimensional embedding coordinates with different dimension reduction methods

表2 不同約簡方法的故障識別率及耗時Tab.2 The fault diagnosis accuracy and time-consuming of different reduction methods

由圖4(a)和圖4(b)可以看出,增殖ONPE算法和批量ONPE算法都能將齒輪箱各種狀態數據能明顯分離開來,充分發揮了ONPE算法優良的聚類特性,使相同類別的樣本在空間分布上聚集在一起。而增殖LLE算法雖然訓練樣本和測試樣本對應的各種狀態數據分別能夠分離開來,但是測試樣本約簡后的結果不能很好的融合到訓練樣本中,在空間分布上出現脫離現象,原始樣本和測試樣本相同狀態的數據不能聚集在一起。而本文增殖ONPE算法選取各類數據的中心點作為重疊點并入測試樣本中,基于重疊點在訓練樣本和測試樣本的差值最小化原則將測試樣本低維嵌入整合到訓練樣本低維空間中,能有效處理新增樣本。使相同類別的樣本在空間中分布在相同的位置,其約簡效果與批量ONPE算法類似。

表2所示不同約簡方法的狀態識別率也證實了本文增殖ONPE方法降維效果與批量ONPE降維效果相當,模式識別的總體識別率均達到95%以上。從新增樣本的維數約簡時間來看,增殖LLE算法的耗時最短,但其識別率只有67.22%,遠低于另外兩種方法,難以滿足故障模式識別需求。本文方法對180個新增樣本約簡耗時僅為為0.172 6 s,是批量處理方式的38.4%(約簡耗時是在windows7操作系統、core i3(2.10 GHz)、4G內存環境下測試所得),大大提高新增樣本的處理速度,更加適用于機械設備狀態監測過程中的動態模式識別。

3.3 算法聚類度分析

聚類特性是流形學習一個重要性能,在維數約簡過程中保持近鄰關系,使同類樣本聚集,不同類樣本分開,有利于模式識別。由于增殖ONPE算法采用分塊、整合策略進行維數約簡,有可能對樣本聚類度產生影響,這里將進一步分析增殖ONPE算法的聚類特性隨新增樣本子集個數的變化關系。定義聚類度表達式為:

同樣以上述數據進行聚類度分析測試,齒輪箱6種狀態分別取30組數據作為訓練樣本,其余180組數據作為測試樣本,每次添加10組測試樣本進行增量學習,并計算其聚類度。同時采用批量ONPE進行對比,聚類度隨新增樣本點數變化關系如圖5所示。

圖5 新增樣本點數與聚類度關系Fig.5 The relation between the number of additional samples and the clustering degree

由圖5可以看出增殖ONPE算法聚類度隨著新增樣本數量的增加呈現一定的波動,但總體上沒有明顯增長趨勢,且增量ONPE算法的聚類度與批量式算法結果基本一致,維持了ONPE算法良好的聚類效果。

4 結 論

增殖ONPE流形學習算法將批量處理模式轉化為分塊處理模式對新增樣本進行約簡,通過選取重疊點,并基于重疊點在原始樣本和新增樣本子集中的低維坐標差值最小原則,將新增樣本進行旋轉平移縮放變換整合到原始樣本子集中。增殖ONPE算法很大程度上降低了維數約簡的運算復雜度,提高新增樣本的處理效率,并且維持了ONPE算法良好的聚類特性。齒輪箱振動故障數據的故障識別結果表明增殖ONPE算法具有良好動態增殖學習能力,適用于機械設備在線狀態監測。

[1]Li F,Tang B P,Yang R S.Rotating machine fault diagnosis using dimension reduction with linear local tangent space alignment[J].Measurement,2013,46:2525-2539.

[2]Jiang Q S,Jia M P,Hu J Z,et al.Machinery fault diagnosis using supervised manifold learning[J].Mechanical Systems and Signal Processing,2009,23:2301-2311.

[3]Kouropteva O,Okun O,Pietikanen M.Incremental locally linear embedding[J].Pattern Recognition,2005,38:1764-1767.[4]Liu X M,Yin J W,Feng Z L et al.Incremental manifold learning via tangent space alignment[C]//Proceedings of the Second International Conference on Artificial Neural Networks in Pattern Recognition.Ulm,Germany,2006:107-121.

[5]Law M H C,Jain A K.Incremental nonlinear dimensionality reduction by manifold learning[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2006,28(3):337-391.

[6]楊慶,陳桂明,童興民,等.增量式局部切空間排列算法在滾動軸承故障診斷中的應用[J].機械工程學報,2012,48 (5):81-86.

YANG Qing,CHEN Gui-ming,TONG Xing-min,et al.Application of incremental local tangent space alignment algorithm to rolling bearings fault diagnosis[J].Journal of Mechanical Engineering,2012,48(5):81-86.

[7]張熠卓,徐光華,梁霖,等.利用增量式非線性流形學習的狀態監測方法[J].西安交通大學學報,2011,45(1):64 -69.

ZHANG Yi-zhuo,XU Guang-hua,LIANG Lin,et al.Condition monitoring method for mechanical equipments based on incremental nonlinear manifold learning[J].Journal of Xi'an Jiaotong University,2011,45(1):64-69.

[8]曾憲華,羅四維.動態增殖流形學習算法[J].計算機研究與發展,44(9),2007:1462-1468.

ZENG Xian-hua,LUO Si-wei.A dynamically incremental manifold learningalgorithm[J].JournalofComputer Research and Development,2007,44(9):1462-1468.

[9]劉小明.數據降維及分類中的流形學習研究[D].杭州:浙江大學,2007.

[10]Saul L,Roweis S.Think globally1 Fit locally:Unsupervised learning of low dimensional manifolds[J].Journal of Machine Learning Research,2002,4:119-155.

A dynamic incremental manifold learning algorithm and its application in fault diagnosis of machineries

SONG Tao,TANG Bao-ping,DENG Lei
(The State Key Laboratory of Mechanical Transmission,Chongqing University,Chongqing 400044,China)

The current batch manifold learning algorithms can't achieve rapid dimension reduction of additional samples with learned manifold structures.Here,the incremental orthogonal neighborhood preserving embedding(IONPE)manifold learning algorithm was proposed.With it,dynamic incremental learning for additional samples was realized with a block processing idea based on orthogonal neighborhood preserving embedding.Firstly,some overlapping points were selected from the original samples and added to the additional samples.Secondly,the subset of low-dimensional embedding coordinates of additional samples was obtained with ONPE independing on the original samples.Finally,based on the principle of minimizing the differences of the overlapping point coordinates,the low-dimensional embedding coordinates of the additional samples were integrated into the original samples with rotating,shifting and scaling transformations.The fault diagnosis case of a gearbox confirmed that the IONPE algorithm has a good incremental learning ability,it improves the processing efficiency of the additional samples while inheriting the superior clustering performance of ONPE.

incremental manifold learning;ONPE;dynamic reduction;block processing;fault diagnosis

TH165.3

A

10.13465/j.cnki.jvs.2014.23.003

國家自然科學基金(51275546);高校博士點專項科研基金(20130191130001)

2013-08-01 修改稿收到日期:2013-12-12

宋濤男,博士生,1987年7月生

湯寶平男,博士,教授,1971年9月生

郵箱:bptang@cqu.edu.cn

猜你喜歡
流形約簡降維
混動成為降維打擊的實力 東風風神皓極
Helicobacter pylori-induced inflammation masks the underlying presence of low-grade dysplasia on gastric lesions
降維打擊
局部對稱偽黎曼流形中的偽臍類空子流形
對乘積開子流形的探討
近似邊界精度信息熵的屬性約簡
廣義分布保持屬性約簡研究
一種改進的稀疏保持投影算法在高光譜數據降維中的應用
基于多故障流形的旋轉機械故障診斷
時頻表示特征約簡的旋轉機械故障特征提取方法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合