?

基于深度學習的礦井滾動軸承故障診斷方法

2024-03-01 09:53竇桂東白藝碩王均利黃博昊陽康
工礦自動化 2024年1期
關鍵詞:故障診斷準確率卷積

竇桂東, 白藝碩, 王均利, 黃博昊, 陽康

(1. 陜西彬長小莊礦業有限公司,陜西 咸陽 713500;2. 中國礦業大學(北京) 人工智能學院,北京 100083;3. 陜西彬長礦業集團有限公司,陜西 咸陽 712000)

0 引言

滾動軸承作為機械設備中不可或缺的零件之一,已在采煤機、提升機和通風機等礦用機械設備中得到廣泛應用[1-2]。然而,由于煤礦機械設備工作環境惡劣,使得滾動軸承故障頻發,如果不能及時發現故障并進行后期維護,不僅會損壞電動機本身,而且會影響整個系統的正常運行,導致極大經濟損失,甚至威脅人員生命安全。因此,滾動軸承故障檢測的準確高效對提高煤礦安全生產具有重要意義[3-4]。

傳統的智能故障診斷方法在早期較為流行,然而其十分依賴信號處理和專家經驗,很難自主挖掘海量數據中的有效信息。為了解決這一問題,深度學習方法逐漸走進人們的視野,文獻[5]針對齒輪箱故障提出了一種多信息融合的卷積神經網絡(Convolutional Neural Networks,CNN)診斷模型,利用多個卷積層和最大池化層,解決了傳統人工選擇特征向量的問題;文獻[6]結合Inception 模塊和卷積注意力模塊(Convolutional Block Attention Module,CBAM)獲得多尺度故障特征信息,進一步拓寬分支網絡結構,提高了網絡表達能力。但是卷積結構采用標量神經元,未能考慮特征間的關聯,所以網絡中沒有可用的空間信息,導致故障特征提取不全面,影響診斷準確率。對此,文獻[7]提出了具有動態路由算法的膠囊網絡,通過計算向量神經元的模長進行分類預測,打破了傳統標量神經元傳遞信息的片面性。近年來,膠囊網絡展現出強大的細節特征提取能力,已在機械設備故障診斷領域嶄露頭角,文獻[8]把膠囊網絡運用到齒輪箱故障檢測,利用門控循環單元初步提取特征后,采用膠囊網絡關注更多細節信息,取得了較好的診斷效果;文獻[9]提出了一種基于隨機法則的深膠囊網絡,驗證了膠囊網絡在不同載荷、不同背景噪聲下對軸承故障診斷具有良好的診斷效果及較強的魯棒性。為了更好地利用神經網絡在機器視覺中的優勢,可以將一維振動數據通過編碼轉換為二維圖像后,再輸入神經網絡進行學習。文獻[10]將原始振動信號轉換為二維灰度圖像,輸入CNN 中進行故障診斷,取得了較好的診斷效果,但該方法并未考慮信號的時間相關性,模型還有一定的改進空間。文獻[11]采用連續小波變換構造二維時頻圖像,再輸入所建立的生成對抗網絡模型中,實現齒輪箱故障診斷,雖然其可以表達信號的局部時頻特征,但選取合適的小波基有一定的困難,存在故障信息丟失問題。對此,可以利用馬爾可夫轉移場(Markov Transition Field,MTF),其通過考慮每個分位數與時間步長之間的依賴關系,保留了原始信號的時間相關性,且編碼方式的映射是一一對應關系,避免了一維信號重要信息的丟失。文獻[12]提出一種MTF 與CNN 相結合的故障診斷方法,但常規CNN 會隨著網絡深度加大而出現梯度彌散等問題,導致模型難以訓練。文獻[13]使用MTF 對振動信號進行編碼,然后輸入深度殘差網絡進行故障診斷,實驗在公開數據集上取得了較好的診斷效果,但并未驗證模型在變工況及存在噪聲污染時的診斷性能。

針對傳統CNN 在煤礦井下等復雜環境中難以充分挖掘數據特征的問題,本文提出一種基于MTF和雙通道多尺度卷積膠囊網絡(Dual-channel Multiscale Convolutional Capsule Network,DMCCN)的滾動軸承故障診斷方法。為保留原始信號的時間依賴性,采用MTF 對振動信號進行編碼,并采用灰度圖轉換,兼顧原始信號的動態和靜態特征;根據雙通道輸入,將2 組特征圖分別通過二維卷積層提取淺層特征后進行特征融合,減少信息損失;同時,引入Inception 模塊,聚焦多尺度特征,加強網絡的特征提取能力;通過膠囊層進行向量化處理,采用動態路由算法計算特征向量相似度,進而實現故障診斷與分類。

1 MTF 和膠囊網絡

1.1 MTF 編碼

MTF 通過計算馬爾可夫轉移矩陣對動態信息進行編碼傳遞,保留信號在不同時間間隔內的時間相關性,是一種將原始一維信號轉換成二維圖像的編碼方法[14-15]。該方法將時間序列的推移類比為馬爾可夫過程,即在已知目前狀態的條件下,信號未來的演變不依賴于其以往的變化情況,由此構造馬爾可夫轉移矩陣,進而拓展為MTF,實現圖像編碼。

給定序列X={x1,x2,···,xn},其中xt(t=1,2,···,n,n為數據總數)為t時刻的振動信號幅值。將序列X分為Q個分位箱,每個數據點對應的分位數為qj(j=1,2,···,Q)。采用一階馬爾可夫鏈的方式計算分位數之間的轉移概率,進而構建一個Q×Q的馬爾可夫轉移矩陣:

式中:wi,j為分位數qi與qj的逼近概率,i=1,2,···,Q;P(·)為逼近概率函數。

為了克服馬爾可夫轉移矩陣對數據分布和時間步長不敏感的缺點,通過考慮時間因素及位置信息,將其拓展到包含時間軸的MTF:

式中mi j為分位數qi到分位數qj的轉移概率。

1.2 膠囊網絡

膠囊網絡的核心思想是用向量神經元代替傳統神經網絡中的標量神經元[16],其對圖像中的位置、角度等姿態信息更敏感,具有更豐富的特征表達能力,且底層膠囊通過動態路由算法更新得到高層膠囊,保留了目標部分與整體之間的相關信息。膠囊網絡由卷積層、初級膠囊層和數字膠囊層組成,如圖1 所示。通過卷積操作將原始輸入數據轉換為底層膠囊,再通過動態路由算法計算出高層膠囊,進而完成預測分類。

圖1 膠囊網絡結構Fig. 1 Capsule network structure

動態路由算法類似于聚類的迭代過程,選擇更多相似特征而弱化離群特征,其具體結構如圖2 所示。令輸入向量uI與權重aIJ相乘,得到預測向量將和路由權值cIJ進行加權求和,計算出總的高級特征向量sJ;通過非線性函數squash 得到壓縮后的輸出向量vJ,即確保向量的方向不變,長度不超過1;初始化中間參數bIJ,并計算u?J|I和vJ的點積,更新中間參數bIJ,進而通過softmax 函數更新路由權值cIJ,保留特征比較相似的信息。

圖2 動態路由算法結構Fig. 2 Dynamic routing algorithm structure

2 MTF-DMCCN 故障診斷模型

針對傳統神經網絡應用于軸承故障診斷時特征辨識性差、難以充分挖掘數據間特征信息的問題,本文提出了DMCCN,將一維振動信號轉換為二維圖像信號作為輸入,實現對軸承故障類型及故障程度的識別。MTF-DMCCN 故障診斷模型由數據轉換、特征提取、膠囊傳遞3 個部分構成,如圖3 所示,其中“@”表示個,如128@5×5 表示128 個5×5 卷積核。

圖3 MTF-DMCCN 故障診斷模型Fig. 3 Fault diagnosis model based on Markov transition field(MTF) and dual-channel multi-scale convolutional capsule network(DMCCN)

2.1 數據轉換

將一維數據直接轉換為二維灰度圖像的方法簡單有效,但這種轉換方式只關注靜態信息,單一輸入數據無法包含信號的時域特征。因此,本文采用雙通道輸入模式,兼顧信號的靜態和動態特征,第2 通道通過MTF 編碼方式生成圖像,保留了振動信號間的時間相關性,避免信息丟失。

2.2 特征提取

在特征提取部分,利用2 個二維卷積層直接從圖像中學習初步特征,第1 卷積層采用5×5 卷積核擴大卷積運算的接收范圍,第2 卷積層采用3×3 小卷積核提高局部特征提取能力。對雙通道提取的特征進行融合后,參考多尺度卷積核Inception 結構,將包含1×1,3×3,5×5 等不同大小的卷積運算加入到初級膠囊層中,提取多尺度信息,在增加網絡寬度的同時減少參數,增強模型的魯棒性。最后將特征標量轉換為特征向量并進行壓縮,封裝為初級膠囊。

2.3 膠囊傳遞

利用膠囊結構構建向量神經元,向量的方向代表特征的位置、角度等姿態信息,向量的長度代表該特征估計的概率,因此膠囊結構能包含更多的空間信息。膠囊之間采用動態路由方式進行特征傳遞,如圖4 所示,紫色向量表示膠囊輸出,橙色向量表示膠囊輸入,黑色向量表示膠囊其他輸入。圖4 (a)中輸出v1和輸入的方向夾角大于90°,即二者點積是一個負數,該特征對應的路由權值c11減??;同理,圖4 (b)橙色向量對應的路由權值c12增大。對所有膠囊及其輸入重復該過程,直至獲得與膠囊輸入最匹配的特征,之后繼續傳遞。但實際上,使用多次迭代往往會導致模型過擬合,本文設置迭代次數為3[17]。

圖4 膠囊傳遞中的權值更新Fig. 4 Weight update in capsule delivery

在模型訓練過程中,需要通過損失函數計算預測值與真實值的誤差,以更新模型權重,本文采用邊緣損失函數:

式中:Lk為損失函數值;Tk為分類指示函數,當輸入樣本屬于類別k時,Tk=1,否則Tk=0;m+為上邊界,取值為0.9;m-為下邊界,取值為為模型輸出第k類故障的概率; λ為比例因子,取值為0.5。

3 實驗驗證與結果分析

3.1 數據集獲取

為了驗證所提MTF-DMCCN 模型的性能,本文使用美國凱斯西儲大學(Case Western Reserve University,CWRU)軸承數據和中煤信息技術(北京)公司礦用滾動軸承數據進行實驗[18]。CWRU 采用的滾動軸承型號為SKF6205,中煤信息技術(北京)公司采用的滾動軸承型號為NSK6800Z,二者均為深溝型軸承,且具有防塵蓋設計,是煤礦井下常用的滾動軸承。CWRU 數據集是使用人為電火花技術造成不同嚴重程度的單點損傷后獲取,包含的故障類型相對較多;中煤信息技術(北京)公司數據集是通過監測已發生故障的礦用滾動軸承的實際狀態獲取,更具有代表性,但其包含的故障類型相對較少。故本文結合2 個數據集的優點,將二者混合后構成數據集。

CWRU 實驗平臺由異步電動機、轉矩傳感器、功率測試機和電子控制器組成,測試對象為支撐電動機的軸承。待測軸承在0,0.746,1.491,2.237 kW這4 種載荷條件下轉動,相應的電動機轉速分別為1 797,1 772,1 750,1 730 r/min,使用電火花加工造成不同類型的軸承故障狀態,包括滾動軸承內圈故障狀態(IF)、外圈故障狀態(OF)和滾動體故障狀態(BF),每種故障狀態又分別包含0.177 8,0.355 6,0.533 4 mm 3 種損傷直徑,分別對應編號07,14,21,故共有9 種故障。中煤信息技術(北京)公司將壓電式加速度傳感器固定在待診斷軸承的基座上,從而完成對礦用滾動軸承振動信號的捕捉,實際損傷類型包括垂直不對中故障狀態(VMF)和水平不對中故障狀態(HMF)。本文通過滑動窗口重疊采樣制作混合數據集,窗口步長為4 096,包含12 種故障類型的7 200 個樣本,軸承故障數據組成見表1。同時,考慮到實際工作場景的多樣性,制作了3 種不同工況下的軸承數據集,見表2。

表1 單一工況下軸承故障數據組成Table 1 Composition of bearing failure data under single operating conditions

表2 不同工況條件下的數據集參數Table 2 Dataset parameters under different operating conditions

3.2 數據預處理

將所有樣本通過編碼轉換為MTF 圖像及灰度圖。由于灰度圖采用直接轉換方式,為使其包含一維信號的所有數據信息,規定圖像尺寸為64×64。針對MTF,分位箱不同,生成的圖像尺寸也不同,以內圈故障信號為例,不同尺寸的MTF 圖像如圖5 所示。

圖5 不同尺寸的MTF 圖像Fig. 5 MTF images of different sizes

從圖5 可看出,由于分位數轉移概率不同,MTF圖像像素點有深有淺,說明該二維特征圖包含一維信號的時間特性,將其作為輸入可以充分利用神經網絡的優勢。尺寸為1 024×1 024 的MTF 圖像像素點過于密集,包含太多冗余信息,以致于難以辨別不同像素點之間的顏色區別;尺寸為64×64 的MTF 圖像像素點的顏色區別明顯,但其單個像素點的面積相對較大,排列相對稀疏,使得其包含的信息量不足。從圖像自身方面考慮,尺寸較大的MTF 圖像能夠包含更多信息,但信息點過于密集,導致計算成本增加,網絡訓練時間大大延長;尺寸過小的MTF 圖像很難保證圖像包含完整的故障特征信息,不利于模型的訓練。從實驗數據量方面考慮,MTF 圖像體現了振動信號的動態特性,因此要將盡可能多的信號轉換成MTF 圖像,然而,若MTF 尺寸過大,會減少可用的訓練圖像數量或使訓練集數據重復性過高,從而無法提取故障特征?;谝陨? 個方面因素,本文最終確定原始輸入MTF 圖像的尺寸為256×256。此外,由于灰度圖與MTF 圖像大小不同,采用雙通道輸入模式提取不同故障特征,灰度圖保留大量靜態信息,MTF 圖像則保留更多動態信息。

3.3 消融實驗

為驗證MTF-DMCCN 模型的合理性,探尋各重要組成部分對模型整體性能的影響,設置消融實驗。采用數據集A 為實驗數據,設置訓練集樣本量為3 600,驗證集和測試集樣本量均為1 800。不同模型的識別結果見表3。其中MTF-DCCN 模型去除了DMCCN 網絡結構中的 Inception 模塊,MTF-MCCN模型去除了灰度圖輸入通道,DMCCN 模型去除了MTF 編碼圖像輸入通道。

表3 不同模型的識別結果Table 3 Recognition results of different models

分析表3 可知, MTF-DMCCN 模型識別準確率最高。加入MTF 圖像輸入后,識別準確率提升了26.5%,對模型的診斷精度提升最高,其主要原因是MTF 編碼方式注重每個分位數與時間步長的依賴關系,能保留原始信號的時間相關性,并且其編碼方式的映射是一一對應關系,避免了重要信息的丟失。比較MTF-DMCCN 和MTF-DCCN 識別結果,其15.72%的準確率差距反映了Inception 模塊在軸承故障診斷中的重要性。MTF-MCCN 雖然取得了較為滿意的結果,但引入灰度圖輸入后,準確率提高了4.83% ,表明加入此模塊對提升模型的診斷效果仍具有一定的有效性。此外,雖然MTF-DMCCN 模型的運行時間不是最短,但能夠在相近時間內獲取最高的識別準確率,依然能說明所提模型具有一定的優越性。

為進一步展示不同模型對軸承故障的識別效果,引入混淆矩陣對實驗結果進行更準確、更全面的分析,不同模型的混淆矩陣如圖6 所示??煽闯鯩TF-DMCCN 模型僅對故障IF21,OF21,VMF 的分類略有錯誤,將4 個IF21 樣本識別為IF14 和HMF,2 個OF21 樣本識別為VMF,4 個VMF 樣本識別為IF21,其他故障均實現了正確分類;MTF-DCCN 模型和MTF-MCCN 模型對故障IF21,OF07,BF07,HMF均存在錯誤分類,此外,MTF-DCCN 模型還對其他4 種故障類型存在錯誤分類。從總體來看,MTFMCCN 模型的錯誤樣本共有97 個,MTF-DCCN 模型的錯誤樣本共有293 個,說明MTF-DCCN 模型性能較差;對于DMCCN 模型,不正確分類發生在IF14,IF21 等10 種故障中,甚至將45 個OF07 故障樣本錯誤識別為BF14 故障。

圖6 不同模型的混淆矩陣Fig. 6 Confusion matrix of different models

可見,MTF-DMCCN 模型在滾動軸承故障診斷實驗中效果最好,MTF-MCCN 模型次之,MTF-DCCN模型和DMCCN 模型效果較差,說明Inception 模塊、灰度圖輸入、MTF 圖像輸入均對軸承故障診斷具有正向促進的作用,MTF 編碼對模型的診斷精度提升最高。

3.4 抗噪性能實驗

在實際工作環境中,受各種外界因素影響,信號采集時不可避免地會存在噪聲干擾。為了驗證MTFDMCCN 模型在噪聲環境下的性能,向數據集B 加入不同的高斯白噪聲,在信噪比-4~6 dB 范圍內進行實驗,并與MTF-MCCN,MTF-DCCN,DMCCN 模型進行比較。各模型在不同噪聲環境下的混淆雷達圖如圖7 所示。

圖7 各模型在不同噪聲環境下的混淆雷達圖Fig. 7 Confusing radargrams of each model in different noise environment

從圖7 可看出,4 種模型的識別準確率隨著信噪比的改變而變化。當添加6 dB 噪聲時,4 種模型的識別準確率均超過80%。隨著信噪比降低,MTFDCCN 模型和DMCCN 模型的識別準確率迅速降低,信噪比為-4 dB 時,2 種模型的識別準確率均低于45%。MTF-DMCCN 模型和MTF-MCCN 模型的識別準確率下降相對緩慢,在信噪比降為-2 dB 前二者僅有微小差別,信噪比為-4 dB 時,MTF-DMCCN模型的識別準確率比MTF-MCCN 模型高10%以上。MTF-DMCCN 模型比其他模型具有更好的魯棒性和抗噪聲能力。

3.5 泛化性能實驗

為驗證MTF-DMCCN 模型在變工況環境下的故障診斷能力,采用在不同工況下分別進行5 次實驗取均值的方法進行泛化性能實驗,實驗結果見表4。其中實驗工況 A→B 表示數據集A 用于模型訓練,數據集B 用于模型測試,其他工況依此類推。分析可知,MTF-DMCCN 模型在A→C 工況下分類效果最佳,平均識別準確率達88.2%;在B→A 時平均識別準確率最低,為76.3%,但仍能基本完成對滾動軸承故障的精準分類;在A→B,A→C,C→B 3 種工況下,每次實驗準確率均超過80%,且在所有實驗中模型識別準確率不低于70%。經過上述分析,證明了本文提出的 MTF-DMCCN 模型具有優異的變轉速適應能力,在不同工況下具有良好的泛化性能。

表4 變工況下的故障識別準確率Table 4 Fault recognition accuracy under variable operating conditions%

3.6 IMS 數據集對比實驗

為進一步驗證MTF-DMCCN 模型在故障診斷中的優勢,排除數據單一的影響,采用辛辛那提大學智能維護系統(Intellegent Maintenance System,IMS)的軸承數據進行對比實驗[19]。共進行3 次實驗,對比實驗數據集選取其中2 次實驗數據,數據類型包含內圈故障、外圈故障、滾動體故障和正常狀態4 種,每種類型2 000 組樣本,每組樣本包含2 048 個采樣點,其中前5 600 組樣本作為訓練集,后2 400 組樣本作為測試集。從編碼方式和網絡結構2 個方面分別進行對比,共建立10 種故障診斷對比模型。采用分別進行5 次實驗取均值的方式進行比較,各模型的識別準確率如圖8 所示。其中GASF 表示格拉姆角和場編碼方式,GADF 表示格拉姆角差場編碼方式;MTF-DCCN1 模型是將DMCCN 網絡結構中的 Inception 模塊替換為16 通道的3×3 二維卷積層;ResNet 是一種深度殘差網絡;WDCNN[20]是以原始信號作為輸入的寬核一維CNN。

圖8 IMS 數據集下不同模型的識別準確率Fig. 8 Recognition accuracy of different models in the IMS dataset

從圖8 可以看出,MTF-DMCCN 模型在IMS 數據集上的識別準確率最高,達99.37%,可以準確識別出軸承的不同故障類型及故障程度。對比MTFDMCCN 和 WDCNN,前者的識別準確率比后者高9.44%,說明在滾動軸承故障診斷中,以雙通道輸入的2D-CNN 相較于以單通道輸入的1D-CNN 具有一定優勢。在網絡結構相同的情況下,以MTF 為主的模型準確率普遍高于采用其他編碼方式的模型,GADF 編碼方式的準確率高于GASF 編碼方式,即MTF 編碼方式最有效,GASF 編碼效果最差。在編碼方式相同的情況下,相比MTF-DCCN1 模型,MTFDMCCN 模型的識別準確率高8.17%,說明Inception模塊可顯著提高模型的故障診斷效果。對比MTFDMCCN 模型和MTF-ResNet 模型,前者的識別準確率比后者高3.73%,進一步證明了本文所提方法的優越性。此外,在10 組模型對比中,MTF-DMCCN 模型的誤差棒長度最短,即實驗結果的誤差范圍更小,集中度更高,證明該模型的穩定性更好。

4 結論

1) 采用MTF 編碼方式將一維信號轉換為二維圖像,考慮了信號在不同時間間隔內的時間相關性,并通過雙通道輸入模式,在關注振動信號靜態特征的同時兼顧其動態特征,減少原始信息的丟失。

2) 針對傳統神經網絡難以獲得空間信息的問題,選用膠囊網絡,采用向量神經元最大程度地保留圖像位置、角度等姿態信息,使特征提取更完善,并在膠囊網絡中加入Inception 模塊提取多尺度特征,在增加網絡寬度的同時減少膠囊層參數,提高模型故障診斷效率。

3) 在模型對比實驗中,MTF-DMCCN 模型的平均故障識別準確率達99.37%,表明該模型能夠準確判斷軸承故障類型及故障程度。為模擬實際工程環境,在樣本中加入信噪比為-4~6 dB 的高斯白噪聲進行抗噪實驗,結果驗證了所提方法具有較強的魯棒性。采用不同負載條件下的數據集進行泛化實驗,結果表明,MTF-DMCCN 模型在6 組變負載實驗中均表現良好,證明了本文所提方法的有效性和優越性。

猜你喜歡
故障診斷準確率卷積
基于3D-Winograd的快速卷積算法設計及FPGA實現
乳腺超聲檢查診斷乳腺腫瘤的特異度及準確率分析
不同序列磁共振成像診斷脊柱損傷的臨床準確率比較探討
2015—2017 年寧夏各天氣預報參考產品質量檢驗分析
從濾波器理解卷積
高速公路車牌識別標識站準確率驗證法
基于傅里葉域卷積表示的目標跟蹤算法
因果圖定性分析法及其在故障診斷中的應用
一種基于卷積神經網絡的性別識別方法
基于LCD和排列熵的滾動軸承故障診斷
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合