?

基于CSSA-F-SVM模型的礦用卡車發動機智能故障診斷

2023-02-22 13:33顧清華王培培李學現姜秉佼
有色金屬(礦山部分) 2023年1期
關鍵詞:麻雀故障診斷精度

顧清華,王培培,李學現,姜秉佼

(1.西安建筑科技大學 管理學院,西安 710055; 2. 西安建筑科技大學 礦山系統工程研究所,西安 710055; 3. 西安建筑科技大學 資源工程學院,西安 710055)

隨著“智慧礦山”建設的推進,礦山機械設備運行數據監測能力得到了較大的提升,但大多現有的礦山機械設備監測監控系統停留在傳感數據可視化顯示和簡單閾值分析(信號值超標、超限)層面,能夠對機械設備的運行過程進行監測,但無法識別設備關鍵部位的早期故障[1]。礦山惡劣的作業環境導致礦用卡車的維修任務占到總維修任務的一半以上,其中發動機故障大約占卡車故障的50%[2]。能夠根據礦卡發動機的監測數據對計劃維修外的卡車發動機故障進行提前診斷對礦山生產具有重大意義。然而,由于發動機故障維修記錄不夠完善,實際可以獲取的有效故障數據極少,能夠在小樣本故障數據中實現對發動機的高精度預測是故障診斷的關鍵。

隨著智能化的不斷推進,機器學習、深度學習和數據挖掘等技術逐漸被應用到發動機故障診斷當中,如,神經網絡[3]、深度網絡[4]、隨機森林[5]、支持向量機[6]等。周俊博等[3]針對目前拖拉機柴油機故障診斷中單個神經網絡模型的局限性,提出一種LWD-QPSO-SOMBP神經網絡模型的拖拉機柴油機故障診斷模型;仲國強等[4]為了提高船舶柴油機智能故障診斷的精度,引入深度學習方法,提出了一種基于深度置信網絡的船用柴油機智能故障診斷方法;魏東海等[5]針對單一分類器的柴油機常見故障診斷識別效果不理想的問題,探索了一種隨機森林分類器用于柴油發動機的故障診斷。然而神經網絡由于具有較多的網絡參數,更適用于大樣本數據集,在樣本數量有限的情況下,神經網絡算法往往表現出較差的泛化能力;基于深度理論的故障診斷方法對大規模的復雜數據往往會有更準確的識別效果,對復雜設備的故障診斷有天然優勢[7],但往往訓練速度較低,導致預測效率不高;隨機森林算法受決策樹數量的影響,對噪聲較大的數據集容易陷入過擬合,會導致預測效果不佳。相較于以上方法,支持向量機有參數少、模型簡單等特點,且泛化能力優秀,能夠在有限的樣本中找到盡可能多的信息,適用于小樣本數據的學習,符合礦用卡車發動機實際故障數據不足的特點。2018年,WU 等[8]提出了一種基于凸半徑邊緣的F-SVM模型,通過結合主成分分析,將特征變換和SVM分類器的聯合學習,實現了數據與分類器的契合,故本文選擇F-SVM作為故障診斷的主體模型。然而,對于多分類問題,支持向量機的優劣一定程度上取決于本身懲罰因子C和核參數g的選擇,這些參數的選取會影響識別準確率和效率[9],F-SVM模型也面臨同樣的問題。許多學者的研究已經證明,借助群智能算法對支持向量機模型的參數進行優化,可以顯著提高其分類精度,在設備故障診斷領域有了很好的應用。文獻[10-12]分別選用PSO、WOA、GA算法對SVM的參數進行尋優,均在故障診斷精度上取得了一定的提升。文獻[13]提出了借助果蠅算法對F-SVM進行參數尋優的方法。然而上述算法在全局搜索能力、收斂速度上存在不足,有陷入局部最優的可能,影響診斷模型的精度。麻雀搜索算法(Sparrow Search Algorithm,SSA)[14]具有搜索精度高、收斂速度快、尋優能力強的突出特點,與其他群智能算法相比表現出極強的優勢,目前已經應用于各種分類器的參數優化上;曹偉嘉等[15]利用改進后的麻雀算法(JYBack-SSA)優化隨機森林,建立了變壓器的故障診斷模型;單亞峰等[16]提出利用麻雀算法對AdaBoost-SVM模型進行優化,尋找最優的弱分類器權重和SVM參數;李黃曼等[17]通過改進麻雀算法優化SVM,建立基于DGA的ISSA-SVM故障診斷模型。以上參數優化方法均提高了原始模型的預測精度,可見,麻雀算法在參數優化方面已經取得了很大的成功。

針對礦用卡車發動機故障數據不足而導致診斷精度不高的問題,本文提出了一種基于改進麻雀搜索算法優化F-SVM的礦用卡車發動機故障診斷模型。通過引入鏈式搜索策略,對麻雀算法進行改進,優化了麻雀發現者和加入者的位置更新過程,提高了原麻雀算法的收斂速度和全局尋優能力。借助改進后的麻雀算法對F-SVM聯合模型尋優,構建了CSSA-F-SVM故障診斷模型,通過尋找最合適的懲罰因子和核參數來平衡診斷模型的訓練精度和泛化能力,降低了由于樣本數據過少產生過擬合現象的可能。將本文模型與原始SVM和用傳統SSA、PSO、FOA、EHO算法分別優化SVM和F-SVM的診斷模型對比,實驗結果驗證了所提方法應用于診斷小樣本故障數據時的可行性和高精度。

1 改進麻雀算法優化F-SVM的礦卡發動機故障診斷模型

基于凸半徑邊緣的SVM模型,即F-SVM,在提高分類精度的同時也實現了將數據的特征提取與SVM相結合。F-SVM模型如下:

st.yi(ωTfi+b)≥1-ξi,

ξi≥0,i=1,…,n

M>0

(1)

對于F-SVM模型而言,懲罰因子C和核參數g的選擇在一定程度上決定著F-SVM的分類性能和泛化能力,因此選取最合適的參數組合將會極大提高分類精度。本文借助麻雀搜索算法進行參數組合的尋優,并為提高其尋優能力對算法進行改進。

1.1 麻雀搜索算法改進過程

標準的麻雀搜索算法具有設置參數少、尋優能力強等特點,但仍存在種群迭代后期多樣性降低、容易陷入局部最優值等不足。本文針對種群中發現者和加入者的位置更新進行改進,引入鏈式搜索策略以協調發現者的局部搜索和全局搜索的能力,遵循位置最優原則對加入者的位置更新公式進行改進以提高加入者的收斂性能。

1)引入鏈式搜索策略

在傳統麻雀算法中,當R2

(2)

式中:Xj1為領導者在第j維空間的位置,Fj為食物在第j維的位置,ub和1b分別是對應的上界和下界。c2和c3均為[0,1]之間的隨機數,用來增強Xj1的隨機性,可以起到提高鏈群的全局搜索和個體多樣性;c1是算法中的收斂因子,由2遞減到0,用于平衡全局搜索和局部開發能力。

(3)

式中:l是當前迭代次數,L是最大迭代次數。

借鑒鏈式搜索的思想,將麻雀算法中發現者的位置更新改進如下:

(4)

式中:(ub-1b)c2+1b可以協調麻雀的全局搜索能力,但直接引入將會導致搜索范圍過大,降低發現者的搜索精度和效率,因此需相應增加麻雀向零點靠近的速度,以平衡搜索范圍過大的風險。改進后的收斂因子c*表達式如下:

(5)

當周圍環境安全時,改進后的發現者既能帶領加入者以鏈式的方式廣泛搜索食物,又能實現以更高的搜索效率尋找食物,從而協調了算法的全局搜索和局部搜索的能力。

2)加入者位置更新策略

加入者位置更新策略如下:

(6)

式中:Xbest表示當前全局最優的位置。當i>n/2 時,表明第i個加入者適應度較低,為獲得更多的能量,需要飛往其它地方覓食,且此時的位置距當前全局最差的位置更近,距離當前全局最優的位置更遠?;诖?,當加入者進行隨機搜索時,遵循位置最優的原則,改進后的加入者會以更快的收斂速度進行位置更新。

在基于改進麻雀搜索算法的參數優化過程中,利用F-SVM分類器的分類精度構建合適的適應度函數,指導麻雀位置的更新,并通過麻雀種群個體位置的不斷迭代來尋找最優的參數C、g。

1.2 基于參數優化的F-SVM礦用卡車發動機故障診斷過程

本文基于改進的麻雀算法CSSA和F-SVM,建立礦用卡車發動機故障診斷模型,CSSA-F-SVM模型結合了半徑信息和參數優化。如圖1所示,整個診斷模型可分為兩部分:參數優化部分和模型訓練及診斷部分。參數優化部分主要是使用分類器精度構造適應度函數來指導麻雀位置的更新,并通過位置的不斷迭代來尋找最合適的參數;模型訓練及診斷部分是利用參數優化部分得到的最優懲罰因子和核參數建立F-SVM分類器,通過該分類器在測試集上得到最終的分類結果。診斷模型具體步驟如下:

Step 1:采集礦用卡車發動機故障數據,進行歸一化處理,并將其劃分為訓練集和測試集;

Step 2:種群初始化,設置CSSA算法的種群規模、最大迭代次數和初始參數;

Step 3:初始化M矩陣并將數據集放入特征空間L中;

Step 4:利用SVM平均交叉驗證分類精度計算適應度值,進行迭代尋優,按照式(4)、(6)分別對發現者、加入者進行位置更新;

Step 5:重新計算每個個體的適應度值并進行排序;

Step 6:重復Step 4和Step 5,直至達到最大迭代次數,輸出適應度值最好的麻雀位置,

確定最優參數C、g,利用最優參數建立故障診斷模型,使用十倍交叉驗證的方法進行訓練。

Step 7:根據訓練結果對測試集進行預測,為保證預測結果的可靠性,對測試集進行K=5次預測,輸出故障診斷結果,并計算平均預測精度。

故障診斷流程圖如圖1:

圖1 基于CSSA-F-SVM的礦用卡車發動機故障診斷流程圖Fig.1 Flow chart of fault diagnosis of mining truck engine based on CSSA-F-SVM

2 仿真分析與實驗驗證

本文以濰柴WP12G460E310發動機為研究對象,借助濰柴智多星路譜監測裝置采集了河南某露天礦自卸卡車發動機的210組21維故障數據,來測試CSSA-F-SVM的性能。由于礦山作業環境的特殊性,礦用卡車發動機的故障類型主要為濾芯及管道堵塞等故障。本文采集了八種故障類型數據,分別為正常、進氣管堵塞、增壓器故障、空濾堵塞、中冷器配套故障、燃濾堵塞、中冷器內部堵塞。將所有數據分為訓練集170組和測試集40組,并對訓練集采用10倍交叉驗證的方法進行訓練,部分實驗數據見表1,實驗數據分類情況及狀態編號見表2。

表1 濰柴發動機WP12G460E310的部分故障數據Table 1 Partial fault data of Weichai engine WP12G460E310

表2 數據集分類情況Table 2 Classification of datasets

2.1 不同算法優化SVM性能對比

對訓練集進行數據歸一化及降維,利用改進麻雀搜索算法(Convergent Sparrow Search Algorithm,CSSA)、麻雀搜索算法(Sparrow Search Algorithm,SSA)、粒子群優化算法(Particle Swarm Optimization,PSO)、象群優化算法(Elephant Herding Optimization,EHO)、果蠅優化算法(Fruit Fly Optimization Algorithm,FOA)對SVM進行參數優化,得到最優的C、g值。對測試集進行數據歸一化后輸入優化后的SVM模型中進行故障診斷,診斷結果如圖2至圖7所示。

圖2 CSSA-SVM故障診斷結果(97.5%) Fig.2 Fault diagnosis results of CSSA-SVM (97.5%)

圖3 SSA-SVM故障診斷結果(95%)Fig.3 Fault diagnosis results of SSA-SVM (95%)

圖5 EHO-SVM故障診斷結果(72.5%) Fig.5 Fault diagnosis results of EHO-SVM (72.5%)

圖6 SVM故障診斷結果(77.5%)Fig.6 Fault diagnosis results of SVM (77.5%)

圖7 FOA-SVM故障診斷結果(85%) Fig.7 Fault diagnosis results of FOA-SVM(85%)

通過對比可知,CSSA-SVM模型對測試集的預測準確度達到最高值97.5%,均明顯高于其他算法優化的SVM模型,證明了本文改進的麻雀算法良好的參數尋優能力。此外,CSSA-SVM模型提高了對燃濾堵塞故障(類別6)及中冷器內部堵塞故障(類別7)與其他故障類型的區分準確度,而在增壓器故障(類別3)的診斷上仍存在失誤。

2.2 不同算法優化F-SVM性能對比

用CSSA、SSA、PSO、EHO、FOA算法對F-SVM進行參數優化,得到最優的C、g值。對測試集進行數據歸一化后輸入優化后的F-SVM模型中進行故障診斷,不同模型運行5次的平均對比結果如表3所示。

表3 不同算法優化F-SVM故障診斷精確度對比(運行5次)Table 3 Comparison of F-SVM fault diagnosis accuracy optimized by different algorithms(5 runs) /%

從平均訓練精度和預測精確度來看,不同算法優化F-SVM模型的診斷精確度整體高于優化SVM模型的診斷精度,CSSA-F-SVM模型診斷性能更為突出。其中,CSSA-F-SVM模型分別較PSO-F-SVM、EHO-F-SVM、FOA-F-SVM、SSA-F-SVM模型準確精度提高了3%、5.25%、2.75%、1.5%。

又從表4中可知,采用CSSA優化的F-SVM模型的最高準確率可達100%,最低為97.5%,平均準確率99%;而采用F-SVM模型的最高、最低和平均診斷精度分別為97.5%、90%、94.5%。懲罰因子和核參數均是在一定范圍內隨機變化的。證明了本文基于改進麻雀算法優化F-SVM的模型針對小樣本發動機數據進行故障診斷的優秀性能。

表4 CSSA-F-SVM尋優與診斷結果Table 4 Optimization and diagnosis results of CSSA-F-SVM

由圖8所示,采用本文模型對各個狀態的診斷正確率均可達100%。對于相同的故障數據,其他四種診斷方法對各狀態下的分類結果如表5所示。本文所提的方法彌補了對比方法對于發動機進排氣系統中冷器內部堵塞、增壓器故障和中冷器配套故障診斷效果不足的缺陷,在故障數據有限的條件下,對各種常見故障類型起到了真正的診斷效果。

圖8 CSSA-F-SVM故障診斷結果(單次100%)Fig.8 Fault diagnosis results of CSSA-F-SVM (single result 100%)

表5 其他算法優化F-SVM模型的正確率Table 5 The correct rate of optimizing the F-SVM model with other algorithms /%

2.3 與其他機器學習方法的對比結果

為了進一步分析本文所提方法在解決礦用卡車發動機小樣本故障診斷問題上的優越性,將本文方法與KNN(K-Nearest Neighbor)、AdaBoost(Adaptive Boosting)、GBDT(Gradient Boosting Decision Tree)傳統的機器學習方法做了對比。如圖9所示,在樣本數量相同的情況下,每種方法取5次運行的平均結果,本文所提方法的預測精度明顯高于其他方法。

圖9 與其他機器學習方法對比結果Fig.9 Comparison results with other machine learning methods

3 結論

本文針對礦卡發動機實際故障數據較少導致診斷精度不足的問題,通過對麻雀算法的改進和對F-SVM方法的研究,提出了基于CSSA-F-SVM模型的礦用卡車發動機智能故障診斷方法??傻贸鲆韵陆Y論:

1)通過改進后的麻雀算法尋找F-SVM的最優參數C、g,降低了參數選擇對診斷精度的影響。實驗結果表明,基于CSSA-F-SVM模型方法的平均診斷準確率為99%,分別較傳統SVM和F-SVM模型提高了21.5%和4.1%。

2)新CSSA-F-SVM模型方法克服了其他群智能算法優化SVM模型對于中冷器內部堵塞、增壓器故障等診斷不足的缺點。能夠較好地實現礦用卡車發動機常見故障的診斷,可為實際應用提供一定的參考。

猜你喜歡
麻雀故障診斷精度
基于包絡解調原理的低轉速滾動軸承故障診斷
拯救受傷的小麻雀
分析誤差提精度
1958年的麻雀
基于DSPIC33F微處理器的采集精度的提高
數控機床電氣系統的故障診斷與維修
麻雀
GPS/GLONASS/BDS組合PPP精度分析
緊盯著窗外的麻雀
因果圖定性分析法及其在故障診斷中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合