?

改進MFO-LSTM網絡的風電機組齒輪箱故障預警研究

2024-03-14 02:15周偉魏鑫李西興
機床與液壓 2024年4期
關鍵詞:飛蛾齒輪箱適應度

周偉,魏鑫,李西興

(湖北工業大學機械工程學院,湖北武漢 430068)

0 前言

齒輪箱作為風電機組傳動鏈的重要部件,其穩定可靠的運行是確保風電機組設備安全穩定運行的基礎,一旦齒輪箱發生了故障,除了高額的維修費用之外,因故障導致的長時間停機也會造成巨額的能量損失[1-2]。風電機組多數處于偏遠的地區,特別是在海上,不僅需要特殊的后勤保障,還需要在有利的天氣條件下才能進行維修作業[3]。針對尚未出現故障的齒輪箱,預測其潛伏性故障的發展態勢,及時在故障發展初期進行預警及制定預防性措施是當下研究的重要內容。

國內外大多數風電機組是通過SCADA系統對機組的運行進行集中監控,傳統的風電機組檢修模式是通過SCADA(Supervisory Control And Data Acquisition)系統對風電機組中所有子系統以及設備中的關鍵部件進行較長時間間隔的采集存儲[4]。在此基礎上,當某些狀態參數連續超過閾值時,SCADA系統發出故障警告,但實際應用過程中,系統發出警告時,故障的發展已經造成了不可逆的損傷[5]。

以風電機組SCADA數據為基礎的故障預警是解決以上問題更有效的方法之一。故障預警是在設備尚未發生故障之前或發生故障之初,分析相應的歷史特征數據,通過機器學習、深度學習等智能數據挖掘技術分析未來故障狀態的發展趨勢,及時定制維護策略[6]。管麗莎等[7]提出基于時間序列和BP神經網絡的風機故障診斷系統,能夠快速診斷風機是否發生故障,達到一定的預警效果。但風電機組SCADA數據具有非線性、維度多、數據集龐大、復雜多變的特點,淺層結構的機器學習處理這類數據的能力有限,在SCADA數據隨工況與時間不斷變化的情況下,難以表征風電齒輪箱的運行狀態。深度學習具有強大的特征學習能力,結合海量的數據集,能夠構建深層次的模型,從而刻畫數據豐富的內在信息[8]。雍彬等人[9]提出基于門控循環(Gate Recurrent Unit,GRU)網絡結合SCADA參數的時序特征,實現齒輪箱的狀態預警。GRU作為循環神經網絡(Recurrent Neural Network,RNN)中一種特殊的改進形式,能夠進行動態時間建模,在保證預測準確度的前提下,模型具有簡單、計算效率高的優點。黃榮舟等[10]提出基于長短期記憶(Long Short-Term Memory,LSTM)網絡融合SCADA數據的風電機組齒輪箱狀態監測與預警方法。LSTM同樣作為RNN中一種改進形式,與GRU相比,模型較為復雜,但靈活性較高,在數據集較大的情況下,LSTM的表達性能更好。但是在使用LSTM的過程中發現,LSTM超參數設置對模型預測準確度有較大的影響,達到盡可能好的效果需要一定的經驗和數次的嘗試。為避免人為因素導致的效果欠佳,LSTM超參數自動尋優十分重要。

因此,本文作者以SCADA數據為基礎,通過LSTM網絡實現對風電機組齒輪箱的故障預警,引入改進飛蛾火焰算法(Moth Flame Optimization algorithm,MFO)來優化LSTM的超參數,建立最終的故障預警模型。最后將該方法與其他研究中的預測方法進行對比。

1 模型方法與原理

1.1 長短期記憶網絡

在眾多深度學習的模型中,RNN引入了時序的概念,依靠其循環的網絡結構、保持記憶的能力以及處理非線性數據的能力,在解決序列數據的長期依賴問題時表現出更強的適應性[11]。但當網絡層級增多,RNN在信息反饋時存在梯度消失、梯度爆炸等問題,并且RNN難以對大跨度時間序列建模[12]。LSTM解決了 RNN 無法建立大跨度時間序列的預測模型問題,LSTM模型將RNN模型隱藏層中的神經元替換為具有“門控”機制的記憶單元,由一個存儲單元和遺忘、輸入、輸出3種邏輯門組成,“門控”機制控制新的信息寫入以及遺忘掉先前累積的信息,從而解決循環網絡結構中長期依賴的問題,避免了循環網絡結構中因梯度反向傳播中的連乘效應造成的梯度爆炸和梯度消失[13]。LSTM記憶單元結構如圖1所示。

圖1 LSTM網絡結構

圖1中:記憶單元在t時刻的單元狀態記作ct,其包含了序列模型的長期記憶信息;在t時刻隱藏層的狀態記作ht,其包含了序列模型的短期記憶信息;在t時刻序列輸入記作xt,記憶單元的狀態從t-1時刻計算到t時刻的主線過程對應圖中ct-1到ct水平貫穿線,LSTM在此基礎上添加3個“門”控制記憶單元的寫入和修改。假設在t時刻,記憶單元輸入t時刻的序列xt、t-1時刻的隱藏層狀態ht-1和單元狀態ct-1,再通過遺忘門,ct-1乘以遺忘門狀態計算結果ft,決定需要保留的信息,其中ft由隱藏層狀態ht-1和序列xt計算,公式如下:

ft=σ(Wf·[ht-1,xt]+bf)

(1)

it=σ(Wi·[ht-1,xt]+bi)

(2)

(3)

(4)

最后,通過輸出門,輸出門的狀態計算結果ot乘以tanh激活函數,決定需要輸出的信息,得到新的隱藏層ht狀態,計算公式如下:

ot=σ(Wo·[ht-1,xt]+bo)

(5)

ht=ot?tanh(ct)

(6)

式中:Wt、Wi、Wo與bt、bi、bo分別為遺忘門、輸入門、輸出門的權重矩陣和偏差向量;Wc與bc分別為單元狀態的權重矩陣和偏差向量;σ為Sigmoid激活函數;?為各元素按位置相乘。

合理地使用LSTM能夠解決RNN中存在的梯度消失、梯度爆炸以及長期依賴的問題,但LSTM超參數的設置對于模型的最終預測能力影響很大,有些超參數的選擇至關重要,其中初始學習率α決定模型的訓練效果,隱藏層神經元的個數hm和隱藏層維數hd決定模型的學習能力與訓練復雜程度,訓練的批次尺寸sbatch影響模型迭代收斂的速度。因此文中利用MMFO算法對這4個參數進行迭代調優,以增強模型的預測能力。

1.2 飛蛾火焰算法

飛蛾火焰算法(MFO)是由自然界中飛蛾的橫向定位導航機制演變而來的。它是根據飛蛾飛行時的導航機制,模擬飛蛾螺旋飛行的路徑而找到最優解的智能優化算法[14]。在飛蛾火焰算法中有2個角色:飛蛾與火焰。一個飛蛾對應一個問題的解決方案,飛蛾在搜索空間沿著螺旋線不斷更新位置尋找更好的解,火焰是到目前為止所有飛蛾種群的最優解。每次迭代過程中,如果飛蛾尋找到了更好的解,就把火焰目前存儲的最好的解替換掉。飛蛾與火焰是一對一的關系,飛蛾只在與它對應的火焰周圍尋找解,而非所有飛蛾只被一個火焰吸引,故所有飛蛾會圍繞著全局多個點進行搜索,避免了算法陷入局部極值的情況,極大地增強了算法的全局搜索能力。飛蛾可以飛行在一維、二維甚至更高維度的空間,飛蛾的種群M和火焰種群F可以用如下矩陣來表示:

其中:n是種群中飛蛾的數量;d是所求解的維度,維度對應需要優化參數的個數。

MFO算法的優化過程如下:

(1)初始化MFO算法。在搜索空間中隨機生成的飛蛾位置,飛蛾種群中每只飛蛾位置的初始化在MFO中實現公式如下:

mi,j=(ubj-lbj)·random+lbj

(7)

式中:ubj和lbj分別為搜索空間第j個待優化參數所在維度的上限和下限;random為0~1之間的隨機值。

(2)計算適應度。使用LSTM模型評價指標作為適應度,當前飛蛾種群作為第一代的火焰種群,并根據適應度對飛蛾與火焰進行排序。

(3)飛蛾種群M中所有飛蛾Mi根據對應的火焰Fi不斷移動尋找解,火焰種群F根據每次迭代最優解進行更新,然后飛蛾按照火焰F種群的對應位置更新順序,如圖2所示。

圖2 MFO算法迭代更新機制

飛蛾Mi位置更新機制按照螺旋曲線飛行,飛蛾飛行螺旋軌跡的公式如下:

Mi(l+1)=distance(Fi(l),Mi(l))·ebt·

cos(2πt)+Fi(l)

(8)

式中:l代表當前的迭代次數;distance函數是計算飛蛾與對應火焰位置之間的距離;b表示構造對數螺旋曲線的常數;t表示飛蛾與火焰位置的接近程度,t越小表示離火焰越近,t越大表示離火焰越遠,它是一個隨機數,取值區間在[-1+l(-1/lmax),1],可以用如下公式表示:

(9)

式中:lmax代表最大迭代次數。

(4)火焰自適應減少。在上述過程中,飛蛾Mi只在本身對應的火焰Fi周圍尋找最優解,飛蛾Mi個體之間缺少聯系,無法充分利用搜索空間。為此,在迭代過程中合理減少火焰的數量,去掉適應度最低的解,此時與之相對應的飛蛾缺少了目標,便以當前解集中適應度最低的解為目標,火焰自適應減少公式與飛蛾飛行螺旋軌跡的完整公式如下:

(10)

(11)

v(t)=ebt·cos(2πt)

(12)

式中:fn代表火焰種群F的數量;round函數返回一個整數,該整數根據小數進行四舍五入;Flast代表火焰種群F適應度最低的火焰。

(5)輸出參數調優的結果,即算法迭代過程中的全局最優解。

MFO算法的全局搜索能力非常強,但是飛蛾火焰算法容易陷入圍繞著少數火焰局部搜索的陷阱,并且算法本身缺少跳出局部搜索的能力[15],一旦陷入局部搜索的陷阱時,算法的全局搜索能力會受到極大的限制。因此文中在傳統的飛蛾火焰算法中引入精英反向學習對算法進行改進,避免模型陷入局部搜索陷阱,形成改進飛蛾火焰算法。

飛蛾個體尋找火焰個體相對獨立,個體與個體之間沒有太多共享的信息,當處于領導地位的最優飛蛾陷入局部搜索陷阱時,將導致算法早熟,全局搜索停滯。反向學習能夠將產生的反向解和當前解放在一起進行擇優迭代[16],飛蛾火焰算法在第l次迭代或初始化之后(l=0)得到其中一個解Fi(l)=(fi,1,fi,2,…,fi,d),反向解為F′i(l)=(f′i,1,f′i,2,…,f′i,d),其中:

(13)

對于原解適應度值大于反向解適應度值的個體,進行反向區域搜索的價值不大,這種策略雖然能夠很大程度上規避飛蛾火焰算法的弊端,但盲目地擴大搜索范圍容易造成時間成本的浪費。因此在反向學習的基礎上加上精英策略,從反向解與當前解中選擇適應度最好的個體組成精英群體,然后根據精英群體生成新的搜索空間,再求原解適應度值小于反向解適應度值的個體的反向解,這樣做既保留了反向學習的優點又降低了時間的浪費[17]。

1.3 改進MFO-LSTM預測模型

以SCADA數據為基礎,實現對風電機組的狀態預測,其數據具有非線性、維度多、復雜、時序性且時間跨度大等特點,研究表明LSTM能夠有效處理這類數據,但LSTM的超參數設置對實驗的結果影響較大,文中提出了一種改進MFO-LSTM的預測模型,具體建模如圖3所示。

圖3 改進MFO-LSTM預測模型

(1)設置需要優化參數的取值范圍,初始化改進MFO算法飛蛾種群M,種群的維數設置為5,其中每只飛蛾Mi維數為需要優化參數的個數,此處需要優化的參數為4個,因此Mi的維數4。

(2)在改進MFO算法迭代的過程中,使用LSTM模型的評價指數作為對應解的適應度值。LSTM模型選取SCADA數據集,經過標準化與歸一化處理后,作為模型輸入量,設置LSTM的訓練次數、時間步長,LSTM模型的隱藏層維數hd、隱藏層神經元個數hm、學習率α、訓練的批次尺寸sbatch由改進MFO算法中飛蛾所在位置及其反向解位置來設置。

(3)根據種群中的適應度值確定當前種群中最優解Pbest和全局最優解Gbest,對當前飛蛾種群以及反向解種群進行排序,選擇最優的5個個體進入下一輪的迭代。

(4)改進MFO算法火焰自適應減少,每只飛蛾Mi最開始在自身對應的火焰Fi周圍尋優,后來逐漸放棄效果不好的解,圍繞最優解尋優。

(5)當改進MFO算法達到最大迭代次數時,獲取最優的LSTM超參數解,構建LSTM模型,結合評價指標對預測結果進行最終評價。

2 實驗設計與結果分析

2.1 SCADA數據特征選取

當風電機組齒輪箱工作時,齒輪與軸承使用同一潤滑設備進行潤滑與冷卻,當齒輪箱某個位置發生異常時,溫度會迅速上升并傳遞到潤滑油中,因此選取SCADA數據中的潤滑油數據作為改進MFO-LSTM模型的輸出。傳統的故障預警方法是:監測的潤滑油溫在某一時間段連續超過設定的閾值時發出預警,但由于風電機組所處的環境多變,風電機組也常處于高負荷狀態,閾值設定過低容易造成誤報,過高則容易導致故障發生一段時間后才報警,都無法達到良好的故障預警效果。實驗使用改進MFO-LSTM融合SCADA歷史數據中正常運行的數據預測未來某一時刻潤滑油溫的值,計算預測值與實測值之間的殘差值,當齒輪箱正常運行時,殘差值基本維持在正常范圍之內,當齒輪箱發生異常時,殘差值與正常范圍呈現明顯的偏離。

另外,SCADA數據所包含的參數有77個,若將全部參數都輸入到LSTM模型中,會極大地增加LSTM模型訓練的壓力,最終影響LSTM模型的預測結果以及運行時間,因此需要對LSTM輸入數據進行適當的選擇。皮爾森相關系數(Pearson Correlation Coefficient)分析方法因速度快、易于計算的特點,經常用在這類特征提取的場合[18]。皮爾森相關系數r表示2個變量之間線性相關程度,r值越大說明其關聯性越強。假設其中一個長度為n的特征x的集合為{x1,x2,x3,...,xn},另一個特征y的集合為{y1,y2,y3,...,yn},那么r的值可以用如下公式來計算:

(14)

計算所有SCADA數據與齒輪箱潤滑油溫之間的皮爾森系數r,其部分結果如表1所示。

表1 部分參數與潤滑油溫相關系數

選取相關系數大于0.6的參數作為LSTM模型的輸入,所選取的變量包括風速vsp1、風速vsp2、齒輪箱軸承空心軸溫度、軸承A溫度、軸承B溫度、輸出功率、高速軸溫度、中速軸溫度、低速軸溫度、環境溫度、齒輪箱冷卻水溫度等19個變量。

2.2 實驗設計

為驗證方案的有效性,選取某風電機組的SCADA數據以及故障日志進行實驗。數據采樣時間為2019年1月1日0點—2019年4月10日0點,采集頻率為1 min/次,共101 047組數據。故障日志顯示2019年4月9日14點左右,系統頻繁報警提示齒輪箱中油溫過高,工作人員檢修齒輪箱內部時發現齒輪已經發生了嚴重的物理磨碎和腐蝕磨損。故障日志的分析原因中顯示:故障發生的原因是風速的變化以及轉速的提升導致齒輪運行時發生振動,造成齒輪表面磨損,其發生的時間可能在系統報警幾小時之前,磨損使齒輪箱中的油溫升高,使潤滑油分解出酸性物造成齒輪化學腐蝕,進一步加劇了齒輪的磨損。此時故障已經對齒輪箱造成了嚴重的損傷,為避免這樣的事情再次發生,采用改進MFO-LSTM模型對正常運行情況下齒輪箱中的潤滑油溫進行預測,并根據監測的數據計算其殘差,當殘差超過其閾值時觸發報警。

將19個影響齒輪箱潤滑油溫的SCADA參數作為LSTM輸入量,齒輪箱潤滑油溫作為輸出結果。SCADA數據中將2019年1月1日0點—2019年4月1日0點之間的數據作為訓練集,2019年4月1日0點—2019年4月6日0點之間的數據作為正常情況下的測試集,2019年4月6日0點—2019年4月10日0點之間的數據作為發生故障情況下的測試集。由于預測數據與真實數據之間的殘差是隨機變量,一般服從正態分布,在正態分布中有99.74%數據分布在μ±3σ范圍之內,因此選用μ±3σ作為上下閾值,其中μ為殘差均值,σ為標準差。齒輪箱正常運行時,真實監測值與預測值之間的殘差不會超過μ±3σ的范圍;當齒輪箱發生異常導致真實值與預測值之間出現較大的偏差時,殘差超出μ±3σ的范圍。

2.2.1 模型參數設置

將特征數據標準化、歸一化處理后輸入到改進MFO-LSTM模型,改進MFO-LSTM模型需要優化的超參數有隱藏層維數hd、隱藏層神經元個數hm、學習率α、訓練的批次尺寸sbatch,設置其取值范圍如表2所示。

表2 求解參數取值范圍

同時利用數據樣本構建PSO-LSTM模型、LSTM模型、RNN模型以及SVM模型,其中PSO-LSTM模型選用相同的優化參數和取值范圍,最后比較模型的預測結果,其參數設置如表3所示。

表3 模型的參數設置

2.2.2 齒輪箱正常運行時預測結果分析

利用訓練集訓練上述的模型并預測齒輪箱正常運行時的數據,并結合實際監測值計算殘差,預測結果以及殘差如圖4所示。

圖4 正常樣本的預測結果

根據μ±3σ公式計算殘差的上下限作為故障報警的閾值,并選用均方根誤差(RMSE)、平均絕對百分比誤差(MAPE)和決定系數R2,對模型的預測結果進行評價,各指標的表達式如下所示:

(15)

(16)

(17)

在上述的指標中,δRMSE與δMAPE越小,R2的值越接近于1,說明模型的擬合程度越高,預測的結果更加準確。具體結果如表4所示。

表4 不同預測模型結果對比

由表4可知:改進MFO-LSTM的故障報警閾值上下限之間的范圍最小,預測值和真實值曲線擬合程度最高。

2.2.3 齒輪箱異常運行時預測結果

改進MFO-LSTM擬合程度最好,閾值范圍最小,理論上改進MFO-LSTM的故障報警應更精確、更及時。為驗證該想法,以齒輪箱異常運行時的樣本進行實驗,各模型的實驗結果如圖5所示。

圖5 異常樣本的預測結果

由圖5可知:改進MFO-LSTM模型在8點左右監測到齒輪箱油溫的真實值與預測值之間的殘差連續超出故障報警的閾值上限,系統報警,與故障日志中研究人員分析的故障發生初期時間一致;而PSO-LSTM模型會在8點50分左右報警;LSTM模型會在10點10分左右報警;RNN模型會在9點20分左右報警;SVM模型會在10點40分左右報警;報警時間均晚于改進MFO-LSTM模型。另外,RNN模型會在4月6號10點20分和4月7號0點30分左右監測出異常而報警,而此時齒輪箱實際處于正常運行狀態,誤報的原因是由于RNN模型的擬合程度不理想導致。結合5種模型對正常樣本和異常樣本的預測結果可知,改進MFO-LSTM能夠在故障發生初期及時監測到異常,并且與其他方法相比,模型的準確性更高。

2.2.4 改進MFO-LSTM與PSO-LSTM迭代效果比較

最后比較改進MFO-LSTM與PSO-LSTM模型最佳適應度值變化的過程如圖6所示。適應度值選用δMAPE,記錄算法迭代過程中最佳位置的值。從圖6中可以明顯看到:改進MFO-LSTM的收斂速度更快,并且能找到更優的解,體現了改進MFO-LSTM算法的優勢。

圖6 迭代效果比較

3 結論

文中構建了改進MFO-LSTM模型,結合風電機組的SCADA數據對風電機組齒輪箱潤滑油溫進行預測。當監測值與預測值的殘差超過閾值時發出警報,從而實現故障預警。SCADA數據契合LSTM模型適用于時間序列數據集的特點,并采用相關性分析篩選特征,最后利用改進MFO算法對LSTM模型中的超參數進行優化,克服參數選取不當導致的模型預測效果不好的問題,得到較高的預測精度。在某風電機組實驗分析中,與其他的算法模型相比,改進MFO-LSTM擬合程度更好、報警閾值范圍更小、報警更及時、誤差風險更低,對于降低風電機組維護成本、保障風電機組穩定安全的運行具有重要意義。

猜你喜歡
飛蛾齒輪箱適應度
改進的自適應復制、交叉和突變遺傳算法
風電齒輪箱軸承用鋼100CrMnSi6-4的開發
可愛的你
Trolls World Tour魔發精靈2
飛蛾說
提高齒輪箱式換檔機構可靠性的改進設計
勇敢的小飛蛾
基于空調導風板成型工藝的Kriging模型適應度研究
杭州前進齒輪箱集團股份有限公司
基于遺傳退火優化MSVM的齒輪箱故障診斷
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合