?

基于重采樣降噪與主成分分析的寬卷積深度神經網絡風機故障診斷方法

2024-01-06 10:09劉展包琰洋李大字
發電技術 2023年6期
關鍵詞:故障診斷風機卷積

劉展,包琰洋,李大字*

(1.北京能高普康測控技術有限公司,北京市 豐臺區 100070;2.北京化工大學自動化研究所,北京市 朝陽區 100029)

0 引言

近年來,為應對氣候變化與能源危機,清潔能源在全球能源組成中的比重不斷加大[1]。風電作為一種重要的清潔能源,具有獲取難度低、技術成熟等優點,得到了廣泛重視與大力發展。據預計,到2030年,風力發電量將占全球總發電量的22%。在我國提出了“雙碳”目標后,風電在國家能源戰略發展中將具有越來越重要的地位[2-3]。

隨著風力發電在我國的大規模發展,風電機組的數量快速增長[4],風電機組故障率高的問題應引起重視。因此,如何快速而準確地進行故障診斷,特別是對難以排查的機械故障[5-8]進行診斷,以降低風電機組運行的維護成本[9],成為風力發電領域面臨的問題之一。

由于風電機組運行所處的環境與其主要機械結構的特點,風機振動信號中包含了大量的運行狀態信息,這些信息可用來分析并判斷風電機組運行狀態與故障[10]。目前,風電機組的故障診斷[11]主要依賴于對風機振動信號的特征分析。

當前用于風機故障診斷的信號分析方法主要有時域分析、頻域分析與時頻域分析,其中時域分析[12]是最常用的方法。因為風機狀態的改變所帶來的振動信號的變化在時域中有明顯的體現,方便對其進行特征的提取與分析。目前在故障診斷領域主要應用的時域分析方法有時域波形分析法、概率密度分析法、相關分析法、濾波處理法以及與人工智能相結合的方法[13]等。

國內外目前對基于時域分析的故障診斷方法已有一定的研究。文獻[14]為適應原始數據中不同尺度的噪聲強度,提出了一種基于Morlet 小波變換的噪聲控制二階增強隨機共振方法,對風機振動信號進行故障提取。針對時域上的重噪聲引起經驗小波變換中的模態混疊現象,文獻[15]首先用原始數據來驅動閾值小波空間鄰近系數法,在此基礎上再進行經驗小波分解,可以自適應性地將信號分解成單組分來提取原有的調制信息。

隨著人工智能技術在深度學習領域的發展[16],其具有越來越強的特征學習、提取與分析能力,在故障診斷問題上有著良好的應用前景。文獻[17]提出了一種在時域分析中應用多傳感器數據融合技術的風機故障診斷方法,將原始時域數據通過融合得到由峰值指數、脈沖指數等組成的故障特征時域集,并結合云蝙蝠算法和核極限學習機構成CBAKELM 模型實現故障診斷。文獻[18]針對齒輪箱振動信號故障診斷,提出了一種結合小波包變換濾波器和交叉驗證粒子群優化核極端學習機的診斷方法。

針對風電機組的故障診斷問題,本文基于時域分析方法,通過對原始風機現場數據進行多種信號預處理,并采用寬卷積深度神經網絡(wide deep convolutional neural network,WDCNN)進行信號特征提取。此方法受風機的機械轉速差異等因素影響較小,在真實診斷場景中具有很好的泛化性與實用性。

1 寬卷積深度神經網絡

寬卷積深度神經網絡 是卷積神經網絡(convolutional neural network,CNN)的一種[19],其最顯著的特點在于首層卷積層所使用的卷積核為寬卷積核。卷積神經網絡中卷積核的大小決定了感受野的大小,即所提取信息的全局性。寬卷積深度神經網絡所使用的寬卷積核在基于時域分析的故障診斷問題中可有效捕獲周期性或波動性故障信號,避免了普通的卷積神經網絡所使用的窄卷積核容易出現的無法將此類故障信號完全納入感受野的問題。在使用寬卷積的首層卷積層將故障信息完全截取之后,再經過多層使用窄卷積核的卷積層對信息進行深層語義剖析,進一步提取其特征。

WDCNN 共有4 層組成,其基本結構如圖1所示。

圖1 WDCNN結構圖Fig.1 Diagram of WDCNN structure

第1 層為卷積層,該層用于提取輸入信息的特征,而其中的卷積核可看作濾波器,其提取特征的全局性與其感受野有關,也即與卷積核的大小有關。一般來說,經過的卷積層越多,提取的特征越深層。卷積后將輸出進一步通過一個激活函數即非線性映射,以滿足網絡非線性的要求。卷積層的輸出表示為

式中:σ為激活函數;xi為輸入信號;wi為卷積核;bi為偏差。

第2層為池化層,該層一般位于卷積層之后,對卷積層的輸出降維。一方面使經過卷積層得到的特征圖進一步變小,降低計算復雜度;另一方面對特征進一步壓縮,提取主要特征,去除冗余信息,加快網絡收斂,防止過擬合現象的發生。

第3 層為全連接層,該層的作用是將網絡學習所得到的分布式特征進行連接,將其映射到樣本標記空間,用于接下來的分類任務。

第4層為歸一化層,該層中使用的Softmax函數可將網絡全連接層的輸出結果歸一化為故障的概率分布,該層的輸出結果可直接用于故障診斷。

神經網絡中用損失函數來表示真實值與預測值之間的差距,并在網絡中進行反向傳播,指導網絡參數的訓練,使網絡在訓練后預測值盡可能接近真實值,從而提高預測精度,在故障診斷問題中也即提高診斷結果的可靠性。

本文提出的方法中所用的WDCNN 共有5 層卷積層,其中第1層卷積核的尺寸為16×16,其余4層卷積核的尺寸為3×3,所使用的非線性激活函數為Relu函數。

2 基于WDCNN的故障診斷方法框架

2.1 基于信號頻率的重采樣方法

對采集得到的風機原始振動信號數據進行分析時,由于原始數據中包含了多臺風機的數據,不同風機的機械轉速等都有所差別,常常導致通過信號分析所得到的不是故障狀態的特征,而是有關特征轉速、頻率等的差異所導致的特征,背離了故障診斷的要求。

為了減小轉速差異對特征提取的影響,本文在數據預處理中采用了基于信號頻率與機械轉速的重采樣方法。信號重采樣間隔表示為

式中:fs為原始數據采樣頻率;ft為重采樣頻率;n為旋轉機械的轉速;q為重采樣倍數常量。

重采樣倍數常量q決定了最后的重采樣頻率,需要通過實驗進行調試,最后選取合適的q值。實驗所用的q值依照振動信號來源的不同而有所不同。以某風力發電機組高速軸斷齒時的振動信號數據為例,其高速軸轉速約1 700 r/min,采用16 384 Hz的原始采樣頻率,經過調試發現q=144,即采樣間隔為4,實際重采樣頻率在4 096 Hz時所得到的故障檢測結果最好。重采樣過程如圖2 所示,圖中L表示所截取數據中采樣點個數。

圖2 某機組高速軸斷齒振動信號重采樣示意圖Fig.2 Diagram of resampling vibration signal of highspeed shaft tooth breakage in a certain unit

該重采樣方法一方面減少了數據中關于轉速等因素的冗余信息,增大了數據中關于故障狀態特征的信息密度,有利于后續的特征提取與網絡訓練;另一方面增大了數據量,起到了對訓練集與測試集進行數據增強的效果。

2.2 小波閾值去噪

原始風機振動信號數據除了受到轉速、頻率的影響,還混合了環境中的自然噪聲,僅僅依靠重采樣無法消除噪聲的影響。WDCNN的輸入為時域上的信號數據,需要避免對噪聲的特征進行無效提取,消除噪聲是保證其有效性的重要步驟。

由于風機振動信號本身具有時變性,因此本文在信號重采樣之后采用了小波閾值去噪的方法,以得到特征性更強的信號,其原理如下。

將包含噪聲的原始數據在各尺度上與式(3)所示的小波基函數進行小波正交變換:

保留在大尺度(低分辨率)下的所有分解值,即保留信號主體的時頻域特征;對小尺度(高分辨率)下的分解值設定一個閾值,保留小波系數高于該閾值的分解值,舍棄小波系數低于該閾值的分解值,即去除幅值相較于原始信號較小的突變噪聲信號。最后對處理過后的信號進行逆小波變換,重構出去除噪聲后的振動信號數據。

圖3 為某風機機組高速軸斷齒時的振動信號數據在降噪前后的對比圖。從圖3 可看出,小波閾值降噪消除了偽分量,明顯地將其中一些由噪聲引起的較高峰值數據進行了削弱,避免之后提取到錯誤的故障特征。

圖3 小波閾值降噪前后對比圖Fig.3 Comparison before and after wavelet threshold denoising

2.3 主成分分析降維

現場風機機組的一個部件上往往會包含多個傳感器測點,因此得到的振動信號數據包含了多個通道的數據。這些不同通道數據彼此具有強相關性而又包含了不同的特征。目前在工程領域會憑借人工經驗選擇某個或某幾個通道的數據進行使用,這種依賴先驗知識的做法會降低方法的泛化性與可遷移性,同時也具有不可靠性。而將所有通道數據都參與網絡模型訓練的做法一方面引入了不必要的特征,另一方面計算量過大,拖慢訓練時間。

本文采用了主成分分析法(principal component analysis,PCA)對預處理后的振動信號數據進行處理,降低數據通道數,提取合適的特征數據。PCA 的原理為利用降維的方法,通過正交線性組合方式,最大化保留樣本間方差,把多指標轉化為幾個綜合指標。圖4為具有5個測點的某風機機組數據PCA 降維前后的頻域圖。圖4 顯示PCA 將原本的5 個數據通道降維成3 個數據通道,在大大減少參加訓練的數據量的同時自動提取并保留了原本5 個數據通道的主要頻域特征。本文實驗中所采用的降維通道數以主元貢獻度之和大于85%為標準來選取,并非一個固定的數。

圖4 某機組高速軸振動信號PCA降維前后頻域圖Fig.4 Frequency domain diagram of high-speed shaft vibration signal of a certain unit before and after PCA dimensionality reduction

2.4 特征參數選擇

風機機組的振動信號數據不僅具有鮮明的時域特征,而且在頻域上故障信號與正常信號也會有所區別。圖5 為某風電機組高速軸在正常與故障時的振動信號數據在頻域上的對比。

圖5 某風機機組高速軸振動信號頻域數據Fig.5 Frequency domain data of high-speed shaft vibration signal for a certain unit

本文所提出的方法不僅選取了時域上常用的15 個特征參數(如平均值、方差、峰峰值、峭度等),還選取了頻域上的5個特征參數(如基頻等),以全面描述振動信號的特征。

2.5 用于風機故障診斷的卷積神經網絡設計

本文所提出的方法利用了卷積神經網絡通過自身的訓練能自適應地從信號中提取有關故障特征的優點,減少了采樣頻率、轉速等因素對特征提取的影響,降低了信號預處理的復雜度與參數的敏感性,且網絡訓練所需的數據量較少,實現了故障診斷的自動化與泛用化。

基于寬卷積神經網絡的方法結構如圖6所示,其主要步驟如下:

圖6 基于WDCNN方法結構圖Fig.6 Structure diagram based on WDCNN method

1)利用風機上的傳感器采集振動信號數據。

2)將采集得到的原始振動信號數據按照設置的步長間隔進行重采樣處理,即對隨后的網絡訓練中作為訓練集與驗證集的數據進行數據增強;并進行小波閾值去噪。將預處理后的數據進行PCA降維。

3)對預處理后的數據按照設置的切片數目與長度進行切片,作為接下來WDCNN 的輸入,并提取時頻域特征作為標簽。

4)按照初始化的參數,先后經過一層寬卷積核的卷積層與多層窄卷積核的卷積層,每次通過卷積層后都通過一個池化層進行壓縮,以此對數據的深度特征信息進行提取。

5)經過全連接層與歸一化層將網絡輸出轉化為故障的概率分布。

6)按照根據真實值與預測值之間的差距所設計的損失函數進行反向傳播,更新網絡參數。網絡收斂同時在驗證集上達到預計的準確率后,保存訓練所得到的模型。

7)將在線數據經過重采樣與切片后輸入到訓練好的WDCNN 中,對數據的深度特征信息進行提取。

8)在經過卷積神經網絡模型之后,經過全連接層與歸一化層輸出故障的概率分布即對故障的分類結果,完成在線故障診斷。

3 實驗結果與分析

3.1 發電機故障診斷實驗

風力發電機是風電機組中最重要的部件,但也常出現機械故障。本節通過分析風力發電機的數據進行診斷實驗,所采用的數據為實際采集的某風電機組數據。

實驗數據分為2 組,分別是發電機驅動端數據與發電機非驅動端數據。其中,發電機驅動端數據包含發電機驅動端正常與發電機驅動端磨損2種狀態,某個通道2種狀態的振動信號數據分別如圖7(a)、(b)所示。發電機非驅動端數據包含發電機非驅動端正常與發電機非驅動端磨損2 種狀態,某個通道2種狀態的振動信號數據分別如圖8(a)、(b)所示。分別從編號為39的風機機組的發電機驅動端數據與非驅動端數據中取出20組具有相同轉速的數據用于網絡訓練,每組包含6 個數據通道,每個通道有65 536 個振動信號數據,故障數據與正常數據各占一半,其中70%的數據用作訓練集,剩余30%的數據用作預測集。網絡訓練完成后分別用其他機組的50組具有相同轉速的數據進行測試。實驗結果如表1所示。

表1 相同轉速下風機發電機故障診斷結果Tab.1 Fault diagnosis results of wind turbine generator at the same speed

圖7 發電機驅動端原始數據Fig.7 Raw data of drive end of generator

圖8 發電機非驅動端原始數據Fig.8 Raw data of non drive end of generator

從表1 可以看到,當機械轉速相同時,用較少數據訓練得到的網絡有相當高的診斷準確率,其中風機發電機驅動端的故障分類準確率達到100%,發電機非驅動端的故障分類準確率達到98%。

為檢驗轉速因素對本文提出方法的影響,分別從編號為46的風機機組的發電機驅動端數據與非驅動端數據中取出30組包含不同轉速的數據用于網絡訓練,每組包含6 個數據通道,每個通道有65 536 個振動信號數據,故障數據與正常數據各占一半,其中70%的數據作為訓練集,30%的數據作為預測集。網絡訓練完成后分別用其他機組的50組包含不同轉速的數據進行測試。實驗結果如表2所示。

表2 不同轉速下風機發電機故障診斷結果Tab.2 Fault diagnosis results of fan generators at different rotational speeds

從表2中可以看出,轉速的差異對網絡的特征提取與診斷能力影響較小,風機發電機驅動端與非驅動端的故障分類準確率分別達到了98%與96%。

3.2 齒輪箱故障診斷實驗

齒輪箱是風電機組中另一個較為重要的部件,該部件信號受齒輪數差異的影響較大,信號中干擾特征較多。本節通過分析齒輪箱的數據進行診斷實驗。

所采用的數據為實際采集的某風電機組數據,共包含齒輪箱正常與齒輪箱斷齒2 種狀態,其中某個通道2種狀態的振動信號數據如圖9所示。

圖9 齒輪箱驅動端原始數據Fig.9 Raw data of drive end of gearbox

實驗中共從編號為4 的風機機組中取出20 組數據用于網絡訓練,每組包含6 個數據通道,每個通道有131 072個振動信號數據,故障數據與正常數據各占一半,其中70%的數據作為訓練集,30%的數據作為預測集。用訓練好的網絡對編號為30的風機機組的50組數據進行測試,分類準確率為98%,說明對于信號差異較大的齒輪箱數據,本文提出的方法仍有較好的診斷效果。實驗結果表明,本文提出的方法對轉速差異等因素具有良好的抗干擾能力,對狀態特征具有優秀的特征提取能力。

3.3 消融實驗

針對本文所采用的預處理方法進行了消融實驗,設置了4組實驗來驗證所采用方法的有效性。4 組實驗所采用的數據均為某風機機組驅動端振動信號數據。

第1 組實驗設置為進行重采樣,未進行小波閾值降噪。第2組實驗設置為進行小波閾值降噪,未進行重采樣。第3 組實驗設置為進行重采樣與小波閾值降噪。前3 組實驗均未進行PCA 降維,均按人工經驗選取數據通道。第4 組實驗設置為同時進行了重采樣、小波閾值降噪與PCA降維。

表3 為消融實驗結果,可以看出,未進行重采樣或小波閾值降噪的網絡性能均會有所下降,證明了本文所采用預處理方法的有效性。另外,采用PCA降維后的實驗結果基本能接近人工經驗選擇的網絡訓練結果,考慮到該方法具有更好的靈活性與泛化性,綜合評估下與PCA結合的方法具有一定的可行性。

表3 消融實驗結果Tab.3 Results of ablation experiment

4 結論

針對風電機組的故障診斷問題,基于時域分析給出了一種使用WDCNN 來進行特征提取并完成自動診斷的方法。此方法在風機軸承轉速不同的情況下,采用重采樣處理數據,并使用小波閾值降噪的方法去除偽分量。另外,針對現場風機數據所含通道數較多的情況,結合PCA 進行降維,選取合適的數據通道。最后,訓練好的神經網絡可有效提取出風電振動信號所包含的故障特征。在風電場中的風機數據表明,此方法通過較少的風機數據即可訓練出具有較強特征提取與故障診斷能力的網絡,同時不受風機軸承轉速改變的影響。所提出的方法在保證較高診斷準確率的同時具有數據需求量少、訓練時間短與限制條件少等優點,在實際工程中有著較大的應用價值。

猜你喜歡
故障診斷風機卷積
基于3D-Winograd的快速卷積算法設計及FPGA實現
從濾波器理解卷積
風機折翼“倒春寒”
基于傅里葉域卷積表示的目標跟蹤算法
風機倒塔事故為何頻發?
節能技術EPU在AV71風機上的應用
因果圖定性分析法及其在故障診斷中的應用
TS3000系統防喘振控制在 AV80-14風機中的應用
一種基于卷積神經網絡的性別識別方法
基于LCD和排列熵的滾動軸承故障診斷
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合