?

基于關聯分析的生成式對抗神經網絡的風電機組故障診斷研究

2022-12-03 09:50方文墨孫志強寧兆秋白佳慶崔馨元
關鍵詞:項集風電風機

于 浩,張 東,方文墨,孫 明,孫志強,寧兆秋,白佳慶,崔馨元

(1.沈陽工程學院a.電力學院;b.新能源學院,遼寧 沈陽 110136;2.沈陽飛機工業(集團)有限公司,遼寧 沈陽 110034)

現如今我國新能源企業飛速發展,人們對綠色能源的使用越來越重視。由于風電場、光伏發電站等新能源發電站逐步向偏僻地帶轉移,這就導致了風電機組的工作條件不能得到保證,并且增大了檢測診斷的難度[1]。風電機的故障率與風電機組的復雜工作狀況有很大聯系,并且電機一旦發生故障,相關設備都會受到很大的影響甚至暫停工作,這就需要很高的檢修費用[2]。所以,對風機進行在線故障監控和故障診斷的研究是很有價值的。當今,大數據處理和深度學習等技術領域迅速發展,利用數據處理分類分析和神經網絡處理數據庫可以完成風電機的在線故障監控、實時反應風機工作狀態、高效診斷風機故障類型等。這對控制風場的發電成本和提高發電效益有很大幫助,不僅提高了企業的經濟效益和能源利用率,還能降低風電企業的維護成本。

張芳芳等[3]結合了位移實驗和最小二乘支持向量機診斷法,特點是減少診斷計算量,在診斷的速度上也有了明顯改善。風機故障診斷方法有很多,其中從故障特征值對風機進行工作狀態的監控和故障檢修的預測方法占比較大[4]。針對實際生產中難以獲得足量的故障樣本數據而導致訓練中樣本不均衡、樣本不足、缺少故障數據等問題,提出了一種基于關聯分析的生成式對抗神經網絡的風電機組故障診斷方法,并將其與卷積神經網絡相結合,構成風電機組故障診斷模型。該模型對風電機組故障數據進行關聯分析,使用FP-tree 法對樣本數據進行整理;根據特征值排序進行分類可以有效減少樣本數據被二次掃描的情況,縮短處理時間,快速找出頻繁項集,完成故障特征的提??;通過生成式對抗神經網絡進行數據庫擴充,實現風電機組的故障診斷。該模型有較好的抗噪性能,在噪聲環境下,具有較高的故障診斷準確率。

1 數據關聯分析

Apriori 算法應用在大量規則集合中篩選出最為有用的相關規則中。這種數據關聯分析法能夠選擇出兩種及兩種以上數據之間的關系,通過特征值比較對其進行分類拆分。風機工作受環境影響較大,為了得到風機故障與環境因素之間的關系,使用關聯分析法對風機發生的不同故障與所處不同環境下的環境因素進行數據發掘分析,將故障與環境因素間的頻繁程度作為參考。

設x為項集,x?y為從x指向y的規則,T是給定數據庫的一組事務。

支持度表示項集x在事務集T中出現的頻率。項集x在事務集T中的支持度定義包含項集x事務在事務集T中的比例,可表示為

最小支持度(min-sup)是項集的最小支持閾值,為關聯規則的最低重要性。

置信度表示規則在事務集中出現的頻率。規則x?y在事務集T中的支持度是指同一事件中既包含項集x也包含項集y事務的比例,可表示為

最小置信度(min-conf)是置信度的最小值,為關聯規則的最低可信度。

首先,將故障數據進行掃描數據集處理,完成初次數據集掃描,輸出頻繁項集的1 項集集合,然后按照支持度降低的順序進行排列,得到的結果為L1={{z,5},{z,4},{z,3},{z,3},{z,3},{z,3}};其次,建立FP-tree,依據根結點(記為“null”)制作頻繁項集且清空鏈表;最后,再次掃描故障數據,對數據樣本中每一項的次序按照L1中排序并過濾掉不頻繁的項。FP-tree流程如圖1所示。

圖1 FP-tree流程

關聯分析法最重要的部分就是對數據樣本的最小支持度閾值和最小置信度閾值的確定,必須滿足這兩個值才能被稱為強關聯規則。由于環境條件狀態的不同,會對其取不同的值,首先對數據進行分類,然后根據特征值再對其進行拆分,建立特征樹與特征樹分支,這樣系統可以根據掃描特征樹避免多次掃描分支數據而耗費時間,可以很好地配合神經網絡對故障數據庫進行擴充。數據關聯分析結構如圖2所示。

圖2 數據關聯分析結構

通過數據關聯分析法,將數據進行分類處理,達到快速訓練神經網絡的目的,起到對風機故障數據擴充及檢測的作用。

2 生成式對抗神經網絡

生成式對抗神經網絡主要是由生成器和判別器構成。生成器的功能是生成大量的隨機樣本,將伴隨現存的少量歷史故障數據輸入到判別器中;判別器的功能是識別生成器端輸入的大量數據,判別其真偽,將假數據篩除,真數據重新導入到生成器端口[5-6]。生成式對抗神經網絡就是生成器與判別器的博弈。在對抗中,生成器優化自身的生成能力,判別器也通過不斷地更新優化提高其識別能力,最后生成的數據也更接近真實數據。具體工作流程如圖3所示。

圖3 生成式對抗神經網絡工作流程

采用目標函數調整生成器和判別器。首先,選出故障數據中的特征值,再從歷史故障數據中選取樣本x,將這些樣本數據輸入到生成式對抗神經網絡中;其次,生成器生成的大量數據進入判別器鑒別,對這些數據的真實概率進行分析,先把50%的數據作為真實數據,另外50%的數據作為偽數據,其目的是讓最后的輸出數據接近于真實數據。風機故障較多,在此對較為常見的故障進行標簽,對不同故障進行分類,具體樣本標簽及標簽值如表1所示。

表1 樣本標簽

判別器不斷檢測出假數據降低真實概率,生成器不斷生成數據,這兩端的能力在對抗中不斷優化,最終這兩部分將達到納什均衡(也就是說G(z)的生成樣本將符合訓練數據的分布,并且對于所有的x,D(x)=1/2)。

2.1 損失函數

損失函數是衡量神經網絡參數設置是否合理的重要指標。生成式對抗神經網絡生成器與判別器都是由不同函數構成的:生成器的定義函數為G,輸入為z,參數為β(G);判別器的定義函數為D,輸入為x,參數為β(D)。生成器與判別器各函數都有相應的參數。判別器JD(βD,βG)與生成器JG(βD,βG)只能通過調節各自的參數βD和βG實現損失函數最小化的目標。生成器與判別器的最優效果都受βD、βG的影響,但是生成器與判別器卻不能控制對方的參數。

2.2 判別器損失函數

大多數生成式對抗網絡用相同的判別器損失函數JD,不同網絡的區別在于生成器損失函數JG[7-8]。判別器損失函數JD:

式中,x-Pdata代表x真實樣本數據的統計分布Pdata,即x屬于真實樣本數據;D(x)代表判別器輸入函數;G(z)代表生成器輸入函數。

期望判別器的輸出盡量接近于1(判定為真實數據),因此期望D(x)接近于1,當logD(x)=0 時,訓練損失率為0;反之,若判別器的判別能力較弱,輸出接近于0,那么logD(x)為負無窮大,而-logD(x)則為正無窮大,因此會造成生成式對抗神經網絡的損失率超過50%。對于“偽造數據”,期望判別器D[G(z) ]的輸出盡量為0(判定為偽造數據),則1-D[G(z) ]無限接近于1,從而log{1-[DG(z)]}無限接近于0,生成式對抗神經網絡的損失率為0,且訓練損失率逐漸趨于平穩,如圖4所示。

圖4 訓練損失率

根據樣本數據分析圖5 可知:生成的故障數據的真實性越來越高,生成器越來越優化,輸出端數據的真實性無限接近于1,定子電流和振動頻率分布較為均勻。通過神經網絡對故障數據進行擴充,不斷優化生成式對抗神經網絡的生成器和判別器,損失訓練率降低且趨于穩定,不但解決了風機故障診斷中樣本容量不足的問題,還解決了神經網絡因樣本容量不足而導致神經網絡模型準確率不高的問題,提高了神經網絡的泛化能力,為風機故障數據不足提供了新的解決方法。真實值與擴充所得到的故障數據樣本趨于一致,這種方法為深度學習因樣本容量不足而造成學習效率低下的問題提供了新的解決方法。

圖5 樣本數據分布

2.3 生成器損失函數

生成器不斷輸入數據,判別器不斷檢測數據,這兩端進行反復對抗。生成器與判別器損失函數之和為0[9],即

對于生成器G而言,在式(3)中只能影響-D[G(z) ],生成器的主要任務在于盡量生成“高仿真”的偽造數據,使得判斷器無法區分其數據是“偽造”還是“真實”。因此,生成器G的D[G(z)]值越大,則1-D[G(z) ]的值就越小,對應的函數JG就越小,損失值也越小。

生成器函數值JG越小越好。根據式(4)可知:函數值JG越小,判別器函數值JD就越大。零和博弈的價值函數為

則生成器的最優解為

生成器使用的損失函數式(4)雖然在理論分析上效果顯著,可是在實際應用中的效果卻不能讓人滿意。在GAN 中,交叉熵既要最小化,也要最大化。對于生成器來說,若判別器在某一置信值時,能夠準確地判斷出由生成器制造的“仿造樣本”,則會導致生成器的梯度消失。為了解決生成器梯度消失的現象,研究人員提出了利用交叉熵最小化處理生成器函數(即直接利用目標函數來構建交叉熵損失函數),而不是利用判別器的損失函數獲取生成器損失[10-11]。這時生成器的損失函數可變為

根據式(3)和式(7)可得生成GAN網絡的優化目標函數為

式中,z-pz(z)表示z符合編碼的統計pz,即z為從編碼的統計分布中采樣的隨機數。

為了解決風機樣本數據不足,提高風電機組故障檢測預測的準確率,通過采集風機樣本數據與仿真平臺,制作生成式對抗神經網絡,對仿真結果進行分析對比。風機主要參數如表2所示。

表2 實驗風機主要參數

本文以定子電流信號和振動信號作為特征量。仿真平臺使用動率分析儀采集電機定子電流信號,將2 個振動傳感器分別連接在電機軸端和底座上,用來采集振動信號,另外還有1個噪聲傳感器。

生成式對抗神經網絡在訓練中的損失率是0。將測試樣本放入訓練完成的神經網絡中進行風機故障判斷訓練,且通過生成器與判別器不斷地升級進化,訓練順勢率波動越來越小并且不斷降低,如圖6所示。

圖6 神經網絡訓練結果

3 結語

本文提出了一種基于關聯分析的生成式對抗神經網絡的風電機組故障診斷方法。該方法通過計算支持度和置信度的最小閾值,對少量故障數據庫進行故障數據特征提取,避免了大量處理無關故障特征值,將帶有特征值的少量樣本帶入到生成式對抗神經網絡中,經過生成器與判別器的反復優化升級,生成大量真實數據,通過神經網絡解決了風電機組故障數據較少的問題。風力發電在未來發電量中會占有越來越大的比重,利用大數據分析技術降低風電場中風電機組設備的維修率,對風電機組狀態進行實時監控,可降低發電成本,提高生產效率。

猜你喜歡
項集風電風機
不確定數據的約束頻繁閉項集挖掘算法
海上風電躍進隱憂
分散式風電破“局”
風機折翼“倒春寒”
風電:棄風限電明顯改善 海上風電如火如荼
風機倒塔事故為何頻發?
節能技術EPU在AV71風機上的應用
重齒風電
TS3000系統防喘振控制在 AV80-14風機中的應用
一種新的改進Apriori算法*
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合