?

基于特征優選和麻雀搜索優化門控循環單元短期風電功率預測

2023-12-12 11:29胡道波陳芳芳張倩倩文博羅銀榕
應用科技 2023年6期
關鍵詞:電功率特征選擇關聯度

胡道波,陳芳芳,張倩倩,文博,羅銀榕

云南民族大學 電氣信息工程學院,云南 昆明 650504

風電功率具有一定的不穩定性和隨機性。隨著風電并入電網,會給電力系統的安全帶來極大的挑戰[1],風電功率預測是解決該挑戰的方法之一,可以作為電網調度的重要依據。因此,準確預測風力發電機組出力具有非常重要的意義。

基于數值天氣預報的風電出力預測仍然是目前的研究熱點之一,有效的特征選擇能提高模型的預測精度。近年來,國內外研究工作人員對預測模型輸入特征優選做了大量的研究。文獻[2]引入灰色關聯度分析法測算各影響因素與工時的關聯度,并驗證該方法的有效性。文獻[3]提出一種基于灰色關聯分析法分析歷史數據與預測日間的關聯程度,將灰色關聯系數大于0.9 的特征數據作為模型輸入特征,實驗結果表明該方法提高了模型的預測精度。文獻[4]指出Kendall 秩相關系數可檢測出2 個變量之間的非性相關性。文獻[5]使用互信息用來提取風電預測模型的輸入特征向量,提高了模型的預測精度。上述文獻有效解決了建模過程中特征選擇的問題,顯著提高了預測精度。但多數研究使用一種特征選擇方法,很少從不同角度運用多種方法選擇輸入特征,進而導致輸入特征選擇不充分,影響模型的性能?;谏鲜龃嬖诘膯栴},本研究運用3 特征選擇方法橫向對比進行特征選擇,選擇有效特征,剔除冗余信息。

神經網絡方法對具有序列特征的數據非常有效,可以充分從數據中提取時間序列信息。門控循環單元(gated recurrent unit,GRU)神經網絡是在長短期記憶(long short-term memory,LSTM)神經網絡基礎上改變的一種神經網絡,也具有門控機制,其結構比LSTM 簡單,所需參數少[6-7]。文獻[6]通過注意力(attention)機制優化GRU 的輸入權重和基于麻雀搜索算法(sparrow search algorithm,SSA)優化GRU 的超參數,建立了Attention-SSA-GRU 的短期負荷預測模型,在短期負荷預測方面取得了很好的預測結果。文獻[7]建立了基于粒子群優化GRU 的故障診斷模型,通過粒子群優化GRU 的超參數,提高了模型的診斷精度。因此,本文選用GRU 神經網絡進行短期風電出力預測,并引入SSA 對GRU 神經網絡的初始隱含層節點數和學習率進行優化。

1 特征選擇

特征選擇是從眾多影響因子中優選部分有效影響因子,對原始數據進行降維處理的同時能夠降低模型的訓練難度,提高模型的預測精度。影響風電出力的影響因子有很多,風力機組輸出功率的表達式為

式中:P為風輪機輸出功率,kW;Cp為風能利用系數;A為轉輪旋轉截面面積,m2; ρ為空氣密度,kg/m3;V為風速,m/s。

1.1 灰色關聯度分析法

灰色關聯度(grey relation analysis,GRA)[8]是對風電出力的影響因子進行分析,以原始數據為基礎提取對風電功率影響具有強相關性的數據特征,灰色關聯分析具體步驟如下。

1)將歷史風電出力數據X0=[X0(1),X0(2),···,X0(m)]T設為參考系列, 將影響因子向量X1,X2,···,Xn構成的矩陣設為比較矩陣:

式中:m為影響因子維數,n為樣本數。

2)對數據進行無量綱處理,使所有數據取值都位于0~1 之間:

式中:i=0,1,···,n;k=1,2,···,m。

3)計算影響因子序列和目標系列之間的灰色關聯度系數:

式中:i=1,2,···,n;ε=0.5。

4)計算關聯度 γi,并將得到的關聯度系數由高到低進行排序。

根據上述計算得到灰色關聯度值,關聯度值越大,得到比較序列和參考序列的變化趨勢越相同。

1.2 Kendall 秩相關系數

Kendall 秩相關系數又稱Kendall 系數,是一個基于秩的相關性指標,用來衡量2 組非線性數據之間的有序關聯統計量,它是以Maurice Kendall 命名的一種數據處理算法[9-10],其計算公式為

式中:n為輸入風電數據的采樣點,x為數值天氣預報(numerical weather prediction,NWP)數據特征,y為風電功率數據。Kendall 秩相關系數的取值區間為[-1,1]。其中相關系數絕對值表示2 組隨機向量之間一致和不一致關系,當這些變量相互獨立時,Kendall 秩相關系數值為0。在此定義Kendall 秩相關系數值在[0.6,1]表示強相關,[0.4,0.6]表示中等相關,[0,0.4]表示弱相關。

1.3 互信息算法

互信息(mutual information,MI)是信息熵理論中一種有用的信息度量,用來表示2 個或多個系統間的相關信息量[11]。文中用來表示原始風電特征數據X和風電功率數據Y之間的相關信息,X、Y之間的互信息I(X;Y)定義為

式中:p(x,y)為聯合概率密度,p(x)p(y)分別為x、y的邊緣概率密度函數。MI 法是通過計算所有影響因子與風電出力的互信息度量,選取n個MI 最高的特征,達到特征優選的目的。

1.4 最優輸入特征選擇

基于上述3 種特征選擇方法,搭建最優特征選擇模型,具體思路如下:基于灰色關聯度分析法、Kendall 秩相關系數法和互信息理論用于計算各個特征對風電功率的灰色關聯度系數、相關系數和互信息量,基于3 種特征選擇方法選擇出3 個最佳特征子集,通過取交集的方式得到預測模型輸入的最佳特征集。特征選擇模型如圖1 所示。

圖1 最優輸入特征集選擇

2 預測模型

2.1 門控循環單元神經網絡

GRU 神經網絡是傳統循環神經網絡(recurrent neuron network,RNN)[12-13]的一種變形,能夠充分利用歷史信息,具有計算效率高、拓撲性強等優點。GRU 模型結構如圖2 所示。

圖2 GRU 神經網絡結構

GRU 神經網絡的最終輸出由輸出門與門控單元共同決定,公式如下:

式中: σ為sigmoid 函數,rt為遺忘門,為更新門,ht為隱藏層,wr、wz、wc和wh?分別為對應變量的權重矩陣,xt為輸入,yt為輸出,br、bn和bm分別為rt、zt和的偏置向量,zt為重置門。

2.2 麻雀搜索算法

SSA 是根據麻雀覓食和反捕食行為的啟發而提出的新型群體智能優化算法[14-15]。在種群中,每只麻雀都有3 種行為,分別為發現者、加入者和警戒者[16-17]。在麻雀搜索算法中,發現者的位置迭代表達式如下:

式中:t為當前迭代次數,j=1,2,···,d,rmax為最大迭代次數,為第i只麻雀在第j維中的位置信息,α ∈(0,1]為隨機數,R2∈(0,1]為預警值,TS∈[0.5,1]為安全值,Q為服從正態分布的隨機數,L為1×d的矩陣。

跟隨者的位置迭代更新表達式為

式中:XP為發現者所處最優位置;Xworst為發現者所處最差位置;A為1×d的矩陣,其中每個元素隨機賦值為1 或者-1,且A+=AT(AAY)-1;當i>n/2,表示適應度較低的第i個加入者沒有得到食物。

在麻雀反捕食過程中會有一部分麻雀具有警戒偵察能力,這部分群體的表達式為

式中:Xbest為當前最優位置, β為步長控制參數,K∈[-1,1]為均勻的隨機數,fi為第i個個體適應度值,fg和fw為當前全局最優和最差適應度值, ε為常數。

2.3 構建SSA-GRU 組合預測模型

為了提高GRU 預測模型的精度,本文提出了一種混合模型SSA-GRU,利用SSA 優化GRU 的初始隱含層節點數和學習率。SSA-GRU 預測模型主要步驟如下,預測模型如圖3 所示。

圖3 短期風電出力預測整體框架

1) 初始化。初始化種群規模、最大迭代次數、參數取值范圍,初始化GRU 的參數,以GRU模型的隱含層節點數和學習率作為優化目標。

2) 將參數代入訓練模型,計算麻雀種群個體適應度值,找出最優適應度個體及最劣適應度個體。

3) 根據種群的當前狀態,判斷是否滿足停止條件:若是,則輸出最優適應度值;若不是,則返回步驟2)。

4) 將SSA 尋找的最優學習率、隱含層神經元個數賦值給GRU 網絡,建立最優的SSA-GRU 短期風電出力預測模型。

3 算例仿真分析

為驗證所構建模型的有效性,選取西北某風電場2017 年7 月4 日—2017 年8 月10 日的風電歷史數據進行分析和計算,數據每15 min 采樣一次,共得到3 648 條數據,其中采用8 月10 日整天實際數據共96 個數據點作為測試集,7 月4日—8 月9 日共3 552 個數據點作為訓練集。采集的數據參量包括風速、風向、濕度和溫度等,具體見表1。

表1 原始數據特征表

為了能更好地評價預測模型精度,本實驗將均方根誤差ERMS、平均絕對誤差EMA和擬合優度系數R2作為評價標準,表達式如下:

3.1 最優特征子集選擇

采用灰色關聯度、Kendall 秩相關系數和互信息分別計算各特征數據對風電功率影響的程度,得到的相關系數如圖4~圖6 所示。其中Kendall秩相關系數強相關取值范圍為[0.6,1],灰色關聯度強相關的取值范圍為[0.65,1]。

圖4 基于灰色關聯度各特征相關系數

由圖4 可知,灰色關聯度為強相關的特征為不同距離點的風速和天氣濕度,說明風速和濕度與風電功率具有很強的關聯度。由圖5 可知,Kendall 秩相關系數為強相關的特征為不同距離點的風速和0 m 處風向,再次說明風速與風電功率具有很強的相關性。由圖6 可知,不同距離點風速特征和0 m 處風向互信息量遠遠大于其他影響特征的互信息量。其中灰色關聯度濕度特征的關聯度為0.662 8,但是風速特征和0 m 處風向的關聯度均大于0.78,很顯然濕度特征的影響程度遠遠沒有風速特征和0 m 處風向高。綜合灰色關聯度、Kendall 秩相關系數和互信息,取三者交集作為最佳特征集。

圖5 基于 Kendall 各特征相關系數

圖6 基于互信息各特征相關系數

上述3 種特征選擇方法都驗證風速對風電出力有著重要的影響。因此,最終選擇最優輸入特征為:10、30、50、70 m 處風速和0 m 處風向5 個特征作為本文預測模型的輸入特征。

3.2 基于SSA-GRU 短期風電功率預測分析

為了防止采用SSA-GRU 模型時參數之間的單位不統一,要消除參數之間的量綱影響,在訓練模型就必須先對風電的歷史數據進行歸一化分析處理:

式中:xmin和xmax分別為數據中的最小值和最大值,x為實際數據值,x′為歸一化分析處理后的值。

為驗證SSA-GRU 風電功率預測模型的預測性能,在保持同一特征集的前提下,采用GRU、極限學習機(extreme learning machine, ELM)、LSTM和SSA-LSTM 模型得到的風電出力預測效果并進行對比,得到各預測模型的風電功率預測圖和誤差評價指標值如圖7 和表2 所示,其中均方根誤差和平均絕對誤差誤差評分越小表示預測效果越好,而擬合優度系數值越大說明模型預測性能越好。從圖7 和表2 可以得出,不管是均方根誤差、平均絕對誤差還是擬合優度系數均比未優化前效果更好,其中均方根誤差和平均絕對誤差分別下降了54.3%和62.5%,擬合優度系數提高了39.2%,且與其他預測模型相比,均方根誤差和平均絕對誤差平均下降了25.3%和31.3%,擬合優度系數平均提高了10.2%。綜上實驗數據可知本文所構建預測模型預測效果最好,在短期風電功率預測方面能取得很好的預測精度。

表2 不同模型的誤差評價指標值

圖7 不同模型的功率預測效果

4 結論

本文提出基于特征優選和SSA-GRU 的短期風電功率預測,經過仿真驗證得出以下結論:

1)利用灰色關聯度、Kendall 秩相關系數和互信息量3 種方法對輸入特征進行選擇,在保留有效信息的同時避免冗余信息。

2)針對GRU 人工調參量大且準確性差的問題,利用麻雀搜索算法尋找最優超參數,充分發揮GRU 的性能。

通過對比實驗發現,本文構建的模型與其他傳統模型相比,具有更好的預測精度和泛化能力。

猜你喜歡
電功率特征選擇關聯度
基于PCC-CNN-GRU的短期風電功率預測
輕松上手電功率
你會計算電功率嗎
解讀電功率
基于灰色關聯度的水質評價分析
Kmeans 應用與特征選擇
聯合互信息水下目標特征選擇算法
基于灰關聯度的鋰電池組SOH評價方法研究
基于特征選擇和RRVPMCD的滾動軸承故障診斷方法
基于二元搭配詞的微博情感特征選擇
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合