?

基于MLP-BiLSTM-TCN組合的超短期風電功率預測

2023-12-14 00:46張曉艷周丙濤劉洪笑段亞窮
關鍵詞:測風塔電功率權值

張曉艷,向 勉,朱 黎,周丙濤,劉洪笑,段亞窮

(湖北民族大學 智能科學與工程學院,湖北 恩施 445000)

近年來我國經濟快速發展,各方面能源消耗與日俱增。隨著化石能源的逐漸枯竭,調整以化石能源為主體的能源結構,進一步增加對風能等新能源的開發和利用勢在必行[1]。由于風能具有清潔、可再生等優勢,因此我國的風電裝機數量不斷攀升。據國家能源局2022年發布的統計數據來看,2021年全國風電總裝機容量約為3.4×108kW,相比2020年增長了約17.2%[2]。由于風力本身具有隨機性、波動性、不可控性等特點,所以風電并網時如果不進行合理的規劃會給電網系統帶來嚴重沖擊,影響電網的安全運行。故風電功率的精準預測對于風力發電場節約成本、解決風電并網過程中的難題、保證電網系統經濟穩定的運行都有十分重要的意義[3]。

為了進一步提高風電功率預測的精度,國內外的專家提出了許多方法。這些方法按照模型類型劃分,可分為單一模型預測和組合模型預測。經典的單一模型預測有多層感知機(multi-layer perceptron,MLP)[4]、卷積神經網絡(convolutional neural network,CNN)[5]、時間卷積網絡(temporal convolutional network,TCN)[6]、循環神經網絡(recurrent neural networks,RNN)[7]、長短期記憶(long short-term memory,LSTM)網絡[8]、支持向量機(support vector machines,SVM)[9]、雙向長短期記憶(bidirectional long short-term memory,BiLSTM)網絡[10]等方法。但是單一模型預測精度較低、誤差較大,在實際應用中較為受限。而組合模型通過融合各個單一模型的優點,比如數據特征處理、預測性能等,進而提升了預測精度。組合模型預測可分為4類:基于多模型加權的組合預測、基于數據分解的組合預測、基于優化技術的組合預測、基于誤差修正的組合預測[11]。崔昊楊等[12]采用K近鄰(K-nearest neighbor,KNN)算法求解各個風機的空間相關性,用門控循環單元(gate recurrent unit,GRU)-MLP模型完成各臺風機的風電功率預測,但是未考慮環境影響因素,不利于風電穩定運行。張浩田等[13]提出了一種加入注意力機制的TCN進行風電預測,具有更快的計算速度,但是預測精度仍有不足。趙凌云等[14]先采用完全自適應噪聲集合經驗模態分解(complete ensemble empirical mode decomposition with adaptive noise,CEEMDAN)方法對原始數據進行模態分解,再通過改進的TCN對子序列分別進行預測,雖然提高了預測的準確率,但是CEEMDAN分解后要對多個分量單獨預測大大增加了整體的計算量。劉永強等[15]提出了基于BiLSTM模型的風電功率預測方法,雖然相較于LSTM模型提高了預測的精度,但是單一的神經網絡模型預測精度低、誤差大。陳德余等[16]提出了基于皮爾遜相關系數(Pearson correlation coefficient,PCC)-GRU-注意力機制(Attention)組合的風電功率超短期預測。辛征等[17]提出了CNN-BiLSTM組合深度學習模型進行風電功率預測,在一定程度上降低了預測的誤差。

上述組合模型研究存在對比模型少、說服力不強等問題。為此,提出了一種基于MLP-BiLSTM-TCN組合模型的超短期風電功率預測。首先對3種單一模型進行調參實驗,每種模型選出最優的4種參數,最后用線性規劃法將12種模型參數進行組合預測。相較于目前常見的組合模型而言,用12種模型進行預測,可以有效地減少傳統組合模型中單一模型出現偏差帶來的影響,且具有很強的靈活性和適應性。

1 氣象特征和風電功率相關性分析

風電場內影響風電功率的原因有很多種,其中氣象特征是最重要的影響因素,包括風速、風向、溫度、濕度、氣壓等。皮爾遜相關系數是用來描述2個變量的相關性程度[18],即氣象特征和風電功率的相關程度,對其相關性進行分析,有利于量化氣象特征對風電功率的影響程度。引入皮爾遜相關系數篩選出與風電功率強相關的氣象特征作為輸入值進行實驗,可以提高計算效率,去除雜亂因素對實驗造成的干擾。皮爾遜相關系數的計算公式如下:

(1)

2 基于MLP-BiLSTM-TCN的組合預測模型

2.1 多層感知機

多層感知機是一種前向結構的人工神經網絡,包含輸入層(單層)、隱藏層(單層或多層)和輸出層(單層),其中層與層之間的連接方式是全連接,同一層神經元之間沒有連接。在輸入層中接收風電功率的數據集,然后傳入隱藏層進行數據處理分析,再將分析處理過的數據傳入輸出層進行輸出。輸入層用X表示,隱藏層進行輸出是經過激活函數變換的,即隱藏層的輸出為f(W1X+B1),其中W1為隱藏層的權值,B1為隱藏層的偏置值,激活函數f選擇Sigmoid函數,計算公式為Sigmoid(x)=1/[1+exp(-x)],激活函數將x的值變換到(0,1)區間。從隱藏層到輸出層是多類別的Softmax回歸,輸出層用Y表示,即輸出層的輸出為Y=Softmax(W2X1+B2),其中W2為輸出層的權值,X1為隱藏層的輸出f(W1X+B1),B2為輸出層的偏置值。最后通過迭代訓練求出W1、W2、B1、B2的值,以達到模型的最優解。

2.2 雙向長短期記憶網絡

雙向長短期記憶網絡是由雙向的LSTM組成,可以從2個方向對時間序列的特征進行提取,從而提高預測精度,具體的模型結構如圖1所示。由圖1可知,在Xt處輸入信息,然后由正向和反向的長短期記憶網絡對數據的序列信息進行特征提取、處理,最后從Ht處輸出預測值信息。

圖1 BiLSTM模型結構Fig.1 Structure of BiLSTM model

計算公式如下:

(2)

(3)

(4)

2.3 時間卷積網絡

TCN由多個殘差模塊構成。殘差模塊包括正則化層、非線性激活函數、權重歸一化、一維擴張因果卷積,能更好地提取時序數據的特征。TCN模型結構如圖2所示。由圖2可知,數據從輸入層輸入,經過殘差模塊進行時序數據的提取和一系列的處理,最后將預測值進行輸出。權重歸一化是指對卷積進行歸一化處理,非線性激活函數使用非線性映射,正則化層是對卷積進行正則化處理,一維擴張因果卷積是單向結構,對于上層t時刻的值,只與下層t時刻和之前的值有關。計算公式如下:

圖2 TCN模型結構Fig.2 Structure of TCN model

(5)

式(5)中,k為過濾器大小,d為擴張系數,s-di為對過去進行卷積,x為輸入序列,s為序列元素,i為網絡的層數,fCONV()為卷積運算。

2.4 組合模型預測

利用線性規劃法對MLP、BiLSTM、TCN進行組合模型預測,對于不同的模型及參數賦予不同的權值以達到最優解,線性規劃計算公式如下:

(6)

(7)

基于MLP-BiLSTM-TCN模型的預測流程如圖3所示。由圖3可知,具體的預測過程如下:

圖3 基于MLP-BiLSTM-TCN模型預測流程Fig.3 Flow of prediction based on MLP-BiLSTM-TCN model

1) 利用皮爾遜相關系數法對數據集進行相關性分析,選取強相關性和弱相關性的氣象信息作為輸入值。

2) 對數據集進行預處理,對空值進行填充,劃分數據集,并將數據集進行歸一化和反歸一化處理。

3) 生成3種單一神經網絡模型MLP、BiLSTM、TCN,將前6個真實值和皮爾遜相關系數分析后選取的值作為輸入值進行實驗。

4) 在進行實驗時,對每種單一模型的隱藏層設置不同參數進行訓練,選取訓練效果好的4種參數,則3個模型總共12種不同參數。分別是:MLP 3層隱藏層取4組不同的模型參數,分別是[16,32,16]、[32,64,32]、[64,128,64]、[128,256,128];BiLSTM 4組不同的模型參數分別是32、64、100、128;TCN 4組不同的模型參數分別是16、32、64、128。12種模型分別記作MLP16、MLP32、MLP64、MLP128、BiLSTM32、BiLSTM64、BiLSTM100、BiLSTM128、TCN16、TCN32、TCN64、TCN128。每個模型在不同的時刻預測的精度不同,用12種模型的預測結果構建組合模型,可以有效減少單一模型帶來的影響,減小了預測誤差。

5) 采用線性規劃法的求解器Cplex,在驗證集中對12種不同模型求出不同權值。線性規劃法包括目標函數和約束條件,目標函數求出各個模型的權值,使得不同權值模型結果相加與真實值最為接近,約束條件是各權值之和為1,并且每個模型的權值都要大于等于0。在驗證集中求出權值以后放在測試集中進行測試,以達到結果的最優化,最后將求出的權值以及對應的預測值的積相加得出組合模型的預測值。

對預測結果進行誤差分析,將平均絕對誤差(mean absolute error,MAE) 和均方根誤差(root mean square error,RMSE)作為模型誤差的度量標準。其中,MAE用來評價預測誤差的平均幅度,RMSE用來衡量誤差的分散程度。EMAE、ERMSE的計算公式如下:

(8)

(9)

3 實驗結果與分析

3.1 數據集與實驗環境

數據集來源于新疆維吾爾自治區某風電場2019年的數據,包括測風塔高度為10m的風速、測風塔高度為30m的風速、測風塔高度為50m的風速、測風塔高度為10m的風向、測風塔高度為30m的風向、測風塔高度為50m的風向、溫度、氣壓、濕度、實際發電量。采樣周期為15min,即每天96個采樣點,數據預處理之后總共是35040個數據。根據處理過的氣象因素和預測點前6個真實值,需要完成下一個15min的超短期風電功率預測。

所有的模型都基于Python 3.7、Tensorflow 2.6框架構建,采用Windows 10系統,內存為16GB,CPU為AMD Ryzen 7 5800H with radeon Graphics,GPU為NVIDIA GeForce RTX 3050 Laptop。使用Cuda11.3和Cudnn8.2.1對GPU進行加速。

3.2 數據預處理

3.2.1 數據清理及歸一化 在對數據進行預處理時,首先對數據集內的異常值進行清理,將其刪除作為空值和原本的空值統一處理,然后將空值用均值填充法進行填充,再將數據集劃分成訓練集、驗證集、測試集,比例為8∶1∶1。為了消除量綱誤差,加速訓練過程,對數據進行歸一化、反歸一化處理,歸一化公式如下:

x=2·(x0-xmin)/(xmax-xmin)-1,

(10)

式(10)中,x表示歸一化處理后的風電數據,x0表示原始數據,xmax、xmin分別表示原始數據的最大值、最小值。

3.2.2 相關性分析 數據集中選取的風電場氣象因素有測風塔高度分別為10、30、50m時的風速、測風塔高度分別為10、30、50m時的風向,以及溫度、氣壓、濕度、實際功率,對其進行皮爾遜相關性分析。相關性熱力圖分析如圖4所示。

圖4 相關性熱力圖分析Fig.4 Correlation heat map analysis

由圖4可知,測風塔高度分別為10、30、50m時風速與風電功率之間的相關系數分別是0.75、0.76、0.78,具有強相關性(正相關),測風塔高度為10m時風向、30m時風向與風電功率之間的相關系數分別是-0.34、-0.37,具有弱相關性(負相關),而測風塔高度為50m時風向、溫度、氣壓、濕度與風電功率之間的相關系數分別是-0.19、0.13、-0.13、-0.14,具有極弱相關性(溫度是正相關,其余為負相關)。為了提高計算效率,減少雜亂信息的干擾,將與風電功率呈極弱相關性的氣象信息剔除,選取強相關性和弱相關性的氣象信息作為輸入值。

3.3 模型參數設置

模型訓練的參數設置:迭代次數為100輪,批量大小為32,初始學習率為0.0005。

3.4 實驗結果分析

3.4.1 組合模型與單一模型對比 按2.4節中隱藏層的參數設置依次構建12種模型,通過實驗得出各模型參數下的風電功率預測值,以及組合模型的風電功率預測值。為了更加直觀地展示組合模型和單一神經網絡模型預測效果的對比,采樣周期設為15min,選取某日的數據即96個時刻點,不同模型的預測曲線如圖5所示。由圖5可知,相比于其他12種模型,組合模型(MLP-BiLSTM-TCN)的預測曲線與真實值更為接近,預測的誤差更小,表現出優越性。

各模型的誤差對比如表1所示。由表1可知,組合模型(MLP-BiLSTM-TCN)的MAE和RMSE值均為最小,即組合模型的預測精度最高,而MLP32、MLP64的誤差較大。從MAE來看,組合模型的值相較于MLP16、MLP32、MLP64、MLP128、BiLSTM32、BiLSTM64、BiLSTM100、BiLSTM128、TCN16、TCN32、TCN64、TCN128模型分別下降了0.880、1.391、1.142、1.054、0.908、0.855、0.744、0.976、0.561、0.585、0.699、0.627MW;從RMSE來看,組合模型相較于其他12種模型,分別下降了1.409、1.660、1.789、1.744、1.577、1.673、1.685、1.709、1.069、1.118、1.226、1.237MW。

表1 各模型誤差對比Tab.1 Error comparison of each model

3.4.2 消融實驗 為了驗證所提出的組合模型MLP-BiLSTM-TCN中各單一神經網絡模型的有效性和必要性,通過移除組合模型中的某個單一模型,得到3組由2個單一模型組成的組合模型,分別為MLP-BiLSTM、MLP-TCN、BiLSTM-TCN,即為3組消融實驗。消融實驗對比結果如圖6所示。由圖6可知,組合模型MLP-BiLSTM-TCN的曲線與真實值曲線更為接近,故預測精度更高。從MAE來看,以上3組模型的值分別為3.562、3.515、3.466MW,MLP-BiLSTM-TCN模型相較于3組模型分別下降了0.587、0.540、0.491MW。從RMSE來看,以上3組模型的值分別為6.659、6.577、6.603MW,MLP-BiLSTM-TCN模型相較于3組模型分別下降了1.185、1.103、1.129MW。

圖6 消融實驗對比

3.4.3 與其他類似組合算法對比 為了驗證所提組合模型預測的精確性,通過與同類型的組合模型CNN-TCN和CNN-BiLSTM進行對比實驗,結果如圖7所示。由圖7可知,組合模型MLP-BiLSTM-TCN的曲線與真實值曲線更為接近,預測精度更高。從MAE來看,2種對比模型的值分別為5.081、5.188MW,MLP-BiLSTM-TCN模型相較于2種模型分別下降了2.106、2.213MW。從RMSE來看,2種對比模型的值分別為8.944、9.131MW,MLP-BiLSTM-TCN模型與之比較分別下降了3.470、3.657MW。

圖7 組合模型對比Fig.7 Comparison of combined models

3.4.4 不同權值情況下的組合模型對比 為了驗證所求權值是否為最優解,通過與等權值的MLP-BiLSTM-TCN模型對比,結果如圖8所示。由圖8可知,所提組合模型與真實值曲線更為接近,預測精度更高。等權值的MLP-BiLSTM-TCN模型的MAE、RMSE分別為3.486、6.574MW,與此相比所提組合模型分別下降了0.511、1.100MW。

圖8 組合模型不同權值對比Fig.8 Comparison of different weights of combined models

4 結論

為了提高超短期風電功率的預測精度,降低預測誤差,提出了一種基于MLP-BiLSTM-TCN組合模型的超短期風電功率預測。用新疆維吾爾自治區某風電場實際運行的數據進行實驗,得出了以下結論:使用皮爾遜相關系數處理數據,選取相關性較高的氣象因素作為輸入,提高了實驗效率。通過MLP-BiLSTM-TCN組合模型預測結果與其他12種單一預測模型結果、消融實驗中MLP-BiLSTM、MLP-TCN、BiLSTM-TCN預測結果、權重相等的組合模型預測結果進行對比,發現MLP-BiLSTM-TCN模型具有更高的預測精度。該模型不但能夠發揮不同模型的預測優勢,而且能更好的弱化不同時刻、氣象條件下單一模型的缺陷問題。但是該研究僅限于確定性的點預測,后續在概率性區間預測方面仍需要進行深入研究。

猜你喜歡
測風塔電功率權值
一種融合時間權值和用戶行為序列的電影推薦模型
基于PCC-CNN-GRU的短期風電功率預測
一種自安裝海上測風塔的運輸和安裝穩性分析
CONTENTS
輕松上手電功率
你會計算電功率嗎
解讀電功率
測風塔法在棄風電量評估中的應用
基于權值動量的RBM加速學習算法研究
臺風“威馬遜”影響廣東期間近地層風特性
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合