?

改進黑猩猩算法的光伏發電功率短期預測

2024-03-22 03:43謝國民陳天香
電力系統及其自動化學報 2024年2期
關鍵詞:黑猩猩聚類功率

謝國民,陳天香

(遼寧工程技術大學電氣與控制工程學院,葫蘆島 125105)

作為清潔能源的一種,光伏發電具有十分廣闊的應用前景[1-3],但大規模接入電網后會給電力系統帶來巨大挑戰[4-5],因此如何最大限度消納這些間歇性的可再生能源,已經成為新能源領域的熱點問題[6-7]

文獻[8]根據不同天氣類型建立人工神經網絡進行預測,在相對平穩的天氣類型下預測效果良好,但在突變天氣的預測效果較差;文獻[9]提出了基于主因子分析的BP神經網絡的光伏發電短期預測模型,但其未考慮季節影響,泛化能力不強,復雜天氣下精度不高;文獻[10]利用相似日聚類劃分多個數據集,針對不同類型數據集分別建立基于長短期神經網絡的光伏短期發電預測模型,提高了預測精度,但在相似日劃分時未能充分考慮環境與天氣的影響,預測精度有待提升;文獻[11]針對BP 神經網絡參數難以確定的問題,使用煙花算法優化參數,提升了預測精度,但神經網絡在大樣本下才能發揮更佳效果;文獻[12]利用加權灰色關聯投影法優化了相似日選取,但每次模型訓練樣本容量過少,在極端天氣情況模型的泛化效果不佳;文獻[13]運用經驗模態分解EMD(empirical mode decomposition)建立模型,獲得了較高的預測精度,但其分解存在明顯模態混疊的現象,在一定程度上會影響模型的預測性能;文獻[14]利用變分模態分解VMD(variational mode decomposition)平穩化處理光伏功率序列,對子序列預測重構后得出最終預測結果,一定程度上消除了模態分解導致的模態混疊的現象,但其對其對極端天氣的處理能力不強,算法所需時間過長。

綜上所述,針對現階段光伏發電功率短期預測方法中的不足,本文提出基于改進K-means++自適應聚類和改進黑猩猩優化算法CHOA(chimpanzee optimization algorithm)優化最小二乘支持向量機LSSVM(least squares support vector machine)的短期光伏發電功率預測模型。首先,考慮不同季節下氣象因素與光伏發電功率的影響程度不同,增強氣象因素與發電功率之間的關聯程度,對不同季節下氣象因素進行自適應聚類,選用相似樣本作為訓練集。為了更好地利用天氣因素,用相關性分析確定了與光伏發電功率相關的變量步長,同時考慮到數據的維度冗余度,用隨機森林進行特征提取構建模型的輸入特征集。

由于每類樣本數量較少,易出現欠擬合的消極現象,因此使用在小樣本情況下有較強擬合能力特性的最小二乘支持向量機可以有效改善模型的擬合能力[14],再利用改進黑猩猩算法優化LSSVM模型的懲罰參數和核函數,增強模型對訓練樣本的擬合能力和對測試樣本的預測能力。將所提模型分別與BP 神經網絡BPNN(back propagation neural network)、長短期記憶LSTM(long short term memory)神經網絡進行對比,并通過實驗驗證本文模型在精度和適用性方面的優勢。

1 算法構建

1.1 最小二乘支持向量機

對于數據集X={(xi,yi)|i=1,2,…,n},xi為第i個輸入向量,yi為第i個輸出向量,n為訓練樣本組數,則線性回歸函數h(x)為

式中:α為線性權重系數矩陣;λ(xi)為非線性函數;β為偏置矩陣。

LSSVM優化目標函數為

式中:c為誤差懲罰因子;ωi為經驗誤差。

約束條件為

拉格朗日函數為

式中:δ為拉格朗日乘子,δ=[δ1,δ2,…,δn]T;ω=[ω1,ω2,…,ωn]T。

根據Karush-Kuhn-Tucker條件,分別對α、β、ωi、δi求偏導,并令其等于0,則消去α、ωi可得到線性方程組為

式中:I=[1,1,…,1]T;h=[h1,h2,…,hn]T;E為n維的單位矩陣;Φ為核函數,Φ=λ(xi)Tλ(xi),i=1,2,…,n。

LSSVM預測函數為

式中:K(xi,xj)為RBF核函數,其中i,j=1,2,…,n;σ為RBF函數的寬度。

1.2 黑猩猩優化算法

LSSVM 的核函數是提高泛化能力和學習精度的關鍵,而核函數易受條件限制,對懲罰參數敏感,易陷入過擬合。所以引入CHOA[16]對核參數進行尋優,獲取模型的最佳支撐參數,進一步提升LSSVM的泛化能力。

1.2.1 黑猩猩優化算法(CHOA 算法)

黑猩猩優化算法是根據黑猩猩表現的不同智力與能力提出的一種啟發式優化算法,其引用了概率和混沌因子,能較其他算法有更快的收斂速度和精度。

在自然界中,黑猩猩被分為5種不同等級:“驅趕者(Driver)”、“阻攔者(Barrier)”、“追捕者(Chaser)”、“攻擊者(Attacker)”和“執行者(Executor)”,其中Attacker 黑猩猩權利最大,指揮整個種群的捕獵行動;Barrier黑猩猩是Attacker黑猩猩助手的角色,協助Attacker 黑猩猩指揮行動;Chaser 黑猩猩服從Attacker 黑猩猩和Barrier 黑猩猩的命令,同時支配下一階層的Driver 黑猩猩;Executor 黑猩猩為最底層的黑猩猩,由余下的黑猩猩組成,是命令的執行者。

在黑猩猩種群中,黑猩猩在狩獵時會出現混亂捕獵行為,所以在優化中以50%的概率選擇正常更新或混沌模型更新。黑猩猩包圍獵物的數學模型為

式中:t為當前迭代次數;Xprey(t) 為當前獵物的位置;dg為黑猩猩與獵物之間的距離;mg為混沌映射矢量;Ag、Cg為系數向量,其更新表達式為

式中:rand()為[0,1]區間的隨機向量;ag(t) 為收斂因子,隨著t增加逐漸較小,其更新表達式為

式中,Tmax為最大迭代次數。

為便于理論研究和公式化處理,定義種群中最優個體為Attacker黑猩猩,次優個體為Barrier黑猩猩,第3優個體為Chaser黑猩猩,第4優個體為Driver黑猩猩,其余為Executor黑猩猩。

Executor黑猩猩位置由Attacker、Barrier、Chaser、Driver共同決定,其更新公式為

式中:Xu為Executor 黑猩猩中第u只黑猩猩的位置;Di(i=1,2,3,4)為第u只Executor 黑猩猩與4 個最優個體黑猩猩之間的距離;XAttacker、XBtarrier、XChaser、XDriver分別為4個最優個體黑猩猩的當前迭代位置;X1、X2、X3、X4分別為4個最優個體黑猩猩的更新位置;Ag1~Ag4、Cg1~Cg4、mg1~mg4分別為Ag、Cg、m中的4個系數向量。

1.2.2 改進的黑猩猩算法(PCHOA 算法)

雖然CHOA算法引入混亂捕獵行為加快了收斂速度,但還存在精度低和收斂慢等不足。為了進一步提高算法搜索能力和收斂性能,引入粒子群算法記錄黑猩猩個體經歷的最佳位置以及群體最佳位置,來更新當前Executor黑猩猩的位置,表達式為

式中:c1、c2為學習因子;r1、r2為[0,1]區間的隨機向量;Xbest為黑猩猩最優的位置;P1、P2、P3、P4為慣性權重系數,其具體公式為

其PCHOA算法流程如圖1所示。

圖1 改進黑猩猩優化算法流程Fig.1 Flow chart of improved chimpanzee optimization algorithm

步驟1設置相關參數,本文種群數N為30,最大迭代次數為80。

步驟2初始化黑猩猩種群位置。

步驟3計算適應度,確定前4個最優解XAttacker、XBtarrier、XChaser和XDriver。

步驟4更新Ag、Cg,按照式(14)更新執行黑猩猩的位置。

步驟5通過粒子群算法的群個體記憶機制,按照式(15)更新執行黑猩猩位置。

步驟6判斷是否滿足迭代次數,若滿足輸出最優黑猩猩位置XAttacker,否則繼續迭代。

步驟7獲得最佳參數,保存最優LSSVM模型。

1.3 改進的K-means++聚類算法(DK 算法)

傳統的K-means++聚類算法原理簡單,適用性強,在光伏功率初始數據處理上得到廣泛的適用[17],但是算法需要人為定義K值,隨機選取聚類中心,會受數據分布、人為因素的影響,處理精度不高。本文采用密度聚類算法[17]的思想,綜合考慮季節內、季節間的差異度,根據綜合評價函數自適應得出最佳K個聚類中心,降低算法陷入局部最優的可能。

樣本xi、xj之間的距離為

式中,M為聚類樣本維度。

距離閾值內的局部密度ρi為

式中:Dt為閾值距離;z為聚類樣本數目。

密度聚類初始聚類中心mk的更新公式為

式中:k為聚類數目;X為總數據集。

綜合評價函數為

式中:Dout為不同類樣本之間的歐式距離;Din為同類樣本之間的距離。

F(k)越接近1,聚類效果越好;F(k)越接近-1,聚類效果越差。

改進算法的步驟如下。

步驟1輸入數據X,閾值距離Dt,計算xi、xj之間的距離d(xi,xj),計算距離閾值Dt內的局部密度ρi。

步驟2對ρi排序,選擇max{ρi} 為第1個聚類中心m1,根據max{d(x,m1)}選出離m1最遠且密度最大的聚類中心m2,依次按照式(19)獲得其最佳聚類中心mi。

步驟3迭代計算,根據式(20)得出最優的F(k),對應的k即為最佳聚類數目K。

步驟4計算樣本xi到mi的距離d,劃分樣本xi到最近的mi。

步驟5重新計算各簇類的平均值,判斷聚類中心是否改變。未改變則直接輸出聚類結果,若改變返回步驟4重新迭代。

步驟6保存聚類結果,等待預測模型調用。

2 預測模型的建立

2.1 輸入量選擇

不同季節下氣象因子有很大不同,光伏功率的輸出變化也會深受影響??紤]不同季節對光伏輸出功率的影響,隨機選取5 d 進行斯皮爾曼相關性分析,結果如表1所示。

表1 斯皮爾曼相關性分析Tab.1 Spearman correlation analysis

由表1 可知,春季輻照度和環境溫度對光伏出力呈現強相關,組件溫度、大氣壓、濕度呈現弱相關;在夏、秋、冬3季,輻照度、環境溫度、組件溫度與光伏出力呈現強相關,而大氣壓與濕度幾乎對光伏出力沒有影響。因此,春季將5個氣候因素都作為輸入特征;而在夏、秋、冬3 季僅選取輻照度、環境溫度、組件溫度3個環境因素表征光伏出力特征。

考慮t+1時刻的光伏功率與前n個時刻功光伏率有很強的相關性,光伏輸出功率自相關性分析,如表2所示。

表2 輸出功率的自相關性Tab.2 Autocorrelation of output power

由表2可知,隨著時間的推移,光伏出力與前n個時刻的相關性逐漸減弱,因此選用前5個時刻功率已經能基本表征t+1時刻的功率。

2.2 基于隨機森林的輸入特征構建

綜上所述,構建的輸入/輸出變量如表3所示。

表3 預測模型的輸入/輸出變量Tab.3 Input/output variables in prediction model

2.3 預測模型指標

采用平均絕對誤差(MAE)、均方根誤差(RMSE)、擬合優度(R2)衡量預測模型性能,它們分別定義為

式中:為預測值;Pi為實際值;為平均值;N為預測點個數。

2.4 基于PCHOA-LSSVM 的功率預測模型

基于上述討論,本文構建DK-PCHOA-LSSVM的光伏輸出功率預測模型,其流程如圖2所示。

圖2 預測模型流程Fig.2 Flow chart of predictive model

步驟1數據清洗,以天為單位剔除由于異常、故障等原因產生的不良數據。

步驟2利用改進的K-means++算法將季節數據聚類,將數據分類為A~K類相似日數據。

步驟3對步驟2中分類得到的相似日數據進行相關性分析,選擇主要的氣象因子和歷史光伏輸出功率數據作為輸入特征,再利用隨機森林算法消除數據的冗余性。

步驟4對步驟3 數據歸一化,轉化為A~K類相似日數據包。

步驟5初始化黑猩猩優化模型參數,將樣本的訓練集輸入到改進的CHOA-LSSVM 模型中進行訓練,直到獲得最優的訓練模型。

步驟6保存最優訓練模型,輸入預測樣本進行測試。輸出模型評估指標MAE、R2、RMSE結束模型。

3 算例實驗分析

3.1 數據描述

本算例實驗數據來源于我國寧夏回族自治區某100 kW 光伏電站監數據,樣本數據為2020 年1 月1 日—2020 年12 月31 日的實測光伏功率和環境監測儀所測得到的太陽輻照度、組件溫度、空氣溫度、相對濕度、大氣壓力的數據集,其采樣時間為15 min/次,其中各監測設備運行情況正常,數據可靠。由于晚間時段光伏出力為0,所以截取每日05:00—19:00 的數據頻段作為輸入樣本,共計365天的數據(21 900 個樣本點)??紤]不同季節對光伏輸出功率的影響,按照季節將全年數據分為4個季節子集,其中12 月—次年2 月為冬季,3—5 月為春季,6—8 月為夏季,9—11 月為秋季。將各季節實際運行數據劃分為2個部分,同類型歷史氣象及光伏發電功率數據作為訓練集,待測日溫度和風速為數值天氣預報NWP(numerical weather prediction)數據及光伏發電功率數據作為測試集,對待預測日05:00—19:00時段進行提前24 h預測。

3.2 聚類結果分析

利用改進的K-means++自適應聚類,不同季節天氣類型聚類天數如表4所示。

表4 不同季節聚類天數Tab.4 Clustered days by season

由表4可知,數據的聚類簇數與季節有關,如春季有A類31 d,B、C、D類分別為22 d、24 d、15 d,而夏季只被分A類和B類,其中,A類為傳統意義下的晴空類數據,B、C、D類為非晴空類,包括多云、雨天(大雨,小雨,暴雨)、陰天、雪天等各種天氣類型。

雖然不同年份、不同季節氣象數據存在差異性、隨機性,但改進的K-means++聚類能自適應出最優聚類數目,能以此建立不同數量的預測模型,能更好地適應氣候、季節變化,應對極端天氣的出現,提高了模型的抗干擾能力和穩定性。

3.3 預測結果分析

根據不同季節的聚類結果,分別采用PCHOA和CHOA算法對LSSVM模型進行尋優,得到各類型下最優核參數向量,從而獲得最優LSSVM 預測模型。為驗證改進K-means++聚類算法和PCHOA 優化LSSVM 模型的優良泛化性能,從數據中隨機抽取2020 年2 月22 日、5 月27 日、8 月24 日、11 月14日數據進行預測,將本文改進K-means++聚類的改進黑猩猩優化支持向量機模型(DK-PCHOA-LSSVM)與普通K-means++聚類的改進黑猩猩優化支持向量機模型(K-PCHOA-LSSVM)、改進K-means++聚類的普通黑猩猩優化支持向量機模型(DKCHOA-LSSVM)的預測結果進行比較。預測曲線分別如圖3~圖6所示。

圖3 2 月22 日各模型對比Fig.3 Comparison among models on February 22

圖4 5 月27 日各模型對比Fig.4 Comparison among models on May 27

圖5 8 月24 日各模型對比Fig.5 Comparison among models on August 24

圖6 11 月14 日各模型對比Fig.6 Comparison among models on November 14

從圖3~圖6 可知,8 月24 日的晴空條件下KPCHOA-LSSVM、DK-CHOA-LSSVM、DK-PCHOALSSVM 3 個預測模型均能良好預測光伏發電功率的變化,但K-PCHOA-LSSVM有更大的誤差;在2月22 日的非晴空條件下,K-PCHOA-LSSVM 模型的跟蹤性能最差,特別是在10:00—15:00 這段時間,預測值偏離實際值較多,而其他兩類模型偏離程度較小,這表明基于自適應類別劃分相似日的數據處理是改善B、C、D類非晴空模型預測性能的有效途徑;而在5月27日和11月14日,DK-PCHOA-LSSVM預測模型很好地跟隨了實際輸出功率,偏離程度最小。而K-PCHOA-LSSVM 和DK-CHOA-LSSVM 預測結果相近,在功率波動時刻偏離誤差較大,表明改進黑猩猩算法提高了算法搜索能力,增強了模型泛化能力和挖掘數據隨機波動規律的能力,提升了B、C、D類非晴空模型預測精度。

分別計算各模型輸出功率的MAE、R2、RMSE,結果如表5 所示。從表5 可知,對比于目前流行的傳統K-means 相似日選取方法,改進的K-means++在B、C、D 類非晴空天氣下R2提高了21%左右,RMSE減小40%左右,MAE減了37%左右;在A類晴空天氣下各預測指標也均有提升。從表5 中也能看出,PCHOA-LSSVM算法與CHOA-LSSVM算法相比,有著更優的擬合優度,更小的誤差。

表5 模型評價指標Tab.5 Model evaluation indicators

為驗證PCHOA-LSSVM 的預測能力,在改進的K-means++聚類下將本文預測模型與文獻天牛須搜索算法優化的BP 神經網絡(DK-BAS-BPNN)和長短期神經網絡(DK-LSTM)預測模型進行對比,4 天的對比效果分別如圖7~圖10 所示。由圖7~圖10可知,在晴空天氣下DK-PCHOA-LSSVM 較參考模型有更高的精度;在非晴空天氣下,DK-BAS-BPNN和DK-LSTM 模型的預測值與實際偏差較大,尤其是對突變點的追蹤能力不強,而DK-PCHOA-LSSVM 模型的偏差程度最小,能對光伏出力的突變作出很好的預測,體現了較好預測性能,表現出PCHOA-LSSVM在小樣本數據集和數據集波動較大時較強的擬合能力,有效避免了神經網絡等方法中常出現的局部最優合和過擬合等問題。

圖7 2 月22 日各模型對比Fig.7 Comparison among models on February 22

圖8 5 月27 日各模型對比Fig.8 Comparison among models on May 27

圖9 8 月24 日各模型對比Fig.9 Comparison among models on August 24

圖10 11 月14 日各模型對比Fig.10 Comparison among models on November 14

為進一步驗證本文方法的泛化能力和普適性,隨機抽取光伏電站功率變化波動大的5 d,即11 月24 日—11 月28 日進行連續5 d 功率滾動預測。其預測結果如圖11所示,預測誤差如表6所示。

表6 模型評價指標Tab.6 Model evaluation indicators

圖11 連續5 d 預測結果對比Fig.11 Comparison of prediction results for five consecutive days

由表6 可知,預測誤差的MAE、RMSE 均小于5%?;谝陨蠈Ρ确治?,本文預測模型相較于傳統方法在天氣大波動下也能良好地追蹤實際輸出功率,適用于晴空、非晴空條件下的光伏發電短期功率預測。

4 結 論

(1)基于傳統K-means++的不足,引入密度聚類和綜合評價函數評估聚類結果,獲得自適應的Kmeans++算法。聚類數目隨著季節氣候變化而發生改變,克服了人為設置聚類數和隨機選取聚類中心的缺點,充分考慮了光伏發電功率預測中各氣象相關因素的影響,為提取待預測光伏功率的特征提供依據。

(2)基于黑猩猩算法收斂速度過慢、易陷入過擬合的缺點,引入粒子群算法記錄黑猩猩個體經歷的最佳位置以及群體最佳位置來優化黑猩猩算法,通過與原始方法比較,改進的黑猩猩算法能提高算法搜索能力,優化效果明顯。

(3)構建的DK-PCHOA-LSSVM 的功率預測模型不僅融合多源外部氣象因素模塊,克服了收斂速度慢等弊端,而且PCHOA 算法實時優化LSSVM 的核函數和懲罰因子,提高了模型預測的適應度,預測精度較其他傳統模型在天氣大波動下也能良好追蹤,實際輸出功率有顯著提升,能夠滿足短期實時調度需求。

猜你喜歡
黑猩猩聚類功率
黑猩猩
被隔離的黑猩猩
『功率』知識鞏固
功與功率辨
追本溯源識功率
黑猩猩
做功有快慢功率來表現
基于DBSACN聚類算法的XML文檔聚類
基于高斯混合聚類的陣列干涉SAR三維成像
一種層次初始的聚類個數自適應的聚類方法研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合