?

基于變分模態分解和復合變量選取的短期負荷預測

2024-02-21 09:40周綱黃瑞劉謀海李文博胡軍華高云鵬
電測與儀表 2024年2期
關鍵詞:變分模態負荷

周綱,黃瑞,3,劉謀海,李文博,胡軍華,高云鵬

(1.國網湖南省電力有限公司,長沙 410004; 2.智能電氣量測與應用技術湖南省重點實驗室,長沙 410004; 3.湖南大學,長沙 410082)

0 引 言

負荷預測,通常指基于現有負荷、氣象、經濟等數據通過數學、人工智能等方法研究和分析歷史數據,探究并挖掘負荷數據及其相關影響因素間的內在聯系與發展規律,并對未來某一時刻或某個時段負荷多少做出合理的預估[1]。準確負荷預測不僅能為電力公司制定發電計劃提供可靠依據,有利于電力系統安全平穩的運行,同時能有效降低運維成本,對電力系統經濟調度控制具有重要指導意義[2]。

近年來,國內外學者一直致力于研究更精準的負荷預測方法,其中短期負荷預測因其隨機性與波動性強、預測難度大,成為負荷預測研究重難點[3]。目前,短期負荷預測方法主要分為兩類,一類是傳統基于統計學的時間序列法,另一類是以機器學習為核心的人工智能算法[4]。時間序列法主要包括高斯過程回歸(Gaussian Process Regression, GPR)、差分整合移動平均自回歸模型(Autoregressive Integrated Moving Average Model, ARIMA)、卡爾曼濾波模型等,這些方法計算簡單、響應速度快,在負荷預測方面取得一些成果,但均以線性模型為主,更適用于規律性強的負荷預測,且在建模過程中無法綜合考慮溫度、濕度、氣壓等因素對負荷變化的影響,導致時間序列法難以滿足非線性與隨機性較強的短期負荷預測精度要求。人工智能技術的不斷發展為負荷預測提供新的思路和方法,據此國內外學者使用聚類[5]、徑向基函數(Radial Basis Function Network, RBF)神經網絡[6]、最小二乘支持向量機(Least Squares Support Vector Machine, LSSVM)[7]、長短時記憶神經網絡(Long Short-Term Memory, LSTM)[8]、深度置信網絡(Deep Belief Network, DBN)[9]等機器學習算法在短期負荷預測方面取得了較好的成果,這些方法將多種負荷變化影響因素作為預測輸入量,具有良好的泛化能力,有效提高負荷預測精度。其中,LSTM網絡因其可實現信息的長期保存、解決信息長期依賴問題,被廣泛應用于時間序列預測等方面,并取得較好的效果。

為進一步提高短期負荷預測精度,國內外學者將信號分解算法與機器學習相結合,進一步分析和挖掘負荷數據變化的潛在規律。文獻[10]使用小波函數將負荷信號分為季節性基礎負荷和需求響應主導負荷兩部分,并結合支持向量機,降低預測誤差的同時提升擬合優度,但分解效果嚴重依賴主觀經驗的小波基函數選取,難以廣泛使用。文獻[11-13]使用經驗模態分解(Empirical Mode Decomposition, EMD)或集合經驗模態分解(Ensemble Empirical Mode Decomposition, EEMD)將負荷信號分解成多個本征模態函數(Intrinsic Mode Function, IMF),分別建立預測模型,較好預測負荷信號的變化波動,但經驗模態分解及其改進無法控制信號分解后IMF的數量,需針對每個IMF建立預測模型,易造成預測模型數量多導致模型訓練時間長、耗費資源多等情況。變分模態分解(Variational Mode Decomposition, VMD)是一種自適應、完全非遞歸的信號處理方法,相比于EMD或EEMD算法,該方法具有更嚴謹的數學理論支撐和更好的模態抗混疊能力,且能根據實際需要,設置分解后IMF數量,更有利于與機器學習結合,建立短期負荷預測模型[14]。

國內外學者針對負荷預測關鍵影響因素的選取也開展了較多研究。文獻[15]依據信息論中熵理論,通過計算并排序不同環境因素與負荷的互信息值選取最佳影響因素;文獻[16]使用相空間重構算法重構負荷影響因素數據,分析重構后的各影響因素與負荷變化的相關性,選取關鍵影響數據集。上述算法可較好衡量兩個變量隨時間變化的關聯性,但兩種算法對變化數據的敏感性也帶來一些缺陷,如不同月份負荷數據會有相應差異,因此“月份”也是負荷預測的關鍵信息之一,但使用關聯分析計算所得“月份”與負荷變化的關聯度較低,與每小時發生變化的負荷數據相比,“月份”的信息變更速度較慢。

針對短期負荷預測隨機性強、影響因素選取困難等問題,使用VMD分解算法將原始電力負荷數據分解為多個特征互異的IMF,挖掘負荷數據潛在波動規律,構建復合變量選取算法(Complex Variable Selection, CVS),針對不同類型負荷影響數據,篩選負荷預測關鍵影響因素,降低預測模型輸入數據維度,結合對時序信號預測具有良好效果的LSTM網絡,據此構建VMD+CVS+LSTM短期負荷預測模型,并以長沙市2019年實測數據驗證對所提出的方法進行驗證與分析。

1 VMD分解

變分模態分解設定信號是由多個具有不同中心頻率和有限帶寬的本征模態函數組成,其利用交替方向乘子法不斷更新各本征模態函數及中心頻率,確保各本征模態函數估計窗寬之和最小,并將本征模態函數解調到相應的基頻帶,最終提取各個本征模態函數及相應的中心頻率。

變分模態分解主要涉及到經典維爾納濾波、希爾伯特變換和頻率混合三個重要概念,算法求解過程可分為變分問題的構建與求解兩個步驟。

(1)變分問題構建

對每個模態函數uk(t)求Hilbert變換,得到其解析信號以及單邊頻譜,給解析信號加入一個指數項e-jwkt調整得到對應的預估中心頻率,將其頻譜調制到相應的基頻帶,最后計算解調信號梯度的L2范數,據此計算各模態信號的預估帶寬,對應約束變分模型表達式為:

(1)

式中k=1,2,3…K,K為原始信號分解得到的本征模態函數個數;wk為本征模態函數;uk所對應的中心頻率;δ(t)為Dirac分布;*為卷積運算。

(2)變分問題求解

為求取式約束變分模型的最優解,VMD算法引入二次懲罰因子和拉格朗日乘法算子將約束變分模型轉化為非約束性變分模型,拓展拉格朗日表達式為:

(2)

式中α為二次懲罰因子,可保證信號在受到高斯噪聲干擾時的重構精度;λ(t)為拉格朗日懲罰算子,用于確保重構模型的約束條件保持嚴格性。

(3)

(4)

為更直觀展示VMD算法的良好性能,構造諧波信號,通過與EMD算法對比,展示VMD算法的抗模態混疊能力及構建短期負荷預測模型的適用性。諧波信號表達式為:

x=sin(50πt)+2sin(100πt)+1.5sin(150πt)

(5)

式中 諧波信號采樣頻率為1 500 Hz,采樣點數為1 024。使用EMD對諧波信號進行分解,共得到10個本征模態分量和一個殘差。其中,IMF1~IMF4時域波形圖及其對應的頻譜圖如圖1所示。

圖1 EMD分解IMF1~IMF4時域及頻域信號

由圖1可見,IMF1為原始信號,包含25 Hz、50 Hz和75 Hz共3種頻率信號,IMF2同時包含頻率為50 Hz和75 Hz的信號,而IMF3與IMF4均只包含一種頻率的信號,信號頻率分別為50 Hz和25 Hz。由此可見,使用EMD算法分解諧波信號得到的IMF包含不止一種頻率成分,出現較為明顯的模態混疊現象。

使用VMD算法對構造的諧波信號進行分解,VMD算法參數中設置分量個數K為3,懲罰系數α為2 000,判別精度為1×10-7,分解后IMF1~IMF3的時域信號及其對應頻譜如圖2所示。

圖2 VMD分解 IMF1~IMF4時域及頻域信號

由圖2可見,使用VMD算法分解得到3個IMF,由分解得到的時域信號及其對應頻率信號可知,每個IMF頻率成分單一,表明VMD算法分離不同頻率的信號效果更好,具有良好的抗模態混疊能力。此外,與EMD算法無法控制分解得到的IMF個數不同,VMD算法能根據實際需要設置分解后信號分量個數,易于神經網絡方法相結合,針對不同頻段的信號選取合適的方法,降低預測模型的復雜度,據此構建快速準確的短期負荷預測方法。

2 基于灰色關聯分析與CART回歸樹變量選擇

在復雜環境下有效選取負荷影響關鍵因素是實現短期負荷精準預測的關鍵,也是降低輸入數據維度、提高模型訓練速度的重要保障。針對不同輸入數據,基于灰色關聯分析和CART回歸樹提出一種復合變量選取方法,分析不同因素對負荷預測的重要程度,選取負荷預測關鍵因素,實現輸入數據有效降維同時提高預測精度。

2.1 灰色關聯分析算法

灰色關聯分析是對一個系統發展變化態勢的定量描述和比較,常用于分析相關因素對結果的影響程度?;疑P聯分析由原始序列集確定參考序列和比較序列,并對所有序列進行無量綱化處理。

比較序列Xi對于參考序列X0在k點的關聯系數計算式為:

(6)

式中ρ為分辨系數,取值越小,分辨能力越高。ρ取值范圍一般為(0,1),更一般取值為0.5。

為將比較序列所有時刻的關聯系數集中體現在一個數值上,采用平均值獲得計算結果為:

(7)

式中γi為關聯度系數;n為序列長度。

2.2 基于決策樹的輸入變量選擇

針對天氣情況、日期信息等隨時間變化較為緩慢的輸入變量,選擇基于CART回歸樹的XGBoost算法,計算各變量對于預測的貢獻度,據此選擇輸入變量用于負荷預測。

XGBoost算法通過不斷添加新CART回歸樹,用于學習新的函數以擬合上次預測殘差。XGBoost的目標函數定義為:

(8)

(9)

式中T為葉子節點個數;w為葉子節點分數;γ可調節葉子節點個數,調整λ可避免葉子節點分數過大,從而避免過擬合。

為最小化損失目標函數,利用目標函數在ft=0處的泰勒二階展開近似函數,找到合適ft使目標函數最小化,并通過“剪枝”得到目標函數為:

(10)

式中gi與hi分別為生成第t棵樹后上一次預測殘差的一階與二階導數。由式(10)可得,目標函數可看作葉子節點分數w的一元二次函數,求得最優目標函數和最優w值。

由于基于空間切分的優化問題是一種NP難問題,XGBoost利用貪婪算法確定最佳決策樹結構并尋找輸入變量最佳特征和最佳分裂點。依據輸入變量在所有樹中作為劃分屬性的次數、帶來的平均增益和影響的平均樣本數三個指標,計算各輸入變量的重要性,據此選擇輸入變量用于負荷預測。

3 VMD-CVS-LSTM預測方法的構建

長短時記憶神經網絡是基于傳統循環神經網絡(Recurrent Neural Network,RNN)的改進,在克服RNN網絡梯度消失問題的同時,對存在短期或長期依賴的數據進行建模時具有良好的表現,已成為實際應用中最有效的序列預測模型之一。LSTM網絡單元通過門結構控制信息的流動,可實現對信息的存儲和更新。LSTM網絡單元如圖3所示。

圖3 LSTM網絡單元結構

圖3中,LSTM單元中有輸入門、遺忘門和輸出門,分別使用i、f和o表示。

采用變分模態分解算法,對用電信息采集系統提供的電力負荷數據進行分解。針對分解得到的各子序列,利用復合變量選取算法篩選負荷變化關鍵影響因素,作為負荷預測的輸入。使用LSTM神經網絡,對負荷子序列分別建立預測模型,并將各預測分量進行疊加,得到最終的短期負荷預測結果。短期負荷預測模型整體框架如圖4所示。

圖4 短期負荷預測模型整體框架

4 實驗與分析

借助國網用電信息采集系統,獲得長沙某地區2019年1月1日-12月31日共8 760條負荷數據,采樣間隔為1 h,并結合對應時間的溫度、濕度、氣壓等氣象數據,構成短期負荷預測的數據集驗證所提出方法。選用均方根誤差RMSE和絕對平均誤差MAE作為短期負荷預測效果的評價指標,用于衡量預測數據與真實數據的偏差與離散程度,均方根誤差與絕對平均誤差計算式分別為:

(11)

(12)

4.1 負荷數據VMD分解

為更加直觀展現負荷數據的部分變化特征,選取2019年1月7日-13日共計一周的每小時負荷數據進行展示,負荷曲線如圖5所示。

圖5 1月7日-13日負荷曲線

由圖5可知,每日負荷曲線的最低點在6時左右,每日12時-14時、18時-22時是該地區的兩個用電高峰期。對比一周七天的負荷曲線可得,周一至周五的負荷曲線變化較為一致,在用電高峰時間段周末的用電量明顯低于工作日。負荷數據變化呈現一定的規律性,使用VMD算法可進一步挖掘并提取負荷變化的規律,提高短時負荷預測的可靠性。

電力負荷信號可分為趨勢分量、細節分量和隨機分量。因此,設置VMD分量個數K=3,懲罰系數α=2 000,判別精度為1×10-7。負荷數據的VMD分解如圖6所示。

圖6 負荷數據VMD分解

由圖6可見,對原始負荷數據進VMD分解得到的IMF1和IMF2都呈現出較好的周期性,變化規律明顯。其中,IMF1中波形變化的周期接近24 h,變化比較平緩且平均幅值最大,反映該地區每天用電量變化的趨勢。IMF2中波形變化周期約為12 h,反映一天之中不同時間段用電的波動規律。IMF3中波形變化規律性弱,波動具有較強的隨機性,且平均幅值相對較低,反映該地區由于天氣等因素發生變化導致短時間內負荷發生相應改變。

4.2 基于CVS輸入變量選擇

使用灰色關聯算法計算多個變量間的關聯度,分析不同變量之間的相互影響程度。使用灰色關聯算法,設置參數ρ=0.5,計算原始負荷數據及各影響因素之間的關聯度,并繪制灰色關聯度熱力圖,負荷影響因素灰色關聯度熱力圖如圖7所示,其橫軸為參考序列名稱,縱軸為比較序列名稱。

圖7 負荷影響因素灰色關聯熱力圖

由圖7可知,灰色關聯度熱力圖可展示每個數據序列與其他數據序列的關聯度,該圖第一列為以負荷數據為參考序列所計算得到灰色關聯度?;疑P聯度越接近1,表明比較序列對參考序列的影響度越大。降水與電力負荷之間的關聯度為0.81,是負荷數據作為參考序列的最大關聯度,表明該地區相比其他因素,降水對負荷變化的影響程度最大。其他影響因素與負荷數據的關聯度分布在0.74~0.79之間,表明各影響因素對負荷變化影響程度接近。此外,本地氣壓與海平面氣壓、2 min風向與10 min風向、2 min風速與10 min風速的關聯系數分別為0.99、0.96和0.95,表明參考序列和比較序列之間關聯密切,變化趨勢幾乎一致。

使用VMD算法將負荷數據分解為3個IMF,為更準確地針對每個IMF選擇合適影響因素作為預測模型的輸入,分別計算每個IMF與影響因素間的灰色關聯度。關聯度計算結果如表1所示。

表1 IMF分量灰色關聯度

針對天氣情況、小時、日、星期以及月份等信息,使用XGBoost算法計算對各IMF預測的重要性,重要性計算值如圖8所示。

圖8 部分輸入變量的預測重要性

由圖8可見,“時刻”與“月份”兩個輸入變量對于IMF~IMF3的預測重要性明顯高于其他輸入變量,且其余輸入變量的重要性計算值均低于11%,表明除“時刻”和“月份”兩個變量外,其余變量對各IMF預測的幫助十分有限。據此,針對不同IMF選擇的全部預測輸入數據如表2所示。

表2 各IMF對應預測輸入數據

由表2可知,通過CVS算法篩選后,不同IMF分量構建負荷預測模型時所需輸入數據不同,再進一步提升短時負荷預測精度的同時,也能有效剔除對負荷預測貢獻較低的數據,減小負荷預測模型的復雜度。

4.3 LSTM網絡參數的選取

使用Python語言,構建三層LSTM網絡,包含輸入層、隱藏層和輸出層。其中,隱藏層神經元個數為500。設置參數epouch=50,batchsize=70,并選擇在非穩態問題具有優良性能、計算效率高、所需內存小的Adam算法作為神經網絡優化器。

4.4 預測與比較分析

將數據樣本的70%作為訓練集,30%作為測試集,在同等條件下,分別運用RNN預測、LSTM預測、CVS+LSTM預測、EMD+CVS+LSTM預測以及VMD+CVS+LSTM預測共5種方法進行短期負荷預測。通過對比5種方法的預測效果,驗證所提出的基于變分模態分解和灰色關聯的短期負荷預測方法有效性。5種預測方法的總體預測效果如表3所示,并選取某日的數據繪制預測效果對比圖與預測相對誤差對比圖,如圖9和圖10所示。

表3 預測方法評價指標

圖9 預測效果對比

圖10 預測相對誤差對比

由表3可知,直接使用神經網絡進行短期負荷預測,均方根誤差和絕對平均誤差較大,表明預測效果欠佳。其中,LSTM網絡的預測精度相對于RNN有較大的提升,但預測結果仍具有較大誤差。使用信息分析或CVS算法對輸入變量進行篩選后,預測精度有進一步的提升。相比于互信息分析算法,基于提出的CVS算法選取負荷預測關鍵變量并結合使用LSTM進行預測,更能有效提高負荷預測精度,RMSE和MAE分別減少32.6%和15.5%,表明CVS算法能有效去除干擾信息,篩選出負荷預測所需的關鍵影響因素,同時提高預測精度。預測模型訓練輸入變量越少,訓練參數越少,需要的訓練時間越短,有利于未來在面對大數據的訓練過程中實現快速訓練,減少模型更新和維護所需時長。使用VMD算法后能夠使短期負荷預測的RMSE和MAE進一步降低,分別減少13.3%和9.9%,預測精度得到更多的提升,表明VMD算法能夠有效的挖掘并提取負荷數據的變化特征,提高負荷預測精度。

由圖9與圖10可知,直接使用RNN或LSTM神經網絡得到的負荷預測曲線對原始負荷曲線的擬合效果不佳,易出現較大偏差。使用CVS算法與神經網絡結合后有較好的改進效果,使用EMD或VMD信號分解算法可進一步提高負荷預測的精度。其中,使用VMD+CVS+LSTM算法的負荷預測曲線與原始負荷曲線變化的一致性最好,累計預測偏差最小。

根據EMD+CVS+LSTM與VMD+CVS+ LSTM兩種預測模型在某日連續24 h的預測對比結果如表4所示。

表4 24 h負荷預測對比

由表4可知,EMD+CVS+LSTM預測模型在這一天的平均絕對誤差為239.4 MW,VMD+CVS+ LSTM預測模型的平均絕對誤差為198.8 MW,表明使用所提出的負荷預測方法獲得的預測結果累計誤差更少,預測精度更高,且VMD+CVS+ LSTM模型的平均相對誤差為3.96%,能夠較好地滿足供電部門對負荷預測的精度需求,為電力系統長期穩定的運行提供幫助和指導。

5 結束語

針對復雜環境下短期負荷波動性、隨機性以及負荷預測影響因素選取困難等問題,建立基于變分模態分解和復合變量選取算法的短期負荷預測模型,實測分析結果表明:使用VMD分解將原始負荷數據分解成為多個本征模態函數,可有效避免EMD或EEMD方法的模態混疊,充分挖掘負荷數據潛在的變化規律;提出復合變量選取算法,充分考慮不同影響因素的特征,篩選關鍵影響因素,可減少模型訓練數據的復雜度,提高預測精度;使用LSTM網絡,能有效學習負荷數據時序序列特征,同時避免負荷預測模型構建過程中梯度消失等問題。比較傳統預測模型,提出方法具有更高的預測精度,可為電力系統制定發電計劃提供準確、可靠的依據。

猜你喜歡
變分模態負荷
逆擬變分不等式問題的相關研究
求解變分不等式的一種雙投影算法
關于一個約束變分問題的注記
一個擾動變分不等式的可解性
防止過負荷時距離保護誤動新判據
主動降負荷才是正經事
國內多模態教學研究回顧與展望
負荷跟蹤運行下反應堆一回路控制系統仿真與驗證
基于HHT和Prony算法的電力系統低頻振蕩模態識別
Savitzky-Golay在含沖擊負荷短期負荷預測中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合