?

基于多源異構數據融合的短期電力負荷預測

2023-10-29 01:31宋曉華牛東曉
計算機仿真 2023年9期
關鍵詞:異構結構化云圖

宋曉華,汪 鵬,牛東曉

(1. 華北電力大學經濟與管理學院,北京 102206;2. 新能源電力與低碳發展研究北京市重點實驗室(華北電力大學),北京 102206)

1 引言

短期電力負荷預測是指導電力交易、安排發電計劃的基礎,高精度的負荷預測對提升電網安全穩定經濟運行水平具有重要的作用,并且其負荷曲線變化對機組合理檢修以及設備采購生產也具有指導作用[1]。短期電力負荷預測精度受到氣象條件、節假日類型等多種因素的影響,其中氣象因素對其影響巨大,已被大量的研究和實踐驗證,因此,充分挖掘氣象因素所蘊含的信息價值,對提高預測精度具有重要作用。

目前,傳統預測方法和智能預測方法是學者針對短期電力負荷預測研究的兩類主要方法。傳統預測方法主要有趨勢外推[1]、時間序列[2]、回歸模型[3]等方法。智能預測方法主要有神經網絡[4-6]、支持向量機[7,8]、極限學習機[9]等。傳統預測方法模型較為簡單、模型參數固定,但難以對復雜的隨機和非線性影響因素進行建模。以神經網絡為代表的智能預測方法能夠實現線性、非線性的復雜映射,目前應用較為廣泛,取得了較好的預測結果。以上方法考慮的氣象因素主要包括氣溫、降雨、濕度、風速等因素10-12],數據類型為結構化數據[12]。隨著氣象大數據技術的快速發展,衛星云圖、地基云圖等非結構化云圖氣象數據越來越多地被應用到國民經濟的各個領域。云圖不僅能反映當前的天氣狀況,還能預示未來一段時間內的天氣變化。針對常規天氣變化,云圖可以補充結構化天氣因素所缺少的天氣演變信息,能夠超前反映當前天氣的變化趨勢。針對轉正性天氣變化,云圖可以及時修正結構化氣象數據與實際天氣狀態產生較大的偏差,能夠表達突變天氣的氣象特征。因此,通過對結構化、非結構化氣象數據的融合,可以將滯后的反映天氣狀態的非結構化氣象數據進行修正,獲得可以表征當前時刻真實天氣狀態的精確參數。利用融合得到的綜合氣象信息,預測模型可以更客觀地建立氣象數據與短期電力負荷之間復雜因果關系,極大提升短期電力負荷預測精度。

目前,大多數學者所研究的短期電力負荷預測方法集中于建立結構化氣象數據與負荷之間的因果關系,但僅通過結構化氣象數據進行建模丟失了非結構化氣象數據中蘊含的氣象演變信息,所構建模型無法體現出非結構化氣象數據對負荷變量的解釋能力。如何集成、挖掘多源異構數據來提升短期電力負荷預測精度是本文研究的重點。

衛星和地基云圖是兩種常見的非結構化云圖數據,從衛星可以獲得大尺度的云信息,但是這些數據是低分辨的,云圖分布范圍較大,難以反映小區域的云圖變化動態[13],無法滿足區域負荷預測對云圖空間尺度的要求。地基觀測設備獲取的云圖資料由于能反映云紋理、邊緣等微觀結構信息,適用于區域短期負荷預測對云圖的空間尺度要求。由此,本文選取地基云圖來表征云圖的進行研究,通過提取云圖關鍵特征信息,融合結構化氣象數據,形成影響短期負荷的綜合氣象數據。

卷積神經網絡[4]、Gabor過濾器[14]、對抗神經網絡[15]已經在圖像特征中得以應用。其中,Gabor過濾器有良好的局域性和方向性,能夠提取圖像多尺度多方向的局部結構特征[16],可以實現氣象云圖關鍵紋理特征的有效提取。

隨著人工智能相關技術的迅猛發展,以深度神經網絡為代表的深度學習方法逐漸在短期電力負荷預測中得以應用。循環神經網絡(Recurrent neural network,RNN)[17]是一種典型的深度神經網絡算法,RNN將神經元上一時刻的狀態輸入到當前時刻神經元中,實現對時間序列的有效處理,但是算法存在梯度爆炸或者梯度消失問題,無法有效處理長時間序列。長短期記憶(Long short-term memory,LSTM)神經網絡是RNN的改進算法,可以較好解決長序列輸入數據在訓練過程中的梯度消失和梯度爆炸問題。

從發展趨勢來看,短期電力負荷預測所面臨的數據已不再是純粹的氣溫、降雨、濕度、風速、日類型、歷史負荷等結構化數據,氣象云圖、天氣狀況等大量的非結構化數據亟需應用于到短期負荷預測模型中來。隨著非結構化數據信息越來越多,數據的收集和查找需要耗費大量的時間和精力[18],傳統的關系型數據庫管理技術無法更好地滿足數據管理的需要,亟需提出新的數據集成技術。

綜上所述,本文提出基于數據空間集成多源異構數據的短期電力負荷預測方法。首先,設計包含數據集成組件、數據空間組件、數據演化組件、數據輸出組件的短期電力負荷預測數據空間框架。其次,設計一種融合多源異構數據的短期電力負荷兩階段預測方法。第一階段:利用Gabor模型提取多方向、多尺度的云圖紋理特征。第二階段,建立融合多源異構數據的LSTM-XGBoost預測模型,將第一階段得到的云圖特征數據、結構化氣象數據、歷史負荷數據、日類型數據進行拼接作為LSTM的輸入,并引入極限梯度提升算法(eXtreme gradient boosting,XGBoost)增加正則化防止模型過擬合,進一步提升預測模型的魯棒性。

2 基于數據空間集成多源異構數據的短期電力負荷

2.1 短期電力負荷預測數據空間框架

短期負荷預測數據管理面臨的新挑戰促使了新數據管理技術的出現——數據空間。圖1是本文提出的短期電力負荷預測數據空間框架,解決短期電力負荷預測多源異構數據集成與管理問題。數據空間主要包括四個部分:數據集成組件、數據空間組件、數據演化組件、數據輸出組件。

圖1 短期電力負荷預測數據空間框架

1)數據集成組件:主要負責數據源管理,對來自SCADA、網頁、XMl、文本的多源異構數據進行集成和管理。通過建立適配器數據接口,接納不同類型的數據源,并對數據對象的數據格式進行規范,完成數據抽取工作。例如,當需要集成地基氣象云圖時,相應的適配器會自動將地基云圖的時間、采集器編號、云圖高度、云圖圖片等信息抽取出來,用這些信息標識該數據對象。

2)數據空間組件:該組件是數據空間的核心,主要負責結構化、非結構化數據的多源存儲、關系索引、事務查詢、安全訪問等,是短期電力負荷預測數據空間設計和開發的核心部分。

3)數據演化組件:包括數據模式的提取、數據邏輯關系的發現、數據重要性及相關性等級的自適應計算、時間戳管理等,其目的是提高數據空間數據收集和查詢操作的效率。

4)數據輸出組件:數據輸出組件是對外實現高質、高品、高效的數據服務。主要包括數據共享、分級、推送和提醒等。通過數據共享技術、數據查詢算法和智能排序算法提高數據輸出組件的服務能力。

2.2 基于Gabor-LSTM-XGboost兩階段預測模型

本文設計一種融合多源異構數據的短期電力負荷兩階段預測方法。

第一階段:設計基于Gabor的云圖特征提取及編碼模型。云圖由天空和云層構成,二者具有不同的不同的大小和尺寸,分布于不同的空間位置。因此,從多個尺度、多個層次進行云圖特征提取,有助于增強云圖關鍵特征的完備性和鑒別能力。另外,云的紋理具有平整與起伏、粗糙與平滑、規則與雜亂等多種情況,云圖紋理特征展現出不同的方向性。由于Gabor具有強大的尺度和方向信息獲取能力,能夠有效提取云圖天空背景和云層對象的復雜紋理變化特征。

第二階段:建立融合多源異構數據的LSTM-XGBoost預測模型。將第一階段得到的云圖特征數據、結構化氣象數據、歷史負荷數據、日類型數據進行拼接,將拼接得到的數據集作為LSTM的輸入。同時,引入XGBoost增加正則化,保證模型訓練不過擬合。

2.1.1 第一階段:基于Gabor云圖特征提取及編碼模型

Gabor濾波器可以在空間尺度實現局部紋理特征的有效提取,其實質是以高斯函數為窗函數進行短時的傅立葉變換。在空域中,二維Gabor濾波器通過由高斯包絡調制的正弦平面波,對二維平面信息進行頻率局部、定向的計算分析,從而實現圖像紋理信息的提取。

通過對云圖特點分析,本文將具有多方向、多尺度特征提取能力的Gabor濾波器作為云圖特征提取算法。具體設計為:①方向參數調整。通過設定不同的方向參數,提取獲得云層不同方向的紋理走向特征和邊緣信息。②尺度參數調整。通過設定不同的尺度參數,提取獲得云層不同尺度的關鍵局部特征。二維Gabor濾波器核函數的復數形式為

(1)

(2)

假設云圖圖像為I(x,y),將Gabor濾波器形成的8個方向、5個尺度的濾波器組記為Gμ,v(x,y),則I(x,y)和Gabor函數Gμ,v進行卷積為

Oμ,v(z)=I(z)*Gμ,v(x,y)

(3)

式中:Oμ,v(z)為卷積結果,*為卷積算子,z=(x,y)。

幅值信息反映了云圖圖像能量譜,采用卷積圖像幅值響應作為輸出特征

(4)

式中,real(Oμ,v(z))和imag(Oμ,v(z))分別為Gabor和云圖卷積運算結果的實部和虛部。

目前單幅經過Gabor濾波器5個尺度、8個方向的特征提取,云圖擴增到40幅特征圖,擴增圖存在冗余信息,直接融合結構化氣象數據,會產生巨大的計算工作量與復雜度,考慮Gabor特征的二次提取。

對云圖中每個像素點的Gabor特征值進行編碼運算,獲得每個像素點5個尺度和8個方向幅值。每個像素點的矩陣形式為

(5)

式中,cij表示第i個尺度,第j個方向的幅值。為進一步增強Gabor方向紋理特征的顯著性,對Mpixel的幅值在8個不同方向執行標準化處理操作,并沿在同一方向不同尺度進行最大值抑制運算

(6)

通過式(6)的操作,可以獲得不同尺度下Gabor幅值反饋的最大值,從而確定不同尺度下單個像素點的關鍵最優特征。

設每幅云圖包含N個像素點,對所有像素點都進行非極大值抑制運算,得到N個幅值矩陣,然后對所有幅值矩陣計算平均值,得矩陣

(7)

假設云圖圖像總共包含D1×D2個像素點,經過Gabor過濾器5個尺度、8個方向的卷積操作變換,可以獲取到40幅D1×D2分辨率的Gabor特征圖,此時的特征維數為D1×D2×5×8。單幅云圖經特征編碼后,最終輸出編碼特征的維數降為5×8。經過上述的計算操作,云圖特征得到大幅壓縮。

(8)

2.1.2 融合多源異構數據的LSTM-XGBoost預測模型

1)模型數據輸入

本文考慮的短期負荷預測的主要數據輸入包括氣象因素、日期類型和歷史負荷。氣象數據對于短期電力負荷的影響主要體現在預測時刻的氣象狀況以及演變趨勢。日期類型也是影響短期電力負荷的重要因素,負荷曲線在不同的日期類型具有不同的形態。例如,工業企業的用電負荷曲線在周內(工作日)、周末和節假日(非工作日)會有較大的差異。此外,大量的研究表明,歷史負荷變化也對當前負荷具有重要影響。綜上,本文將氣象因素、日期因素、歷史負荷因素作為模型的數據輸入;具體而言:將結構化氣象數據、第一階段處理后的非結構化氣象數據、歷史負荷、日期類型數據等進行樣本拼接,形成預測模型的輸入,具體描述如表1所示。

表1 預測模型影響因素輸入

2)LSTM模型原理

LSTM在RNN基礎上增加控制門,主要的類型為三類:Forget Gate (遺忘門)、Input Gate(輸入門)、Output Gate (輸出門),LSTM的結構如圖2所示。

圖2 LSTM模型結構

遺忘門以一定的概率忘記部分信息,并將當前序列和上一序列的隱藏狀態作為輸入,并利用激活函數進行映射,得到對應的輸出,如式(9)所示。

ft=σ(Wfht-1+Ufxt+bf)

(9)

其中,σ為激活函數,Wf為隱藏層到門的權重,Uf為輸入層到門的權重,bf為偏執向量。

輸入門的主要功能是處理神經網絡的輸入信息,通??梢圆捎肧igmoid和tanh兩種激活函數。如式(10)、(11)所示。

it=σ(Wihi-1+Uixt+bi)

(10)

at=tanh(Waht-1+Uaxt+ba)

(11)

更新神經元信息由兩步組成:第一步,將Ct-1與遺忘門函數進行乘積運算;第二步是Sigmoid激活函數的輸出it和tanh激活函數的輸出at進行乘積運算,表達式為

Ct=Ct-1ft+itat

(12)

輸出門控制得到得神經網絡得輸出

ht=ottanh(Ct)

(13)

3)XGBoost模型原理

本文設定XGBoost算法的目標函數為

(14)

其中,Ω(fk)如式(15)所示。

(15)

(16)

式中,gi、hi、Ω(ft)可以表達為

(17)

(18)

(19)

得到葉子節點權重公式為

(20)

Gj、Hj分別表示一階導數和二階導數在葉子節點i的值。將上式代入式(15),可以得到目標函數的最優解:

(21)

4)模型預測誤差

本文采用平均絕對百分比誤差yMAPE和根均方誤差yRMSE兩種誤差評價指標對預測模型的優劣進行評估。上述兩者的計算值越小,就表示負荷預測結果越準確。

(22)

(23)

n為預測結果的總個數;yreal(i)、yfore(i)為第i個時刻的負荷的實際值和預測值。

3 算例分析

選擇我國西部某地區電網2020年1月-12月的氣象、負荷作為算例分析的基礎數據,并且基于所設計的數據空間框架對多源異構數據集成管理。仿真硬件環境為:Intel(R) Core(TM) i7 CPU,4 GB RAM,500 G 硬盤。軟件環境為:Windows 7操作系統,Spyder(Python 3.8)。

1)Gabor云圖特征提取及編碼

本文選擇在上述時段內采用面陣列掃描測云儀器(WSIRCMS)晝夜連續拍攝高分辨率云圖。單張云圖的分辨率大小為256×256。設定提取尺度為5、方向為8,經過計算得到40個濾波器的實部、虛部過濾器分別如圖3、4所示。

圖3 5個尺度8個方向的Gabor濾波器實部

圖4 5個尺度8個方向的Gabor濾波器虛部

選取2020年8月11日15點云圖進行Gabor特征提取,經過黑白處理的地基云圖如圖5所示,Gabor提取得到的云圖紋理特征圖如圖6所示。

圖5 黑白處理后的地基云圖

圖6 Gabor濾波器提取的云圖紋理特征圖

由圖6,白色高亮部分為天空區域,黑色高亮部分為云層區域,Gabor濾波器組強化了藍色天空與云圖的邊緣紋理信息,較好地提取出了該云圖的紋理特征信息,實現了云圖特征級數據增強。

根據本文提出的特征融合方法,對多個Gabor過濾器提取的云圖進行特征編碼,得到1×40的特征編碼矩陣為

V=[0,0.71,0.98,…,0.18]

2)融合多源異構數據的LSTM-XGBoost預測

為了驗證本文所提出的基于Gabor-LSTM-XGboost兩階段模型(M1)的預測效果,將不考慮非結構化氣象云圖數據的基于LSTM-XGboost方法(M2)和不考慮正則化的基于Gabor-LSTM方法(M3)的預測結果與M1進行對比分析,并通過上文所提到的MAPE和RMSE兩個指標來評價模型的預測精度。

圖7為2020年8月8日-10日當天三個模型的預測值與實際值的對比曲線,其中M為實際負荷變化曲線,M1為融合異構氣象數據基于Gabor-LSTM-XGboost兩階段模型的負荷預測曲線,M2為不考慮非結構化氣象云圖數據的基于LSTM-XGboost負荷預測模型的預測曲線,M3為不考慮正則化基于Gabor-LSTM負荷預測模型的預測曲線。

圖7 模型預測結果

從圖7可知,本文提出的M1模型預測對實際曲線的擬合結果較M2、M3更好,結果表明,融合異構氣象數據和采用XGBoot正則化能夠更好地實現對偏差結果的修正。

為了更加清晰直觀地對比M1、M2、M3模型的預測效果,分別計算三個模型的MAPE和RMSE,結果如表2所示。

表2 不同預測模型的結果比較

由表2,M1預測結果的MAPE在0.0072-0.009之間,RMSE在61.33-66.39之間,且M1的MAPE、RMSE均小于M2和M3。本文提出方法的結果相較于其它兩種方法預測誤差較低。

為了驗證M1模型對突變天氣的負荷預測精度,本文選擇8月11日進行預測分析,結果如圖8所示。

圖8 8月11日模型預測結果

圖8(b)為圖8(a)在15:00-22:00的放大圖。由圖8(a)可以看出,M1和M3的預測結果相較于M2更接近實際值,M2模型預測結果在峰荷、谷荷部分與實際值存在著一定的偏差。本文所提出的方法整體具有良好的預測效果。由圖8(b)可以看出,局部范圍內,實際負荷在17點達到峰值,一直持續到19時,負荷驟降的主要原因:該地區16點40分左右出現大面積卷積云,17時形成典型局地強對流天氣,短時內出現大風和降雨,引起電力負荷驟降。圖8(b)中M1、M3模型與實際負荷變化趨勢吻合,M2模型的預測負荷在19時稍微增加,與實際下降趨勢相反,產生較大的預測誤差。三個模型預測結果差異的主要原因:M1、M2較好地學習了局地強對流天氣產生前的積雨云特征,及時對修正了滯后的非結構化氣象數據,確保了預測模型所需的綜合氣象因素數據的有效性。M3僅考慮通過天氣預報數據獲取到的溫度、風速等非結構氣象數據,面對突變天氣狀況,非結構化的氣象數據難以得到及時修正,負荷預測結果仍基于滯后的非結構氣象數據,預測結果會出現較大偏差。M1預測模型能較為準確地擬合突變天氣下負荷變化趨勢,進一步驗證了本文所提方法的有效性。

4 結論

本文設計了短期電力負荷預測數據空間框架,提出了一種融合異構氣象數據的Gabor-LSTM-XGboost兩階段預測模型,并以我國西部某地區電網的氣象、日類型、負荷作為基礎數據,進行算例分析,得出如下結論:

1)設計了包含數據集成引擎、數據空間引擎、數據演化引擎、數據輸出引擎、負荷預測模型引擎的短期電力負荷預測數據空間框架,解決了多源異構數據收集和查找的難題。

2)將融合異構氣象數據作為預測模型的輸入,充分發揮了Gabor過濾器對云圖關鍵特征提取優勢,能夠從多源異構氣象信息中挖掘出更多有效信息。

3)與單一模型相比,本文提出的融合多源異構數據的Gabor-LSTM-XGboost兩階段預測模型綜合了三種模型的優點,模型計算過程不復雜,且負荷預測精度能夠得到有效提升。此外,預測模型能夠有效學習突變天氣特征,提高突變天氣下的電力負荷預測精度。

猜你喜歡
異構結構化云圖
試論同課異構之“同”與“異”
促進知識結構化的主題式復習初探
結構化面試方法在研究生復試中的應用
成都云圖控股股份有限公司
黃強先生作品《雨后松云圖》
異構醇醚在超濃縮洗衣液中的應用探索
overlay SDN實現異構兼容的關鍵技術
基于TV-L1分解的紅外云圖超分辨率算法
LTE異構網技術與組網研究
基于圖模型的通用半結構化數據檢索
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合