?

融合聚類-卷積-門循環的居民用電短期負荷預測方法

2023-02-02 09:19李坤奇孟潤泉李鳳蓮
太原理工大學學報 2023年1期
關鍵詞:用戶群用電聚類

李坤奇,孟潤泉,李鳳蓮

(太原理工大學 a.電氣與動力工程學院,b.信息與計算機學院,太原 030024)

在碳中和與新能源占比不斷提升的背景下,發電側和用電側的峰谷差逐年增大[1],居民用電短期負荷預測問題有著較高的研究價值。高效準確的負荷預測有助于電力系統調度工作的穩定性和經濟性[2],提升用電效率,減少能源浪費。在對居民用電負荷進行預測時,傳統方法是基于居民區整體的負荷數據進行預測[3]。但隨著智能電表的普及,用戶用電行為的數據精度更高、粒度更細、特征更多?;谟脩魧用娴纳疃葦祿诰蚩梢允诡A測模型學習到更多規律,有助于進一步提升負荷預測精度[4]。

對用戶進行聚類分析有助于提升負荷預測精度。如文獻[4-5]在建立預測模型前,根據用戶的用電行為特性,采用K-means聚類算法對用戶進行聚類分析,驗證了聚類分析在負荷預測任務中的可行性和有效性,有助于負荷預測模型學習到不同用戶群的用電趨勢信息。已有方法通常是對用電數據采用聚類分析得到用戶群信息后,針對每個用戶群分別建立預測模型,導致預測模型數量偏多,且各模型只能學習到相應用戶群的用電信息,無法學習到其他用戶群的用電信息,因此也無法獲取不同用戶群用電規律之間的潛在聯系。另外,K-means[6]以及層次聚類算法等為常用的時間序列聚類算法。K-means算法簡潔高效,但算法性能易受初始聚類中心的影響。BIRCH算法屬于層次聚類算法,其性能不受初始聚類中心影響,通過生成一棵具有層次結構的聚類特征樹,聚類結果有更好的可解釋性,且性能更優,靈活性更強[7]。因此,為克服已有方法缺陷,本文提出了一種基于BIRCH(balanced iterative reducing and clustering using hierarchies)聚類算法融合單預測模型的居民用電短期負荷預測方法,首先采用BIRCH聚類算法進行用戶用電量的聚類分析,以得到多個具有不同用電習慣的用戶群,挖掘不同用戶群的用電規律之間的潛在聯系,構建可更精確反映用戶用電特性的多特征時間序列用電數據,為后續預測模型構建提供更優質的特征屬性數據,并有助于降低預測模型數量。

在居民用電負荷預測模型構建方面,目前用于短期負荷預測的方法主要包括指數平滑法[8]和多元線性回歸[9]等統計方法,以及分類和回歸(classification and regression tree,CART)決策樹、支持向量機(support vector machine,SVM)[10]、人工神經網絡(artificial neural network,ANN)和深度學習等機器學習方法。統計方法采用傳統的統計學思想,預測模型有較好的解釋性,但模型較為簡潔,在數據量較大的情況下無法充分利用數據中的非線性信息[11]。CART決策樹算法采用自頂向下遞歸結構建樹,較適合高維數據,但模型性能易偏向多值屬性數據,且忽略了屬性之間的相關性。SVM能較好地處理非線性問題,且泛化性能較好,但存在對大規模訓練樣本較難實施缺陷。人工神經網絡及基于神經網絡的各種深度學習模型,在非線性數據量較大的情況下,性能更優,近年來在負荷預測領域應用廣泛。

作為深度學習常用結構,CNN(convolutional neural network)是包含卷積計算的神經網絡,可高效實現輸入特征的提取,被廣泛應用于圖像識別、語音識別及居民用電量負荷預測等領域[12]。在居民用電預測領域,CNN在提取高維特征和壓縮時間窗上有較好效果。如文獻[13]在構建負荷預測模型之前,采用CNN網絡預先對輸入數據進行處理,取得了較高的預測精度。另一種常用結構是RNN(recurrent neural network),由于RNN在網絡中引入了循環結構,因此能更好地學習動態時間序列數據的時序特性,預測精度更高[14]。GRU(gated recurrent unit)[15]和LSTM(long-short term memory)[16]是RNN的兩種改進模型,由于添加了門結構,從而能更有效地挖掘時間序列包含的潛在規律。如文獻[17]將LSTM應用于單個居民用戶的短期負荷預測,取得了較高的預測精度。

針對上述研究現狀,本文提出了一種BIRCH聚類算法融合CNN-GRU預測模型的居民用電短期負荷預測方法(簡寫為BIRCH-CNN-GRU).所提出方法,首先基于BIRCH聚類算法對用戶用電數據進行聚類分析,以構建包含用戶群負荷數據的多特征時間序列數據集,接著進行CNN-GRU預測模型訓練,最后,基于居民用電公共數據集進行預測性能分析,驗證了本文方法的有效性。

1 居民用電短期負荷預測框架設計

1.1 居民用電短期負荷預測方法設計思路

(1)

圖1給出了本文提出的一種新型的居民用電短期負荷預測方法設計框架。

(2)

聚合后的負荷信息可以由式(3)表示:

(3)

基于聚合結果,將多個用戶群的負荷數據、融合時間以及氣候等特征信息,得到多特征時間序列數據集,用于后續預測模型訓練及性能測試。

相比于傳統方法,本方法的優勢在于:由于輸入數據中不僅有總負荷曲線,也有不同用戶群的負荷曲線。預測模型不僅可以學習到不同用戶群的用電規律,而且可以學習到不同用戶群用電趨勢之間的潛在聯系,因此預測精度更高,擬合速度較快,使得訓練模型的時效性更高。

圖1 BIRCH-CNN-GRU預測方法Fig.1 Methodology of BIRCH-CNN-GRU forecasting method

1.2 多特征時間序列數據集構建

除了歷史負荷數據外,居民用戶的用電行為與時間因素、氣候因素也有較強相關性[8]。季節、時刻、節假日等因素會顯著影響居民的用電行為,因此本方法采用月、日、星期、時刻、以及是否為節假日等5個時間變量。氣候因素的變化會影響居民用電需求。本方法選取與用電負荷相關性較高的平均溫度、平均濕度等兩個氣候變量。

綜上所述,本方法構建了包含時間變量、氣候變量以及負荷變量3種特征的居民用電數據集,具體如表1所示。

表1 多特征時間序列用電數據集結構Table 1 Multivariate time series dataset

2 融合BIRCH聚類算法及CNN-GRU預測模型的負荷預測方法

本文提出的BIRCH-CNN-GRU負荷預測方法融合了BIRCH聚類算法,以及CNN-GRU預測模型。其中BIRCH聚類算法用于對居民用電量進行聚類分析,對聚類分析后的用戶群用電量進一步融合時間以及氣候信息以得到居民用戶群用電數據特征,將用戶群用電特征數據劃分為訓練集、驗證集及測試集,其中訓練集用于構建CNN-GRU預測模型,驗證集用于對模型性能進行驗證及優化,并用測試集對模型性能進行評估。

2.1 基于BIRCH聚類算法的居民用電多用戶群構建

為了提高預測性能,本文采用BIRCH聚類算法結合最優輪廓系數準則尋優得到最佳居民用電用戶群數量。尋優時,將居民用電用戶群數量設置為一個動態尋優范圍,此處設置為[2,10],則BIRCH聚類算法分別運行9次,得到9組聚類結果,其中的最優輪廓系數對應的聚類數即為最佳居民用電用戶群數量。

聚類分析的具體步驟如下所示:

2) 歸一化。對平均日負荷用電量進行歸一化,以準確提取用戶的日內用電趨勢,避免不同用戶的用電總量差異對聚類結果產生影響。歸一化公式如式(4)所示。

(4)

3) 根據實際情況,設定聚類數目k的參數空間。對每一個聚類數目k,采用BIRCH聚類算法對數據集進行聚類分析,得出每一個聚類數目對應的聚類結果。

其中,BIRCH聚類算法特征樹的每個節點由包含3個元素的聚類特征(cluster feature,CF)表示,如式(5)所示。

(5)

式中:Nnodes為簇內樣本點的數量,對應本文為同一用戶群用戶數量。xn為樣本點的表征向量,對應本文為用戶n歸一化后的平均日負荷用電量。LS為簇內所有點的代數和,SS為簇內所有點的平方和。

4) 求各聚類結果的輪廓系數。輪廓系數S用于衡量聚類的效果,以確定最優聚類數。輪廓系數的計算方式如式(6)所示。

(6)

式中:Nnodes為樣本點的總數;a(i)用于量化簇內的凝聚度,即樣本i到簇內各樣本點距離的均值;b(i)用于量化簇間分離度,即樣本i到其他簇樣本點距離的均值。Ninside為樣本pi所在簇的樣本點個數,pj為樣本pi所在簇的其他樣本點;Noutside為樣本pi所在簇外的樣本個數,qj為樣本pi所在簇外的樣本點。

5) 采用最大輪廓系數對應的聚類數目k和聚類結果作為最優類簇數M和最終聚類結果,每個用戶歸屬于一個用戶群。輪廓系數越大,聚類效果越好,以本文實際應用為例,更大的輪廓系數代表用戶群內用戶的用電習慣更加相似,不同用戶群的用戶用電習慣更加不同。

6) 每個用戶群內,用戶的歷史負荷數據相加,匯總得到每個用戶群的歷史負荷用電量。

2.2 居民用電短期負荷CNN-GRU預測模型構建

為了對多特征時間序列用戶群數據進行充分學習,本文進一步提出了CNN-GRU居民用電量預測模型。模型結構主要包括CNN層、GRU層和全連接層,整體網絡結構如圖2所示。

模型中每層描述如下:

圖2 CNN-GRU網絡結構Fig.2 CNN-GRU architecture

1) CNN層。本模型的CNN層包含一個卷積層和一個池化層。卷積層用于挖掘各用戶群負荷數據與氣候和時間等變量之間的潛在關系,并提取高維特征。以M表示用戶群數量,則表征居民用電信息的輸入數據包含(8+M)個時間序列,每個時間序列包含48個時刻的歷史數據,因此單個輸入樣本為(8+M)×48的矩陣。卷積層通過U個卷積核,將居民用電信息映射為U個時間序列,輸出U×48的矩陣至池化層。之后池化層通過最大值池化將居民用電信息映射為U×24的矩陣,從而在保留有效信息的同時,壓縮時間序列的長度,減少后續GRU網絡的訓練時間。

2) GRU層。本模型搭建了雙層GRU結構,以充分學習居民用電負荷數據的時序特性?;贑NN層輸出的U×24的用電信息矩陣,由第一層GRU提取時序特性,并傳遞相同格式的用電信息矩陣至第二層GRU,第二層GRU再進一步提取時序信息后,由最后一步神經元輸出U×1格式的表征居民用電信息的向量至全連接層。

GRU單元的基本結構如圖3所示,數學描述如式(7)所示。在圖3中,箭頭所指方向為數據流動方向。

(7)

圖3和式(7)中,×為矩陣的數乘,σ為激活函數Sigmoid函數,tanh為激活函數,“1-”表示該鏈路向前傳播的數據為1-zt.zt和rt為更新門和重置門的輸出,xt為輸入,ht-1為上一隱藏層的輸出,ht為隱藏層的輸出。

圖3 GRU網絡基本單元Fig.3 GRU basic unit structure

3) 全連接層。包含V個神經元的全連接層對GRU網絡提取的居民用電信息做進一步非線性映射,最后由包含單個神經元的輸出層輸出負荷預測結果。全連接層及輸出層的計算公式如式(8)所示。

y=W1×V·σ(WV×U·hU×1+bV×1)+b1×1.

(8)

式中:y為居民用電負荷預測值,hU×1為GRU網絡輸出的表征居民用電信息的向量,WV×U和bV×1為全連接層的權重矩陣和偏置向量,W1×V和b1×1為輸出層的權重矩陣和偏置。

3 算例分析

為驗證所提負荷預測方法的可行性與精確性,本文選取愛爾蘭能源管理委員會(commission for energy regulation,CER)發布的公開數據集進行實例驗證[18],選取了數據集中3 639戶居民,自2009年8月1日至2010年12月31日,共17個月的數據。數據集被劃分為訓練集、驗證集和測試集。其中訓練集為2009年8月1日至2010年7月31日負荷數據,共365 天的數據,隨機取80%得到,剩余20%數據作為驗證集;測試集為2010年8月1日至2010年12月31日共153天的負荷數據。負荷數據采樣粒度為30 min.

本文使用訓練集對BIRCH-CNN-GRU 預測方法所用模型進行訓練,建立居民用電短期負荷預測模型,采用測試集對構建的模型性能進行測試及評價。每個輸入樣本的時間窗長度為24 h,相應的輸出樣本為1 h后的總負荷值。

同時,將預測結果與相同條件下ANN、CNN、CNN-GRU在訓練時間與預測精度維度等方面進行比較,以驗證模型效果。其中ANN模型由3層全連接層構成,CNN模型由3層CNN單元和2層全連接層構成,CNN-GRU模型采用2.2節所提出的思路搭建,其中卷積層卷積核數U、GRU每層神經元數W、全連接層神經元數V分別設置為128、32、32.

3.1 實驗環境配置

本文實驗環境采用Intel i5-8265U處理器,Intel UHD Graphics 620顯卡。采用Python3.6作為編程語言,深度學習架構基于Tensorflow框架以及Scikit-learn機器學習庫,繪圖工具采用Matplotlib繪圖庫。

3.2 實驗評價指標

為了評估所提出方法的預測性能,以平均絕對百分比誤差MAPE、均方根誤差RMSE為評價指標。計算方法如式(9)-(10)所示。

(9)

(10)

式中:n為測試樣本個數;Xact(i)和Xpred(i)分別為第i時刻的用電負荷電量真實值和預測值。

3.3 用戶群聚類分析

對3 639戶居民的平均日負荷用電量進行BIRCH聚類分析,當聚類數增大時,輪廓系數的變化趨勢如圖4所示。當聚類類別數為2和3時輪廓系數較大,即聚類效果較好。為保留更多的用戶用電信息,我們設定聚類類別數為3,并根據聚類結果將3 639戶居民數據劃分為3類,得到3個用戶群的用戶數分別為1 163、2 274、202個。各用戶群的平均負荷曲線如圖5所示??梢钥闯?,不同用戶群的用電模式有明顯區別。

圖4 不同聚類類別數的輪廓系數結果Fig.4 Silhouette scores of different cluster number

3.4 預測結果分析

表2為各模型在2010年8月到12月連續5個月的日負荷預測結果。本文所提方法的MAPE和RMSE分別為2.932 1%和78.973 9 kWh.通過比較本文提出的BIRCH-CNN-GRU方法與ANN模型、CNN模型、CNN-GRU模型的預測結果,可知本文所提方法在2項精度指標上都有明顯優勢,MAPE平均值分別降低了24.33%,18.01%,16.74%,RMSE分別降低了20.53%,12.43%,16.73%.

圖5 2010年9月1日至3日各用戶群平均負荷曲線Fig.5 Average load curve of each user-group from September 1 to 3, 2010

表2 負荷預測結果對比Table 2 Prediction performance comparison over test data

為了更直觀顯示本文所提出模型及對照組模型的預測效果,以2010年9月1日為例繪制實際負荷曲線及預測負荷曲線的對比圖如圖6所示??梢钥闯?,與其他幾種對比模型相比,本文方法預測負荷曲線與實際負荷曲線更接近。

圖6 2010年9月1日預測結果Fig.6 Prediction results on September 1, 2010

此外,繪制前150個時期(Epoch)的訓練過程中的誤差下降曲線,縱軸為RMSE,橫軸為時期,如圖7所示??梢钥闯?,相比于其他3種方法,BIRCH-CNN-GRU方法的收斂速度更快,即子用戶群的用電趨勢信息有助于提升模型擬合速度。

圖7 模型訓練過程中的誤差變化趨勢分析Fig.7 Error variation trend analysis during model training

4 結束語

本文提出了一種BIRCH聚類算法融合CNN-GRU預測模型的居民用電短期負荷預測方法。所提出方法可以更充分地利用智能電表提供的歷史負荷數據,有更高的預測精度?;趯嶋H數據集的算例顯示,本方法相比于ANN、CNN、CNN-GRU等方法,在預測精度層面有明顯優勢。未來主要從以下兩個方向展開研究為:

1) 本文只考慮了單點預測和單步預測。但是在自動化調度過程中,概率預測和多步預測可以為自動化調度策略提供更多的依據。因此未來的工作將探索基于本方法的概率預測和多步預測。

2) 本方法目前只考慮了用戶的負荷特征,沒有考慮用戶的其他特征。由于智能電表收集的信息越來越多樣化,下一步將研究更多的用戶信息加入到特征集中,并對預測模型性能進行進一步改進優化,以進一步提升負荷預測精度。

猜你喜歡
用戶群用電聚類
基于協同過濾和Embedding的冷啟動推薦算法研究
用煤用電用氣保障工作的通知
安全用電知識多
從資源出發的面向用戶群的高校圖書館資源推薦模型分析
基于K-means聚類的車-地無線通信場強研究
為生活用電加“保險”
用電安全要注意
基于高斯混合聚類的陣列干涉SAR三維成像
一種層次初始的聚類個數自適應的聚類方法研究
公共圖書館的用戶群和服務人員的分析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合