?

計及時空分布特性的光-荷典型場景提取方法

2024-03-15 13:52鐘富城王星華黎子律張嵐麒楊煒康黃祥源趙卓立
廣東電力 2024年2期
關鍵詞:饋線出力典型

鐘富城,王星華,黎子律,張嵐麒,楊煒康,黃祥源,趙卓立

(廣東工業大學 自動化學院,廣東 廣州 510006)

隨著我國“雙碳”目標以及屋頂光伏整縣工作的推進,越來越多的屋頂分布式光伏接入配電網中[1-3]。分布式光伏出力隨機性較大,與氣象條件有著很強的相關性。分布式光伏對配電網的高滲透率會對電力系統的調度優化控制提出更高的要求[4-5]。準確描述含大規模分布式光伏的配電網光伏、負荷典型日運行場景,是提升光伏就地消納能力與配電網安全可靠運行能力的前提。

典型場景法是當前描述含不確定性光伏出力運行場景的主要手段,其主要分為數學統計學和聚類方法2種?;诟怕拭芏群瘮档姆椒ɡ脭祵W統計方法對歷史光伏、負荷數據進行處理,得出滿足歷史光伏、負荷數據分布特性的公式或曲線:文獻[6]利用蒙特卡洛抽樣法生成光伏發電中的隨機分量,結合理想出力歸一化曲線與隨機分量生成光伏發電序列;文獻[7]利用copula函數構建光伏-風電相關性模型后,采用改進的拉丁超立方抽樣法生成大量光伏-風電場景,最后結合k-means聚類法完成典型場景生成;文獻[8]基于copula理論構建出符合歷史分布特性的光伏和負荷的關聯公式,從而完成光-荷聯合,根據關聯公式為含光伏的配電網提供規劃參考?;诰垲惙治龅姆椒ㄊ且环N實現簇內相似度更大和簇間相似度更小,以揭示樣本之間內在性質的算法:文獻[9]利用k-means聚類算法分別對各節點的負荷、光伏和風電數據進行聚類,并以聚類中心作為該節點的典型場景;文獻[10]基于局部密度中心的聚類算法對光伏歷史出力數據進行聚類分析,以聚類中心為典型出力場景,再利用copula函數建立描述典型場景間相關性的公式。

以上方法在對單一節點的典型場景生成時有較好的效果,但未能很好地考慮配電網中各臺區節點之間光伏出力、負荷功率之間的時間和空間分布特性。因此本文提出一種計及時空分布特性的光-荷典型場景提取方法,考慮配電網的空間拓撲結構,建立計及節點負荷時空分布特性且能整體反映光伏、負荷日場景的描述矩陣,并基于拉普拉斯特征映射(Laplacian eigenmaps,LE)和高斯混合模型(Gaussian mixture model,GMM)估計,完成光-荷典型日場景提取,生成能為配電網的運行調度和規劃等工作提供參考的光-荷典型日場景。

1 基于LE矩陣降維

為了能一次性建立整個中壓配電網或一整條饋線上所有臺區的光伏、負荷典型場景,避免每次只能單獨形成1個臺區典型場景的缺點,本文提出基于LE及GMM的計及時空分布特性的光-荷典型場景聯合方法。主要步驟如圖1所示。

圖1 本文所提方法主要步驟Fig.1 Main steps of the proposed method

1.1 光-荷日運行場景描述矩陣

本文所需數據為完整1年中每日24 h各時刻的光伏、負荷數據。利用3次樣條插值法[11]對缺失少量數據的日期進行填充,并舍棄缺失過多數據的日期,最終得到1年中具備完整24 h光伏、負荷運行數據的日期,保證形成的日運行場景描述矩陣之間行、列完整且相同,便于后續計算矩陣的降維和概率密度時,避免由于矩陣結構不一致帶來的降維值不可用的影響。

圖2所示為1個已知拓撲結構的中壓配電網(其中PV表示光伏),共有10個負荷節點,其中有4個節點有光伏接入。

圖2 配電網拓撲結構示意圖Fig.2 Schematic diagram of distribution network topology

根據圖2建立光伏、負荷的日場景矩陣描述,如下:

(1)

式中:p為光伏出力或負荷功率;下標n表示節點編號。日場景描述矩陣的每1列表示1個節點,每1行表示節點采樣時刻記錄的出力數據。分別建立能夠反映配電網時間斷面下負荷、光伏出力節點分布情況的日運行場景,將整個配電網或整條饋線所有臺區的場景都包含在描述矩陣中。該場景描述矩陣的每行之間很好地體現了各節點光伏出力和負荷水平的時序相關性特征,每列之間很好地體現了各節點之間的空間相關性。

此外,這種光伏、負荷日場景描述矩陣通過新增列數或建立新的矩陣來描述同一配電網結構中光伏、負荷節點新增的情況,不僅可以很好地反映配電網光伏、負荷的時空分布特性,且充分考慮了二者的增長特性。

1.2 基于LE的矩陣降維

由于光伏、負荷日場景描述矩陣的每行、每列之間包含了節點之間光伏出力、負荷功率的時序相關性和空間相關性特征[12-14],若簡單使用投影類型降維法(如將三維矩陣投影到二維平面),則在整體上丟棄了某個維度的信息特征,使矩陣信息失真過大而失去參考價值。為保留描述矩陣的流形結構特征,且不過多丟失矩陣的重要信息,應避免選用投影類降維法。本文選用基于流形學習的LE法來描述矩陣的降維要求。

LE是運用圖拉普拉斯概念來計算高維特征集的低維流形表示的非線性流形學習降維算法[15-16],其實質是找到平均意義上保持數據點局部鄰近信息的特征表示。LE算法所產生的映射可以看作是對幾何流形的一種連續離散逼近的映射,用數據點的鄰域圖來近似表示流形,并用Laplace-Beltrami算子近似表示鄰域圖的權值矩陣,可實現高維流形的最優嵌入。其基本實現步驟如下:

步驟1,構建圖。對于1個矩陣內部的數值,將每個數據點與近鄰的k個數據點連線,其中k為預先設定的值,由此將所有的數據點連接構建1個圖。

步驟2,確定權重。確定數據點之間連線的權重大小,構成鄰接矩陣Wij;若點i和點j相連,則二者關系的權重設定如下:

(2)

步驟3,構建拉普拉斯矩陣。定義對角矩陣D,對角線上(i,i)位置元素等于矩陣Wij的第i行之和。則拉普拉斯矩陣L=D-Wij。

步驟4,確定目標函數。為了讓樣本yi和yj在降維后的子空間里盡量接近,優化目標函數為min∑‖yi-yj‖2wij,wij為i和j之間的權重值;利用Lagrange乘子法將目標函數化簡為Lyi=λDyj。

步驟5,特征映射。計算拉普拉斯矩陣L的特征向量與特征值λ:Lyi=λDyj,其中Dyj為步驟3中D的yj樣本矩陣,Lyi為yi樣本矩陣,使用最小的m個非零特征值對應的特征向量Ly作為降維后的結果輸出。

由于后文高斯混合模型在處理高維數據時計算復雜度急劇增加,且容易出現維度災難問題,導致估計結果不準確,而其對一維數據的估計效果是最佳的,所以本文對24行n列的矩陣降維到一維,再分別組成用于高斯混合模型計算的光伏、負荷矩陣降維值的數據集。由于每個矩陣內部都呈現不一樣的流形結構,對每個矩陣做相同降維處理后的數值仍能表征矩陣的流形結構差異。

2 基于GMM的典型場景提取

GMM是一種常用的概率模型,用于對具有未知或復雜分布的數據進行建模,從而計算其數據分布特征,最終基于多個高斯分布的線性組合來描述數據的概率分布[17-19]。對于LE形成的光伏、負荷矩陣降維值數據集,由于內部降維值的分布特征未知,可認為其總體分布中含有K個子分布概率模型。針對數據分布特征未知的數據集,為了準確得出矩陣降維值數據分布特征,本文采用GMM進行計算,其數學表達式如式(3)所示:

(3)

高斯密度函數

(4)

GMM的計算具體步驟如下:

步驟1,初始化。假定數據集內部共有K種子分布,隨機初始化每種分布的均值、協方差和權重參數。

步驟2,期待步驟。根據當前模型參數,計算每個數據點屬于每個分布的后驗概率,然后使用參數的當前估計評估似然函數。

步驟3,最大化步驟。根據期待步驟的結果更新模型參數,即通過最大化似然函數來調整每個高斯分布的均值、協方差矩陣和權重系數。

步驟4,重復步驟3,直至模型收斂或達到預定的迭代次數。

步驟5,根據訓練好的模型參數可視化處理模型。

對于光伏、負荷的日場景描述矩陣的降維值數據集,使用上述GMM計算,即可分別得出光伏、負荷日場景的概率分布情況,并選取光伏、負荷數據集中概率密度較大的場景作為候選典型場景集。

2.2 基于Wasserstein距離的典型場景提取

在初步完成典型場景候選集識別后,為了減少候選集場景中雖然滿足概率閾值要求但場景矩陣內部數據分布差別不大的場景數量,提高典型場景的代表性,本文利用Wasserstein距離指標來衡量候選典型場景集之間的相似程度[20-21],并最終舍棄部分雖然滿足概率閾值要求但相似性較大的冗余場景,得出具有高度代表性并與其他典型日場景有較大區別的典型日場景。

Wasserstein距離可以用來衡量2個分布的相似程度,數據從分布p移動成分布q所移動距離的最小值即為2個分布間的Wasserstein距離。本文利用Wasserstein距離衡量矩陣之間的相似程度,2個矩陣之間的Wasserstein距離越小表明矩陣間的相似程度越高,其公式如下:

(5)

式中:Π(p,q)為分布p和q組合起來的所有可能的聯合分布的集合,對于每一個可能的聯合分布γ,可以從中采樣得到任一對樣本(x,y),并計算出這對樣本的距離。最終計算出該聯合分布γ下,樣本對距離的期望值Ex,y~γ(‖x-y‖)。在所有可能的聯合分布中能夠對這個期望值取到的下界就是2個分布間的Wasserstein距離。

在本文中,若2個候選場景集矩陣間的Wasserstein距離過小,表示2個日場景描述矩陣比較相似,應取其中概率密度更高的作為典型場景。具體Wasserstein距離下限的設置,可在1年的光伏典型場景數量5~10個、負荷典型場景數量7~12個的規模之間進行調整,這樣的光-荷典型場景規模比較適合配電網運行規劃[22-24]。

3 算例分析

為了驗證本文方法的有效性,選取廣東省清遠地區某條含光伏接入的10 kV饋線2021年的光伏、負荷運行數據進行實驗仿真。該饋線共有10個負荷節點,其中包含4個光伏節點,拓撲結構如圖2所示,各臺區節點容量見表1。

表1 各節點變壓器容量及光伏裝機容量Tab.1 Transformer capacity and PV installed capacity at each node

首先對所有收集到的運行數據進行預處理,按上文所述方法填充部分缺失值,舍棄缺失值過多的日期。進而按照該配電網的拓撲結構分別建立光伏、負荷近1年運行日的日場景描述矩陣。

3.1 典型場景提取

本文使用PyCharm集成開發環境進行實驗仿真。LE鄰域值設置為3,維數設置為1;混合高斯分布K值初始化設置為5。首先分別對光伏、負荷的日場景描述矩陣進行降維處理得到光伏、負荷降維值數據集;隨后利用GMM分別計算2個數據集的概率密度分布情況,得到結果如圖3、圖4所示。

圖3 光伏典型日場景的概率分布Fig.3 Probability distribution in typical PV daily scenarios

圖4 負荷典型日場景的概率分布Fig.4 Probability distribution in typical load daily scenarios

由圖3可以提取出光伏候選典型場景矩陣7個(記為Top1—Top7),Top6和Top7僅占4.75%,故予舍棄。剩下5個候選場景在經過Wasserstein距離指標篩選后,最終確定為饋線的5個光伏典型日場景矩陣。由圖4可以提取出負荷候選典型場景矩陣6個(記為Top1—Top6),經過Waserstein距離指標篩選后最終確定為饋線的6個負荷典型日場景矩陣。

圖5和圖6分別為所提取的該饋線全節點光伏、負荷概率最大的典型日場景1曲面圖。使用平滑的曲面將矩陣列數(節點編號)形成的曲線相連,能更直觀地看出整個場景描述矩陣中各點之間的關聯性。在投影到二維平面后能直觀看出各光伏、負荷節點在哪些時間點普遍出力較多或較少等情況,更適合規劃人員對整個配電網運行場景的全面把控。

圖5 該饋線全節點光伏典型日場景1曲面圖Fig.5 Surface diagram of full feeder nodes in typical PV daily scenario 1

圖6 該饋線全節點負荷典型日場景1曲面圖Fig.6 Surface diagram of full feeder nodes in typical load daily scenario 1

由圖5可以看出,該饋線某個典型場景的節點在10—15時段光伏出力最大最集中,且由于第3列(5號節點)光伏裝機容量最大,其光伏出力值最大。由圖6可以看出,該典型場景下負荷節點用電高峰期也集中于10—15時段,與光伏出力高峰期接近。由圖4得到的全年6個負荷典型場景得知,每個負荷節點的最高峰時期也基本在9—17時段,基本與全年5個光伏典型日場景的出力高峰重合,可知該饋線有更高的運行穩定性。

3.2 不同方法生成的典型日曲線對比

為了突出本文方法識別典型場景的優點,利用廣東某城市配電網數據組成的日場景矩陣,對比使用本文基于LE-GMM的典型場景提取法、k-means聚類法和拉丁超立方采樣法生成的典型場景與實際運行場景,結果表明本文方法速度最快,誤差最小,更貼近實際運行場景。

對于上述含有10個負荷節點且其中4個包含光伏出力的中壓饋線,使用這3種方法得到的典型日場景與饋線后續2個月內實際日運行場景擬合度對比的誤差曲線如圖7、圖8所示。其中k-means聚類方法使用手肘法得到的光伏典型場景最佳聚類數為7,負荷典型場景最佳聚類數為11;拉丁超立方采樣得到的光伏、負荷典型日場景數分別為10和11。對整個配電網所有節點全年數據進行典型場景生成,3種方法所使用的時間和誤差見表2。

表2 不同方法生成典型場景對比Tab.2 Comparisons of generating typical scenarios using different methods

圖7 饋線全節點光伏典型場景誤差曲線Fig.7 Typical PV scenario error curves of feeder full nodes

圖8 饋線全節點負荷典型場景誤差曲線Fig.8 Typical load scenario error curves of feeder full nodes

從表2可以看出,在對整個配電網所有臺區光伏和負荷典型場景提取上本文方法所用時間最短,平均誤差最小,生成的場景個數更少,能達到更好的效果。

選取最能擬合配電網或饋線各節點真實運行場景的典型場景法,才能準確地為配電網的短期運行調度、發電計劃調整以及規劃優化等提供可靠參考,這樣才具有典型場景生成的現實意義。

4 結論

a)k-means聚類方法的核心是用歐氏距離衡量數據對象間的相似度,對數據進行類別劃分并找出聚類中心。但在本文構造的日運行場景描述矩陣中,若只簡單使用歐氏距離來衡量矩陣中各行或各列數值之間的歐氏距離,則無法很好地考慮光伏出力時序相關性和空間相關性。采用本文所提LE-GMM算法在矩陣降維時則不僅考慮了矩陣內部數值之間的局部相關性,也保留了矩陣的流行結構,即同時考慮了各節點之間時序以及空間上的相關性,對于所構造的日場景描述矩陣,其識別典型場景的能力較好。

b)拉丁超立方采樣方法是一種從多元參數分布中近似隨機抽樣的方法。根據數據集的分布劃分采樣區間,確保僅有少量數據的區間也能參與采樣。對于一整年的日場景描述矩陣數據集,雖然此方法同樣能識別數據集中具有代表性的場景,但受少量極端場景影響,提取的典型場景代表性不強;所以該方法在實際運用中的誤差也是最大的。而本文的LE-GMM算法能通過概率密度曲線很好地體現各種場景出現概率的大小,由此判斷場景是否具備代表性。

綜上所述,相較于傳統的k-means聚類算法以及拉丁超立方采樣形成的典型場景,本文提出的LE-GMM典型日場景提取算法對實際運行場景有更好的擬合能力,誤差更小。搭配所構建的日場景描述矩陣,本文方法能夠快速生成整個配電網或整條饋線各個臺區節點的典型場景,在得到能高度擬合現實配電網的典型運行場景后,可以為含光伏的配電網運行調度以及發電計劃的安排提供可靠參考。

猜你喜歡
饋線出力典型
用最典型的事寫最有特點的人
多項式求值題的典型解法
典型胰島素瘤1例報道
變電站10KV饋線開關與線路開關的保護配合應注意的要點
風電場有功出力的EEMD特性分析
要爭做出力出彩的黨員干部
基于新型材料的短波饋線實踐
配網饋線接地定位及環供支線接地選線判據探討
風電場群出力的匯聚效應分析
饋線自動化終端設備智能接入的研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合