?

計及出行行為調整的綜合能源系統雙層博弈優化策略

2024-04-10 07:49賈士鐸康小寧田博文崔金旭蕭淑文李昕盈
西安交通大學學報 2024年4期
關鍵詞:電熱懲罰調度

賈士鐸,康小寧,田博文,崔金旭,蕭淑文,李昕盈

(西安交通大學電氣工程學院,710049,西安)

隨著“碳達峰、碳中和”目標的提出,推動清潔能源轉型,構建高效、低碳、清潔的新型電力系統刻不容緩[1-2]。電熱氫綜合能源系統(ETH-IES)能夠實現多種能源的交互響應和互補互濟,顯著提高能源利用率[3-5]。此外,氫燃料電池汽車(FCV)和電動汽車(EV)作為靈活性資源參與綜合能源系統的調度,有效提高了系統運行經濟性和環保性[6-8]。

目前,計及不確定性因素的同時合理規劃ETH-IES與新能源汽車的協調運行是面臨的重要挑戰之一。文獻[9]采用蒙特卡洛法模擬電動汽車無序充電,充分考慮源側風光出力和負荷側價格型需求響應等過程中的不確定性因素進行經濟調度。文獻[10]在計及風光不確定性的基礎上,提出了綜合能源系統與EV雙層優化模型,采用拉丁超立方采樣處理風光隨機性。文獻[11]提出了一種考慮碳交易和電動汽車充電負荷的工業園區綜合能源系統調度策略。以上文獻在考慮了EV負荷和不確定性因素的基礎上制定了日前優化調度策略,但未考慮EV實時并網數量的隨機性。文獻[12]構建了兼顧配電系統安全和用戶充電等待成本的雙層實時優化調度模型。文獻[13]實時優化各EV充電功率以實現經濟性最優。以上文獻在實時階段采用單斷面的優化,在實際運行時會引入較大誤差[14]。模型預測控制(MPC)可以很好地解決含多種不確定因素的優化控制問題[15-16],但在MPC滾動優化過程中,還需要抑制車主按照個人意愿無序改變充電計劃的行為。

為了考慮綜合能源系統中不同主體的利益競爭行為,較多的學者結合博弈論進行優化[17-19]。文獻[20-22]基于主從博弈模型分析售電公司和用戶在電力市場中的互動機制。文獻[23]提出了一種考慮動態參數的階梯型碳交易機制和需求響應的園區級綜合能源系統主從博弈優化調度方法。文獻[24]提出了基于納什談判合作博弈理論的多綜合能源系統聯合規劃方法。以上研究均采用單一的博弈方法,實際中系統內的不同主體之間既存在非合作博弈關系還存在著合作博弈關系,并且考慮車輛出行計劃臨時改變帶來的不利影響,通過迭代優化出行計劃調整懲罰單價的研究尚處于空白狀態。

為此,本文建立了考慮車主出行行為調整的電熱氫綜合能源系統雙層博弈優化運行策略。首先,在MPC第1階段建立一主多從Stackelberg博弈模型,引入車輛出行計劃調整懲罰機制,考慮各主體利益的同時減小了車輛出行計劃臨時改變所帶來的不利影響;其次,基于ULA和NEVLA之間存在的合作博弈關系,在MPC第2階段建立合作博弈模型并根據Shapley值法分配收益,滾動優化過程中實現各個主體利益最大化,并保證調度的安全性和準確性;最后,將所提策略和算法應用到某電熱氫綜合能源工業園區以驗證其有效性。

1 計及出行行為調整懲罰機制的雙層博弈調度框架

所提調度框架集綜合能源系統運營商、新能源汽車負荷聚合商以及用戶負荷聚合商于一體,協同互聯能源網絡,能夠提供相比電網更加靈活的電價策略,對于鼓勵用戶科學用能具有積極作用?;陔p層博弈的滾動優化調度框架如圖1所示,該框架基于兩階段MPC滾動優化,時間窗為24、1 h,時間步長為1 h、5 min,結合實時數據,提高調度的準確性。

圖1 基于雙層博弈的滾動優化調度框架Fig.1 Rolling optimization scheduling framework based on two-layer game

在第1階段中,考慮基于系統運營商的報價,新能源汽車負荷聚合商與用戶負荷聚合商能夠通過優化各時段的需求功率獲得更高的利益。該階段包含了定價決策層和定量決策層,兩層存在先后次序,彼此互相影響,符合主從博弈的邏輯結構,因此構建以IESO為領導者,ULA、NEVLA為跟隨者的主從博弈模型。在此基礎上,引入懲罰博弈機制,即上層的系統運營商通過制定車輛出行計劃調整懲罰成本,抑制車主按照個人意愿無序改變充電計劃的行為,避免新能源汽車負荷聚合商頻繁調整EV集群充放電計劃,減小實時調度功率偏差。

在第2階段中,根據最新的負荷功率預測值和新能源汽車接入情況,ULA、NEVLA可以調節自身的靈活性負荷來平抑預測功率誤差和車主出行行為調整帶來的偏差功率,當其自身靈活性資源不足以消除該偏差功率時,可以與另一個主體進行能量交換,避免向IESO支付高昂的申報偏差懲罰費用。因此,兩者可以通過相互協調、結盟減小自身的成本,并且通過合理的分配策略能夠使聯盟形式下的成本顯著低于自身單獨運作的成本,構建ULA和NEVLA的合作博弈模型。所提框架將雙層博弈模型嵌入到MPC滾動優化模型中,以期在實時優化過程中實現各個主體利益最大化,并保證調度的安全性和準確性。

2 電熱氫綜合能源系統實時調度模型

本文所研究的電熱氫綜合能源系統的結構、各設備模型及參數可參考文獻[25-26]。

2.1 MPC滾動優化第1階段

綜合能源系統運營商的能源交易包括定價決策、定量決策兩個子階段。這兩個階段按照先后順序進行,彼此相互影響,通過迭代最終達到均衡狀態。定價決策是上層IESO作為領導者,制定出售電價、熱價、氫價及車輛出行計劃調整懲罰價格,定量決策是下層ULA、NEVLA作為跟隨者,分別根據價格信號調整靈活性資源,因此下層的最優決策是基于上層決策變量的結果。

2.1.1 綜合能源系統運營商模型

運營商在考慮供能側出力計劃和用能側負荷、新能源車輛負荷及車主臨時改變出行計劃情況的基礎上制定價格策略,從而實現自身效益最大化,可表示為

maxBIESO=IIESO-Futility-Fom-Fmt-Fe

(1)

(2)

(3)

(4)

max{0,St-St-1}Cmts+

(5)

(6)

為防止問題退化,避免用能側直接與電網交易,需要滿足如下約束[24]

(7)

此外,售電、售熱、售氫價格還需滿足[24]

(8)

(9)

(10)

2.1.2 用戶負荷聚合商模型

ULA基于上層制定的價格信息優化自身的可平移和可削減電熱氫負荷的功率,以期獲得最大的消費者剩余,具體表示為

(11)

(12)

式中:ve、αe分別為電能消費的一次項、二次項偏好系數;vth、αth分別為熱能消費的一次項、二次項偏好系數;vh、αh分別為氫能消費的一次項、二次項偏好系數。

用戶負荷由固定、可平移和可削減負荷功率3部分組成,具體表示為

(13)

式(13)需要滿足如下約束條件

(14)

2.1.3 新能源汽車負荷聚合商模型

NEVLA旨在考慮充能成本及EV蓄電池退化成本的基礎上,最大化車主的充能滿意價值,可表示為

(15)

(16)

根據放電深度的定義和放電深度與可循環次數的關系,可以得到蓄電池的退化成本[26]

CBde(t,αDOD(Δt))=

(17)

(18)

式中:CBde為單次循環的退化成本;PB為蓄電池功率;Cre表示蓄電池的替換成本;LB為蓄電池壽命擬合曲線;EBA為蓄電池實際滿容量;ηBc、ηBd分別表示蓄電池的充電和放電效率系數;αDOD為放電深度;Ea為累計交換能量;g(t)為功率流方向標志。

2.1.4 主從博弈模型

根據以上分析,ULA和NEVLA基于IESO的價格信息調整自身靈活性資源,而他們的運行方式又會對IESO制定價格產生影響,此過程符合主從遞階結構的動態博弈,因此建立了以IESO為領導者,ULA和NEVLA為跟隨者的一主多從Stackelberg博弈模型,可以表示為

G={N;ρIESO;{δNEVLA,δULA};FIESO;

{FNEVLA,FULA}}

(19)

上述博弈模型中分別包含參與者、策略和收益,具體表示如下:領導者與跟隨者均為參與者,可以表示為N={IESO, NEVLA, ULA};IESO的策略為售出的電價、熱價和氫價以及車輛改變計劃懲罰價格,可以表示為ΚIESO=(Ce,s,Ch,s,Cth,s,Cpenalty);NEVLA的策略為各時刻的EV集群充放電功率和FCV集群加氫功率,表示為δNEVLA=(PV2G,PFCV);ULA的策略為各時刻可平移和可削減負荷功率,表示為δULA=(Psσ,Pcσ);各參與者的收益為各主體的目標函數,分別通過式(1)、(11)、(15)計算。

2.2 MPC滾動優化第2階段

2.2.1 ULA和NEVLA合作博弈模型

在第2階段中,由于預測功率誤差和車主出行行為調整影響,ULA、NEVLA的實際功率值與第1階段申報值存在偏差,因此可以通過自身的靈活性資源以及與另一主體進行能量交換來消除該功率偏差。若仍無法消除,則向IESO支付申報偏差懲罰費用。因此,該模型的目標函數為

(20)

式(20)需滿足如下約束條件

(21)

(22)

2.2.2 綜合能源系統運營商模型

(23)

2.2.3 基于Shapley的聯盟收益分配

Shapley值法屬于求解合作博弈模型的數學方法,其特點在于根據聯盟內各主體的邊際貢獻進行分攤,對于參與聯盟ULA和NEVLA兩個主體,其運行成本計算公式為

(24)

(25)

式中:K為子集c中包含主體的個數;ci為合作聯盟中包含第i個主體的所有子集;δ為加權因子;v(c)為子集c產生的運行成本;v(c/i)為子集c中除去第i個主體后的總運行成本。

3 求解方法

MPC滾動優化第1階段中的領導者IESO優化模型為大規模非線性規劃問題,跟隨者ULA和NEVLA的目標函數為二次函數,并且在競爭型電力市場中信息互不透明。為此,本文采用一種沙丘貓群體優化算法與二次規劃(SCSO-QP)聯合的分布式求解算法。MPC滾動優化第2階段中ULA和NEVLA的優化模型均為線性規模,采用CPLEX求解器進行求解。SCSO算法由于篇幅限制,具體內容見文獻[27]。模型求解可歸納為算法1。

算法1基于雙層博弈的滾動優化調度模型求解方法,步驟如下:

1. 運行MPC滾動優化第1階段,初始化tu=1

2. fortu=1 toTu,do

3. 讀取電熱氫負荷及風電光伏出力短期預測值

4. 采用SCSO-QP分布式協同算法求解MPC滾動優化第1階段的主從博弈模型

5. 將決策變量作為MPC滾動優化第2階段TlΔtl+Δtu時間窗內的參考值

6. fortl=1 toTl,do

7. 讀取電熱負荷及風電光伏出力超短期預測值

8. 采用CPLEX求解MPC滾動優化第2階段的合作博弈模型

9. end for

10. 反饋蓄電池、超級電容以及儲熱儲氫裝置的狀態變量給MPC滾動優化第1階段

11.end for

4 算例分析

4.1 算例參數

以某典型綜合能源工業園區為算例,對本文所提的基于雙層博弈和MPC的ETH-IES協同滾動優化運行策略進行仿真分析。EV及FCV容量參數及隨機特性參數參考文獻[26]。將EV負荷分為4類:①全天停泊在充電站的EV;②日常工作通勤的EV;③有緊急充電需求的EV;④有臨時駛出需求的EV。其中,第④類EV負荷在當前停車場EV總數的占比不超過10%。采用蒙特卡洛模擬法得到 EV的接入時刻、離開時刻、初始荷電狀態、期望荷電狀態等基本信息[26],對于FCV的蒙特卡洛模擬方法與EV類似。

臨時改變出行行為的汽車數量設置方法如下:原計劃于8:00出行車輛中10%的車輛提前至6:00出行,另有15%的車輛提前至7:00出行。用戶對電能、熱能及氫能的偏好系數ve、αe、vth、αth、vh、αh分別為0.000 9、1.5、0.001 1、1.1、0.001、1.2[22],熱價上、下限為0.9、0.3元/(kW·h),氫價上、下限為1.0、0.4元/(kW·h),最大平均售電、售熱、售氫價格為1.0、0.8、0.9元/(kW·h)。該算例在MATLAB2021b環境下運行,第1階段耗時279.2 s,第2階段耗時23.1 s,滿足MPC在線運行的需求。

4.2 結果分析

4.2.1 MPC滾動優化調度結果

系統中電能部分的MPC滾動優化結果如圖2所示。由圖2(a)可知:3:00—8:00期間,電價低谷,可通過主網購電彌補部分功率缺額;11:00—12:00和16:00—17:00期間電價較高,此時蓄電池釋放低峰期間儲存的電能,微型燃氣輪機輸出最大功率以最大程度出售電能;20:00—22:00期間,負荷高,電價峰值,優先利用蓄電池和燃料電池來滿足需求,剩余負荷缺額再通過購電來彌補。在整個調度周期中,蓄電池在用電低谷時儲存電能、在用電高峰時賣出電能,燃料電池、電解槽和儲氫罐在電低谷時將電能轉化為氫能儲存、在電高峰時將氫能轉化回電能,大大提高了綜合能源系統的運行經濟性和靈活性。

(a)第1階段滾動優化結果

由圖2(b)可知,由于疊加了預測功率誤差,在實時調度中實際值與計劃值存在偏差,因此需要調整各單元出力來平抑不平衡功率??梢钥闯?在調度過程中優先使用儲能等調節成本較低的單元,若仍不滿足要求,則改變微型燃氣輪機出力和主網聯絡線的功率值。

系統中熱能部分的MPC滾動優化結果如圖3所示。由圖3(a)可知,由于地源熱泵屬于電熱耦合設備,而電解槽和燃料電池均為電熱氫耦合設備,因此其出力受電價影響較大。在4:00—8:00期間系統多發多儲,以期在電價峰階段減小對電熱耦合及電熱氫耦合設備的依賴;在10:00—13:00和19:00—21:00期間,電價處于峰階段,優先使用儲熱裝置中存儲的能量。由圖3(b)可知,第2階段中熱網部分的各單元出力與第1階段調度計劃值差異較小,所產生的不平衡功率優先由儲熱裝置等調節成本較低的設備平抑。

(a)第1階段滾動優化結果

氫負荷供給情況如圖4所示,5:00—6:00期間分時電價低谷,廉價的電能轉化為氫能進行儲存。在19:00—20:00期間由于熱負荷較高,儲熱裝置余量不足,考慮經濟性及運行約束,增加了電解槽出力,由于電熱氫耦合效應,過剩的氫能儲存在儲氫罐中。

圖4 氫部分MPC滾動優化結果Fig.4 Hydrogen optimization results of MPC rolling optimization

IESO的定價策略如圖5所示,圖5(a)中IESO在當地電網提供的分時電價和上網電價的包絡線內制定售電價格策略,與電網相比為用能側提供了更優的價格,在8:00—9:00和12:00—13:00期間IESO提供了相比于電網低得多的價格,旨在促進新能源消納,避免棄風棄光的現象。圖5(b)、5(c)分別表示IESO制定的售熱售氫價格策略,通過價格引導ULA、NEVLA的負荷需求響應,在滿足功率平衡約束的同時提高IESO的自身收益。

(a)出售電價優化結果

圖6給出了IESO車輛出行計劃調整懲罰價格的優化結果。由圖6可知,在6:00—8:00期間,車主改變出行計劃的意愿較為強烈,有較大的可能提前駛離以適應不同的天氣情況及道路擁堵情況,因此IESO在此期間制定較高的懲罰價格以抑制車主不遵循初始制定的充電計劃行為。

圖6 IESO車輛出行計劃調整懲罰價格優化結果Fig.6 IESO vehicle travel plan adjustment penalty price optimization results

本文將雙層博弈機制嵌入了MPC滾動優化模型,可計算出當前時間窗內的最優策略后滾動時間窗,然后繼續進行優化計算,就可以得到每個時間節點對應時間窗的最優迭代曲線,最終將各個時間窗對應的結果組合成最優迭代收斂平面,如圖7所示。由圖7(a)可知,隨著迭代次數的增加,每個時間窗內的IESO收益均有所增加,不同時間節點的時間窗對應的IESO收益也有較大差異,在2:00—7:00及15:00對應的時間窗有著較大的收益值,而1:00、8:00、11:00和21:00的時間窗對應的IESO收益值達到低谷。由圖7(b)可知,隨著迭代次數的增加,每個時間窗對應的ULA剩余價值逐漸減小,可見領導者和跟隨者的收斂趨勢不同,體現了博弈過程。當達到Stackelberg均衡后,各主體策略不再改變,說明在該策略下,任何參與者都不能通過獨立改變策略而獲得更多收益。

(a)IESO收益迭代平面

對比本文所提雙層博弈模型與僅在MPC第1階段引入主從博弈模型的結果,ULA調節成本分別為 642.27、698.62元,NEVLA充能成本分別為 1 232.65、1 372.01元,因此雙層博弈模型的成本分別降低了8.07%、10.16%,從而驗證了本文所提策略的有效性。

4.2.2 對比分析

對比所考慮的4種策略,策略1為本文所提策略,同時考慮懲罰博弈機制和MPC滾動優化策略;策略2僅考慮MPC不考慮懲罰博弈機制;策略3僅考慮懲罰博弈機制而采用單斷面的優化策略;策略4不考慮懲罰博弈機制且采用單斷面的優化策略。不同策略下的指標對比如表1所示,策略1下的IESO總收益相比于其他策略分別提升了4.43%、7.75%、14.00%,ULA剩余價值分別增加了6.48%、12.18%、13.75%。EV負荷調度成本相較于策略2、3的結果分別減少了13.64%、4.43%,說明引入MPC和懲罰博弈機制對實際情況下的EV充放電計劃有所改進,并且減小了功率調度偏差,提高了系統運行經濟性。

表1 不同策略下的指標對比Table 1 Index comparison under different strategies 單位:元

為了進一步驗證MPC策略及懲罰博弈機制對于主網聯絡線跟蹤的作用,將所提策略的主網聯絡線跟蹤偏差懲罰成本與其他策略的結果進行對比,如圖8所示。由圖8可知:引入懲罰機制后,原本在6:00—8:00期間改變出行計劃的車主大部分繼續按照原計劃實行,從而減小了負荷調度偏差,降低了主網聯絡線跟蹤偏差懲罰成本;而引入MPC滾動優化策略后,進一步消除時間窗內的調度偏差,減小了跟蹤偏差懲罰成本。

圖8 主網聯絡線功率跟蹤偏差懲罰成本Fig.8 Tie-line power tracking deviation penalty cost

5 結 論

本文針對含電動汽車和氫燃料電池汽車的電熱氫綜合能源系統提出了一種考慮車主出行行為調整的雙層博弈優化運行策略,將所提策略與算法應用到某電熱氫綜合能源工業園區,得到如下主要結論。

(1)將所構建的Stackelberg-Shapley雙層博弈模型嵌入MPC滾動優化模型中,在提高調度準確性的同時,對系統內各主體利益協調分配產生積極作用。

(2)在MPC第1階段的Stackelberg博弈模型中引入車輛出行計劃調整懲罰機制,抑制車主按照個人意愿無序改變充電計劃的行為,減小實時調度功率偏差。

(3)應用SCSO-QP的分布式求解算法,在得到各主體均衡解的同時可以保護各參與者隱私。

猜你喜歡
電熱懲罰調度
神的懲罰
《調度集中系統(CTC)/列車調度指揮系統(TDCS)維護手冊》正式出版
一種基于負載均衡的Kubernetes調度改進算法
學會區分電能、電功和電熱
Jokes笑話
虛擬機實時遷移調度算法
巧辨電能、電功與電熱
懲罰
電熱刀具在聚苯乙烯快速成型機上的應用
巧學電能、電功與電熱
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合