?

電網數字化戰略中風險的結構性遞展分析:基于多站融合項目運營

2022-10-08 08:10張晨孫軼愷崔維維劉平闊
智能電網 2022年5期
關鍵詞:決策樹問卷指標

張晨,孫軼愷,崔維維,劉平闊*

(1.國網能源研究院有限公司,北京市 昌平區 102209;2.國網浙江省電力有限公司經濟技術研究院,浙江省 杭州市 310020;3.上海電力大學經濟與管理學院,上海市 楊浦區 200090)

0 引言

電網數字化轉型成為當前發展的一種新業態,是將數字化、智能化、互聯網化應用于傳統電網,以增強電網的靈活性、開放性、交互性、經濟性、共享性的過程,因此,傳統單一變電站的資源價值已不能滿足電網數字化轉型過程中用戶的需求[1]。充分發揮變電站站址富余資源價值,探索對外提供公共服務的新業態,培養新的業務增長點,進行多站融合項目的建設將成為必然趨勢。多站融合項目是以變電站資源為核心,實現多類需求交叉融合發展,優化能源類業務、發展信息類業務、開拓租賃類業務,將各類資源優化整合,實現能源和信息的互聯互通、平等共享、供需平衡、優化互動,以優化電網運行和業務能力水平為目標,優化能源配置,提升綜合服務水平,最終構建包括物理形態、數字形態和產業形態的共享平臺[2]。在此背景下,建設實現資源優化分配、增強信息共享、保障運作可靠、實現運營和運維管理、提高經濟和社會效益的多站融合服務至關重要。多站融合充分應用了“大-云-物-移-智-鏈”等技術,以實現多站融合項目所涉及的各環節互聯互通,提高了數據采集、應用的能力。然而,隨著云計算、SDN(sofeware defind network, 軟件定義網絡)、NFV(network functions virtualization, 網絡功能虛擬化)、5G等新技術的引入對傳統的單個站運營安全造成了巨大的沖擊,存在傳統風險、新增風險等多方面風險隱患[3]。因此,有必要就電網數字化風險評估開展研究,其中多站融合成為了數字化過程的“排頭兵”項目。通過對多站融合運營風險源以及風險指標的分析,確定在不同場景業務下各類風險指標的重要程度,明確進行風險規避時決策側重點[4],從而保證多站融合系統的安全、高效、可靠運行,為在多站融合的經濟運行和價值最大化打下基礎。

諸多學者對多站融合項目的建成與運營進行了深入探討,其整合現有的通信、電力等資源,實現資源利用最大化,相對于單站運營,多站運營更具有優越性[5-6],能夠實現“電力資源、電力業務、通信數據”三者合一。多站融合等形式的綜合能源服務已成為當前國家能源戰略和能源企業發展的新焦點[7-9]。多站融合系統的復雜性和各種不確定性的相互作用,使得維持系統正常運行變得困難[10-13],即多站融合系統的復雜性和智能化的快速發展導致了潛在運營風險增加[14-19]。確保多站融合的優勢以及效益最大化的前提是保證多站融合安全穩定運行,那么,風險與安全研究以反映風險波動在操作階段避免重大事故就至關重要[20-21]。進行多站融合風險管理評估就是控制多站融合運營過程中可能出現的風險,用盡可能低的成本降低多站運營風險[22-23]。

在進行風險管理之前要明確風險的衍生源與風險指標為風險的量化評估打下基礎[24]。關于變電站類風險分析中,變電站在項目建設階段多存在項目的安全、質量、進度風險,以及自然風險等。在變電站運行維護階段多存在技術、人員、外力等方面因素引發的風險[25-28]。

本文就基于變電站基礎的多站融合項目運營中可能出現的風險衍生源進行分析,定義存在的風險指標,以及對定義的風險指標進行結構性分析。為此,利用卡方自動交互檢測法(chi-squared automatic interaction detector, CHAID)的決策樹分類原理,聚焦多站融合項目風險的結構性遞展過程,著力分析三方面問題:①在多站融合的項目安全運營過程中風險指標及體系的建立;②分析風險指標體系,研究其風險遞展進程;③明確在多業務場景下風險指標的重要程度,并提出決策側重點。本文旨在從理論上建立完善的多站融合風險指標體系,在應用上為多站融合風險管控提供較為全面的風險狀況參考。

1 研究方法

1.1 風險指標體系構建

風險指標體系的建立以多站融合項目的經濟增加值[29](economic value add,EVA)作為多站融合運營風險評估的起點,對其進行價值型績效分解,如圖1 (a)所示分解出三大類價值驅動因素[30]:運營利潤率、資產利用率、運營性現金流。將風險因子與三類價值驅動因素結合,分析出九大績效杠桿[31-32],如圖1 (b)所示。

進而,在原有變電站風險源分析的基礎上,根據多站融合的實際運營情況和指標確定標準,并結合多站運營、電力市場、5G相關運營管理者的意見,得到其風險管理涉及充換電站、5G基站、分布式能源站、數據中心站、儲能電站、北斗基站等融合運營中各環節協調發展的風險衍生源[33-34]。從定性角度對十大風險源進行分析將風險指標定性分為11個指標,如圖1 (c)所示:R1信息傳遞風險、R2技術可靠性風險、R3區位選址風險、R4績效偏差風險、R5財務風險、R6部門文化差異風險、R7經濟周期風險、R8制度規范風險、R9需求風險、R10政策風險、R11意外災難。關于風險指標定義的具體解釋,詳見附錄A。

根據多站融合項目的投資建設期、項目運營期以及收益期等不同時期的不同特點,從3個維度對11個風險指標進行分類:政策風險、市場風險、運營風險。其中運營風險包括 R1、R2、R3、R4和R5,政策風險包括 R8、R10,市場風險包括R6、R7、R9、R11。從內生和外源兩個層次對11個風險指標進行分類:內生風險(R1、R2、R3、R4、R5、R6和R7)和外源風險(R8、R9、R10和R11)。

1.2 風險遞展

多站融合的物理形態呈現出“變電站→能源站→多業務站”的技術協同與功能延展過程;在綜合能源站、光伏發電站、儲能站(充換電站)的基礎上,科學整合數據中心站、5G基站、北斗地基增強系統站等優勢資源與“新基建”設施,形成多領域、多業務的邏輯融合、結構集成、優勢互補、數據貫通,成為實現電網數字化與電網高質量發展的前沿領域和關鍵一環。

多站融合運營項目呈現“多方位、多層級、多環節”的特點,其運營環節的各個方面相互依存,任何一個環節出現風險都會波及其他環節,因此需要進行風險遞展分析。本文進行的風險遞展分析主要是針對各個環節之間、各個風險因素之間對多站融合運營項目的影響,在運營管理中根據多站融合運營的特點對其運營風險的重要程度進行優先排序,以供決策者做出最優決策。本文采用數據挖掘(data mining,DM)方法對風險結構性遞展過程進行分析。

數據挖掘模型的功能優勢在于通過預測未來趨勢及行為,做出前攝的、基于知識的決策?;诙嗾救诤线\營階段的大量數據,本文通過數據挖掘模型對其進行處理,分析預測出未來的風險趨勢以及風險側重點,為風險管控與決策提供理論依據[35-37]。

數據分析中的分類和預測是兩種不同的形式,是指對現有數據處理顯示未來趨勢的模型。當輸出具有離散性,則為分類;當輸出具有某種連續性,則為預測[38]。本文中11類風險指標屬于離散變量,因此本文研究的問題為分類。

數據分類問題通常采用統計、距離、決策樹或者神經網絡等方法解決,由于本文所分析問題中風險類別較多、所要求的風險狀況分析較為復雜,因此本文采用易于分析且結果表達直觀的決策樹算法[39-40]。

1.2.1 CHAID算法

本文采用卡方自動交互檢測(CHAID)方法對風險結構性遞展過程進行分析。CHAID算法是一種用于數據集分類的靈敏且直觀的決策樹技術,它細分屬性變量和因變量之間的關系。本文使用CHAID算法,能夠確保風險變量分類的準確性高,可以清晰地顯示哪些字段比較重要,即生成清晰的規則[41]。模型運行結果為一個樹狀圖,頂端是所有樣本觀測值的合集,接著分成兩個或兩個以上的子集,即能從多個風險變量中自動搜索出產生最大差異的風險變量,從而達到對風險指標分類的作用。

1.2.2 CHAID算法步驟

1)定類/定距變量屬性的判定。

①若本文處理變量屬性為定類,則需找到在多個分類的標準級別下合并影響不明顯的變量。

②若本文處理變量屬性為定距,則根據輸出變量的種類不同,采用不同的檢驗方法,即分類變量采用卡方檢驗,數值變量采用F檢驗。

2)已判定分支變量的確定和分隔值的選擇。

①按照步驟1)中計算出各個變量的卡方檢測統計量和P值。根據P值的大小來確定變量的關聯程度,選擇與目標變量關系最為密切的作為最佳分支變量,其他變量作為其子分支節點。

②重復上述操作,直至滿足收斂。

1.2.3 CHAID算法公式

擬合優度檢驗,即檢驗模型對樣本觀測值的擬合程度。在檢驗過程中,實際觀測數與理論觀測數關系為

fe越大,即fe≥5,說明檢驗結果越好,擬合程度越高。

當樣本容量較小時,利用似然比檢驗對數據的分類處理更為通用和穩健,因此,本文中考慮使用似然比檢驗。似然比的計算公式為

式中:RLR為似然比;L1為復雜模型中的最大似然估計值;L2為簡單模型中的最大似然估計值。

樣本的聯合分布函數為似然函數

式中:θ為待估參數;x1、x2、…、xn均為來自總體樣本x的觀察值。

提升度用以反映CHAID模型中的收益 (%);提升度越高,說明模型的 “收益”越好。提升度的計算公式為

式中:Llift為提升度;為模型特定樣本空間輸出值是t類的概率;為所有樣本空間內輸出值是t類的概率。

2 數據及分析

2.1 實驗數據處理

2.1.1 數據采集

第一,將各個指標的含義進行簡潔的定義與解釋。

第二,將第一步中定義的研究變量與多站融合項目的工作人員、運營管理方面學者以及風險評估方面的專家等進行溝通討論,對問卷中變量以及對變量的解釋進行修改和完善。

第三,組織部分專業人士進行預問卷調查,修正部分內容。

第四,以各種不同的形式正式發布調查問卷。

第五,定期回收,檢查質量,對已回收問卷進行處理。

問卷將政府部門、教育及科研機構、電力企業、多站相關企業等的相關工作人員設為答卷人的選擇范圍。

問卷分為五部分:調查目的說明、問卷說明、答卷人背景的信息調查、對多站融合運營風險指標的解釋、答謝語。其中,問卷主體內容包含兩部分:第一部分即答卷人背景信息的調查;第二部分是針對影響多站融合運營項目的風險指標進行調查(即將指標影響程度分為一般重要、稍微重要、比較重要、非常重要、極其重要五個層次進行打分)。

2.1.2 統計性描述

本次問卷調查回收周期為3個月 (2020年8月至2020年11月),實際共發放問卷500份(為了保證問卷的分析結果準確,樣本容量應在300份以上[27-28]),實際收回問卷416份,其中有效率為82.45%。對問卷數據進行分析、處理如表1和表2所示。

表1 信度分析Table 1 Trust level analysis

表2 效度分析Table 2 Validity analysis

信度分析用于研究數據的回答可靠準確性。

第一,分析表1中的α系數,若α≥0.8,即說明該問卷屬于高信度;若0.7 ≤α< 0.8,則說明該問卷屬于較高信度;若P=0.000<0.05,則說明該問卷屬于低信度;若KMO值小于0.6,則說明該問卷屬于低信度。

第二,若CITC值小于0.3,可考慮將該項進行刪除;

第三,若“ 項已刪除的α系數”的值明顯高于α的值時,說明可以將該項刪除后對其他各項重新進行分析。

第四,對分析進行總結。

如表1所示α=0.833>0.8,因此,可以說明該問卷調查中的研究數據的信度好。且刪除任意項的“項已刪除的α系數”,結果不會有顯著的提高,因此,說明問卷中的各項不需要做刪除處理。

上述各項中的CITC的值均滿足大于0.4的條件,因此,說明各項間相關性良好,也可說明該問卷的信度高,可用于進一步分析。

效度研究用于分析研究項是否合理有效。

第一,分析表2中的KMO值,若KMO值不小于0.8,說明該問卷效性高;若KMO取值[0.7, 0.8),說明該問卷效性較高;若KMO取值[0.6, 0.7),說明該問卷效性一般;若KMO值小于0.6,說明該問卷效性較低。

第二,效度分析要求需要通過Bartlett檢驗(對應p值需小于0.05)。

第三,若僅兩個分析項,則KMO值均為0.5。

從表2中得KMO值為0.893,大于0.8,即該問卷效度高。

調查對象情況如表3所示。

表3 調查對象個人信息表N=343Table 3 Personal information form N=343

續表

2.2 數據分析

2.2.1 數據預處理

卡方檢驗統計結果如表4所示。

表4 卡方檢驗統計Table 4 Card side inspection statistics

若總例數不少于40,最小理論頻數大于5,則滿足卡方檢驗條件,選擇卡方值(pearson chi-square)和對應的P值(即Sig)。若P≤0.05,即說明差異具有統計學意義;反之,P>0.05,即說明差異無統計學意義。

從表4可以看出:P=0.000<0.05,差異有統計學意義。

2.2.2 CHAID決策樹構建

1)模型建立與執行結果。

本文采用Clementine軟件完成分類建模過程。

①將數據導入數據流,選擇“分類”節點對其進行預處理。由于本文采用的是主觀數據,考慮到數據的主觀影響以及分類的清晰度,僅將風險分為不存在“0”以及存在“1”,即調查問卷中指標影響程度中一般重要、稍微重要兩個層次歸為不存在類別,比較重要、非常重要、極其重要三個層次歸為存在類別。

②選擇“CHAID”模型節點,進行建模。

③模型的“專家”選項中,卡方用于類別目標選擇“似然比”,其他“字段”、“成本”、“注釋”保持原始設置不變。

④形成完整的數據流,輸出模型,生成決策樹。

CHAID決策樹結果如圖2所示。

由圖2可得,多站融合運營風險的決策樹結構呈多分支走向,圖2和表5用不同的方式展現了多站融合運營的風險診斷。其中,各個分支節點P≤0.025,即具有較強的相關性。由圖2的分支走向可得,當多站融合項目運營過程中不存在“部門文化差異風險”時,決策者應優先考慮運營風險體系中的“信息傳遞風險”,該指標數n=70,占樣本總數的20.408%(P=0.000); 當多站融合項目運營過程中存在“部門文化差異風險”時,項目決策者應優先考慮運營風險體系中的“意外災難”,該指標數n=273,占樣本總數的79.592%(P=0.000)。其他的風險遞增決策過程以此類推。

由圖2可知,根據多站融合運營決策樹分支的去向和發展以及CHAID模型分析層次,可得到決策樹14個分支去向,即多站融合運營項目的主要風險狀況分為14種,進一步分析可得如下結論。

首先,決策樹的起始風險為“部門文化差異風險”,即說明“部門文化差異風險”的存在與否對風險狀況的走向影響最為深遠,因此“部門文化差異風險”成為融合的最大不確定性因素;

其次,“信息傳遞風險”和“意外災難風險”位于風險決策樹的第二層級,在分析“部門文化差異風險”后需要根據概率權衡“信息傳遞風險”和“意外災難風險”以進一步分析風險狀況;

最后,在風險決策樹低端的“財務風險”、“經濟周期風險”、“政策風險”和“制度規范風險”,相對于而言對風險狀況的影響較小、易于管控。

將圖2中的14種分支去向用表格的形式來表示,見表5。通過表5對風險狀況的展示,可清楚的看出CHAID模型將定義的11個風險指標進一步篩選出10個較重要的影響多站融合運營風險管理的風險指標。表5中的14種風險狀況為具體多站融合項目的風險識別提供參考,使運營項目有目標有側重點地進行風險管控,以降低項目存在的風險隱患,提高其運營可靠性。

表5 多站融合的風險狀況Table 5 Risk conditions for multi-station fusion

2)模型收益評價。

表6和表7中,給出模型的收益評價數據。其中,各個主要節點的收益評價用“指數(%)”的值來表示,“指數(%)”的數值越大,則說明上述CHAID模型的收益越好。

表6 訓練樣本各節點的收益數據Table 6 Train the revenue data for each node of the sample

表7 訓練樣本累積的收益數據Table 7 Revenue data accumulated from the training sample

最后,由clementine軟件CHAID模型預測結果可得,其多站融合運營決策樹的錯誤率為0.335,標準誤差為0.072,錯誤率及標準誤差都在可接受范圍內,因此分析過程合理。

3 結論及建議

3.1 研究結論

第一,為針對性研究電網數字化的風險管控問題,本文以多站融合運營項目為例,建立了多站運營的風險指標體系,為分析確定風險源及風險指標的遞展關系提供理論框架;進而,為多站融合在各場景下的風險指標屬性進行分類,由運營風險決策樹的分支去向可得,“部門文化差異風險”、“信息傳遞風險”和“意外災難風險”屬于表象風險,“績效偏差風險”和“區位選址風險”屬于潛在風險,為進一步風險規避提供了決策側重點。

第二,本文將多站融合的運營風險遞展通過過程性維度進行遞展分析可得,在項目導入期,“部門文化差異風險”成為融合的最大不確定性因素,其次需要根據概率權衡“信息傳遞風險”和“意外災難風險”,而常規意義的“財務風險”、“經濟周期風險”、“政策風險”和“制度規范風險”等風險處于可控范圍。

第三,本文得出的14類風險狀況可用于多站融合導入期、建設期、運維期的風險識別,在未來的研究中,以本文所建立的風險指標體系以及風險狀況為指導,可對多站融合項目進行風險管控,提高項目運營可靠性;隨著多站融合試點的不斷擴大建設,可根據實際出現的安全隱患對本文的風險指標及風險狀況進行修正,以更好地應用于實踐。

3.2 政策建議

當前,作為中國能源戰略和能源企業發展的新焦點的多站融合項目的興起,迫切需要解決多站融合運營的安全穩定運行問題。因此,本文總結以下政策建議。

首先,穩步建設多站融合試點運營、推進電網數字化轉型,完善相關電力政策法規。從而,從源頭解決部分風險衍生源,在多站融合項目啟動、投運或經營之前,在選址、建設方面規避致命性風險因素,在多站聯動、站址規模、投資成本等方面實現多站融合項目運營安全。

其次,推進具有區域地方特色的多站融合運營風險理論體系研究,尤其是涉及針對各個不同的多站融合項目的運營場景下的風險遞展途徑進行明確,從而改進相關政策制度、指定應對風險有效策略以及加強風險監管的機制等關鍵問題的研究,使之成為多站融合風險管控的有力支持和有效機制。

最后,穩步推進技術革新,充分利用電力企業在多站融合運營項目中的牽頭、引導作用,從而形成規范、穩定、安全運營環境和行之有效的政策支持框架,促進多站融合的發展。

附錄A 多站融合項目運營風險指標的重要性評價

多站融合風險指標 風險對于多站融合項目運營的重要程度指標的名稱及其說明 一般 稍微 比較 非常 極其R1信息傳遞風險 1 2 3 4 5說明:對多站融合中的實時監測與反饋的要求更高,各環節傳遞信息發生信息錯誤的機會增多。R2技術可靠性風險 1 2 3 4 5說明:多站融合運營后技術本身的先進性、可靠性、實用性、可得性與預期方案發生較大變化,達不到預期的效果,而導致損失的風險。R3區位選址風險 1 2 3 4 5說明:部分站選址局限性問題突出,區域因素影響的不確定性。R4績效偏差風險 1 2 3 4 5說明:多站融合運營過程中項目績效總收益較原站績效收益總和有下降的風險,從而造成損失的風險。R5財務風險 1 2 3 4 5說明:數據中心等需要統一運營的業務需要重點防范分散運營而失去合力的情況,從而造成品牌不強、市場能力薄弱、運營成本過高的情況。R6部門文化差異風險 1 2 3 4 5說明:多站原有的運營方式、運營理念、制度等在融合過程中存在沖突的可能性增大。

多站融合風險指標 風險對于多站融合項目運營的重要程度指標的名稱及其說明 一般 稍微 比較 非常 極其R7經濟周期風險 1 2 3 4 5說明:外部市場競爭激烈,在整體服務體系、營銷管理上要具備外部競爭的能力,需要關注投資與收益不匹配的問題。R8制度規范風險 1 2 3 4 5說明:數據中心類指南或規范,現行內容不適用多站融合,與多站融合場景存在一定沖突。R9需求風險 1 2 3 4 5說明:多站融合業務的多樣化同原站單一業務比較需求的不確定性增大,使損失的風險加大。R10政策風險 1 2 3 4 5說明:國家的制度、法律在逐漸完善的過程中,規制、制度、法律法規的調整、修訂的不確定性。R11意外災難 1 2 3 4 5說明:地震、火災、公共衛生安全、政治的動蕩、意外的戰爭、氣候變化、環境惡化等指標補充及重要度1 2 3 4 5

猜你喜歡
決策樹問卷指標
主要宏觀經濟指標及債券指標統計表
主要宏觀經濟指標及債券指標統計表
簡述一種基于C4.5的隨機決策樹集成分類算法設計
莫讓指標改變初衷
主要宏觀經濟指標及債券指標統計表
決策樹學習的剪枝方法
問卷大調查
問卷你做主
決策樹在施工項目管理中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合