?

基于知識圖譜與細胞自動機模型的配電網信息系統風險分析

2022-11-05 06:12梅冰笑周金輝孫翔
中國電力 2022年10期
關鍵詞:圖譜配電網實體

梅冰笑,周金輝,孫翔

(國網浙江省電力有限公司電力科學研究院,浙江 杭州 310007)

0 引言

近年來,各種先進量測、通信和控制技術密集應用在配電網中,其信息化程度迅速提高,導致信息系統對電力系統的影響日益增大?,F代配電網狀態感知、運行決策和經濟運行越來越依賴信息系統的可靠運行,配電網已發展成為電力物理系統與信息通信系統深度融合的復雜動態系統[1-4]。

信息系統對配電網安全穩定的影響也逐漸突出:發生在信息系統上的失效事件,尤其是近年來日益頻繁的網絡攻擊,對整個配電網的安全穩定運行造成了嚴重的影響。文獻[5]針對烏克蘭停電事件中網絡攻擊的原理、手段及目標開展分析,認為其是人類歷史上信息安全影響電力系統運行的里程碑事件,文獻[6]從發、輸、配、用電側4 個環節綜述了電力系統中網絡攻擊的典型場景,文獻[7]從數據采集與監控(SCADA)系統受到網絡攻擊的角度開展不同攻擊場景對電力系統可靠性的影響分析,文獻[8]指出信息系統的事故將導致電力網絡的癱瘓,針對網絡攻擊,文獻[9]從攻擊建模和系統安全評估方面進行了梳理分析。進而,文獻[10]對信息系統風險在電力系統中的傳播開展了建模分析,文獻[11]從攻擊方的角度開展了網絡攻擊對象和攻擊模式的分析。上述研究主要從電力系統的傳統模型和運行機理出發,側重于依賴現有的硬件隔離裝置和端口保護策略實現對來自信息系統風險的研究。

為了進一步刻畫攻擊行為在信息物理耦合空間中的傳播過程和演化規律,近年來通過利用電網運行狀態大數據分析技術,開展其在安全防護中的研究應用逐漸增多。文獻[12]指出應充分利用大量多源異構電力大數據,并從中提煉出深層知識并發揮其應用價值為電網安全服務,文獻[13-15]通過利用電網運行態勢分析技術,分別實現安全風險的估計預測、智能調度和安全防御機制構建,文獻[16]總結了大數據和人工智能方法在故障診斷和狀態預測等典型業務場景中的應用研究??梢?,目前電網風險分析主要是利用電源管理單元(PMU)、SCADA 等量測單元的數據分析,以大數據理論為基礎分析電網狀態信息和預測未來態勢發展。以上工作為電網安全風險分析勾勒了藍圖,但未給出相關技術的詳細論述,且多數研究僅停留于對量測數據的初步分析,未深入挖掘海量數據背后隱藏的電網異常狀態之間的關聯分析和風險傳遞關系,不能實現對網絡攻擊跨空間傳播路徑的精準估計。

為了深入挖掘多源異構的配電網數據特征,更加全面掌握電網運行狀態及風險傳播過程,可利用知識圖譜方法[17-22]對采集的多源異構配電網數據進行風險知識的有效提取和深度融合,并通過構建多模態信息融合的風險知識圖譜,實現對網絡攻擊的類型梳理和風險的關聯分析。進一步的,為了刻畫風險的動態傳播過程,可利用細胞自動機技術[23-26]實現對離散信息系統動態過程的精確建模。

因此,本文首先利用知識圖譜技術對配電網多源信息進行統一表征和存儲,實現配電網風險過程的靜態分析。進而基于細胞自動機建模分析技術,研究系統正常與故障狀態的轉變機制,實現對配電網中信息風險發展過程的動態分析。通過知識圖譜與細胞自動機的結合,實現對風險傳遞信息的充分融合,進而達到對配電網安全風險動態演進過程的有效刻畫和分析。

1 模型設計

1.1 總體設計

為了深入挖掘配電網海量數據背后隱藏的電網異常狀態之間的關聯和風險傳遞關系,實現對風險跨空間傳播路徑的精準估計,基于知識圖譜和細胞自動機技術構建多源異構數據抽取和融合模型,該模型的總體框架如圖1 所示。

圖1 總體技術路線Fig. 1 Overall technical framework

該模型主要包含2 部分:風險知識圖譜構建和基于細胞自動機的信息風險跨空間傳播分析方法。整體的實現流程如下。

(1)利用知識圖譜從配電網多種類型的數據源中提取出風險實體,并歸納實體間的關聯因素,在此基礎上形成關于配電網風險實體的知識表達;對于不斷加入的新風險數據,通過與原有實體信息進行整合,并排除新舊數據之間的矛盾和歧義,并進一步經過質量評估將合格的部分風險知識加入知識庫,以確保風險故障分析的知識庫的質量。通過上述風險知識圖譜構建,實現對配電網風險過程的靜態分析。(2)基于信息系統風險對電力物理設備的影響特點,構建配電網風險分析的細胞自動機模型,并設計細胞的正常與故障狀態轉變機制,以實現對配電網中信息風險發展過程的動態分析。(3)結合知識圖譜和細胞狀態機技術開展實驗仿真,實現對信息風險的跨空間傳播過程分析、細胞的防御程度對風險傳播影響分析和故障細胞的自愈率對風險傳播的影響分析。

1.2 配電網風險分析知識圖譜

近年來,電網公司通過多維度數據源信息的融合互通,初步實現配電網運行多層級的狀態監測與管控。以省級配電網為例,每月在運行產生幾十種類型高達數TB 的多源異構大數據,同時存在著設備臺賬數據字段空缺和數據錄入不準確等情況,導致難以充分發揮數據貫通、業務融合和資源共享優勢,不能達到對配電網風險管控業務的有效支撐。

而知識圖譜技術能夠實現對不同種類的文本、數據庫、圖片、視頻等多源異構數據進行有效的信息抽取和知識融合,梳理數據之間的關聯關系并實現知識合并和歧義消除,進而通過聚類整合大量知識信息,實現知識的質量評估和關聯推理,形成簡單清晰的 <實體,關系,實體> 三元組。這將為實現配電網中風險數據的深度挖掘和風險傳播分析奠定良好的數據基礎。

1.2.1 配電網風險分析知識圖譜的構建過程

考慮到配電網風險跨空間傳播的特點,采用自頂向下的知識圖譜構建技術實現配電網中風險實體抽取和風險傳遞關系的梳理。因此,面向配電網風險分析的知識圖譜構建包括風險信息的抽取、風險知識的融合和風險知識的加工等基本過程,如圖2 所示。

圖2 風險分析知識圖譜構建過程Fig. 2 Construction process of risk analysis knowledge graph

首先,在信息抽取過程中,主要以從SCADA、地理信息系統(GIS)等數據庫和互聯網中采集到的結構化數據源為基礎,通過采集到的各種類型結構化數據提取初步的實體信息,同時將半結構化及非結構化海量運行數據進行分類梳理,實現結合多個數據源信息的互相印證和補充,從而實現對配電網運行風險數據的規范化融合,實現有效的信息抽取。

其次,在知識融合過程中,針對結構化數據和互聯網數據通過知識合并獲得進一步確切的實體分析,進而針對配電網中半結構化和非結構化時空數據,開展數據特征篩選與特征穩定性分析,從多維異態數據中提取基本特征,并在此基礎上利用數據特征的交互融合分析實現實體歧義合并,為配電網信息空間中現有風險或潛在風險的全景評估奠定基礎。

最后,在知識加工過程中,根據知識融合后實體間的關聯關系回溯發現風險成因和傳播關系,從而進一步剝離錯誤實體,清理得出構建配電網風險分析的準確實體,并在精確推理、預測和評估基礎上實現對配電網風險關聯關系的刻畫,最終構建融合實體和關聯關系在內的三元組,以形成反映配電網風險的知識圖譜。

1.2.2 知識圖譜構建關鍵技術

確定實體及其關系是構建配電網風險分析知識圖譜的首要任務。配電網風險分析中所涉及的實體關系包涵了風險實體的定義、風險關系的歸集與抽取等。其中,風險實體主要從結構化數據集中自動識別并確定風險發生的部件或裝置。風險實體按照類別可以劃分為一次系統設備類型風險實體和信息/測控系統等二次系統類型風險實體。而風險關系的歸集與抽取主要是針對確定的與各種實體相關聯的風險數據進行特征建模,然后基于模型處理海量數據集形成新的實體集,并針對新實體迭代生成實體之間的關聯關系。

然而,實體集中得到的是一系列孤立的實體,為了進一步反映風險實體間的深層邏輯關系,還需要進一步挖掘實體之間的關聯關系。面對配電網中各種類型的風險數據,通過人工構造語法或半監督學習等機器學習技術,基于現有實體集知識,從大量半結構化或非結構化數據中進一步梳理實體間的相互聯系,最終形成關聯各個實體的知識網絡圖譜結構。在知識圖譜技術中,通常采用表達實體間聯系的三元組 <實體,關系,實體 >來描述風險傳播過程中各個實體的關聯關系。如在微機保護裝置反饋的饋線電流諧波異常風險分析中,針對保護裝置與電流的風險傳遞關系可用知識圖譜三元組表示為 <保護裝置,諧波,電流 >,而饋線與保護裝置的風險傳遞關系用三元組 <饋線,異常,保護裝置> 表示。為了圖形化顯示方便,借鑒圖論知識可將實體簡化為圖論中的節點,而實體間的關聯關系可用圖論中的邊表示。通過點與邊的組合,配電網風險實體之間的傳播關系可以用網絡圖形表示,從而以直觀方式展示相應場景下的一次系統設備、二次系統設備的風險關聯狀態。

通過以上風險實體的定義、風險關系的歸集與抽取,將配電網風險故障信息轉化為結構化三元組數據??紤]到針對同一風險故障的記錄,有可能是來自GIS 系統或者SCADA 系統的結構化數據,也有可能是來自監控系統的圖像、運維系統的報告等非結構化數據,導致在上述多源數據中包含重復的風險主體和關聯關系描述等信息,通過數據清洗和質量提升技術,構建三元組的知識更新模塊,開展對多個數據源數據的可靠性和一致性驗證,并選擇將各個數據源中高頻度出現的風險主體和關系屬性加入現有的風險知識庫中。然后,根據配電網信息空間風險分析中已有的實體概念定義及分析框架,以三元組的形式將所有的風險知識聯結起來,從而以關系聯絡圖的直觀形式存儲在Neo4 j 圖數據庫中,實現對配電網風險故障實體的建模及關聯關系梳理,最終構建配電網風險分析知識圖譜。

綜上,通過借助從SCADA、GIS 等數據庫或互聯網采集到的結構化數據源,首先選擇其中高質量的數據,用于描述配電網風險的概念、演化和邏輯聯系。進而提取抽象出風險實體和風險轉移關系,通過采用圖計算和深度學習等數據處理模式,篩選出影響配電網風險的主導實體和關鍵特征,利用關聯、推理、預測等數據挖掘方法,對配網運行大數據進行基礎信息挖掘,構建反映配電網時空大數據風險事件行為的知識圖譜。通過知識圖譜的構建,從數據分析的角度實現對風險故障傳播時空動力學特性的認知,并且在風險分析過程中能夠通過推理實現對未知潛在故障的預測能力,為電網風險分析和預警提供技術保障。

1.3 配電網風險分析細胞自動機模型

配電網信息風險傳遞過程是一類時間和空間都離散的過程,而細胞自動機模型通過模擬細胞的自我復制過程,能夠實現對離散事件的有效分析。細胞自動機模型一般包含細胞及其狀態的建模、鄰域細胞模型建模和細胞狀態轉換規則設計等要素。

下面以配電網中的一次系統節點為電力細胞,以二次系統節點為信息細胞, 建立配電網風險分析細胞自動機模型。

1.3.1 細胞及其狀態模型

根據配電網風險分析知識圖譜三元組,將其所包含的設備分為一次系統中的電力細胞和二次系統中的信息細胞兩類。其中, 電力細胞主要指的是實現電能產生、傳輸和轉化的設備,例如發電單元、負荷單元等一次系統節點,而信息細胞主要指實現信息采集、通信傳輸、保護控制的設備,例如SCADA、前置通信單元、控制器等二次系統節點。

不論電力細胞或者信息細胞,在風險傳播過程中,細胞的狀態要么處于正常狀態,要么處于故障狀態,并隨著時間在二種狀態之間變化。

1.3.2 細胞鄰域模型

在風險傳播過程中,配電網中細胞狀態的動態變化過程可用有向圖G=(V,E)表 示,其中V是細胞集合,E是細胞間關聯關系集合。令細胞i和j之間的鄰域關系用鄰域矩陣Z={zi,j}i,j∈V表示,若細胞i和j之間存在關聯則zi,j=1, 反之則zi,j=0。

通過對鄰域矩陣進行分塊處理,可進一步精確刻畫配電網風險傳遞過程,從而將電力細胞和信息細胞的關系與鄰域矩陣建立對應關系。鄰域矩陣的分塊結果可表示為

式中: βj和 βk分別為細胞j和細胞k防御機制的配置水平;Ni為細胞i的鄰域細胞集合。一般的,通過參考配電網脆弱性分析中節點訪問復雜度,設置風險傳遞概率的取值為[0, 1]。因此細胞防御程度越高,風險從信息細胞i傳遞給信息細胞j的概率越小。

與信息細胞相關矩陣A=(ai,j)m×m相對應的,鄰域矩陣中與電力細胞相關聯的部分是D=(di,j)n×n,表示電力細胞間的關系矩陣。具體的,di,j表示電力細胞間的功率關系。 當i=j時,分2 種情況討論:di,j>0表示電力細胞i輸出功率,而di,j<0 表示電力細胞i消耗功率; 當i≠j時, 分2 種情況討論:di,j>0表示功率從細胞i流向細胞j,而di,j<0則表示功率從細胞j流向細胞i。

電力細胞與信息細胞的關聯關系用矩陣B=(bi,j)m×n和C=(ci,j)n×m表示。其中,B=(bi,j)m×n是信息細胞對電力細胞的風險傳遞矩陣,刻畫了信息細胞風險對電力細胞的傳遞影響,其元素值表示信息細胞風險轉化為電力細胞風險的相關性,取值為[0, 1]。而C=(ci,j)n×m則表示電力細胞將風險傳遞給信息細胞的概率。本文主要研究信息風險的傳播機制, 因此矩陣C設定為零矩陣。

1.3.3 狀態轉換規則模型

為了精準描述配電網風險傳遞過程,需要對細胞的狀態變化規則進行分析并在此基礎上設計細胞的狀態轉化規則模型。

(1)信息細胞的狀態變化。

一般的,對于任意信息細胞i,令其在t時刻的狀態為si(t) ,那么其在t+1 時刻的狀態si(t+1)不但受到其在t時刻狀態的影響,同時受到其鄰域細胞在t時刻狀態集合的影響。如果存在某一鄰域信息細胞j因受到網絡攻擊而具有風險傳播危險,那么細胞i將 會以aj,i的概率被感染,即信息細胞j以概率aj,i攻擊感染鄰域細胞i。因此信息細胞i在t+1 時刻發生風險故障的概率可表示為

同時,由于系統校驗和自我修復機制的存在,信息細胞i能夠以一定概率恢復正常狀態,即細胞具有一定的自愈率。綜上,信息細胞i狀態轉換規則為

(2) 電力細胞的狀態變化。

綜上,電力細胞i的狀態變化規律為

2 仿真實驗及分析

2.1 仿真模型及場景設置

本文選擇如圖3 所示的配電網仿真系統,對信息風險過程開展分析。

圖3 仿真系統Fig. 3 Structure of the simulation system

在電力物理空間,仿真系統具有3 臺發電機G1、G2、G3,配置負荷為L1、L2、L3,3 臺發電機分別通過變壓器 T1、T2、T3 實現區域供電。同時,在信息通信空間,發電機、變壓器和負荷端均配置相應的監控和傳感設備,通過通信系統與配電網監控主機相連。

在配電網中,信息細胞風險傳遞到電力細胞的整體過程主要與3 個因素相關,分別是信息細胞到電力細胞的風險傳遞矩陣B、細胞防御機制被攻破的概率和細胞從故障到正常狀態的自愈率。為此, 仿真實驗對應設計相應的3 個場景開展分析。本文主要考慮信息細胞風險對電力細胞的影響,因此仿真中主要關注隨著信息細胞風險傳播,電力細胞的故障規模指標變化情況,該指標可定義為

式中:I(t)為t時刻處于故障狀態的電力細胞數量Nf(t) 占全部電力細胞總量N的比例,也是仿真實驗的主要分析指標。

2.2 仿真流程

針對上述場景,仿真實驗主要包括以下步驟。

(1)利用配電網風險數據通過知識圖譜技術,構建風險分析三元組;

(2)隨機選擇配電網中任意信息細胞變化為故障狀態;

(3)根據知識圖譜三元組知識,判斷是否有相關電力細胞發生故障。根據細胞狀態轉換規則更新信息細胞和電力細胞的狀態;

(4)如果有電力細胞變化為故障狀態,則計算配電網的系統潮流,否則等待進行到下一時刻;

(5)達到仿真結束條件,輸出電力細胞故障規模指標I(t)。

2.3 仿真結果

2.3.1 配電網信息風險分析知識圖譜構建

基于配電網仿真實驗需要,通過設計相應的故障場景積累歷史風險數據,并在數據清洗的基礎上利用圖數據庫Neo4 j 技術對知識圖譜中檢測識別出的風險實體與狀態進行查詢,返回與之關聯的實體及屬性,完成風險知識庫的融合加工?;谥R圖譜的三元組分析結果,實現對風險的靜態分析,為利用細胞自動機技術實現風險傳播過程的動態分析奠定基礎。圖4 是配電網中發電機G1 監控單元信息風險傳播過程的知識圖譜分析結果。

圖4 G1 信息風險傳播過程的知識圖譜Fig. 4 Knowledge graph of G1 information risk propagation

2.3.2 配電網信息風險的傳播動態仿真

以發電機G1 的監控單元感染病毒為例,基于知識圖譜得到的結構化知識和細胞自動機的離散狀態分析技術,開展對信息風險傳播過程的仿真模擬。該信息風險傳播過程如圖5 所示。

其中, 假定細胞自愈率 ε=0,細胞的防御程度為0.5,即風險傳播成功的概率為0.5。信息細胞是圖5 中的第1 行方格,分別代表仿真系統中G1、G2、G3、T1、L1、T2、 L2、T3、L3 的監控單元;電力細胞是圖5 中的矩形方格,矩陣的行與列分別對應系統中的母線序號,圖5 刻畫了矩陣Z中的分塊矩陣B,即信息細胞對電力細胞的風險傳遞和影響過程。在t時刻, G1 監控單元感染病毒,由于電力細胞防御機制存在,信息風險并沒立刻傳播給電力細胞;在t+1 時刻,由于鄰域細胞感染,導致與G1 相關聯的T1 監控單元轉移到故障狀態,同時發電機G1 進入故障狀態。與此同時,系統潮流重新計算,導致母線8 與母線9 之間線路功率超限而退出運行;在t+2 時刻,由于細胞防御機制的存在,變壓器T1 仍未受到信息風險的影響,但隨著故障在電力細胞間的擴散,導致多條母線因功率超限退出運行。最終系統中電源和負荷均無法聯絡,導致系統停電事故。以上是僅僅對發電機G1 監控單元信息細胞風險傳播過程的分析,為了分析不同信息細胞風險對系統的影響情況,接下來開展信息風險傳播對電力細胞故障規模指標的影響分析,如圖6 所示。

圖5 信息風險動態發展過程Fig. 5 Dynamic evolution process of information risks

圖6 風險演化的時間特性Fig. 6 Temporal characteristics of risk evolution

其中,G1、G2、G3、T1、L1、T2、 L2、T3、L3 的監控單元分別對應9 個信息細胞,分別記為節點1 到節點9,并且電力細胞故障規模指標采用260 次仿真的統計均值。由圖6 可知,信息細胞風險對電力系統故障規模產生一定程度的影響,但是不同的信息細胞風險其影響程度是不同的。具體的,從傳播速度上分析可知,除母線L1 監控單元所代表的節點5 外, 其他細胞風險傳播后的4 個仿真步長能夠導致80%以上的電力細胞轉移到故障狀態。進一步分析可知, 變壓器T2 監控單元所代表的節點6 在受到風險感染后,導致電力細胞達到60%故障規模的時間最短,可知變壓器T2 的監控單元重要性突出,尤其要施加更加全面有效的安全防御措施。

2.3.3 風險防御機制對電力故障規模的影響

選取發電機G1 監控單元故障為例,分析信息細胞風險傳播對象在不同的防御程度下,電力細胞故障規模的變化情況,如圖7 所示。

圖7 細胞防御程度對故障規模的影響Fig. 7 Impact of cellular defense degree on the scale of failure

其中,假定所有細胞從故障狀態無法自行恢復到正常狀態,即自愈率為0。發電機G1 的信息細胞風險傳播到鄰域電力細胞過程中,電力細胞的防御程度β從0.1 等步長變化到0.9。由圖7 可見,在故障傳播后的任意時間斷面處,隨著電力細胞防御程度的增強,由于G1 監控單元信息風險傳播導致電力細胞的故障規模逐漸降低;同時當系統穩態時,防御程度越高,電力細胞的故障規模越小。

2.3.4 細胞自愈率對電力故障規模的影響

接下來針對細胞從故障狀態自動轉換到正常狀態的能力,即細胞的自愈率對電力細胞故障規模的影響開展分析,實驗結果如圖8 所示。

其中,信息故障來自發電機G1 的監控單元,同時假定所有細胞的防御程度均為0.5。為了比較不同細胞自愈率對電力細胞故障規模的影響,設定細胞自愈率 ε從0.9 等步長減小到0.2,令b=1-ε刻畫細胞自身的欠修復能力。對應細胞的欠修復能力b從0.1 等步長增長到0.8。由圖8 可知,信息細胞的欠修復能力越弱,其自愈率越高,導致由G1 監控單元中的信息風險所造成的故障規模越小。因此通過增強信息細胞節點的自我修復機制,可以有效提升配電網抵抗風險傳播的能力。

圖8 自愈率對電力故障規模的影響Fig. 8 Impact of cure rates on the scale of failure

3 結語

為了實現對配電網中信息系統風險的傳播過程的精確刻畫,本文利用知識圖譜與細胞自動機技術相結合的方法實現對配電網信息系統的風險分析。首先通過知識圖譜技術實現配電網中與風險關聯的多源異構數據的有效提取和融合,構建反映配電網風險實體關聯關系的知識圖譜三元組,實現對信息系統風險的靜態刻畫;進而構建配電網風險分析的細胞自動機模型,設計細胞狀態轉變機制,實現對配電網中信息系統風險傳播過程的動態分析。在未來研究中,應著重考慮細胞狀態轉換時間對風險定量分析的影響,并考慮風險在信息系統中的傳播速率與仿真時間間隔的對應關系,以進一步精細刻畫風險傳播的過程。

猜你喜歡
圖譜配電網實體
基于圖對比注意力網絡的知識圖譜補全
繪一張成長圖譜
前海自貿區:金融服務實體
配電網FTU配置優化方法研究
實體書店步入復興期?
10千伏配電網線損原因與管理策略探析
圖表
關于城市10kV配電網自動化實施的探討
兩會進行時:緊扣實體經濟“釘釘子”
振興實體經濟地方如何“釘釘子”
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合