?

基于隨機森林的智能電網多源數據異常檢測

2024-04-13 06:54王金忠吳焰龍
電子設計工程 2024年7期
關鍵詞:傳輸速率電網森林

王金忠,吳焰龍

(國網寧夏電力有限公司寧東供電公司,寧夏銀川 750411)

隨機森林是一種分類器結構,可以利用樹狀節點組織實施對樣本數據的訓練與預測處理。在機器學習領域中,一個隨機森林分類器同時包含多個決策樹組織,且數據樣本輸出類別可由決策樹節點指標取值直接決定[1]。一個穩定的隨機森林模型能同時面對多種不同的數據樣本,并在判斷樣本信息所屬類別時,確定評估變數指標的取值范圍。與其他類型的分類器結構相比,隨機森林模型不需要平衡數據樣本之間的誤差關系,只要數據樣本之間的親近度關系滿足隨機性原則,就可以認定這些樣本信息屬于同一個數據集合[2]。決策樹組織作為隨機森林模型的核心應用結構,其對于數據樣本的承載能力決定了隨機森林模型對于數據信息參量的實時處理能力。

智能電網是一種新型的電力應用網絡,為了實現高度智能化的電網調度,需要不斷完善電力設備之間的連接關系,一方面提升輸電信號的瞬時傳輸速率,另一方面避免電網多源異常數據出現過度堆積的情況[3]。隨著智能電網多源數據輸出量的增大,常規數據、異常數據會混合在一起,但由于二者之間傳輸速率的差異相對較小,智能電網主機面臨難以精準檢測多源異常數據的問題?;诙喑叨鹊椭饶P偷臋z測方法通過定義隱含異常數據的方式,確定數據樣本的實時傳輸速率[4]。然而此方法并不能在保證常規數據傳輸速率的同時避免異常多源信息出現快速傳輸的行為。為解決上述問題,設計基于隨機森林的智能電網多源數據異常檢測算法。

1 暫態穩定性評估

1.1 隨機森林構建

隨機森林模型的構建包括樣本極值求解、表達式總結兩個處理環節[5-6]。對智能電網多源數據而言,基于隨機森林模型的樣本極值由極大值與極小值組成,求解如下:

式中,χ表示智能電網多源數據樣本的統計系數,e表示隨機向量的初始賦值,r表示多源數據樣本的編碼向量,qr表示基于r向量的數據樣本特征,ir表示數據樣本的多源定義系數。設α、δ為兩個隨機選取的數據樣本模系數,u^ 為智能電網多源數據的暫態度量特征。聯立式(1)、(2),可將隨機森林模型表達式定義為:

為實現智能電網多源數據的準確分類,在構建隨機森林模型時,要求系數α、δ的取值恒不相等,且系數樣本的取值量隨智能電網多源數據累積量的增大而增大。

1.2 評估指標的選取

評估指標的選取是基于隨機森林模型檢測智能電網多源異常數據,可以將異常多源信息與常規傳輸數據區分開來,從而幫助智能電網主機準確辨別待測對象。由于智能電網空間對多源數據的存儲能力極強,所以在實施評估指標選取時,必須按照隨機森林模型準確定義異常樣本參量的傳輸能力[7-8]。設γ為多源數據參量的異構系數,在智能電網環境中,γ≠0 的不等式條件恒成立。

基于隨機森林模型的評估指標選取表達式為:

式中,φ表示異常信息樣本置信度系數的初始賦值,i1、i2、…、in表示n個不同的智能電網多源異常數據存儲特征,β表示基于隨機森林模型的數據樣本辨別系數。在智能電網環境中,n系數取值越小,就表示異常多源信息的實時存儲量越少。

1.3 暫態穩定裕度

暫態穩定裕度可以用于評估智能電網的運行穩定性,在評估指標選取結果保持恒定的情況下,穩定裕度指標的求解數值越大,就表示智能電網的運行穩定性越強[9-10]。在隨機森林模型中,對于暫態穩定裕度指標的計算需要同時考慮評估指標度量值與異常多源信息的表征參量。評估指標度量值可表示為φ,在求解暫態穩定裕度表達式時,要求系數φ的取值必須大于自然數1。異常多源信息表征參量可表示為λ,隨著智能電網多源數據存儲量的增大,系數λ的取值也會不斷增大。聯立上述物理量,可將暫態穩定裕度表達式定義為:

②多信道:配置了亞洲4號、3G(電信、聯通)、亞洲 5 號(預留)等多種通信信道,實現多信道互備,提高了應急通信的可靠性。

式中,k表示暫態標記系數,k→表示異常多源數據的存儲向量。規定在檢測異常智能電網多源數據時,存儲向量的最小取值結果只能為1。

2 異常檢測算法

在隨機森林模型的支持下,構建Hadoop 檢測框架,再按照多源數據負荷特征求解、異常值檢測系數計算的處理流程,實現智能電網多源數據異常檢測算法的應用。

2.1 Hadoop檢測框架

Hadoop 框架是實現智能電網多源數據異常檢測的關鍵應用結構,框架包含Spark SQL、Spark Streaming、MLlib、Graphx、MapReduce 五類節點。RDD 模塊作為核心檢測設備,可以接收智能電網主機輸出的多源數據樣本;Spark SQL 節點負責混合數據的存儲;MLlib 節點可以將常規數據從混合樣本中分離出來;Spark Streaming 節點可以將異常數據從混合樣本中分離出來;Graphx 節點負責傳輸常規數據樣本;MapReduce 節點負責傳輸異常數據樣本[11-12]。完整的Hadoop 檢測框架結構如圖1 所示。

圖1 Hadoop檢測框架結構

為將常規數據樣本與異常數據樣本準確區分開來,在將混合數據樣本反饋至各級節點組織之前,RDD 模塊需要對智能電網輸出的多源數據樣本進行多次重復辨別。

2.2 多源數據負荷特征

負荷特征是表示異常智能電網多源數據分布密集程度的量化參數[13]。在智能電網環境中,一般不直接計算整個區域內的電信號負荷密度,而是將整個檢測區域按照功能屬性的不同,分成多個子區域,再利用隨機森林模型,完成對異常多源數據參量的單獨預測。在隨機森林模型的認知中,異常負荷特征具有可遷移的特性,隨著智能電網多源數據輸出量的增大,特征指標的計算結果也會不斷增大[14]。設為常規電網多源數據的度量向量,為異常電網多源數據的度量向量,且的不等式條件恒成立,聯立式(5),可將基于隨機森林的異常智能電網多源數據負荷特征表達式定義為:

其中,κ表示電信號負荷系數。智能電網檢測區域劃分標準的不同,會導致多源數據負荷特征求解結果出現差異性。

2.3 異常值檢測系數

異常值檢測系數決定了智能電網主機對異常多源數據信息的處理能力。在已知多源數據負荷特征求解結果的情況下,計算異常值檢測系數既要考慮隨機森林模型的約束作用能力,又要參考多源信息節點的實際定義形式[15-16]。設g1、g2、…、gn為n個隨機選取的多源數據節點定義系數,μ為異常值指標的檢測度量系數,f為異常智能電網多源數據的選擇參量,j為常規數據定義項,j′為異常數據定義項。聯立上述物理量,可將異常值檢測系數求解結果表示為:

至此,實現對各項指標參量的計算與處理。在不考慮其他干擾條件的情況下,完成基于隨機森林的智能電網多源數據異常檢測算法的設計。

3 實例分析

3.1 前期準備與實驗步驟

選擇S11-M 型變壓器設備作為實驗對象,將其置于220 V 的電路環境中,閉合控制開關,調節變阻器、逆變器等多個設備元件,使變壓器設備保持相對穩定的工作狀態。利用7090MT 主機捕獲變壓設備輸出的多源數據信息,借助Linux 軟件將常規傳輸數據與多源信息異構體分離開來,并分別對這些數據對象進行后續處理。

表1 反映了實驗所選設備的具體型號。

表1 實驗設備選型

按需連接表1 中的各個電路元件。首先利用基于隨機森林的智能電網多源數據異常檢測方法控制數據處理主機,記錄電量表示數值,將所得數據作為實驗組變量;然后利用基于多尺度低秩模型的檢測方法控制數據處理主機,記錄電量表示數值,將所得數據作為對照組變量;最后對比實驗組、對照組變量數據,總結實驗規律。

3.2 實驗結果

在智能電網環境中,數據傳輸速率可以用來描述電網主機對于多源數據樣本的檢測能力,故該次實驗以多源電網數據傳輸速率作為研究對象,記錄在實驗組、對照組檢測方法作用下,常規數據傳輸速率、異常數據傳輸速率的數值變化情況。在常規數據傳輸速率保持較高水平的情況下,異常數據傳輸速率越慢,電網主機對于這一類信息樣本的檢測能力也就越強。

表2 記錄了實驗組、對照組檢測方法作用下,常規數據傳輸速率的數值變化情況。

表2 常規數據傳輸速率

分析表2 可知,在實驗組檢測方法作用下,常規數據傳輸速率均值為5.64 MB/ms,與標準數值相比,下降了0.02 MB/ms,二者差值相對較??;在對照組檢測方法作用下,常規數據傳輸速率均值為5.34 MB/ms,與標準數值相比,下降了0.32 MB/ms,差值遠高于實驗組。

圖2 反映了實驗組、對照組異常數據傳輸速率的數值變化情況。

圖2 異常數據傳輸速率

分析圖2 可知,在智能電網環境中,異常數據傳輸速率呈現出先增大、后減小的數值變化狀態。整個實驗過程中,實驗組數據傳輸速率最大值為2.36 MB/ms,與對照組最大值3.79 MB/ms 相比,下降了1.43 MB/ms。

綜上可知,在基于多尺度低秩模型的檢測方法的作用下,常規數據傳輸速率與標準傳輸速率數值相比明顯下降,且異常數據的傳輸速率水平也沒有得到有效控制;在基于隨機森林檢測算法的作用下,常規數據傳輸速率依然保持在較高的數值水平,而異常數據的傳輸速率卻得到了有效控制,說明此方法在一定程度上能夠促進電網主機對多源數據樣本檢測能力的增強。因此可得,基于隨機森林的智能電網多源數據異常檢測算法更符合精準檢測電網多源異常數據的實際應用需求。

4 結束語

為提升智能電網多源數據異常檢測的準確性,提出基于隨機森林的智能電網多源數據異常檢測方法。根據隨機森林模型,選取關鍵評估指標,通過求解暫態穩定裕度系數的方式,計算多源數據負荷特征與異常值檢測系數。實驗結果表明,該算法能夠在保證常規數據傳輸速率的同時,避免異常多源信息出現快速傳輸的行為,可以提升智能電網主機對于電網多源異常數據的檢測能力。

猜你喜歡
傳輸速率電網森林
穿越電網
跨山通信中頻段選擇與傳輸速率的分析
哈Q森林
哈Q森林
數據傳輸速率
哈Q森林
哈Q森林
電網也有春天
一個電網人的環保路
電網環保知多少
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合