?

LSTM 模型在用電信息采集系統數據計量分析

2024-01-31 10:35鄒賢求
電氣技術與經濟 2024年1期
關鍵詞:置信區間電表用電

鄒賢求

(國網湖南省電力有限公司婁底供電分公司)

0 引言

利用用電信息采集系統可以通過遠程方式對相關計量點的數據信息進行采集[1],截至目前已經在我國幾億只電能計量器上得到應用。對于采集得到的電壓、功率、電流等數據信息可以上傳至系統站中,利用大數據分析技術進行處理,以便及時掌握電表的運行狀態,發現存在的問題[2]。由于大量的電表在應用過程中,受到各類環境因素影響,難免出現故障問題,通過數據分析可以及時發現計量異?,F象,不需要利用傳統的人工方式進行排查,能顯著提升工作質量和效率,為電力企業的經濟效益提供堅實的保障[3]。本研究利用長短期記憶網絡(LSTM)模型,對用電信息系統采集的數據信息進行深度挖掘分析,可以及時發現計量異?,F象。通過實踐測試發現其具有良好的效果,值得進一步推廣應用。

1 用電信息采集系統數據的特點

我國當前使用的電表通常為智能電表,電表采集得到的電壓、電流、功率,包括有功功率和無功功率,及其隨時間的演變情況等信息,能夠很好地反映出智能電表的實際工作狀態[4]。利用用電信息采集系統對智能電表的上述信息進行采集,基于先進的數據分析技術進行處理,可以及時發現電表計量過程中存在的異常問題。一般情況下表計異常點比較隱蔽,且會持續比較長的時間,實踐過程中發現表計異常點主要表現為三種形式,分別為數據偏大、數據偏小、數據持續缺失。如果存在數據缺失問題,在數據預處理階段就可以發現。針對其他問題則需要進行深入的數據挖掘分析,不同用戶的用電行為特征與大小存在很大差異,所以需要基于系統采集的數據信息進行深度的數據挖掘與甄別,才能發現用戶的用電行為異?,F象。

如果表計數據信息出現持續性的數據偏小或者偏大,而沒有按照正常的規律變化,那么可以根據數據庫中存儲的此類異常點之前的數據信息進行數據分析,很快就可以確定異常點的開始時間[5]。如果數據庫中沒有存儲足夠的數據信息,那么將很難查找到異常點開始時間,此時就需要利用電力模型確定異常點開始時間,比如對線損率進行排查計算,但這類方法需要依賴很多的數據信息,計算量和工作量很大,工作質量和效率不高。本文基于長短期記憶網絡(LSTM)模型進行數據挖掘分析,能夠快速的確定表計數據的異常情況,效率較高。

2 數據分析模型概述

2.1 模型概述

本研究利用深度學習算法對用電信息采集系統收集得到的數據信息進行挖掘分析,判斷存在的電表計量異常問題,具體為長短期記憶網絡(LSTM)模型。利用深度學習算法時需要利用已有的數據信息對模型進行訓練與驗證,然后可以利用該模型對電力用戶未來的電流、電壓以及功率等數據進行準確預測,基于預測結果設置一個置信區間。如果實際結果正好處在置信區間范圍以內,則認為不存在異常問題。相反的,如果實際結果不處在置信區間范圍以內,則認為實際結果與預測結果之間存在明顯的偏差,可以認定對應的采集點存在數據計量異常問題。下文將對LSTM模型進行深入介紹,基于該模型可以對電壓、電流、功率等常見的電參數的異常點進行有效甄別。模型需要輸入的是電流、電壓或者功率的歷史數據信息,模型輸出的是下一個采集點的置信區間,并將實際結果與置信區間進行對比,判斷是否存在異常問題。

2.2 模型結構

整個LSTM模型可以劃分成為不同的結構,每個結構均具有對應的功能,所有功能結合起來就可以實現電流、電壓、功率結果的預測與分析。具體包括遺忘門結構、輸入門結構、當前輸入單元狀態、當前時刻單元狀態、輸出門的計算結構等。以下對各結構或狀態的情況進行簡要介紹。

對于遺忘門結構的計算過程可以利用式(1)表示:

式中,Wf為遺忘門結構的權重矩陣;bf為遺忘門結構的偏置矩陣;[ht-1,xt]表示將括號內的兩個量進行拼接,ht-1、xt分別表示LSTM模型前一時刻的輸出以及當前時刻的輸入情況;σf表示遺忘門激活函數。

對于輸入門結構的計算過程可以利用式(2)表示:

式中,σi表示輸入門的激活函數;Wi為輸入門結構的權重矩陣;bi為輸入門結構的偏置矩陣。

利用c′表示當前時刻輸入的單元狀態,具體操作時可以利用式(3)進行計算:

式中,Wc為該單元的權重矩陣;bc為該單元的偏置矩陣。

利用ct表示當前時刻的單元狀態,該狀態主要由兩部分構成:第一是基于前一時刻的單元狀態ct-1獲得,具體是ct-1與遺忘門ft相乘;第二是基于當前輸入單元的狀態獲得,具體是c′t與輸入門it相乘。具體計算過程可按式(4)進行:

式中,符號“?”表示根據元素進行相乘。根據以上公式,LSTM模型可以把當前記憶c′t和長期記憶ct-1進行有效結合,最終構建出新單元狀態ct。

輸出門的計算過程可以按式(5)進行處理:

式中,σo表示輸出門的激活函數;Wo表示輸出門的權重矩陣;bo表示輸出門的偏執矩陣。

3 異常數據甄別基本測試分析

3.1 模型的訓練

利用LSTM模型對功率大小實施預測,可以得到待測時間點功率大小的概率預測置信區間范圍。主要的網絡模型結構參數如下:循環神經網絡為4層,包括輸入層、LSTM層、普通隱含層、輸出層,其中輸入層為96×1序列輸入,LSTM層和隱含層分別設置有8個節點和4個節點,輸出層的節點數量只有1個。系統每間隔15min采集一次數據信息,利用該模型可以利用96個點的歷史數據信息對未來一個時刻的數據進行預測。使用模型之前需要利用歷史數據信息對LSTM模型進行訓練,本案例中準備的訓練樣本信息為5856個,共完成了400次迭代訓練,訓練批數為512次,每次迭代運算需要使用4~5批數據信息。其中訓練的數據可以分為兩種類型,分別為訓練集和驗證集,其中驗證集占所有數據信息比例的5%。利用歷史數據信息對模型進行訓練和驗證以后,發現利用模型得到的數據信息基本在100%置信區間范圍以內,并且整個置信區間的范圍非常窄,意味著LSTM模型對功率進行預測的置信區間具有很好的效果,且區間范圍對于異常數據信息的分析識別具有非常好的參考意義。如果實際的參數信息超過了模型預測的置信區間范圍,那么說明實際參數信息與歷史數據樣本信息的時序規律不相符,屬于異常數據點。

3.2 評價指標

對于本研究所述的異常數據信息分析模型,可以采用兩個重要的指標進行評價,分別為檢出率和誤檢率,以上兩個指標分別用kacc、kerr符號表示,其計算公式如下:

式中,Nb表示實際所有的異常點數目;Nt表示利用模型正確檢測出來的異常點數目;Nf表示錯誤檢測的異常點數目。

使用不同大小的噪聲方差對不同類型的參數信息進行預測,對兩個關鍵指標進行了統計計算。對于電壓參數信息,當噪聲方差為0.5V2時,kacc和kerr分別為79.66%和16.94%;當噪聲方差為0.7V2時,kacc和kerr分別為83.05%和13.55%。對于電流參數信息,當噪聲方差為0.01A2時,kacc和kerr分別為72.88%和25.42%;當噪聲方差為0.05A2時,kacc和kerr分別為77.97%和18.64%。對于功率參數信息,當噪聲方差為7kW2時,kacc和kerr分別為67.8%和15.25%,當噪聲方差為13kW2時,kacc和kerr分別為76.27%和13.55%。上述所有參數中,kacc和kerr的平均數分別為76.27%和17.23%。

4 實際電表電流和功率的測試結果

為了驗證LSTM模型在用電信息系統數據計量異常分析中的應用效果,結合實際情況選取了三只存在異常數據的智能電表為對象進行分析,電表分別用Ⅰ、Ⅱ、Ⅲ序號表示。選取的是2023年3月6日~5月7日的數據信息,每間隔15min采集一次數據信息,在兩個月時間里共測量得到了5952個點的數據信息,主要是功率值、電壓值和電流值等,利用上文提出的LSTM模型對計量異常數據信息進行識別,以達到檢驗LSTM模型的目的。下面對具體的測試過程以及結果進行分析。

4.1 電流變化率過大異常問題

在普通電力用戶一天的用電過程中,其電流值通常不會出現明顯的變化,如果通過分析發現用戶的電流存在明顯突變現象,大概率是存在計量異常問題。如圖1所示為電表Ⅰ的電流大小以及電流變化情況,圖中顯示的是電表Ⅰ在3月6日的電流數據及其變化情況,從圖中可以看出,第37個采集點的電流及其電流變化值存在異?,F象,利用LSTM模型判定為異常點數據,異常的根據是電流變化率過大,與實際數據進行對比分析,發現異常點的甄別判斷是有效的。

圖1 電表Ⅰ的電流大小以及電流變化情況

4.2 功率變化率過大異常問題

普通電力用戶的用電功率不會出現明顯的變化,如果用電功率存在突變問題,則很可能是存在計量異常問題。如圖2所示為電表Ⅱ的功率大小以及功率變化情況,圖中顯示的主要是4月25日電表Ⅱ的數據信息。

圖2 電表Ⅱ的功率大小以及功率變化情況

從圖中可以看出,在第57個采集點的功率以及功率變化值出現了顯著的變化現象。利用LSTM模型進行分析判斷后,認為第57個采集點屬于異常點數據信息,判斷的根據是該采集點的功率存在突變現象。通過與實際情況進行對比,認定該異常點的甄別是有效的。

4.3 電流功率相關性異常問題

根據相關的理論可知,對電力用戶而言,其用電功率與電流的平方是成正比的,意味著電力用戶的電流越大,對應的功率也越大。如果通過用電信息采集系統采集得到的電流和功率數據信息之間不匹配,則大概率是存在計量異常問題。如圖3所示為電表Ⅲ的電流大小以及功率變化情況,圖中顯示的是5月7日電表Ⅲ的數據信息。利用LSTM模型對相關的數據進行深入挖掘分析以后,認為第75個采集點的數據信息存在異?,F象,主要的根據是第75個采集點的電流值相對較小,但是功率值卻相比較大。這與基本的電力常識相沖突,因為在電壓保持不變的情況下,功率應該與電流的平方成正比。通過與實際情況進行對比,發現該采集點確實存在數據異?,F象,驗證了LSTM模型甄別判斷過程的有效性。

圖3 電表Ⅲ的電流大小以及功率變化情況

利用LSTM模型對智能電表的異常數據進行分析時,可以結合實際情況決定是否將相關結果反饋給有關部門。如果某一個智能電表在一段時間內只是出現個別異常數據信息,則需要對該異常點的前后數據信息進行更加細致地排查,確定是否出現了數值偏小或者數值偏大的更加隱蔽的數據計量異常問題,如果不存在上述問題,可以認定為是偶然現象,無需向有關部門進行反饋;如果某一個智能電表在很短的時間內出現了很多次異常數據點,可以認定該電表存在計量異?,F象,需要及時將結果反饋給有關部門。

綜上所述,針對用電信息采集系統收集得到的數據信息,利用LSTM模型進行深入地挖掘分析,可以及時發現智能電表計量過程中存在的問題,該模型是可行有效的。通過與實際的數據信息對比,發現平均檢出率和平均誤檢率分別為76.27%和17.23%。能夠大幅縮小故障問題的排查范圍,為電力企業提供很好的現實參考價值。

5 結束語

在人工智能的發展歷程中,LSTM模型以其卓越的數據建模和推理能力,得到了全球學術界和業界的廣泛關注和推崇。針對用電信息采集系統采集的電壓、電流、功率等大量數據信息,通過運用LSTM模型進行深度挖掘和分析,能夠快速準確地發現電表計量過程中存在的異常問題。通過實踐測驗發現LSTM模型的平均檢出率和平均誤檢率分別為76.27%和17.23%。這些測試結果有力地證明了LSTM模型的實用性和有效性,這對于進一步推廣LSTM模型在用電信息采集系統數據計量異常分析中的應用具有重要的現實意義。

猜你喜歡
置信區間電表用電
用電安全
巧判電表測量對象
定數截尾場合三參數pareto分布參數的最優置信區間
電表“對”與“錯”歸類巧掌握
p-范分布中參數的置信區間
用煤用電用氣保障工作的通知
多個偏正態總體共同位置參數的Bootstrap置信區間
安全用電知識多
用電安全要注意
列車定位中置信區間的確定方法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合