?

基于NB-IoT 與深度學習的校園用電監控及預測

2024-04-16 03:25吳游龍彭晨席云李龍祥李軍
電子制作 2024年6期
關鍵詞:編碼器工科預處理

吳游龍,彭晨,席云,李龍祥,李軍

(吉首大學 通信與電子工程學院,湖南吉首,416000)

隨著電力系統向交互性和智能化的方向發展,傳統電力系統已較難適應現代電力需求,因此智能電網近幾年來成為研究熱點[1]。智能電網往往利用各類通信技術采集負荷數據進行分析和預測,以更好地實現電力供應和需求之間的平衡,有學者提出物聯網在智能電網中有著廣闊的應用前景[2~3]。目前大型負載級別的分析和預測較為常見,而在大學校園與一般辦公區域的負荷分析預測仍然較少[4]。主要原因在于此類小型負載用電規律性不強,使預測結果往往存在較大偏差。同時,由于用電采集設備成本的限制,使采集到的用電數據往往存在部分異常和空白時段。本項目中,筆者用電氣測量裝置結合窄帶物聯網(Narrow Band Internet of Things,NB-IoT)技術對學校辦公大樓的用電數據進行采集;采集到的用電數據在通過多層清理后,消去了空白時段與異常點,數據質量得到了提升。同時,為了改善校園級的小型負載用電情況規律性不強對預測結果的不良影響,本文采用Informer 神經網絡模型進行負荷預測。該模型本為長時間序列預測設計,在應用于本項目時也改善了短期數據規律性不強的影響,提高了時間序列預測的推理速度及預測結果的準確性[5]。

1 數據采集系統的實現

■1.1 開口式電流互感器

常規的電流互感器通常是閉合磁路,采用閉合磁路可以確保磁路中的磁阻抗較低,有效地將一次側的電能傳輸到二次側端。然而,此類設計有一個比較顯著的缺陷:若一次側的電流中有直流分量,將導致磁路的磁阻非常低,使得閉磁路內存在較高的直流磁通量,最終導致鐵芯磁化曲線工作點進入飽和區,造成測量誤差。針對傳統電流互感器的固有缺點,本項目采用了開口式電流互感器。它的工作原理是在磁路上插入一個空氣隙的磁阻,以減少一次側的直流成分對鐵芯所產成的磁通[6]。由于鐵芯的磁導率要大于空氣的磁導率,所以其仍能形成較高的磁阻,從而確保電流互感器芯磁化曲線的工作點在線性區域,采用的開口式電流互感器參數規格為200/5A。

■1.2 NB-IoT 技術

近幾年來NB-IoT 通信技術在各類智能表數據采集傳輸中應用得越來越廣泛,是當前物聯網發展的主流技術之一。NB-IoT 技術屬于低功耗廣域網,其依托3GPP 技術規范而制定,具有低功耗、低成本、高連接能力、強覆蓋能力等優點。不僅可以應用于地下室或隧道等偏遠惡劣用電負荷的終端,而且能滿足各類超遠程、多終端的智能裝置的數據采集及通信需求[7]。

■1.3 工科樓實時負荷數據采集

本系統使用準同步采樣,準同步采樣是指被采樣周期信號的周期T 不等于采樣周期ts 的整數倍的采樣[8]。使用開口式電流互感器與依托A/D 轉換器計量芯片的采集器對負載端開展實時采集,每隔6 分鐘對系統電氣量進行一次采樣,通過采集系統收集到的數據為:單、三相電壓電流及有功功率、無功功率。同時為了增強所搭建的數據采集系統的數據傳輸覆蓋率,使用NB-IoT 通信技術對其數據進行傳輸。如圖2 所示,搭載NB-IoT 的數據采集電表,可將采集數據經窄帶開關系統(Narrowband switching system,NBSS)通過NB-IoT 網絡實時傳輸至IoT 平臺,實現數據的高效采集,再由算法程序整理為excel 表格,每一個時刻的數據都會打上相應的時間戳,方便后續的數據分析與預測工作的展開。

圖2 NB-IoT 數據傳輸原理圖

2 數據預處理

數據預處理是時間序列分析和預測的重要步驟,本研究使用了pandas_profiling 進行探索性數據分析。分析結果表明,數據集中存在部分異常點和零值。故在數據預處理階段須對這些異常點剔除,零值進行插值填補,下面展示數據處理前后的情況。

■2.1 總體數據情況

圖3 給出了所采集數據的總體概況,包括變量個數(Number of variables)、 樣 本 行 數(Number of observations)、缺失行數(Missing cells)、缺失率(Missing cells)、重復行數(Duplicate rows)、重復率(Duplicate rows)等。如圖4 所示,經過預處理后的數據缺失率達到0%,重復率0%。

圖3 原始數據總體概況

圖4 預處理后數據總體概況

■2.2 單變量分析

從單變量分析的結果亦可看出預處理后效果,如圖5所示,單相電壓值個數為1011,其中最大值為243.9,最小值為0,對其進行預處理后,缺失率由原先的43.3%下降至小于0.1%。

圖5 原始單相電壓

圖6 預處理后單相電壓

利用相同的方法對單相電流、單相有功功率進行預處理后,使數據缺失率均降至0.1%左右。

■2.3 相關性分析

在統計學上,Pearson 的線性相關系數是衡量兩個變量X、Y 的相關性的度量標準,其數值在[-1,+1]之間[9]。假定存在X、Y 這兩個變量,那么用如下公式可以得到X 與Y 之間的 Pearson 系數:

其中E 是數學期望,cov 表示協方差。在此,需要指出,Pearson 相關系數只是其中可能性之一,而要利用Pearson 線性相關系數,就必須假定這些數據是由正態分布對得到的,同時數據必須是等間距的。當兩個條件不一致時, Pearson 相關系數可以用可以使用 Spearman 相關系數替代。

而對于Spearman 相關系數,其是一個非參數性質(與分布無關)的秩統計參數,用來度量兩個變量之間聯系的強弱[10]。假設X 和Y 為兩組數據,則Spearman 相關系數計算公式如下:

其中,d i為Xi和iY之間的等級差,ρ位于-1 和1 之間。圖7 為預處理前后的Pearson 和Spearman 相關矩陣輸出。通過數據處理后,兩兩變量間的相關性水平整體得到糾正,其中電流與有功功率的相關性接近于1,符合功率計算準則。

圖7 預處理前后的Pearson 和Spearman 相關矩陣輸出

3 Informer 預測模型

本研究使用神經網絡模型Informer,預測方法如圖8所示。模型主要由四個部分組成,分別為探索性數據分析模塊、編碼器、解碼器以及全連接神經網絡。輸入數據先經過數據分析及處理,以抽取并推導出對實現工科樓負荷預測有價值、有意義的數據。接下來,編碼器負責將輸入的負荷特征序列進行編碼,映射為包含輸入特征信息的中間向量。解碼器負責將編碼器輸出的中間向量解碼為輸出序列,訓練好的模型通過全連接層獲得最終的預測結果。

圖8 預測流程圖

■3.1 編碼器

編碼器主要由自注意力機制和蒸餾層組成。Informer模型中的自注意力機制通過較少的計算量從輸入的負荷特征序列篩選出少量最重要的信息,使得模型聚焦于最為重要的信息上多頭注意力機制可以從不同的表現子空間聚焦于重要信息,從而避免嚴重的信息損失。蒸餾層通過一維卷積和池化操作實現降維,可以起到減少維度和網絡參數量的目的。

編碼器的核心原理為多頭概率稀疏自注意力機制。與Transformer 中的自注意力機制一樣,多頭概率稀疏自注意力機制也是通過計算特征向量間的相似度來表征相關性,以此解決長距離依賴問題。不同的是多頭概率稀疏自注意力機制計算復雜度大大減少了。Informer 通過Kullback-Leibler 散度公式區分每一個查詢矩陣的概率分布和均勻分布的相似性從而篩選出重要的查詢矩陣。通過隨機選擇U 個點積對計算注意力使得復雜度降低,選出其中的 u 個對注意力貢獻最大的查詢矩陣計算特征矩陣的注意力值,最終的計算公式如下:

式中:Q的平均為篩選后的查詢矩陣,K為鍵矩陣,V為值矩陣。

■3.2 生成式解碼器

解碼器包含多頭掩碼概率稀疏自注意力層與多頭概率稀疏自注意層。將掩碼操作應用于注意力的計算中,可以防止每個位置都關注未來的位置,從而避免了自回歸。解碼器中的自注意層與編碼器中的不同,其鍵矩陣K 與值矩陣V 來自編碼器的輸出,查詢矩陣Q 來自多頭掩碼概率稀疏自注意力機制模塊的輸出。最后,通過一個全連接層獲得最終的對工科大樓照明預測的結果。Informer 所提出的生成式解碼器只需一個前向步驟即可得到所有的預測結果,提升了長序列預測的速度,同時也避免了誤差的累積。

4 實驗結果分析

■4.1 數據集

實驗使用的是校園工科大樓的用電數據,該數據集以分鐘級別記錄了工科大樓2021 年上半年期間的用電情況。數據集包含了單相電壓、三相電壓、頻率及總有功尖電量等數十種電力數據類型。其中,單相電流、單相電壓、單相有功功率以及日期特征被作為模型輸入,功率因素作為模型預測的目標值。訓練集/驗證集/測試集的大小分別為4/1/1個月。

■4.2 評價指標

為了評估Informer 模型對于工科大樓用電負荷預測的能力,本研究采用了兩個常用的評價指標,平均絕對誤差(Mean Absolute Error ,MAE) 和 均 方 誤 差(Mean Square Error,MSE)。

式中n 為訓練樣本的個數,yi表示工科樓實際歷史負荷值,^yi表示模型輸出的預測值。MAE 和MSE 取值范圍都在[0,+∞)之間,其值越接近0,說明預測模型擁有更好的效果。

■4.3 實驗參數設置

Informer 預測模型的編碼層與解碼層的參數分別設置為3 和2,所有的多頭注意力層的頭數均為8。初始學習率設置為0.0001 并隨機初始化權重矩陣。Log-cosh 被用作損失函數并以Adam 優化算法進行訓練。批次大小設置為32,epochs 總數為6。

模型以Pytorch 深度學習框架實現,數據集的輸入均采用零歸一化以消除不同量綱在回歸預測中所帶來的誤差。

■4.4 結果分析

隨機選取連續三天的上午、晚上和下午的時間段,圖9 展示了采用Informer 算法作為預測模型時,功率因素(Power factor)真實值與預測值的對比。其中Ground Truth 為真實值,Prediction 為預測值,評價指標MSE 值0.796、MAE 為0.690,且由圖可以看出Informer 模型能夠在一定程度上較好地擬合實際值曲線。

圖9 預測結果對比圖

5 結語

電力負荷預測的準確性對于發電容量調度和電力系統管理具有重要意義。本研究將基于NB-IoT 技術的電流互感器安裝到校園工科大樓配電箱,獲取了工科樓的用電數據,并進行了全面的負荷分析、預測。其預測結果在一定程度上可以較好擬合實際的負荷曲線,其分析與預測方法將可推廣到智能電網、用電負荷數據挖掘以及非侵入式故障檢測等方向的研究。但是其仍然存在一定的進步空間,如數據集時間跨度不夠,應最好超過一年,使得預測結果更加規律準確。其次可以使用校歷信息,如節假日標簽、學院活動標簽等。因此可以針對此類問題做出進一步的完善與改進,其預測結果將會更加準確與科學。

猜你喜歡
編碼器工科預處理
87年工科“學霸”成都追夢記
新工科下創新型人才培養的探索
新工科背景下項目推動式教學模式的探索
基于FPGA的同步機軸角編碼器
基于預處理MUSIC算法的分布式陣列DOA估計
基于PRBS檢測的8B/IOB編碼器設計
淺談PLC在預處理生產線自動化改造中的應用
JESD204B接口協議中的8B10B編碼器設計
絡合萃取法預處理H酸廢水
工科研究生教學模式的思考與創新
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合