?

基于停電圖紋識別線變關系的實現

2018-11-08 03:27湖南國網永州供電公司湯新華
大眾用電 2018年10期
關鍵詞:圖紋歸類臺區

● 湖南·國網永州供電公司 蔣 濤 湯新華 李 娟

線變關系是指供電企業線路與變壓器之間的對應關系,通常每臺變壓器都連接到固定的線路上,線變關系正確與否將直接影響到配電搶修效率和優質服務質量的好壞,同時也決定著線損計算正確與否。目前核對線變關系的主要方法是現場核對,通過現場與圖紙、系統對比,發現差異并整改問題,實現三者的統一。對配電變壓器新增、改接、銷戶引起的線變關系變動要加強管理,確保系統檔案與現場一致,避免前清后亂。實際工作中,受多種因素影響,線變關系在系統檔案中會出現與現場不一致的情況,管理人員難以及時發現檔案中存在的問題。

基于“同一線路終端停電時間一致”原理,永州供電公司利用數據挖掘技術建立識別模型,為識別檔案中線變關系正確與否提供一種新的手段,可以極大地提高線變關系核對效率,減少大量的人工操作。

1 數據概要

隨著電力采集終端在現場安裝率和運行穩定性的不斷提高,利用其對現場臺區運行狀況進行監測已成為現實?,F場運行的終端根據自身供電情況產生對停/上電的判斷,并將判斷結果主動上報形成停/上電記錄,記錄僅局限于對單個終端的運行工況。

1.1 停電數據的生成

停電事件的生成包括終端停/上電和電能表掉電事件的生成。本文僅分析與線路有關的臺區停電數據,因此重點研究終端停/上電數據的生成。

根據《智能電能表及采集終端事件記錄采集規則》,終端停/上電事件為1級緊急事件,終端生成事件后,采集終端采用光纖、手機網絡等方式主動上報事件數據到主站,而后主站向終端下發確認命令。

1.2 停電數據的干擾因素

由于用電現場環境復雜、情況多變,采集終端可能由于供電回路異常、軟件設計差異、通道通信、終端時鐘等原因,出現現場未停電情況下生成停電事件并主動上報主站,或是發生了一次停電卻多次上報停電事件等情況。因此,在利用停電數據進行數據分析時,要充分研究停電事件生成原理,掌握終端停/上電數據質量的影響因素,對誤報干擾信息進行清理,保留有價值的數據。

2 實現過程

終端停/上電數據來源為“電力用戶用電信息采集系統”中的主站停/上電事件查詢,由縣供電公司分月導出。整個實現過程分成5個步驟,分別是數據可視化、數據清洗、數圖轉換、聚類分析和結果可視化,其中數據清洗、數圖轉換、聚類分析3個步驟重點在于對數據進行處理,由于涉及到大數據量的計算,可以通過Python編程形成一個可執行文件自動完成;數據可視化和結果可視化使用Tableau工具完成,最終結果是形成停電圖紋PDF文件和異動臺區Excel文件。

2.1 數據可視化

根據電力用戶用電信息采集系統主站停/上電查詢界面,其數據是以停電事件為記錄,即每一個記錄代表每一個終端上報的停/上電事件,對終端一次完整的停/上電事件進行記錄,數據包括用戶編號、線路名稱、停電發生時間和停電結束時間。

停電數據可視化有助于了解、發現數據的特點。利用Tableau工具可以對終端停/上電數據進行可視化分析并得到結果??梢暬Y果以單個臺區為記錄,反映單個臺區在一段時間(本文取1個月)內的停電時間和停電時長,每一個條紋代表一次停電,每個條紋位置對應停電時間點,條紋的寬度代表停電時長。由此可以發現每個臺區的停電圖形有其自身的獨特性,類似于人類的“指紋”,為此,筆者提出了“停電圖紋”的概念,通過特定停電圖紋可以快速地識別一個臺區。據此可以利用停電圖紋的相似性來聚類臺區,將停電圖紋相似度極高(即多次停電相同)的臺區歸成一類,然后將聚類結果與檔案數據比對,把有差異的情況視為異動。

2.2 數據清洗

通過對業務數據形成的理解和停電數據的分析,發現停/上電數據質量上存在問題,主要表現在:停電時間不規范,標準停電時間格式為yyyy/m/d h:mm,不規范停電缺失時間格式為yyyy/m/d,經過分析,缺失時間以0點0分為主,解決辦法是按標準格式補齊數據。

另外,為提高聚類分析的準確度,聚類分析使用的停電圖紋要基于多次停/上電的數據,因此要清洗掉分析數據中停電次數僅為一次的臺區數據。

2.3 數圖轉換

通過數據分析,發現即使是同一時間同一線路的臺區數據中的停電時間也存在不一致的情況,時間偏差集中在1~5分鐘,最大偏差可達30分鐘,存在這種現象的原因是終端時鐘不一致所致。鑒于停電偏差的問題,直接使用時間點來聚類的效果會很差,通過使用停電圖紋可以有效避免時間偏差的問題,提高數據分析成效。

以2月份國網道縣供電公司道萬線三角街臺區(采集點)為例,該臺區共停電4次,總停電時長598分鐘。經過數據可視化,轉換成4個條紋,對應相應的時間點、時長等停電特征,形成了該臺區2月份的停電圖紋,如圖1所示。

圖1 停電圖紋數圖轉換過程

把可視化的停電圖紋以數字的方法存儲,首先建立以分鐘為顆粒度的時間序列,以一個月30天計算,時間序列長度為30×24×60=43200個單元,每一個單元表示該臺區在這一分鐘是否停電,未停電為0,停電為1,最終形成該臺區停電圖紋序列。將當月所有臺區停電序列放在一起,就形成了當月的停電圖紋矩陣,在此數據基礎上再開展圖紋相似度的計算。

2.4 聚類分析

2.4.1 聚類算法選擇

聚類是將物理對象或抽象對象的集合分成由類似的對象組成的多個類的過程,聚類是一種無監督學習。本文使用的聚類算法是DBSCAN算法,它是一個有代表性的基于密度的聚類算法。與劃分和層次聚類方法不同,它將簇定義為密度相連的點的最大集合,能夠把具有足夠高密度的區域劃分為簇,并可在噪聲的空間數據庫中發現任意形狀的聚類。DBSCAN算法不需要事先知道要形成的簇類的數量,可以發現任意形狀的簇類,并能夠識別出噪聲點,且對于數據庫中樣本的順序不敏感。正是基于以上特點,本文選擇了DBSCAN算法作為實現過程中的聚類算法。

2.4.2 聚類算法實現

利用Python編程對停電圖紋進行聚類,在結果數據中增加3個字段:歸類、問題歸類、異常點。歸類是聚類算法計算的直接結果,算法以圖紋相似大于90%為條件,將臺區自動聚類,聚類結果以自然數(0、1、2 ...)標記歸類,每一個歸類將停電特征相近的臺區進行統一標記編號。

問題歸類是指同一歸類中,當出現多個不唯一的線路名稱時視為問題,將同一歸類中線路名稱種類不為1的歸類標記為問題歸類。

異常點是在問題歸類中查找線變關系有可能出錯的臺區,按同線路臺區出現數量的多少為判斷,數量少的線路名稱上的臺區為異常點,算法默認線變關系中多數臺區的線變關系是正確的。

2.5 結果可視化

聚類算法的結果利用Tableau工具進行可視化處理成停電圖紋。通過停電圖紋,可以發現檔案在道萬線上的三角街臺區與道上線的其它臺區停電圖紋非常相似。對于停電時間和時長如此相似的臺區,筆者初步判定道萬線三角街臺區、道縣上關鄉石門村油茶基地臺區位于道上線上,這2個臺區檔案可能存在問題,將此異動下發到基層單位進行核對,結果證明判斷正確。

3 模型應用

整個實現過程將數據可視化技術和數據挖掘技術緊密結合,通過編程方法進行封裝,操作人員只需要按要求提供有效的終端停/上電數據,一個程序、一張圖即可通過停電圖紋識別線變關系。

在實現工作中,模型能發現和解決很多問題,但同時仍存在一些問題,比如單個母線多次停電導致多條不同線路停電圖紋一致,臺區單次停電較長會影響相似度的對比,程序界面不友好,分析數據基于離線數據,這些都是下一步需要改進的地方。

4 結束語

停電圖紋識別線變關系是對停電數據的挖掘和應用,充分挖掘停電數據的價值。通過數據分析,可以大大降低業務部門現場核查的工作量,同時形成有效的監督手段,充分利用數據來督辦現場工作。

猜你喜歡
圖紋歸類臺區
青銅繪畫·獸面圖紋、水陸攻戰圖紋
電表“對”與“錯”歸類巧掌握
“古幣”會挖沙
Happiness through honorable actions
降低臺區實時線損整治工作方法
分式方程應用題歸類解說
凌絮裙擺
凌絮裙擺
三合一集中器作為臺區線損考核表計的探討
多功能低壓臺區識別設備的研制
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合