?

基于MATLAB的東遼縣電網累年故障數據處理與分析

2017-11-09 16:16楊濤
農業科技與裝備 2017年6期
關鍵詞:關聯分析聚類分析

楊濤

摘要:整理現有8 a(2009—2016年)電子版數據,對所收集的2 628條有效數據進行必要的預處理,根據工作習慣和故障因素特征具體分成六類。采用現今流行的數據挖掘技術,即數據的聚類分析和關聯分析,探索各類故障因素的相關聯系,進行排序,尋找工作重點和優先方向,為確保電網堅強進行有益探索,并借助MATLAB平臺使數據分析模型得以實現。

關鍵詞:累年故障數據;聚類分析;關聯分析;東遼縣

中圖分類號:TM715 文獻標識碼:A 文章編號:1674-1161(2017)06-0018-04

東遼縣位于長白山余脈與松花江平原結合部,地勢以山地為主,多山丘溝壑和草原林地,雷雨、大風等惡劣天氣多。國網吉林東遼縣供電有限公司配網線路分布其間,設備布點多、線路覆蓋面積廣,延伸路徑復雜,有多處線路位于采煤沉降區,公司電網極易受到自然環境等外界因素的影響。近幾年,東遼公司的配網設備經歷了嚴峻考驗,除了受到自然災害的影響外,設備老化嚴重,結構缺員,致使配網設備故障頻發,改造治理和管理提升需求迫切。隨著地方經濟不斷發展,產業結構逐步優化升級,電力需求和供電質量要求同時不斷上升。面向農村地區的配網線路不僅結構復雜,而且覆蓋地域較廣,因此,對配網線路故障進行全面分析和有益探索,采取積極有效的應對措施,對于提高線路供電可靠性意義重大。

1 數據收集整理情況

故障數據分析治理項目小組接到任務后,聯系公司調度室,整理現有8 a(2009—2016年)電子版數據,對所收集到2 628條有效數據進行必要的預處理,根據工作習慣和故障因素特征具體分成六類(如表1、圖1和圖2所示)。采用現今流行的數據挖掘技術,即數據的聚類分析和關聯分析,探索各類故障因素的相關聯系,進行排序,尋找工作重點和優先方向,為確保電網堅強進行有益探索,并借助MATLAB平臺使數據分析模型得以實現。

2 數據處理與分析

2.1 數據審核

從不同渠道獲得的原始數據,在審核的內容和方法上是不同的。對原始數據應主要從數據完整性和數據準確性兩個方面著手觀察。數據完整性審核主要是檢查應調查的數據樣本個體是否有遺漏,所有的調查數據特征或指標是否填寫齊全。數據準確性審核主要包括兩個方面:一是檢查數據資料是否符合客觀實際情況;二是檢查數據是否有原發性錯誤,數值記錄等是否正確等。

2.2 數據篩選

原始數據的篩選主要包括兩方面:一是將某些不符合特征的數據或有明顯錯誤的數據剔除;二是將符合某種特定條件的數據篩選出來,對不符合特征的數據予以剔除。

2.3 數據排序

原始數據的排序是按照某種要求的順序將數據排列,便于使用者通過瀏覽數據排序情況發現一些明顯的特征或趨勢。除此之外,數據排序還有助于對原始數據檢查糾錯,為數據的重新歸類或排序分組等提供充分的依據。

2.4 處理方法

數據處理方法主要有4種:數據清理、數據集成、數據變換和數據歸約。本研究主要采用數據歸約。數據挖掘時往往需要操作的數據量非常大,即便是在少量數據上進行挖掘分析,也需要耗時較長。數據歸約技術可以用來得到數據集的歸約表示,它量級小得多,但卻保留了原有的數據特性,并使歸約后結果與歸約前結果相同或近乎相同。

數據預處理技術是數據挖掘的一個熱門的研究方向,也是數據挖掘的必經環節,對所收集到2 628條有效數據進行必要的預處理,將經過處理的數據整理成10 kV配網線路故障分類統計表。

2.5 數據聚類分析

數據聚類分析是將待處理的數據分到不同的類或簇中的過程,所以同一個類或者簇中的數據對象有著極大的相似性(同質性),而不同類或簇間的數據對象又有很大的相斥性(相異性)。

按照數學觀點來說,數據聚類分析是通過用數據建模來簡化數據計算的一種分析方法。數據聚類分析是在一種無監督規則下的探索性分析,在分類的過程中不必事先給出一個分類的標準,數據聚類分析能夠從樣本數據實際情況和客觀要素出發,自動進行分類。聚類分析因所使用數學模型算法的不同,常常會得到不同的結論;不同使用者對同一組待處理數據進行數據聚類分析,所得到的結論也未必完全一致。

從數據分析實際應用的角度看,數據聚類分析也是數據深度挖掘的主要任務之一。數據聚類分析能夠作為一個較為實用的數學工具獲得數據的分布狀況,觀察每一類或簇數據的特征,集中對特定的聚簇集合做進一步分析。聚類分析還可以作為其他算法(如分類和定性歸納算法)的預處理步驟。

利用聚類分析四次劃分得到分類順序,即極端天氣、配電設備故障、線路樹障、外力破壞、管理不到位和用戶設備故障(如圖3所示)。

2.6 數據灰色關聯分析

灰色關聯分析方法是灰色系統理論的一個重要分支,應用灰色關聯分析方法對受多種因素影響的事物和現象從事物整體角度出發進行綜合評價,是一個被廣為接受的方法。

灰色關聯分析法是將研究對象及影響因素的因子值視為一條直線上分布的各個點,是假定的理想標準參考值,與待識別對象及影響因素的因子值所繪制的曲線點進行比較,將其之間的擬合程度通過繪圖函數分別量化顯示,計算出研究對象與待識別對象各影響因素之間的擬合程度的關聯度,通過比較各關聯度的大小來判斷待識別對象對研究對象的影響程度?;疑P聯度分析法是一種實用的數學分析技術,能夠發現存在于大量數據集中的關聯性或相關性,從而發現描述一個事物中某些屬性同時出現的規律和模式。

灰色關聯分析從大量數據中發現項集之間有趣的相關聯系并進行綜合評價(注意對表格轉置),如圖4和圖5所示。

由灰色關聯度排序可以看出,極端天氣>線路樹障>配電設備故障>外力破壞>管理不到位>用戶設備故障。即極端天氣因素與虛擬最具破壞力故障因素的關聯度最大,可斷定極端天氣因素為最具破壞力故障因素;按照排列次序關聯度降低,其他故障因素對公司電網的破壞與影響逐漸減小。endprint

2.7 數學模型及不同分析方法的評價

對比兩種方法的計算過程可以發現:層次分析法概念直觀、計算方便、容易理解,但該方法最大的缺點是主觀性強、客觀性較差。由于樣本的重要性本身就是個模糊的概念,所以對于樣本的重要性比較,不同的人可能給出不同的結論,而且根據個人的素質、學識、能力與價值觀等,難免會對某些樣本產生過于偏愛的傾向。另外,該方法在實際操作中需要請相關方面的專家、有經驗的人員等進行判斷,同時還要考慮到專家的結構和素質。所以該方法雖然計算方便,但其實際操作過程卻比較復雜。而灰色關聯分析法的最大優點是客觀性強,避免了人的主觀判斷帶來的影響。該方法利用樣本數據經過一系列的數學計算,得到權重,實際上結論完全是由數字信息得來的。相對于層次分析法來說,該方法的操作比較簡單,應用者一旦掌握,可以自己對數據進行處理,得到結論。但該方法的計算相對較為復雜,如果不熟悉,建議采用層次分析法。綜上所述,層次分析法簡單直觀,計算過程可調用函數,容易理解,但主觀性強,客觀性較差,且計算結果精確度不高;灰色關聯分析法結論客觀性較強,計算結果精確度較高,但計算過程比較繁瑣,需要編寫大量代碼。

3 措施及建議

1) 根據以上分析,對6個不同方面的故障因素,采取積極的應對措施,有的放矢,有針對性地解決問題。除極端天氣需要做好風險轉移報案理賠外,其他因素均需要業務部門進行前瞻性解決。

2) 通過數據分析可知,線路樹障和外力破壞是影響配網穩定的不可忽略故障因素,除采取積極的技術措施外,還應尋求地方政府和司法幫助。電力法和電力設備保護條例在現實環境中是保護電力設備權益的重要武器,但常常遭遇挑戰,建議公司尋求地方立法和司法幫助是非常必要的。

3) 通過數據審核發現,配電設備故障易發時間多為早晚時段,特別是農村用戶負荷集中,此時也是電壓低、電壓不穩等問題的多發時段。建議各基層供電所提醒農村廣大用戶“錯峰”用電,避免用電擁堵帶來的不便。

4) 通過數據分析發現,管理不到位因素雖然排在倒數第二位,但經仔細分析,除極端天氣外,其他的故障因素都可以劃分在管理范疇,這說明打造堅強電網不僅需要對電力設備進行改造治理,還需要大幅提升管理水平,轉變管理方式。

參考文獻

[1] 張斌,張薇薇.機械設備故障診斷技術概述[J].建筑機械化,2005,8(15):14-15.

[2] 朱大奇,于盛林.基于知識的故障診斷方法綜述[J].安徽工業大學學報,2002,19(3):197-204.

[3] 王海彬.農村配電變壓器防雷措施的應用[J].沿海企業與科技,2008(12):149-150,148.

[4] 王益明,王永德,薛慶國,等.大學新生學科選擇結果與人格特征關系的研究[J].心理科學,2000,40(5):586-589,639.

[5] 張文穎,施久玉.基于聚類分析的當代大學生學習心理研究[J].黑龍江高教研究,2009(4):113-115.

[6] 徐鳳銀,朱興珊,顏其彬,等.儲層含油氣性定量評價中指標權重的確定方法[J].西南石油學院學報,1994(4):11-17.

[7] 蘭海,史家鈞.灰色關聯分析與變權綜合法在橋梁評估中的應用[J].同濟大學學報:自然科學版,2001,29(1):50-54.

[8] 穆瑞,張家泰.基于灰色關聯分析的層次綜合評價[J].系統工程理論與實踐,2008,28(10):125-130.

[9] 申卯興,薛西鋒,張小水.灰色關聯分析中分辨系數的選取[J].空軍工程大學學報:自然科學版,2003,4(1):68-70.endprint

猜你喜歡
關聯分析聚類分析
玉米骨干親本及其衍生系中基因的序列變異及與株高等性狀的關聯分析
玉米骨干親本及其衍生系中基因的序列變異及與株高等性狀的關聯分析
基于隨機函數Petri網的系統動力學關聯分析模型
關聯分析技術在學生成績分析中的應用
農村居民家庭人均生活消費支出分析
基于省會城市經濟發展程度的實證分析
基于聚類分析的互聯網廣告投放研究
基于關聯分析的學生活動參與度與高校社團管理實證研究
“縣級供電企業生產經營統計一套”表輔助決策模式研究
不同的數據挖掘方法分類對比研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合