?

決策樹在汽輪機故障診斷中的應用

2010-01-08 05:27
北大荒文學 2009年12期
關鍵詞:子集增益決策樹

梁 娜

本文研究了決策樹挖掘方法在故障診斷中的應用,根據設備的歷史運行記錄,對其可能的運行狀態進行分類,提取出故障特征。實例證明,利用決策樹挖掘技術進行知識提取,有效克服了故障診斷系統知識獲取的瓶頸,具有實際的應用價值。

1.引言

汽輪發電機組是電力工業中的關鍵設備,其結構復雜,運行環境特殊,因此故障率較高。隨著電廠信息化水平的不斷提高,越來越多的數據被DAS系統存儲到實時數據庫中,這些數據包含了機組運行狀態的各種特征。怎樣從過去的數據中發現有用的信息,把所獲得的知識用于過程監控,提高生產過程自動化水平是值得研究的課題。數據挖掘就是從大量不完全、有噪聲、模糊的或者隨機的數據中提取出有價值的知識。本文將數據挖掘技術應用于汽輪機的故障診斷,具有實際的意義。

2.數據挖掘概述

2.1 數據挖掘技術

數據挖掘,也稱為數據庫中的知識發現(KDD),是指發掘隱藏在堆積如山的數據中的真知灼見。通過數據挖掘,有價值的知識、規則或高層次的信息就能從數據庫的相關集合中抽取出來,并從不同角度顯示,從而使大型數據庫作為一個豐富可靠的資源為知識歸納服務。

2.2 決策樹算法

決策樹是數據挖掘分類方法的一種。決策樹的表現形式類似于流程圖的樹結構,它的基本組成部分包括決策節點、分支和葉子。決策樹中最上面的節點稱為根節點,是整個決策樹的開始。每個分支是一個新的決策節點。每一個決策節點代表一個問題或決策,通常對應于分類對象的屬性。每一個葉節點代表一種可能的分類結果。Qulnlan設計的ID3方法是國際上最有影響和最為典型的決策樹學習算法。

設S是數據樣本的集合,集合中的樣本數用S來表示。假定故障類別具有m個不同值,它們將樣本分為m個類,用Mi(i=1,2,……m)來表示,Mi表示類Mi中的樣本數。則任意一個樣本屬于Mi的概率為pi=Mi/S,一個給定樣本分類的平均信息熵為 E(S)=-∑mi=1pilog2pi。

設屬性A具有n個不同的值,它們將樣本劃分為n個子集,每個子集Sk中的樣本在A上的取值相同。設Sik是子集Sk中類Mi的樣本數。則由A劃分的決策樹分類的條件熵為:E(S/A)=∑nk=1pk[-∑mi=1piklog2pik],其中,pk=SkS,pik=SikSk表示Sk中的樣本屬于類Mi的概率。熵的變化量稱為屬性A對分類的信息增益Gain(A),則Gain(A)=E(S)-E(S/A)

具體的操作是:

(1)計算每一個屬性的信息增益,選擇信息增益最大的屬性A作為根結點;

(2)屬性A的不同取值將全體樣本分成若干個樣本子集,按照前面的方法在每一個新的樣本集合中選擇信息增益最大的屬性作為這一級的結點;

(3)重復上面的步驟,直至所有的子集都屬于同一個類別。

3.實例分析

3.1 數據準備與預處理

本文在現場調研和查閱文獻的基礎上收集整理了一個汽輪機振動故障數據庫,該數據庫包含21組故障數據,五種典型故障。我們定義幾個在故障診斷中常用的頻段作為測試屬性:

A1 0.01-0.49fA2 0.5fA3 0.51-0.99fA4 1f

A5 2f A6 3-5fA7 >5f

3.2 構造決策樹

根據上一節介紹的構造決策樹的方法,計算表31中每一個測試屬性的信息增益如表32所示。

表32 屬性對應的信息增益

屬性信息增益屬性信息增益

A10.24A50.80

A20.95A60.19

A30.19A70.36

A41.88

從表32可以看出,屬性A4的信息增益最高,因此以A4為根結點構造決策樹。對于根結點以下的各級子集按照同樣的方法計算信息增益。最后形成的決策樹如圖32所示。

圖32 汽輪機故障決策樹

3.3 結果評價

為了檢驗規則的正確性,我們用五組實際的故障數據進行驗證。診斷出來的結果如表34所示。

表34 檢驗樣本實際故障與診斷結果的比較

檢驗樣本實際故障診出故障

1油膜振蕩油膜振蕩

2不對中+不平衡不對中

3不平衡+碰摩碰摩

4不對中+碰摩碰摩

5氣流激振氣流激振

從上面的結果可以看出:使用一個數量有限的故障樣本集得到的診斷規則還是令人滿意的。對于單一故障都夠能診斷出來,對于混合故障也能夠診斷出其中的一種故障,說明規則的正確率還是很高的。

4.結束語

決策樹方法是從樣本中學習規則,所以樣本集對決策樹的形成是至關重要的,但決策樹始終在尋找信息增益最大的屬性作為當前節點的測試屬性,所以具有一定的抗噪聲能力,而且對于由噪聲產生的分枝,已經有一些樹剪枝的方法,以提高決策樹獨立于測試數據正確分類的能力。通過訓練所得出的規則可用于故障診斷,具有一定的實用價值。

猜你喜歡
子集增益決策樹
高一上學年期末綜合演練
K5;5; p 的點可區別的 IE-全染色(p ?2 028)
經典儀表放大器(PGIA)的新版本提供更高的設計靈活性
簡述一種基于C4.5的隨機決策樹集成分類算法設計
旦增益西的藏戲夢
寬頻帶增益放大器的設計與測試
放大器仿真設計
決策樹學習的剪枝方法
集合的運算
決策樹在施工項目管理中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合