?

基于隨機森林算法的飛機發動機故障診斷方法的研究

2016-11-02 23:25郝姜偉魯斌
電腦知識與技術 2016年23期
關鍵詞:隨機森林故障診斷

郝姜偉 魯斌

摘要:根據飛機發動機狀態參數建立決策樹進行分類是發動機故障檢測的重要方法,本文針對單棵決策樹模型分類方法精度不高、容易出現過擬合等問題,提出使用組合單決策樹來提高計算精度的隨機森林算法,并將該方法進行仿真實驗。結果表明,隨機森林算法能夠解決單個決策樹過擬合問題,在解決飛機發動機故障診斷領域中具有廣闊的發展及應用前景。

關鍵詞:飛機發動機;故障診斷;隨機森林

中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2016)23-0158-03

Abstract:Establish decision tree for aircraft engines state parameters to classify is an important method of engine fault detection, the paper according to the accuracy of a single decision tree classification model is not high, prone to problems of over-fitting,propose the Random Forest algorithm which use a combination of a single decision tree classification model to improve the accuracy, and use it for simulation experiments.The results show that the Random Forest algorithm can solve the problem of over-fitting with a single tree,and it has a broad development prospect in solving aircraft engine fault diagnosis.

Key words:aircraft engine; fault diagnosis; random forest

隨著互聯網技術的持續快速發展,各種創新技術、前沿概念不斷影響著人們的生活,人類社會進入了一個前所未有的信息化時代。國內航空市場發展迅速,飛機的數量不斷增加,航空維修行業在不斷發展。在航空業繁榮的背后,航空維修承擔著非常重要的作用,航空公司近百分之二十的飛行成本是維修費用。飛機安全飛行是航空公司的生命線,飛機發動機是航空器的“心臟”是安全飛行的基礎[1],飛機發動機的重要性不言而喻。目前的航空領域正處于快速發展時期,新技術、新需求不斷出現,對維修方面也提出了更高的要求,按照原來的維修方法、要求,以及安全性、可靠性已無法滿足新時代的新的需求。在短時間內,利用有效、可靠的技術手段完成維修任務變得越來越重要。

分類預測是數據挖掘技術領域的主要方法。利用數據挖掘技術,根據現有的數據,對未來發展趨勢進行準確、有效的分類和預測,受到了廣泛的關注和研究,而且其成果也不斷投入到我們的現實生活。其中應用很多優秀的算法,比如決策樹、貝葉斯、k-近鄰分類、神經網絡、支持向量機等。近幾年分類器在飛機發動機故障診斷領域也逐漸被推廣,但是單模型分類器會出現診斷精度不高、過擬合、訓練速度慢、陷入局部最優解等缺點。

本文提出采用隨機森林算法對飛機發動機進行故障診斷,根據波音747-400(發動機型號為 PW-4000)發動機四個狀態參數進行初步診斷:低壓壓縮機轉速 NL;高壓壓縮機轉速 NH;排氣溫度 EGT;燃油流量 FF[3]。建立隨機森林的組合分類器模型,每個分類器起到互補的作用,將單決策樹錯誤判斷影響降低,最終根據每個決策樹的投票得出最終診斷結果,該方法具有速度快、準確率高等優點。

1 決策樹和隨機森林

1.1 決策樹

決策樹,根據給定的無規律的樣本,推理得出樹狀的分類規則的方法,它的一個分支就是一個決策過程,每個決策過程中涉及一個數據的屬性[6],然后遞歸直到滿足決策條件。其中樣本數據集中含有多個特征屬性和目標屬性,采用從上向下的原則,從根節點開始遍歷,直到每一個數據子集都有唯一的對應的目標。建立好決策樹后,輸入測試樣本,測試數據根據生成的決策樹,確定一條由根節點到葉節點的唯一路徑,葉節點即為測試樣本所屬類別[2]。決策樹算法有著很多良好的特性,比如說訓練時間復雜度較低、預測的過程比較快速、模型容易展示等。但是同時,單決策樹又有一些不好的地方,比如說容易過擬合。

1.2 隨機森林

隨機森林算法是Leo Breiman于2001年提出的一種新型分類和預測模型,是基于決策樹(decision tree)的分類器集成算法,用隨機的方式建立一個森林,由多個決策樹組成的集成分類器算法[5],再輸入X時,每一棵樹只投一票給它認為最合適的類。

隨機森林通過在每個節點處隨機選擇特征進行分支,最小化了各棵分類樹之間的相關性,提高了分類精確度。由于每棵樹的生長速度很快,所以隨機森林的分類速度很快,并且很容易實現并行化。按這種算法得到的隨機森林中的每一棵都很弱,但是多顆決策樹組合起來就可以達到更精確的結果。即:將每一棵決策樹看成一個精通于某一個窄領域的專家,隨機森林中就有了很多個精通不同領域的專家決策樹,對待新的問題,用不同的角度去看待它,最后由各個專家,投票得到最終結果[4]。該算法具有需要調整的參數少、分類速度快、不用擔心過度擬合、能高效處理大樣本數據、能估計哪個特征在分類中更重要以及較強的抗噪音能力、數據集上表現良好等特點。

2 基于隨機森林算法的飛機發動機故障診斷步驟

隨機森林應用自助法重采樣技術生成整個決策樹分類器,其步驟如下:

1)從樣本集中用自助法(Boot-strap)重采樣選出n個樣本,預建立決策樹(CART),每個自助樣本集包括每棵分類樹的全部訓練數據。

2)在樹的每個節點上,從所有屬性中隨機選擇k個屬性,選擇出一個最佳分割屬性作為節點。

3)每棵樹最大限度地生長, 不進行剪枝操作;

4)將生成的多棵分類樹組成隨機森林,對新的數據進行判別與分類,分類結果按樹分類器的投票多少而定,最終決策結果根據如下公式給出:

用投票策略來得到最終結果。

基于隨機森林的飛機發動機故障診斷流程如圖1所示:

3 基于隨機森林算法的飛機發動機故障診斷的應用

本文使用Google開發的一種編譯型、可并行化、并具有垃圾回收功能的編程語言GoLang對隨機森林算法進行仿真實驗。

3.1 輸入特征

根據飛機發動機故障維修人員的經驗,波音 747-400(發動機型號為 PW-4000)的故障可以通過如下四個參數進行初步診斷:低壓壓縮機轉速 NL;高壓壓縮機轉速 NH;排氣溫度 EGT;燃油流量 FF。故障診斷就是利用這些有限的參數所提供的特征信息來確定發動機的故障狀態的[3]。 選用文獻[3]的12個特征,即典型故障模式作為學習樣本輸入,如表1所示。

3.2 學習樣本和測試樣本

本文為每種故障分別選定20個樣本,總共240個學習樣本,將輸入和目標樣本作為算法入口進行分類學習,試驗中取100棵獨立決策樹組成隨機森林。根據文獻[3]典型故障模式輸入輸出樣本如表2所示。

本文進行多組實驗將隨機森林算法應用到飛機發動機故障診斷中,當選取的樣本集數量為100組,即數量較少、生成決策樹數量較少或樣本差異不明顯時,測試數據故障診斷錯誤率高達30%及以上,隨著樣本集數量以及樣本數據的不斷調整,錯誤率不斷降低。因此,正確選取學習樣本、確定適合的樣本數量、減少樣本數據的相關性是隨機森林算法能否準確決策的關鍵因素。

3.3 系統實現

前端借鑒MVC模式,使用Angularjs框架,結合HTML,CSS開發,數據通信基于http協議,采用RESTful風格,使用JSON數據格式進行數據傳送。服務端使用Google開發的一種編譯型、可并行化、并具有垃圾回收功能的編程語言GoLang。Web API層基于RESTful Web API開源框架Martini實現,分為路由管理、控制器、RPC代理三層,其中路由管理模塊負責資源的路由分配;控制器模塊定義了應用系統的行為,通過提供的HTTP方法向前端暴露資源;RPC代理模塊負責與模型層的通訊,使用MongoDB進行數據的存儲。實現結果如圖3和圖4所示:

4結論

本文研究了基于隨機森林算法的飛機發動機故障診斷方法,并通過實驗驗證該方法的有效性,實現了相應的web應用。實驗結果表明,利用該方法進行飛機發動機故障診斷能取得理想的效果,證明該方法的可行性,在解決飛機發動機故障診斷領域中具有廣闊的發展及應用前景。

參考文獻:

[1] 李愛. 航空發動機磨損故障智能診斷若干關鍵技術研究[D].南京航空航天大學,2013.

[2] 陶棟琦,薄翠梅,易輝. 基于隨機森林的變壓器故障檢測方法的研究[J]. 電子器件,2015(4):840-844.

[3] 吳月偉. 基于徑向基神經網絡的飛機發動機故障診斷研究[D].中國民用航空學院,2006.

[4] 尹玲. 基于心率變異和腦波分析的塑身腹帶著裝壓力舒適性研究[D].東華大學,2012.

[5] 鄢仁武,葉輕舟,周理. 基于隨機森林的電力電子電路故障診斷技術[J]. 武漢大學學報:工學版,2013(6):742-746.

[6] 葉圣永,王曉茹,劉志剛,等. 基于隨機森林算法的電力系統暫態穩定性評估[J]. 西南交通大學學報,2008(5):573-577.

猜你喜歡
隨機森林故障診斷
凍干機常見故障診斷與維修
拱壩變形監測預報的隨機森林模型及應用
基于量子萬有引力搜索的SVM自駕故障診斷
因果圖定性分析法及其在故障診斷中的應用
基于隨機森林算法的B2B客戶分級系統的設計
基于多視角特征融合與隨機森林的蛋白質結晶預測
基于LCD和排列熵的滾動軸承故障診斷
基于WPD-HHT的滾動軸承故障診斷
高速泵的故障診斷
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合