?

基于VPNRS-RF的飛機液壓系統故障診斷模型

2024-02-29 09:24李耀華王簽簽
機械設計與制造 2024年2期
關鍵詞:約簡特征選擇鄰域

李耀華,王簽簽

(中國民航大學航空工程學院,天津 300300)

1 引言

液壓系統是飛機重要的功能系統,主要用于起落架、襟翼和減速板的收放、前輪轉彎操縱和燃油泵的液壓馬達等,其故障會直接影響飛機的飛行安全[1-3]。據統計,相比飛機其他系統來說,液壓系統發生故障概率較高,約占飛機機械系統總故障的30%左右,其健康狀態直接影響飛機的安全性和可靠性[1-2]。因此對飛機液壓系統進行故障檢測和診斷,成為飛機健康管理技術的一個研究熱點。

目前,針對液壓系統故障診斷問題國內外學者從不同的角度展開了研究,文獻[1]利用人工蜂群優化BP神經網絡,以提高飛機液壓系統故障診斷精度。文獻[4]基于BNfinder軟件數據處理優化貝葉斯網絡結構,分析液壓系統故障原因。文獻[5]提出一種基于LSTM與CNN相結合的高速柱塞泵故障診斷方法。對于液壓系統故障診斷,大多學者著重于故障診斷模型的改進,對冗余特征影響模型準確率方面研究不是太多,但特征選擇對于民機液壓系統的故障診斷有非常重要的影響。

文獻[6]通過DPCA對故障特征進行降維,然后采用GA-SVM實現液壓系統故障診斷。文獻[7]通過對所提取特征參數進行敏感度分析,結合EMD-PNN實現快速有效的柱塞泵故障診斷。但是,對于敏感且重要特征參數的選取,需要綜合考慮特征與類別之間的多方面因素。

特征選擇作為機器學習的一個非常重要的預處理步驟在計算機等其他領域已經得到了廣泛的應用[8-9]。變精度鄰域粗糙集[10-11]結合了變精度粗糙集和鄰域粗糙集的優勢,綜合考慮了條件屬性對決策屬性結果的影響,而隨機森林[12]基于變量重要性度量對特征進行重要度計算,相較于過濾性特征選擇算法具有模型性能優良的優點,故將變精度鄰域粗糙集(VPNRS)與隨機森林(RF)相結合進行分階段特征選擇。并在液壓系統故障分類階段,采用OS-ELM作為分類模型對飛機液壓系統進行故障診斷。

2 飛機液壓系統故障診斷模型構建

2.1 VPNRS-RF評價指標

特征選擇的核心是在全部特征集合中去除無關特征,保留與類別相關的條件屬性,使得所選子集具有最大相關性和最小冗余性。不同評判特征間類別可分能力指標擁有不同的篩選能力和約簡范圍,單一的評價指標易造成約簡集合次優。為了有效的選取對故障信號較為敏感的特征,提出一種變精度鄰域粗糙集與隨機森林相結合的特征選擇方法。該方法利用VPNRS度量特征與類別間的關聯度,RF作為分類器評判特征的類別可分能力,來作為一種特征排序度量標準。

VPNRS-RF算法是一種基于屬性依賴度和分類器的特征重要度的階段特征選擇方法。設在原始數據集中,有M種故障類型,每種故障類型有K種統計特征,則可表示為:

求解F的子集S={f1*,f2*…fN*}(N<M)。

為獲取含有N個特征的最優特征子集,將決策屬性對條件屬性的依賴度作為條件屬性對決策屬性的影響程度的評價指標,可用以下公式計算特征重要度大?。?/p>

式中:a∈B,a—條件屬性;

B—條件屬性子集;

D—決策屬性;

γB(D)—D對B的依賴度。

含有N個特征的子集可能只是次優約簡,當其中一個特征信息可以由另外特征推斷得知,特征刪除時不會對分類結果造成太大影響,因此,采用基于分類器平均精確率減少作為評價指標,直接度量每個特征對模型準確率的影響,賦予特征重要性權重。

式中:errOOB1—添加噪聲前的袋外數據誤差;

errOOB2—添加噪聲后的袋外數據誤差。

2.2 基于VPNRS-RF的特征選擇方法

變精度鄰域粗糙集是在鄰域粗糙集的基礎上引入了包含度閾值,擴大正域,使模型具有一定的容錯性,使得邊界域中一些有用的信息進入正域,極大程度地保留了核心特征,但是仍然存在著對類別屬性影響較弱的條件屬性,而隨機森林算法基于變量重要性度量在變精度鄰域粗糙集屬性約簡后,極大程度的降低了特征相關性冗余度的基礎上,對特征進行重要性排序,使得賦予特征重要性權重準確度提升,進行進一步篩選后可獲取最優特征子集。算法流程,如圖1所示。

圖1 VPNRS-RF特征選擇流程圖Fig.1 Flowchart of VPNRS-RF Feature Selection

構建VPNRS-RF特征選擇算法基本步驟如下:

(1)設置鄰域半徑δ和閾值β取值范圍為步長分別為Δδ和Δβ,則約簡屬性次數為:

(2)初始化屬性約簡次數1 ≤i≤N。

(3)使用變精度鄰域粗糙集計算鄰域半徑δ=δmin+(i-1) Δδ,閾值β=βmin+(i-1) Δβ時的約簡特征子集{red1,red2…redN}。

變精度鄰域粗糙集算法主要步驟:

①初始化red=?;②根據鄰域半徑δ和閾值β,計算鄰域關系NA及其對應屬性依賴度γai(D);③對任意ai∈C-red,計算sig(ai,red,D)=γred∪{ai}(D)-γred(D);④選擇屬性重要度大的條件 屬 性ak,其 滿 足sig(ak,red,D)=Max(sig(ai,red,D));⑤若sig(ak,red,D)>0,則red=red∪ak,轉到步驟(3);⑥輸出red。

(4)利用PNN 神經網絡分別計算在不同鄰域半徑和閾值下的約簡集合redi的分類精度。

(5)選擇分類精度最高的約簡集合特征Selectred作為步驟6)的輸入數據。

(6)隨機森林重要度計算方法主要有三種,在此采用置換法OOB data 計算誤差值,以平均精度降低作為特征重要性評價指標,對特征進行排序,該步驟主要分為2個過程:

第一個過程為對于隨機森林中的每一顆決策樹,使用相應的OOB(袋外數據)數據來計算它的袋外數據誤差,記為errOOB1。然后隨機地對袋外數據OOB所有樣本特征加入噪聲干擾,再次計算它的袋外數據誤差,記為eerOOB2。

第二個過程為利用特征重要性的計算式(3)來計算特征重要性并對特征進行排序。

(7)使用序列后向選擇方法(SBS)從特征的全集開始搜索,每次從特征子集中去掉一個特征,采用PNN神經網絡來獲取不同特征子集分類準確率。

(8)由于隨機森林的固有隨機性,可能每次給予特征不同的重要性權重,導致得到的特征數隨準確率變化趨勢產生差錯,可以通過再次返回步驟(6),以選出分類準確率最高的特征子集作為集成模型的輸入數據集。

2.3 基于VPNRS-RF的OS-ELM故障診斷模型

2.3.1 OS-ELM算法

OS-ELM 算法[13-14]對于單隱層神經網絡的輸出權重的學習過程主要分為兩部分:

第一部分是初始階段,假設有N0個任意訓練樣本(Xi,ti)∈Rn×Rm,其中Xi=[xi1,xi2…xin]T為學習模型的輸入值,ti=[ti1,ti2…tin]T為學習模型的期望輸出,利用ELM 數學模型,求得使滿足‖H0β-T0‖的最小值β0,其中:

式中:g(·)—隱含層的激活函數;

ai—輸入層與隱含層之間的權值;

bi—隱含層的偏差。

所用到的激活函數有:

接著采用最小二乘法和廣義逆的思想,求出隱含層權值β0為

第二部分是在線學習階段,當有新的樣本進入模型時,由在線學習的遞推公式可得出輸出權值:

2.3.2 飛機液壓系統故障診斷模型這里液壓系統故障診斷模型構建主要分為如下兩個部分:

(1)特征選擇:由飛機液壓系統仿真信號得到的量化特征集存在高維度及大量冗余問題,利用VPNRS-RF 特征選擇算法選取維度低、敏感度高且分類錯誤率小的主要特征向量。

(2)模型構建:OS-ELM具備了ELM模型的速度和泛化能力上的優點,并且可以隨著新數據的到來不斷更新模型,可以進一步提高飛機液壓系統故障準確率。流程圖,如圖2所示。

圖2 基于VPNRS-RF的OS-ELM流程圖Fig.2 OS-ELM Flow Chart Based on VPNRS-RF

步驟如下:

(1)基于Amesim飛機起落架收放系統仿真模型的壓力信號,構建特征向量。

(2)對數據進行歸一化處理,基于變精度鄰域和模糊熵粗糙集理論,對數據樣本進行屬性約簡。

(3)基于步驟(2)屬性約簡特征,利用RF算法OOB data計算誤差并對特征進行重要度排序。

(4)利用PNN神經網絡選擇合適的特征數目K。

(5)基于ELM分類模型,將VPNRS-RF與其他特征選擇方法進行對比,驗證VPNRS-RF算法的優越性。

(6)將選擇特征作為OS-ELM輸入參數,進行故障診斷和結果分析。

3 仿真研究

3.1 仿真建模

建模完成后,按照飛機液壓系統相關資料輸入相關參數,具體設置參數,如表1所示。

表1 起落架收放系統仿真模型參數設置Tab.1 Parameter Setting of Simulation Model of Landing Gear Retraction System

選取對象是某型飛機液壓系統起落架收放系統,在AMESim仿真平臺下建立液壓系統仿真模型,建立的模型[1,3,15],如圖3所示。

圖3 飛機液壓系統仿真模型Fig.3 Simulation Model of Aircraft Hydraulic System

相關參數設置完成后,運行該模型,液壓泵輸出壓力隨時間變化曲線,如圖4所示。飛機液壓系統的故障模式通過改變模型的物理參數來設置,通過改變模型的泄露系數、油濾孔徑、油液空氣含量來分別模擬泄露、堵塞、氣塞、堵塞和氣塞、泄露和堵塞五種故障模式。

圖4 飛機液壓系統正常情況下泵輸出壓力仿真結果Fig.4 Simulation results of Pump Output Pressure Under Normal Conditions of Aircraft Hydraulic System

3.2 VPNRS-RF特征選擇

這里要監測和采集的數據是飛機液壓系統的液壓泵出口壓力信號,以飛機起落架放下過程為仿真的工作過程,在6種狀態下分別采集了3000個樣本,從中各選取2500個樣本,將其分成50段,每段50個樣本,構建特征集合,并利用VPNRS-RF算法進行特征篩選,以獲取最優特征子集作為OS-ELM故障診斷模型輸入,來提高飛機起落架收放系統故障診斷精度。首先選取決策屬性D={1,2,3,4,5,6},分別對應6種狀態,選擇分別于系統相關的18個條件屬性C={c1,c2…c18}。在變精度鄰域粗糙集算法中,有兩個變量鄰域半徑δ和閾值β,不同的鄰域半徑δ和閾值β,將得到不同的約簡集合。設置變量δ的值從(0.05~0.5)以步長0.05變化,變量β的值從(0.5~1)以步長0.1變化。選擇特征個數和PNN分類精度隨δ和β的變化,如圖5、圖6所示。從圖6可以得出當δ和β為(0.1,0.5)和(0.15,0.7)時分類精度最高,特征選擇個數為8,分別為{c1,c4,c5,c7,c8,c10,c12,c15}和{c1,c4,c5,c7,c8,c10,c14,c15},由 于δ和β在這兩種情況下,選擇特征大多重合且分類精度相等,因此將選擇的特征融合為{c1,c4,c5,c7,c8,c10,c12,c14,c15}。

圖5 特征個數隨δ和β的變化Fig.5 Variation of the Number of Features with δ and β

圖6 分類精度隨δ和β的變化Fig.6 Variation of Classification Accuracy with δ and β

接著利用RF 算法OOB data 計算誤差并對由VPNRS 和FISEN分別選擇的特征進行重要度排序,如圖7、圖8所示。

圖7 變精度鄰域選擇特征排序圖Fig.7 Sequencing Diagram of Variable Precision Neighborhood Selection Features

圖8 模糊熵選擇特征排序圖Fig.8 Sequencing Diagram of Fuzzy Entropy Selection Features

由圖7、圖8得出特征重要性排序后需進行特征篩選,為了選擇合適的特征數目K,使用序列后向選擇方法(SBS)從特征的全集開始搜索,每次從特征子集中去掉一個特征,采用PNN神經網絡模型對不同的K值進行試驗,通過比較不同的K值對分類準確度的影響來選擇最優的K值,實驗結果,如圖9所示。

圖9 特征數對分類精度的影響Fig.9 Influence of Feature Number on Classification Accuracy

從圖9可以看出,當VPNRS-RF-PNN和FISEN-RF-PNN模型輸入特征個數分別為4和3時,分類精度高于VPNRS-PNN和FISEN-PNN 分類模型,且VPNRS-RF-PNN 分類精度高于FISEN-RF-PNN模型,說明了VPNRS-RF相比單一VPNRS特征選擇方法,在輸入特征更少的基礎上獲取更高的分類精度。因此最后作為輸入數據特征為中值、最大值、均方根、調和平均數。

3.2.1 基于ELM模型的特征選擇驗證評估

為了比較特征篩選算法的性能,基于飛機液壓系統故障仿真數據集對不同特征選擇算法進行試驗對比,并采用ELM算法對其進行訓練,具體結果,如表2所示。

表2 不同特征選擇算法基于ELM模型結果對比Tab.2 Comparison of Results of Different Feature Selection Algorithms Based on ELM Model

從表2 可知,VPNRS-RF 模型分類精度高于WMNRS、GA、PCA、熵權法,雖然PCA和熵權法在特征降維上表現良好,但是并不能較好的保留數據信息。表明了VPNRS-RF特征選擇方法相比應用于液壓系統中傳統單一的GA、PCA、熵權法等方法,不僅可以減少計算量,去除冗余特征,而且可以提高分類準確率。

3.3 OS-ELM液壓系統故障識別

OS-ELM故障診斷模型需要對一些參數進行人為的選擇,不同參數的選取會對診斷精度和算法性能產生影響。

3.3.1 OS-ELM隱含層神經元及激活函數的選取

故障樣本的分配、隱含層神經元、激活函數的選取會對故障診斷算法的訓練時間和診斷精度產生一定的影響,因此,分別采用樣本比例為4:1、3:2、1:1對OSELM隱含層神經元個數和激活函數進行分析結果,如圖10~圖12所示。

圖10 診斷準確率隨OS-ELM 網絡神經元數量的變化Fig.10 The Variation of Diagnostic Accuracy with the Number of Neurons in OS-ELM Network

圖11 診斷準確率隨OS-ELM 網絡神經元數量的變化Fig.11 The Variation of Diagnostic Accuracy with the Number of Neurons in OS-ELM Network

圖12 診斷準確率隨OS-ELM 網絡神經元數量的變化Fig.12 The Variation of Diagnostic Accuracy with the Number of Neurons in OS-ELM Network

從圖10~圖12可知,在不同故障樣本比例下,四種激活函數的診斷準確率隨著OS-ELM網絡神經元數量的增加呈現出先增大后減小的趨勢。其中,當樣本比例大于1,且神經元數量較少時,隱含層激活函數選取rb(f)或sig()函數,診斷準確率較高;當神經元數量較多時,選取hardlim()函數較好。

經過飛機起落架收放系統仿真數據分析,OS-ELM網絡各參數設置為:N0:BLOCK=4:1,nHiddenNeurons=80,ActivationFunc‐tion=’rbf’。

3.3.2 故障診斷結果分析對比

為驗證OS-ELM 故障診斷方法的穩定有效性,選取PNN、ELM、C4.5三種分類模型進行對比,均采用VPNRS-RF約簡后的數據作為模型輸入結果,如表3所示。

表3 不同模型的故障識別對比Tab.3 Comparison of Fault Identification of Different Models

從表3可以看出,OSELM模型的識別準確率最高且OS-ELM明顯優于ELM、PNN、C4.5模型,說明了OSELM模型具有較好的精度和泛化能力。因此VPNRS-RF-OSELM 模型在飛機液壓系統故障診斷中可達到理想的效果。

4 結論

這里采用VPNRS-RF-OSELM故障診斷模型,利用變精度鄰域和模糊熵分別對原始特征集合進行屬性約簡,然后用RF對約簡后的特征進行重要度排序,選擇最優的特征個數,最后利用OS-ELM算法構建飛機液壓系統故障檢測模型。所采用的特征選擇算法相比WMNRS、GA、PCA等特征選擇算法精確度更高,因此,在模型對飛機液壓系統故障診斷時,應用VPNRS-RF特征選擇的OS-ELM模型相比于其他特征選擇算法和分類模型在分類精確度上具有一定優勢。

猜你喜歡
約簡特征選擇鄰域
稀疏圖平方圖的染色數上界
基于二進制鏈表的粗糙集屬性約簡
基于鄰域競賽的多目標優化算法
實值多變量維數約簡:綜述
基于模糊貼近度的屬性約簡
Kmeans 應用與特征選擇
關于-型鄰域空間
聯合互信息水下目標特征選擇算法
基于特征選擇和RRVPMCD的滾動軸承故障診斷方法
基于二元搭配詞的微博情感特征選擇
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合