?

基于GMM 的流體旋轉設備運行可靠性在線評價方法

2024-04-07 01:59吳賢慧王莉靜張建業
流體機械 2024年2期
關鍵詞:離心機可靠性聚類

郗 濤,王 博,吳賢慧,王莉靜,張建業

(1.天津工業大學 機械工程學院,天津 300387;2.天津城建大學 控制與機械工程學院,天津 300384)

0 引言

隨著水輪機、渦輪發動機、離心機等流體旋轉設備的廣泛應用,相應的設備運行與維護也越來越受重視,目前各大企業為了降低運維成本,相繼建立了基于物聯網的設備運行實時監控系統,但只能對關鍵參數進行在線監測,無法對設備運行的可靠性進行評價。因此研究準確高效的設備在線運行可靠性評價方法,實現準確的可靠性預測,對于降低設備故障頻率、延長設備安全運行時間、指導預防性維修具有重要意義。

在設備運行可靠性評價領域,荊岫巖等[1]提出了一種基于比例協變量模型的抽水蓄能機組軸系運行可靠性評估方法,該方法需要獲取故障數據計算初始故障率,但是由于設備故障種類多,導致難以得到準確的初始故障率;URBAHA 等[2]提出一種基于聲發射監測評估飛機燃氣輪機轉子葉片的可靠性評價方法,但該方法僅適用于故障發生后的維修期間,無法實現運行中的實時評估;陳衛沖等[3]通過對軸承溫升、機組振動信號識別分析,實現泵站故障的原因分析與智能預警,完成了大型泵站運行狀態的評價;王紅軍等[4]對振動信號進行處理,構建高維特征空間,計算當前狀態與正常狀態的特征子空間的夾角,來表征設備的運行可靠性。但是旋轉設備在實際運行中,振動源多且復雜,存在振動信號不易提取,安裝振動傳感器增加運維成本的問題[5]。

由于流體旋轉設備內部流體物料的不固定性與不穩定性,設備往往在多種工況條件下運行。而工況變化進一步導致電流、溫度等監測參量的變化[6]。針對流體旋轉設備存在多工況運行的問題,本文提出分工況進行設備運行可靠性評價的方法。通過建立監測數據、工況條件、運行狀態與系統可靠性之間的聯系,基于高斯混合模型(Gaussian Mixture Model,GMM)實現設備運行可靠性在線評價。

1 構建運行工況劃分模型

在不同環境溫度和不同負載情況下,基于傳感器采集的設備運行數據存在較大差異,若只考慮單一工況,勢必影響可靠性評價的準確性,為了提高可靠性評價的準確性、可靠性、普適性,故進行工況劃分。由于流體旋轉設備無法簡單的通過重力傳感器實現工作負載識別,故本文通過設備歷史運行數據采用聚類的方法實現工況劃分。

分別使用基于密度的空間聚類算法(DBSCAN)和基于快速搜索和發現密度峰值的聚類算法(DPC)在公開數據集上進行對比分析。本文采用C-MAPSS 公開數據集中的test_FD002數據作為測試數據集進行聚類分析,該數據集由美國航天航空局創建,模擬了渦輪風扇發動機的實際退化過程,包括6 種工況下21 個傳感器參數信息,最后采用3 種常用的聚類性能評價指標評價算法性能,選擇聚類性能較好的算法應用于設備的工況劃分。

1.1 DBSCAN 聚類算法

DBSCAN 是一種能夠很好地識別噪聲點,可以實現快速聚類[7]。該算法主要根據設定的鄰域半徑(Eps)和樣本在鄰域半徑內包含的最小鄰域點個數(Minpts)實現聚類。但是該算法存在鄰域半徑和最小領域點個數難以確定,且參數對聚類效果特別敏感的缺點。

1.2 DPC 算法

DPC 算法是由ALEX RODRIGUEZ 等[8]于2014 年提出,該聚類算法不需要提前指定聚類個數,能夠自動發現聚類中心點,實現高效聚類。對于每一個數據點,都可以計算它的局部密度ρi和該點距離高密度點的最小距離δi,其局部密度定義為:

式中,χ(·)為邏輯判斷函數;dij為xi與xj之間的距離;dc為截斷距離。

δi是通過計算數據點xi與其他更高密度點的最小距離,δi定義為:

1.3 聚類效果評價

使用聚類評價指標對上述2 種聚類算法在公開數據集C-MAPSS 上進行聚類效果評價。已知數據集X={x1,x2,…,xn},真實類標簽為U={U1,U2,…,UT},聚類劃分結果為V={V1,V2,…,VC},采用聚類精度(ACC)、調整互信息指數(AMI)、調整蘭德系數(ARI)評價聚類性能為:

式中,N1為正確聚類的樣本數;N為總樣本數;H(U),H(V)分別為U和V的熵;MI(U,V)為互信息;E{MI(U,V)}為互信息的期望值;a為在真實和試驗情況下都屬于同一個簇的點對數目;b為在真實情況下屬于同一個簇而在試驗情況下不屬于同一個簇的點對數目;c為在真實情況下不屬于同一個簇而在試驗情況下屬于同一個簇的點對數目;d為在真實和試驗情況下都不屬于同一個簇的點對數目[9]。

借助公開數據集對上述2 種聚類算法的聚類結果進行對比分析,得到聚類效果見表1。

表1 聚類效果分析Tab.1 Clustering effect analysis

可以發現,DPC 具有更高的聚類精度,故本文選擇DPC 聚類方式對設備運行工況進行劃分。

2 構建運行工況在線識別模型

為了實現對設備運行工況的實時在線識別,本文選擇XGBoost 算法[10]對含工況類別的歷史數據集進行訓練,構建工況識別模型。

XGBoost 樹模型以CART 作為基分類器,通過Gradient Boosting 實現多棵CART 樹組合的集成學習算法[11-12],XGBoost 的模型定義為:

式中,fK(xi)表示第K棵決策樹。

XGBoost 的目標函數定義為:

式中,L(y i)為損失函數;Ω(fk)為正則項;γ,λ為超參數、控制懲罰程度;T為葉節點個數;ω為每個葉子節點的權重分數。

3 構建設備運行可靠性評價模型

3.1 特征選取

為了降低評價模型的復雜度,避免引入冗余特征,故進行特征選擇,挑選出與設備運行狀態更具相關性的特征,構建合理的特征向量作為評價指標。首先選用ReliefF 算法計算每個特征對設備運行狀態的重要度,保留貢獻度大的特征,為了避免強相關性特征對模型準確率的影響,利用Pearson 算法計算每個特征之間的相關性,針對具有強相關性的2 個參量,只保留重要度較大的參量,去除冗余特征。

3.2 構建基于GMM 的運行可靠性基準模型

高斯混合模型[13-15]是一種無監督學習算法,其原理是通過多個高斯概率密度函數的線性組合表示數據的空間分布,可以實現任意類型分布數據的有效擬合。

現假設數據樣本集合D中包含m維樣本特征,n個樣本數據,第i個樣本Xi={x1,x2,…,xm},各樣本均符合高斯分布,某一時刻樣本觀測值Xi的概率表示為:

式中,P(x)為高斯混合模型的概率密度函數;ωk,μk,σk分別為第k個樣本的權重、均值、協方差,且為高斯概率密度函數。

利用公開數據集中某一工況下正常運行階段的數據進行訓練,得到三維基準高斯混合模型如圖1 所示。

圖1 基準高斯混合模型的三維Fig.13 d graph of the datum Gaussian mixture model

3.3 構建運行可靠性評價指數

將經特征選擇后的設備實時監測數據作為一個特征向量,基于馬氏距離來度量當前特征向量偏離基準高斯混合模型的距離,當前特征向量與第個高斯模型馬氏距離表示為:

則特征向量與高斯混合模型的偏離程度表示為:

為更直觀地了解當前設備的運行可靠性程度,將馬氏距離映射到[0,1]之間作為設備運行可靠性評價指數(Operational Reliability Index,ORI),其中,可靠性指數越接近于1 表示設備運行越可靠。

式中,α為調整系數,取α=0.015。

4 實例分析

為了驗證上述所提方法的有效性,以礦用離心機設備為實例進行分析,離心機是運用高速旋轉離心原理實現固液分離的裝置[16]。針對離心機載荷變化明顯,存在多種運行工況的問題,本文分工況實現對離心機設備的運行可靠性評價[17]。

本文以北京某礦用離心機設備生產廠商所生產的WL1200 型臥式振動離心機作為研究對象,利用離心機遠程監控平臺采集設備實際運行數據進行驗證,其中包括正常運行狀態下的數據和故障數據,部分監測特征參量見表2。

表2 監測參量Tab.2 monitoring parameters

4.1 基于DPC 算法的工況劃分

本文對歷史數據集采用DPC 算法進行聚類分析,分別得到圖2 的決策和圖3 的二維可視圖,可以看出離心機歷史數據集被劃分為5 種典型工況。

圖2 離心機數據集上得到的決策Fig.2 Decision diagram obtained from centrifuge dataset

圖3 離心機數據集上得到的二維聚類效果Fig.3 Two-dimensional clustering effect graph on centrifuge dataset

將聚類后的數據點還原到原來的數據空間,分別得到工況1~5 的工況情況見表3~7。

表3 礦用離心機工況1 模型Tab.3 Working condition 1 model of mining centrifuge

表4 礦用離心機工況2 模型Tab.4 Working condition 2 model of mining centrifuge

表5 礦用離心機工況3 模型Tab.5 Working condition 3 model of mining centrifuge

表6 礦用離心機工況4 模型Tab.6 Working condition 4 model of mining centrifuge

表7 礦用離心機工況5 模型Tab.7 Working condition 5 model of mining centrifuge

4.2 基于XGBoost 算法的運行工況在線識別

為了驗證XGBoost 算法在離心機工況識別上的準確率,隨機提取歷史運行數據作為測試集并帶入到訓練好的模型中進行測試,測試結果如圖4 所示。

圖4 工況預測結果分析Fig.4 Analysis of condition forecasting results

由圖中可以看出,使用該算法進行工況識別具有較高的準確率。

4.3 特征選擇

使用ReliefF 算法計算每個特征對離心機運行狀態的重要度,得到24 個參量的平均重要度見表8。

表8 監測參量的平均重要度Tab.8 Average importance of monitoring parameters

由于ReliefF 算法無法有效去除冗余特征,本文選擇保留重要度大于0.5 的特征參量,然后使用Pearson 算法去除冗余參量,將Pearson 相關系數的閾值設定為0.9,若相關性超過0.9,則只保留重要度較高的參量。經過上述特征選擇,最終選擇主電機A 相電流、振動電機1A 相電流、振動電機2A 相電流、主電機繞組溫度,振動電機1 溫度、振動電機2 溫度、油泵電機溫度、主振彈簧溫度、篩籃位移、潤滑油溫度、主軸轉速、主軸溫度、前后軸承溫度共14 個參量作為評價指標。

4.4 基于GMM 方法的運行可靠性基準模型構建

在設備正常運行數據集中分別提取5 種不同運行工況下的歷史運行數據,利用上述14 個狀態參量分別構建5 種不同工況下的運行可靠性基準模型。為實現運行可靠性評價,將實時在線采集的14 個狀態參量作為一個特征向量,對該特征向量進行工況識別后再將此特征輸入到對應工況下的基準高斯混合模型中,測量該特征與基準模型的馬氏距離,再將馬氏距離映射到[0,1]之間得到運行可靠性指數(ORI)。

4.5 結果分析

為了驗證本文所提算法能夠有效反應設備的劣化過程,取3 臺設備從投入運行至第一次維修之前的運行數據。由于數據量太大,每間隔10 h 提取一條運行數據,構成測試數據集進行驗證。計算得到設備運行期間的運行可靠性指數變化趨勢如圖5 所示。

圖5 設備全壽命周期的運行可靠性指數Fig.5 ORI of equipment life cycle

隨著設備運行時間的增加,運行可靠性指數不斷下降,且設備故障點越多,運行可靠性指數越低,符合實際。

為了進一步驗證故障點個數與運行可靠性的關系,分別提取工況1,2,4 下的正常運行數據、含有1 種故障、含有2 種故障和含有3 種及以上故障的設備運行數據,得到對應的運行可靠性指數ORI。對應工況1,得到各運行條件下的ORI分布,如圖6 所示。

圖6 工況1 不同運行條件下的ORIFig.6 ORI in different operating conditions of condition 1

對應工況2,得到各運行條件的ORI,如圖7所示。

圖7 工況2 不同運行條件下的ORIFig.7 ORI in different operating conditions of condition 2

對應工況4,得到各運行條件的ORI,如圖8所示。

圖6~8 分別示出了工況1、工況2、工況4 下,故障點個數與運行可靠性指數的關系,可以看出隨著設備故障點數的增多,設備運行可靠性不斷降低。對5 種工況不同運行條件下的運行可靠性指數分布情況進行統計,得到不同工況不同運行條件下的ORI分布見表9。

表9 不同工況運行條件下的ORI 分布Tab.9 ORI distribution under different operating conditions

為了建立統一的評價標準,對表9 作進一步分析,按正常運行狀態、含1 種故障狀態、含2 種故障狀態、含3 種及以上故障狀態劃分評價等級,依次為高可靠性階段、低可靠性階段、警告和危險階段。以工況內取中值和工況間取均值的方法建立表10 所示的整機運行可靠性評價標準。

根據表10 可知,當整機設備運行可靠性指數小于0.857 時,可以認為設備開始出現故障特征,離心機開始進入劣化狀態,工作人員可以對離心機進行適當維修。

表10 離心機設備整機運行可靠性評價標準Tab.10 Standard for reliability evaluation of centrifuge equipment

為了驗證評價準確率,取正常狀態下的運行數據并計算運行可靠性指數,得到ORI分布如圖9 所示??梢园l現,設備在正常運行狀態下僅有少數樣本點的ORI指數低于0.857,通過統計發現評價準確率達到98%以上。

圖9 正常樣本點的ORI 分布Fig.9 ORI distribution of normal samples

有學者針對礦井通風機的運行可靠性提出了基于PCA-MSET 的運行可靠性評價方法,對13個監測變量降維后建立可靠性評價模型,利用歐式距離計算殘差得到可靠性指標[18]。但是該方法僅考慮了單工況運行情況,若將該方法用于多工況運行的設備,則會導致評價不準確?;谏鲜龇椒?,不再考慮多工況問題,使用離心機處于健康狀態下的運行數據建立評價模型并進行可靠性評價,得到圖10 示出的設備ORI分布。

圖10 僅考慮單工況下的ORI 分布Fig.10 ORI distribution under single working condition

由圖中可以看出,基于PCA-MSET 的單工況運行可靠性評價模型,采用本文所用的離心機處于健康狀態下的運行數據進行仿真,評價結果不準確且存在明顯分層現象,也驗證了工況類別對設備運行可靠性評價存在較大影響。因此本文所提方法在處理多工況運行的設備上效果更好。

5 工程應用

本文依托北京某公司離心機設備遠程監控與運行可靠性評價項目,驗證本文所提方法的有效性,將其集成到遠程監控系統中并應用到選煤廠的離心機設備上。

首先采集離心機設備運行數據并傳輸到遠程監控系統中,現場設備PLC 通過傳感器采集得到設備運行狀態參數,通過DTU 將數據上傳至遠程監控系統中。大型選煤廠一般將所有信號接回集控中心,小型選煤廠為節省布線成本,一般會在現場進行數據采集,現選用1 臺WL1200 型臥式振動離心機和現場電氣控制柜,完成設備控制、數據采集和數據遠程傳輸。

離心機遠程監控系統包括多個功能模塊,離心機的部分重要運行數據可以直觀得到。

使用Python 語言對運行可靠性評價相關算法完成編寫后,將其嵌入到遠程監控系統后臺,通過程序調用實現對離心機設備的運行可靠性評價,選擇界面左側“設備信息管理”下的“運行可靠性評價”選項,選擇對應的項目便可以查看該項目下所有設備的運行可靠性指數,同時運行狀態異常的特征數據點也會顯示在對應的設備上。

本文選取1 臺由于主電機溫度過高發出預警的設備進行驗證。該設備在2020 年10 月12 日17 時發出主電機溫度報警,圖11 示出了故障前、后主電機溫度的變化曲線。

圖11 主電機繞組溫度變化曲線Fig.11 Temperature change curve of main motor winding

得到故障發生前、后的設備ORI的變化曲線,如圖12 所示。

圖12 ORI 變化曲線Fig.12 ORI curve

由圖12 可以看出,大概在17:00 左右溫度超出閾值范圍,觸發報警,由圖13 可以發現,隨著繞組溫度偏離正常溫度區間,設備ORI逐漸減小,大約在13:30 左右,ORI已經低于正常運行狀態。由此可以看出,本文所提方法可以有效地實現設備運行可靠性的評價,可以早于閾值報警發出故障預警,更早的識別出設備性能力惡化狀況,起到提早發現故障的作用。

6 結論

(1)針對流體旋轉機械運行可靠性的問題,提出了一種基于GMM 的運行可靠性的評價方法。

(2)以離心機設備為例進行實例分析,考慮到離心機運行過程中存在多種工況,為了提高評價模型的適用性和評價準確率,進行分工況處理,共得到5 種典型工況;為了降低模型的復雜度,提高效率,進行特征選擇,從24 個監測參量中選擇14 個特征參量作為評價指標參與高斯混合模型構建。最后基于馬氏距離得到ORI,結果表明,當ORI低于0.857 時,便可認為離心機設備進入低可靠性運行階段,且評價準確率達到98%以上。

(3)在實際應用中,本文所提方法可以提前預測設備的劣化狀態,有效地幫助設備管理人員實時掌握當前設備的運行情況,及時做出維修決策。

猜你喜歡
離心機可靠性聚類
可靠性管理體系創建與實踐
LP60型雙級活塞推料離心機的研制與應用
基于DBSACN聚類算法的XML文檔聚類
5G通信中數據傳輸的可靠性分析
基于高斯混合聚類的陣列干涉SAR三維成像
離心機轉速及相對離心力的正確表示
基于可靠性跟蹤的薄弱環節辨識方法在省級電網可靠性改善中的應用研究
ZPJ-40型高速轉盤離心機減振技術
土工離心機研制概述
一種層次初始的聚類個數自適應的聚類方法研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合