?

基于DGLPP-SVDD算法的化工過程故障檢測

2024-04-26 21:03孫四通李師慶
化工自動化及儀表 2024年2期
關鍵詞:故障檢測特征提取

孫四通 李師慶

作者簡介:孫四通(1964-),副教授,從事過程優化與故障檢測方向的研究,slsyjs2023@126.com。

引用本文:孫四通,李師慶.基于DGLPP-SVDD算法的化工過程故障檢測[J].化工自動化及儀表,2024,51(2):310-318.

DOI:10.20030/j.cnki.1000-3932.202402021

摘 要 為解決傳統全局局部保留投影算法(GLPP)不能充分利用已有故障數據進行特征提取的缺點,提出了判別全局局部保留投影算法(DGLPP)。在數據降維處理后,為應對高斯和非高斯混合分布的過程數據特性,通過支持向量數據描述算法(SVDD)構建故障檢測統計量。將兩種算法相結合提出基于DGLPP-SVDD的故障檢測方法。將DGLPP-SVDD算法應用于TE過程仿真,并與GLPP算法對比,結果表明:DGLPP-SVDD算法具有更短的故障檢測滯后時間和更高的故障檢測率。

關鍵詞 特征提取 DGLPP-SVDD算法 圖嵌入 故障檢測 全局局部保留投影 支持向量數據描述

中圖分類號 TP277? ?文獻標志碼 A? ?文章編號 1000-3932(2024)02-0310-09

為了預防化工事故的發生以及在發生故障時能夠及時報警,構建一個針對化工過程的故障檢測模型至關重要。在化工生產過程中,采集到的數據一般都具有高維度的特點,為此普遍在構造故障檢測模型前先進行數據特征提取或特征選擇來壓縮數據維度[1]。數據特征提取方法旨在保留高維數據的特性,目前主要有兩種類型的算法分別從全局角度和局部角度進行特征提取。以主成分分析(PCA)[2,3]及其變體為代表的全局方法通過保持數據的最大方差來學習數據的全局信息,但此類方法忽略了數據的局部信息。以局部保留投影(LPP)[4~6]及其變體為代表的流形學習方法旨在提取數據的局部近鄰信息,但此類方法忽略了由方差信息和高階統計量表示的全局信息。針對這些方法存在的問題,LUO L J提出了全局局部保留投影算法(GLPP)來提取全局和局部特征[7]。在此基礎上,文獻[8]提出非線性動態全局局部保留投影(NDGLPP)算法;同時還有一些基于核函數和稀疏性的GLPP變體[9~11]。然而基于GLPP及其變體的故障檢測方法并沒有充分利用已有的故障數據,而是僅依靠對正常工況數據進行特征提取來實現故障檢測。對于一個真實的工業過程,即使不可能收集到所有類型的故障數據,但歷史數據庫中總是有一些已知的故障數據,而這些先驗故障數據可以為在線故障檢測提供一些非常有價值和強大的故障判別信息[12,13]。因此在GLPP基礎上,有必要通過考慮利用已有故障數據進行擴展來提取有利于故障檢測的判別特征。

數據降維后需要構建統計量以檢測是否發生故障。常用的統計量有T2和SPE,但其受限于數據服從高斯分布的假設(實際工業生產中數據通常是高斯和非高斯混合分布)[14]。支持向量數據描述(SVDD)算法不受數據服從高斯分布的限制,并且能夠處理非線性數據,目前已廣泛應用于故障檢測領域[15,16]。

綜上所述,為充分利用先驗故障數據來提取判別特征,筆者在圖嵌入框架下對GLPP算法進行判別擴展,提出了DGLPP算法。數據降維后,使用SVDD在數據高斯和非高斯混合分布的情況下構建合適的統計量,從而提出基于判別全局局部保留投影和支持向量數據描述(DGLPP-SVDD)的故障檢測算法,并通過TE過程仿真驗證該方法的有效性。

1 算法描述

1.1 DGLPP算法

基于GLPP算法的描述[7],筆者在圖嵌入框架下將其擴展為DGLPP算法。與GLPP訓練樣本只包含正常數據不同,DGLPP的訓練樣本包括正常數據和各類故障數據。對于m維n個樣本點組成的數據矩陣X=[x,x,…,x]∈R,尋找一個合適的降維轉換矩陣A∈R,通過Y=AX變換,得到維度為l(l

J=min(y-y)W?搖J=-min(y-y)?搖J=-min(y-y)?搖 (1)

其中,J是指降維時保留類內樣本的局部信息;J是指保留類內樣本的全局信息;J是指保留正常樣本和故障樣本之間的判別信息;y、y表示低維空間中的樣本點;W、W、分別表示高維空間中構造的3個權重矩陣,以表征3個有不同邊連接關系的圖結構。若高維空間的樣本點xi和xj在圖中存在邊連接,則權重矩陣中對應的元素值以熱核法表示,即exp(-‖x-x‖/t)(其中,t為經驗參數,‖·‖表示歐氏距離);若x和x之間不存在邊連接,則3個權重矩陣W、W、中對應的元素為零。

3個圖結構中樣本點之間存在連接邊的條件不同:在類內局部圖中條件為樣本點x和x為類內k近鄰關系;在類內全局圖中條件為樣本點x和x不是類內k近鄰關系;在類間判別圖中條件為正常樣本點x和每類故障樣本點x為類間k近鄰關系。為了平衡3個子優化目標的關系,引入權重系數η來構成一個整體優化函數。DGLPP的優化函數表達式如下:

J=min{η(J+J)+(1-η)J}

=min(y-y)2R? (2)

=min(aXHXa-aXRXa)=min(aXMXa)

s.t. aa=1

R=η(W-)-(1-η)W

其中,H為對角矩陣(H=R),拉普拉斯矩陣M=H-R;a為降維轉換向量。最終的優化問題可以轉換為求Ma=λa(λ為矩陣特征值)的廣義特征值,從而得到降維轉換矩陣A。η是一個介于0和1之間的值,用于平衡子目標函數間的重要性,其值對總體目標函數具有較大影響。η值的選取準則為:ηρ(W-)=(1-η)ρW,其中ρ(·)代表矩陣的譜半徑。

圖1、2分別為GLPP、DGLPP降維過程示意圖。假設在高維空間中有3類數據,圓點代表正常運行數據。GLPP通過在正常數據中構造局部圖和全局圖進行降維。DGLPP通過構造類內局部圖、類內全局圖和類間判別圖進行降維。以樣本間的最近鄰距離和類別為依據,設置樣本點在圖中的邊連接關系,同類別樣本設置k=2近鄰,正常樣本與各類故障樣本間設置k=3近鄰。圖1、2中以標黑樣本點為例顯示與其他樣本之間的邊連接關系,邊上的箭頭方向表示降維時力作用的方向。圖1中,在局部圖中有邊連接關系的正常樣本點會相互吸引,而在全局圖中會相互排斥,從而使得正常數據在低維空間中出現類內聚集且整體形狀保持的效果,但GLPP對異常類數據并無約束,可能導致在低維空間中出現正常數據和異常數據相互交疊的情況,從而影響后續故障檢測效果。圖2中,在類內局部圖中有邊連接關系的樣本點會類內相互吸引,在類內全局圖中有邊連接關系的樣本點會類內相互排斥,在類間判別圖中有邊連接關系的正常樣本和故障樣本相互排斥,從而實現降維后類內樣本聚集且整體形狀保持并且正常數據與故障數據相互遠離的效果。

1.2 SVDD算法

SVDD的基本思想是構造一個球心為b、半徑為r的超球體,使其盡可能多地包含訓練樣本中的正樣本且體積盡可能小,從而實現正樣本與負樣本最大程度的分離。SVDD應用的關鍵是尋找最優的超球體,其優化函數如下:

min r+Cξ

s.t.‖?準(x)-a‖≤r+ξ,ξ>0,i=1,2,…,n? ?(3)

其中,C為超球體體積和誤差的平衡參數;ξ為每個訓練樣本x對應的誤差松弛變量;?準(x)表示從低維空間映射到高維空間的數據。

將式(3)轉換為對偶問題:

maxαK(x·x)-ααK(x·x)? ?(4)

s.t.α=1,0≤α≤C

其中,拉格朗日乘數α=[α,α,…,α];K(·)為引入的核函數。求解式(4)即可確定半徑r:

r=1-2αK(x·x)+ααK(x·x)? ?(5)

其中,x為支持向量。測試樣本z到超球體球心的距離D的計算式為:

D=‖z-a‖=1-2αK(z,x)+ααK(x,x) (6)

若D>r,則認為測試樣本是異常的,反之則為正常。

2 基于DGLPP-SVDD的故障檢測

DGLPP-SVDD故障檢測流程分為離線建模和在線檢測兩部分?;贒GLPP-SVDD算法的故障檢測流程如圖3所示。

離線建模流程如下:

a. 載入正常工況和故障工況數據組成訓練集,求取正常數據的平均值和標準差,然后對整個數據集進行標準化處理。

b. 設置相關參數,構造3個圖結構,采用DGLPP算法求取降維轉換矩陣A。求取整個數據集的低維投影數據Y=AX和正常數據的低維投影數據Y=AX。

c. 用Y作為SVDD算法的訓練集,訓練SVDD算法模型,得到超球面中心和半徑。

在線檢測流程如下:

a. 載入測試數據x,并用離線建模時的平均值和標準差進行標準化;

b. 獲得測試數據x在低維空間中的表示Y=AX;

c. 將Y作為已訓練好的SVDD算法測試集,計算樣本點到超球面中心的統計量D,并判斷是否超過控制限。

3 仿真與結果分析

3.1 實驗數據集

TE過程是美國伊斯曼公司根據真實化工過程開發的一個仿真平臺,其產生的數據具有時變、強耦合和非線性特征,廣泛用于測試復雜工業過程的控制和故障診斷模型[17~19]。TE過程主要由反應器、冷凝器、氣液分離塔、壓縮機和汽提塔5部分組成,其工藝流程如圖4所示。TE生產過程主要由4種氣態物料參與反應,分別為A、C、D和E,生產出兩種產品G、H,并伴有一種副產品F,此外在產品的進料中會含有少量的惰性氣體B。生產過程為:首先將物料A、C、D、E送入反應器,然后將產物送入冷凝器,冷凝后的產物進入汽液分離器,氣相組分經壓縮機循環后進入反應器,液相組分進入汽提塔與剩余的反應物分離,然后分離得到產物G和H。

TE過程包括22個過程測量變量、19個成分測量變量和12個操作變量,具體變量描述可見文獻[18]。TE仿真控制系統中共預設有21種不同的故障,全部故障描述可見文獻[19]。筆者選取與文獻[19]相同的34個變量用于構建監控模型,即22個過程測量變量和12個操作變量。使用廣泛采用的數據集進行訓練和測試,此數據集中包括正常工況的仿真數據和21類故障數據。每類數據包括480個樣本點的訓練集和960個樣本點的測試集,故障測試集中從第161個樣本處引入故障,樣本點的采樣間隔為3 min。

3.2 仿真設置及結果分析

在GLPP降維算法的基礎上加以改進得到DGLPP降維算法,并與文獻[19]中的GLPP-T2和GLPP-SPE算法作對比,即通過在GLPP降維后的主元空間建立T2統計量和在殘差空間中建立SPE統計量,研究筆者算法在TE過程上的故障檢測性能。根據文獻[19]對GLPP故障檢測算法做相同的設置,k1近鄰數目設為10,降維后保留16個維度;熱核參數t設為距離平均值;設定T2和SPE控制限的置信度為99%。為定量對比,對DGLPP做相似的參數設置,類內k近鄰數目設為10,類間k近鄰數目設為20,降維后保留16個維度;t設為距離平均值;設定SVDD算法中高斯核參數為8,參數C=0.05。為了對比DGLPP與GLPP的故障檢測性能,筆者采用故障檢測滯后時間、故障檢測率(FDR)和故障誤報率(FAR)來表征對TE過程中21個故障的檢測性能。其中,故障檢測滯后時間是指故障發生后到第1次檢測出故障的時間,FDR是指檢測出來的故障樣本數占總故障樣本數的比值,FAR是指正常數據中誤報的樣本個數占正常數據的比值。TE過程21個故障的故障檢測滯后時間、FAR和FDR見表1。已有研究證明,故障3、9、15難以通過數據驅動方法進行檢測,故在表1中記錄了去除這3個故障后的平均值(平均值*)。

從表1可以看出,對于易于檢測的故障(如故障1、2、6、7、8、13、14),3種方法的故障檢測率都比較高。對于GLPP-T2和GLPP-SPE難以檢測的故障(如故障4、11、19),采用DGLPP-SVDD可以有更高的故障檢測率。對于所有方法來說,檢測故障3、9、15都是極其困難的,這是因為它們對測量變量的平均值、方差或峰值時間影響很小??傮w來看,DGLPP-SVDD算法的平均故障誤報率相比于GLPP-T2和GLPP-SPE算法有一定上升,但從提高故障檢測率效果來看,代價是可以接受的。DGLPP-SVDD算法有更高的故障檢測率和更短的故障檢測滯后時間,這是因為在提取正常數據和故障數據間的判別信息后對故障更加敏感。

筆者選擇故障5(階躍故障)、故障10(隨機故障)和故障19(未知故障)進行具體分析對比,檢測結果如圖5~7所示。故障5的原因是由于冷凝器冷卻水進口溫度發生階躍變化。該變化導致系統增加冷凝器冷卻水流速以補償溫度變化。此外,當故障發生時從冷凝器到分離器的物料流速也發生變化,這進一步增加了分離器中的溫度。然而控制回路可以補償這種變化,使得分離器溫度可以在大約第360個采樣之后返回到初始設定點。從圖5可以看出,GLPP-T2算法可以在第161個樣本點檢測到故障,并且可以一直持續報警。GLPP-SPE算法可以在第161個樣本點檢測到故障,但受到TE工藝的閉環反饋特性影響,在第360個采樣點之后無法對故障實現有效檢測。DGLPP-SVDD算法可以在第161個采樣點檢測到故障,并且可以持續檢測故障。

圖5 故障5檢測結果

圖6 故障10檢測結果

圖7 故障19檢測結果

故障10的原因是物料C的溫度發生隨機變化,由于物料C被送入汽提塔,故該故障導致汽提塔溫度持續波動。汽提塔蒸汽閥通過改變整個過程中的開度來緩解汽提塔溫度變化,這意味著該故障影響系統操作條件動態變化,故檢測結果也是上下波動變化。從圖6可以看出,GLPP-T2算法可以在第175個采樣點處檢測到故障,DGLPP-SVDD算法可以在第166個樣本點檢測到故障,從故障檢測延遲角度看,DGLPP-SVDD算法效果更優。從故障檢測率角度看,DGLPP-SVDD算法和GLPP-T2算法都可以檢測出該故障,而GLPP-SPE算法的故障檢測率卻很低。

故障19為未知故障,無法從工藝機理上進行分析。從圖7可以看出,GLPP-T2和GLPP-SPE算法在故障19發生后基本檢測不到;DGLPP-SVDD算法可以在第161個采樣點處檢測到故障19,并可以對其持續檢測報警到結束,故障檢測率較高。

4 結束語

筆者提出了基于判別全局局部保留投影-支持向量數據描述的故障檢測算法。DGLPP降維算法是在GLPP的基礎上擴展而來,解決了傳統GLPP不能利用先驗故障數據的問題。DGLPP通過構建3個圖結構同時保留數據的局部信息、全局信息和基于故障樣本的判別信息,提取到有利于后續故障檢測的低維特征,在數據降維后利用SVDD算法處理非高斯數據的優勢構建監控統計量,提高了算法的故障檢測性能。在TE過程仿真平臺上與GLPP算法進行對比,結果證明了DGLPP-SVDD有更高的故障檢測率和更短的檢測滯后時間。提出的圖嵌入框架下的改進策略,可為其他故障檢測方法提供改進思路。

參 考 文 獻

[1] 姚羽曼,羅文嘉,戴一陽.數據驅動方法在化工過程故障診斷中的研究進展[J].化工進展,2021,40(4):1755-1764.

[2] RUSSELL E L,CHIANG L,BRAATZ R D.Fault detection in industrial processes using canonical variate analysis and dynamic principal component analysis[J].Chemometrics and Intelligent Laboratory Systems,2000,51(1):81-93.

[3] DENG X G,TIAN X M,CHEN S,et al.Fault discriminant enhanced kernel principal component analysis incorporating prior fault information for monitoring nonlinear processes[J].Chemometrics and Intelligent Laboratory Systems,2017,162:21-34.

[4] HE X F,NIYOGI P.Locality preserving projections[J].Advances in Neural Information Processing Systems,2003,16(1):186-197.

[5] 張學磊,徐進學,祝朋艷.基于改進核局部保持投影的故障檢測方法研究[J].計算機應用與軟件,2022,39(5):115-124;131.

[6] ZHONG F J,ZHANG J S,LI D F.Discriminant Locality Preserving Projections Based on L1-Norm Maximization[J].IEEE Transactions on Neural Networks and Learning Systems,2014,25(11):2065-2074.

[7] LUO L J.Process monitoring with global-local preserving projections[J].Industrial & Engineering Chemistry Research,2014,53(18):7696-7705.

[8] 徐靜,王振雷,王昕.基于非線性動態全局局部保留投影算法的化工過程故障檢測[J].化工學報,2020,71(12):5655-5663.

[9] 徐靜,王振雷,王昕.基于DGLPP-SVDD算法的化工過程故障檢測[J].控制工程,2021,28(12):2462-2468.

[10] LUO L J,BAO S Y,MAO J F,et al.Nonlinear process monitoring based on kernel global-local preserving projections[J].Journal of Process Control,2016,38:11-21.

[11] BAO S Y,LUO L J,MAO J F,et al.Improved fault detection and diagnosis using sparse global-local preserving projections[J].Journal of Process Control,2016,47:121-135.

[12] 郭小萍,尹瑞琛,李元.基于MDP-SVM的過程多類型故障診斷[J].電子測量技術,2022,45(1):159-164.

[13] 常書源,趙榮珍,陳博,等.基于邊界判別多流形分析的故障數據集降維方法[J].振動與沖擊,2021,40(23):120-126.

[14] LUO L J,XU M,BAO S Y,et al.Improvements to the T2 statistic for multivariate fault detection[J].Industrial & Engineering Chemistry Research,2019,58(45):20692-20709.

[15] TAX D M J,DUIN R P W.Support vector data description[J].Machine Learning,2004,54:45-66.

[16] HUANG J,ERSOY O K,YAN X F.Fault detection in dynamic plant-wide process by multi-block slow feature analysis and support vector data description[J].ISA Transactions,2019,85:119-128.

[17] 顧炳斌,熊偉麗.基于多塊信息提取的PCA故障診斷方法[J].化工學報,2019,70(2):736-749.

[18] GE Z Q,SONG Z H.Distributed PCA model for plant-wide process monitoring[J].Industrial & Engineering Chemistry Research,2013,52(5):1947-1957.

[19] HUANG C H,CHAI Y,LIU B W,et al.Industrial process fault detection based on KGLPP model with Cam weighted distance[J].Journal of Process Control,2021,106:110-121.

(收稿日期:2023-03-28,修回日期:2024-01-23)

Failure Detection in Chemical Process Based on

DGLPP-SVDD Algorithm

SUN Si-tong, LI Shi-qing

(College of Automation and Electronic Engineering, Qingdao University of Science and Technology )

Abstract? Considering the fact that traditional global locality preserving projection(GLPP) algorithm fails to make full use of the existing failure data for feature extraction, a discriminant global locality preserving projection (DGLPP) algorithm was proposed. For purpose of dealing with the process data characteristics of Gaussian and non-Gaussian mixture distribution, The data dimension reduction was completed and the support vector data description(SVDD) algorithm was used to construct fault detection statistics, including having two algorithms combined to propose a fault detection method based on DGLPP-SVDD. Applying the DGLPP-SVDD algorithm to TE process simulation and compared with GLPP algorithm shows that, the DGLPP-SVDD algorithm has shorter fault detection lag time and higher fault detection rate.

Key words? feature extraction, DGLPP-SVDD algorithm, graph embedding, failure detection, GLPP, SVDD

猜你喜歡
故障檢測特征提取
基于Gazebo仿真環境的ORB特征提取與比對的研究
基于Daubechies(dbN)的飛行器音頻特征提取
一種基于LBP 特征提取和稀疏表示的肝病識別算法
基于定子逆序的電機同步速變換故障檢測算法
優化網絡設備維護提高數據通信傳輸質量
新型探測線圈淺析
暖通空調系統故障檢測與診斷技術探討
基于DSP的直線特征提取算法
基于MED和循環域解調的多故障特征提取
Walsh變換在滾動軸承早期故障特征提取中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合