?

基于雙重控制策略的故障檢測方法

2024-01-23 08:26劉曉強李雨婷
關鍵詞:誤報率偏差閾值

劉曉強 ,李 飛 ,李雨婷

(安徽工業大學 a.電氣與信息工程學院;b.安徽省智能破拆裝備工程實驗室;c.安徽省特種重載機器人重點實驗室,安徽 馬鞍山 243032)

隨著社會的不斷發展和進步,現代工業生產過程的規模越來越大、復雜程度越來越高,工業過程的運行狀態不斷向智能化、自動化、集成化等方向發展[1]?,F代工業過程各環節相互關聯,任一環節出現故障會導致生產過程中部分功能出現故障,甚至導致整個生產過程癱瘓。對于化工生產、高爐煉鐵、火力發電和高精密加工等工業過程,若不能及時對過程進行故障檢測與識別會造成重大事故[2]。因此,對復雜工業過程進行有效的故障檢測是保障工業過程安全生產的有效手段,也是當前過程控制領域的研究熱點。

過去幾十年,多變量過程監控方法廣泛用于故障檢測并在工業過程監控中取得巨大成功,如主成分分析(principal component analysis,PCA) 方法[3-7]、獨立成分分析(independent component analysis,ICA)方法[8-9]、核主成分分析(Kernel principal component analysis,KPCA)方法[10]、基于核獨立成分分析(Kernel independent component analysis,KICA) 方 法[11]等。上述方法可看作是與霍特林T2統計量(簡稱T2統計量)相結合的數據處理辦法,適用于變量間有強相關的數據,不能反映所有變量的故障信息,若原始數據的相關性不強則達不到很好的降維效果,需與其他方法或統計量結合來監控工業過程。為此,研究使用控制圖的多變量過程監控方法用于工業過程。Crosier[12]提出一種多元累積控制圖法用于檢測正態分布變量均值的變化,Runger 等[13]提出一種累積和控制圖的多元擴展方法,Liu 等[14]提出一種基于改進歐氏距離控制(improved Euclidean distance control,IEDC)的多變量過程故障檢測方法。此類方法是基于控制圖的觀點并加以改進而提出的,中心性參數值依賴于基礎均值向量和協方差矩陣,過程失控時易出現均值向量偏移延遲的現象,致使故障檢測效果不佳。為探尋一種能反映過程更多變化信息的多元統計量,并對復雜工業過程進行直接監控,提出一種基于雙重控制策略(dual control strategy,DCS)的故障檢測方法,統計過程中所有監控變量的故障信息,以期達到良好的故障檢測效果。

1 偏差變量與統計量的生成

在復雜的工業過程中,控制變量特性會隨機變化進而導致表征信息的數據發生改變,從中可得到所需要的控制信息。為此,對采集的工業過程數據進行預處理,利用偏差變量的計算方法將其生成新的輔助監控統計量,得到參量正常與不正常數據之比,據此調節統計量閾值。

1.1 數據的預處理

數據包含大量信息且各數據的數量級相差很大,無法直接進行計算,需對其進行標準化處理,以保證各樣本數據的維度處于同一水平。假設整個工業過程中的多元變量X=(x1,x2,...,xT) , 其中xi∈R(N×1)(i=1,2,...,T),T表示觀測變量的個數,N表示觀測數據的數量。變量相互獨立且服從高斯分布xi~ψ(ui,σ2i),ui為均值, σ2i為方差。標準差標準化法的定義為

其中x′i為標準化后的數據。

1.2 偏差變量的計算

1.3 統計量的生成

2 基于雙重控制策略的多變量過程監控

給定變量的上下限從而確定偏差變量的表達式,實現第一重控制;對偏差變量進行絕對值處理并通過累計求和的方法得到新的輔助監控統計量,實現第二重控制;針對輔助監控統計量閾值不易確定的現象,提出一種基于反饋調節的參數自適應方法設置統計量的閾值。

2.1 變量上下限的選取

其中: μ1, μ2為大于零的系數;Exi,Sxi分別為xi的均值和標準差。若xi的控制區間關于均值對稱,則有μ1= μ2;若xi的控制區間不服從均值對稱,則系數可由置信區間的原理來確定。當變量服從正態分布時,可根據 3δ原則判斷上下限參數的大小,根據置信區間的原理,變量落在 3δ范圍內的概率高達99.74%,可信度高,因此可確定系數 μ1和 μ2的值為3。

2.2 統計量閾值的計算

Q的閾值限由置信區間原理確定,表示如下:

其中:Qup,Qdown分別為Q的 閾值上下限;EQ,SQ分別為Q的均值和標準差; η為大于零的系數,由置信區間的原理確定,與上述確定系數 μ1和 μ2的方法相同,設置 η為3。對輔助監控統計量Qa進行分析,該統計量不滿足高斯分布,閾值表示如下:

式中:Qa-up,Qa-down分別為統計量閾值的上下限;EQa,SQa分別為Qa的均值和標準差; ρ為大于零的系數。為分析變量上下限對Qa的影響,設置一個新的參量K,為Qa正常數據與不正常數據之比(ratio of normal and fault data,RNFD)。將在Qa閾值限內的數據個數統計到Qa-n中,在閾值限外的數據個數統計到Qa-f中。參量Qa的閾值范圍與正常數據和錯誤數據的個數由參數 ρ確定。一般情況下,正常數據比錯誤數據多才能使過程數據具有可靠性,即K≥1。從置信區間的原理可知,如果K值太大,會導致多數數據落點在 3δ原則外,不具說服性,在這種情況下需適當降低K值。為保證過程數據的合理性,提出一種基于反饋調節的參數自適應方法穩定K在1~3 之間,設置初始系數 ρ=1。

2.3 故障檢測流程

引入偏差變量的概念,并對偏差變量進行絕對值處理,再通過累積求和得到輔助監控統計量Qa。絕對值的存在不會出現均值抵消的情況,同時在統計量控制圖中體現出來的效果落差較大,更易觀察。使用Qa對工業過程進行故障檢測,其流程如圖1,具體步驟如下:

圖1 基于雙重控制策略的多變量過程監控方法流程圖Fig.1 Flow chart of multivariate process monitoring method based on dual control strategy

1) 導入訓練與測試數據,計算訓練數據的均值和方差并進行標準化處理;

2) 確定變量的上下限,并通過計算得到偏差變量;

3) 使用基于雙重控制的方法獲得Qa,先通過步驟2)得到偏差變量實現第一重控制,再通過對偏差變量進行絕對值處理并通過累計求和得到所需的Qa,實現第二重控制;

4) 確定初始系數 ρ并通過參數自適應策略將參量K穩定在1~3 的范圍內;

5) 確定Qa的閾值限;

6) 計算Qa數據的故障檢測率和誤報率;

7) 比較Qa與設置閾值限的大小得出是否發生故障的結論。

3 TE 過程的實驗及結果分析

3.1 仿真實驗

依據實際化工反應過程,美國Eastman 公司開發化工模型模擬仿真平臺[15],即田納西伊斯曼過程(TE 過程)。此平臺是一個開放的、具有挑戰性的化工過程實驗平臺,平臺產生的數據具有時變、非線性和強耦合的特征,能較好地模擬實際復雜工業過程系統的典型特征[16-17]。產物冷凝器、反應器、產物汽提塔、循環壓縮機和汽液分離器是TE 過程的5 個主要操作單元[18],所有反應都伴隨熱量的釋放,因此反應器中額外的熱量由水冷系統進行傳遞。TE 過程的工藝流程圖如圖2。

圖2 TE 過程工藝流程圖Fig.2 TE process flow chart

TE 過程共可收集52 個測量值,包括41 個過程測量變量和11 個過程操縱變量,分為6 種故障類型,共計21 個故障。其中:故障1~7 的主要特征為過程變量的階躍變化;故障8~12 由過程變量的隨機變化引起[19];故障13 由反應動力學的緩慢變化引起;故障14,15 由閥門黏滯導致;故障16~20 的故障類型未知;故障21 由進料通道4 的閥門固定在恒定位置引起[20]。TE 過程的數據集分為訓練集和測試集,訓練集數據用于完成標準化處理等工作,總數為500;每個測試集包含960 個樣本。為驗證文中所提雙重控制策略(DCS)故障檢測方法的監控性能,采用DCS、改進歐氏距離控制(IEDC) 和主成分分析(PCA) T2和SPE 統計量方法用于TE 過程的故障檢測,并進行比較分析。

3.2 仿真結果分析

TE 過程每個測試集包含960 個樣本,所有故障從第161 個樣本引入直至結束,統計量超過閾值會觸發警報。提取TE 過程中具有階躍故障特征的故障4 與隨機變化特征的故障12 進行分析, DCS 方法、IEDC 與PCA 方法對統計量的檢測結果如圖3~4。圖中虛線為閾值線。

圖3 故障4 不同檢測方法統計量的檢測結果Fig.3 Detection results of different detection methods statistics for fault 4

由圖3 可看出:對于故障4,DCS 方法中的Qa可較好地反映內部變量的振動,故障發生時能及時保存故障信息并檢測出故障;與IEDC 方法相比,DCS方法在整個測試樣本中表現較好;與傳統PCA 方法中T2統計量檢測相比,DCS 方法在故障發生或不發生時檢測效果較好;與SPE 統計量檢測結果相比,DCS 方法在故障未發生時檢測優勢更顯著。

由圖4 可看出:對于故障12,DCS 方法在故障產生區間里的檢測效果比PCA 和IEDC 方法統計量略差,主要是因為隨機變化特征導致數據產生波動,對偏差變量的生成產生影響,使其不能完整地收集故障信息;但對于未發生故障的樣本范圍,DCS方法的檢測效果比其他2 種方法更具優勢。

圖4 故障12 不同檢測方法統計量的檢測結果Fig.4 Detection results of different detection methods statistics for fault 12

對于工業過程的故障檢測,檢測指標一般為產品誤報率(false alarm rate,FAR)與故障檢測率(false detection rate,FDR)。產品誤報率指未發生故障時報警的概率,在TE 化工過程為在前160 個采樣數據中統計量超過閾值限的概率;故障檢測率指發生故障時報警的概率,在TE 化工過程表現為采樣數在161~960 中統計量超過閾值限的概率。對TE 化工過程的21 個故障進行檢測,分別計算DCS 方法、IEDC 和PCA 方法的故障檢測率與誤報率,結果如表1??紤]到PCA 方法一般使用T2統計量作為工業過程的檢測統計量,表中將DCS 方法數據故障檢測率和誤報率優于IEDC 方法與PCA 方法的T2統計量檢測的數據標黑加粗處理。

表1 不同檢測方法的故障檢測率與產品誤報率Tab.1 Fault detection rate and false alarm rate of different detection methods

由表1 可看出:對于故障3、故障9、故障15、故障19,DCS 方法檢測時表現不敏感,故障檢測率與產品誤報率的效果均不理想,但與IEDC 和PCA方法相比,DCS 方法能反映過程中更多的變化信息,在故障檢測率與產品誤報率具有優勢。原因在于TE 過程變量的相關性是非線性的,且變量中存在噪聲,非線性偏差變量的均值和標準差不能僅通過累積求和相互抵消,導致故障檢測效果不顯著。對于具有階躍變化特征的故障7,DCS,IEDC,PCA 方法的T2和SPE 統計量的故障檢測率均為100%;產品誤報率分別為0,4.4%,3.1%和16.3%,DCS 方法在面對階躍變化特性的故障時能發掘更多的數據信息,對產品誤報率檢測更敏感。對于黏性變化特征的故障14,DCS 方法、IEDC 方法、PCA 方法的T2和SPE統計量的故障檢測率分別為100%,100%,100%和99.6%;產品誤報率分別為0,3.1%,9.4% 和21.9%,DCS 方法對產品誤報率檢測更敏感。對于具有黏性變化特征的故障, DCS 方法先將信息統計到偏差變量再通過累計求和傳遞給Qa,可減小黏性變化帶來的影響并保存更多的數據信息,達到良好的故障檢測效果。

4 結論

針對工業過程故障檢測效果不佳的問題,提出一種基于雙重控制策略的多變量過程監控方法。從變量本身出發提取偏差變量,對偏差變量進行絕對值處理并通過累積求和將得到的故障信息統計到輔助監控統計量;使用基于反饋調節的參數自適應策略確定輔助監控統計量的閾值。將提出的故障檢測方法用于TE 過程的仿真分析,并與IEDC 和PCA方法的檢測結果進行比較,結果表明所提方法著重統計過程中的多個故障信息,可達到良好的故障檢測效果。但變量存在的噪聲及工業過程存在的延遲會導致產生更復雜的故障檢測問題,下一步研究需考慮這些因素對故障檢測的影響。

猜你喜歡
誤報率偏差閾值
基于GRU-LSTM算法的物聯網數據入侵檢測分析
基于SSA-SVM的網絡入侵檢測研究
家用燃氣報警器誤報原因及降低誤報率的方法
如何走出文章立意偏差的誤區
兩矩形上的全偏差
小波閾值去噪在深小孔鉆削聲發射信號處理中的應用
基于自適應閾值和連通域的隧道裂縫提取
比值遙感蝕變信息提取及閾值確定(插圖)
室內表面平均氡析出率閾值探討
關于均數與偏差
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合