?

基于深度殘差網絡的接轉站工藝流程異常工況診斷

2024-01-06 03:08張蕊侯磊劉珈銓孫省身張坤杜鑫李興濤
石油科學通報 2023年6期
關鍵詞:殘差卷積準確率

張蕊 ,侯磊,劉珈銓,孫省身,張坤,杜鑫,李興濤

1 中國石油大學(北京)機械與儲運工程學院,北京 102249

2 中國石油長慶油田分公司長慶工程設計有限公司,西安 710021

3 中國石油長慶油田分公司第十二采油廠,合水 745000

4 中國石油國際勘探開發有限公司,北京 102249

0 引言

接轉站作為油氣田地面集輸系統的關鍵節點,既有設備集中、運行連續性強的生產特點[1],還容易出現來流比例劇烈波動和設備運行故障等工況異常[2]。目前油田生產現場對接轉站場的工況診斷主要依靠操作員工經驗。對于簡單設備的異常數據,操作員工尚能進行初步診斷,但對整個站場的大量SCADA實時監測數據,僅靠經驗和知識難以實現快速分析處理[3]。閾值報警系統本應及時準確地反饋異常信號[4],但實際應用中其對多模態過程適應性差,“假報警”“不報警”問題突出,亟待發展適用于接轉站場的智能診斷方法。

油氣處理工藝流程的診斷方法包括基于知識的方法、基于模型的方法及數據驅動方法[5]。目前站場應用較多的是基于知識的方法。趙自愿[6]利用模糊故障樹分析法對原油集輸系統關鍵設備進行異常分析,用CAFTA軟件對現場集輸流程進行仿真,求取關鍵設備在一定工作時間內的可靠度。方一宇[7]采用QRA法對接轉站中的壓力容器進行風險評價,對接轉站系統的危害因素進行有效識別,量化了接轉站系統風險等級。

上述基于知識的方法雖能用于對油氣站場的異常模式及危害度進行定量分析,但難以在系統輸入與輸出之間建立精確數學模型。數據驅動方法只需建立具有分類功能的數學模型[8],就能直接對SCADA數據進行處理,以實現站場狀態的實時診斷與評估。

在數據驅動方法中,異常工況診斷被視為時間序列數據的分類[9],具體包括統計分析方法、淺層學習方法和深度學習方法。統計分析方法、淺層學習方法均需要豐富的專業領域知識來確定時頻域特征[10],在復雜學習任務中的信息表征能力存在局限性[11],不適用于具有非高斯分布、非線性特性的儲運站場過程數據。深度學習方法是一種用多個隱含層對特征數據進行逐層非線性轉換從而實現數據特征抽象提取的算法[12],適于處理高維海量數據,能夠自動提取非線性數據特征,通過組合足夠多的變化,理論上可以無限逼近任意復雜函數。

Zhao[13]利用基于批歸一化(BN)的長短時記憶神經網絡(LSTM),自適應學習原始數據的時間動態信息。Xie[14]利用階層深度神經網絡(HDNN)對田納西-伊斯曼過程(TE過程)進行故障診斷。Chao等[15]利用改進的貝葉斯優化和DRN的異常診斷模型,對變電站的熱異常進行診斷。Jiang[16]將堆棧式稀疏自編碼器(SSAE)用于故障診斷,實現了半監督學習策略。

從網絡架構角度而言,針對其他分類任務設計的高深度模型[13-16]直接應用于接轉站場數據時,易出現在訓練集表現良好但驗證集精度降低的過擬合現象。從數據特性角度而言,接轉站場收集數據相比公開時間序列數據集,樣本量小且維度高,模型存在學習不足,難以訓練風險。從訓練成本角度而言,高深度且多核的模型在學習過程中耗時長,硬件要求高,訓練難度加劇。

深度殘差網絡(DRN)[17]于2015年被首次提出,是一種先進的深度學習模型,它在卷積神經網絡(CNN)結構中加入恒等映射快捷連接,解決了深層網絡梯度彌散和精度下降的問題,緩解了訓練困難,使網絡在加深過程中既保證精度,又控制速度[18]。

本文以某油田接轉站流程為例,將多元時間序列數據(MTS)分類方法[19]融入異常診斷體系中,提出一種基于DRN的接轉站異常工況診斷方法,能夠自動提取異常特征,實現高精度異常診斷,通過油田生產現場SCADA數據對該方法進行有效性驗證。

1 基于DRN 的異常工況診斷方法

1.1 卷積層

卷積層的主要作用是從輸入數據中提取特征,對一個有M個特征映射的作為輸入的卷積層,當有N個過濾器時,按下式計算第K層的輸出特征[20]:

如圖1 所示,卷積層的局部感知能夠提取監測變量的局部特征,接轉站過程數據中不同時間點,不同變量間的相同變化特性能夠被卷積的權值共享模式捕獲[21]。

圖1 卷積核示意圖Fig. 1 diagram of convolution kernel

1.2 激活層

激活層通過對加權輸入進行非線性組合以產生非線性決策邊界,非線性變換能夠使網絡存儲信息量大大增加[20]。如圖2 所示,常見激活函數包括邏輯函數(Sigmoid)、雙曲正切函數(tanh)、線性校正單元(ReLU)等。

圖2 激活函數示意圖Fig. 2 Schematic diagram of activation function

Sigmoid型函數定義見下式,它是兩端飽和的S型曲線函數。

Sigmoid型激活函數的優點是神經元輸出可以直接看作概率分布,神經網絡可以更好地和統計學習模型相結合,并且它將不同尺度的特征擠壓到一個受限空間[20],適應于特征相差較復雜的場景,本文采用Sigmoid作為激活函數。

1.3 殘差連接

殘差連接是DRN的核心部分。殘差結構如圖3 所示,DRN在卷積神經網絡(CNN)的基礎上通過卷積層之間的殘差連接實現多層網絡的直接輸出,避免了卷積神經網絡的梯度消失問題。

圖3 殘差結構示意圖Fig. 3 Diagram of residual structure

假設多個殘差塊堆疊,則從第i個殘差塊到第j個殘差塊的信息向前傳遞如下式[17]:

在誤差反向傳播過程中,網絡優化的梯度見下式[18]:

式中,L為損失函數,項保證了底層網絡都能接收到這個梯度,緩解訓練困難問題。

1.4 全局平均池化層

GAP層(Global Average Pooling)對最后一層卷積的特征圖進行平均池化操作。如圖4,當有K個特征圖時,池化結果為K個1×1 的特征圖,這些特征圖直接輸入Softmax層后產生K個類別的置信度,起到取代傳統全連接層的效果[22]。

圖4 GAP示意圖Fig. 4 Schematic diagram of GAP

全局平均池化層能夠簡化模型訓練參數,避免傳統全連接層過擬合風險,提高模型泛化能力。

1.5 批量歸一化層

批量歸一化(BN)層對模型上一層進行歸一化操作,通過特征映射將輸出數據轉化為具有相同尺度的標準正態分布,保證樣本特征在同一量綱范圍,緩解模型內部協方差偏移問題[20],可表示為

式中,第l層的經過BN操作后的輸入為BN(z(l)),a(l)為神經元的輸出,f()為激活函數。BN(z(l))為凈輸入z(l)的標準正態分布。

2 接轉站工藝流程數據集

2.1 接轉站工藝流程

某油田轉接站位于甘肅區塊,于2015年建成投運,設計年處理原油20×104t。主要功能包括原油加熱、油氣分離、原油脫水、凈化油外輸、污水處理及回注等。接轉站接收上游5 個輸油點來流,來流通過加熱爐加熱后分別進入溢流沉降罐和三相分離器進行分離。分離油經加壓、加熱達到外輸壓力溫度要求,過濾計量后輸往下站。沉降罐和三相分離器的分離水輸往水處理模塊。各設備分離出的氣體與井場采出氣經過氣液分離后作為燃料輸往加熱爐,剩余氣體通過火炬燃燒。

2.2 數據集

由接轉站自動化監控終端采集原始參數,調取2020年7月至10月的2001 組數據,整套流程共采集到36 個參數,采集間隔1 h。去除采集異常后形成有5 種工況的36×1800 組數據。所有工況如表1 所示。

表1 接轉站流程工況列表Table 1 List of operation conditions for block process

接轉站流程的36 個監測變量如表2 所示。

表2 接轉站流程監測參數Table 2 Block station process monitoring parameters

3 基于DRN 的接轉站工藝流程異常工況診斷

基于深度殘差網絡的接轉站流程異常工況診斷流程如圖5 所示,具體步驟如下:

圖5 接轉站異常工況診斷流程Fig. 5 Abnormal operation condition diagnosis process of block station

(1) 數據降噪:對原始數據進行逐維離散小波降噪。

(2) 入模前處理:重采樣擴容數據集形成時間序列樣本,通過正則化手段均衡數據分布,劃分訓練集和驗證集。

(3) 入模診斷:建立基于DRN的接轉站流程診斷模型,根據診斷評價指標進行模型優化,得出最優模型。

3.1 數據降噪

由于現場信號采集器性能不穩定或工況波動,SCADA數據往往存在強噪聲。數據噪聲會掩蓋監測變量的真實波動,降低模型對少數類樣本的識別能力,模型存在同時學習噪聲和少數類的風險[23]。由此,需要對數據進行降噪處理,減弱采集干擾,增強模型診斷性能。

常用去噪方法有高斯濾波、中值濾波、傅里葉變換等,但它們不能區分有效信號的高頻部分和噪聲引起的高頻干擾。小波變換的時頻局部化特性能夠保留信號尖峰和信號突變,將高頻信息和高頻噪聲區分開來并抑制高頻噪聲的干擾[24],適于轉油流程的數據降噪。

小波變換的時頻局部化特性可以線性表示如下式[25]:

Wx表示含噪混合信號,Wf代表純凈信號,We表示噪聲信號。

采用一維小波離散去噪(DTW1),得到細節分量(高頻)與近似分量(低頻),對細節分量進行閾值處理,用處理后的各分量進行小波重構,得到去噪后的信號。降噪處理前后數據變化如圖6 所示。

圖6 降噪處理前后數據Fig. 6 Data before and after noise reduction

圖7 表示同一網絡架構下數據降噪對診斷準確率和模型損失的影響。未降噪數據在訓練時,隨著疊代次數增加,噪聲特征被模型學習并不斷擴大,模型準確率出現劇烈擾動,并出現過擬合現象。數據降噪后模型準確率提升2.1%,損失下降0.03,過擬合得到糾正,穩定性大幅提升。

圖7 降噪對模型準確率、損失的影響Fig. 7 Influence of noise reduction on model accuracy and loss

3.2 重采樣與正則化

接轉站工藝流程的數據采集間隔為1 小時,設定1 個樣本包含10 個數據點,共形成180 個樣本。但樣本量少易導致模型訓練不足,由此本研究采用樸素重采樣方法,樸素重采樣以一定的采樣間隔在時間序列上移動,讀取數據形成多個樣本。采樣間隔越小則樣本相似度越高,模型越容易出現過擬合現象;采樣間隔越大則樣本擴容幅度越小,對模型訓練能力提升有限。經實驗確定最佳采樣間隔為3 個時間點,最終形成大小為10×36 的630 個樣本,如圖8 所示。

圖8 樸素重采樣原理Fig. 8 The principle of naive resampling

L2 正則化通過對大數值的權重向量進行懲罰,使模型傾向于使用所有輸入特征,而不是依賴輸入特征中的小部分特征[20]。L2 正則化可表示為:

其中L()為損失函數,N為訓練樣本數量,f( )為待學習的神經網絡,θ為參數,e2為L2范數函數,λ為正則化系數。

如圖9 所示,對轉油流程數據集,36 維數據單位、幅值均不一致,L2 正則化通過權重懲罰,能夠有效均衡數據分布,避免模型對個別維度的依賴,增強模型特征利用率,提高模型泛化能力,降低過擬合風險。

圖9 正則化對模型準確率的影響Fig. 9 Influence of regularization on model accuracy

重采樣與正則化后以7:3 的比例將數據集劃分為訓練集和驗證集,訓練集用于模型學習,驗證集用于驗證模型診斷性能。訓練集、驗證集樣本數分別為441、189。

3.3 DRN診斷模型

為探索適宜接轉站流程特點的診斷模型,設計8種DRN模型架構,見表3,調整參數包括卷積層層數、卷積核數量、激活函數類型、分類層類型,以訓練集數據對模型進行訓練。

表3 DRN診斷模型Table 3 DRN diagnosed model

以模型4 為例進行說明。1 個樣本矩陣的輸入大小為10×36,其中“10”代表樣本時間長度,即系統運行10 h進行1 次診斷;“36”表示過程變量的數量,對應為轉油流程的36 個監測變量。模型4 的網絡架構為2 個殘差塊,1 個全局平均池化層和1 個全連接層,每個殘差塊包含3 個卷積層,3 個標準化層和1 個殘差連接結構。殘差塊中的卷積層卷積核大小分別為8×8,3×3,3×3,步幅設為1;第1 個殘差塊中的卷積層包含6 個過濾器,第2 個包含12 個過濾器。通過全局平均池化層輸出大小為1×12 的樣本,使用“Softmax”的全連接層將輸出轉化為1×5向量。

Softmax函數即歸一化指數函數,能將任意K維向量Z轉換為0 至1 范圍內的實數,K維向量σ(Z)總和為1[21],Softmax函數定義見下式。

Softmax函數使模型輸出一個長度為5 的向量,其每個值代表對應類別的可能性,其中可能性最高的值即為診斷結果。

3.4 診斷結果分析

完成DRN模型構建后,在以下開發環境中實現診斷過程:Windows10 操作系統,軟件平臺Python 3.6。硬件開發環境為:PC機一臺,Intel(R)Core(TM)I7-6700HQ-CPU- 2.60GHz,8G的DDR3 內存、英偉達NVIDIA-GeForce-GTX-960M顯卡。

用準確率(ACC)、精確率(PRE)和敏感性(TPR)3個指標來評價模型診斷性能。表4 為定義的總體工況混淆矩陣。

表4 工況的混淆矩陣Table 4 Confusion matrix of working conditions

準確率(ACC)評估模型的全局準確程度;精確率(PPV)表示模型對異常數據識別的準確程度;敏感性(TPR)表示模型對異常數據的敏感程度,敏感性越高,漏診概率越低。ACC、PPV和TPR可定義為:

每次診斷導入一個樣本矩陣,每個樣本矩陣包含從時刻t-1 到時刻t的36 個變量的時間序列數據,以診斷t時刻的轉油流程的運行狀態。

表5 中列出了表4 中各模型的驗證集總準確率、敏感性和精確率。模型4 具有最高的驗證集總準確率和敏感性,為最佳模型。模型4 的完整網絡參數如表6 所示,網絡結構如圖10 所示。

表5 測試集診斷結果Table 5 Diagnostic result on testing set

表6 模型4 完整架構參數(輸入大小為一個樣本矩陣)Table 6 Model 4 complete architecture parameters (input size is a sample matrix)

圖10 模型4 結構示意圖Fig. 10 Model 4 structure diagram

圖11 為模型4 訓練和驗證階段的準確率曲線及損失曲線。在441 個訓練樣本矩陣中,訓練數據集的準確率為97.50%,模型損失為0.113。對于包含189 個樣本矩陣的驗證數據集,模型準確率為97.35%,模型損失為0.139。

圖11 模型損失和準確率圖Fig. 11 Model loss and accuracy diagrams

所有5 類工況的診斷結果混淆矩陣如圖12 所示。5 類工況分別取得了99.2%、100%、85.7%、100%、92.3%的精確率。其中,第3 類工況的診斷精度最低,在14 個測試樣本中2 個樣本被劃分為第1 類工況;第5 類工況的13 個測試樣本中1 個樣本被劃分為第1 類工況。

圖12 驗證集診斷結果混淆矩陣圖Fig. 12 confusion matrix of test diagnostic result

3.5 工況相關性分析

多元互信息值可以反映兩個矩陣之間共享信息量的大小,定義如下[26]:

其中,Y是有k個可能值的多項式隨機變量,P(y)是它對應值的概率分布,X是一個多元隨機變量。在Y=y條件下,X遵循參數為μy和∑c的多元正態密度分布。

為量化接轉站各工況間的相關性大小[27],計算工況間的多元互信息值,如圖13 所示。工況1 與工況3及工況5 的相關程度最低,證明其在網絡診斷過程中最易發生誤診。工況2 與其他工況間的相關程度最高,證明其在網絡診斷過程中最易于識別,這驗證了上述DRN的診斷結果。同時,模型對樣本量最少的工況2達到了100%的準確率,證明本模型有效避免了各類樣本的不均衡性限制。

圖13 各工況間的多元互信息值Fig. 13 Mutual information values among different conditions of samples

3.6 與其他模型的對比

為驗證所提出模型在接轉站的應用優勢,分別采用支持向量機(SVC)、卷積神經網絡(CNN)、全卷積神經網絡FCN)、多層感知機(MLP)與殘差神經網絡(DRN)進行比較。最終診斷結果為各模型參數調整后的最優結果,診斷結果見表7。

表7 機器學習算法診斷結果對比Table 7 Comparison of diagnostic results of machine learning algorithms

與淺層模型SVC及MLP相比,所提出的DRN模型的總精確率有顯著提升,表明模型能夠有效學習小樣本工況的特征;與深度模型CNN及FCN相比,所提出的DRN模型在測試集中未出現過擬合現象,表明模型泛化能力較強。

4 結論

(1)針對接轉站數據噪聲強、干擾大、數據量小的問題,采用小波方法進行降噪,根據重采樣方法進行樣本擴容,通過正則化手段均衡各維數據分布,有效提升了模型準確率和泛化能力。

(2)提出8 種不同的DRN架構,以測試集ACC、PRE與TPR作為評價指標,確定適用于接轉站流程的最佳DRN診斷模型,實現對異常工況97.35%的診斷精度,證明了診斷模型的準確性。

(3)通過基于多元互信息值的相關性分析方法,量化5 類樣本間的相關程度,表明互信息值的大小能夠反映診斷難易程度,證明了診斷結果的可靠性。

(4)與經典機器學習模型SVC、CNN、FCN及MLP對比,DRN模型精確率分別提升4%、17%、10%、32%,表明模型能夠對小樣本工況的特征進行有效學習,診斷模型的泛化性顯著提升,該方法對其他油氣站場的異常診斷具有一定意義。

猜你喜歡
殘差卷積準確率
基于雙向GRU與殘差擬合的車輛跟馳建模
基于3D-Winograd的快速卷積算法設計及FPGA實現
乳腺超聲檢查診斷乳腺腫瘤的特異度及準確率分析
不同序列磁共振成像診斷脊柱損傷的臨床準確率比較探討
2015—2017 年寧夏各天氣預報參考產品質量檢驗分析
基于殘差學習的自適應無人機目標跟蹤算法
基于遞歸殘差網絡的圖像超分辨率重建
從濾波器理解卷積
高速公路車牌識別標識站準確率驗證法
基于傅里葉域卷積表示的目標跟蹤算法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合