林啟釗,彭志平,郭 棉,崔得龍
(1.廣東石油化工學院計算機與電子信息學院,廣東 茂名 525000;2.廣東工業大學計算機學院,廣東 廣州 510006;3.廣東技術師范大學電子與信息學院,廣東 廣州 510665)
裂解爐是乙烯生產裝置中的核心設備,其主要作用是把石腦油等飽和烴類原料通過裂解、蒸餾等過程轉化為工業所需的乙烯、丙烯等化工產品。隨著裂解的進行,爐管內壁焦層不斷增厚、擴大,爐管的傳熱能力將變差,不僅降低裂解反應的質量,還會造成爐管滲碳、鼓包、開裂直至爐管失效,帶來經濟損失和安全隱患。為保障裂解爐長周期安全高效運行,有必要快速準確感知裂解爐爐管表面溫度及其變化。
多年來,研究人員已經開展了一系列爐管表面溫度測量技術的探索。其中,人工測量法是通過手持式紅外測溫儀在現場檢測爐內溫度,其缺點是只能進行單點的測溫,無法做到連續和在線監測,而且容易漏測,出現問題也不能及時發現。唐磊等[1]建立了一種基于近紅外比色測溫技術的爐管金屬溫度在線監測與分析系統,降低了裂解爐裝置因爐管高溫引起的故障風險。Peng 等[2]提出了一種非接觸式雙驅動測溫方法來測量爐壁和爐管金屬溫度,并通過重管識別、異常數據處理等進一步提升測溫數據的準確性,測溫裝置主要是通過裂解爐的觀火孔來遠程測量爐管表面溫度。
另一方面,20 世紀80 年代,Kumar 等[3-4]已建立了基于7 類裂解原料的石腦油分子反應動力學模型來分析乙烯裂解過程,但是由于該模型高度依賴較多不可直接測量的過程參數,而且計算過程非常復雜、計算量太大,無法直接應用于工業生產。通過對復雜機理進行簡化,對乙烯裂解爐建立一維和二維的裂解、結焦反應動力學模型、爐膛傳熱模型等工藝數學模型[5-8],在能夠大致地模擬出乙烯裂解機理的同時,降低了裂解過程計算時間成本。隨著計算流體力學(Computational Fluid Dynamics,CFD)技術的發展,研究人員開始采用CFD 技術來模擬爐膛內高溫煙氣的湍流、熱輻射和管的熱傳遞,以及爐膛的幾何形狀、尺寸、燃燒器的結構、燃燒器的分布等[9-13]因素對裂解產品的產量和質量的影響。
近年來,研究人員已經嘗試基于神經網絡來探索獲取過程參數的方法。耿志強等[14]提出了一種基于模糊C均值的徑向函數神經網絡模型,并用于分析預測不同技術、不同規模乙烯裝置的生產情況。顧恒昌等[15]提出了一種交叉迭代的長短期記憶神經網絡模型,解決了實際應用中缺少可用的建模所需數據的問題。Chen等[16]利用支持向量機回歸方法建立了爐膛溫度趨勢預測算法和模型,用于爐膛溫度異常檢測。Li 等[17]利用密度峰值聚類算法較好地預測了每個生產環境的乙烯產量。
由于高溫下爐管震蕩和存在觀火口視覺盲區等問題,純物理測量方法所測得的數據容易存在數據缺失和異常問題,導致未能準確測量爐管沿管長所有表面的溫度。神經網絡模型是數據驅動型模型,通過監督學習能很好地求解數據之間的關系,計算出目標信息,但其極度依賴大量的訓練數據,而在高溫復雜的乙烯裂解過程中,神經網絡訓練所依賴的部分重要輸入數據,如反映裂解過程與爐管溫度的主要過程參數,無法通過直接感知的方法獲取。而CFD 技術能以實際操作數據和生產數據通過模擬仿真求解出神經網絡訓練所需要的輸入參數。
據此,本文擬融合乙烯裂解機理和LSTM 網絡來探索裂解爐爐管表面溫度場的重構方法。首先基于計算流體力學仿真平臺構建反映裂解過程與爐管溫度的數學關系的乙烯裂解機理模型,獲取主要過程參數,在此基礎上,設計基于LSTM 網絡的雙向多步爐管溫度預測網絡來預測爐管溫度場,并在所述網絡中引入注意力機制[18]和遺傳算法(GA)[19]來進一步提高網絡訓練的效率和溫度場重構準確率。
如圖1 所示,本文首先基于CFD 仿真平臺、結合實際生產數據和乙烯裂解原理進行模擬計算,獲得反映乙烯裂解過程與爐管溫度場關聯關系的機理模型及主要過程參數,其作為輸入參數對雙向多步預測進行模型訓練,模型的輸出是預測的爐管溫度。在本文設計的神經網絡模型中,引入注意力機制來提高特征提取的有效性,設計群體智能優化算法來提高神經網絡結構及參數的學習效率。最后,利用工業數據對神經網絡的預測結果進行數值矯正,最終獲得爐管溫度場。
圖1 整體算法流程
1.1.1 機理模型計算方法
本文將利用fluent[20]仿真軟件分別建立爐膛燃燒模型、湍流模型、乙烯裂解反應模型對乙烯裂解過程進行模擬。乙烯裂解模型由數百萬個空間網格組成,經過多輪耦合計算,模擬得到最終的機理仿真模型,該過程如圖2 所示。主要過程參數為爐管各部位的爐管金屬溫度、裂解氣溫度、管內壓強以及裂解氣中各物質含量。
圖2 機理模型
通過比較機理模型中裂解氣溫度和爐管溫度,其誤差均符合|dpredictions-dindustrial|<0.035×dindustrial,故該模型大致還原真實生產工況。其中dpredictions為fluent仿真模型的溫度值,dindustrial為乙烯企業測得的工業溫度值。
1.1.2 主要過程參數篩選策略
皮爾遜相關系數(Pearson correlation coefficient)[21]是一種線性相關系數,反映了2 個變量的線性相關程度。通過Pearson 相關系數可排除與爐管溫度分布相關性較弱的參數。相關系數介于-1~1 之間,絕對值越接近1,表明2個變量的線性相關程度越強。由于各特征參數之間存在較大的差異,計算相關性之前需要先對參數進行歸一化處理,Pearson 相關系數rx,y的計算公式為:
其中,x、y為求解相關性的2個變量;d為變量的維度。
1.2.1 算法背景
實際生產過程中,采集設備一般是從裂解爐的觀火口處進行數據采集[22],而觀火口之間的爐管段的數據較難獲取。據此,如圖3(a)所示,將觀火口處易測得數據作為模型輸入參數(黑色部分),較難測量處作為預測目標(白色部分)。U 型爐管沿入口到出口方向,每個觀火口及該觀火口到下一觀火口之間的爐管段作為同一個分段,即圖3(b)中的X(k)和Y(k)為爐管第k分段。
圖3 爐管分段與溫度預測目標示意圖
1.2.2 算法原理
如圖3(b)所示,由于本文所提出的預測模型需要以一定時間序列數據作為輸入參數,故將爐管分段繼續劃分為多個微元段,并在不影響計算結果的情況下,假設溫度、氣壓、物質百分含量等參數在各微元段中均衡分布。
以爐管的第k分段為例,X(k)={Xk,1,Xk,2,…,Xk,n}為模型初始輸入參數,步長為n,Y(k)={Yk,1,Yk,2,…,Yk,N}為原始預測目標,步長為N。
由于需要預測目標步長較長,本文采用一種基于卷積塊注意力模塊(Convolutional Block Attention Module,CBAM)注意力的雙向多步預測模型進行目標預測。首先初始化Y(k),LSTM 以X(k)作為初始輸入參數,將訓練得到的預測值加權到預測目標,得到Yk,1,f,繼續以{Xk,2,Xk,3,…,Yk,1,f}作為輸入參數,同理得到Yk,2,f,繼續重復以上步驟直到得到Yk,N,f,即得到Y(k,f)={Yk,1,f,Yk,2,f,…,Yk,N,f},至此完成正向多步預測。為了解決多步預測導致的誤差迭代問題,再反向建立LSTM 模型,以X(k+1)作為初始輸入參數,將訓練得到的預 測 值加權 到 預測 目 標,得 到Yk,N,b,直 到 得到Yk,1,b,即得到Y(k,b)={Yk,1,b,Yk,2,b,…,Yk,N,b},至此完成反向多步預測。通過融合Y(k,f)和Y(k,b),得到一輪爐管的最新預測溫度{…,X(k),Y(k,new),X(k+1),…}。經過多輪訓練,得到該爐管分段的最終溫度分布預測數據。具體的算法步驟可總結如下:
輸入:X(k)、X(k+1)
輸出:Y(k,new)
1) 初始化Y(k);
2) ep = 0;
3) While ep <epochs do
4)Y(k,f,ep)=Y(k);
5)i= 1;
6) Whilei≤Ndo
7) pref= LSTM({Xk,i,…,Xk,n-1+i});
8)Yk,i,f,ep=wf×Yk,i+(1-wf)×pref;
9)i=i+1;
10) End while
11)Y(k,b,ep)=Y(k);
12)i= 1;
13) Whilei≤N do
14) preb=LSTM({Xk+1,2-i,…,Xk+1,n+1-i});
15)Yk,N+1-i,b,ep=wb×Yk,i+(1-wb)×preb;
16)i=i+1;
17) End while
18)Y(k)=(Y(k,f,ep)+Y(k,b,ep))/2;
19)End while
20)Y(k,new)=Y(k);
21)returnY(k,new)
算法中,epochs為預設定的訓練輪數;下標f表示正向預測過程;下標b 表示反向預測過程;Y(k,f,ep)和Y(k,b,ep)分別用于保存正向和反向在本輪訓練的更新值。
裂解爐在不同的生產時刻,其內部結焦狀態是不一樣的,即不同時刻的爐管狀態是有所不同,又由于爐管在裂解爐中存在一定的排布規則,使得同一時刻不同爐管的狀態也是存在差異的。為了更好地關注輸入參數中的重要信息,從中提取特征,將注意力機制融入到網絡模型當中。
CBAM[23]是一種通用的輕量級模塊。如圖4 所示,輸入參數經過CBAM 中的通道注意力模塊(Channel Attention Module,CAM),先對輸入特征進行信息壓縮,分別通過全局最大池化和全局平均池化得到2 個特征圖,將特征圖分別送入MLP 中得到2 個新的特征,再經過求和和Sigmoid 激活操作得到特征Mc,過程可表示為:
圖4 卷積塊注意力算法流程圖
其中,σ表示Sigmoid函數;MLP表示多層感知機;F表示輸入特征。
Mc和輸入特征F相乘的結果作為空間注意力模塊(Spatial Attention Module,SAM)的輸入特征F'。F'分別通過全局最大池化和全局平均池化得到2 個特征圖,特征以通道進行拼接后,經7×7卷積后,通過Sigmoid 函數激活得到特征Ms,Ms和F'相乘即可得到最終需要的特征信息。過程可表示為:
其中,f7×7表示卷積核為7×7的卷積層。
模型結構對溫度預測的計算效率和準確率具有重要的影響。模型的網絡層數和網絡層神經元數屬于組合問題,啟發式算法[24]可針對待解決的組合優化問題給出每一個實例的可行解。
本文設計一種改進的遺傳算法進行網絡結構優化。由于LSTM 網絡在層數超過3 時,模型準確率會明顯下降,故限定模型網絡層數均不大于3 層。種群中每一個染色體對應一個LSTM模型,可表示為:
其中,llstm表示LSTM 層數;lfc表示全連接層數表示LSTM 各層神經元個數表示全連接層各層神經元個數。
在雙向多步預測模型中,需要針對每一個預測目標建立對應的LSTM 模型,即種群染色體數為2N,在搜索空間解的優化目標函數為:
其中,k為爐管分段序號;i為測試目標序號;Yk,i為原始預測目標;dpredictions為目標預測值。
取目標函數的倒數作為適應度,可表示為:
種群的選擇選用“輪盤賭”算法,以個體適應度占總體適應度的比例作為該染色體被選中的概率。同時,為了盡可能保留較優染色體,淘汰較差染色體,在選擇操作過程,利用Sigmoid 函數擴大優劣染色體適應度之間的差距,即染色體被選中的概率表示為:
其中,σ表示Sigmoid 函數;φ表示規范化;κs表示規范化的區間范圍。
同樣地,利用tanh函數擴大個體間的染色體交叉和基因變異概率的差距,其過程如下:
其中,下標c和m分別表示交叉操作和基因突變操作;rbase表示預設定的變異率;τ為tanh 函數;φ表示規范化;κ表示規范化的區間范圍。
網絡模型經過特征學習后,所輸出的預測結果是歸一化后的爐管溫度數值,與實際工業生產數據存在平移映射關系,即模型的溫度預測結果還需要通過加上相關性偏差數值進行矯正來獲取實際的爐管溫度預測值。相關性偏差可表示為:
其中,dindustrial為工業生產數據;dsimulation為機理模型的主要過程參數。
本文使用的工業數據來源于某石化公司編號為H-114 和H-115 的裂解爐[25],在裂解爐清焦周期內對裂解爐進行定期數據采集。為了防止模型過擬合,工業數據中90%用于模型的訓練和驗證,10%用于模型的測試,采用K-fold交叉驗證法對訓練和驗證數據進行處理,其中K取值為9。
本文以經過矯正的預測數據和實際工業數據的均方根誤差(Root Mean Square Error,RMSE)作為模型評估方法,可表示為:
對機理模型參數計算Pearson 相關系數,結果如表1所示。
表1 機理模型的Pearson相關系數
分別取r值大于0.8 的2 類參數、大于0.6 的5 類參數、大于0.5的9類參數、大于0.4的13類參數,大于0.3 的15 類參數,經特征提取后,將特征輸入到雙向多步預測模型,預測結果如表2 所示。當r取值大于0.5 時,模型的預測結果較好,故選用該9 類參數作為網絡輸入參數。
表2 不同輸入參數的預測結果
雙 向 多 步 預 測 模 型 以DNN[26]、BPNN[27]、RNN[28]、LSTM[29]等4 種神經網絡作為基礎網絡進行實驗對比。結果如表3 所示,LSTM 比其他網絡的誤差值更低,故選用LSTM作為基礎網絡。
表3 不同基礎網絡的預測結果
輸入參數經CBAM 進行特征提取,再輸入到不同結構的模型當中,預測結果如表4 所示。通過對比,不同結構的網絡模型在加入注意力機制后,其誤差均有降低,其對模型的預測能力有一定的提高作用。
表4 基于注意力機制的預測結果
傳統GA 在概率搜索區域進行隨機搜索時,可能會停留在局部最優解,不能很好保證求解出全局最優解,由于選擇、交叉、突變等更新操作概率相對固定,其時間復雜度較高。而本文所設計的改進GA,將個體之間的適應度差距進一步擴大,盡可能讓優勢染色體存留下來,排除掉劣勢染色體。同時染色體間發生交叉和染色體發生基因突變的概率也根據其適應性而改變,適應性更高者,其變異概率則更小,反之亦然。種群染色體的平均適應度如圖5 所示,傳統GA 的種群平均適應度總體上在[189,208]區間范圍內波動,而改進GA 后,種群平均適應度有逐漸上升趨勢,經過強化優勝劣汰機制,整體的適應度有明顯的提高。
圖5 傳統GA與改進GA的平均適應度對比結果
使用改進GA 對雙向多步預測模型進行結構優化,經種群更新迭代100 次后得到本文所設計模型GA-BMLSTM,對比文獻[15]所提出的CIBLSTM 模型,預測結果如表5 所示。從結果上觀察,本文所設計模型GA-BMLSTM 的性能遠優于CIBLSTM。
表5 模型預測結果對比
圖6 為GA-BMLSTM 和CIBLSTM 對爐管分段的平均表面溫度預測結果。由于CIBLSTM 模型對數據的連續性要求較高,而預測目標的序列步長往往為幾十步,本文提出的預測模型GA-BMLSTM 在多步預測問題上做了針對性的設計,對爐管表面溫度有較好的預測能力。
圖6 GA-BMLSTM 和CIBLSTM的爐管分段平均溫度預測圖
為了保障裂解爐長周期安全高效運行,有必要對爐管表面溫度場進行有效監控。據此本文對爐管溫度預測模型進行了消融研究,融合基于計算流體力學的機理模型和基于LSTM 的雙向多步預測模型對爐管表面溫度場進行預測,并利用改進的遺傳算法對網絡模型進行結構性優化。從實驗結果觀察,該模型對爐管溫度的預測結果有較高的準確性。本文提出的爐管溫度場重構方法為裂解爐乙烯裂解的安全生產檢測提供了新思路,進一步驗證了人工智能在化工領域實踐的可行性。