一種基于數字孿生云平臺的煉鐵過程智能優化服務

2021-03-17 02:54周恒楊春節孫優賢

工程 2021年9期

周恒, 楊春節*, 孫優賢

The S tate Key Laboratory of Industrial Control Technology&College of Control S cience and Engineering, Zhejiang University, Hangzhou 310027, China

1.引言

煉鐵的制造工藝復雜，它能不斷地為其他行業提供基礎材料。煉鐵行業在原材料市場和能源市場都占據重要地位，其能源消費量占全球能源消費總量的10%以上。中國現今成為世界上最重要的鋼鐵供應國，生產的鋼鐵占全球總產量的一半。因此通過技術創新實現該行業的節能減排至關重要[1]。

用于解決基于制鐵機制的轉換理論和反應規則復雜性的傳統方法，在高爐的建模和優化方面存在不足[2-3]。因此，研究人員仔細調查了煉鐵過程中的各種智能建模方法。為了突出黑箱建模的優點，Chen 和Gao[4]提出了一種新的算法來提升高爐軟邊緣支撐向量機的透明度。Zhou 等[5]提出了一種基于遞歸學習的雙線性子空間識別算法，對具有非線性的隨時間變化的高爐進行建模和控制。此外，Li 等[6]利用模糊分類器，通過預測金屬硅含量的發展趨勢，判斷產品質量和熱狀態。為了獲得氣體的流量分布和優化充電操作，Huang等[7]設計了一種基于高溫工業內窺鏡的三維（3D）形貌測量方法來檢測高爐的爐料面。Li 等[8]隨后提出了一種智能的數據驅動優化方案來確定高爐爐料面合適的分布位置。雖然這些方法都在一定程度上改善了高爐的運行，但整個煉鐵過程都需要一個結合了各種服務的云計算框架。

云計算為客戶提供計算機系統的按需服務、計算能力和數據存儲服務，而客戶不需要實際擁有相關對象[9]。大容量存儲設備、低成本計算機和高容量網絡的有效性促進了云計算的發展，而硬件資源虛擬化、自主公用計算和服務導向式架構的廣泛發展也為云服務的增長做出了貢獻[10]。事實上，許多公司已經在云平臺上部署業務，這讓云服務滲透到我們工作和生活的方方面面。例如，Yelp廣告團隊依賴預測模型來分析客戶與廣告互動的可能性。他們利用亞馬遜彈性MapReduce上的Apache Spack（一個統一的分布式內存計算引擎）處理大數據和訓練機器學習模型，這使得Yelp 的收入和廣告點擊率有所增加[11]。過去，12306（中國鐵路客戶服務中心）網站預訂系統總是在特定時間數據訪問量激增時崩潰。在春節期間，阿里云通過云計算處理余票的查詢訪問，有效地解決了這一瓶頸問題[12]。

隨著高集成和大規模制造工業的快速發展，傳統的方法在煉鐵過程中在建模和優化方面十分受限。由于在操作中很難將相互沖突的目標聯合起來，所以一個好的指示器總是會削弱另一個指示器的效果。為了同時優化幾個目標，我們使用遺傳算法（GA）中的加權方法將多目標問題轉化為單目標問題。此外，我們在GA中引入自適應算法，以提高其搜索性能。在將GA 應用于實際問題之前，我們有必要通過建模的方法來學習算法的物理特征。為了滿足對高精度和其他實時性要求，我們簡化了遞歸神經網絡的結構，將更新和重置門壓縮為單門來模擬煉鐵過程。因此，我們設計了一個基于分布式計算的云煉鐵廠的多目標優化框架，如圖1 所示。有了云上工廠的這個服務例子，與煉鐵工廠合作的學者和研究人員可以在世界任何地方為這個工廠工作。綜上所述，本文的主要貢獻可以簡要總結如下：

圖1.云上煉鐵高爐結構示意圖。

（1）結合改進的GA與遞歸神經網絡，以優化煉鐵過程中的多目標問題。

（2）基于Rancher和Harbor框架構建了數字孿生的云計算平臺。

（3）將混合多目標模型作為一種優化服務部署到云計算平臺上。

2.方法論

煉鐵廠在制造過程中通過可編程邏輯控制器、工業傳感器和局部指示器產生大量數據[13]。中國有數百家煉鐵廠和數千座高爐，這些工廠的數據量和計算需求遠遠超出了工廠的負擔能力。如果一個高爐每分鐘有數千個測量點可以采樣，它每天的總數據量可以高達1 TB。然而，這些工業大數據沒有得到充分的利用，反而給煉鐵廠造成負擔。盡管云服務和煉鐵工藝都各自取得了重大進展，但很少有學術研究或工業應用試圖將這兩者結合起來。因此，我們設計了一個基于分布式系統的云上工廠（圖2），充分利用這些工業大數據挖掘隱藏的信息。首先，暫時將過程數據存儲在煉鐵廠數據中心的本地服務器中。經過一些必要的預處理和重新格式化后，干凈的數據將直接傳輸到關系數據庫中。由于工廠的工業數據都備份在云數據庫中，所以不需要擴展其存儲設備容納不斷增加的數據量。然后，如果我們想修改算法或從云存儲中訓練數據集，可以從本地服務器或云數據庫中提取樣本。

云煉鐵高爐由存儲層、框架層和服務層組成。存儲層通過云關系數據庫對來自制造系統的數據流進行備份。計算框架層位于存儲層和服務層之間，包含一個基于深度學習和進化算法的混合模型。此外，該計算集群是Apache Spark 的一個實例，與本地云服務提供商的虛擬機相互關聯。有了計算框架和存儲容量的支持，云上工廠能夠為高爐煉鐵過程提供多目標優化服務。最后，我們使用Apache Spark在虛擬機上部署多目標優化框架，為云上工廠提供云計算服務。工廠和學術界都可以從云煉鐵廠中獲益：煉鐵廠不需要存儲所有的生產數據，而學術研究人員可以在其他地方研究實際數據。通過使用Apache Spark和云計算，我們成功地將聚類、建模和優化模型的多目標優化服務應用到高爐煉鐵過程中。

圖2.云上工廠與實際工廠交互系統流程圖。

混合模型的集成將聚類、建模和優化過程結合成一個不可分割的整體。在聚類分析預處理的基礎上，我們采用建模方法獲得了高爐煉鐵過程的動態信息。然后，優化方法在臨界約束條件下可以尋找生產指標的實時最優解。因此，該優化問題的目標函數如下：

式中，w為權重矩陣；?和g為激活函數；dt為處置門；T為生成；F(x)是加權后的綜合適應度函數；f(x)是單個優化目標的適應度函數；x是輸入變量；h為神經元隱含狀態。

聚類簇將對象的集合分為幾個組，其中屬于同一聚類簇的對象彼此之間比與其他聚類簇中的對象更相似[14-15]。它既是探索性數據挖掘的主要任務，也是用于機器學習統計分析的一般方法。一開始，我們利用高斯混合模型（GMM）將數據分到不同的聚類簇中，并選擇理想的數據集實現知識發現。高斯混合模型是一個基于分布的模型，它適用于包含一定數量的高斯函數的數據集[16-17]。高斯混合模型的概率密度函數列于如下公式中。

式中，k表示第k個聚類簇；μ為平均值；Σ為方差；p是概率密度函數；N是樣本個數；π為混合權重，π的和為1。

當對煉鐵過程的原始數據進行高斯混合模型聚類預處理時，有必要用智能方法重建煉鐵過程。在各種深度學習方法中，遞歸神經網絡（RNN）在學習時間序列數據的物理特征方面表現出色[18-19]。然而，傳統的門控遞歸單元神經網絡（GRU-RNN）的結構有些復雜，不能滿足煉鐵工藝行業的高實時性要求[20]。因此，為煉鐵過程提出一個新的遞歸神經網絡，它將GRU-RNN的更新和重置門簡化為一個單一的處置門[21]。處置門控循環單元（dGRU）的數學定義如公式（3）所示，以及圖3 為內部體系結構的可視化圖。

式中，激活狀態ht是待激活狀態和已激活狀態ht?1之間的線性插值。U和W是輸入變量和激活閾值的權重。Wd和Ud分別是重置門激活函數的權重和閾值。dt在歷史記憶ht?1和候選信息xt之間做出了妥協。在dGRU 中進出單元的信息僅由一個門進行操作，從而提高了計算效率。dGRU 的反向傳播將誤差在時間和空間上進行反轉，以更新其參數。因此，時間t?1時的反向傳播誤差如公式（4）所示：

圖3.dGRU的內部結構。

式中，E為輸出估計值；net 為dGRU 網絡；δ為輸出誤差；l代表步長；d為重置門；代表候選狀態。內部誤差δd,t和δh,t可以轉換為公式（5）中的表達式。

因此，用于更新dt和ht中的權值和閾值的梯度的原型如公式（6）所示。有了這種學習模式，dGRU 能夠在迭代過程中優化其內部結構。

式中，ΔWd和ΔW是dt和候選激活狀態中輸入變量的權重；ΔUd和ΔU是dt和候選激活狀態中激活閾值的權重。

在進化算法中，GA是解決組合優化問題的全局優化方法[22]。GA 的主要組成部分是編碼/解碼類型、適應性函數、遺傳算子和控制參數。更具體地說，GA可以執行以下任務：

?編碼優化問題的解決方案；

?創建在第t代中包含N(t)編碼解決方案的總群；

?建立能評估解決方案最優解的適應性函數；

?利用遺產算子創建新的后代種群；

?設置控制參數。

近年來，對GA的研究大多集中在概率分布、遺傳算子和染色體編碼上[23-24]。盡管種群規模在很大程度上影響了計算效率，卻很少受到關注。一般來說，種群規模與求解精度成正比，與計算效率成反比。為了解決這個問題，Koumousis 和Katsaras [25]提出了一種鋸齒狀的GA，它能周期性地增加和減少種群規模。為了同時保持準確性和效率，我們設計了一種自適應種群遺傳算法（SAP‐GA），該算法的種群規模能隨著適應性函數解的變化而變化[26]。每一代種群的理想適應性分布都應該是正態分布，但由于遺傳算子的隨機性，這往往難以實現。實際分布到正態分布的偏差程度被定義為偏度（Sk），如公式（7）所示。

式中，fe為中位數；fˉ為平均值；σ為標準差。偏態分布與種群規模之間的關系如圖（4）所示，可用公式（8）解釋。

圖4.適應性偏度與種群規模的對應關系。N(t)+和N(t)?代表在進化過程中種群的增減過程。

式中，Sk是適應性偏度；N是種群規模；k是種群規模轉換區間的整數。至于SAPGA，Sk的上升趨勢代表了較優解決方案的增加，導致需要增加新的候選方案以增加基因多樣性。Sk的下降趨勢表明存在大量較差的解決方案，為了保持SAPGA良好的搜索性能，需要將其排除。綜上所述，當適應性分布的偏度從負轉向正時，表明較優解決方案的比例在增加，或者較差個體在減少，候選方案的適應性需要調整回正態分布。

為了比較SAPGA 和標準遺傳算法（SGA）的性能，我們根據模式理論對表1中符號的解的適應度進行了理論分析。

表1 文中的符號列表

在進化過程的后期，平均適應度的增加導致種群規模的減少。T是SAPGA的種群變得小于SGA的種群的世代。因此，我們做出如下定義的引理。

Lemma:N(t)SAPGA=N(t)SGA-k,其中t>T。

由于變異和交叉的影響，候選i在模式h下產生的后代的預期數量如公式（9）所示，符號的定義如表1所示。

在第t代，模式h下n時刻的適應度可以表示為公式（10）。

第t+1代模式h的預期平均適應度由兩部分組成：一種是從種群繼承的原始解，沒有遭到破壞；另一種是重組操作產生的新解。

第t+ 1 代模式h下解的平均適應度由公式（11）表示。

式中，q為符合模式定理的候選染色體；α=作為比較，公式（12）中給出了SGA中模式h下解的平均適應度的相應原型[27]。

式中，β=(1-pc)(1-pm)n。

很明顯，從公式（11）和（12）中可得，在模式h下，SAPGA比SGA具有更高的平均適應度。因此，自適應種群模式促使SAPGA具有更準確的解決方案和更快的收斂速度。

3.實驗和結果

本節數據最初采集于一座工作空間為2650 m3的高爐。在上線前，需要驗證算法，我們通過從Oracle數據庫中采樣，從本地服務器中獲取數據集。由于數據質量是確定數據源的重要問題之一，因此使用高斯混合模型將數據集分成不同的類別，剔除不滿足高數據質量要求的數據集。如公式（14）所示，Calinski-Harabasz 指數[28]作為一種聚類評估函數，通常被用來確定聚類中心的最佳數量。較高的Calinski-Harabasz 指數代表更好的聚類性能，原因在于聚類內部的協方差較小而聚類之間的協方差較大。因此，很容易確定圖5 中的最佳簇數為4。此外，煉鐵過程中存在三種工作模式：上升、下降和平穩運行趨勢。

因此，實驗剔除了性能最差的簇以調整鐵的生產條件。

式中，k是樣本數；m是簇數；Bm是不同簇間的協方差矩陣；Wm是簇內的協方差；tr是矩陣的軌跡。

圖5.高斯混合模型的簇個數與評價指標之間的關系。

將從云數據庫中抽取的樣本分為4組。將硅含量和頂壓作為圖6中簇的橫縱坐標軸。黃色團簇在高頂壓中分布較廣，為高爐運行異常。為使爐頂氣壓力回收渦輪機高效工作，高爐爐頂壓力必須保持穩定并在較小的范圍內波動。因此，剔除數據集中在高頂壓中分布廣泛的集群，以提高數據質量。

剔除不滿足條件的簇之后，dGRU由剩余的2000個樣本進行驗證，其中20%劃分為測試數據集。深度神經網絡的輸入參數是滲透率指數、CO2、CO、煙氣指數、理論燃燒溫度、東北頂部溫度、西南頂部溫度、西北頂部溫度和東南頂部溫度。圖7中的數據表明，dGRU-RNN在跟隨輸出參數（包括硅含量、焦炭比和鐵產率）的變化趨勢方面具有出色的性能。實際數據和預測數據的對比表明，dGRU單元具有較高的精度和較快的收斂性。如表2中所示，硅含量的均方根誤差（RMSE）為0.025，意味著dGRU-RNN具有學習煉鐵過程物理動力學的非凡能力。

表2 預測數據與實際數據的比較

圖6.存在簇時四分量高斯混合模型的表示。

圖7.dGRU-RNN對多個煉鐵生產指標的預測結果。

焦炭比的波動比硅含量和鐵產率似乎更平穩。為了更直觀地理解模擬結果，預測的焦炭比及其相應的誤差如圖8所示?？梢钥闯?，dGRU-RNN大部分時間都可以跟蹤焦炭比的變化趨勢，誤差很小。然而，在高焦炭比下的幾個主要錯誤表明，深度神經網絡模型在遇到突然變化時可能會出現低精度。因此，dGRU在處理穩定的工業過程（如高爐煉鐵）方面具有巨大潛力。

圖8.極軸上的焦炭比誤差條形圖。寬度代表預測的焦炭比，半徑是它們對應的誤差。

SGA 存在許多變體，包括自適應遺傳算法（AGA）和具有模擬退火突變概率的遺傳算法（SAMGA）[29-30]。實驗進行了以單對象優化為特征的4 個數值測試函數（圖9），以比較SAPGA和SGA以及其他GA變體的性能。從圖9 中可以發現測試函數（a）在(0,0)處具有最小值，測試函數（b）在(3, 0.5)處具有最小值，測試函數（c）在(π,π)處具有最小值，測試函數（d）分別在(3,2)、(?2.805,3.131)、(?3.779,?3.283)和(3.584,?1.848)處具有4個最小值。

4種GA變體對測試函數（d）的優化過程如圖10所示，其中SAPGA 在搜索精度和收斂速度方面表現最為突出。SAPGA 可以在5 次迭代內收斂到最優，次數遠少于其他GA。在某些情況下，SGA以及其他GA可能會陷入局部極限。然而，由于SAPGA自適應方案，其在測試過程中很少出現陷入局部最優的情況。適應度偏度和種群規模的組合導致了一個典型的現象，即在進化過程中解的數量會先增加然后減少，這有助于避免出現局部極值并提高計算效率。

為了獲得更直觀的優化效果可視化，圖11 中通過將3D圖形轉換為2D平面，展示了測試函數（d）的優化解。結果表明，SGA 在最后階段的最優點附近具有最廣泛的種群分布。但是，SAPGA 具有高度集中的解，可以找到全部的4 個最佳點，表現出比其他GA 變體更好的性能。因此，在優化單目標優化問題方面，SAPGA 比其他3 個典型的GA變體更加強大。

經SAPGA 驗證后，與dGRU 合并以優化實際煉鐵過程。對于高爐而言，由于生產條件不同，出入料順序可能會有很大差異。鐵質硅含量和能耗焦炭比由現場工程師的操作水平決定，而鐵產率可以根據當前和未來的市場情況動態變化。材料供應商、鋼鐵生產商和鋼鐵客戶之間總是存在目標沖突。因此，煉鐵廠依靠多目標優化算法來平衡這些相互矛盾的目標至關重要。在將模型上傳到云上工廠系統之前，我們必須通過三個必要的步驟來驗證多目標優化算法。首先，應用基于常規GRU-RNN 和SGA 的混合框架來優化高爐工藝指標。然后，改進算法取代傳統算法，在時間和空間尺度上優化煉鐵工藝。最后，將經過驗證的dGRU-SAPGA 部署到獨立模式下的分布式計算系統Spark中。

圖9.GA變體的測試函數的3D圖。f是GA在每次進化中的適應度。

圖10.GA在測試函數上的適應度迭代。

圖11.測試函數（d）的GA解分布在第20代終止。

考慮到GA的隨機性，每個測試重復100次。如圖12所示，Spark 系統在計算效率方面有著巨大的優勢。dGRU-SAPGA在分布式系統的平均運行時間為0.04 s，遠小于本地服務器的0.10 s。在本地測試期間，修改后的混合框架dGRU-SAPGA 的運行速度略快于GRU-SGA。但是，dGRU-SAPGA的異常值多于GRU-SGA，這意味著后一種算法比前一種算法更穩定。

圖12.不同方法的多目標優化計算效率。

我們已經將經過驗證的混合框架dGRU-SAPGA 部署到云上工廠超過2 個月。如圖13 所示，鐵產率提高了1.29%，焦炭比降低了3.60%，硅含量平均降低了10.61%。

4.結論

一個高度集成的大型煉鐵工藝制造工廠需要及時的響應和彈性的計算系統來應對各種工作狀況。常規方法在煉鐵過程中受到限制。因此，本文提出了一種基于混合模型的分布式計算方法來優化高爐煉鐵過程中的沖突目標。在本地模式下，dGRU-SAPGA 在建模和優化煉鐵過程方面表現出競爭優勢?；谌津炞C，我們將Spark分配系統中的混合優化框架應用于廣西柳州鋼鐵集團有限公司2號高爐?？蚣軕脙蓚€月后，高爐多項生產指標明顯提高。但是，需要注意的是，對于煉鐵過程來說，僅靠多目標優化服務是不夠的?；诜植际接嬎愕脑粕瞎S還需要許多其他服務，包括智能檢測、數據融合、故障診斷和高級控制。

圖13.多目標優化服務在高爐云上工廠中的效果。

致謝

感謝國家自然科學基金（61933015）的支持。感謝廣西柳州鋼鐵集團有限公司。感謝實驗室同事的辛苦付出。

Compliance with ethics guidelines

Heng Zhou, Chunjie Yang, and Youxian Sun declare that they have no conflict of interest or financial conflicts to disclose.