?

機器學習驅動鍋爐燃燒優化技術的現狀與展望

2024-03-21 05:09姚順春李龍千盧志民李崢輝
潔凈煤技術 2024年2期
關鍵詞:鍋爐神經網絡預測

姚順春,李龍千,盧志民,李崢輝

(1.華南理工大學 電力學院,廣東 廣州 510640; 2. 廣東省能源高效清潔利用重點實驗室,廣東 廣州 510640)

0 引 言

為應對氣候變化,實現雙碳目標,中國火電裝機容量增速放緩,新能源裝機容量不斷攀升。據統計,截至2023年5月底,全國太陽能、風電總裝機已達8.3億kW,約占全國發電機容量的31.13%[1]。但火電總裝機量仍高達50.63%,2022年我國煤電發電量50 792億kWh,占全口徑發電量的58.4%。煤炭仍是中國經濟社會發展的主體能源,發揮電力供應基礎保障和靈活性調峰的重要作用[2]。為落實綠色低碳發展政策,火電行業為實現燃煤電站鍋爐高效率、低污染且安全經濟的運行,開展了包括對燃燒設備的設計和改造、基于參數調整的現場試驗、基于燃燒理論的數值模擬技術、燃燒參數的檢測技術優化、基于機器學習算法的鍋爐參數預測等一系列燃燒優化技術[3]。

隨著人工智能與機器學習算法的快速發展,機器學習技術層出不窮,燃燒優化技術中的參數預測得到了強有力的技術支持[4]。在污染物排放濃度預測的相關研究中,建模對象包括垃圾焚燒鍋爐[5]、燃煤鍋爐[6]等,建模算法包括隨機森林[7]等集成建模方法、結合卷積層的長短期記憶神經網絡[8]等深度學習模型,所建立的鍋爐參數預測模型準確性較高且在相關應用場景中得到驗證。但在深度調峰的過程中鍋爐負荷快速變化,機組低負荷運行會導致鍋爐爐膛流動均勻性下降,燃燒穩定性變差,爐膛溫度降低,導致污染物生成增加造成排放量超標?,F有研究多關于穩態工況參數模型建立的理論方法研究,快速變負荷工況下模型的精度較差且缺乏工程應用及驗證;同時模型的多目標優化效果較差,未能做到低排放與經濟運行的協調統一。筆者通過對比分析鍋爐參數模型的相關研究,總結現有關于污染物排放濃度的機器學習算法,從特征篩選、機器學習算法和應用場景3部分展開介紹,為變負荷工況下的建模方法提供參考,并展望未來鍋爐多目標優化及結合預測模型的污染物復合控制結構的研究方向。

1 NOx排放濃度背景

1.1 火電脫硝系統介紹

NOx是燃煤機組排放的主要污染物之一,具有一定毒性,在陽光直射下易與臭氧發生反應,從而破壞地球的臭氧層,同時也是形成酸雨、光化學煙霧和PM2.5等環境災害的主要物質之一,對生態系統、生活環境以及社會經濟方面均有較大影響。主要NOx排放控制方法包括爐內低氮燃燒技術、選擇性催化還原技術(Selective Catalytic Reduction,SCR)、選擇性非催化還原技術(Selective Non-Catalytic Reduction,SNCR)和臭氧脫硝技術。其中,SCR技術在大型高污染排放工業領域中應用較成熟,且操作設備專業,具有運行穩定﹑脫硝效率高等優點,廣泛應用于火力發電廠。

SCR脫硝過程通常以尿素或氨水作為還原劑,V2O5/TiO2為催化劑,反應溫度在300~400 ℃,發生的主要反應有

(1)

(2)

(3)

(4)

隨機組負荷快速變化,NOx排放濃度劇烈波動,易造成氨逃逸,引發催化劑中毒、引風機腐蝕等問題。因此,SCR脫硝系統NOx排放濃度和氨逃逸率的有效控制將得到極大考驗,火電機組深度調峰和靈活性能力將得到進一步重視。

1.2 NOx排放濃度數據特征

由于SCR煙氣脫硝系統較為復雜,在研究其出口NOx濃度模型前需總結其特有的大數據特征,具體如下:

1)慣性與遲延:SCR煙氣脫硝反應過程涉及較多化學反應變化,煙氣中各組分的反應過程需要一定時間;同時由于煙氣自動監控系統(Continuous Emission Monitoring System,CEMS)抽取的煙氣需經較長的伴熱管線才能到達分析儀分析,多種傳感器、控制器等設備也存在一定的響應時間,NOx排放濃度及相關參數的測量滯后較嚴重。

2)強耦合性:SCR煙氣脫硝系統相關參數與機組運行參數間存在強相關性,如煙氣溫度、飛灰含碳量等均隨機組負荷的變化而改變,不同量級與維度的數據互相影響,在深度調峰背景下對NOx排放濃度的影響更明顯。

3)非線性:NOx排放濃度不僅受機組運行參數的影響,煤質改變或催化劑活性變化也會導致NOx排放濃度出現不規則波動。

為更好解決上述典型數據特征對模型建立的影響,有必要對機組運行數據進行預處理并提取關鍵特征,同時改進現有機器學習算法擬合非線性數據來建立更準確的模型。

2 特征篩選

在建立模型前需從系統復雜特征中提取有用信息,具體分為數據預處理、特征提取和特征選擇3部分,具體流程如圖1所示。

2.1 數據預處理

鍋爐參數模型的建模數據多來自在線監控平臺和機組的歷史運行數據,隨深度調峰的進行,機組負荷的快速波動會為集散控制系統(Distributed Control System,DCS)平臺的數據收集與存儲帶來一系列不穩定因素,易造成數據缺失、數據異常、數據噪聲等問題。

2.1.1 數據缺失

收集到的運行數據有時會出現空白值,通過設置合理的變量取值范圍,審查數據是否符合實際工況要求,提升數據質量。錢楓等[7]刪除長時缺失時間段內的所有數據,對數據中短時缺失部分使用均值填充。但該處理方法相對粗糙,不能很好地保持數據的原始特征。蔡廟輝等[8]采用參數預測方法,即設定時間窗口大小,利用缺失值前n個時刻的數值進行該時刻數值的預測,使用預測值替代缺失值,填補數值的科學解釋性更強。

2.1.2 數據異常

由于現場環境復雜,電廠運行數據可能因DCS通訊故障、測量設備損壞及環境干擾等原因與實際值不符或與臨近樣本偏差較大,即異常值。金秀章等[9]利用滑動窗口檢測數據離群點并進行3次樣條插值填充修正離群點。唐振浩等[10]使用異常值前20個點的平均值替代四分位法篩選出的異常值。戴寧鍇等[11]使用中位數絕對偏差方法對異常數據進行診斷。金秀章等[12]采用拉依達準則,使用中位數替代不在(μ-3σ,μ+3σ)區域范圍內的數值,確保不同特征列間的時序連續性。但針對變負荷工況下復雜的機組數據,上述統計學方法適用性較差,通過計算樣本向量之間距離的聚類方法在處理高維數據時效果更好[13]。李延臣等[14]根據不同穩態運行時間段的數據在全部穩態數據集中所占比例進行蒙特卡洛采樣,刪除重復數據。余舒等[15]通過密度聚類確定有效的聚類中心,簡化時間數據的相似特征。李悅等[16]采用歐氏距離作為分類標準,使用K-Means聚類算法篩選樣本集合并建立典型建模樣本集合。

2.1.3 數據降噪

系統在處理現場信號時受環境和系統本身波動等隨機因素影響而存在的誤差,被稱為運行數據的噪聲。如電磁擾動和煙氣濃度波動等因素均會引入較大的不穩定性,因此在建模前需對數據進行降噪,以此提高模型的準確性。部分學者[17]采用S-G濾波器對原始數據進行濾波降噪。金秀章等[12]采用卡爾曼濾波算法,通過對狀態變量的線性最小方差進行遞歸估計達到降噪目的。陳延信等[18]通過計算模態分解后的IMF分量與原信號之間的歸一化相關系數,當系數在局部達到最小時,對該分量采用中位值平均濾波進行信號處理。李宇航等[19]使用小波閾值降噪方法,對包含噪聲的數據樣本進行小波分解算法的變換處理,得到小波分解系數和閾值函數并對絕對值低于閾值的小波分解系數置零處理,以提高原始數據的平穩性。上述降噪方法均可有效清除系統及外界因素干擾,提升數據的準確性。

2.1.4 數據標準化

火電廠中的運行數據種類繁多且量綱不統一,數據標準化可以消除不同特征數據間的量級和量綱不統一對建模結果的影響,有效提高模型的收斂速度。蔡廟輝等[8]使用min-max歸一化對數據進行標準化處理。馬牧野[13]采用Z-score標準化變換歷史數據的均值和標準差,生成滿足標準正態分布的形式。其中需要注意的是在使用min-max歸一化時,可以根據后續建模算法選擇不同的最大值和最小值以避免出現過擬合的情況。

2.2 特征提取

特征提取通過分析特征屬性間的關系,利用數據轉換或映射生成新的特征空間,得到新屬性,排除信息量較小的特征,以減少計算量,實現降維的目的。目前,常用的數據特征提取方法主要包括線性方法、非線性方法以及統計學方法等。

作為一種典型的線性降維方法,主成分分析(Principal Component Analysis,PCA)方法在特征提取中的應用較為廣泛,通過對數據進行正交變換,旋轉原坐標系并將數據在新坐標系上表示出來[20]。李延臣等[14]采用與PCA方法等效的奇異值分解(Singular Value Decomposition,SVD)方法對燃煤鍋爐的穩態數據進行篩選,但SVD方法在求解新矩陣時不需計算原矩陣的協方差矩陣及其特征值特征向量,可通過高效的迭代求解方法計算。偏最小二乘法(Partial Least Squares,PLS)也具有將變量從高維空間映射到低維空間的能力,石翠翠等[21]應用PLS方法提取燃氣輪機原始數據集中潛在變量所包含的信息,最大程度地消除變量間的共線性問題同時排除系統中的噪聲干擾。

伴隨機器學習技術的發展,神經網絡方法得到更廣泛的應用。卷積神經網絡(Convolutional Neural Network,CNN)具有局部區域連接和權值共享等特點,能夠有效提取數據特征[22]。蔡廟輝等[8]利用CNN卷積層提取垃圾焚燒爐輸入數據的特征并減小矩陣規模,通過池化層進一步提煉卷積后的數據,降低輸入矩陣復雜性和模型計算量。鄧明星等[20]為增強卷積層處理數據的能力,在CNN通道增加了注意力機制模塊(SE-Net),通過訓練得到的每個特征通道的重要程度,作為賦權的依據,使原CNN高效關注于柴油車相關數據的重要特征,從而改善性能。相似的非線性降維方法還有自動編碼器 (Auto Encoder,AE),該方法能有效挖掘海量數據中的特征信息,將原始數據的深層次多維信息轉化為低維數據特征,從而保留大部分原始數據信息,同時降低神經網絡的復雜性。張鑫等[23]采用結合RMSprop梯度下降優化算法的自編碼方法,通過小批量循環訓練對輸入數據進行降維重構。此外還有基于統計學的時域特征提取方法,通過計算數據的方差、偏度、峭度等統計學特征,了解數據的分布、變化和關系,在故障診斷、地震波形信號分析、目標檢測等領域得到了廣泛應用。唐振浩等[10]通過完全集合經驗模態分解得到多個IMF分量,利用統計學計算的方法計算每個IMF分量的時域特征。

2.3 特征選擇

在分析NOx出口濃度數據特征時,常選擇盡可能多的特征以獲取更多重要信息。但當變量數據集過大時,易出現信息冗余現象,導致模型復雜度增加、計算效率降低和易過擬合,影響模型的預測精度和泛化能力。特征選擇是從研究對象的一組復雜特征中挑選最具代表性的特征,從而降低特征向量空間的維度并簡化運算[24]。與特征提取方法相比,特征選擇方法保留原始數據的特征,最終得到的降維數據實際上是原數據集的一個子集,物理上有更強的科學解釋性。常見的特征選擇方法包括:相關系數、互信息、最大信息系數等方法。

余舒等[15]利用皮爾森相關系數和斯皮爾曼相關系數,分析各輔助變量對NOx排放濃度的影響,驗證了所選輸入輸出變量之間具有較強的相關性。王永林等[22]使用灰色關聯度分析(Grey Relation Analysis,GRA)方法,通過兩序列間發展過程的相近性或發展趨勢的相似性計算輔助變量間的相關度。類似的還有線性回歸方法,即通過最小化目標函數來實現模型的特征選擇和系數稀疏化。唐振浩等[25]使用Lasso回歸方法構造懲罰函數,對與輸出變量相關性較弱的輸入變量的系數置0,實現變量選擇。

但上述相關系數方法只能計算變量之間的線性相關程度,在SCR脫硝系統中變量間常存在較大的非線性關系?;バ畔?Mutual Information,MI)在已知其中一個特征的情況下,通過計算2個特征共同包含的信息,來衡量另一個特征需包含的信息量,在處理線性與非線性問題時均有較好的效果[26]。李延臣等[14]將最小冗余最大相關性(Max Relevance and Min Redundancy,mRMR)作為變量篩選評價標準,通過計算變量間的MI篩選出與輸出變量高度相關且變量之間相關性較低的特征變量。王瓏憲等[27]引入相關性判斷改進mRMR算法,利用MI方法計算了輸入變量與鍋爐出口NOx濃度的關聯度并進行時延估計,重構了輸入變量的時間序列,有效增強模型的動態特性。伴隨MI技術的發展,衍生出最大信息系數(Maximal Information Coefficient,MIC)方法。MIC方法能夠對不同的關聯類型進行評估,進而搜索更廣泛的關系范圍;同時MIC方法準確度更高,可以克服MI算法中不便計算連續變量的缺點。吳康洛等[28]在MIC的基礎上引入基于關聯性的特征選擇算法(Correlation-based Feature Selection,CFS),篩選出特征間平均相關性最小輸出類別時平均相關性最大的特征子集。此外也有學者采用機器學習算法分析特征間的相關性,采用特征選擇組合算法選擇最優訓練特征[29]。

3 關于鍋爐參數模型的機器學習算法

3.1 支持向量機算法

支持向量機(support vector machine,SVM)算法通過選擇最優分類面使得不同特征向量到該平面的距離最大,屬于淺層學習系統。王志堅等[30]針對SVM算法在面對數量較大的樣本時特征輸入矩陣計算復雜度較大的問題,采用序列最小優化的啟發式算法建立NOx排放故障診斷模型。最小二乘支持向量機 (Least Squares Support Vector Machine,LSSVM)算法將SVM算法中復雜的二次規劃問題轉化為計算簡單的線性問題,提高計算效率。于聞歌等[31]使用LSSVM算法建立NOx排放量預測模型,通過局部異常因子確定損失函數的加權系數,解決了歸一化導致無法區分鍋爐不同輔助變量對結果貢獻度不同的問題。支持向量機回歸(Support Vector Regression,SVR)是在SVM的基礎上引入不敏感損失函數,尋找一個最優面使樣本距離最優面的誤差最小。金鵬[32]通過對比SVR算法與BP神經網絡的預測誤差,驗證SVR算法在鍋爐NOx排放量濃度預測上更有優勢。但在確定SVM的核函數時,由于徑向基核函數參數設置簡單,能降低模型的復雜度,學者多采用徑向基核函數來構造預測模型的代價函數,如線性核函數、多項式核函數等其他核函數在SVM中的應用有待進一步研究。

3.2 神經網絡算法

神經網絡算法通過模擬人腦神經系統建立數學模型,具有自我學習能力且訓練速度快,可處理復雜信息,已是多學科交叉的廣泛應用領域。按信息流向可以分為:前饋神經網絡和反饋神經網絡。

3.2.1 前饋神經網絡算法

前饋神經網絡(Feedforward Neural Network,FNN)如圖2所示,是應用最廣泛、發展最迅速的神經網絡之一,主要包括:反向傳播神經網絡、徑向基神經網絡、極限學習機和生成對抗網絡等。

圖2 前饋神經網絡結構

反向傳播神經網絡(Back Propagation Neural Networks,BPNN),向前傳播信號向后傳遞誤差,屬于多層前饋神經網絡,擁有復雜模式的分類能力,同時可以很好地映射非線性信息。BP神經網絡通常會隨機生成初始權值和閾值,不確定性會對模型訓練和預測效果產生較大影響。因此通過智能算法對初始權值和閾值的最優值進行搜索有利于進一步提高預測模型的預測準確性和穩定性。關于NOx排放濃度的BP神經網絡預測模型多采用粒子群(PSO)算法和遺傳(GA)算法對模型參數進行尋優[33]。陳暉[34]在粒子群算法的基礎上引入非線性慣性遞減權重,提出改進的PSO算法優化NOx排放濃度模型參數。天牛須搜索 (BAS)算法僅有1個尋優個體,相較于GA算法和PSO算法,計算量明顯縮小且尋優速度更快。陳延信等[18]使用BAS算法進行參數尋優,相較于PSO算法效果更好。聞增佳等[35]采用遺傳算法(GA)確定最佳信息素,利用最佳信息素更新蟻群算法(ACO)確定初始信息素,結合2種算法的優勢搜索NOx排放濃度模型最佳參數。其他尋優算法的優缺點見表1,相關優化算法在模型參數尋優和目標函數計算中應用廣泛,通過對比各尋優算法的優勢并結合相應原理改進現有算法將成為未來算法研究的主要方向。

表1 部分優化算法在SCR脫硝系統預測模型中應用的優缺點對比

盡管BP神經網絡的理論和性能方面均已較為完善,但仍具有不少缺陷:學習速度慢、迭代耗時過長、針對小樣本建立的關聯函數誤差較大且輸出結果很難收斂等,上述缺點都影響BP神經網絡預測結果的準確性。徑向基(Radial Basis Function,RBF)神經網絡模型中網絡連接權值與輸出呈線性關系,在保證計算結果準確度的同時擁有更快的計算速度,且具有唯一最佳逼近的特性,可有效避免局部最小的問題。楊文玉等[40]通過對比分析RBF、BP、AE三種神經網絡模型關于NOx質量濃度的預測效果,證明RBF神經網絡具有較好的預測能力。孫繼昊等[41]采用RBF神經網絡預測NOx與CO的排放濃度,預測結果與數值模擬數據吻合程度較好,證明該方法能較準確地預測污染物排放濃度。

但由于結構限制,RBF神經網絡模型在處理時序預測問題時并沒有明顯優勢,泛化能力較差,易陷入局部極小點。極限學習機(Extreme Learning Machine,ELM)是具有單隱藏層的前饋神經網絡,一般通過隨機生成或人為給定確定隱藏層權重,只需計算輸出權重而無需使用梯度反向傳播。這種特性在減少模型參數選擇計算量的同時保留了模型的泛化能力[42]。葛憲福[43]采用核映射代替隨機映射節省優化隱層神經元個數的時間,建立關于混合核極限學習機算法的鍋爐NOx排放量預測模型,改善隱層神經元隨機賦值帶來預測穩定性下降的問題。譚增強等[38]使用深度極限學習機算法預測脫硝出口NOx濃度,通過堆棧多個自編碼極限學習機實現對數據特征的映射。牛培峰等[39]使用并行極限學習機算法,通過并聯2個ELM加快NOx排放濃度模型的訓練速度大幅提高了神經網絡的性能。

此外,SCR脫硝系統中存在較多類別和數目的特征,具有較強特征抓取能力的生成對抗網絡(Generative Adversarial Network,GAN)有良好的表現。GAN是一種常用于學習數據類別特征的前饋神經網絡,通過判別生成器生成的樣本和真實樣本之間的真偽進行學習。張鑫等[23]通過對比GAN神經網絡和BP神經網絡,證明了具有較深層次的GAN神經網絡模型可以充分挖掘火電機組高維、復雜的非線性序列數據。但GAN對于生成器沒有任何約束,使得數據生成的隨機性大,導致訓練樣本量增加時模型難以控制;同時GAN以隨機噪聲為輸入,真實數據的分布與輸入數據的關聯不足。張志宇等[44]在GAN的基礎上輸入可控數據,增加了約束條件,人為規定了樣本的生成方向,所建立的NOx排放濃度模型具有較高的預測精度。

3.2.2 反饋神經網絡算法

反饋神經網絡包括循環神經網絡、長短期記憶網絡和玻爾茲曼機等,相比前饋神經網絡,數據可通過層間神經元的連接自由傳遞。同時反饋神經網絡采用Hebb學習規則使得收斂速度更快,更適合應用于聯想記憶和優化計算等領域。

與循環神經網絡(Recurrent Netural Network,RNN)相比,長短期記憶(Long Short-Term Memory,LSTM)神經網絡在分析處理時序數據時有明顯的優勢。RNN雖然考慮了不同時刻隱藏層之間的關系,但由于其結構單一,在處理長時間序列問題時效果不佳。相較之下LSTM神經網絡如圖3所示(圖中t為時刻;x為輸入;C為輸出;h為隱藏層參數),引入了門控循環單元機制,具備對短期記憶敏感的特性,同時還有專門保存長期信息的單元狀態,有效解決了RNN在處理時序數據時可能出現的梯度爆炸或消失問題。王永林等[22]利用LSTM算法預測NOx生成質量濃度,同時加入了正則化(Dropout)方法減少過擬合現象。劉文慧等[45]在LSTM神經網絡層中加入了時序注意力機制(TPA),通過構建向量間的相似度對變量進行選擇,突出關鍵信息,提高了鍋爐床溫模型的計算效率和預測精度。武松等[46]引入全局注意力機制(GAM)建立關于LSTM神經網絡的NOx排放量預測模型,通過與CNN等典型神經網絡的預測結果進行對比,證明本模型具有更高的預測精度,泛化能力更好。

圖3 LSTM神經網絡結構

門控循環單元(Gated Recurrent Unit, GRU)是LSTM的一種簡化結構,在處理時間序列時有更大的優勢。GRU將控制單元狀態的忘記門和輸入門合并,并引入新的門控結構,在保持LSTM神經網絡時序數據處理效果的同時又具有參數簡化和收斂性更好的優勢,更適用于工程應用[47]。但是GRU神經網絡只能單向對數據進行學習,容易丟失反向重要信息,馬永光等[36]采用雙向GRU網絡(BiGRU)建立SCR脫硝系統出口NOx排放預測模型,如圖4所示,通過獨立計算疊加前向和后向隱藏層狀態獲得最終輸出結果。BiGRU對特征學習能力更強,更適合處理時序性明顯的鍋爐參數數據。楊國田等[48]通過疊加多層GRU結構提高了模型挖掘數據特征的能力和魯棒性,有效提升關于火電廠NOx排放量的預測效果。李宇航等[19]通過對比LSTM、GRU、BiGRU等算法關于柴油機NOx排放濃度的預測結果,證明BiGRU模型的預測精度最高,誤差最小。

圖4 BiGRU神經網絡結構

3.3 集成學習建模方法

將不同學習器組合起來被稱為集成方法(Ensemble Method)或元算法(Meta Algorithm),集成模型同時具有不同學習器的優勢,準確性和泛化能力都有較大程度的提升。集成方法通過對數據進行深入分析,一定程度上克服了火電機組工況多變、負荷快速變化等因素使得建模效果較差的問題。按照各學習器之間的組合方式大致可分為Boosting 與Bagging兩種。

使用Boosting集成學習方法時各學習器間存在強依賴關系,可將弱學習器提升為強學習器。錢虹等[17]基于注意力機制對向量自回歸(Vector Auto Regression,VAR)模型與在線循環極限學習機的多維混合預測模型進行變權融合,建立NOx排放量預測模型。但在賦權時主要采用加權平均的方法,缺少一定的科學理論依據,模型泛化能力較弱。王亞歐等[49]通過神經網絡方法對若干LSSVM模型的預測結果進行非線性融合,同時結合通過模糊聚類得到的樣本隸屬度,加權得到SCR入口溫度的預測輸出。譚增強等[50]利用SVR模型對LSTM神經網絡預測模型的誤差進行預測并修正,得到的脫硝系統入口及出口的NOx預測濃度效果較好。金秀章等[51]組合使用對線性序列預測更加準確的ARIMA模型和對非線性部分數據更加敏感的OSELM模型,對比最優權重組合預測方法和殘差優化組合預測方法,結果表明殘差優化組合模型能夠更好地提取NOx排放濃度序列中的非線性信息進而提升預測精度。梯度提升決策樹(Gradient Boosting Decision Tree,GBDT)算法也是一種典型的Boosting集成學習方法,該算法同時結合決策樹與Gradient Boosting算法的優勢,在多元非線性回歸問題方面有較好的應用[52]。陳天鍇等[53]利用GBDT算法有效解決包含多特征的柴油機非線性系統問題,所建模型對NOx、CO等氣體的預測具有較高的準確度和穩定性。

使用Bagging集成方法時個體學習器間依賴關系較弱,不同學習器之間并行化,所建模型泛化性能更好。隨機森林(Random Forest,RF)算法在決策樹的訓練過程中引入Bootstrap自助采樣法隨機選擇屬性,訓練速度快,調節參數少,抗過擬合能力強[54]。孫胡彬等[55]將所建立的NOx質量濃度RF模型與BPNN和LSSVM模型相對比,證明RF模型具有更高的預測精度和更優的泛化性能。極端隨機樹(Extreme Tree,ET)算法是針對隨機森林樣本選擇方式不能保證樣本被充分利用,導致決策樹之間相似性較高,從而提出的一種Bagging集成方法[56]。陳建均等[57]使用ET算法建立NOx排放預測模型,多個CART決策樹獨立訓練并隨機選擇分叉值,提高了基學習器間的差異性和隨機性,通過對比ET算法與RF算法的預測結果,證明ET算法模型具有更強的泛化能力。Stacking集成學習方法包括基學習器模型訓練和元學習器模型二次集成預測兩部分,通過整合多個模型的優點,提高整個集成模型的泛化能力和魯棒性,減少過擬合風險,避免單個模型的局限性和缺陷[58]。唐振浩等[10]采用ELM、DNN、MLP、XGBoost為基學習器和ESN為元學習器構建Stacking集成學習模型,通過集合不同強預測模型充分提取數據特征,使得NOx排放濃度的預測效果最優。

綜上所述,機器學習算法在NOx排放濃度預測模型中應用較多,在前饋神經網絡中針對BP神經網絡學習速度慢、易陷入局部最小值等問題,發展出用于學習數據類別特征的GAN和計算速度快泛化能力強的ELM。在反饋神經網絡中LSTM神經網絡擅長處理時序序列特征,GRU神經網絡則進一步優化了LSTM神經網絡的結構。集成學習方法通過組合不同學習器的優勢,提高整個集成模型的泛化能力和魯棒性,避免單一模型所帶來的局限性。但是有關動態模型的研究較少,相關模型所選數據多集中在穩定負荷工況,變負荷工況下的數據特征不能得到很好的預測。通過遞推、滑動窗口、即時學習和時間差分等方式更新模型樣本,在線更新并不斷優化模型參數,以及對模型誤差進行動態修正將在NOx動態模型的建立中取得較好效果。

4 應用場景

4.1 鍋爐運行參數監測與修正

火電機組深度調峰已經成為常態,但深度調峰下的負荷遠低于鍋爐設計的最優運行工況,機組低負荷工況下長期穩定運行受到較大考驗,相關鍋爐參數將出現較大波動。鄧明星等[20]通過建立改進的LSTM神經網絡預測模型,對缺失嚴重的NOx濃度數據進行預測填補,通過不同連續缺失時間及不同排量類型條件下的對比試驗,得到模型預測結果的決定系數保持在0.86以上,均方根誤差較次優模型降低了19.13%且保持在較低水平,有效提升了采集NOx濃度數據的完整性。同時由于測量滯后的問題,在NOx質量濃度波動較大時SCR脫硝系統往往不能及時調節噴氨量。余舒等[15]使用軟測量手段,在應用開環、閉環控制系統中嵌入入口NOx濃度預測模型替代前NOx傳感器,其中開環系統傳感器測量的比排放與預測模型輸出的比排放值絕對誤差為0.11 g/kWh,相對誤差為1.16%,在閉環系統中絕對誤差為0.06 g/kWh,相對誤差為0.75%,精簡系統,有效降低硬件成本。

此外為達到較優的經濟效益與社會效益,往往需要對鍋爐的運行參數進行調節。張媛媛等[59]通過NOx排放質量濃度的BP神經網絡預測模型得到350 MW機組低負荷工況下的最優鍋爐運行參數,其中尿素溶液的質量流量為0.1 t/h,滿足NOx超低排放并符合運行經濟性要求。閆睿等[60]通過對410 t/h循環流化床鍋爐的燃燒系統進行建模,優化一組高飛灰含碳量和高NOx排放量的數據并進行工業試驗,結果顯示飛灰含碳量由8.79%降至7.98%,NOx排放濃度降低了15.4%,實現了燃煤鍋爐高效清潔燃燒的目標。劉建軍等[61]建立的CNN-LSTM混合模型在預測5 min后SCR入口的NOx濃度時誤差為7.05%,低于在實際生產中制訂噴氨策略所要求的15%。將該預測模型發布為Web服務并接入電廠SIS系統的數據接口后,運行人員可以根據現場生產數據實時獲取未來一段時間出入口NOx濃度,方便運行人員及時調整排放煙氣中NOx的質量濃度,提高生產效率。其中處理時序數據效果更好的LSTM神經網絡模型預測精度高于BP神經網絡、徑向基神經網絡等淺層神經網絡,也較好地印證了火電機組數據時序性較強的特點。

在煙氣排放指標監測環節中,除出口NOx質量濃度外,氨逃逸濃度也是一項重要檢測指標。但是有關氨逃逸的模型相關研究較少,催化劑孔堵塞與失活、燃燒系統失穩及還原劑噴口堵塞等情況都會引起氨逃逸量的非正常增加。同時大部分電廠安裝的CEMS無法準確測量脫硝系統出口氨逃逸量,氨逃逸超標無法被CEMS及時檢測到,易造成空預器堵塞和降低催化劑壽命,導致鍋爐效率降低,廠用電率增加。陳鴻偉等[62]采用GABP算法的間接模型預測氨逃逸濃度,相對誤差為±24.29%,略高于工程要求的±20%以內,但其預測值與實際值的上下限范圍基本一致。譚增強等[63]通過對比關于預測氨逃逸的LSTM模型和SVR模型,其中SVR模型的平均絕對誤差為0.002 4 μL/L,均方根誤差為0.007 1 μL/L,具有更高的準確度和泛化能力。

隨著時間推移,機組各設備的運行狀態會發生變化,如催化劑活性下降、煤種變化、傳感器漂移等情況。由于機組運行工況與運行時間相關,通過預測模型對時序數據進行分析可以判斷機組是否處于正常運行狀態,監測鍋爐設備狀態。王永林等[22]在Hadoop平臺中對CNN-LSTM模型運行效果進行在線評估,當現役模型控制效果偏差超過閾值時平臺會發出模型失配報警,采用安全介質將新的CNN-LSTM模型從輔安全區更新到主安全區中,使用新模型繼續控制脫硝系統運行。

綜上所述,NOx排放濃度模型可在數值上直觀表示系統的運行狀態,及時準確的出口NOx濃度對現場人員監測及調控鍋爐參數有重要的指導作用,準確完整的數據集一定程度上提高了遠程監控平臺對NOx排放的監管精度,為煙氣排放大數據應用研究提供數據基礎。建立氨逃逸預測模型不僅可以及時顯示SCR脫硝裝置的運行狀態,有助于分析鍋爐系統設備的潛在問題,同時可作為NOx排放濃度預測模型的輔助變量,實現NOx超低排放。此外,通過神經網絡模型計算得到不易測量的氨逃逸量也可以有效解決CEMS測量不準和單點測量不具代表性的問題。同時鍋爐參數各變量之間有極強的耦合關系,CEMS無法檢測的系統狀態如催化劑活性、噴氨格柵老化狀態等都可以通過NOx濃度的異常情況進行判斷。未來結合總煤量、飛灰含碳量等DCS系統無法直接獲取的燃燒參數數據的預測模型準確度將進一步提高,同時模型將包含更多信息并為現場運行裝置的狀態分析提供參考。

4.2 燃燒優化控制

國外對燃燒優化控制方面起步較早,將燃燒優化技術與自動控制技術結合,技術較成熟。燃燒優化技術包括: Ultramax公司的Ultramax燃燒優化技術和Pegasus公司的Power Pefecter燃燒優化技術、NeuSIGHT燃燒優化技術等[64]。國內火電機組應用廣泛,現有燃燒優化控制系統包括:西安熱工研究院開發的鍋爐燃燒優化指導系統、清華大學開發的OCP3系統和東南大學開發的BCOS-2000/2.0系統等[65]。

噴氨量是調節SCR系統出口NOx質量濃度的最主要手段,基本控制方法包括固定摩爾比控制方式、固定出口NOx含量控制方式等常規PID串級結構[66]。嚴新宇等[67]建立參數自整定模糊PID控制,通過調節主控制器的3個參數控制噴氨量,超調小于20%,到達穩態的時間約為1 600 s,系統的穩定性和魯棒性得到增強。張洪敏等[68]采用2階線性自抗擾控制,即在PID的基礎上引入2階濾波器的結構,響應速度更快,上升時間由13 min降至7 min,同時標稱值在±20%的范圍內隨機攝動時仍具有較強的魯棒性。來長勝等[69]建立基于自校正控制的GPC結構改善SNCR煙氣脫硝系統的控制性能和調節品質,但在負荷和煙氣含氧量變化幅度劇烈時其控制效果一般。

SCR脫硝系統具有較大的滯后性和延時性,傳統控制策略無法完全滿足脫硝噴氨調節要求。SCR脫硝系統的準確建模是對噴氨量進行有效控制的前提,隨著機器學習算法的發展,結合NOx預測模型的前饋控制、模型預測控制等復合控制結構得到廣泛關注。王永林等[22]使用CNN-LSTM神經網絡建立入口NOx質量濃度預測模型,并將其嵌入SCR脫硝優化控制系統中的前饋環節部分,氨水平均用量由153.6 kg/h降至147.9 kg/h。高明明等[70]將爐膛出口NOx濃度預測模型作為一次風量二次風量指令的修正,同時引入前饋控制提前調節噴氨量,該模型在290 MW穩定工況下平均誤差為5.76%,可提前3~5 min計算出爐膛出口NOx濃度。賈曉靜等[71]采用分區混合動態噴氨控制策略,顯著降低脫硝系統的氨逃逸率,同等入口條件下出口氨逃逸率小于1.1%,同時提高脫硝系統出口NOx分布均勻性,平均分布偏差小于10%。改善了超低排放改造后脫硝系統的控制特性,提高了SCR脫硝控制系統運行水平。李亞寧等[72]根據不同入口煙氣換向過程最低NOx濃度和出口NOx濃度設定值關系設置前饋控制策略,通過換向過程臭氧發生機功率曲線圖計算得到單日臭氧消耗量節省0.930 1 kg。上述前饋環節通過預測模型提前獲得入口NOx質量濃度改善還原劑投入滯后的問題,此外與預測模型結合較好的模型預測控制結構也有明顯優勢,通過反饋校正和滾動優化不斷修正設定值與實際值之間的偏差。姚楚等[73]通過神經網絡構建的NOx排放濃度模型預測值修正機理模型,該模型預測控制策略在2個典型工況下的脫硝效率比PID控制策略高約10%。李佩佩等[74]通過受控自回歸滑動平均模型預測NOx濃度,所建立模型預測控制結構控制出口NOx濃度與設定值的最大動態偏差在5 mg/m3內,平均氨逃逸率低于2.3 μL/L,控制效果較好。

隨著深度調峰不斷深入,機組負荷快速變化,實現變負荷工況下煙氣清潔排放的目標為控制策略提出更高水平的要求。孟宏君等[75]在電站現場原有單回路PID的控制策略基礎引入AGA-Smith預估補償控制策略,通過IPSO算法辨識得到SNCR脫硝控制系統170和260 MW兩種典型工況下的傳遞函數,分別加入20 mg/m3的外來擾動,超調量分別為10.52%和11.74%,抵抗外來擾動的能力得到增強。李剛等[76]通過Smith預估控制噴氨量,控制對象在100%、80%、60%機組負荷下保持較小的超調量,有較好的穩態特性。鄭必君等[77]使用Mean LSTM模型計算燃煤電廠常見的8個不同負荷段工況下的凈煙氣NOx濃度,預測值與原定值的偏差為3.44%,通過引入NOx濃度的模型預測值改進優化PID控制。此外,針對不同工況建立的多模型預測控制在應對快速變負荷問題時也有較好的效果。李悅等[16]通過Stacking融合模型預測多變工況下的NOx排放濃度,結合深度確定性策略梯度強化學習模型,實現SCR脫硝系統的參數優化控制,脫硝效率值穩定在86%左右。噴氨質量流量穩定在35.657 kg/h,脫硝成本總價格降低了27.56%。尹貴豪等[78]通過對瞬時總給煤量進行核密度統計確立3種典型工況,建立多模型預測控制器,升、降負荷段出口NOx質量濃度波動分別為±6和±5 mg/m3。譚暢等[79]通過爐膛出口煙溫確立機組負荷,分工況構建多模型預測控制,變負荷工況時波動在±8.1 mg/m3,標準差分別為2.10和2.89 mg/m3,設定值跟蹤穩定。肖運啟等[80]采用多模型動態矩陣控制策略控制噴氨閥門開度,氨逃逸不超過8 mg/m3。 趙征等[81]將入口NOx質量濃度預測值作為前饋,構建模糊增益調度3個典型工況串級控制器的多模型預測控制結構,其中300 與400 MW負荷下系統的上升時間與調節時間均小于500 s。

綜上所述,隨著機器學習技術的發展控制器算法得到優化,控制器準確性、穩定性和快速性同時得到提升。隨著對精細控制要求的提升,為保證火電機組在深度調峰的過程中實現NOx的超低排放,建立控制結構時模型將收集處理更多的歷史數據,模型復雜程度將進一步升級,控制器運算量將指數上升。而有著深層網絡的深度學習算法不僅可以更好地辨識模型結構參數,還能提高計算效率,將成為噴氨優化控制的主流發展方向。在火電機組中除NOx排放控制外還包含主蒸汽溫度控制、磨煤機控制、CFB鍋爐解耦控制等,而鍋爐參數較為統一,各變量間相關性較強,未來結合前饋、反饋環節同時包含多變量控制的綜合控制方案設計將更加合理,鍋爐燃燒優化的自動化水平將進一步提升。

4.3 多目標優化問題

在燃燒調整過程中燃燒穩定性與污染物排放相互制約,提高燃燒穩定性勢必會加大NOx排放量,這個過程需要調整鍋爐參數來維持燃燒穩定性與低污染物排放的平衡,而鍋爐效率在數值上直觀反映了燃燒穩定性。由于燃煤鍋爐具有燃燒過程復雜、運行變量強耦合等特點,加上新能源的入網使鍋爐負荷波動大且變化迅速,有時需要在確保鍋爐深度調節負荷能力的同時犧牲鍋爐效率。在低負荷下燃燒穩定性下降可能導致NOx等污染物排放超標,對鍋爐穩定性提出更高要求。因此,需要優化預測模型,確保在鍋爐負荷快速變化的過程中,保持較高鍋爐效率的同時盡可能減少NOx排放,實現多目標優化。

在解決多約束、多目標優化問題時需要確定模型綜合優化的目標函數,該目標函數同時涵蓋NOx排放量和熱效率2項參數,且需要具備在目標函數尋優過程中NOx排放量和熱效率2項參數能向各自最優方向上變化。閆睿等[60]在設計優化函數時使用飛灰含碳量代替鍋爐效率,根據燃燒優化過程中對鍋爐效率和低污染排放的重視程度,人為定義飛灰含碳量與NOx歸一化值的權重,但該種賦權方法沒有考慮目標間的影響關系,依靠人工經驗設定權值會影響最優解的分布,難以反映優化目標的真實情況。許朵等[82]將燃油消耗率和NOx排放濃度共同作為優化目標,通過非支配排序遺傳算法計算得到一組最優控制參數組合,經驗證優化后的NOx排放平均下降了76.4%,燃油消耗率平均下降了3.5%。徐文韜等[83]引入快速排序法改進非支配排序遺傳算法,降低鍋爐NOx排放質量濃度為主提高鍋爐熱效率為輔的優化方案效果最優,得到NOx的排放質量濃度平均降低15.42%,鍋爐熱效率平均升高0.105 8%。

此外關于脫硝控制還涉及脫硝成本的問題,相關成本包括還原劑消耗成本、NOx排放費用、電價補償以及人工、折舊、維修等費用[84]。通過先進的機器學習算法可以將NOx超低排放與經濟性相關聯,建立關于鍋爐綜合運行成本的預測模型。卞韶帥等[85]建立了鍋爐低氮燃燒與SCR脫硝系統聯合運行的綜合成本模型,經試驗驗證,灰渣平均含碳量減少了32%,鍋爐效率提高約0.28%,氨耗量增加約23 kg/h,綜合節省費用約240元/h。李斌等[86]通過支持向量機算法建立SCR脫硝系統成本預測模型,通過混沌粒子群算法優化后,中負低氮組脫硝所需噴氨量降低了0.013 8 t/h,度電脫硝成本減少0.538 8×10-3元/(kW·h)。崔超等[87]使用最小二乘支持向量機方法建立脫硝經濟性預測模型,尋優后建立離線最優專家數據庫,采用模糊關聯規則挖掘算法優化調整,成本降低5.75%,模型建立時間為0.562 s,優化時間為0.079 7 s,適合火電機組的在線優化控制。廖永進等[88]通過建立脫硝效率的預測模型,將SCR脫硝系統運行成本與噴氨質量流量相關聯,330.9 MW負荷下成本最低,噴氨質量流量下降6.67%。李偉等[89]通過引入系統供電煤耗和單位負荷下噴氨量建立聯合運行成本模型,經優化1 000 MW發電機組成本降低3%~5%。

綜上,在多目標優化中NOx脫除效率通常與鍋爐效率或脫硝成本共同作為優化目標,即建立多目標代價函數,但受限于函數賦權問題此類優化通常并沒有最優結果。而鍋爐效率與發電量相對應,通過并網電價可建立鍋爐效率與經濟效益的聯系;同時脫硝效率與還原劑氨氣、尿素、臭氧等用量有關,結合還原劑的投入與人工成本可對脫硝效率進行成本評估。未來以經濟性為綜合目標的優化問題將得到統一,同時在保證經濟性的基礎上控制NOx的排放,實現經濟效益與社會效益的統一。

5 結語及展望

有關NOx排放濃度的機器學習研究主要包括特征篩選、模型構建和應用場景3個方面。

1)在特征篩選方面,相關研究多采用統計學方法篩選數據,但這種方法的科學解釋性較差,不能很好地反映原數據的特征及趨勢;同時由于火電機組DCS數據具有較強非線性和耦合性,傳統的線性降維方法往往不能很好地辨識高維數據,具有一定的局限性。由于神經網絡結構在處理非線性數據時有明顯優勢,如卷積神經網絡可通過卷積和池化提煉重要數據,RF、XGBoost等機器學習算法可對數據特征進一步優化,注意力機制可以對與輸出數據關聯程度大的部分增加賦權,從而放大并提取重要特征。未來隨著機組深度調峰的不斷深入,結合注意力機制和神經網絡算法的特征篩選方法將在火電機組的時序數據中取得更好的效果。

2)在模型構建方面,建模方法主要包括支持向量機、神經網絡和集成建模等淺層學習與深度學習算法。其中支持向量機算法可通過核函數將將模型從高維空間映射到低維,有效降低模型的復雜程度;神經網絡模型的應用最為廣泛,LSTM神經網絡可以充分挖掘數據中的長期依賴關系,在利用時序性較強的鍋爐燃燒參數進行建模時有較好的效果;集成模型同時具有不同學習器的優勢,準確性和泛化能力均有較大程度的提升。但多數模型所選數據種類較為單一且多集中在平穩負荷,不能很好地反映深度調峰過程中機組的多變特性。為使模型更好應對現場運行工況的變化,所選建模數據應盡可能包含更廣的機組負荷分布范圍,即包含低、中、高多個負荷段和升負荷、降負荷的負荷變化過程的運行數據,分工況建模,應對未來更復雜多變的情景。

3)在應用場景方面,NOx排放濃度預測模型多應用于鍋爐運行參數監測與修正、燃燒優化控制、多目標優化3個方面。通過對SCR脫硝系統建立預測模型可以方便運行人員模擬并修正可調參數,同時NOx排放模型可作為軟測量手段,監測燃燒系統運行狀態,在參數失真時及時修正更新模型。但多數模型并未考慮煤質參數對預測效果的影響,不同火電機組使用的燃煤品質也有一定差異,如熱值、飛灰含碳量等能夠反映燃燒效率的煤質因素并未得到很好的分析,未來相關預測模型有必要考慮上述影響因素。在燃燒優化控制中燃煤電廠多采用PID控制且效果較差,在相關研究中提及的控制手段包括串級控制、前饋控制和模型預測控制等,但實際應用較少且研究分散,先進控制手段間的控制效果對比較少同時未能很好的結合,結合多控制方法的復合控制結構是未來的研究方向之一。在多目標優化中NOx脫除效率通常與鍋爐效率或脫硝成本共同作為優化目標,但代價函數賦權問題具有較強的主觀性,此類優化通常并沒有最優結果。而鍋爐效率與脫硝費用均與成本相關,為保證經濟效益與社會效益的統一,未來以成本為導向的綜合目標優化將有較大發展。

猜你喜歡
鍋爐神經網絡預測
無可預測
選修2-2期中考試預測卷(A卷)
選修2-2期中考試預測卷(B卷)
對干熄焦余熱鍋爐運行爆管的幾點探討
神經網絡抑制無線通信干擾探究
12CrlMoV鍋爐吊桿用鋼的開發生產實踐
不必預測未來,只需把握現在
關于鍋爐檢驗的探討
基于神經網絡的拉矯機控制模型建立
復數神經網絡在基于WiFi的室內LBS應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合