?

基于量子遺傳模糊推理系統的煤與瓦斯突出預測模型

2023-12-13 13:25郭金棟
華北科技學院學報 2023年6期
關鍵詞:染色體遺傳算法量子

郭金棟

(淮南職業技術學院 能源工程學院,安徽 淮南 232001)

0 引言

煤與瓦斯突出評價是礦井煤巖動力災害防控工作的基礎,準確預測煤與瓦斯突出及其危險程度已成為礦井安全生產亟待解決的重大問題。隨著數據理論和人工智能的快速發展,基于數據驅動的機器學習方法及其應用取得了突破性成果,神經網絡[1-2]、支持向量機[3-4]、極限學習機[5]等分類器廣泛應用于煤與瓦斯突出災害的分類識別與預測。神經網絡具有較強的非線性映射能力和自學習能力,但其網絡結構的確定較為困難,網絡結構設計復雜時網絡訓練容易出現過擬合,網絡結構簡單又可能導致欠擬合而出現不收斂現象;BP網絡采用梯度下降學習算法,容易陷入局部最優,這些問題都影響著BP網絡的預測效果。支持向量機解決多分類問題時需要構造多個復合分類器,訓練規模較大樣本的計算成本較高,且SVM核函數和懲罰參數的合適取值較為困難。極限學習機的參數隨機生成導致了結果的隨機性,影響預測準確性。為了提高預測準確率和運行效率,不少研究者使用群智能仿生算法優化這些分類器的參數。文獻[1]用遺傳算法優化BP神經網絡的權值和閾值;文獻[2]將免疫算法中基于繁殖概率的抗體多樣性保持機制引入量子遺傳算法,以此對BP網絡隱含層數和連接權值進行尋優;文獻[3]將等距映射算法與優化加權向量機耦合算法相結合,建立了DDICS-WLS-SVM預測模型,預測精度有所提高;文獻[5]提出自適應天牛須算法與極限學習機相結合的預測模型,模型的泛化能力和預測精度效果較好。由于煤與瓦斯突出形成機制的復雜性、機器學習算法本身的弊端以及樣本數據特征空間分布的混疊性等問題,煤與瓦斯突出預測的可靠性和準確率并不高,因而非常有必要對煤與瓦斯突出智能預測模型進行深入研究。

自適應神經模糊推理系統(Adaptive Neuro-Fuzzy Inference System,ANFIS)是將神經網絡與模糊推理結合在一起的混合系統,ANFIS的模糊推理不依賴于對象模型,系統具有良好的可解釋性及強大的學習能力,可以很好地處理非線性問題。ANFIS采用反向傳播算法與最小二乘法進行參數調整,學習算法對初始狀態及參數非常敏感,在初始解較差或不合理情況下收斂較慢,而且很容易陷入局部極值。本文使用改進的實數編碼量子遺傳算法改善ANFIS的性能。經典量子遺傳算法[2,6-9](Quantum Genetic Algorithm,QGA)用量子位編碼表示染色體,量子染色體可以表達多個態的疊加,通過量子位的觀測得到二進制編碼的染色體,用量子旋轉門更新種群,實現對目標問題的優化求解。在求解組合優化問題時,QGA相較傳統遺傳算法具有更強的全局尋優能力和更快的收斂速度,算法表現出更優良的性能,但QGA不適合求解連續空間數值優化問題[7-9]。為此,不少學者提出了實數編碼量子遺傳算法(Real-coded Quantum Genetic Algorithm,RQGA),并從理論上分析證明了RQGA算法具有全局收斂性[7-9]。文獻[7]提出雙鏈量子遺傳算法,該算法利用目標函數的梯度信息計算量子旋轉門的旋轉角大小,通過構造量子位到實數的映射關系得到實數種群,量子位與實數的映射關系為縮放變化,解碼精度不能得到保證,算法仍不可避免地會出現收斂慢和易陷入局部最優等問題。文獻[8]通過量子位的觀測得到實數編碼的染色體,用量子旋轉門更新染色體,算法通過模擬量子系統中態疊加性的強不確定性,使算法在迭代過程均有概率搜索整個解空間。RQGA算法可以有效避免經典QGA算法染色體編碼轉換的問題,減少尋優的計算復雜度,在連續函數的優化中表現出了較好的性能。然而在多峰連續函數的優化中仍然存在搜索速度慢,解的搜索精度相對低,保持種群多樣性差,易陷入局部極值等問題。為改善RQGA算法的性能,不少研究者針對文獻[7]提出了許多更新策略,但對文獻[8]提出的RQGA算法的深入研究相對較少。針對煤與瓦斯突出具體工程問題,本文在文獻[8]基礎上,提出一種融合多種策略的改進實數編碼量子遺傳算法(Improved Real-coded Quantum Genetic Algorithm,IRQGA)。IRQGA采用拉丁超立方抽樣方法初始化量子種群,加強個體在解空間的均勻化分布;用凸型遞減函數對量子旋轉門轉角大小進行自適應動態調整,增強算法的適應性;借鑒禿鷹搜索算法[10]的阿基米德螺線空間搜索機制對量子染色體進行變異,加強個體與全局最優個體和種群均值之間的信息交流,以此提高尋優能力;用差分變異提升最差個體的進化能力,保持種群多樣性;用高斯-柯西變異增強算法跳出局部搜索空間的能力。用量子位的概率幅對一階Sugeno型模糊推理系統的前件參數和后件參數進行編碼,通過IRQGA對模糊推理系統搜尋最優參數,對實例數據進行仿真實驗,以平均絕對誤差(MAE)均值、均方誤差(MSE)均值、均方根誤差(RMSE)均值和預測準確率作為評價指標,驗證了IRQGA-ANFIS模型的可靠性和準確性,為煤與瓦斯突出預測提供了一種行之有效的方法。

1 煤與瓦斯突出ANFIS預測模型

ANFIS結構共分為5層,如圖1所示。系統的輸入神經元由煤與瓦斯突出的影響因素變量zi(i=1,2,…,5)組成。第1層計算輸入分量zi屬于各語言變量值模糊集合的隸屬度,實現各輸入變量值的模糊化處理,本文選用高斯隸屬度函數。第2層計算每條規則的觸發強度。第3層計算歸一化的規則強度。第4層計算每條規則的加權輸出。第5層為煤與瓦斯突出危險程度輸出。模糊推理系統由前件網絡和后件網絡兩部分組成,系統規則庫中的第k個模糊規則可用以下形式表示:

圖1 自適應神經模糊推理系統結構示意圖

(1)

其中,K為模糊規則總數;pk0,pki(i=1,2,…,5)為結論參數。

模糊規則的獲取是ANFIS的關鍵,模糊規則數過多會導致系統結構復雜,網絡易出現過擬合;規則數過少則系統逼近性能不佳。文獻[11-12]提出從樣本數據直接提取模糊規則的方法,該方法簡單易用且無需了解對象內在機制,在一定程度上改善了模糊推理系統的準確性與可靠性?;跀祿寗拥哪:巹t提取步驟如下:

(1) 第一個輸入的樣本數據產生一條模糊規則,并定義相應的高斯隸屬度函數。圖1第一層高斯函數參數的確定方法:將訓練樣本數據的方差作為高斯函數的寬度,第一個輸入樣本數據作為模糊子集上的高斯函數的中心。

(2) 將訓練樣本數據依次進行模糊化,并計算第一條規則的觸發強度,若樣本數據產生的觸發強度之和小于設定的覆蓋率閾值,則產生一條新模糊規則,并按步驟(1)在圖1第一層創建指定參數的隸屬度函數。

(3) 遍歷整個樣本數據集后,按步驟(1)和(2)得到輸入變量在論域上的模糊子集個數。

(4) 根據式(1)的線性表達形式,用最小二乘法求解后件網絡參數的初始解。

(5) 用訓練樣本與測試樣本的ANFIS預測性能進行規則篩選,確定最終的ANFIS模糊規則數,即可確定ANFIS網絡結構。

用ANFIS預測煤與瓦斯突出的另一個關鍵問題是尋找最佳的前提參數集和結論參數集,本文采用改進的實數編碼量子遺傳算法進行尋優。

2 改進實數編碼量子遺傳算法

2.1 實數編碼量子遺傳算法

RQGA的量子染色體用量子位的概率幅表示,一條具有m位量子位的染色體編碼可表示為

(2)

RQGA對染色體的每個量子位概率幅進行測量,以獲得一組用二進制表示的確定解,文獻[8]將這組確定解用于量子旋轉門旋轉角的判定,并按式(3)得到求解問題的實數編碼染色體。

(3)

2.2 拉丁超立方抽樣初始化種群

2.3 量子旋轉角改進策略

量子旋轉門的旋轉角度通常在0.001π~0.05π范圍內取固定值,若旋轉角取值較大,量子個體以較快速度聚集,算法容易出現“早熟”現象;若角度較小又會使算法收斂速度太慢甚至出現不收斂情況。為最大程度發掘量子旋轉門的尋優能力,本文用式(4)凸型遞減函數對旋轉角度進行自適應動態調整。

(4)

式中,θmin,θmax分別為0.001π和0.05π;T為最大迭代數。

2.4 阿基米德螺旋線空間搜索機制[10]

RQGA的量子旋轉門是以全局最優個體為指導來更新染色體,導致迭代后期種群多樣性變差,算法陷入局部極值。文獻[7]使用量子非門實現染色體變異,但量子位的兩個概率幅簡單互換,并不能很好地解決早熟收斂和增加種群多樣性。本文借鑒禿鷹搜索算法中禿鷹在俯沖捕獲獵物階段以阿基米德螺旋線方式加速飛向最優位置去捕獲食物的策略對量子染色體進行變異,改進策略同時考慮了普通個體與全局最優個體和種群個體均值之間的信息交流。螺旋飛行軌跡采用極坐標數學模型表示,染色體按式(5)~式(12)進行變異更新。

(5)

(6)

(7)

(8)

xr(j)=r(j)×sinh(γ(j))

(9)

yr(j)=r(j)×cosh(γ(j))

(10)

r(j)=γ(j)

(11)

γ(j)=a×π×erand

(12)

2.5 差分變異策略

差分變異是差分算法中借助種群個體間的差異來對個體進行擾動的操作。最差個體差分變異策略通過追蹤種群內最佳個體和全局最優個體進行變異更新,這種變異操作兼顧種群最優個體附近解空間以外區域的搜索,使群體保持較好的多樣性,增強勘探能力;進化后期,隨著局部搜索能力的不斷增強,算法能以更高的精度逼近全局最優解。量子染色體按式(13)進行差分變異。

(13)

2.6 高斯-柯西變異策略

算法在迭代中后期種群多樣性逐漸降低,種群容易被局部極值控制,出現無效搜索。高斯變異和柯西變異是群智能仿生算法常用的變異操作。一維標準柯西分布的概率密度函數與正態分布的密度函數接近,但柯西分布具有較高的兩翼概率特性,其分布與水平軸接近時比較平緩,變化速度比高斯分布更慢,且在原點附近的峰值比高斯分布更小,因此高斯變異具有較強的局部發掘能力,而柯西變異具有較強的全局探索能力。為充分發掘種群當前最優個體和全局最優個體的信息,在算法迭代前期,用柯西變異進行大范圍搜索,增強算法的全局搜索能力;在算法的中后期,利用高期變異進行局部開發。

(14)

(15)

式中,η=t/T為變異系數;N(0,δ2)為滿足高斯分布的隨機數;C(0,δ2)為柯西分布生成的隨機數,柯西分布隨機變量生成函數為η=tan[(ξ-0.5)π]。

2.7 算法流程

輸入:種群規模N、最大迭代次數T、量子染色體長度m,ANFIS待優化參數取值范圍等。

輸出:最優染色體及其適應度值。

(1) 用拉丁超立方采樣方法初始化種群Q。

(2) 按文獻[8]對種群實施一次測量得到實數編碼染色體,將ANFIS輸出的均方誤差MSE作為目標函數,計算個體適應度,進行適應度評價,找到并記錄最優適應度值和最優染色體。

(3)while(t

(4) 量子旋轉門更新染色體。

(5) 用式(5)~式(12)對量子染色體進行變異更新,對更新后個體進行一次測量并計算個體適應度,若更新后的個體優于原個體,用新個體替換原個體,否則保留原個體。

(6) 用差分變異策略對種群最差個體執行變異操作,對更新后的個體進行一次測量并計算個體適應度,若更新后的個體優于原個體,用更新個體替換原個體,否則以0.5的概率對其部分維度進行均勻初始化變異,變異的維度均為隨機選擇的若干個維度。

(7) 若全局最優個體連續g代無變化,對種群最優個體實施高斯—柯西變異,若更新后的個體優于原個體,用更新個體替換原個體。

(8)t=t+1

(9) end while

3 實例應用

為驗證改進實數編碼量子遺傳算法優化自適應神經模糊推理系統(IRQGA- ANFIS)預測模型的可靠性和準確性,以淮南礦區煤與瓦斯突出事故的部分樣本數據為研究對象,進行煤與瓦斯突出危險程度預測。

出于多分類識別和類間樣本數量均衡考慮,根據煤巖體拋出的質量將煤與瓦斯突出強度劃分為兩類,即拋出煤巖體質量小于100t/次為一般突出,大于100t/次為嚴重突出。據此,將煤與瓦斯突出危險程度劃分為三個等級,即無突出、一般突出、嚴重突出,對應ANFIS的三種輸出結果,即‘0’表示無突出,‘1’表示一般突出、‘2’表示嚴重突出。

數據預處理后獲得84組樣本數據,數據來源于文獻[4]。其中嚴重突出樣本25個,一般突出29個,無突出樣本30個,不同類別的樣本基本均衡。從中抽取18個樣本作為預測樣本,預測數據見表1,表中Z1~Z5分別代表瓦斯含量(m3/t)、瓦斯壓力(MPa)、孔隙率(%)、煤的堅固性系數和瓦斯放散初速度(mmHg)等輸入變量。

表1 煤與瓦斯突出預測數據及危險程度

根據基于數據驅動的模糊規則提取方法,不同覆蓋率閾值對應的模糊規則數及ANFIS預測性能對比見表2。從表2可知,ANFIS的模糊規則數為7條時,測試樣本的識別準確率為77.78%,測試樣本的MSE最小,此時訓練樣本的MSE和識別準確率相對較好,因此選取7條模糊規則。圖1中第一層每個輸入變量的論域上的模糊子集個數為7個,待優化的ANFIS網絡參數的數量為112個。建模及仿真在MatlabR2016平臺實現。

3.1 不同優化算法的性能比較

為了對比分析不同訓練算法的優化性能,分別用量子粒子群(QPSO)、RQGA和IRQGA優化ANFIS網絡參數。算法的最大迭代次數均設為40,種群規模設為20,用拉丁超立方采樣方法初始化種群。IRQGA算法的控制螺旋運動軌跡a設為5,移動強度c1和c2均設為2。三種算法分別獨立運行30次,30次訓練的平均收斂曲線如圖2所示。

圖2 不同算法的平均收斂曲線

由圖2可知,三種算法在迭代初期的收斂都比較迅速,IRQGA后期搜索到的最優個體的平均適應度值明顯優于其他兩種算法。IRQGA、QPSO和RQGA對ANFIS訓練的平均適應度值分別為0.2944、0.3281和0.5018,IRQGA平均迭代12次后就能尋找到RQGA的目標值,說明融合多種進化策略的IRQGA算法有效地提升了基本RQGA的性能。30次獨立運行中IRQGA搜索到的適應度值均低于QPSO的0.3281,且平均迭代26次就可搜索到0.3288。由此可知,高維函數優化中,IRQGA具有較強的尋優能力。

3.2 預測結果分析

分別用ANFIS、QPSO-ANFIS、RQGA-ANFIS、IRQGA-ANFIS對預測樣本進行煤與瓦斯突出危險識別,四種預測模型的平均正確預測率分別為77.22%、83.33%、83.33%和94.44%,預測結果見表3。IRQGA-ANFIS對無突出樣本的準確預測率達100%。

表3 煤與瓦斯突出預測結果

為評估模型的泛化能力,用30次仿真得到的平均絕對誤差(MAE)均值、均方誤差(MSE)均值、均方根誤差(RMSE)作為評價指標,實驗結果見表4。

表4 不同模型預測效果對比

由表4可知,IRQGA-ANFIS在三個評價指標上均有更好的表現。相比QPSO-ANFIS和RQGA-ANFIS,所建模型的MAE均值分別降低了0.0245和0.1184,MSE均值分別降低了0.0162和0.1849,RMSE均值分別降低了0.0172和0.1721。綜上可知,IRQGA-ANFIS模型具有較高的預測準確率和預測性能。

4 結論

(1) 將禿鷹算法的阿基米德螺線空間搜索機制、高斯-柯西變異和差分變異策略引入基本量子遺傳算法,提出改進的實數編碼量子遺傳算法IRQGA,仿真結果表明IRQGA在高維復雜問題優化中比實驗對比算法QPSO和RQGA具有更好的優化性能。

(2) 采用基于數據驅動的模糊規則提取方法確定了ANFIS模糊規則數和網絡初始參數,降低了ANFIS網絡結構設計的復雜度。用改進實數編碼量子遺傳算法搜索模糊推理系統的最優前提參數和結論參數,提出了煤與瓦斯突出危險程度IRQGA-ANFIS預測模型。實例數據的仿真結果表明,IRQGA-ANFIS模型的MAE均值、MSE均值和RMSE均值都優于QPSO-ANFIS和RQGA-ANFIS模型,IRQGA-ANFIS模型的多分類識別準確率達到94.44%,IRQGA-ANFIS具有更好的非線性映射能力和預測效果,這對煤與瓦斯突出危險預測具有重要的現實意義,同時對其他領域的復雜評價系統也有很好的借鑒意義。

猜你喜歡
染色體遺傳算法量子
2022年諾貝爾物理學獎 從量子糾纏到量子通信
決定未來的量子計算
新量子通信線路保障網絡安全
多一條X染色體,壽命會更長
為什么男性要有一條X染色體?
基于自適應遺傳算法的CSAMT一維反演
一種基于遺傳算法的聚類分析方法在DNA序列比較中的應用
基于遺傳算法和LS-SVM的財務危機預測
一種簡便的超聲分散法制備碳量子點及表征
能忍的人壽命長
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合