?

基于WOA優化Elman神經網絡的露天礦邊坡位移預測

2024-01-10 07:22戚鑫鑫楊逸飛高彩云
河南城建學院學報 2023年6期
關鍵詞:均方露天礦權值

高 寧,戚鑫鑫,楊逸飛,高彩云

(1.河南城建學院測繪與城市空間信息學院,河南平頂山467036;2.安徽理工大學空間信息與測繪工程學院,安徽 淮南 232001;3.高分辨率對地觀測系統河南數據與應用中心平頂山分中心,河南 平頂山 467036;4.白俄羅斯國立經濟大學,白俄羅斯 明斯克 220071)

露天開采是我國礦產資源開發的主要形式,在開采過程中形成了大量的礦邊坡工程。隨著開采深度、堆排高度和邊坡角度不斷增大,邊坡穩定性變差,由此引發的露天礦安全風險日益突出,制約了區域經濟和社會的可持續發展[1]。為降低露天礦安全風險,迫切需要建立準確的邊坡變形預測模型,及時掌握邊坡變形發展趨勢,實現提前預測、預報和預警。

露天礦邊坡始終處于復雜的動態開挖、回采過程,且影響因素復雜多變[2],因此具有明顯的“動態”特征。目前,學界關于邊坡變形預測的方法主要有時間分析、小波分析、灰色系統理論、神經網絡等[3]。其中,神經網絡因其具有較強的非線性映射能力、自主學習能力優等特點,被廣泛用于邊坡工程變形預測。如林國平[4]采用BP神經網絡對降雨條件下的邊坡變形演化發展進行了較為準確的預測;歐陽斌等[5]利用優化后的BP神經網絡對安家嶺露天煤礦1270平盤邊坡位移開展預測,預測結果與實測值較為吻合;劉利君等[6]應用RBF神經網絡對白音華二號露天礦南幫邊坡位移進行了預測;韓亮等[7]提出了基于RBF神經網絡的露天礦邊坡穩定系數預測模型。雖然BP、RBF神經網絡能夠用于露天礦邊坡位移預測,但其建模原理都是將動態時序問題轉變為適合算法本身的靜態問題,而這與露天礦邊坡工程數據的動態特性不匹配,會影響預測結果的合理性、正確性。

基于此,本文引入具有動態反饋功能的Elman神經網絡,并通過鯨魚算法(Whale Optimization Algorithm,WOA)獲取最佳權值和閾值,構建露天礦邊坡WOA-Elman預測模型,為露天礦邊坡變形預測提供一種有效途徑。

1 模型算法原理

1.1 Elman原理及特點

1990年,Jeffery.L.Elman針對語音處理問題提出了Elman神經網絡。它的輸入包括有延遲的輸入或輸出數據的反饋,被視為一種反饋動力學系統[8-10]。

Elman神經網絡的拓撲結構主要包含輸入層、隱含層、承接層和輸出層(見圖1)。輸入層的主要作用是傳輸信號;隱含層的主要作用是連接輸出層和承接層的反饋,根據權值的調整影響輸入的數據;承接層作為一步延時算子,能夠使系統對歷史狀態的數據具有較強的敏感性,以達到記憶目的,增強網絡本身處理動態信息的能力,實現動態建模;輸出層的主要作用是線性加權輸出。

圖1 Elman神經網絡拓撲結構

Elman神經網絡的非線性狀態空間表達式為

式中:x為n維隱含層的節點單元向量;f(*)為隱含層神經元的傳遞函數;w1為承接層與隱含層的連接權值;w2為輸入層與隱含層的連接權值;w3為隱含層與輸出層的連接權值;xc為n維反饋狀態向量;u為r維輸入向量;y為m維輸出節點向量;g(*)為輸出神經元的傳遞函數,是隱含層輸出的線性組合。

Elman神經網絡采用傳統的BP神經網絡修正權值。誤差函數的表達式為

式中di(k)為k時刻第i個輸出節點的期望輸出。

1.2 WOA優化Elman神經網絡

WOA是一種元啟發式優化算法,他源于對自然界中座頭鯨群體狩獵行為的模擬,如鯨魚群體搜索、包圍、追捕和攻擊獵物等過程實現優化搜索目的。相較于其他優化算法,WOA具有機制簡單、參數少、尋優能力強等優點[11-12]。

傳統的Elman神經網絡初始權值和閾值一般通過隨機賦值方式確定,缺乏全局搜索優化能力。本文采用WOA優化Elman神經網絡的權值和閾值,增強Elman網絡的訓練速度及全局尋優能力。WOA優化Elman神經網絡(WOA-Elman)算法流程如圖2所示。

圖2 WOA優化Elman神經網絡算法流程

Step1:初始化Elman神經網絡所需的參數。

Step2:初始化鯨魚數量、最大迭代次數以及參數的上下限等WOA參數。

Step3:WOA通過包圍獵物、螺旋式更新位置和搜索獵物,迭代優化Elman神經網絡,直到迭代結束,形成最佳個體,包括權值和閾值。

Step4:分析最佳個體,利用分析的權重和閾值對Elman神經網絡進行訓練,并進行預測。

2 實例建模與驗證

撫順西露天煤礦位于遼寧省撫順市,是我國第一大露天煤礦。該礦南幫邊坡巖體破損、風化嚴重。本文以2016年1月至3月采用雷達系統監測的該礦南幫邊坡位移80期數據[13]為例建立邊坡位移預測模型。

2.1 構建WOA-Elman邊坡位移預測模型

(1)數據預處理。

隨著露天礦邊坡演變階段的不同,數據的變化差異較為明顯。采用Elman神經網絡預測時,各輸入數據之間的量級差異偏大或者偏小均會影響預測結果。為了消除數量級與量綱方面的影響,防止出現神經元輸出飽和現象,本文對所有原始數據進行歸一化處理,使其均落在[0,1]區間。歸一化公式為

反歸一化公式為

式中:xmax為輸入樣本數據的最大值;xmin為樣本數據的最小值;xi、yi分別為輸入樣本歸一化前后的值。

(2)確定輸入層節點數。

Elman神經網絡輸入層節點數對預測時效影響較大。若輸入層節點數太大,Elman神經網絡的訓練時間長、結構冗余;若輸入層節點數太小,會導致Elman神經網絡不收斂。為此,本文采用滾動預測模式確定輸入層節點數。所謂滾動預測即對每一周期的訓練數據進行同步更新[14]。

以訓練樣本為例,抽取x1~xN組成第一個樣本,其中(x1,x2,…,xN-1)為自變量,xN為目標函數值,以此類推,形成訓練矩陣

本例中,分別選取3,4,5,…,20作為輸入層節點數進行實時滾動。因輸出為邊坡預測值,故輸出節點取1。不同的輸入層節點數所對應的均方誤差如圖3所示。當N取值為3時,神經網絡的均方誤差最小,因此,選擇3作為輸入層節點數。

圖3 本文輸入層節點數與神經網絡均方誤差的關系

(3)選取激活函數。

選取常用的激活函數(purelin型、logsig型及tansig型)進行兩兩組合,求出不同組合下預測結果的均方誤差(見表1)。

表1 不同激活函數組合預測結果的均方誤差

由表1可知,當隱含層函數選取purelin、輸出層函數選取purelin時,均方誤差最低。因此,本文選其作激活函數組合。

(4)確定隱含層節點數。

隱含層節點數直接影響Elman神經網絡的泛化能力。若隱含層節點數太大,則網絡訓練時間過長,會導致過學習現象,進而降低工作效率;若隱含層節點數太小,則難以建立復雜的映射關系,會導致逼近能力差。

圖4 本文隱含層節點數與神經網絡均方誤差的關系

2.2 3種模型的建模與預測性能對比分析

(1)3種模型建模。

分別采用3種神經網絡對本文實例進行建模預測。將第1~58期數據作為訓練樣本,將第59~80期數據作為測試樣本。

模型1(BP神經網絡)。輸入節點設為3,輸出節點設為1,單隱含層,隱含層節點數設為6,隱含層、輸出層的激活函數以及訓練函數分別設為tansig、purelin、trainlm,學習速率設為0.01,目標誤差設為0.000 1 mm,最大收斂次數設為2 000。

模型2(Elman神經網絡)。輸入節點數設為3,輸出節點數設為1,單承接層、單隱含層、隱含層節點數均設為8,隱含層、輸出層的激活函數均為purelin,訓練函數設為traingdx,學習速率設為0.01,動量因子設為0.01,目標誤差設為0.000 1 mm,最大收斂次數設為2 000。

模型3(WOA-Elman神經網絡)。采用WOA獲取Elman神經網絡的最佳權值和閾值。初始化Elman神經網絡所需的參數以及WOA參數(如鯨魚數量、最大迭代次數以及參數的上下限等),再通過WOA包圍獵物、螺旋式更新位置和搜索獵物操作,不斷迭代尋找最優個體(包括權值w1、w2、w3和閾值b1、b2)。WOA的維數設為105,則存放最優個體的矩陣為1×105的權值矩陣。輸入層到隱含層是8×3的權值矩陣,共24個權值。隱含層到承接層是8×8的權值矩陣,共64個權值。隱含層的閾值矩陣為8×1矩陣,共8個閾值。隱含層到輸出層是1×8的權值矩陣,共8個權值。輸出層的閾值矩陣為1×1的矩陣,共1個閾值。使用WOA得到的WOA-Elman神經網絡最優初始權值和閾值如表2所示。

表2 WOA-Elman神經網絡最優初始權值與閾值

(2)3種模型的預測性能對比分析。

采用3種神經網絡對本文實例建模時,迭代次數越少,收斂速度越快。為了驗證WOA-Elman神經網絡的收斂性,在相同的訓練樣本下,比較WOA-Elman神經網絡與Elman神經網絡的收斂速度(此處不再討論BP神經網絡的收斂性)。WOA-Elman神經網絡的進化曲線如圖5所示。迭代過程可分為3個階段:第0~10次進化迭代時,均方誤差急劇減??;第10~23次進化迭代時,均方誤差變化率逐漸減弱;第38次進化迭代后,進化曲線趨于平緩,并最終獲得最優值。

圖5 WOA-Elman模型的進化曲線

樣本相同時,Elman神經網絡在迭代108次時才達到收斂,而WOA-Elman神經網絡僅迭代38次,就達到了收斂,說明WOA-Elman神經網絡收斂速度快。3種模型對測試樣本的模擬測試結果及殘差值如表3所示。

表3 3種模型對撫順西露天礦位移的模擬測試結果mm

由表3可知,模型1的殘差絕對值最大為1.07、最小為0.02;模型2的殘差絕對值最大為0.68、最小為0.05;模型3的殘差絕對值最大為0.37、最小為0.01。這說明模型3的測試結果較穩定,波動性小。選取均方根誤差(RMSE)、平均絕對誤差(MAE)、平均絕對百分比誤差(MAPE)等指標評價各模型,評價結果如表4所示。

表4 3種模型對撫順西露天礦位移預測的測試結果精度

由表4可知,模型3的MAE、RMSE和MAPE分別為0.146 mm、0.167 mm及0.685%,與其他兩種模型的預測結果相比,具有較小的預測誤差,與模型2的MAE、RMSE、MAPE相比,分別降低了0.137 mm、0.165 mm、0.647%。因此,模型3的穩定性更好,預測精度更高,泛化能力更強。

3 結論

(1)Elman神經網絡具備動態映射功能,適應時變建模預測系統。

(2)采用WOA優化Elman神經網絡的初始閾值與權值,增強了Elman神經網絡的穩定性以及全局尋優的能力,提升了Elman神經網絡預測的穩定性。

(3)WOA-Elman神經網絡對露天礦邊坡變形預測得到的RMSE、MAE、MAPE均優于Elman神經網絡和BP神經網絡,且收斂速度快,預測結果與真實值更接近、精度更高。本文模型可為露天礦邊坡災害的防治工作提供參考。

猜你喜歡
均方露天礦權值
一類隨機積分微分方程的均方漸近概周期解
一種融合時間權值和用戶行為序列的電影推薦模型
備戰鐵礦露天礦與掛幫礦同時開采穩定性研究
露天礦山土石方量的測量及計算
CONTENTS
Beidou, le système de navigation par satellite compatible et interopérable
基于權值動量的RBM加速學習算法研究
基于多維度特征權值動態更新的用戶推薦模型研究
基于Delphi-TOPSIS法的露天礦采區接續方案優選
河北將對1881個露天礦山開展環境治理
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合