?

基于深度學習的浮選回收率預測建模研究

2024-03-02 13:01趙紅宇何桂春江長松吳為波
金屬礦山 2024年1期
關鍵詞:預測值回收率深度

趙紅宇 何桂春 石 巖 江長松 吳為波

(1.江西省礦業工程重點實驗室,江西 贛州 341000;2.江西理工大學資源與環境工程學院,江西 贛州 341000)

浮選是將有用礦物與脈石礦物分離的重要方法,但浮選過程非常復雜,對浮選指標的干擾因素眾多,如何根據礦石性質等因素前瞻性地預測浮選精礦指標,進而采用自動控制系統及時進行工藝技術參數調整,以實現礦山企業經濟效益的最大化具有重要意義。

在保證精礦品質的情況下,盡可能提高目標礦物的回收率,既是礦山企業追求經濟效益的要求,更是礦產資源高效綜合利用的要求,因此,對浮選回收率進行有效預測具有重要意義。

隨著計算機技術的飛速發展,選礦行業的智能化發展備受關注[1-2],但由于傳統機器學習方法[3-5]通常采用相對規模較小的數據進行預測建模[6],對于復雜問題和大規模數據,存在數據滯后、泛化性差及準確性低等問題[7],難以滿足智能化浮選的要求。因此,研究動態實時的浮選回收率預測技術成為智能化選礦建設的重要一環。 深度學習是一種模仿神經網絡的學習算法,用于復雜數據模式識別與預測,已在機械刀具損耗預測[8]、電力系統電網頻率預測[9]、采礦巖爆烈度分級預測[10]以及隧道掘進機凈掘進速率預測[11]等方面取得顯著進展。 在浮選領域,已有學者采用深度學習中卷積神經網絡使浮選泡沫圖像分類的準確率得到提升[12-14]、采用前饋神經網絡使浮選藥劑用量的預測精準度得到提升[15]、采用長短記憶網絡實現對精礦品位的有效預測[16]。

目前,已有不少關于傳統機器學習預測浮選回收率方面的研究成果,但是利用深度學習預測浮選回收率的相關性研究較少,尤其是大量實際工況數據下的浮選回收率預測建模。 因此,本研究以某銅礦實際工況數據為基礎,通過箱圖與濾波算法對數據進行預處理,采用傳統機器學習算法(DT、RF、SVR)、深度學習算法(DNN、CNN)構建相應浮選回收率預測模型,并通過實際生產數據對預測模型的預測精度加以驗證,得到最優預測模型,為浮選回收率實時預測及浮選過程協同優化提供技術支持。

1 模型算法與評估方法

1.1 傳統機器學習算法模型

DT 基于熵最小原理建模,是一種基于樹結構來進行決策的方法。 在訓練數據集的輸入空間中,遞歸地將每個區域劃分為2 個子區域,并決定每個子區域上的輸出值,流程如圖1(a)所示。 采用平方誤差(MSE)作為特征選擇的準則,通過計算MSE,選擇最小MSE 為最優特征與切分點[17]。 RF 由決策樹組成。 在處理回歸預測問題時,取多棵決策樹預測值的平均值作為RF 預測結果,流程如圖1(b)所示。 SVR是一種支持向量機算法的變體,與傳統的線性回歸方法不同,SVR 專注于處理非線性回歸問題,并具有一定的魯棒性和泛化能力,流程如圖1(c)所示。 SVR將輸入數據映射到高維空間,嘗試構建一個能夠將所有訓練樣本投影到高維空間中的超平面,使得該超平面上離最接近的訓練樣本點的距離最大化,同時保證間隔邊界內的樣本點盡可能滿足預測結果。 RF 模型結構如圖2 所示。

圖1 DT、RF 和SVR 算法流程Fig.1 Flow of DT,RF and SVR algorithm

圖2 RF 模型結構Fig.2 RF model structure

1.2 深度學習算法模型

1.2.1 DNN 算法模型

在DNN 模型中,輸入層和輸出層的大小由輸入輸出的維度決定。 DNN 模型神經元分層排列,網絡結構分為輸入層、隱藏層、輸出層,如圖3 所示。 其中隱藏層的深度體現網絡深度,每個神經元僅與前一層神經元相連。 神經元輸出計算方式如圖4 所示,計算公式見式(1)。

圖3 DNN 網絡結構Fig.3 DNN network structure

圖4 神經元計算方式Fig.4 Neuron computing method

DNN 模型訓練分為兩階段。 其一是前向傳播階段,數據信息從輸入層傳遞至網絡各層,經神經元變換逐級傳遞至輸出層;另一個階段為反向傳播階段,將向前傳播所得的預測值與實際值的Loss函數(式(2)),Loss通過梯度下降進行反向傳播(式(3)、(4)),逐層更新神經網絡各個層的可訓練參數(權值W和偏置b)。 學習速率參數(α)用于控制損失函數反向傳播的強度。

1.2.2 CNN 算法模型

CNN 是一種具有深度結構和卷積運算的前饋神經網絡,是深度學習代表算法之一,具有非線性數據特征的提取能力。 CNN 主要由卷積層、池化層、全連接層組成,如圖5 所示。

圖5 CNN 結構典型模型Fig.5 Typical model of CNN structure

卷積層[18]是CNN 的核心部分,具有特征提取、特征映射、局部連接、權值共享、非線性激活的特點。通過不同卷積核,按照步幅和填充,在特征平面上取與之相應位置的內積,提取輸入數據中局部特征,即為卷積運算。 不同的局部特征反映了輸入數據中不同特征的存在位置。 同時,因卷積核參數在不同位置具有共享性,從而減少了模型的參數數量,降低了數據的空間維度,增加了模型的表達能力。

池化層[18]是一種常用的操作層,用于對輸入數據進行下采樣[19](降維)和特征提取。 通過對輸入數據進行空間上的降采樣,有助于減少數據的空間維度;通過降低特征圖的維度和尺寸,有助于減少后續層的計算量;通過在每個池化窗口中選擇最顯著的特征值來提取主要特征,有助于增強數據的魯棒性。 同時,池化層具有平移不變性的特性,對輸入的平移或位置變化不敏感。 以上特征使得模型能夠在不同位置或尺度的特征上獲得相似的響應,增強了模型的位置不變性和對局部特征的抽象能力。 本研究采用一維卷積神經網絡(1D-CNN),網絡結構如圖6 所示。

圖6 1D-CNN 回收率預測模型Fig.6 1D-CNN prediction model for recovery rate

1.3 模型評估方法

采用平均絕對誤差(MAE)、均方根誤差(RMSE)、擬合優度(R2)、相對誤差(RE)對模型性能進行評估,檢驗預測模型的優劣[20-21],計算公式見式(5)~(8)。

其中,n為樣本數量,Σ 表示求和運算,分別為真實值、預測值、平均值。MAE、RMSE和RE值越小,表示模型的預測結果越接近真實值;R2越接近于1,表明模型的預測結果越貼近實際值。

2 結果與討論

2.1 數據來源與預處理

2.1.1 數據來源

本研究的數據采自江西某銅選礦廠,為160 m3浮選機選礦系列粗選工段實際生產數據,工藝流程如圖7 所示。 所收集數據時間跨度為2022 年1 月1 日到2022 年7 月1 日,共182 d,每組數據為記錄時刻前1 h 內的平均值,共4 368 組,定義的各輸入變量如表1 所示。

表1 輸入變量Table 1 Input variables

圖7 160 m3 系列粗選工段工藝流程Fig.7 Process flow of 160 m3series rough selection section

2.1.2 數據預處理

使用describe()方法對工況數據進行描述性統計分析[22],結果如表2 所示。 由于構建預測模型所收集的工況數據浮動變化較大,存在缺失值、異常值,需要將源數據進行預處理。

表2 統計分析Table 2 Statistical analysis

由表2 可知,y的count 數值數量低于4 368,可知樣本數據存在缺失值。 其中x4缺失105 個記錄。對缺省值進行剔除,此外,由表2 及四分位數的大小可對數據集各工況參數的異常值情況進行估計,11組參數中均存在異常值,需要進行異常值處理,其中x7、x8偏差最為嚴重,分別達標618.17、201.64,數據離散較為嚴重。

在對數據進行處理之前,為避免不同的浮選工況特征量之間存在量綱上的差異,對數據處理、模型訓練與優化造成困難,需將訓練數據集進行歸一化[23]。

針對異常值問題,使用箱圖和濾波處理的方法對原始數據進行處理。 首先,使用箱圖檢測異常值,找到數據集中的低密度區域,采用截斷剔除的方式處理;其次,將處理后數據進行濾波處理,可去除噪聲、平滑數據和提取數據特征。 這種聯合使用的方法可以提高數據的可靠性、可視化和分析能力,為后續的工況分析、建模提供更好的基礎。

工況數據經缺失值與異常值的剔除,數據集由4 368 條記錄變為3 344 條記錄。 根據濾波算法對輸入數據進行處理,去除異常波動值,使數據更加可靠、穩定、平滑,減少噪聲對數據分析處理的影響,有助于提取數據特征。

2.2 浮選預測的傳統算法模型比較分析

基于DT、RF 和SVR 算法,結合工況數據,構建了DT、RF 和SVR 回收率預測模型。 對模型進行多次迭代運算,探究了DT、RF 和SVR 預測模型的最優參數,如表3 所示。 通過訓練集對模型進行訓練,采用測試集對模型進行驗證。 各回收率預測模型評估指標如表4 所示,預測效果如圖8 所示。

表3 DT、RF 和SVR 回收率預測模型參數設定Table 3 Parameter settings for DT、RF and SVR prediction model parameter setting

表4 基于傳統機器學習算法的回收率預測模型評價指標Table 4 Evaluation metrics for a recycling rate prediction models based on traditional machine learning algorithms

圖8 基于傳統機器學習算法的回收率預測模型預測值分布Fig.8 Prediction value distribution of recycling rate prediction model based on traditional machine learning

分析表4、圖8 可知,基于傳統機器學習算法的回收率預測模型中,DT、RF 和SVR 回收率預測模型的R2分別為0.501、0.782 和0.759,其中DT 預測模型的R2最小。 結合圖8(a)可知,DT 模型回收率預測值分布較離散,與真實值的線性關系不顯著,擬合效果較差,其原因為DT 模型過于簡單,單顆決策樹無法對多維數據進行有效劃分。 RF 預測模型和SVR預測模型的R2均大于0.7,預測效果較好。 但二者MAE指數大于1、RMSE指數大于1.5,結合圖8(b)和圖8(c)可知,RF、SVR 模型的回收率預測值分布較集中,與真實值具有顯著的線性關系,誤差基本分布于±4%范圍內。 可見,RF、SVR 模型的預測效果較好,但個別預測值仍存在較大預測誤差。

2.3 浮選預測的深度學習算法模型比較分析

由基于傳統機器學習算法的回收率預測模型結果可知,DT、RF 和SVR 模型的效果并不理想,采用深度學習算法中的DNN 和CNN 算法,構建DNN 和CNN 回收率預測模型。 經模型的迭代訓練,探索最優的預測模型參數,各參數如表5 所示。 基于深度學習算法的回收率預測模型的評估指標如表6 所示,預測效果如圖9 所示。

表5 DNN、CNN 預測模型參數設定Table 5 DNN、CNN prediction model parameter setting

表6 基于深度學習算法的回收率預測模型評價指標Table 6 Evaluation indicators of recycling rate prediction model based on deep learning algorithms

圖9 基于深度學習算法的回收率預測模型預測值分布Fig.9 Prediction value distribution of recycling rate prediction model based on deep learning algorithms

由表6 和圖9 可知,DNN 和CNN 模型的R2分別為0.854、0.907,均大于0.85,擬合效果較好。 DNN和CNN 回收率預測模型的預測值分布在實際回收率的兩側,分布在±4%誤差范圍外數據點較少,與傳統機器學習的回收率預測模型相比,DNN 和CNN 模型回收率預測值更接近實際值。 其中,與RF 模型相比,DNN 模型的評價指標R2、MAE和RMSE分別提升了9.2%、23.6%和18.1%;CNN 模型的評價指標R2、MAE和RMSE分別提升了16. 1%、42. 3%和35.0%。說明基于深度學習算法的DNN 和CNN 回收率預測模型均能取得較好預測效果。

相較于DNN 模型,CNN 模型回收率預測值分布更為集中,DNN 模型的MAE為0.797,RMSE為1.322,CNN 模型的MAE為0. 601,RMSE為1. 049。 在MAE、RMSE和R2上CNN 模型均優于DNN 模型,說明在回收率預測效果上,CNN 模型優于DNN 模型。

2.4 各算法模型比較分析

為了進一步驗證各預測模型的預測效果,分別對各回收率預測模型進行預測誤差和誤差準確率對比分析,結果如表7、表8 所示。

表7 各回收率預測模型預測誤差統計分析Table 7 Statistical analysis of prediction errors in various recovery rate prediction models %

表8 各回收率預測模型預測命中率Table 8 Each recycling rate prediction model predicts the hit rate %

由表7 可知,在基于傳統機器學習算法的回收率預測模型中,SVR 模型的MAX、STD最低,優于DT、RF模型,說明SVR 模型較為穩定,但MEAN并非最優。同時,結合表8 可知,SVR 模型的±2%誤差命中率最低,±4%誤差命中率最優,可知SVR 模型在±4%誤差范圍內模型比較穩定,而在±2%誤差范圍內精度欠佳。 相較于SVR 模型,RF 模型在MAX和STD上效果欠佳,但兩模型相差較小,而在MEAN上RF 模型優于SVR 模型。 RF 模型在±2%誤差范圍精度最佳,±4%誤差范圍RF 模型與SVR 模型相差僅1.3 個百分點,表明RF 模型較為穩定,精度較高,但RF 模型的MAX為11.6%,說明該模型存在偏差較大的預測值。 其原因是RF 模型和SVR 模型對數據的特征敏感程度不同,RF 模型為復雜的模型,易受訓練數據中噪聲和細節的影響。 綜上所述,認為在基于傳統機器學習算法回收率預測模型中,RF 預測模型預測精度最佳。

基于深度學習算法的回收率預測模型擬合效果優于基于傳統機器學習算法的回收率預測模型。 由表7 可知,DNN 模型和CNN 模型的MEAN分別為1.1%、0.8%,預測誤差較小,均優于傳統機器學習算法模型。 CNN 模型的STD數值最小,而DNN 模型的STD略高于SVR 模型的。 DNN 模型和CNN 模型的MAX分 別 為10. 5%、 9. 5%, 均 高 于 SVR 模 型(9.2%),說明對于MAX指標,DNN、CNN 模型均非最優。 結合表8 可知,DNN 模型和CNN 模型在±2%誤差命中率分別為91.6%、90.6%,±4%命中率分別為96.6%、98.1%,均優于傳統機器學習算法模型。 綜合MEAN、MAX、STD指標,DNN 模型與SVR 模型雖在STD指標上相差不大,但在MEAN上,DNN 明顯優于SVR 模型,表明DNN 模型預測更為穩定,但存在少數預測偏差較大的預測值。

基于深度學習算法的回收率預測模型中,CNN模型在預測效果上優于DNN 模型。 由表7 可知,CNN 模型的MEAN、MAX、STD指標均略優于DNN 模型。同時,由表8 可知,DNN 與CNN 模型在±2%誤差分別為91. 6%、90. 6%,± 4% 誤差分別為96. 6%,98.1%。 說明DNN 模型預測精度上略優于CNN 模型,而CNN 預測具有更好的穩定性。

模型的構建時間也是評價模型的重要指標,但往往因計算機硬件軟件的差異有所變化,本模擬所使用的計算機配置如下: CPU i7-6500U; 主板戴爾0K64R6;內存16.00 GB(1 600 MHz 三星);硬盤240 GB(希捷);顯卡AMD Radeon(TM) R5 M335;系統Windows 10(64 位);Python 3. 8(32-bit);Pycharm Community Edition 2021。 訓練集與測試集運行時間如表9 所示。

表9 各回收率預測模型訓練集與測試集運行時間對比Table 9 Comparison of running time between training and testing sets of various recovery rate prediction models

由表9 可知,訓練集所需運行時間隨著模型復雜程度的增加而增加,各模型測試集所需運行時間均小于1 s。 在浮選回收率的預測中,測試集的數據為當前時刻5 s/10 s/30 s/60 s 內的工況信息,數據量較小。 模型在小數據集下,均為秒級響應。

在現實工況下,浮選流程必然產生海量數據,隨著數據量的增加,對模型的訓練時間必然增加,現將訓練集與測試集擴大100 倍,訓練集267 500 條,測試集66 900 條,代入DNN、CNN 模型中,所需運行時間如圖10 所示。

圖10 百倍數據集下各回收率預測模型耗時Fig.10 Time consumption of various recovery rate prediction models on a hundred fold dataset

由圖10 可知,CNN 模型訓練時間約為DNN 模型的5 倍,而兩模型測試集耗時相差約為1 s,表明DNN 模型后期維護成本優于CNN 模型。 同時,隨著數據集的增加,DNN 模型的預測效果有所提升,最優模型下,DNN 模型的R2為0.891,與CNN 模型的R2(0.907)僅相差0.016,表明在大數據集下兩模型回收率預測效果相差并不顯著。

3 結 論

(1)從浮選工況數據的特征出發,首先對工況數據采用了箱圖和濾波結合的處理方法,其次分別采用DT、SVR 和RF 這3 種傳統機器學習算法,對浮選回收率進行預測建模,構建多種算法預測模型。 結果表明,傳統機器學習算法模型中RF 預測精度最佳,±2%誤差區域80.1%,±4%誤差區域為93.0%。

(2)基于深度學習算法的回收率預測模型擁有更好的準確度。 DNN 和CNN 預測模型的R2分別為0.854、0.907,±2%誤差區域命中率分別為91. 6%、90.6%,±4%誤差區域命中率分別為96.6%、98.1%。深度學習模型預測效果均優于傳統機器學習算法模型,采用深度學習算法建立銅礦的浮選回收率模型能夠獲得較好的預測精度。

(3)針對深度學習算法的回收率預測模型首選DNN 模型。 單從預測效果來看,CNN 模型略優于DNN 模型;從模型運行耗時來看,由于CNN 算法復雜度較大,訓練耗時較長,而兩者測試耗時均為秒級響應;通過將數據集擴大,發現DNN 模型的R2與CNN 模型的僅相差0. 016,CNN 模型預測效果并不顯著,且以±2%誤差區域命中率為依據,則DNN 模型預測精度略優于CNN 模型。

猜你喜歡
預測值回收率深度
加拿大農業部下調2021/22年度油菜籽和小麥產量預測值
不同形態氮肥對棉花15N回收率和產量的影響
±800kV直流輸電工程合成電場夏季實測值與預測值比對分析
全國農膜回收率年底前達到80%以上
深度理解一元一次方程
法電再次修訂2020年核發電量預測值
深度觀察
深度觀察
深度觀察
提高梅山鋼鐵企業生活區電費回收率的研究實踐
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合