?

基于AdaBoost分類器的電煤價格預測

2024-04-10 05:53牟曉霞
中國儲運 2024年3期
關鍵詞:電煤決策樹分類器

文/牟曉霞

為適應我國能源結構和市場需求變化,提供決策參考,預測電煤價格至關重要。本文從煤炭供給、消耗、行業發展、新能源、氣溫等方面收集了200個影響因素,建立基于AdaBoost分類器的隨機森林和決策樹模型對全國及山西地區的未來1、2、3用電煤價格進行預測。結果顯示,預測模型效果優于隨機森林、極端隨機樹、線性回歸和決策樹模型,預測結果可為煤炭消耗型企業購煤決策提供參考。

1.引言

近年來,隨著國家能源結構調整、供給側改革的深入推進,煤炭消費量有所下降,但我國“富煤、貧油、少氣”的國情和所處的發展階段并未改變,煤炭在我國能源消費中仍占主導地位。在維護能源安全和托底保供方面,煤炭仍發揮著“壓艙石”的作用。預測電煤價格有助于理解突發事件對價格的影響機理,為煤炭企業決策提供參考。

2.研究方法與數據處理

本文綜合考慮了200個影響電煤價格的因素指標,確定影響因素指標包括:各地區和各行業煤炭產量、用電量、發電量、生鐵產量、水泥產量和氣溫,煤產品進口量,電廠供、耗、存。本文數據源于Wind數據庫,選取全國以及山西地區的電煤市場價,以2013年10月至2022年1月為時間窗口,進行預測和分析。利用Excel對原始數據進行清理,綜合分析皮爾遜系數結果、格蘭杰因果檢驗結果和特征重要性三個結果,剔除相關性和顯著性較低的指標,完成變量的篩選。

3.煤價預測模型構建

本文采用Adaboost分類器,訓練多個弱分類器,并將它們集成為一個更強的最終分類器,構建基于六種模型的預測模型,包括AdaRF(自適應隨機森林)、Adatree(自適應樹)、RF(隨機森林)、ExtraTrees(極端隨機樹)、LR(線性回歸)和Tree(決策樹)。本文將交叉驗證與網格搜索相結合,以MSE最小化為參數優選的目標,避免抽樣隨機性對模型性能的影響。

4.預測結果與模型評估

以全國和山西省的電煤價格為研究對象,對全國以及山西省的月度電煤價格和各影響因素的指標值進行收集。綜合考慮全國及山西的六種預測方法的結果,得到全國及山西的未來三個月的電煤價格,全國1月后572.96元/噸,2月后573.52元/噸,3月后574.46元/噸,山西1月后486.87元/噸,2月后488.17元/噸,3月后489.55元/噸。當電煤消耗量平穩的狀態下,當預測到電煤價格上升時,地區甚至國家應該增加短期內購買量,采購燃料補充庫存。在電煤價格預測的指導下,保證每次的燃料采購價格最優,年度燃料采購價格最小,年度燃料庫存及損耗成本能夠得到有效地降低。為評價模型的預測性能,選擇均方差(MSE)、平均絕對誤差(MAE)作為預測評價指標。根據圖2的全國電煤價格預測模型效果對比,Adatree的預測效果最佳,各項誤差值均相對最??;AdaRF的預測效果次之,各項誤差值的較小。由于收集數據的限制,山西電煤預測模型效果與全國的模型相比較差,但是預測穩定性達到較高水平。

圖1 全國(左)和山西(右)預測模型誤差

5.結論

本文建立AdaRF、Adatree、RF、ExtraTrees、LR、Tree六種模型,對全國和山西的1、2、3月后的煤價進行短期預測。通過實驗對比各模型的預測誤差,證明該方法能夠根據各個影響因素的指標值對電煤價格進行有效預測,且預測準確率較高。本文對優化燃料采購,降低燃料庫存及損耗成本提供參考。

猜你喜歡
電煤決策樹分類器
4月份湖北省統調火電廠電煤消耗量同比下降22.6%
5月份湖北省統調電廠耗煤量同比下降14.3%
7月份湖北省統調電廠耗煤量同比增長58.1%
一種針對不均衡數據集的SVM決策樹算法
決策樹和隨機森林方法在管理決策中的應用
BP-GA光照分類器在車道線識別中的應用
加權空-譜與最近鄰分類器相結合的高光譜圖像分類
結合模糊(C+P)均值聚類和SP-V-支持向量機的TSK分類器
基于決策樹的出租車乘客出行目的識別
基于肺癌CT的決策樹模型在肺癌診斷中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合