?

基于隨機森林的配網物資需求預測

2016-05-30 09:17李俊妮歐陽昱郭陽
企業技術開發·中旬刊 2016年11期
關鍵詞:隨機森林需求預測

李俊妮 歐陽昱 郭陽

摘 要:目前國網公司按照層層匯總物資需求的方式開展配網物資需求采購計劃,需求計劃生產周期較長,且采購準確度較低,對生產物資的購置、供應計劃、物資領用等環節產生不利影響,并增加了配網物資采購成本。文章關聯配網工程項目特征與物資品類需求,通過啞變量的形式構建訓練樣本,基于隨機森林算法對配網物資采購需求進行預測,提升預測精度,有效指導工程建設及生產計劃的合理安排,降低采購成本。

關鍵詞:隨機森林;配網物資;需求預測

中圖分類號:TKl21 文獻標識碼:A 文章編號:1006-8937(2016)32-0136-02

1 研究背景

國網公司總部物資部自2013年以來開展配網項目物資集中框架招標采購,實現協議庫存管控模式,目前每年在3月、9月開展兩次農配網物資需求計劃安排工作,采用由下至上的工作模式,從生產一線開始對采購需求進行統計、估算、上報,經由地市公司、省公司層層匯總形成總體采購需求,由總部物資部和物資公司共同實施采購,涉及大量的審核、匯總工作。

因此,物資采購需求的產生周期較長,且省市公司物資部門普遍反映,根據預測結果框架招標采購的物資與配網工程建設實際需要的物資在數量上有較大的偏差。同時,公司配網建設所需的物資體量較大,對物資需求預測工作主要基于經驗,缺乏農配網需求預測模型支持,導致項目建設所需物資不能按照工程要求準確到位,為了防止項目建設延期,往往過量上報物資需求,然而物資數量過多又會占用公司資金、造成庫存物資積壓的風險。因此,不準確的采購計劃會對物資的采購、供應、暫存和領用等產生影響,導致配網物資整體管理效率降低。

隨著國網公司信息系統的完善和業務數據的不斷積累,可以通過歷史數據構建農配網項目屬性及建設內容與所需物資之間的映射關系,并基于下一年度的項目建設計劃,從總體角度,分品類預測需要采購的物資數量,提升配網物資需求預測準確率,為企業物資采購批次計劃執行提供科學依據,有效指導物資供應計劃的合理安排,降低采購和庫存成本、提高生產建設的精益化水平。

2 模型原理

為了依據農配網項目的建設計劃預測物資采購需求,首先要提取農配網工程項目的項目特征值,以標記各工程項目的建設屬性和建設內容,隨后需要在已投產的項目記錄基礎上,構建工程建設特征和建設內容與其領用物資品類、數量之間的映射關系,最后通過學習及模擬工程建設特征和建設內容與物資領用品類、數量之間的函數關系來構建隨機森林預測模型。具體的模型構建原理,如圖1所示。

在提取項目特征值過程中,首先需要根據歷史投產的配網工程項目名稱創建配網專業詞典,然后使用文本挖掘工具對項目名稱中包含的重要特征值進行分詞,隨后根據各工程項目的物資領用信息歸類合并具有相似性質的工程項目,固化成44個工程類型。具體詞典創建原理和分詞過程參見項目組前期研究成果(參見文章《配網工程項目詞庫創建及分詞探索》)。在分詞之后,將項目特征結合地市信息、項目類型、下達預算和歷史項目中不同物料小類的物料領用總量共同作為隨機森林預測模型的輸入空間。

采用2013、2014年領料記錄完整的歷史項目物料小類采購數據作為訓練集,2015年領料記錄完整的項目物料小類采購數據作為測試集。由于配網輸入數據具有標簽復雜,類型眾多的特點,因此首先需要對數據進行數據預處理,排除不符合業務邏輯的異常值,將原始數據轉換成為采取啞變量方法進行展示的形式并作為隨機森林模型的輸入,以便隨機森林模型可以更好地學習歷史項目的有效特征。

3 預測模型構建

配網項目具有樣本數量多,項目類型、標簽復雜的特征。因此,采用具備處理高維數據能力的隨機森林算法構建配網物資需求預測模型,同時隨機森林模型在訓練速度和避免過擬合方面也具有明顯的優勢。簡單地說,隨機森林是利用多棵決策樹對樣本進行預測的模型,它的結構,如圖2所示。給定決策樹的數量,每棵決策樹按既定方法選取輸入信息的子集作為樣例進行學習,不剪枝地生長,直到滿足停止生長規則并給出結果,最終集合所有單棵決策樹結果做出判斷并把信息傳遞給外界。

隨機森林通過自助法重采樣技術,從原始訓練樣本集N中有放回地重復隨機抽取k個樣本生成新的訓練樣本集合,然后根據自助樣本集生成k個決策樹組成隨機森林。其實質是對決策樹算法的一種改進,將多個決策樹合并在一起,每棵樹的建立依賴于一個獨立抽取的樣品,其輸出將會是所有決策樹輸出的平均值。

隨機森林中每一棵決策樹為二叉樹,其生成遵循自頂向下的遞歸分裂原則,即從根節點開始對訓練集進行劃分。分裂過程中,按照最大信息增益率的原則選取特征,并不斷分裂為左節點和右節點,直到滿足分枝停止規則方才停止生長。為了精確地定義信息增益,先定義一個度量標準,稱為熵(entropy),它表示任意樣例的純度(purity):

構建預測模型時,首先將預處理過的歷史數據作為輸入空間放在隨機森林預測模型中,模型會根據輸入空間學習歷史項目中不同項目工程特征的不同物料小類的領料特征,形成隨機森林網絡,直到獲取最優的分裂信息和信息增益率時模型訓練停止。隨后根據下一年度新的建設計劃,包括工程屬性、電壓等級、下達預算等變量作為新的輸入空間,進行分品類的物資需求預測。以國網某省公司的實際數據計算結果為例,對于采購金額最高的12個物料小類的預測精準度都穩定保持在95%以上。見表1。

4 研究結論

通過研究發現可以對配網工程項目名稱進行特征值提取,結合投資規模、所屬單位、電壓等級等項目屬性信息,分物料小類構建項目特征與物料領用信息之間的規律,通過隨機森林學習并模擬,訓練得到相應的映射函數,以從物料小類匯總數量的層面上實現對物資采購需求的預測。

對于后期的實際工作而言,只要規劃配網建設計劃,即可評估出下一年度各物料小類的總體采購需求,大幅提升配網物資采購需求安排的準確度及需求計劃的編制效率。

參考文獻:

[1] 王學斌,馬士華. 庫存需求災變灰預測模型[J].工業工程與管理,2002

(5):23-28.

[2] 曾艷.需求確定的多級庫存系統的庫存策略[J].集美大學學報,2004(3),

77-81.

[3] 張旭梅.面向供應鏈的合作計劃預測與補給[J].工業工程,2000(4):

45-47.

[4] 王曉萍.庫存控制模型與算法[J].工業技術經濟,2000(5): 25-28.

[5] Yang P C,Wee H M. Economic ordering policy of deteriorated items

for Vendor and buyer an integrated approach[J]. Production Planing

and Conrtol, 2011, 11(5): 474-480.

猜你喜歡
隨機森林需求預測
基于貝葉斯最大熵的電動汽車充電需求預測
基于計算實驗的公共交通需求預測方法
隨機森林在棉蚜蟲害等級預測中的應用
基于二次隨機森林的不平衡數據分類算法
拱壩變形監測預報的隨機森林模型及應用
基于隨機森林算法的飛機發動機故障診斷方法的研究
淺談電網規劃中的電力需求預測
基于隨機森林算法的B2B客戶分級系統的設計
基于多視角特征融合與隨機森林的蛋白質結晶預測
中國中長期煤炭需求預測
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合