?

基于PCA-GA-BP 神經網絡模型對安徽省物流需求量預測

2024-01-25 05:16聶軼文
關鍵詞:權值遺傳算法閾值

聶軼文,王 韡

(1.阜陽師范大學 信息工程學院,安徽 阜陽 236037;2.安徽電信合肥分公司,安徽 合肥 230031)

0 引言

《安徽省“十四五”物流業發展規劃》提到,到2025 年,安徽省物流業關鍵發展指標將會顯著提升,物流設施服務能力大幅改善,“三橫四縱多輻”運輸通道更加便捷,物流樞紐功能更加完善,物流設施網絡更加均衡[1]。新增省級示范物流園區30家左右,創建國家骨干冷鏈物流基地3-4 個、國家物流樞紐5 個左右。重點物流領域持續增強。供應鏈穩定性和競爭力不斷提高,冷鏈物流、郵政快遞效率和品質大幅改善,航空物流、高鐵物流以及新業態新模式快速發展,儲備適度、反應迅速、抗沖擊能力強的應急物流體系基本建成[2]。

安徽省在加快建設物流強省的過程中,主要有三個抓手:提質增效降本、完善物流網絡布局、提高物流智慧化水平。其中物流需求量預測是科學布局物流網絡的基礎,是有效平衡物流業供需發展的重要依據。區域物流需求系統是非線性變化系統,受到的影響因素多,且中長期預測往往偏差較大,因此在合理選擇指標變量,采用更有效的預測方法顯得尤為重要[3]。

呂靖[4]從區域經濟發展水平、供給水平、冷鏈物流服務水平三個維度構建了指標體系,并提出了一種基于和BP 神經網絡的組合預測模型。王曉平[5]等人從供給、經濟發展、冷鏈水平、人文發展、物流需求五個維度構建指標體系,構造了農產品冷鏈物流需求的GA-BP 神經網絡預測模型,并以北京為實例進行了實證分析,取得了不錯的效果。孫啟鵬[6]等人認為物流需求是一種派生需求,在理論上建立預測模型是可行的,從市場價格及市場支付能力、物流基本功能要素和物流發生源三個方面對物流量進行了定量描述,并構建了指標體系。

GUO Hongpeng[7]等人建立了三個隱藏層的MLP 神經網絡模型,以山西省工業物流需求進行了實例驗證,取得了不錯的預測效果。QU Licheng[8]等人利用多層監督學習算法訓練預測器,以西雅圖短期交通流量數據進行訓練和預測,預測精度優于傳統的一些預測方法。黃建華[9]等人提出了改進GM-BPNN 組合預測方法,利用差分移動平均自回歸模型和遺傳算法改進模型,以浙江、廣東、江蘇進行實例驗證,提高了物流需求預測的精確度。陸文星[10]等人提出改進后的PSOBP 方法,利用粒子迭代周期増加位置擾動,對粒子群算法進行改進。將改進后的PAPSO 算法對BP 神經網絡的初始權值和閾值進行優化,有效的提升了預測精度。冉茂亮[11]等人考慮到數據的非平穩性、強隨機性、非線性等特征,利用集成經驗模態分解(EEMD)、局部均值分解(LMD)、長短期記憶網絡(LSTM)以及局部誤差校正(LEC)方法,提出用于短時物流需求預測的EEMD-LMDLSTM-LEC 深度學習模型,取得了不錯的預測效果。

這些學者從不同的角度,采用不同的方法進行了預測,都取得了不錯的預測效果。但是區域物流需求的影響因素很復雜,物流需求預測指標變量的選取沒有統一的標準,每一變量之間或多或少存在重疊、相關的關系。變量太多會增加問題的復雜性,一般希望在分析的過程中涉及的變量盡可能少,而包含的信息量盡可能多。因此利用主成分分析法,降低模型輸入維數,提取出物流需求特性的主成分。本文嘗試選擇更多的指標,利用PCA 進行降維處理,盡量提取出影響物流需求量的關鍵信息,以求構建的模型預測更加可靠。

1 預測模型的建立

1.1 主成分分析法

主成分分析法(PrincipalComponentsAnalysis,簡稱PCA)是一種常用的降維方法,將多指標轉化為少數幾個綜合指標(主成分),提取出的新的主成分是原指標變量的一組線性組合,這些主成分通過方差依次遞減的順序進行排列,其中具有最大的方差,稱為第一主成分,次大的方差變量為第二主成分,依次類推,n 個變量就有n 個主成分[12]。

設觀測到m 組n 維的數據樣本矩陣為:

(1)計算維度上的相關系數矩陣。

(2)解特征方程|λI-R|=0,求出特征值λi與特征向量ei。

(3)計算累積貢獻率。

特征值描述的就是對應主成分方向上的方差,通過計算累積貢獻率達到85%以上的特征值λ1,λ2,…,λp,就可以提取出前p 個主成分。

(4)提取主成分Fi。

式中:Fi表示第i個主成分。

1.2 遺傳算法優化的BP 神經網絡的建立

(1)隱含層神經元數量k

根據柯爾莫哥洛夫定理可知可以確定隱含層神經元的個數k,

ninput、noutput分別為為輸入層和輸出層數目,a取值為1-10 之間[13]。

(2)傳遞函數、學習率等網絡參數的設定

Sigmoid 函數基本上都能實現非線性輸出,這里隱含層傳遞函數選擇tansig 函數和輸出層采用purelin 線性函數[14]。

BP 神經網絡不斷優化的本質就是將每次輸出結果與期望輸出進行比較,不斷的進行反向傳播調節對權值和閾值更新,而調整方法就是梯度下降法。學習率η決定了下降的步長ηdf(x)/dx,步長太大就可能會出現震蕩,結果無法收斂。

圖1 BP 神經網絡拓撲結構

GA-BP 神經網絡的基本思想是:在利用BP神經網絡進行預測時,一般會隨機初始化權值和閾值,但擬合結果不是很理想。這里利用遺傳算法的全局尋優能力和快速收斂速度的優點,可以獲得比較好的初始權值和閾值。然后將優化后的權值和閾值輸入BP 神經網絡,達到預定訓練次數或目標精度則終止訓練并輸出結果[15]。遺傳算法優化BP 神經網絡算法的流程如圖2 所示。

圖2 GA-BP 神經網絡流程圖

2 安徽省物流貨需求量預測

2.1 數據收集

在區域物流需求量預測前,首先需要進行數據收集和處理。本文數據來源主要出自《安徽省統計年鑒》、《中國統計年鑒》、《安徽省國民經濟和社會發展統計公報》等相關網站,因普查數據修訂、統計指標的修訂等原因,個別指標在不同年份會略有差別,因此,本文所有數據均是采用截止至2021 年的核算數。

貨運量:指在一定時期內,各種運輸工具實際運送的貨物(旅客)數量。它是反映運輸業為國民經濟和人民生活服務的數量指標,也是制定和檢查運輸生產計劃、研究運輸發展規模和速度的重要指標[16]。

能源生產/消費總量:其中包含煤炭和電力的生產/消費[17],煤炭換算為電力的生產和消費,換算標準為1 kg 標準煤=8.141 千瓦時。

陸路交通長度:該指標是公路交通和鐵路交通總運營里程之和[18]。

表1 (a)2000-2019年安徽省貨運量及其影響因素

2.2 主成分分析法提取主成分

因原始數據指標過多,利用SPSS 軟件中的因子分析方法對原始數據提取主成分進行降維,各指標量綱差距較大,這里采用相關系數進行提取,為了更好的對提取出的主成分進行解釋,采用最大方差法對初始因子載荷矩陣進行旋轉[19]。

經檢驗,KMO 系數為0.79,Bartlet 球形度檢驗顯著性系數p 遠小于0.05,故適合進行因子分析?;谔卣髦荡笥? 提取的各成分累積載荷比如表2 所示。

表2 基于特征值提取出的主成分

從上表可以看出,提取出了3 個主成分,各主成分的表達式如下:

轉換得各主成分得分見表3。

2.3 初始權值和閾值進行優化

這里設置進化代數為100 次,種群規模為50。交叉概率和變異概率進行多次測試比較,選擇更優者。

如圖3 所示,通過多次尋優,種群進化100代,平均均方誤差為0.112 9,最佳均方誤差為0.000 4,BP 模型獲得比較好的初始權值和閾值。

圖3 遺傳算法優化后的適應度

圖4 貨運量預測各實驗數據相關系數

其中,W10、B10為分別為隱含層到輸入層的權值和閾值,W20、B20分別為輸出層到隱含層的權值和閾值。

2.4 GA-BP 模型預測

將遺傳算法尋優得出的初始權值和閾值輸入模型進行訓練和測試,訓練目標誤差為0.001,經過多次調試學習率設置為0.01,隱含層神經元數目為5[20]。

從圖中4 可以看到,訓練集、驗證集、測試集和總體相關系數分別為0.93936、1、1、0.92507,表明訓練好的BP-GA 模型很好。

因2009 年陸路貨運量抽樣調查方法進行了調整,從圖5 也可以看出2009 年真實貨運量出現了較大的跳躍,從而把測試集和整體平均絕對百分比誤差水平拉高。剔除異常值后重新進行計算,如圖6 所示。

圖5 貨運量預測結果

圖6 剔除異常值后的貨運量預測結果

剔除異常值(2009 年)后的平均絕對百分比誤差,訓練集的平均絕對百分比誤差為6.38%,4 組測試集的平均絕對百分比誤差為7.78%,總體平均絕對百分比誤差為6.6%。通過結果可知本文構建的GA-BP 神經網絡應用于物流量預測的精度基本滿足實際要求,預測結果較為理想。

3 結論

通過對安徽省物流需求量預測的實例驗證,可以得出如下結論:(1)本文中選擇的18 個原始經濟發展指標數據利用主成分分析對數據進行降維處理后,提取出的主成分仍然包含了原始數據的絕大部分信息,沒有造成原始數據的失真,而模型訓練速度卻得到了大幅提升。(2)在樣本量較少的情況下,本文構建的GA-BP 神經網絡取得了不錯的預測精度,同時因為樣本數量較少,也會對一些異常值更為敏感,導致預測結果出現較大的波動,因此需要分析這些異常值產生的原因,適當的剔除這些異常值。(3)初始權值、閾值的設定對BP神經網絡預測結果的好壞會有很大的影響,本文利用遺傳算法的優點快速找到局部最優解,從而得到初始參數,并獲得了不錯的預測結果。本文中的學習率等網絡參數是通過不斷調試來設定的,這些參數會影響到模型的訓練效率和結果。在以后的探究中可以考慮通過一種動態調整的方法來調整這些超參數,從而獲得更快的訓練速度和更好的預測精度。另外2020 年因為疫情的影響,各項經濟指標波動較大,故本文數據只取用了2020 年以前的數據,而對于突發事件條件下的物流需求預測是繼續努力研究的方向。

猜你喜歡
權值遺傳算法閾值
一種融合時間權值和用戶行為序列的電影推薦模型
CONTENTS
小波閾值去噪在深小孔鉆削聲發射信號處理中的應用
基于自適應閾值和連通域的隧道裂縫提取
基于自適應遺傳算法的CSAMT一維反演
比值遙感蝕變信息提取及閾值確定(插圖)
一種基于遺傳算法的聚類分析方法在DNA序列比較中的應用
基于權值動量的RBM加速學習算法研究
基于遺傳算法和LS-SVM的財務危機預測
基于多維度特征權值動態更新的用戶推薦模型研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合