?

基于預測需求量的物流倉儲中心選址研究

2023-12-14 00:47程元棟汪建偉韓佰慶
關鍵詞:長三角遺傳算法聚類

程元棟,汪建偉,韓佰慶

(安徽理工大學 經濟與管理學院,安徽 淮南 232001)

中共中央及國務院在2019年12月印發的《長江三角洲區域一體化發展規劃綱要》指出,長江三角洲(以下簡稱長三角)地區是我國經濟發展最活躍、開放程度最高、創新能力最強的區域之一,在國家現代化建設大局和全方位開放格局中具有舉足輕重的戰略地位。而物流業是經濟發展的潤滑劑,是區域經濟發展的重要保障。其中,物流倉儲中心作為重要的物流節點,其合理的選址可以減少運輸時間,對于提高物流效率有著重要的作用。如何合理地選擇長三角地區的物流倉儲中心對于該地區經濟發展有重要的意義。

對于倉儲中心選址問題相關學者給出了眾多研究方法。徐利民等[1]考慮了時間因素對企業倉儲中心選址的影響,提出了動態選址方法,使得倉儲中心選址更加靈活且能夠符合實際需求,但是并未給出求解模型。丁小冬等[2]運用0-1混合整數規劃法構建選址模型,將多種約束條件作為權重構建至模型中,使得整體物流費用最小。劉丹等[3]采用向量空間模型(vector space model,VSM)將影響倉儲中心的多種經濟性、環境性、社會性指標轉化為向量空間進行分析。程旭[4]提出利用粒子群算法對倉儲中心進行靜動態分析,為倉儲中心選址提供多種分析。苗將等[5]用優化的帝王蝶算法對京津冀地區進行逆向選址分析,精確求解出物流成本最低的倉儲中心坐標。Maria等[6]對倉儲中心動態選址問題進行詳細的闡述,對不同的動態選址進行分類,并將不同的動態選址模型進行分析總結。Agzaf[7]考慮在多周期需求增加的情況下的設施選址問題,設計求址模型并利用算法求解,保證求解的設施能在客戶可接受的時間范圍將貨物分配到位,對倉儲中心選址問題求解具有啟發作用。以上學者給出了求解倉儲中心的多種思路和方法,對于求解倉儲中心選址問題都有一定效果,但他們更加關注求解方法和模型,對于需求點的具體需求數據考慮不深,不是以自擬需求量就是以往年的需求量作為依據來進行倉儲中心選址。這樣會導致其仿真實驗求解出的結果滿足不了實際的要求,從而影響整個區域物流體系的效率,進而影響區域經濟的發展,因此在進行倉儲中心選址時應充分考慮需求點未來幾年的需求量并以此作為倉儲中心選址的依據。

對于物流需求量的預測有許多方法,其中指數平滑法就是一種比較常見的預測方法。米翠蘭[8]認為二次指數平滑法實質是對歷史數據進行加權平均并將其作為未來時刻的預測結果,對于中長期預測有較好的效果,她使用二次指數平滑法成功預測出某煤礦工人塵肺病患病率;趙婉[9]以貨運量、貨物周轉量為指標,運用二次指數平滑法成功預測陜西省高速公路服務區物流需求量;李玉峰等[10]運用二次指數平滑法、徑向基函數神經網絡模型、多元線性回歸模型等分別對水產品冷鏈物流需求量進行預測,通過與實際值對比及誤差分析發現,使用二次指數平滑法預測的水產品冷鏈物流需求量與實際值擬合程度較好且誤差較小。以上學者都證實了二次指數平滑法對于預測物流需求量有較好的效果。

為了解決目前倉儲中心選址問題中對于需求量考慮不足及選址模型脫離實際、考慮因素較少等問題。利用二次指數平滑法求解出長三角地區未來3年的實際需求量,并基于該地區物流實際發展情況,構建考慮多種因素的求址模型。利用K-means聚類算法和遺傳算法精確求解出滿足總成本最低和物流效率最高的長三角地區物流倉儲中心,從而提高該地區整體物流水平,為該地區經濟發展提供有效助力。

1 預測需求量

1.1 指數平滑法

指數平滑法通過將觀察值與實際值進行比較,來確保預測結果的準確性。這種方法基于布朗的理論,可以有效地捕捉時間序列的變化趨勢,從而獲得更準確的預測結果。論文利用指數平滑法來估算時間序列的變化趨勢,并結合特定的預測模型來預測其未來發展趨勢。

1.2 預測模型計算步驟

1) 時間序列的一次指數平滑值為

(1)

(2)

2) 建立二次指數平滑預測模型如下:

Yt+T=at+btT,

(3)

式(3)中,Yt+T為t+T期的預測值,單位為元;T為從t期向后推移的期數,單位為期。其中,

(4)

(5)

應用二次指數平滑法對物流量進行預測,其初始值及平滑系數?的選擇很關鍵。大多數研究人員建議在數據集項數較多時(一般大于20個),使用第1期的觀測值或之前的觀測值進行指數平滑是比較合適的。這樣做不會太大地改變最終的結果,也不會太大地降低預期的準確性。因此,在進行數學模型分析之前,應該從初始觀測值中挑選出幾項并以其平均值作為模型的基準,從而使模型的準確性得到提升。此外,隨著項數的增加,模型的平滑系數也將變得越來越重要。王慈光[11]認為當平滑系數較小且時間序列的項數較大時可以說明歷史數據比近期數據起更大的作用。

因此,選取長三角地區27個中心城市2009-2022年的貨物運輸量數據,采用指數平滑法對中心城市2023-2025年的貨物運輸量進行預測。以2009-2011年的數據作為指數平滑初始值。通過Excel軟件選取多個平滑系數進行實驗,分析各城市2023-2025年預測值總平均相對誤差,得出結果如表1所示。

表1 平滑系數對比Tab.1 Smoothing coefficient comparison

由表1可知,當平滑系數選取0.8時未來3年總的平均相對誤差最小。說明當平滑系數較大時,近期數據對于預測未來的數據起更大作用,可以使得預測結果更貼近實際。因此,選取0.8作為平滑系數進行預測分析。通過Excel軟件利用二次指數平滑法對各城市進行貨運量預測,其中對合肥市的貨運量預測實驗結果如表2所示。

表2 二次指數平滑模型計算結果Tab.2 Calculation results of quadratic exponential smoothing model

由表2可知,從2011-2022年通過二次指數平滑法預測出的貨運量與真實值誤差基本都在5.00%以下,這表明二次指數平滑法對于預測貨運量有較好的效果,可用于預測合肥市2023-2025年的貨運量。通過實驗發現其他城市的預測值相對誤差也都維持在較低水平,因此可以證明二次指數平滑法在預測長三角地區中心城市貨運量上的準確性。

2 物流倉儲中心選址模型

2.1 模型假設

1) 各個備選倉儲中心和各個區域需求點均可相互到達;

2) 各個備選倉儲中心和各個區域需求點的距離采用歐氏距離計算;

3) 不考慮備選倉儲中心到需求點需要多少輛車,假設運輸工具充足;

4) 備選倉儲中心坐標已知,各個備選中心的建設成本、運營成本已知;

5) 各區域需求點坐標和未來3年預計需求量已知;

6) 各個備選倉儲中心到各個區域需求點的單位運輸成本固定且已知;

7) 各個備選倉儲中心到各個區域需求點的運輸速度一致。

2.2 物流倉儲中心選址模型

1) 倉儲中心建設成本:

(6)

式(6)中,m為倉儲中心數量,單位為個;Qi為倉儲中心i的建設成本,單位為元;xi為0-1變量,xi為1時表示備選倉儲中心i被選中,否則xi為0;S1為倉儲中心建設成本,單位為元。

2) 倉儲中心運營成本:

(7)

式(7)中,β為倉儲中心i3年的運營成本和建設成本的比例系數;S2為倉儲中心運營成本,單位為元。

3) 運輸成本:

(8)

式(8)中,C為倉儲中心到需求點的單位運輸成本,單位為元;Sij為倉儲中心i到需求點j的運輸量,單位為t;dij為倉儲中心i到需求點j的距離,單位為km;yij為倉儲中心i提供給需求點j的需求量,如果沒有需求量則yij為0;S3為運輸成本,單位為元。

4) 總成本:

min(S)=S1+S2+S3,

(9)

式(9)中,S為總成本,單位為元。

約束條件為

(10)

式(10)中,J為各區域需求點集合:J={1,2,…,n}。

yij≤xi,?i∈I,j∈J,

(11)

式(11)中,I為備選倉儲中心集合:I={1,2,…,m}。

(12)

式(12)中,P為允許建設倉儲中心的數量,單位為個。

tij=dij/V,

(13)

式(13)中,tij為備選倉儲中心i到需求點j的運輸時間,單位為h;V為倉儲中心到需求點的運輸速度,單位為km/h。

(tij+Ri)yij≤Tj,?i∈I,j∈J,

(14)

式(14)中,Ri為備選倉儲中心的響應時間,單位為h;Tj為需求點可接受的貨物到達最長時間,單位為h。

式(10)表示每個需求點都需要1個倉儲中心為其提供服務;式(11)表示當備選倉儲中心被選中時才可以為需求點提供服務;式(12)表示倉儲中心建設數量;式(13)表示倉儲中心i到需求點j的運輸時間;式(14)表示倉儲中心的響應時間及運輸時間之和小于需求點最長可接受時間。

3 K-means聚類算法

K-means算法是一種廣泛應用的迭代式聚類算法。其步驟是:若要將數據分為K組,則隨機選取K個對象作為初始的聚類中心,然后計算每個數據與各個聚類中心之間的距離,把每個數據分配給距離它最近的聚類中心。

K-means聚類算法中需要距離的計算,可以根據實際應用的特點和需要選擇任意距離度量方法,如歐氏距離、曼哈頓距離等。不同的距離度量方式,只是在計算距離時使用相對應的距離計算公式,其余步驟不變。實驗選擇歐氏距離,采用誤差平方和(sum of squared errors,SSE)作為質心位置的優化指標。因此,需要計算每個點的歐氏距離,也就是它們與質心的距離,并將誤差平方和作為衡量標準。對于指定的K個簇,簇內點之間的距離越小,對應的SSE也越小,聚類的效果也越好。當SSE接近于0時,表明模型的選擇和擬合效果更佳,從而使得實驗結果更加準確可靠。

其中數據到簇質心的歐氏距離計算公式為

(15)

式(15)中,D(Xl,Cm)為2個目標之間的歐氏距離,Xl為第l個數據,Cm為第m個聚類中心。

SSE計算公式為

(16)

式(16)中,PSSE為誤差平方和,x為簇內的目標,cl為簇質心。

4 遺傳算法

遺傳算法是從大自然生物進化規律抽象出來的隨機全局搜索優化算法,它借鑒了達爾文生物進化論和孟德爾遺傳學的原理,以更加精確的方式求解復雜的問題。遺傳算法能夠實現全局搜索,并在搜索過程中自主學習,不斷適應環境得到最優解。利用計算機模擬技術,可以把原本用于研究問題的參考值轉換成可用于描述特征集合的編碼,并且根據適應性函數來衡量特征集合的表現,同時利用編碼集合來構建個性集合,并且可以采用多種方法(如交叉、變異和迭代)來實現個性集合的持續發展,從而獲得更加完善和有效的結果。遺傳算法流程如圖1所示。

圖1 遺傳算法流程Fig.1 Flow of genetic algorithm

由圖1可知,算法依次進行參數初始化、初始化種群、選擇個體交叉、變異子代、評估子代,然后形成新的種群,再判斷種群是否滿足收斂條件(收斂條件為成本最小),滿足收斂條件則計算目標函數值,不滿足則重復進行交叉變異操作,直到滿足條件則結束算法輸出結果。

5 仿真實驗與分析

5.1 實驗數據與環境

為了驗證算法在求解長三角地區中心城市倉儲中心選址問題時的有效性與正確性,建立了長三角地區中心城市數據集,如表3所示。以此數據集為選址算例,在具有Intel(R) Core(TM) i5-7200U處理器和Windows 10系統的計算機上使用Matlab軟件進行仿真求解。

表3 長三角數據集Tab.3 Yangtze River Delta dataset

由表3可知,需求量為通過二次指數平滑法預測出的2023-2025共3年的需求量之和。為了便于在二維平面進行定位計算,需要將經緯度坐標轉化為平面xy坐標。通過米勒投影法編寫相應算法對經緯度進行轉化。由于經緯度轉化的坐標數值太大,導致點與點的差距很小,不便于求解和結果分析,于是將橫縱坐標分別減去1個公共值,橫坐標減去33000,縱坐標減去7300。

5.2 備用倉儲中心選擇

長三角地區涵蓋三省一市,區域不同,城市眾多。因此,考慮該地區具體地理情況及位置信息,使用K-means算法將該地區進行聚類的運行結果如圖2所示。由圖2可知,K-means聚類算法將長三角地區中心城市分為3個區域并得到3個聚類中心,聚類中心坐標依次為(141.9501km,247.0279km)(388.7333km,243.5720km)(522.8903km,433.4988km),將這些聚類中心作為備選倉儲中心。

圖2 K-means聚類算法運行結果Fig.2 K-means clustering algorithm running results

通過對比K-means、K-modes、K-medians聚類算法,來驗證K-means聚類算法在劃分區域和計算備用倉儲中心方面的優越性及正確性。還運用弗洛伊德算法得出各區域聚類中心到區域內各點的距離和,其值越小,代表聚類算法性能越卓越。3種聚類算法進行對比,結果如表4所示。

表4 聚類算法比較Tab.4 Comparison of clustering algorithms

由表4可知,K-means聚類算法運行時間最短,距離和最小,這證明該算法相比于其他算法具有優越性,因此可用于選擇長三角地區備用倉儲中心。通過對比發現,K-means聚類算法的總距離和比其他算法低得多,這說明其可以降低長三角地區物流距離,提高物流效率。

5.3 長三角地區倉儲中心選址

通過遺傳算法和長三角地區數據集,可以有效地確定物流倉儲中心的位置。結合長三角地區具體地理位置,發現該地區中心城市地形緊湊,備選倉儲中心覆蓋范圍較大。因此,為降低倉儲中心建設成本,從3個備選中心里挑選出2個,并利用遺傳算法和數據集,結合經緯度信息,進行仿真實驗,以獲得更精準的結果。仿真實驗迭代過程如圖3所示,得出的倉儲中心及對應服務的需求點如圖4所示。并與模擬退火算法[12]、蟻群算法[13]進行對比,以總成本為標準,分析判斷遺傳算法在長三角地區倉儲中心選址問題上是否具有科學性及合理性,算法性能對比結果如表5所示。其中對于倉儲中心的建設成本及運營成本,根據文獻[14]進行取值,3個備選中心的建設及運營成本之和分別為5.2×104、5.0×104、5.1×104元。

圖3 迭代過程Fig.3 Iterative process

圖4 最優選址方案Fig.4 Optimal site selection scheme

表5 算法性能對比Tab.5 Algorithm performance comparison

由圖3可知,算法經過不斷優化,使得總成本不斷變小直至得到最優結果。當迭代至66次時下降至最低點,在66次之后總成本趨于穩定,最優的總成本收斂于1.8928×108元。

由圖4可知,1~9號需求點選擇①號倉儲中心,10~27號需求點選擇②號倉儲中心,滿足模型成本最小。

由表5可知,相比于模擬退火算法與蟻群算法,遺傳算法得出的總成本最小、所用時間最短,這說明通過遺傳算法得出的倉儲中心可以大大降低長三角地區物流成本。遺傳算法在求解長三角地區倉儲中心選址問題上具有科學性與優越性,可以為該地區倉儲中心選址提供較好的幫助。

6 結論

為提高長三角地區物流效率,助力該地區經濟高速發展。提出了運用二次指數平滑法預測長三角地區中心城市2023-2025年貨物運輸量,以此作為選址依據并建立該地區倉儲中心選址模型。利用K-means聚類算法進行區域劃分并選出備選倉儲中心,使用遺傳算法求解選址模型,得出精確的倉儲中心坐標位置。通過算法對比,驗證遺傳算法在解決長三角倉儲中心選址問題上具有優越性和科學性,使得該地區物流成本降低,物流效率提高。通過預測未來3年該地區物流量,確定了該地區倉儲中心,為倉儲中心選址提供了新思路。在未來的研究中,可以預測5年或更長時間的物流量,以此提高倉儲中心的可持續性。

猜你喜歡
長三角遺傳算法聚類
緊扣一體化 全面融入長三角
“首屆長三角新青年改稿會”作品選
基于DBSACN聚類算法的XML文檔聚類
基于自適應遺傳算法的CSAMT一維反演
一種基于遺傳算法的聚類分析方法在DNA序列比較中的應用
基于高斯混合聚類的陣列干涉SAR三維成像
基于遺傳算法和LS-SVM的財務危機預測
長三角瞭望
長三角瞭望
基于改進的遺傳算法的模糊聚類算法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合