?

國家公路里程預測模型建立與研究

2024-04-15 07:40張思琪
河南科技 2024年4期
關鍵詞:預測模型

張思琪

摘 要:【目的】在交通強國建設背景下,交通發展由依靠傳統要素驅動向注重創新驅動轉變,前瞻規劃、科學預測成為國家交通建設的前提和基礎?!痉椒ā恳?006—2020年國家統計局發布的公路里程為基礎數據,運用指數法、對數法、多項式法、冪函數法建立預測模型?!窘Y果】經過對比與檢驗,結果表明,6次多項式擬合預測模型最優,通過增加新增年度數據可對其進行優化?!窘Y論】添加年度新增數據的6次多項式預測模型可以為國家公路建設規劃提供參考。

關鍵詞:公路里程;多項式;預測;模型

中圖分類號:U412.1? ? ?文獻標志碼:A? ? ?文章編號:1003-5168(2024)04-0071-04

DOI:10.19968/j.cnki.hnkj.1003-5168.2024.04.013

Establishment and Research of National Highway Mileage Prediction Model

ZHANG Siqi

(Chang'an Dublin International College of Transportation at Chang'an University, Xi'an 710086, China)

Abstract: [Purposes] Under the background of building a powerful transportation country, the transportation development has changed from relying on traditional factors to focusing on innovation. Forward-looking planning and scientific forecasting have become the premise and foundation of national transportation construction. [Methods] Based on the data of highway mileage published by the National Bureau of Statistics from 2006 to 2020,the prediction models are established by index method, linear method, logarithmic method, polynomial method and power function method. [Findings] After comparison and testing, the results show that the 6-degree polynomial fitting prediction model is the best, and it is optimized by adding new annual data.[Conclusions] The 6-degree polynomial prediction model with added annual new data can providereferencefor national highway construction planning.

Keywords: highway mileage; polynomial; forecast; model

0 引言

2019年9月19日,中共中央、國務院印發了《交通強國建設綱要》,對我國新時期交通建設與發展提出了兩個階段的發展目標,并指明了方向。在這一背景下,我國交通建設由追求速度規模向注重質量效益轉變,由各種交通方式相對獨立發展向更加注重一體化融合發展轉變[1]。公路交通具有快捷、方便、地域適應性強等顯著特點,在物資短途運輸、民眾生產生活、帶動與刺激經濟發展等領域發揮著重要作用。但現實中也存在規劃建設中路線重復、過度占用浪費土地資源等現象。構建安全、便捷、高效、綠色、經濟的現代化綜合交通體系,科學規劃和預測是其重要前提,公路建設的規劃和預測也是其重要組成部分。本研究利用已有數據建立預測模型,對國家未來公路建設里程進行科學預測,以期為國家公路建設規劃提供參考。

1 概念界定與國家公路里程2006—2020年統計數據

國家統計局網站對公路里程的解釋為:報告期末公路的實際長度,統計范圍包括城際、城鄉間、鄉(村)間能行駛汽車的公共道路,公路通過城鎮街道的里程,公路橋梁長度,隧道長度,渡口寬度。公路里程不包括城市街道里程、斷頭路里程、農(林)業生產用道路里程、工(礦)企業等內部道路里程。統計原則是按已竣工驗收或交付使用的實際里程計算,兩條或多條公路共同經由同一路段的重復里程,只計算一次[2]。根據國家統計局網站公布的數據顯示,2006—2020年國家公路里程統計數據見表1。

2 預測模型建立與篩選

公路里程的預測與確定是公路網規劃的重要內容。本研究以國家統計局發布的2006—2015年公路里程為基礎數據,運用指數法、對數法、多項式法、冪函數法等4種方法進行對比研究,以獲得國家公路里程較為準確的預測模型[3],其對應的預測公式及R?值見表2。

統計學中對變量進行回歸分析,在采用最小二乘法進行參數估計時,R?為回歸平方和與總離差平方和的比值,表示總離差平方和中可以由回歸平方和解釋的比例,這一比例越大,所建立的模型就越精確,回歸效果越顯著。R?介于0~1之間,越接近于1,擬合效果越好,一般認為超過0.8的模型,其擬合度較好[4]。由表2可知,4種預測模型的R?均大于0.9,上述方法所建立的模型均符合理論要求。但不難看出,4種預測模型仍有優劣之分。其中多項式模型最優,其R?為0.999 6,指數模型、冪函數模型次之,對數模型最差。為了更好地建立國家公路里程的預測模型,選取多項式模型作為研究方法,并采用進一步的數據處理方案,以獲得更高精度的模型。

3 國家公路里程預測模型的建立

3.1 多項式擬合基本原理

曲線擬合是根據一組已有數據擬合出一條曲線或者函數的過程,是求近似函數的一種數值方法,該方法不要求近似函數在每個節點處與函數值相同,只要求盡可能地反映給定數據點的基本趨勢和某種意義上的無限逼近。通過曲線擬合方式擬合出的函數曲線,可以將沒有出現的點代入函數中獲得該點對應的值,也可以反映該數據集數據的趨勢或者數據之間的關系。

最常用的曲線擬合方法是最小二乘法,即通過求取最小的誤差平方和獲得某一函數,使之求得的數值與原始值的誤差平方和最小。給定序列觀測值{(xi,yi), x=0,1,2,…,n},在這些觀測值的基礎上,通過最小二乘原理,求得變量x和y之間的關系f(x,A),使函數f符合數據集合的特性。其中f(x,A)是擬合函數,A=(a0,a1,…,an)是將要獲得的擬合函數的最佳參數。最小二乘法的原理是在無限多組A=(a0,a1,…,an)參數組中,利用誤差平方和衡量原始觀測值與擬合函數求出擬合值之間的差值,該差值反映了該擬合函數和理想函數的差值。找出一組參數組A,根據擬合函數求出y值,使其與真實y值的誤差平方和最小。對所有候選函數均計算差值,取其中差值最小的函數為最終擬合函數[5]。其計算公式見式(1)。

[i=0mωxi][f'(xi)-yi2=]

[mini=0mωxif(xi)-yi2] (1)

函數[f'](xi)是期望求得的擬合函數,在數據集中,每一個觀測x值都對應一個觀測y值,而根據函數[f'](xi),可以求得每一個x值對應函數的y值y′。

擬合函數公式有的是一次方程,有的是多次方程,一次方程的稱為線性擬合,多次方程的稱為多項式擬合,多項式擬合的公式見式(2)。

[y=a0+a1x+a2x2+…+anxn] (2)

對于多項式擬合,最終的參數組合(a0,a1,…,an)也是由最小二乘法確定的,其公式見式(3)。

[RSS=i=0m(y'i-yi)2=]

[i=0m(a0+a1xi+a2x2i+…+anxni-yi)2] (3)

殘差平方和RSS可以看作是參數組合(a0,a1,…,an)的函數[?](a0,a1,…,an),則令每一個參數的一階偏導數為0,則有式(4)。

[?φ?aj=2i=0m(a0+a1xi+a2x2i+…+anxni-yi)]=

[0( j=0,1,2,…,n)] (4)

根據此公式可得矩陣方程見式(5)。

[m+1i=0mxi…i=0mxnii=0mxn+1ii=0mx2i…i=0mxn+1i…………i=0mxnii=0mxn+1i…i=0mx2ni×a0a1…an=i=0myii=0mxiyi…i=0mxniyi] (5)

把此矩陣方程簡化為XA=Y,則矩陣A的算法為A=X?1Y。

根據最小二乘法,求出誤差平方和最小的一組多項式擬合的系數,從而獲得擬合方程。

3.2 模型建立

同一組數據,不同次多項式擬合結果也會有區別,為獲取理想的預測模型,需要對不同次多項式擬合模型的預測精度進行統計。本研究仍以2006—2015年國家公路里程數據為實測數據建立模型(其中自變量[x]為自2006年為起點1,時間間隔為1年的年度數,2007—2015年分別對應2—7,依次類推。),各不同次多項式擬合模型的預測公式及R?值見表3。

由表3可知,2—6次多項式預測模型的模型精度結果都較好,其中6次模型精度最優,考慮到預測值與實際觀測值的統計差值小于萬分之三,本研究以6次多項式預測模型作為最終的預測模型。

3.3 模型預測與驗證

采用6次多項式預測模型對國家公路里程2016—2020年數據進行預測,其預測公式及R?見表3。預測獲得的數據結果統計見表4。

由表4可知,利用國家公路里程2006—2015年數據對后續2016—2020年數據進行預測,2016年的預測值與實際值偏差很?。?.30%)。但是隨著時間的推移,二者的差值越來越大,2020年時差值竟超過50%,這說明該模型對于短時間內的預測適用,隨著時間延長,模型的精度快速下降。

在實際應用中,為了克服上述因素帶來的影響,嘗試將每年新增的實際統計數據加入模型建立過程中,不斷增加模型數據的時間序列,能夠提高模型滾動預測精度。本研究模擬將2016—2020年每年獲得的統計數據加入模型中,對后續年度進行滾動預測,其預測公式及R?值見表5。

由表5可知,隨著實際數據的獲取,并添加到模型中,采用6次多項式擬合建立的模型,其精度良好。添加每年度新增數據后,得到預測模型獲取的預測值、預測值與實際值的差值統計見表6。

由表6可知,添加年度新增數據后,滾動預測獲得的預測值與實際值的差值在可控范圍內,連續5個模型最近一年的預測值與實際值的差值最小為1.39萬km、最大為15.26萬km,其差值的百分比分別為0.30%、2.94%,都在3%以內,由此可見,采用該方式,可以獲得較高精度的預測結果。最終的模型預測值與實際值的曲線如圖1所示。

4 結語

建設交通強國是國家的重大戰略決策,是建設現代化經濟體系的先行領域。隨著國家交通建設事業的全面推進,公路作為立體交通網絡中重要的基礎設施,在經濟發展中起著至關重要的作用,必須把路網規劃納入國家總體規劃之中。本研究采用指數法、對數法、多項式法、冪函數法等4種預測方法建立國家公路里程預測模型,獲得各模型精度,確定多項式法建立的模型最優。運用多項式擬合模型原理,對比不同次多項式模型,本研究發現6次多項式擬合模型更適合國家公路里程的預測。針對6次多項式擬合模型時間序列精度不足的問題,通過運用滾動加入新增年度數據模型的手段,提高了后續年度數據預測精度。公路里程作為路網規劃的重要參數,應該對其進行科學研究與預測,本研究提出的添加年度新增數據的6次多項式預測模型,可以為持續性路網規劃提供基礎數據支撐。

參考文獻:

[1]中共中央、國務院.交通強國建設綱要[M].北京:人民出版社,2019.

[2]國家統計局.公路里程[EB/OL](2021-05-09)[2022-04-10]. http://data.stats.gov.cn/easyquery.htm.

[3]李夢婉,沙秀艷.基于GM(1,1)灰色預測模型的改進與應用[J].計算機工程與應用,2016,52(4):24-30.

[4]陳健勛.城市供水管網漏失特性模擬及評價[D].哈爾濱:哈爾濱工業大學,2020.

[5]何岸青.基于多項式擬合與支持向量機的股票關鍵拐點預測[D].長春:吉林大學,2016.

猜你喜歡
預測模型
無可預測
適用于BDS-3 PPP的隨機模型
選修2-2期中考試預測卷(A卷)
選修2-2期中考試預測卷(B卷)
選修2—2期中考試預測卷(A卷)
p150Glued在帕金森病模型中的表達及分布
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
不可預測
不必預測未來,只需把握現在
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合