?

基于ARIMA模型的三亞機場客流量預測

2018-08-13 11:35李苑輝歐志鵬
軟件 2018年7期
關鍵詞:客流量吞吐量差分

李苑輝,劉 夏,歐志鵬

?

基于ARIMA模型的三亞機場客流量預測

李苑輝,劉 夏,歐志鵬

(三亞航空旅游職業學院 人文社科學院,海南 三亞 572000)

通過對2008年1月至2016年12月三亞機場的客流量數據進行分析,發現其具有趨勢和季節的規律。通過構建機場客流量的ARIMA預測模型并進行檢驗,結果表明,ARIMA模型對客流量數據有著較好的擬合效果,預測誤差較小,可應用于機場旅客吞吐量的短期預測,為機場的運營管理提供相應決策依據。

客流量;ARIMA模型;預測

0 引言

三亞鳳凰國際機場于1994年7月1日正式通航,初期的設計保障規模為旅客年吞吐量150萬人次.2007年,鳳凰機場年旅客吞吐量突破500萬人次;2011年,突破1000萬人次;2017年,超過1938萬人次,逼近2000萬人次大關。目前鳳凰機場的客流量已經遠遠超過其設計保障能力,航站樓已處于超負荷運行狀態,造成了機場客運高速增長與發展空間嚴重不足的矛盾,影響國際旅游島的形象,增加了機場安全運營風險。

機場客流量預測對于機場未來規劃和管理措施改進有重要意義??茖W準確地預測鳳凰機場客流量的發展趨勢,是確定合理的交通設施規模的基礎、保證機場設施高效率使用的前提,能夠為機場運營管理提供科學決策依據。

1 旅客吞吐量數據

本研究選擇2008~2017年三亞鳳凰機場的月度旅客吞吐量作為研究數據,共120個數據樣本,其中2008~2016年108個樣本作為訓練集進行建模,2017年12個樣本作為測試集,檢驗預測模型的性能。具體數據如表1所示。

2 構建預測模型

2.1 選擇預測方法

為達到較高精度的預測成果,國內外許多學者對不同的預測模型進行了廣泛研究[1-3]。預測客流量的方法很多,據不完全統計,世界上大約有約300種方法,其中有150多種比較成熟,30多種比較常用,10多種使用比較普遍,但根據不同的標準,大體分為兩類:一類是線性理論和非線性理論,另一類是定性預測法和定量預測法,但總體都包括:時間序列模型、灰色預測模型、專家預測模型、指數平滑法、神經網絡、支持向量機、趨勢外推法、回歸分析法等[4]。

表1 2008~2017年三亞機場旅客吞吐量月度統計表(單位:萬人)

Tab.1 Monthly Statistics of Passenger Flow of Sanya Airport from 2008 to 2017 (unit: 10,000 people)

數據來源:三亞旅游官方政務網http://tour.sanya.gov.cn/tongji_yue.asp

國內學者用不同的模型對機場客流量進行預測研究,取得了一些成果。例如,王婷婷(2017)運用灰色馬爾科夫模型對貴陽龍洞堡機場2006-2016年的旅客吞吐量數據進行預測,結果證明灰色馬爾科夫預測模型擁有較好的預測精度,平均年誤差為3.38%[5]。劉夏(2016)將Holt-Winter季節模型、ARMA模型和線性回歸模型加權組合對三亞機場客流量進行預測,經驗證該方法可以作為有效預測機場客流量,平均年誤差為3.98%[4]。黃邦菊(2013)建立了多元線性回歸模型預測西南某機場的旅客吞吐量,平均年誤差為2.49%[6]。屈拓(2012)將灰色模型和BP神經網絡相結合,建立組合預測模型,預測成都機場的旅客吞吐量,平均誤差為2.74%[7]。

由此觀之,不同模型的預測精度有著明顯的差別。而在短期預測方面,ARIMA模型是一種精確度較高的方法,國內學者已經應用于不同領域的預測。例如,薛冬梅(2010)根據吉林省過去十六年的全社會固定資產投資總額數據,運用ARIMA(3,1,2)模型對吉林省今后五年的全社會固定資產投資進行了預測分析[8]。周葉(2010)根據2002年1月至2009年12月我國航空貨運量月度數據,采用ARIMA (1,1,1)模型,對往后六個月的貨運量進行了預測[9]。張小斐(2006)以1978~2003年我國的國內生產總值作為樣本資料,采用平滑ARIMA(1,1,2)時序模型,對往后四年的我國國內生產總值作出預測[10]。以上擬合值均與實際觀察值非常接近(誤差小于5%),具有較高的預測精度,表明ARIMA(p,d,q)模型應用于短期的時間序列預測是有效可行的。

一個地方的機場旅客吞吐量受到當地產業結構、節假日安排、航線安排、機票定價和氣候等多種不同因素的影響,往往兼具周期性和非線性變化的特性。三亞作為旅游城市,淡旺季差異明顯,來訪旅客月度數量縱向比較波動較大(見表1),具有明顯的季節性特征。因旅客吞吐量月度數據包含季節變化,考慮采用ARIMA(sp,sd,sq)S(1)季節模型.

因此,本文擬綜合ARIMA(p,d,q)模型與ARIMA (sp,sd,sq)S(1)季節模型,構建復合季節模型,對三亞機場的旅客吞吐量進行預測分析,以期為本地的航空客運市場調控和發展提供理論支持。

2.2 ARIMA模型簡介

ARIMA模型,又叫求和自回歸移動平均(Auto Regressive Integrated Moving Average)模型, 簡記為ARIMA(p, d, q)模型,是由美國學者博克思(Box)和英國學者詹金斯(Jenkins)于20世紀70年代提出的時間序列預測模型,又稱為Box-Jenkins模型,亦簡稱B-J模型。

其建模思想是將預測對象隨時間變化形成的序列看作是一個隨機序列,并用相應的數學模型加以近似描述,通過對相應數學模型的分析研究,更本質地認識這些動態數據的內在結構和復雜特性,從而達到在最小方差意義下的最佳預測。

ARIMA模型具有如下結構:

由ARIMA模型結構可知:

即ARIMA(p,d,q)模型是由差分運算與ARMA (p,q)模型組合而成。由于差分運算具有強大的確定性信息提取能力,說明非平穩序列只要通過適當階數的差分后平穩,就可以用ARIMA(p,d,q)模型對時間序列進行擬合[11]。

對于以月、季度為時間單位的序列,數據經常包含季節變化。季節模型(Seasonal Model)和連續序列一樣,只是連續模型的時間單位是1,而季節模型的時間單位是相應的周期S。季節求和自回歸移動平均模型ARIMA(sp,sd,sq)S(1)可以表示為:

且規定:

將ARIMA(p,d,q)模型與ARIMA(sp,sd,sq)S(1)綜合在一起,得到復合季節模型(General Multiplicative Seasonal Models),它是相乘模型。對于一般的序列,復合季節模型能得到較為滿意的結果[12]。其模型結構為:

記為:ARIMA(p,d,q)(sp,sd,sq)S(1),即為ARIMA模型的一般形式。其中,p是自回歸模型的階數,d是差分的階數,q是移動平均的階數,sp是季節模型的自回歸階數,sd是季節差分的階數,sq是季節模型的移動平均階數,S是季節周期[13]。

3 使用ARIMA模型預測的基本步驟

3.1 檢驗數據的平穩性

如果序列是平穩的,進入下一個步驟,否則進行差分運算,使得序列變得平穩。

根據表1的數據,用SPSS 19作出旅客數的時序圖,如圖1所示。由圖1可知,三亞機場的旅客吞吐量呈整體上升趨勢和季節性周期波動(周期為12個月),因此旅客數的數據具有趨勢和季節的規律,可以初步判斷為非平穩序列。為進一步判定,下面作出自相關圖和偏相關圖,如圖2和圖3所示。

圖1 旅客數的序列圖

圖2 旅客數的自相關圖

圖3 旅客數的偏相關圖

從圖2和圖3可以看出,旅客數數據的自相關函數和偏相關函數都是拖尾的,并未衰減到0,因此數據序列是非平穩的。

為消除趨勢信息,對原始序列做一階差分。一階差分的運算公式為:

同時要清除季節信息,需對數據做一階季節差分。一階季節差分的運算公式為:

分別做完一階差分和一階季節差分后,作出時序圖,如圖4所示。

圖4 旅客數一階差分時序圖

由圖4可以看出,數據的方差有逐漸增大的趨勢。為消除方差的變化,對數據進行自然對數轉換,再作出時序圖,如圖5所示。從圖5初步可以判斷,旅客數序列此時已經基本平穩。

圖5 對數轉換后的一階差分時序圖

為進一步驗證差分運算后序列的平穩性,作出自相關函數和偏相關函數的圖,如圖6、圖7所示??梢钥闯龃藭r數據基本平穩。

圖6 一階差分后的自相關圖

3.2 對ARIMA模型定階

圖7 一階差分后的偏相關圖

現在分別對各個模型進行擬合,然后根據可決系數R方和正態化BIC的值作出判斷。R方值越大、BIC值越小的模型擬合效果越好。最終需要在以上所有可能的模型中選擇一個最優的模型。

利用SPSS軟件進行建模,對各個可能的(p,q) (sp,sq)組合反復檢驗與比較,如表2所示(為顯示簡潔,略去R方值較小且BIC值較大的數據)。盡管ARIMA(1,1,1)(0,1,1)模型可決系數略小于其它模型, 但它的標準化BIC值最小,因此,最終選擇的擬合模型為ARIMA(1,1,1)(0,1,1)S(12)模型。

表2 各種模型擬合效果表

Tab.2 Various model fitting effects

3.3 分析預測結果

根據所選擇的模型進行擬合,結果如表3所示。

表3 模型統計量

Tab.3 Model statistics

從表中可以看出,模型能解釋原來序列中97.1%的信息,N-BIC值最小,Ljung-Box統計量的值顯著,說明ARIMA(1,1,1)(0,1,1)S(12)模型擬合時間序列數據的效果比較理想。

根據所選擇的ARIMA(1,1,1)(0,1,1)S(12)模型,應用SPSS 19統計軟件對2017年1~12月三亞機場的旅客吞吐量進行預測,結果如表4和圖8所示。從表4可看出預測值的誤差絕對值大多低于5%,年度總誤差的絕對值小于2%;從圖8可以看到觀察值與擬合值幾乎重合。因此,該ARIMA模型能很好地應用于預測三亞機場的客流量。

表4 2017年客流量預測值與實際值比較(單位:萬人)

Tab.4 Comparison Between Predicted Value and Actual Value of Passenger Flow in 2017 (Unit: 10,000)

現在用ARIMA(1,1,1)(0,1,1)S(12)模型預測三亞機場2018年和2019年的月度客流量,結果如表5所示。

表5 兩年的月度客流量預測(單位:萬人)

Tab.5 Monthly forecast of passenger volume in two years (Unit: 10,000)

4 結論

(1)根據2008年1月至2016年12月三亞機場的客流量數據分析來看,其具有趨勢和季節的規律。三亞作為旅游城市,淡旺季差異明顯,容易使得民航市場旺季時運力緊張,淡季時運力閑置。若能預估進出港客流量,提前合理安排運力,可帶來明顯的經濟效益和社會效益。

(2)通過構建機場客流量的ARIMA模型并進行檢驗,結果表明,ARIMA模型對三亞機場的客流量進行預測是可行和可靠的,預測精度較高,誤差較小,可以為機場的運營管理提供決策依據。

[1] 張金飛, 黎英, 高偉, 等.城市交通路口短時流量預測[J]. 軟件, 2018, 39(1): 126-131.

[2] 崔仁桀. 數據挖掘在學生專業成績預測上的應用[J]. 軟件, 2016, 37(01): 24-27.

[3] 楊振宇. 高校招生數據采集及分析系統設計與實現[J]. 軟件, 2015, 36(5): 61-66.

[4] 劉夏, 陳磊, 李苑輝, 等. 基于組合方法的三亞機場客流量預測[J]. 計算機系統應用, 2016, 25(8): 23-28.

[5] 王婷婷, 王紫晨. 基于灰色馬爾科夫對龍洞堡機場旅客吞吐量預測[J]. 交通科技與經濟, 2017, 19(5): 48-51.

[6] 黃邦菊, 林俊松, 鄭瀟雨, 等. 基于多元線性回歸分析的民用運輸機場旅客吞吐量預測[J]. 數學的實踐與認識, 2013, 43(4): 172-178.

[7] 屈拓. 組合模型在機場旅客吞吐量預測中的應用[J]. 計算機仿真, 2012, 29(4): 108-111.

[8] 薛冬梅. ARIMA模型及其在時間序列分析中的應用[J]. 吉林化工學院學報, 2010, 27(3): 80-83.

[9] 周葉, 肖靈機. 基于ARIMA模型的我國航空貨運量預測分析[J]. 南昌航空大學學報, 2010, 9(12): 22-27.

[10] 張小斐, 田金方. 基于ARIMA模型的短時序預測模型研究與應用[J]. 統計新論, 2006, 10: 7-9.

[11] 游皓麟. R語言預測實戰[M], 北京:電子工業出版社, 2016: 365-366.

[12] 張文彤, 董偉. SPSS統計分析高級教程[M]. 北京: 高等教育出版社, 2013: 404-405.

[13] 夏怡凡. SPSS統計分析精要與實例詳解[M]. 北京: 電子工業出版社, 2010: 265-266.

Passenger Flow Forecast of Sanya Airport Based on ARIMA Model

LI Yuan-hui, LIU Xia, OU Zhi-peng

(School of Humanities and Social Sciences, Sanya Aviation and Tourism College. Sanya 572000, China)

By analyzing the passenger flow data of Sanya Airport collected from January 2008 to December 2016, the general trend and seasonal variation regular-ity of the passenger flow can be found. By constructing and testing the ARIMA forecast model, the results show that the ARIMA model has a good fitting effect on the passenger flow data, and its forecast error is small. Therefore, this model can be applied into the short-term forecast of airport passenger flow, and help to provide the corresponding decision-making basis for the airport operation man-agement.

Passenger flow; ARIMA model; PredictionIntroduction

O211.61

A

10.3969/j.issn.1003-6970.2018.07.009

海南省自然科學基金項目(批準號:618QN258)、三亞市院地科技合作項目(批準號:2014YD52)

劉夏(1983-),男,副教授,主要研究方向:計算機應用;歐志鵬(1973-),男,講師,主要研究方向:管理學。

李苑輝(1982-),男,講師,主要研究方向:數據挖掘。

本文著錄格式:李苑輝,劉夏,歐志鵬. 基于ARIMA模型的三亞機場客流量預測[J]. 軟件,2018,39(7):42-47

猜你喜歡
客流量吞吐量差分
數列與差分
基于嵌入式系統的商場客流量統計算法
2017年3月長三角地區主要港口吞吐量
2016年10月長三角地區主要港口吞吐量
2016年11月長三角地區主要港口吞吐量
基于AFC數據的城軌站間客流量分布預測
基于差分隱私的大數據隱私保護
相對差分單項測距△DOR
2014年1月長三角地區主要港口吞吐量
差分放大器在生理學中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合