?

基于灰色理論和時間序列模型預測棉花產量可行性研究

2021-03-24 09:59尹曉燕王旭陽史澳何曉豐王雪劉云
棉花科學 2021年1期
關鍵詞:時間序列預測

尹曉燕 王旭陽 史澳 何曉豐 王雪 劉云

摘要:為了進一步提高新疆棉花產量的預測精度,運用GM模型與ARIMA模型對新疆棉花產量進行了預測,進而賦予合理權重建立了基于灰色理論和時間序列的組合預測模型對新疆棉花產量進行了預測。實證分析結果表明:組合模型的預測結果更加逼近于真實數據,預測精確度較單一預測模型的結果準確性更高、誤差更小。因此, GM模型與ARIMA模型組合預測新疆棉花產量是可行的。

關鍵詞:灰色理論;時間序列;組合模型;棉花產量;預測

中圖分類號:S562

文獻標識碼:A

文章編號:2095-3143(2021)01-0015-07

DOI:10.3969/j.issn.2095-3143.2021.01.003

Abstract:In order to improve the forecast precision of Xinjiang cotton yield, the GM model and ARIMA model are used to predict Xinjiang cotton yield, the combination forecasting model based on grey theory and time series was established to predict the cotton yield in Xinjiang. The results of empirical analysis showed that the forecasting accuracy of the combined model is higher and the error is smaller than that of the single model. Therefore, it is feasible to combin the GM model and the ARIMA model to forecast cotton yield in Xinjiang.

Key words:Grey theory; Time series; Combination model; Cotton yield; Forest

新疆維吾爾自治區是我國主要的植棉區之一,同時也是我國最大的優質棉和唯一的長絨棉生產基地。在新疆農業中,棉花產業占居主導地位,其產量的變動對棉花行業相關從業者的經營和發展有重大的影響。棉花產業的健康發展對新疆農業及紡織工業的發展具有極其重要的意義[1]。相對于一熟旱地作物,棉花生長周期長,受自然環境的影響大。長期以來,棉花產量面臨較大的風險,波動頻繁,需要進行產量預測,以改變管理措施和調控市場。

近年來,基于不同的研究對象眾多學者運用不同的方法對新疆棉花產量進行了預測。目前學者研究的熱點是系統分析法,主要包括灰色理論預測法、人工神經網絡預測法、時間序列預測法以及系統動力學法等。這些方法對平穩的時間序列取得較好的預測效果,得出了一系列重要的結論[2]。為了能夠合理的利用各種預測模型的優點,Bates,等[3]將不同的預測模型進行適當的組合,于1969年提出了組合預測的方法,該方法能夠綜合利用各種預測模型提供的信息,盡可能地提高預測的精度。近年來已有許多對組合預測模型得到了推廣。邢棉[4]提出了灰色神經網絡組合模型,為較復雜的季節性預測問題,提供了一種新的有效的方法,并對電網供電量進行了預測。朱輝[5]運用了灰色預測模型,對新疆生產建設兵團棉花產量進行了預測,得到了精確度更高的預測值。陳黎明,等[6]運用灰色預測和回歸模型建立組合預測模型對GDP統計數據質量進行了評估研究。單銳,等[7]為了更加精確的預測出人均GDP,采用了ARIMA模型與GM模型的組合模型,結果顯示組合預測結果更加接近于真實值。佟長福,等[2]為了減少隨機性,提出了基于小波分析理論的農業需水量組合預測模型。李曉彤,等[8]通過建立灰色模型和ARIMA-GARCH模型的組合模型對我國的股票市場進行了分析。張利平,等[3]通過建立六種時間序列組合模型并結合它們的優點,使其擬合及預測效果達到最優。為了對棉花的產量進行動態、科學、精準地預測,作者運用灰色理論與ARIMA模型對新疆棉花產量進行預測,運用相關統計軟件分析得出單一灰色GM(1, 1)模型與ARIMA模型的預測結果,之后結合二者各自的優點賦予合理權重建立基于灰色理論和時間序列的組合預測模型,以期提高棉花產量預測的精度,為政府及棉花相關從業者制定合理的生產、銷售、儲存和加工等產銷策略提供參考與借鑒。

1灰色時間序列組合預測模型

1.1 GM(1, 1)模型

灰色預測是一種對具有不確定因素的系統進行預測的方法,能有效解決數據少、序列的完整性及可靠性低的問題。GM(1, 1)模型是一種較為常用的灰色模型,GM(1, 1)預測模型的建立實質上就是對原始數據序列作一次累加生成,使生成數據序列呈顯出一定規律,然后通過建立微分方程模型,求得擬合曲線,進而對系統進行預測。該模型構建思路如下。

1.2 ARMIA模型

ARIMA模型(自回歸積分滑動平均模型)是一種根據系統觀察得到的初始時間序列數據,通過曲線擬合和參數估計建立數學模型的理論和方法。ARIMA模型認為依照時間順序進行排列的所有觀測值之間都具有自相關性,這種自相關性延續了變量的發展趨勢。若將這種自相關性用定量的方法描述,就可以依據時間序列的過去值預測其將來值。該模型構建思路如下。

(1)序列預處理:原始時間序列經過預處理,可以被識別為平穩非白噪聲序列,就能夠利用模型對該數據序列進行建模。

(2)模型識別:由給出的序列樣本,根據樣本自相關系數和偏自相關系數的性質,選擇階數適當的ARMA(p, q)模型進行擬合。

(3)參數估計:根據識別的模型及階數,對模型進行參數估計和顯著性檢驗。

(4)模型的構建:記原始時間序列數據為at(t=1,2,3,...,n),記at的秩為Rt=R(at),考慮變量對(t,Rt)(t=1,2,3,...,n)的Spearman的相關系數qs,則有(14)數據。

(5)平穩性檢驗:假設H0為平穩序列,H1為非平穩序列。對于顯著水平a,由時間序列at計算(t,Rt)的Spearman秩相關系數qs,若T>ta2(n-2),則拒絕H0,認為序列非平穩。且當qs>0時,認為序列有下降趨勢。又當T>ta2(n-2)時,接受H0,可以認為序列是平穩序列。

1.3組合預測模型

灰色模型是通過對原始數據加工處理來弱化隨機性的,若數據存在較大的波動性,預測出來的結果可能會存在較大誤差。ARIMA模型對于預測的模型比較理想,要求時序數據是穩定的,或者是進行差分后是穩定的,往往需要對數據進行預處理,導致預測的精度不夠準確。單一的預測模型均存在一定的局限性,很難把握預測結果的準確性,從而使得誤差較大。組合模型可以通過對各個預測模型加權平均,把單一預測模型的優點集合起來,形成預測精度更高的預測模型,可以大大減小誤差,使得結果更加準確。

設原始序列的為X(0),預測序列為X^(0),觀測樣本數列為N,預測樣本數為k,組合模型為(15),其中ω1,ω2的公式為(16)[4]。

式中:X^(N+k)(0)表示組合模型的k個預測值,X^(N+k)(1)表示灰色模型的k個預測值,X^(n+k)(2)表示ARIMA模型的k個預測值。ω1,ω2分別表示灰色模型、ARIMA預測模型的權重,σ1,σ2分別表示灰色模型、ARIMA預測模型的標準差。

檢測結果表明,該組合預測方法優于單一預測方法,由此可得最優的組合預測模型。

2實證分析

選取2005~2019年的《新疆統計年鑒》中新疆維吾爾自治區棉花產量(單位為萬噸)年度數據為研究對象,對棉花產量進行短期預測。

2.1 GM(1, 1)預測模型

按照GM(1, 1)的模型求解思路,建立傳統GM(1, 1)模型,得到時間響應公式(17)。

利用Matlab軟件求解GM(1, 1)模型,將新疆歷年棉花產量作為訓練數據,預測值與真實值的曲線擬合結果如圖1所示。

一般情況,如果絕對誤差百分比MAPE≤10%,同時遠點誤差小于2%時可以認定研究結果滿足精度的要求。由模型擬合結果可得:MAPE=0.0764SymbolcB@

0.1認為模型精度誤差滿足要求。后驗差比值C=0.2828<0.35,小誤差概率p=1>0.95,認為精度檢驗合格。綜上可知,本次GM(1, 1)灰色預測模型精度檢驗合格。模型精度等級為1級,模型擬合結果良好,建立的模型所得的預測值誤差較小,其模型方程為(18)。將數據代入公式(18)中,可預測出棉花近幾年的總產量,具體預測數據見表2。

2.2時間序列預測模型

ARIMA模型要求序列是平穩序列,因此要對數據進行平穩性分析。對樣本數據進行ADF檢驗,發現原始序列是非平穩序列,經二階差分后的P值<5%,在5%的顯著性水平下是平穩序列。棉花產量序列經二階差分后的自相關圖ACF和偏自相關圖PACF,如圖1所示。

由圖2也可以看出,二階差分后,數據逐步趨于平穩,且滿足置信區間,故差分次數d=2。差分后的序列可以通過自相關圖和偏自相關圖初步確定p和q的值,由圖2可知,延遲5階后,ACF和PACF均落在二倍標準差范圍內,因此該數據序列滿足ARIMA(5,2,1)模型。

2.3組合預測模型

對于上述兩種單一預測模型的預測精度不高、數據波動較大等問題,若結合以上兩種單一預測模型的特征,構建組合預測模型,經計算可得,GM(1,1)模型與ARIMA模型的組合權重系數分別為0.46497和0.53503。預測值與真實值的具體數據見表2。

基于灰色預測模型與ARIMA模型得組合預測模型,較好地結合了兩種單一模型的優點,能夠有效地擬合非線性波動及非線性增長趨勢。從表2可以看出,組合預測模型的平均相對誤差(MAPE)小于GM(1,1)模型與ARIMA模型這兩種單一預測模型。說明組合預測模型有較高的預測精度,取得很好的預測效果,預測精度較兩種單一預測模型有了很大的提高,實證分析結果表明該方法是有效和實用的,灰色預測模型與ARIMA模型的組合預測模型可以為相關從業者科學準確地預測新疆棉花產量提供依據和實踐參考。

3結論

單獨采用灰色理論預測模型和時間序列模型進行預測時,由于各個單一預測模型自身條件的限制,不能全面準確地掌握原始數據的信息,影響預測結果的準確性。而通過加權組合方式對兩個單一預測模型進行組合,獲到的組合預測模型彌補了兩種單一預測模型自身的不足。本文基于灰色GM(1, 1)模型與時間序列ARIMA模型,通過加權組合方式將兩種單一模型很好地融合在一起,并選取2005~2019年的新疆維吾爾自治區棉花產量年度數據為研究對象,對棉花產量進行了短期預測。實證分析結果表明組合模型預測的精度和穩定性高于單項預測模型。因此,這種組合預測模型用于棉花產量預測是有效可行的。這為復雜性時間序列的建模和預測提供了切實可行的方法。

參考文獻

[1]李娟麗, 許英. 基于ARIMA模型的新疆棉花產量的預測分析[J]. 教育現代化,2018,5(17):149-150.

[2]佟長福, 史海濱, 包小慶, 等. 基于小波分析理論組合模型的農業需水量預測[J]. 農業工程學報,2011,27(05):93-98.

[3]張利平, 于貞杰, 張建華, 等. 六種時間序列組合建模方案在衛生費用趨勢擬合中的應用研究[J]. 中國衛生經濟, 2015,34(08):56-58.

[4]邢棉. 季節性預測的組合灰色神經網絡模型研究[J]. 系統工程理論與實踐,2001, 21(01):31-35.

[5]朱輝.GM(1, 1)模型在新疆生產建設兵團棉花總產量預測中的應用[J]. 安徽農業科學,2008(20):8399-8400.

[6]陳黎明, 傅珊. 基于組合預測模型的GDP統計數據質量評估研究[J]. 統計與決策,2013(08):8-11.

[7]單銳, 王淑花, 高東蓮, 等. 基于時間序列模型與灰色模型的組合預測模型的研究[J]. 燕山大學學報,2012,36(01):79-83.

[8]李曉彤. 基于小波分析的灰色模型與ARMA-GARCH模型的組合預測[D]. 濟南: 山東大學,2018.

[9]楊中旭. 棉花產量的Fuzzy預測法[J]. 江西棉花,1995,17(01):18-21.

[10]鄧聚龍. 灰色系統理論教程[M]. 武漢: 華中理工大學出版社, 1990.

猜你喜歡
時間序列預測
選修2—2期中考試預測卷(B卷)
選修2—2期中考試預測卷(A卷)
選修2—2期中考試預測卷(A卷)答案與提示
選修2—2期中考試預測卷(B卷)答案與提示
上證綜指收益率的影響因素分析
基于指數平滑的電站設備故障時間序列預測研究
基于時間序列的我國人均GDP分析與預測
基于線性散列索引的時間序列查詢方法研究
基于組合模型的能源需求預測
《福彩3D中獎公式》:提前一月預測號碼的驚人技巧!
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合