謝妮妮
(西安財經大學行知學院經濟與統計學院,陜西 西安 710038)
時間序列分析最早誕生于7 000年前的古埃及。到20世紀末[1],數學家詹金斯(Jenkins)和博克思(Box)建立并提出了ARIMA模型,即自回歸積分滑動平均模型(Autoregressive Integrated Moving Average Model,以下簡稱ARIMA),時間序列分析得到進一步完善,并被更廣泛應用。近年來,越來越多的國內外學者采用時間序列分析法對不同地區的GDP進行研究,探索并尋找發展變化規律,利用對未來事物的發展狀況或趨勢進行有關預測。例如,在商業領域可以用于預測股票及基金的趨勢,進行炒股及基金理財等;在農業領域可以用于研究農作物價格及產量的變化,增加收益等;在自然領域可以用于預測天氣變化及溫度的變化等;在社會領域可以用研究出生率、死亡率及犯罪率等。所以,時間序列分析的預測作用在實際生活中具有極其重要的作用。
GDP可以顯著反映區域經濟發展情況,GDP是衡量經濟生活甚至社會生活的重要指標和核心尺度之一。GDP為政府對宏觀經濟發展狀況進行戰略制定和對經濟政策進行制定時提供了極其重要的參考依據,而且對宏觀經濟健康平穩發展起到導向作用,還可以利用其研究結果對經濟發展趨勢進行精準預測,從而更好促進經濟和社會發展。所以,對GDP進行深入的研究具有極其重要的實際價值和參考意義。
時間序列分析法的研究對象是動態數據,通過借助統計分析等方法,探尋隨機數列所遵循的統計規律,對已經獲得的歷史數據進行分析及預測,從而解決實際問題。
從陜西省統計局發布的《陜西七十年》和《陜西統計年鑒》中,選取1952—2019年陜西省GDP數據并對其進行分析。確定模型之前,先利用EXCEL對GDP序列進行趨勢分析。如圖1所示。
圖1 陜西省GDP(生產總值(億元))折線圖
由圖2可得,陜西省GDP具有明顯的指數增長趨勢,可以觀察得出該時間序列為非平穩序列。陜西省GDP的變化趨勢與指數趨勢擬合,所以選用指數函數來擬合陜西省GDP(億元)。
圖2 陜西省GDP(生產總值(億元))指數趨勢擬合圖
ARIMA(p,d,q)[2]中,AR為“自回歸”,p是自回歸項數[3];MA是“滑動平均”[4],q是滑動平均項數[5],d是使之成為平穩序列所做的差分次數(階數)[6]。ARIMA模型可以表示為[7]:
其中L是滯后算子,d∈Z,d>0。非平穩時間序列經過差分處理后可以轉換為平穩時間序列,其中差分的次數就是齊次的階。
將?記為差分算子,那么有
對于延遲算子B,有
因此可以得出
設有d階其次非平穩時間序列yt,那么有?dyt是平穩時間序列,則可以設其為ARMA(p,q)模型,即
其中λ(B)= 1-λ1B-λ2B2-…-λPBP,分別為自回歸系數多項式和滑動平均系數多項式。為零均值白噪聲序列??捎洖锳RIMA(p,d,q)。
2.1.1 模型識別相關概述
由圖3時間序列趨勢折線圖可知,隨著時間推移,序列季節波動幾乎接近平滑,越來越小,所以該時間序列季節成分不顯著。由于ARIMA模型要求序列是平穩的,所以對GDP數據序列進行一階拆分,由其結果可知,陜西省GDP序列在零比線兩側的時間跨度為平均差,因此認為是穩定的。對拆分后的GDP時間序列進行ACF(自相關)和PACF(偏自相關)分析可得,自相關呈現逐漸衰減的趨勢,由此可知自相關拖尾;偏自相關呈斷落式下跌,由此可知偏自相關截尾。
圖3 陜西省GDP(生產總值(億元))時間序列趨勢圖
2.1.2 模型檢查和相關分析
ARIMA模型結果為:
如表1、表2、表3所示,決定系數R2越接近于1,模型效果擬合越好,由于R2=0.998,所以擬合效果非常好,AR和MA的系數分別是0.527和-0.415,有效性在0.01以下,系數不是0。綜上可認為,該模型擬合效果很好。通過時間序列趨勢折線圖、ACF和PACF分析等可知序列是平穩的。綜上所述ARIMA(1,2,1)是合理的。
表1 模型描述
表2 模型統計量
表3 ARIMA 模型參數
2.1.3 模型預測及相關分析研究
因此,ARIMA模型結果為:
最后,使用上述模型對陜西省GDP時間序列進行擬合預測,通過模擬實驗發現,上述模型擬合效果很好。由大量模擬實驗可得,目前使用ARIMA(3,1,3)模型預測了2019年陜西省GDP的自然對數。2019年至2021年的預測結果見表4。
表4 ARIMA模型預測結果
表5 輸入/移去的變量b
2.1.4 模型的回歸分析
對陜西省GDP及第一、二、三產業的相關數據通過SPSS進行研究分析,結果如下所示:
如上表6所示,模型適應系數(包括第一、第二和第三產業的三個變量)的調整判定系數為1.000。Durbin-Watson測試的結果是1.487,說明因變量的取值不存在序列相關。
表6 模型匯總b
表7顯示,模型的有效性水平為0.000,與回歸模型合作有意義。但是,無效變量被刪除時,F會增加。這表明僅包括第一,第二,第三產業的三個變量的模型的適應性最好。
表7 Anova b
如果模型的容量極限小于0.1并且色散擴大系數大于10,則存在變量之間的多共線性。因此,從表8可以得出結論,三個獨立變量沒有多重共線性。GDP與第一、第二、第三產業有著積極的關系。所以,有回歸系數表可得回歸模型為:
表8 系數a
其中,y是GDP,x1是第一產業,x2是第二產業,x3是第三產業。
本研究通過對1952—2019年陜西省的GDP時間序列數據進行大量擬合實驗,并經研究分析可知,由于一個時間序列與其ACF及PACF存在錯綜復雜的關系,所以對時間序列進行建模,以及識別時間序列模型并非易事,需要對時間序列進行大量實驗并結合實驗結果進行研究分析,才能得到理想的結果,從而更好地判別和選擇最優模型。首先,對1952—2019年陜西省的GDP時間序列進行研究,然后建立了ARIMA(1,2,1)模型,最后通過對時間序列模型參數的變換,生成了殘差序列中的白噪聲序列。其次,通過對1952—2019年陜西省的GDP時間序列建模結果進行分析研究,發現運用SPSS軟件建立的時間序列模型的擬合效果更具有實際價值,也更有可信性,所以可利用該模型對2011—2019年的陜西省GDP進行預測,同時將相對誤差控制在5%之內,可以得出較為準確的結果,從而更好地預測未來幾年陜西省GDP的發展情況,有助于促進經濟發展。最后,從GDP變化的角度對經濟預測進行了分析,提高了經濟預測的準確性和實際價值,本研究可以為國家宏觀經濟政策和發展戰略的調整、宏觀經濟平穩健康發展,以及人口變化和宏觀經濟指標的調整等提供參考依據,可以有效規避一些經濟活動中隱藏的風險,從而更好促進陜西省以及我國經濟健康發展。