?

灰色模型和ARIMA模型在專利授權數預測中的應用

2024-03-04 02:34杜彤彤
中國新技術新產品 2024年1期
關鍵詞:差分天津市專利

杜彤彤

(天津商業大學,天津 300000)

我國知識產權事業不斷發展,發明專利是知識產權的一種形式,作為技術創新信息的載體,發明專利的授權數量可以在一定程度上反應社會公眾創新意識的程度,其中專利價值既包括對全社會知識存量貢獻的社會價值,又包括其所創造的經濟價值[1],與地區發展之間有密切聯系。地區發明專利的授權數量可以較好地衡量地區突破性技術創新水平,反映地區的綜合實力[2]。本文運用ARIMA 模型和GM(1,1)模型對天津市發明專利的授權數量分別進行預測。通過本文的研究,為天津市出臺加強知識產權保護政策提供參考,同時能加深對知識產權保護和成果轉化的重視程度,在此基礎上對天津市制定地區專利規劃提出合理建議,具有重要的理論和現實意義。

1 理論依據

1.1 數據來源

本文為衡量天津市的綜合創新能力,選取2003—2020年天津市發明專利的授權數量作為原始數據,共18 期數據,來預測2021年和2022年兩年天津市發明專利的授權數量,數據均來源于天津市統計年鑒。

1.2 模型說明

1.2.1 ARIMA 模型

本文選擇ARIMA 模型來建立預測模型。ARIMA 模型的全稱是差分自回歸移動平均(Auto-Regressive Integrated Moving Average)模型,其是由Box 和Jenkins 提出的時間序列預測方法,是一種精度較高的時間序列短期預測方法,目的是根據過去的行為對未來的行為進行預測。ARIMA 模型的基本思想是將預測對象隨時間推移而形成的數據序列視為一個隨機序列,用一定的數學模型來近似描述這個序列,這個模型一旦被識別后就可以通過時間序列的過去值及現在值來預測未來值,在實際分析的過程中,對于不平穩的時間序列來說,經過d 次差分,轉化為平穩序列后服從ARMA(p,q)模型,則稱時間序列服從于ARIMA(p,d,q)模型,具體模型形式如公式(1)所示。

式中:yt為t年份的專利授權數取對數;φp為自相關系數;θq為滑動系數;εt-q為q階誤差值。

具體建模步驟如下:首先,判斷序列的平穩性,如果數據非平穩,那么對原序列進行d 階差分運算,使其轉化為平穩序列。其次,根據時間序列的自相關系數(ACF)和偏自相關系數(PACF)識別參數p、q,擬合合適的ARMA模型。最后,檢驗模型參數是否顯著,殘差是否為白噪聲序列,判斷模型的擬合程度和有效性,并利用所擬合的模型對未來數據進行預測分析。

1.2.2 GM(1,1)模型

灰色預測是對含有已知和未知信息的系統進行預測,通過對系統因素之間的發展趨勢進行關聯分析,尋找其變化的規律,并對事物的發展趨勢進行預測。主要特點是模型使用的不是原始數據序列,而是生成的數據序列?;疑A測所需的樣本較少,且對于具有不確定性因素的復雜系統預測效果較好,GM(1,1)預測模型是其最常見的模型,常被用于經濟預測分析。具體模型如公式(2)~公式(5)所示。

設原始序列:

通過一次累加生成新序列:

并做出X(1)的緊鄰均值序列:

建立GM(1,1)模型:

式中:x(0)(k)為原始數據,即已知年份專利授權數;a為發展系數,它反映的是x(1)和x(0)之間的發展態勢;b為灰作用量,它的大小反映數據變化之間的關系。z(1)(k)為通過一次累加生成新序列后的緊鄰均值序列數據。

模型最小二乘估計滿足公式(6)。

求解a,b后,得到GM(1,1)灰色微分方程的白化方程,如公式(7)所示。

其離散解,如公式(8)所示。

式中:a為發展系數,其反映x(1)與x(0)之間的發展態勢;b為灰作用量,其大小反映數據變化之間的關系。

最終得到還原值,如公式(9)所示。

對得出的模型進行殘差檢驗和后驗查檢驗。

其次,計算其相對誤差序列,如公式(12)和公式(13)所示。

最后,計算平均相對誤差,如公式(14)所示。

平均相對誤差值越小,說明模型的預測效果越好。使用后驗差檢驗時,計算原始序列的標準差,如公式(15)所示。

式中:X(0)(i)為原始序列。

和絕對誤差的標準差如公式(16)所示。

計算方差比,如公式(17)所示。

和小概率誤差如公式(18)所示。

式中:S1為原始序列的標準差。

根據方差比和小概率誤差的值對比后驗查檢驗判別參照表判斷模型的精度。

2 實證分析

2.1 ARIMA 模型預測

首先,檢驗原始時間序列是否具有平穩性,根據2003—2020年天津市發明專利的授權數量對數繪制專利授權數量對數隨著年份變化的時序圖,觀察圖中走勢可以發現,專利授權書對數隨著年份更迭呈現穩定增長的趨勢。為精確地判斷序列的平穩性,運用SPSS 軟件對序列進行單位根檢驗,并選擇適合的差分階數對序列進行平穩化處理(見表1)。對數時序圖如圖1所示。

圖1 專利授權數量對數時序圖

表1 一階差分序列ADF 檢驗結果

由檢驗結果可知,原始序列不能拒絕存在單位根的原假設,因此原始序列不平穩。對一階差分序列檢驗的P<0.05,因此拒絕原假設,一階差分序列具有平穩性。通過觀察一階差分時序圖的走勢可以發現,在一階差分時序圖中的時間序列走勢已經趨于平穩狀態,觀察表1 可知,0階差分時的P值為0.265,1 階差分時的P值為0.007,根據一階差分序列ADF 的檢驗結果和時序圖走勢可以判斷在一階差分序列已經趨于平穩狀態。因此,確定ARIMA(p,d,q)模型中d=1。根據一階差分序列的自相關系數和偏自相關系數可確定模型中p和q的值。

一階差分序列自相關系數和偏自相關系數見表2,由1-15 階延遲的自相關系數變化趨勢和偏自相關系數變化趨勢可以看出偏自相關。函數表現為拖尾,自相關函數表現為一階截尾,經過多次模型檢驗,并采取最小AIC 準則,最終本文選擇的模型為ARIMA(0,1,1),模型參數估計見表3。

表2 一階差分的自相關性

表3 模型參數估計

對模型殘差進行白噪聲檢驗,得出1-12 階的AC值分別為0.001、-0.061、0.157、0.041、-0.073、0.113、0.081、-0.080、-0.234、0.139、-0.012、-0.084。

PAC值分別為0.001、-0.061、0.158,0.036、-0.056、0.097,0.062、-0.055,-0.263、0.114、-0.007、-0.004。

標準誤差分別為0.00004,0.0796、0.6464、0.6883、0.8315,1.2059、1.4170、1.6473,3.8532、4.7385、4.7458、5.2007。

2-12 階的p值分別為0.778、0.724、0.876,0.934、0.944、0.965、0.977、0.870、0.856、0.907、0.921。

可以看出各階相關系數的p值>0.05,說明殘差為白噪聲序列,原始序列中的有效信息已被充分提取。

根據表中模型參數估計的結果可知:C值為0.184358,MA(1)的值為0.744589,模型擬合公式如公式(19)所示。

式中:yt為預測值;εt-1為t-1 時刻的殘差。

用模型對2019年和2020年天津市發明專利的授權數量進行預測,將得到的數據與實際數據進行對比,并利用該模型對2021年和2022年天津市發明專利的授權數量進行預測,得到的結果見表4。即通過ARIMA(0,1,1)模型預測的2019年和2020年天津市發明專利的授權數量的相對誤差分別為0.08 和0.05。

表4 模型ARIMA(0,1,1)預測值和預測誤差

2.2 GM(1,1)模型的預測

GM 模型適應于小樣本情況,為選擇最佳數據維度,列舉2013—2018年、2012—2018年及2011—2018年的數據對2019年和2020年的預測結果。選用后驗查檢驗對模型進行檢驗和選擇。其中,m為數據維度,c為模型方差比,p為小殘差概率。根據預測結果并結合后驗查檢驗判別參照表,選取m等于7 的GM(1,1)模型對2021年和2022年天津市發明專利的授權數量進行預測,所得到的預測數據見表5。通過GM(1,1)模型預測2019年天津市發明專利的授權數量2013—2018年、2012—2018年及2011—2018年的相對誤差分別為0.17、0.06、0.08;2020年天津市發明專利的授權數量2013—2018年、2012—2018年及2011—2018年的相對誤差分別為0.13、0.03、0.08。

表5 模型GM(1,1)預測值和預測誤差

2.3 模型預測結果對比

從表6 可以看出ARIMA(0,1,1)模型和GM(1,1)模型預測的平均相對誤差都較小,ARIMA(0,1,1)模型預測的平均相對誤差為0.065,而GM(1,1)模型預測的平均相對誤差為0.045。對于預測天津市發明專利的授權數量,GM(1,1)模型的預測結果更精準,更適用于小樣本情況下的短期預測。

表6 模型預測結果對比

3 結論

利用GM(1,1)模型所預測2021年和2022年的預測值與實際值之間的平均相對誤差<5%,說明該模型的預測結果可靠,可以用該模型預測未來天津市發明專利授權數量的變化規律。通過ARIMA(0,1,1)模型和GM(1,1)模型的預測結果可知,天津市發明專利授權數量呈上升趨勢,創新能力將進一步提高。地區的發明專利對其經濟高質量發展有促進作用,這體現了創新對于社會發展的重要意義。提高創新能力,加大創新對社會經濟的影響應注重以下幾個方面。首先,應從公眾角度提高社會公眾的產權意識。其次,專利數量是衡量地區創新能力的一種方法,應重視創新質量的提升,要協調專利數量和質量的協調發展。最后,提高各產業積極投身于創新研發的動力,激勵更多的人們投身于高質量創新的事業中,不斷促進社會主義市場經濟的發展。

猜你喜歡
差分天津市專利
專利
數列與差分
有趣的云
如果畫筆會說話?
發明與專利
天津市第三屆“未來之星”初中數學邀請賽
基于差分隱私的大數據隱私保護
相對差分單項測距△DOR
差分放大器在生理學中的應用
專利
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合