?

固定效應部分線性單指標空間自回歸面板模型的二次推斷函數估計

2023-12-14 14:04丁飛鵬
高校應用數學學報A輯 2023年4期
關鍵詞:估計量參數估計生產力

丁飛鵬

(江西財經大學 統計學院,江西南昌 330013;江西師范大學 數學與統計學院,江西南昌 330022)

§1 引言

眾多領域的數據呈現空間效應(即空間相依性和空間異質性)問題,這與經典計量理論的基礎假設相違背,導致經典計量分析方法難以解釋這種空間效應,為此,計量經濟學家建立了空間計量模型.該模型自提出后,引起了學術界的高度重視.文[1-2]詳細地描述了空間計量模型的理論方法及應用.在各種空間計量模型中,空間自回歸模型(SAR)受到了極大關注,大量針對該模型的估計方法相繼建立,例如,糾正普通最小二乘法(參見文[3]),矩估計法(參見文[4]),廣義矩估計法(參見文[5-7]),準極大似然估計法(參見文[8-10]).這些模型的特點是通常假設回歸函數為線性或已知的非線性形式.然而在實際應用中,變量間的空間計量經濟關系往往存在高度非線性,而且事先也很難預知回歸函數的形式,因此采用這些模型進行實證分析,容易出現模型誤設現象,影響結論分析的準確性.

非參數計量方法的出現,為解決模型誤設問題提供了新的途徑.該方法降低了對回歸函數形式的要求,能夠提供更好的擬合效果,在計量理論和實證分析中得到了廣泛研究和應用.目前,一些學者已將非參數計量技術引入空間計量模型中,建立了大量非參數空間計量模型及其估計方法.文[11]將邊際積分法和局部線性法結合,研究了空間數據的非參數回歸模型,并建立了漸近理論;與文[11]不同,文[12]在誤差項存在空間相關性,條件異質性及非同分布的條件下,研究了空間數據的非參數回歸模型,在給定一些充分條件下,推導了模型的大樣本性質;文[13]為部分線性空間自回歸模型建立了截面極大似然估計法;隨后,文[14-15]將截面極大似然估計法分別應用于非參數空間動態模型和部分線性單指標空間自回歸模型的研究中;然而,截面極大似然估計法無法獲得解析表達式,因此在實際中不易實施,為此,文[16]建議采用廣義矩法估計半參數空間自回歸模型;根據文[16]的建議,文[17-18]采用廣義矩估計法分別研究了部分線性單指標空間自回歸模型和部分線性可加空間自回歸模型;文[19]則考慮了隨機場(random fields)下的非參數空間自回歸模型,推導了估計量的大樣本性質;文[20]為部分線性單指標空間自回歸模型建立貝葉斯估計法.

最近,面板數據計量模型發展迅速.其主要原因是面板數據具有純截面數據和時間序列數據無可比擬的優點:一是面板數據具有更多的自由度,可讓研究人員估計更復雜的模型;二是面板數據可以消除異質性問題,估計結果更加有效;三是可減少共線性等問題的出現.基于此,一些學者將非參數空間計量模型與面板數據計量模型結合,建立了非參數空間面板模型.當前關于非參數空間面板模型的文獻還較為有限,文[21]結合樣條函數及半參數最小二乘法,研究了誤差項具有空間異質和空間相關情形下的半參數空間面板固定效應模型;文[22]則考慮了半參數空間動態面板固定效應模型,為模型建立了兩階段最小二乘法,并證明了估計量的大樣本性質;文[23]采用空間異質懲罰算法(algorithm based on spatial anisotropic penalties)研究了一種半參數空間自回歸面板模型,該模型的特點是時空趨勢具有非參數形式,時間序列方向存在自相關性.

與通常的非參數模型類似,非參數空間面板模型也存在“維數災難”現象,即隨著非參數部分協變量維數的增加,估計精度會不斷降低.部分學者建立了具有降維功能的半參數空間面板模型以克服“維數災難”現象,其中包括單指標空間自回歸面板模型(見文[24]).與文[24]不同,本文將研究個體內存在相關性下部分線性單指標空間自回歸固定效應面板模型,這主要基于以下幾點考慮:一是所述模型具有顯著的降維功能;二是所述模型不僅保留了非參數空間面板模型的靈活性,還通過加入線性部分,增加了模型的解釋力,更具實用性;三是實際中的面板數據在個體內通常存在相關性,若忽略該相關性,將減少估計量的有效性,甚至影響估計量的一致性;四是固定效應模型應用范圍更廣.

本文其余部分安排如下:§2介紹相關的模型及其估計方法;§3說明在實際操作中的一些問題;§4給出了模型估計量的大樣本性質,并提供了相關證明;§5采用Monte Carlo模擬和實際數據分析評價了模型及估計方法在有限樣本下的表現;最后對全文進行了總結.

§2 模型及其估計方法

假設個體數N較大,時期數T固定.所述模型的數學形式為

其中γl為樣條函數系數,l=1,···,q.將式(4)代入式(3)中,有

記B(·)=[B1(·),···,Bq(·)]′,γ=(γ1,···,γq)′.則式(5)可重寫為

式(6)的矩陣形式為

式(7)的均衡表示形式為

其中S(ρ)=[(IN-ρW)?IT]-1.令uW=S(ρ)(Xβ+B(Zθ(ψ))γ),?=(ρ,β′,ψ′,γ′)′.經過簡單計算可得

其中?=IN ?V,V為ei=(ei,1,···,ei,T)′的協方差矩陣(本文假設誤差項滿足同分布假設),i=1,···,N.式(9)中,α為干擾參數,采用差分方法雖然可以消除該個體效應,但將導致部分信息損失,影響連接函數的估計.根據識別條件,本文采用LSDV法消除個體效應,即給定參數向量?的值,α的值為

將式(10)代入式(9),于是有

其中LD=INT-D(D′D)-1D′.在式(11)中,協方差矩陣V是未知的,若用其估計值代替,將損失大量的自由度,損害估計量的有效性.按照文[25]的建議,采用已知對稱基矩陣的線性組合近似V-1,

其中M1,···,Ms為已知對稱矩陣,a1,···,as為未知常數.式(12)說明

將式(13)代入式(11)中有

為避免估計常數a1,···,as,構建擴展計分函數

顯然E(gN(?))=0,參數向量的估計值?可由矩條件gN(?)=0獲得.事實上gN(?)的方程個數為s(d+p+q) 大于未知參數的個數,因此矩估計法不可行,需訴諸于廣義矩估計法,為此令

由于QN(?)具有非線性形式,因此無法獲得參數向量?的解析表達式,需要運用迭代算法.本文中,采用Newton-Raphson迭代算法.

§3 一些實際操作問題

3.1 算法的實施步驟

設?(0)為任意參數向量值,在?(0)的鄰域內利用Talor展式可知

第一步 利用兩階段最小二乘法獲得參數估計的初始值?(0);

第二步 給定第k步的迭代值?(k),則第k+1步的迭代值為

第三步 不斷重復第二步,直到滿足給定收斂準則為止.

3.2 基矩陣的選擇

對于常見的一些特殊相關結構,基矩陣M1,M2,···,Ms的選擇并不困難.例如對于一階自相關的結構,可以選擇M1=IT,IT為T階單位矩陣,M2為次對角線元素為1,其它為0的矩陣,M3為在(1,1)和(T,T)的位置為1,其它為0的矩陣,在實際應用中,M3通常省略;對于等相關結構,通常M1的選擇與一階自相關結構相同,的對角元素為0,非對角元素為1的矩陣;若相關結構不確定,則可同時使用矩陣M2和,或應用自適用估計法(具體參見文[26]).基矩陣選取方法的詳細討論可參考文[25].

3.3 節點數的選擇

由于計算的復雜性,在模型估計時,無法做到同時確定樣條函數的階,節點的位置和節點的數量.一般的做法是,固定樣條函數的階,同時用等間距的方式選擇節點,剩余的工作就只需選擇合適的節點數.目前已有大量的節點數選擇方法:近似選擇法,AIC準則,BIC準則及廣義交叉確證法(詳細可參見文[27]).本文采用BIC準則選擇節點數,其統計量為

實際操作中,通常采用網格搜素法尋找最優的節點數.

§4 漸近性質

4.1 漸近理論

A7.(i) 空間加權矩陣W的元素為已知常數,對任意空間相關系數ρ ∈(-1,1)有IN-ρW是非奇異的;(ii)W和(IN-ρW)-1的行與列元素的絕對值和均是一致有界的.

這是都是常用的假設條件,實際應用中很容易驗證.假設條件A1是為了大概率保證處于分母的變量不為零;假設條件A2主要用于說明非參數估計量的收斂速度;假設條件A3表明誤差項滿足中心極限定理的條件;假設條件A4主要是保證可以選擇到合適的樣條函數,條件→0是定理證明的需要,在此條件下,函數的經驗內積將足夠接近其理論內積;假設條件A5為保證加權矩陣CN的特征值有界;假設條件A6 確保均值項有限,同時說明用非參數技術估計X的條件期望時的收斂速度,該條件可減弱為E(X|Z,Zθ)滿足一階連續可導,見文[28];假設條件A7是空間相關系數及空間加權矩陣的基本假設.

定理4.1在假設條件(A1)–(A7)下,連接函數的估計量實現了最優收斂速度,即

4.2 定理的證明

引理4.1在假設條件A2下,存在參數向量γ0和某個常數C,使得

證證明的細節請參見文[29].

再次由a的任意性可知‖ξ2k‖=Op((Nh)-1/2).定理結論得證.

引理4.3在假設條件A1-A7下,的特征值有界,進一步,對任意? ∈ΘN(C)有

引理4.4在假設條件A1-A7下,有

證要證明式(28)中的結論成立,只要證明結論對每個分量成立即可.根據各表達式的定義可知,對k=1,···,s有

引理4.5在假設條件A1-A7下,存在常數C=C(ε),使得當N →∞時,

同理由假設條件A5,存在常數C2有

定理4.1的證明由引理4.4及4.5立即可得

式(37)說明定理4.1的結論成立.

定理4.2的證明首先類似于文[30],由引理4.4,不難證明

另一方面,根據Newton-Raphson算法,Talor展示及定理4.1的結論可知

式(39)表明

進一步由引理4.3知,存在存在系數矩陣Λ,使得

綜上可得‖J2‖=Op(h2r)=op(N-1/2).

綜合上述結論立即可得定理4.2的結論成立.

§5 數值研究

5.1 Monte Carlo模擬

表1為參數估計量在自相關結構下的表現.從表1可知,無論空間加權矩陣是Rook矩陣還是Queen矩陣,在ρ=0.3和ρ=0.8下,MAD值均隨著個體數N的增大而下降,且數值大小逐漸接近于0,表明參數估計值與真實值的接近程度隨個體數N的增加而增加,均符合大樣本性質的表現;同樣S.E.值也隨著個體數N的增大而減少,且數值趨于0,表明估計方法的穩健性隨N的增大而增大.進一步,Rook矩陣下的數值大小與Queen矩陣非常接近,說明估計方法的表現與空間加權矩陣的選擇無關.表2為等相關結構下參數估計量的表現.與表1類似,可得出以下三個結論:一是估計方法的表現與空間加權矩陣的選擇無關;二是參數估計量的表現符合大樣本性質;三是隨著N的增大,估計方法的表現越來越穩健.表3為獨立結構下參數估計量的表現,與表1和表2的情況類似,參數估計量的表現符合大樣本性質,估計方法的表現隨N的增加而更加穩健,且與空間加權矩陣的選擇無關.綜上所述,所述方法在參數估計方面具有非常優越的表現,且不會因空間相關程度及空間加權矩陣的改變而改變.

表1 自相關結構下參數估計量的表現

表2 等相關結構下參數估計量的表現

表3 獨立結構下參數估計量的表現

表4為非參數估計量的表現.從表4的數值可以看到,在Rook矩陣和Queen矩陣下MAISE的數值相近,說明非參數估計量的表現與空間加權矩陣的選擇無關.其次,在所有相關結構下,隨著個體數N的增加,MAISE的數值逐漸減小,表明連接函數的估計值與真實的連接函數隨著N的增加而不斷接近,符合大樣本性質的表現.最后,當ρ=0.3時MAISE的數值要小于ρ=0.8的數值,說明較強的空間相關性對非參數估計量具有一定的影響,但這種影響會隨著N的增加而不斷減少.

表4 非參數估計量的表現

例2 與兩階段最小二乘法(TLS)的比較為說明忽略個體內的相關性對估計量造成的影響,本文將所述方法與TSL法進行比較.數據產生過程與例1相同,個體數N=100,時期數T=5,zi,t的所有分量均獨立來自于參數為0.2和0.5的beta分布,θ=(2/3,1/3,2/3)′,其他變量的設置與例1相同,模擬次數為500,模擬結果分別呈現在表5至表8中.

表5 估計方法在自相關結構下參數估計量的比較

表5為本文所述方法與TLS在自相關結構下參數估計量表現的比較,從表中的數值可以看到,在所有的空間加權矩陣下,對所有的空間相關系數ρ的值,本文所述方法下所有參數估計量的MAD值和S.E.值要遠遠小于TSL的相應數值,表明本文所述方法在參數估計方面的表現要大大優于TSL,且與空間加權矩陣的選擇和空間相關系數的大小無關;表6為本文所述方法與TSL在等相關結構下參數估計量表現的比較,與表5的結果類似,在等相關結構下,本文所述方法的表現仍遠遠優于TSL;表7為本文所述方法與TSL在獨立結構下參數估計量表現的比較;類似與自相關和等相關的情形,本文所述方法仍然要優于TSL;表8為各種情形下本文所述方法與TSL在非參數估計量表現的比較,各數值均清晰地表明,在所有情形下,本文所述方法的MAISE值要遠遠小于TSL,本文所述方法的表現要更優越.綜上所述,當忽略個體內的相關性時,參數估計量的偏度和標準誤會偏大,連接函數的估計量與真實函數的偏度增大,導致估計量的精確度降低,損害了統計的推斷力.

表6 估計方法在等相關結構下參數估計量的比較

表7 估計方法在獨立結構下參數估計量的比較

表8 非參數估計量表現的比較

5.2 真實數據應用

本節中,將本文所述模型和方法應用于分析美國各州生產力的影響因素.數據為美國48個州1970年至1986年的生產力數據,變量的選取和度量與Baltagi和Pinnoi(1995)中所使用的變量一致,因變量為各州總產值(用Y表示),影響因素有勞動輸入(用L表示),私人資本(用PK表示),公共資本(用CK表示),失業率(用UNE表示),所有變量均為原始變量的對數值(除失業率外).由于主要關注本文所述模型和方法的應用,因此忽略數據測度的誤差.為避免“虛假回歸”,將針對差分后的變量進行分析.通過分析各變量差分與?Y之間的散點圖(限于篇幅,散點圖沒有在本文中報告)發現,?L和?UNE與變量?Y具有非常明顯的線性關系,其他變量差分與?Y具有不同程度的非線性關系,鑒于此建立模型

其中wi,j為空間加權矩陣W中的相應元素,空間加權矩陣是根據美國48個州的地理位置,按照Queen矩陣方式計算而得;(ρ,β1,β2,θ1,θ2)′為未知參數向量;αi為第i個州的固定效應;ei,t為隨機誤差項;i=1,···,48;t=1,···,16.運用本文所述方法對模型進行估計,估計結果呈現在表9和圖1中.

圖1 連接函數估計圖

表9 各參數估計結果

根據表9中本文所述方法的估計結果,空間相關系數ρ=0.217,說明各州之間生產力的增長存在正向空間溢出效應,意味著周邊地區的經濟增長會帶動本地區的經濟增長;β1=0.782<1表明勞動輸入對生產力具有正向影響作用,但生產力對勞動輸入缺乏彈性,即大量的勞動輸入并不能引起生產力的快速增長;β2=-0.256>-1表示失業率增長會阻礙生產力發展,但生產力對失業率同樣缺乏彈性,即失業率的上升不會導致生產力的大幅下降.

圖1為連接函數的估計圖,圖中虛線分別表示連接函數估計量的95%置信上下限(連接函數估計量置信上下限的獲得方法為:首先獲得樣條系數估計量的置信上下限,然后類似于連接函數的估計,進而得到置信上下限的估計量).觀察圖1中縱坐標和橫坐標數值發現,大多數情況下,資本增長率變化5個單位,生產力增長率變化不足一個單位,說明生產力對資本是缺乏彈性的;進一步用連接函數值除以單指標值作為生產力對資本彈性的度量,通過計算發現,當資本在0值附近時,生產力對資本的彈性非常大,接近于40,在其他地方的彈性均小于1,表明大部分情形下,生產力對資本缺乏彈性,只有在資本相當匱乏時,生產力對資本才富有彈性.此外,由θ1和θ2大于零表明,私人資本增長率和公共資本增長率對生產力增長率的影響均與單指標變量的影響方向一致,因而可推知,在大部分情形下,生產力對私人資本和公共資本是缺乏彈性的.

§6 結論及總結

本文研究了固定效應下個體內存在相關性的部分線性單指標空間自回歸面板模型.該模型不僅存在空間內生性,個體內還具有某種相關性,而且受到固定效應的干擾.為有效地估計模型,首先采用B樣條函數近似連接函數,采用LSDV法消除個體效應,再根據模型的特點,利用均衡模型的均值項與原模型的誤差項不相關的事實,結合二次推斷函數法,為模型構建了新的估計方法.該方法不僅消除了個體效應的干擾和空間內生性,還可以捕捉個體內的相關性,提高了估計量的有效性.進一步,在一些正則條件下,推導了連接函數估計量的收斂速度和參數估計量的漸近正態性.同時,采用Monte Carlo模擬評估了估計方法在有限樣本下的表現,結果發現,本文所述方法在有限樣本下的表現符合大數定律,且明顯優于忽略個體內相關性下的估計方法.最后,利用本文所述方法分析了美國各州生產力增長率的影響因素,結論表明,勞動輸入增長率對提高生產力增長率具有顯著的正向線性影響,失業率增長量會阻礙生產力增長率的提高,私人資本增長率和公共資本增長率對生產力增長率具有不同程度的非線性影響.

猜你喜歡
估計量參數估計生產力
基于新型DFrFT的LFM信號參數估計算法
Logistic回歸模型的幾乎無偏兩參數估計
淺談估計量的優良性標準
把“風景”轉化成“生產力
基于向前方程的平穩分布參數估計
基于競爭失效數據的Lindley分布參數估計
基于配網先驗信息的諧波狀態估計量測點最優配置
人口紅利與提高生產力
負極值指標估計量的漸近性質
展望2014:推動科技創新轉化為第一生產力
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合