?

內生轉換回歸模型理論與應用

2022-10-17 08:32王馨瑤任鈺田李心儀
統計與管理 2022年7期
關鍵詞:家庭收入內生投保

王馨瑤 任鈺田 李心儀

(東北農業大學 經濟管理學院,黑龍江 哈爾濱 150030)

一、引言

在經典的多元回歸模型中均有嚴格外生假定,但通常情況下該假定很難被滿足,所以學者們只要求同期外生,即弱外生性假定,要求擾動項與解釋變量同期不相關。然而,現實中這一假設也可能無法實現,從而出現內生性問題。因為內生性問題會破壞參數估計的一致性,使估計結果不具備參考價值,所以對內生性問題加以解決也是實證研究中的重要問題。一般而言,出現內生性問題的原因有四種:第一,遺漏解釋變量;第二,解釋變量與被解釋變量互為因果,有時也稱反向因果關系;第三,自選擇問題;第四,測量誤差問題?,F有多種方法可解決內生性問題,比如雙重差分法、工具變量法等。但在實證研究中,個體觀測很可能是一個選擇后的結果,由于只能觀測到個體的選擇行為以及選擇后的結果,直接將結果變量對決策變量回歸可能存在遺漏變量的內生性問題,所以可利用內生轉換回歸模型 (Endogeneous Switching Regression Model,簡稱ESR)來緩解這類問題。

Maddala和Nelson(1974)最早在轉換回歸模型的基礎上提出內生轉換回歸模型,用以解決樣本選擇偏差所帶來的內生性問題[1]。早期運用該模型的經典研究包括:Lee(1978)的工會薪酬模型,該模型涉及有工會部門和無工會部門這兩種選擇,通過選擇模型確定個人是否加入工會,并分別利用模型考慮兩種選擇時的工資情況[2];Thorst(1977)的住房需求模型,該模型涉及擁有住房和租用住房兩種選擇,利用選擇模型加以確定并分析兩種情景下的支出情況[3];Adamchik和 Bedi(1983)的公私營工資模型,該模型使用波蘭數據從預期收益和在特定部門工作的相關好處等方面經驗分析公營和私營條件下工人的工資差異[4]。

內生轉換回歸模型是一種拓展的Heckman選擇偏差矯正模型,較Heckman選擇模型而言具有明顯優勢。Heckman模型只能根據可觀察到的關系方程研究解釋變量和被解釋變量之間的關系,比如研究是否有孩子與工資之間的關系,但對于沒有工作的部分人而言不存在工資這一被解釋變量,從而因缺失值的出現造成樣本選擇偏差。此時,一般通過觀察樣本中的逆米爾斯比率糾正樣本分布,再估計兩者之間關系。而內生轉換回歸模型可通過同時關注到的兩種選擇情景下的實際情況推演被解釋變量和解釋變量之間的關系,并放松必須將共同影響因素全部納入方程的假設,除此之外,選擇方程也會受到兩種情境下被解釋變量的影響,如選擇方程為是否加入工會,這一選擇將會同時受到公共部門的工資和私有部門工資的影響,故利用內生轉換回歸模型可有效改善估計結果無效、有偏的問題。且內生轉換回歸模型考慮了處理效應的異質性問題,其在項目、政策效果評價方面均優于最小二乘估計 (OLS)和傾向得分匹配(PSM)方法[5]。傳統的回歸模型只能估計影響效應,不能同時觀測同一個體在選擇不同情景下時的行為,因此不能對比影響效應,而內生轉換回歸模型可以通過擬合實現反事實推斷,從而更好比較項目、政策的影響效果。正因為內生轉換回歸模型具有這些優勢,近些年國內學者也開始廣泛運用此方法以解決樣本選擇帶來的內生性問題,尤以2019年至2021年為主,研究多集中于農業經濟學領域。

二、理論研究

兩階段方法利用兩個回歸方程描述所表達的行為,并用一個準則函數Ii決定兩個方程式中的一個適用方程,方程式表達為:

這個模型與Goldfeld和Quandt(1973)所提出的轉換回歸模型相類似,但是假設μi與μ1i和μ2i相關,故該轉換模型被 Maddala和 Nelson(1974)[1]稱之為內生轉換回歸模型(ESR),該模型分為兩個階段:

第一個階段為選擇方程,這個選擇會帶來結果上的差異Ii*,這一差異不能被直接觀察到,可利用方程表達為:

第二個階段為結果方程,針對選擇情況分別分析影響因素,設定形式為:

方程 (4) 和方程 (5) 中 Zi是影響 y1i和 y2i的外生向量集,Xi可以與Zi重合,但需要存在至少一個屬于Xi卻不屬于Zi的變量,這類變量相當于工具變量。假設選擇方程 (3)、結果方程 (4) 和結果方程 (5) 的隨機誤差項μi、ε1i和ε2i均服從均值為0、方差為σ的三元聯合正態分布,其協方差矩陣形式可表示為:

其中,F和f分別為累積正態分布函數和正態密度分布函數。

內生轉換回歸模型中,相關系數ρ1i(ρ1i=σ1i2/(σiσ1i) ) 和ρ2i(ρ2i=σ2i2/(σiσ2i) ) 分別表示方程 (3) 與方程 (4) 和方程 (5) 誤差項之間的協方差,ρ1i和ρ2i的計量意義包括:第一,當ρ1i和ρ2i在統計水平上顯著時,說明存在不可觀測因素,其導致了選擇偏差,為得到具有一致性的估計結果,須同時考慮可觀測和不可觀測因素,選取內生轉換回歸模型是適宜的;第二,當ρ1i和ρ2i具有不同的正負性時,說明已根據自身比較優勢做出了理性決策,當ρ1i和ρ2i是同正或同負時,說明不需要考慮選擇情況;第三,當ρ1i>0時,說明存在負向的選擇偏差,當ρ2i<0時,說明存在正向的選擇偏差[6]。當存在較大相關系數時,使用最大似然法估計過程會難以收斂,通過蒙特卡羅模擬表明,校正殘差可以解決幾乎所有情況下的問題[9]。

當存在不可觀測因素使得corr(μi,εi)≠0時,需在第一階段估計選擇方程,并通過其計算逆米爾斯比率λ1i、λ2i以及協方差項σ1i= cov (μi,ε1i) 和σ2i= cov (μi,ε2i),將其帶入兩個方程中以校正由于不可觀測因素導致的選擇偏差,其擴展形式為:

利用方程 (6)和方程 (7)估計出相關系數后,可計算出三種平均處理效應,分別是處理組的平均處理效應 (ATT)、對照組的平均處理效應 (ATU)以及總體樣本的平均處理效應(ATE)。但因都包含了沒有受到相關政策影響樣本的處理效應,所以對照組和總體樣本的平均處理效應在評估政策方面的意義不大,最重要的估計參數為處理組的平均處理效應。雖然在自選擇問題上,可以通過傾向得分匹配法進行控制以獲取平均處理效,但傾向得分匹配法存在一個主要缺陷,即只能控制由于可觀測因素帶來的選擇性偏誤,卻不能控制由于不可觀測因素所帶來的選擇性偏誤。

利用內生轉換回歸模型估計平均處理效應時,可將可直接觀測的事實水平用方程表示為:

可將不可直接觀測的反事實水平用方程表示為:

由此可將平均處理效應表達為:

可使用兩階段最小二乘法 (2SLS)或最大似然法 (MLE)估計內生轉換回歸模型中的選擇方程,但是這兩種方法估計出的參數有效性較低,并需要繁瑣調整才能得到一致的標準誤差。因此,Lokshin和Sajaia于2004年將Terza(1998)的計數數據回歸模型進行擴展提出了完全信息極大似然估計 (Full Information Maximum Likelihood,FIMI),這種方法可以同時估計選擇方程和結果方程,直接得到一致的標準誤差,但該方法計算量較大,需通過Stata軟件實現[7]。并且使用該估計方法有一定前提,即選擇方程需為二值選擇方程,結果方程的誤差項需要符合聯合三元正態分布。如果ε1i和ε2i與μi不能滿足服從聯合正態分布的假設,那么所得估計結果將會產生偏差,故在某些應用中存在適用性問題[8]。此時,可利用 Terza(2008)提出的兩階段殘差嵌入方法 (2SRI),這一方法放松了正態分布假定[9]。除此之外,也可使用Probit估計方法對選擇方程進行估計,這類模型被特定稱為內生轉化概率模型 (Endogeneous Switching Probit Model,ESP)。

三、應用研究

(一)內生轉換模型的應用領域

由于內生轉換模型在應對選擇性偏差等可觀測及不可觀測的內生性問題上具有天然優勢,近年來運用內生轉換模型的實證研究成果層出,主要應用領域包括經濟學、管理學、社會學及其交叉學科,其中農業經濟學和社會經濟學方面的應用研究更為廣泛。

在農業經濟學方面,利用內生轉換模型進行的學術研究集中于四個主題:第一,研究對農戶收入的影響,影響因素包括信貸配給、選擇使用先進生產技術與模式[10-12]。第二,研究對農業產出的影響,包括采用適應性生產技術措施等變量[13-14]。第三,研究種植改良農產品或有機認證農產品的影響[15-17]; 第四,研究應用互聯網等現代科技的影響[18]。除此之外,內生轉換模型同樣能為涉農政策評價提供基礎。利用內生轉換回歸模型構架 “反事實”分析框架,估計集體林地確權到戶、捕撈法規等涉農政策的作用效果[19-20]。

在社會經濟學方面,從個人層面分析公共部門和私營部門之間的工資差距是最主要的也是早期研究的重點領域,目前已被應用研究荷蘭、秘魯等國家的具體情況[21-22],也有學者研究工會的參與情況以及是否為全日制工作對工資的影響[23]。從企業管理層面研究對企業投資的影響[24],從政策評價層面分析土地政策等的政策效果[25]。

(二)農戶投保行為對家庭收入的影響效應分析

1、理論基礎

農戶是否投保的行為往往受農戶人力資本、金融資本、社會資本、物質資本和自然資本等要素的影響[26]。參考已有研究,本文將性別、年齡、農作物種植年限、風險態度等戶主個人特征,家庭兼業化程度、家庭債務貸款情況等家庭生產特征以及以是否遭受過自然災害來表示的自然特征納入農戶投保行為方程中?,F有研究表明政策性農業保險對農戶收入存在正負兩種效應:負效應表現為當沒有災害發生時,農戶購買保險導致的家庭收入減少。在投保農業保險后農戶疏于防范、不制止受災范圍繼續擴大等道德風險問題造成的家庭收入大幅減少。以及農戶投保行為導致的生產要素配置改變最終提高農作物產出,但在市場機制下農產品價格降低帶來的收入減少;正效應表現為農業保險對農業生產風險的轉移和補償,促進農戶災后恢復再生產,穩定并提高農戶家庭收入?;蛲ㄟ^促進農業產業結構調整、農村金融發展以及農業技術創新,提高農業生產效率和農產品質量,以此增加家庭收入。

雖然現有研究已探討政策性農業保險與農戶家庭收入的關系,但針對政策性農業保險究竟是提高還是降低農戶家庭收入這一核心議題仍沒有定論,造成研究差異的主要原因有兩點:第一,農業保險對農民收入的影響機制是具有復雜性和多樣性的;第二,與不同研究所使用的不同樣本、數據以及方法有關,尤其是實證方法選用上,當未充分考慮農戶生產行為與投保行為可能存在一定的 “同時決策”,且存在投保決策的自選擇問題時,就會出現嚴重的內生性情況,在數據方面現有研究以宏觀數據為主。因此,本文基于微觀調研數據利用內生轉換模型對這一問題加以解決,研究政策性農業保險的農戶投保行為對農戶家庭年收入的影響,以期得到更為合理的研究結果。

2、數據來源與變量說明

本文所使用的數據來源于相關課題的調研,以黑龍江省政策性農業保險開展較好的具體代表性的地區,即綏化市、齊齊哈爾市、佳木斯市以及鶴崗市為調研對象展開實地調研,共對上述4個市的9個縣發放問卷405份,回收有效問卷364份,問卷有效回收率為89.88%。據統計,2019年黑龍江省成災面積占主要農作物播種面積之比為11.89%,農業保險在分散農業自然風險、平滑農民家庭收入方面都發揮著重要作用。按照經營主體劃分,364個調研對象中有28個農業合作社、82個種植大戶以及254個普通農戶,其中將種植面積在200畝以上的農戶定義為種植大戶。如表1所示,364個樣本中有232戶選擇投保農業保險,占樣本總數的63.74%。從戶主特征來看,投保組與非投保組差別不大,相較于非投保組,投保組農戶更加年輕,受教育程度更高,農業種植經驗更少,對政策性農業保險的評價更為滿意。從家庭特征來看,投保組的家庭總人口數更高,間接說明從事農業生產的勞動力更多,并且農戶家庭年農業收入和現有的債務金額均較高。從生產特征來看,投保組經營種植的土地面積明顯高于非投保組,且整體經營土地面積均較高,符合黑龍江省的自然地理特征。從自然特征來看,投保組農戶之前遭受過自然災害的比例高于非投保組農戶。

表1:變量設置及說明

家庭特征家庭總人數 農戶家庭人口總數 (人) 2.27 1.91家庭收入 農戶家庭年農業收入 (萬元) 136.71 30.50債務水平 農戶家庭現有債務情況 (萬元) 35.31 8.52生產特征經營主體 農戶的生產經營主體的確定。農業合作社=1,種植大戶=2,普通農戶=3 2.62 2.62農業生產兼業化程度 農戶家庭生產經營類型。純農業經營=1,農業為主兼營其它=2,非農業為主兼營其它=3,非農業經營=4 1.45 1.44耕地面積 農戶經營土地面積 (畝) 961.56 268.79土地流轉情況 農戶經營土地是否存在流轉行為 0.85 0.89自然特征 受到災害影響 農戶是否受到過自然災害影響。無=0,有=1 0.79 0.63

3、模型構建

結合本文的研究目的與理論基礎,構建的農戶投保行為方程為:

(1)式中,I為農戶是否購買政策性農業保險;Gen為戶主性別;Age為戶主年齡;Edu為戶主受教育程度;Year為農業種植經驗,用戶主從事農業生產年限表示;Eva為戶主對于政策性農業保險的服務評價;Risk為戶主風險態度,用戶主是否購買商業型農業保險表示;Occu為農戶生產兼業化程度,用農戶家庭生產經營類型表示;Dis為農戶是否受到過自然災害影響;ε為隨機干擾項。

構建的農戶投保政策性農業保險對農戶家庭收入的影響效應方程為:

(2)式中,Inc為農戶家庭收入;Num為農戶家庭總人數;Fin為農戶家庭債務水平;Acre為農戶耕地面積;Land為農戶經營土地是否存在流轉行為;μ為隨機干擾項,其它變量含義同前式。

內生轉換模型將 (2)式轉化為 (3)式和 (4)式,以分別表示投保組和非投保組農戶的投保行為對其家庭收入的影響,具體方程為:

(3)式中的IncT和 (4)式中的IncU分別表示投保組和非投保組的農戶家庭收入。當不可觀測因素同時影響農戶投保行為和農戶家庭收入時,投保行為方程和農戶家庭收入方程的殘差項就會存在相關關系,造成OLS估計的結果有偏。由于實際情況的限制,農戶投保和不投保的行為不能同時發生,也就是說IncT和IncU不能被同時獲得,ESR將該問題視為數據缺失,所以將農戶投保行為方程 (1)式中計算得到的逆米爾斯比率λ引入收入效應方程,對這一問題加以來解決。此時,投保組和非投保組的投保行為對農戶家庭收入的影響效應方程將分別轉化為:

(5)式和 (6)式中,λT和λU表示觀測不到的農戶能力或偏好致使的投保選擇,σTε=cov (μT,ε) 和 σUε= cov (μU,ε)表示行為方程和收入效應方程誤差項的協方差,若二者在統計意義上顯著,則表明十分有必要利用內生轉換模型解決自選擇問題。待已糾正不可觀測因素導致的偏差問題后,(5)式和(6)式得到的估計結果將是無偏的和一致的。本文選擇完全信息極大似然估計法 (FIMI)對行為方程 (1)式和收入效應方程 (5)式、(6)式進行估計,對農戶投保行為的收入效應進行反事實分析,比較投保農戶與非投保農戶在現實與反事實條件下農戶家庭收入間的差異,以準確評價農戶投保所引致的收入變化。

投保組和非投保組的家庭收入的條件期望可表達為:

而投保組和非投保組的反事實家庭收入的條件期望可表達為:

實際投保組農戶家庭收入的平均處理效應,即處理組的平均處理效應ATT可表示為 (7)式與 (9)式之差,具體表達式為:

(11) 式中,XT為 (3)式中的解釋變量,βT和βU分別為(7)式和 (9)式中的參數估計結果。

實際未投保組農戶家庭收入的平均處理效應,即非處理組的平均處理效應ATU可表示為 (8)式與 (10)式之差,具體表達式為:

(12)式中,XU為 (4)式中的解釋變量,βT和βU分別為(8)式和 (10)式中的參數估計結果。

4、實證結果

由表2所示的農戶投保行為的收入效應方程的實證估計結果可知,經營主體的類型,農戶的風險態度以及生產兼業化程度是決定其投保行為的重要因素,即農戶的生產專業化程度越高,其投保概率越低,風險意識較強的農戶更會選擇購買政策性農業保險,尤其以大規模農戶為主。由于表中ρUε與聯合獨立似然比均通過了1%水平的顯著性檢驗,故證明了內生轉換模型的適用性。根據表中投保組與非投保組投保對家庭收入的影響效應方程的實證估計結果可知,對于投保組來說,戶主受教育程度、生產兼業化程度以及負債水平越高,家庭總人數越多,經營土地面積面積越大,則越能促進投保組農戶家庭收入的提高,而即使已投保政策性農業保險,自然災害的影響仍會對農戶家庭收入產生不利影響;對于非投保組來說,較投保組而言其風險態度對家庭收入有重要影響,在未購買政策性農業保險的情況下,越具有風險意識的家庭其收入的增加效果越明顯。

表2:農戶投保行為及家庭收入的內生轉換模型實證估計結果

由表3所示的農戶投保行為對農戶家庭收入的處理效應可知,投保農戶家庭收入的平均處理效應 (ATT)為1.235,未投保農戶家庭收入的平均處理效應 (ATU)為1.313,表明購買政策性農業保險有利于提高農戶家庭收入。

表3:農戶投保行為對家庭收入處理效應的測算結果

根據經營主體劃分,農業合作社、種植大戶以及普通農戶的政策性農業保險的投保率分別為75%、76.83%和72.44%,相較而言,普通農戶的投保率較低,故為檢驗投保對于普通農戶的收入影響效應的具體情況,本文測算普通農戶的投保行為對其家庭收入的處理效應。如表4所示,投保的普通農戶家庭收入的平均處理效應 (ATT)為0.665,未投保的普通農戶家庭收入的平均處理效應 (ATU)為0.569,雖然其增收效應不如總體效果好,但也可證明對于政策性農業保險的主要需求者來說,普通農戶購買政策性農業保險有利于提高其家庭收入,對于普通農戶的增收效應明顯。

表4:普通農戶的投保行為對家庭收入的處理效應測算結果

四、總結

內生轉換回歸模型作為轉換回歸模型的一種,在不斷發展中日益得到完善,是經典實驗設計的自然擴展。并且因其在解決內生性問題以及評價項目、政策效果方面的獨特優勢,在計量經濟學文獻中被較為普遍地使用。其中國外學者使用此方法進行的研究較為豐富,主要集中在農業經濟學領域上,國內從2018年開始逐漸流行此類研究,且不僅廣泛應用于農業經濟學領域也涉及社會經濟學領域,研究層次均較高?,F有研究多關注于涉及二值選擇的有限因變量內生轉換回歸模型,雖連續變量的內生轉換回歸模型也有應用,但研究數量較少,所以在未來的研究中可以將此類模型通用化,并進一步發展有限因變量的研究。本文利用內生轉換回歸模型實證分析農戶投保政策性農業保險的收入效應問題,充分利用該模型解決因農戶投保行為的自選擇性質所帶來的內生性問題,并評價政策性農業保險的政策效果。使用黑龍江省農戶作為研究對象,得到投保政策性農業保險可以促進農戶增收的結論,與現有研究結果相一致[27],并且充分考慮了內生性問題,結果具備合理性。據此,應推動保險公平,注意對普通農戶進行保險宣傳,提高其風險防范意識,并提高農戶整體投保水平。

猜你喜歡
家庭收入內生投保
內生德育:九年一貫制學校德育路徑探索
植入式廣告的新創意
互聯網財險投保者
恩格爾系數
恩格爾系數
民辦高職獲得生機的必由之路
重新評估社會化小農家庭糧食生產效率:以SC省
恩格爾系數
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合