?

體育鍛煉促進心理健康研究體育鍛煉促進心理健康研究
——基于CFPS的工具變量法和PSM的實證分析

2021-11-04 02:47
龍巖學院學報 2021年5期
關鍵詞:偏誤體育鍛煉工具

林 瑜

(福建體育職業技術學院 福建福州 350002)

隨著經濟的高速發展與生活水平的提高,來自工作、生活等方面的壓力與日俱增,使得人們更加關注自身心理健康[1]。心理健康是個人積極工作、健康生活的重要前提[2]。2017年《中國城鎮居民心理健康白皮書》顯示,73.6%的城鎮居民處于心理亞健康狀態,心理健康的居民僅有10.3%。體育鍛煉作為一種健康投資行為,對心理健康的促進作用被眾多學者得到驗證并認可[3-5]。值得注意的是,隨著因果推斷成為“新的學科前沿”,有學者指出相較于經濟學、管理學等其他學科,當前關于體育鍛煉與健康的研究多處于統計相關性的描述階段以及傳統的回歸分析,基于因果推斷的解釋能力不足,忽略了體育鍛煉與健康水平之間可能存在的遺漏變量偏差、聯動性偏差和樣本選擇性偏差等內生性問題以及武斷假設因果關系的單一路徑等問題[6-7],從而導致研究結果可能存在偏誤。

鑒于現有文獻忽略了體育鍛煉與心理健康可能存在的雙向因果關系等內生性問題,以及研究對象多為老年人、大學生等特定群體,不具有全國代表性[8],本文借助2018年中國家庭追蹤調查數據(CFPS2018),利用全國性的樣本數據,首先采用傳統OLS回歸模型探究體育鍛煉對心理健康所產生影響的基礎上,進一步運用工具變量法和傾向得分匹配法消除聯動性偏差和樣本選擇偏差問題對傳統統計估計結果的影響,探究體育鍛煉對心理健康的因果關系。旨在更加準確、客觀地驗證體育鍛煉對心理健康的影響,使研究結果更具真實性和推廣意義,進一步發揮體育鍛煉的潛能,為滿足人民日益增長的美好生活需求貢獻力量。

1 數據來源與變量選取

1.1 數據來源

本研究使用數據來自2018年中國家庭追蹤調查(CFPS),CFPS是由北京大學中國社會科學調查中心進行的一項全國性、大規模的涉及經濟、教育、家庭關系、健康等的家庭進戶跟蹤調查項目。其分層多階段的抽樣設計,使樣本幾乎可以代表95%左右的中國人口,該調查具有很好的可信度和真實性,已被學者廣泛用于眾多領域的相關研究[9]。在剔除本研究所涉及變量缺失值、不確定回答的樣本后,共獲得27034個有效樣本。

1.2 變量選取

被解釋變量:心理健康(Mental Health)。為了更加客觀、全面地評價個體的心理健康狀況,參考陳梓森[10]的心理健康指數的測算方法,在CFPS調查中選取“我感到情緒很低落的頻率”“我覺得做任何事都很費勁的頻率”“我感到孤獨的頻率”“我感到悲傷難過的頻率”“我覺得生活無法繼續的頻率”5個變量,其中各選項賦值為:幾乎沒有(<1 d)=1、有些時候(1~2 d)=2、經常有(3~4 d)=3、大多數時候有(5~7 d)=4。通過測算5個變量標準分的均等加權總和,得出最終的心理健康指數,具體公式如下:

(1)

公式(1)中,MentalHealthi表示個體的心理健康指數,xij為每個變量的個體數據,μj和σj分別為該變量整體的平均值和標準差。由此測算出的心理健康指數為-3.6243~17.6323,當心理健康指數越高,則表示個體心理健康狀況越差,反之,則越好。

解釋變量:體育鍛煉頻率(Freq)、體育鍛煉時間(Time)、是否經常體育鍛煉(PA)??紤]到在CFPS問卷中,關于體育鍛煉的情況的調查包括鍛煉頻率、鍛煉時間兩個方面,措辭分別是“過去一周,鍛煉了幾次?”和“過去一周,總共鍛煉了多長時間?”因此,在進行OLS模型探究體育鍛煉對心理健康水平的影響時,選取體育鍛煉頻率(Freq)、體育鍛煉時間(Time)、是否經常體育鍛煉(PA)作為解釋變量。在工具變量法和傾向得分匹配法的分析時,選取是否經常體育鍛煉(PA)為解釋變量。參考王富百慧[11]對是否經常參加體育鍛煉的劃分,將一周鍛煉不少于3次,每次鍛煉時間不少于30 min的人群確定為經常參加體育鍛煉組,反之,則為不經常參加體育鍛煉組。

控制變量:為了更好地解決因為遺漏變量導致的選擇性偏誤問題,本研究盡可能多地選擇既影響個體體育鍛煉又影響心理健康的控制變量。主要包括性別(Sex)、年齡(Age)、戶籍(Hukou)、受教育水平(Edu)、婚姻狀況(Mar)、醫療保險(Bx)、吸煙(Smo)、飲酒(Dri)、收入(LnIncome)等變量。

工具變量:家庭體育鍛煉氛圍。適宜的工具變量需要滿足與內生解釋變量強相關且與擾動項不相關,即所選取的工具變量需要對個體參與體育鍛煉具有直接的影響關系,但是對個體的心理健康水平又不具有直接的影響。鑒于此,參考程鄭權[7]關于體育鍛煉對收入水平影響研究中工具變量的選取,確定家庭體育鍛煉氛圍為本研究工具變量。在CFPS問卷中,通過計算家庭中除研究個體外的調查成員中經常參加體育鍛煉的比例作為家庭體育鍛煉氛圍的衡量指標。

表1為主要變量的描述性統計,從數據可以看出,所選樣本中平均每周鍛煉次數為2.5888次,每周鍛煉時長為4.1695 h,經常參加體育鍛煉的人群占比37.7%,家庭中除研究個體外的調查成員經常參加體育鍛煉的比例為19.52%,其中經常鍛煉組中的家庭體育鍛煉氛圍比不經常鍛煉組高出近10個百分點,且由兩階段估計模型中的第一階段回歸結果可知,家庭體育鍛煉氛圍與個體是否經常鍛煉之間具有較強的相關性,即家庭體育鍛煉氛圍對個體經常參加體育鍛煉會產生顯著影響作用。

表1 主要變量測量方法及描述性統計

2 模型設定

為了檢驗體育鍛煉頻率、體育鍛煉時間對心理健康的影響及可能存在的非線性關系,建立如下模型:

(2)

(3)

在公式(2)和(3)中,MentalHealth表示心理健康,Time為體育鍛煉時間,Time2為體育鍛煉時間的平方項,Freq為體育鍛煉頻率,Freq2為體育鍛煉頻率的平方項,Control為一系列控制變量,ε為殘差項。

由于上述模型在探究體育鍛煉對心理健康的影響作用結果中可能僅是相關關系而非因果關系,忽略了內生性、反向因果等問題對研究結果造成的偏誤。因此,在上述模型的基礎上,本研究采用工具變量法和傾向得分匹配法進一步考察體育鍛煉對個體心理健康的影響。

工具變量法是通過尋找工具變量,采用兩階段估計獲得無偏的參數估計,進而獲得內生變量對被解釋變量影響的一致估計。具體模型如下:

(4)

(5)

在公式(4)中,PA是因變量,ExercsieRate是PA的工具變量,即家庭體育鍛煉氛圍。公式(5)中PA’是第一階段中PA的預測值,Control為控制變量,ε為殘差項。

考慮到將研究樣本分為經常體育鍛煉組和不經常體育鍛煉組進行分析時,兩組樣本間的可觀測值可能存在較大差異,會產生選擇偏差問題。因此,采用傾向匹配得分法進行分析,旨在盡可能的使兩組樣本的可觀測值相似(匹配),減小估計結果偏誤,具體可以分為三個步驟。首先,采用Logit模型估計傾向得分,進行傾向得分匹配。其次,根據傾向匹配得分進行平衡性檢驗。最后,依據匹配后的樣本數據再次進行回歸分析。

3 估計結果與分析

3.1 OLS回歸和工具變量回歸分析

表2分別報告了體育鍛煉對心理健康影響的OLS回歸和工具變量回歸結果。其中,模型1的解釋變量為體育鍛煉時間,模型3的解釋變量為體育鍛煉頻率,模型2、模型4是在模型1、模型3的基礎上分別加入體育鍛煉時間的平方項、體育鍛煉頻率的平方項,進一步探究體育鍛煉時間、體育鍛煉頻率與心理健康之間是否存在非線性關系。從表2中可以看出,體育鍛煉時間、體育鍛煉頻率對心理健康影響的回歸系數均為負數,且通過1%統計水平檢驗,說明體育鍛煉時間、體育鍛煉頻率均能顯著改善心理健康水平;從模型2、模型4中體育鍛煉時間、體育鍛煉頻率的平方項回歸系數可知,體育鍛煉時間、體育鍛煉頻率與心理健康水平間均存在非線性關系,表現為“U”型曲線關系,即適宜的體育鍛煉時間、頻率對心理健康具有促進作用,當體育鍛煉時間、頻率達到一定量后,則對心理健康具有抑制作用。研究表明,在體育鍛煉過程中適宜的運動強度,會讓人身心放松,消除疲憊,產生愉悅的感覺;相反,當運動強度過大,則會造成肌肉酸痛、精神疲憊等,產生“不舒服”的感覺[12]。由此可見,只有適宜的運動量,才能對心理健康產生促進作用。

模型5的解釋變量為是否經常體育鍛煉,其對心理健康的回歸系數為負數,且通過1%統計水平檢驗,說明經常參加體育鍛煉對心理健康同樣具有顯著的促進作用。同時,從回歸系數可以發現,經常體育鍛煉能夠使心理健康指數得分減少0.3953,且經常參加體育鍛煉對心理健康的影響效應要明顯優于僅分析體育鍛煉時間或是體育鍛煉頻率對心理健康的影響效應。

模型6是采用工具變量回歸克服內生性問題的分析結果,在第一階段的回歸結果中,工具變量對核心解釋變量表現為顯著的正向影響作用,說明工具變量和內生變量之間具有強相關性(本研究僅給出第二階段的回歸結果),第一階段回歸結果的F值為253.47,大于10,說明二階段模型不存在弱工具變量現象,家庭體育鍛煉氛圍是一個好的工具變量;其次對內生性進行豪斯曼檢驗,豪斯曼結果通過1%統計水平檢驗,說明是否經常體育鍛煉作為內生解釋變量存在內生性問題,需要使用工具變量進行無偏估計,進行二階段回歸可以得到有效估計。從模型6結果可知,在使用工具變量調整估計偏誤后,經常體育鍛煉對心理健康的影響仍表現為負向顯著,回歸系數高達-1.9021。對比模型5和模型6的結果可知,工具變量法的估計結果是OLS估計結果的3倍以上,說明OLS估計存在較大的偏誤。

由此可以得出結論,雖然使用傳統統計分析方法和工具變量法探究體育鍛煉對心理健康的影響時,均表現為體育鍛煉對心理健康具有促進作用,但由于傳統統計分析方法忽略了可能存在的內生性問題,因此弱化了體育鍛煉對心理健康的促進效應,而工具變量法能夠較準確、真實地反映出體育鍛煉對心理健康的促進效應。

3.2 傾向得分匹配法

為了消除可能存在的樣本選取偏差問題,進一步采用傾向得分匹配法估計是否經常體育鍛煉對心理健康的影響。首先,運用Logit模型計算傾向得分值,其中被解釋變量為是否經常體育鍛煉,解釋變量為本研究所選取的一系列控制變量。從表3中可知,各變量對是否經常體育鍛煉表現為顯著的影響作用,說明各控制變量在經常鍛煉和不經常鍛煉樣本之間存在明顯差異,有必要對樣本進行傾向得分匹配。

表3 Logit回歸結果

表4是經常鍛煉組和不經常鍛煉組匹配前和匹配后的平衡性檢驗結果。由表4可知,在匹配后兩組間各控制變量的值均發生了一定程度的變化,除收入水平的偏誤率為11.6%,其余變量的偏誤率均在5%的范圍內,整體來看,傾向得分匹配的結果有效。

表4 傾向得分匹配平衡性檢驗

在表5中,模型7、模型8是在傾向匹配后,分別采用OLS模型和工具變量法探究是否經常參加體育鍛煉對心理健康的影響作用。從結果可知,在消除了由于經常鍛煉組和不經常鍛煉組可觀測值差異而產生的選擇性偏差后,經常體育鍛煉對心理健康依然表現為具有顯著的促進作用,且在工具變量法的模型估計中,同樣驗證了家庭鍛煉氛圍是一個好的工具變量,且有必要采用工具變量進行無偏估計。研究結果也表明,在經常體育鍛煉對心理健康促進效應的分析中,相較傳統統計分析方法,使用工具變量法能夠更加準確地反映體育鍛煉對心理健康的促進效應。

表5 傾向匹配法下體育鍛煉對心理健康的影響

4 結論

本文利用2018年CFPS數據,運用普通最小二乘法、工具變量法和傾向匹配得分法,探究體育鍛煉對心理健康水平的影響,主要結論如下:(1)所選樣本中,經常體育鍛煉人群的占比為37.7%,說明經常體育鍛煉的人群占比尚存在較大的提升空間;(2)體育鍛煉時間、體育鍛煉頻率均可對心理健康產生促進作用,且表現為“U”型非線性關系,即體育鍛煉時間、體育鍛煉頻率對心理健康表現為先促進后抑制的作用關系;(3)經常參加體育鍛煉對心理健康水平的促進作用明顯優于僅關注鍛煉時間或鍛煉頻率所產生的作用;(4)在使用工具變量法和傾向匹配得分法解決可能存在的遺漏變量問題、體育鍛煉與心理健康的反向因果以及樣本選擇偏差等問題后,體育鍛煉對心理健康的促進作用明顯提高。

猜你喜歡
偏誤體育鍛煉工具
怎樣激發學生參與體育鍛煉
波比的工具
波比的工具
初級對外漢語讀寫教學過程中偏誤的成因及對策研究
偏誤分析內涵探究及應用
準備工具:步驟:
“巧用”工具
偏誤分析的意義與局限
滇遼兩省城鎮居民體育鍛煉行為的比較研究
體育鍛煉不能放寒假
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合