?

基于嶺回歸和LASSO回歸淺析河南省糧食產量影響因素

2024-01-18 06:01聶文倩
山西農經 2023年23期
關鍵詞:純量共線性灌溉面積

□耿 娟,聶文倩

(河北經貿大學數學與統計學學院,河北 石家莊 050062)

“民以食為天,國以糧為本”,糧食對于國家發展至關重要。河南省是糧食生產大省,保證國家糧食安全是一項重大的政治任務。河南省地處平原,有大片耕地,以農業為主,其糧食產量關系到整個國家的命運,因此,需充分發揮區位優勢,大力發展農業,保證國家糧食安全。研究河南省糧食生產的主要影響因素對提高糧食生產水平、保證糧食安全具有十分重要的現實意義。

1 文獻綜述

河南省是我國小麥生產第一大省,是我國的糧食生產核心區。歷年來,學者們運用多種方法對河南省糧食產量的影響因素進行分析。劉忠廣(2019)[1]利用SPSS 軟件和通徑分析法分析了河南省糧食產量的影響因素,結果表明,影響因素對糧食產量影響程度從大到小依次是糧食作物單位面積產量、糧食作物播種面積、農村用電量、化肥施用量、有效灌溉面積、農村機械總動力、農村從業人口數,說明增加糧食作物單位面積產量、擴大播種面積、增加農村用電量等可以顯著提高糧食產量。張貞等(2017)[2]運用Pearson 相關分析法和灰色關聯熵法進行分析,結果表明,影響糧食產量的因素排名從前往后依次是農田有效灌溉面積、耕地面積、糧食作物播種面積、平均氣溫、日照時數、年降水總量、化肥、農藥以及受災面積。楊娟等(2017)[3]運用主成分分析法分析河南省1978—2014 年的數據,探索建立計量經濟模型對該期間影響河南省糧食產量波動的因素進行分析,結果表明,經濟發展與農業資本投入、勞動與土地投入、成本—收益對糧食產量的影響排在前三名。李炳軍等(2021)運用BP神經網絡對河南省糧食產量進行預測,發現河南省糧食生產增速放緩,糧食生產重心北移。張淑華等(2022)用SD-GM 方法對河南省糧食生產科技創新進行分析,提出“科技蓄糧”的建議。

2 數據說明

為研究河南省糧食產量的影響因素,文章主要運用河南省2002—2021 年的數據。為保證數據來源的可靠性,所有數據均來自《河南省統計年鑒》。根據已有研究,取河南省糧食產量(萬t)為被解釋變量Y,播種面積(千hm2)、灌溉面積(千hm2)、農業機械總動力(萬kW)、化肥施用折純量(萬t)分別為解釋變量X1、X2、X3、X4,構造多元統計模型如下。

式中:β0是常數項,β1~β4是被解釋變量的系數,ε是隨機擾動項,且ε服從均值為0、方差為σ2的正態分布。各變量數據描述性統計如表1 所示。

表1 2002—2021 年各變量數據描述性統計

3 實證分析

3.1 多重共線性檢驗

用SPSS 軟件對數據進行多重共線性檢驗,檢驗結果如表2 所示。

由表2 可知,有4 個條件指數大于10,所以有充足的理由認為變量間具有嚴重的多重共線性,此時不適合使用普通最小二乘法估計。因此,使用可以處理多重共線性問題的嶺回歸和LASSO 回歸分析。

3.2 嶺回歸

嶺回歸和LASSO 回歸可以解決多重共線性問題,考慮到變量量綱不同,進行嶺回歸和LASSO 回歸之前,對數據進行無量綱化處理,主要采用標準化處理。根據嶺回歸原理分析,運用嶺回歸求解回歸系數可表示為如下。

式中:lambda 是嶺回歸參數,之后用R軟件實現嶺回歸。制訂嶺參數lambda 的取值范圍是0~1,繪制嶺跡圖如圖1 所示。

圖1 嶺跡圖

從嶺跡圖中可以看出,當lambda=0 時,圖像不穩定。因此可以說明變量間存在多重共線性。用R 軟件中的select 函數查看k值并篩選,選擇最小的k值(即lambda)為0.120 511 5,之后使用lambda 值進行嶺回歸分析,具體結果如表3 所示。

表3 嶺回歸結果

由表3 可知,標準化后β1、β2、β3、β4的系數分別為1.136 0、1.642 0、0.577 4、1.085 0,并且都在0.05顯著性水平下通過檢驗,標準化后的嶺回歸方程可以表示為如下。

4 個自變量的回歸系數全部為正,說明河南省糧食種植面積、有效灌溉面積、農業機械總動力和化肥施用折純量與糧食產量呈現正相關,河南省糧食種植面積、有效灌溉面積、農業機械總動力和化肥施用折純量增加會導致糧食產量增加,這與現實情況相符。解釋變量值越大,對被解釋變量影響越大。

進一步分析可知,因為β2>β1>β4>β3,所以對河南省糧食產量影響比較大的解釋變量依次是有效灌溉面積、糧食種植面積、化肥施用折純量和農業機械總動力。

3.3 LASSO回歸

LASSO 回歸也可以解決多重共線性問題。文章選取常用的Cp統計量法進行系數選擇,R 語言中有多個包可以實現LASSO 回歸,運用R 軟件中Lars 算法進行LASSO 回歸,得到相應的回歸結果[4]。

圖2 中的豎線個數對應LASSO 中迭代的次數,對應的系數值不為0 的自變量即為選入模型的解釋變量。圖2 中共有五條豎線,所以一共進行五次迭代,具體迭代情況如表4 所示。

圖2 迭代次數

表4 LASSO求解中值的變化

表4 反映了LASSO 求解中值的變化情況,其中Step 表示步數,RSS 表示殘差平方和,找到使統計量Cp達到最小值的步數,輸出所對應解釋變量的系數,從中篩選出系數不為0 的變量??梢钥闯?,當變量選取到第4 步時,Cp值取得最小值4.060 4。

圖3 反映了變量篩選結果,顯然篩選之后只剩下種植面積、有效灌溉面積和化肥施用折純量三個解釋變量,這與嶺回歸分析結果保持一致,LASSO 回歸分析結果如表5 所示。

圖3 變量篩選結果

表5 LASSO回歸結果

表5 中種植面積、有效灌溉面積和化肥施用折純量三個解釋變量的系數分別為0.244 4、0.437 8、0.376 1,LASSO 回歸方程如下。

各解釋變量與被解釋變量依然存在正相關關系,以上分析結果依然適用。

4 結束語

當前,中國人不僅有能力解決自己的吃飯問題,還能幫助世界人民解決吃飯問題,但這并不意味著我國的糧食安全穩如磐石,保障糧食安全是一條永無止境的路。文章運用嶺回歸和LASSO 回歸對具有多重共線性的數據進行分析,得出以下結論。河南省糧食產量與種植面積、有效灌溉面積、農業機械總動力和化肥施用折純量呈現正相關關系;對河南省糧食產量影響比較大的解釋變量依次是有效灌溉面積、糧食種植面積、化肥施用折純量和農業機械總動力??梢?,糧食種植面積會影響糧食產量,相關部門要堅決守住耕地這條不可逾越的紅線,鼓勵糧食生產向多元化規模經營方向發展,提高糧食生產效率和質量,發揮金融對糧食產量的保駕護航作用,暢通糧食生產和流通的各個環節。

猜你喜歡
純量共線性灌溉面積
銀行不良貸款額影響因素分析
單一低滲煤層順層鉆孔水力化措施應用
11426工作面瓦斯綜合治理效果分析
文氏圖在計量統計類課程教學中的應用
——以多重共線性內容為例
不完全多重共線性定義存在的問題及其修正建議
CO2致裂增透技術的抽采半徑考察研究
2016年河南省已建成灌溉面積和新增耕地灌溉面積
2016年河南省己建成節水灌溉面積
灌溉面積
河南省2014年已建成灌溉面積和新增耕地灌溉面積
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合