?

基于GBDT 的望奎縣農田土壤有機碳主控因子研究

2024-03-28 08:08祝元麗馮向陽閆慶武吳子豪中國礦業大學公共管理學院江蘇徐州226中國礦業大學礦區土地利用與生態安全研究中心江蘇徐州226中國礦業大學中國資源型城市轉型發展與鄉村振興研究中心江蘇徐州226
中國環境科學 2024年3期
關鍵詞:環境變量土壤有機速效

祝元麗,馮向陽,閆慶武,吳子豪*(.中國礦業大學公共管理學院,江蘇 徐州 226;2.中國礦業大學礦區土地利用與生態安全研究中心,江蘇 徐州 226;3.中國礦業大學中國資源型城市轉型發展與鄉村振興研究中心,江蘇 徐州 226)

東北黑土區是世界四大黑土區之一,具有優越的農業生產條件[1-3].然而由于高強度的人類利用和土壤侵蝕等原因,黑土地肥力逐年下降,表層土壤有機碳(SOC)含量降低等問題出現[4].因此,正確揭示黑土區農田土壤有機碳空間分異特征,并探究其分異的主控因子,闡明土壤有機碳與土壤理化性質、氣象因子和農田管理措施變化等影響因素的關系,對于農田土壤有機碳的空間預測和碳庫的精確估算具有重要意義.

近年來,很多學者利用多源數據對農田土壤有機碳的空間分異特征及其影響因素進行了深入地分析[5-9],研究指出,農業有機碳的變化與氣溫、降水、地形和土壤理化性質以及農藝管理措施,例如:輪作、秸稈還田、耕作制度以及化肥和動物糞肥的施用密切相關[10-12].土壤養分含量通過影響植被生長影響植被凋落物的輸入量,從而影響SOC.Yu 等[13]、Li 等[14]和Yuan 等[15]的研究分別表明土壤氮、磷、鉀元素含量與SOC 高度正相關.但是以上多數研究的數據來源于野外采樣和國家土壤普查結果,受成本限制而難以擴展到大范圍,其時效性也難以保障,這也導致了土壤氮、磷、鉀等土壤養分數據在數字土壤制圖研究中較少得到使用.近年來,隨著開源土壤數據的逐漸豐富,例如世界土壤數據庫(HWSD)、世界土壤信息數據(SoilGrids)以及中國高分辨率國家土壤信息格網基本屬性數據集(2010~2018)等開源土壤數據網站,提供了我國土壤養分和土壤質地的空間分布信息.將以上開源多源土壤養分因子納入解釋變量指標體系,為更準確地探究SOC 空間分異及主控因子提供了新的契機.目前機器學習算法,包括決策樹(DT)、人工神經網絡(ANN)、支持向量機(SVM)、隨機森林(RF)、Cubist 等模型,被廣泛應用于土壤屬性空間分異的影響因子探究中[16-19],例如,袁玉琦等[20]使用隨機森林模型對福建閩東南地區SOC 的影響因子進行了相對重要性排序,進而確定該區域SOC 主控因子是水解性氮因素.這些機器學習算法具有寬松的建模假設,并且充分考慮了土壤屬性與環境因子間復雜的非線性關系,其模型的擬合優度高于傳統線性回歸模型,可以更好確定土壤屬性空間分異的主要影響因子.然而,現有研究大多止步于環境因子的相對重要性分析,鮮有研究對土壤屬性與環境變量的非線性關系進行可視化,難以揭示環境變量對SOC 的影響機理.

望奎縣位于典型黑土區,處于東北黃金玉米帶,耕地占全縣面積的75%.長期高強度耕作引發了嚴重的水土流失,侵蝕驅動的土壤物質遷移造成SOC的空間遷移與再分布,使SOC呈高度空間異質性.本研究以望奎縣為典型范例,利用多源開源氣候、土壤以及地形等數據,使用梯度提升決策樹模型(GBDT)探究該區域SOC 與環境變量的非線性關系,確定SOC 主控因子,揭示SOC 空間分異機理.

1 材料與方法

1.1 研究區概況

望奎縣位于黑龍江省綏化市的中部(46°32′07″N~47°08′24″N,126°10′23″E~126°59′00″E)(圖1),轄區面積約為2314km2,地處于松嫩平原腹地.該縣東部為丘陵漫崗區、中部為漫川漫崗區、西部為低洼平原區,地勢東高西低,海拔在46~256m 之間.望奎縣內南部有呼蘭河流經、西部有通肯河環繞,水力資源豐富.該縣屬于中溫帶大陸性半濕潤季風氣候區,年均降水量約為650mm,年均氣溫為3.9℃.土壤類型以黑土為主,是國家商品糧食生產基地縣和全國產量大縣.耕地面積為1724km2,占全縣面積的75%.隨著望奎縣黑土地的不斷開發利用,帶動了當地經濟的快速發展,但也相對帶來了土壤退化等一系列問題,對當地土地資源帶來負面影響[21].

圖1 基于GBDT 的土壤有機碳模型建立流程Fig.1 Soil organic carbon modeling process based on GBDT

1.2 梯度提升決策樹模型

梯度提升決策樹(GBDT)是基于CART 算法的增強集成學習模型[22].它利用弱分類器(CART 樹)構建集成模型,通過反復迭代訓練多個決策樹模型,并且將其進行疊加,達到提高預測準確性的目標.在每次迭代過程中,在上一次迭代的基礎上,計算損失函數(式1),求得偽殘差(式2),并求得該迭代,進而構建一個新的決策樹,然后通過梯度下降的方式,根據決策樹的權重(式3),將所有生成的決策樹進行加權融合(式4).GBDT 模型將決策樹與集成思想進行了有效的結合,提高了模型的預測精度.GBDT 算法中,通常包括以下步驟:

GBDT 具有較高的準確性,可以在建模過程中識別并糾正誤差.但是GBDT 對異常值比較敏感,在多次迭代中,GBDT 模型會嘗試著去擬合異常值,導致過擬合的風險增加.為防止過擬合現象發生并提高預測性能,本研究導入數據進行超參數調優,以便獲取參數最優解.本研究初始設置了5000 個弱分類器,6 個節點,采用十倍交叉驗證導入數據進行擬合(圖1).

運用一元線性回歸模型與GBDT 模型構建了SOC 與解釋變量間定量關系,并對比了一元線性回歸模型與GBDT 模型用于探究SOC 與解釋變量間定量關系的解釋程度,建模與擬合過程均在 R studio 軟件中完成,使用決定系數R2來評估模型的擬合效果.最后,通過比較GBDT 模型中的單因素與雙因素的R2來探究因子間的交互效應,若R2(X1∩X2) = R2(X1) + R2(X2),則因素X1與因素X2獨立,若R2(X1∩X2)

1.3 SOC 和環境變量獲取

1.3.1 SOC 數據的獲取及處理 SOC 數據來源于國家地球系統科學數據中心(http://www.geodata.cn),首先對望奎縣2012年的1000多個采樣點進行整理,剔除異常值和錯誤點,之后采用ArcGIS 軟件將余下的采樣點進行矢量化,并根據關鍵字段與SOC 數據進行關聯,使用Kriging 法進行插值;按分層隨機抽樣方法,剔除掉望奎縣內非耕地,林地與草地區域,在望奎縣境內隨機生成2000個樣本點,每個樣本點相距至少1km,在面積較小的土壤類型(如:雛形土)與土地利用類型(如:林地和草地)中生成更多的點,以提高樣本的代表性,使樣點覆蓋整個研究區(圖2).

圖2 研究區位置和SOC 空間分布Fig.2 Location and SOC spatial distribution of the study area

1.3.2 環境變量數據的獲取及處理 基于Scorpan 理論模型探究SOC 的影響因子,選取了包括土壤屬性(S)、氣候因子(C)、有機體(O)、地形(R)、和空間位置(N)5 類25 個影響因子(表1),空間分布狀況見圖3.

表1 環境變量分類體系及來源Table 1 Classification system and source of environmental variables

2 結果與分析

2.1 不同農用地利用類型的土壤環境因子分析

由圖4(a)可以看出,水田的平均SOC 含量為20.28%,旱地的平均SOC 含量為20.41%,林地的平均SOC含量為20.37%,草地的平均SOC含量為20.35%,出現旱地>林地>草地>水田的情況;而土壤pH 值在各個農用地利用類型中均呈堿性,且差異較小,對SOC 含量影響較小.除堿解氮含量外,旱地的SOC、有效磷、速效鉀、黏粒含量以及pH 值均高于水田、林地以及草地,并且旱地的堿解氮含量僅低于林地.通過對比可知,SOC 含量直接與堿解氮、有效磷、速效鉀含量有關,旱地的SOC 含量以及堿解氮、有效磷、速效鉀含量高是施肥作用的效果,而水田為了防止燒苗環境污染,施肥較少且慢速釋放肥料,在水里水肥共生,肥料緩慢分解,難于深入到土壤中,導致肥效降低.對比不同農用地利用類型的SOC、堿解氮、有效磷、速效鉀、pH 值以及黏粒含量的差異性,可以看出農用地利用類型對SOC 差異表現出有效性,而圖5 中GBDT 模型自變量的相對重要性可以得出土地利用這一指標在整個環境變量指標體系相對重要性排序中相對較低,表明農用地利用類型對于土壤養分含量影響的主要方式為施肥這一途徑.

圖4 不同農用地利用類型的土壤環境因子統計Fig.4 Statistical map of soil environmental factors of different land uses

圖5 GBDT 模型中環境變量的相對重要性Fig.5 Relative importance of environmental variables in GBDT

2.2 模型預測效能

表2 結果表明,GBDT 模型相較于一元線性回歸模型在所有的自變量上均具有更好的預測效果,R2提升了13.4%~3671.94%,尤其是地形粗糙指數、到道路的距離、增強型水體指數、歸一化植被指數、坡度、裸地指數等自變量,模型的擬合效果都有明顯的提升.在一元線性回歸模型和GBDT 模型中,各變量的個重要性排序基本一致.以上結果表明,SOC 與選取的各環境變量的關系為非線性關系,GBDT 算法可以更靈活地擬合復雜的非線性模式,因此預測效果比ULR 更好.因此后續研究中僅展示GBDT 模型的結果.

表2 GBDT 模型與一元線性回歸模型擬合效果對比Table 2 Comparison of fitting effect between GBDT model and ULR model

2.3 土壤有機碳的主控因子分析

GBDT 模型總體的R2為0.958,表明該模型能夠很好地解釋目標變量的變異,與實際觀測值較為一致.

如圖5 所示,利用GBDT 模型探究SOC 與解釋變量間定量關系的解釋程度時,各個變量對于SOC的預測能力存在很大差異.其中,堿解氮、有效磷、氣溫、土壤微生物多樣性和速效鉀是所有變量中影響SOC含量最為顯著的幾個因素.如果考慮變量的度量單位和量綱,可以看出:堿解氮以33.85%的影響權重位居最高,這表明當提高土壤的堿解氮含量時,通常呈正向關聯的情況下,SOC含量往往也會隨之顯著上升;其次,有效磷以24.88%的權重位列次席.堿解氮和有效磷對于作物生長的影響很大程度上決定了土壤中營養元素的供給能力,這些變量與作物生長發育密切相關,可以直接或間接影響作物的產出效益.

年最低氣溫和土壤微生物多樣性以18.01%和11.72%的權重位列第3 和第4 位,這表明氣溫的高低和微生物豐富度是控制SOC 分解的重要調節因素.其中氣溫對于土壤中微生物代謝和分解活動具有重要作用,溫度升高時,微生物活動率也會提高,這會影響SOC的分解速率.速效鉀的相對重要性為6.8%,雖然在SOC 預測模型中的相對重要性較低,但其是植物生長運轉所必需的關鍵元素之一,影響植物吸收養分的能力和土壤中其它營養元素的釋放率.堿解氮、有效磷、氣溫、土壤微生物多樣性和速效鉀的相對重要性加和達到95.27%,其余變量均小于1.5%.

2.4 土壤有機碳與環境變量的非線性關系分析

圖6 中,主要環境協變量與SOC 含量之間的非線性關系以相對重要性的降序呈現.環境變量并不是在其全部范圍內都影響SOC 含量,在以上7 個環境變量中,均觀察到對SOC 的閾值效應,6 個環境變量具有雙閾值.7 個環境變量與SOC 之間的關系可以分類3 類:第1 類是堿解氮和有效磷,兩者均與SOC 含量成正相關.堿解氮在170~180mg/kg 之間迅速增加,而在其余區間是穩定的,有效磷和堿解氮的發展趨勢類似,在有效磷含量<40mg/kg 的范圍內,SOC 含量保持平穩,在40~44g/kg 范圍內,SOC 含量快速增長,隨后回歸平穩.

圖6 環境變量對SOC 的閾值效應Fig.6 Threshold effects of environmental variables on SOC

第2 類是氣溫和土壤微生物多樣性,SOC 含量先隨溫度升高,含量逐漸上升,-28.3℃后后急劇下降,最后趨于平穩,而土壤微生物多樣性也是如此;溫度升高,微生物代謝速率增加,能夠參與有機質分解的微生物數量也會增多,但當超過一定的溫度門檻時,微生物生長和活動陣亡極高,SOC 的分解反而會減緩;微生物指標小于108 時,固碳作用占主導,微生物會通過代謝過程吸收和存儲有機碳并且積累在自己的組織中,從而促進了 SOC 的增加,大于108 之后代謝作用占主導,將土壤中的有機物轉換成無機物質從而使SOC 含量降低.

最后一類是速效鉀、土壤pH 值和降水量,與SOC 含量呈負相關.隨著速效鉀的含量上升,SOC 含量先保持平穩,當速效鉀的含量超過195mg/kg 之后,SOC 含量快速下降,最后回歸平穩狀態.降水量與土壤有機碳之間存在著非線性關系,隨著降水量的增加,SOC 含量先是處于平穩階段,當達到降水量610mm 時,SOC 含量迅速下降進入第二個平穩期,直至降雨量達到640mm 左右,SOC 含量再次下降再次進入穩定階段.

2.5 環境變量交互效應對土壤有機碳的影響

GBDT 模型中前7 個重要變量對SOC 的雙因素交互效應見圖7.任何2 個變量都不是完全獨立的,均具有相互作用的關系.任何兩個環境變量的相互作用效應均為負值,而僅有降水量與速效鉀、降水量與微生物、土壤pH 值與速效鉀的交互效應為正.其中堿解氮與微生物解釋了89.9%的有機碳變異,堿解氮和有效磷解釋了87.5%的有機碳變異行為,而堿解氮與其他變量也均解釋78.3%以上的有機碳變異.綜上,堿解氮對于SOC 空間變異的解釋程度最強.

圖7 GBDT 模型中環境變量的雙因素交互效應Fig.7 Interaction effects between environmental variables in GBDT

3 討論

3.1 環境變量對土壤有機碳的影響機理

土壤堿解氮、有效磷和速效鉀含量等土壤養分含量是土壤有機碳空間分布的主要影響因子,本研究中土壤氮磷鉀均對土壤有機碳產生較大程度的影響,其中堿解氮和有效磷對土壤有機碳的影響為正效應,表明土壤氮和磷元素在一定程度上對土壤有機碳含量的增加產生積極效應.一方面,氮添加會影響土壤pH 值、養分有效性和土壤微生物多樣性,進而影響土壤有機碳的分解.氮元素的輸入對土壤有機碳的分解速率也會產生影響,因為研究表明氮元素的富集會導致土壤酸化,通過改變土壤的理化性質而抑制微生物的代謝活動,進而抑制有機碳的分解[33-35].人為活性氮的增加能夠顯著提升生態系統中土壤有機碳的固定,從而增加土壤有機碳的含量[35].另一方面,隨著施氮量的增加耕層土壤有機碳含量顯著提高[13,37],耕層土壤有機碳的輸入主要是種植的作物生物量決定的[38],而大量氮肥的輸入能夠顯著提高地上作物生物量和根生物量,從而顯著增加土壤有機碳的含量[39],這與本研究的結果一致.本研究發現土壤氮元素在所有的環境變量中對土壤有機碳的影響最大,這可能與土壤氮元素從影響土壤有機碳的輸入和輸出兩個方面來對總量產生影響.

本研究中,磷元素對于土壤有機碳的影響僅次于氮元素,呈明顯的正相關關系,說明磷元素對土壤有機碳的促進作用可能主要與植物碳輸入的增加有關[40-41].有研究表明,磷元素的增加也會對土壤有機碳的分解產生顯著的負效應[42],但有研究表明,磷元素含量對土壤有機碳含量的影響并不顯著[43],這證明了關于磷元素對于有機碳分解的微生物調控記住目前尚不明確.Li 等[14]發現土壤氮和磷含量的高低雖然對土壤有機碳的分解以及固存沒有直接的影響,但卻能通過碳氮磷三者的比值增加或減少微生物的生物量,從而達到影響微生物活性和微生物碳利用效率的效果,從而影響土壤碳動態.

本研究采用的環境變量數據以及土壤有機碳數據均為多源開源數據,仍得出與很多研究相似的結果,側面證明了多源開源獲取數據進行土壤有機碳空間分布的主控因子研究具有有效性,可能受到柵格數據分辨率的限制,部分影響因子的R2不高,這表明之后結合更精細的遙感影像數據獲取環境變量有望進一步提升模型的精度.并且受數據可獲取性的限制,本研究未考慮風向風速、土壤母質、施用農藥、殺蟲劑和有機肥等因子的影響,對模型的精度造成了影響.本研究得出土壤氮元素對于土壤有機碳含量的影響非常顯著,證明控制土壤C/N 對于耕地土壤有機碳的可持續利用具有重要意義.

3.2 環境變量的閾值效應分析

本研究發現,環境協變量與土壤有機碳之間存在著非線性關系,這與前人研究一致[44-45],模型評估結果表明GBDT 模型為何優于線性回歸模型,即GBDT 模型的估計結果更為可靠,而線性回歸模型假設數據間的關系是線性的,因此以上結果證實了在實際情況下,數據間的關系常常是非線性的,而GBDT 算法可以靈活地擬合復雜的非線性模式.Lamichhane 等[46]和Siewert[47]的研究也證實了隨機森林等非線性模型優于傳統線性回歸模型.因此,后續研究推薦使用機器學習算法來探究土壤屬性和環境變量間復雜的非線性關系.

本研究發現堿解氮和有效磷這兩種土壤養分與土壤有機碳含量之間的非線性關系存在閾值效應,即引起土壤有機碳含量發生變化的范圍區間是相對固定的,更多量的氮磷元素輸入并不會引起SOC 的增加.Brown 等[48]研究也發現,過量施氮對土壤有機碳沒有影響,只是補充了在農業生產中流失的氮含量,當施氮量超過需求量時,多余的氮素會以N2O 和NO3的形式排出,此研究佐證了閾值效應的存在,但并沒有進一步得到閾值點.以上研究結果對于當地科學施肥和精確農業有重要意義,如何確定當前我國連續耕作的農田土壤的肥料投入,以最低肥料成本達到最大程度增加土壤中的養分和有機碳含量的目的,避免過度施肥造成的資源浪費和農田生態污染問題.化學氮肥的大量輸入對土壤碳循環影響顯著,引起了廣泛關注[49],同時不合理的施肥是影響土壤溫室氣體排放的重要因素.綜上所述,不合理的化肥施用容易對大氣環境造成了嚴重的危害,同時也造成土壤性質的惡化以及肥力的退化.

4 結論

4.1 相較于一元線性回歸模型,GBDT 模型在所有的自變量上均具有更好的預測效果,可以更靈活地擬合SOC 和環境變量之間復雜的非線性模式,R2提升了13.4%~3 671.94%不等.

4.2 7個主要協變量可以解釋98.011%的SOC濃度變化,其中堿解氮和有效磷濃度起主要作用.

4.3 7 個主導環境變量對SOC 含量均存在閾值效應,其中6 個環境變量存在雙閾值.閾值效應結果表明,在堿解氮(170~180mg/kg)和有效磷(40~44mg/kg)的位置有機碳含量迅速升高,在土壤微生物多樣性(108)、速效鉀(195~215mg/kg)、降水量(610mm 和640mm)的位置土壤有機碳含量下降,確定了協變量對土壤有機碳含量的雙向和三向交互作用.

4.4 在確定環境變量的有效范圍、SOC 空間分布的潛在過程和提高農田SOC 變化的解釋力時應考慮閾值和相互作用效應.

致謝:感謝國家科技基礎條件平臺-國家地球系統科學數據中心(http://www.geodata.cn)提供數據支撐.感謝國家青藏高原科學數據中心(http://data.tpdc.ac.cn)提供數據支撐.

猜你喜歡
環境變量土壤有機速效
從桌面右鍵菜單調用環境變量選項
徹底弄懂Windows 10環境變量
不同殺螨劑對柑桔紅蜘蛛速效與持效性防治田間試驗
土壤速效鉀測定方法的影響因素
西雙版納橡膠林土壤有機碳分布特征研究
秸稈還田的土壤有機碳周轉特征
土壤有機碳轉化研究及其進展
基于三階段DEA—Malmquist模型的中國省域城鎮化效率測度及其收斂分析
AMDIS在土壤有機污染物鑒別中表征性統計量的探究
施用不同有機物料對山地果園紅壤速效氮磷鉀含量的影響
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合