?

2002-2017年新疆天山云杉區域生物量時空分布數據集

2024-04-29 05:01胡嘯琦,胡林,曹姍姍,孫偉
農業大數據學報 2024年1期
關鍵詞:時空分布生物量

摘要:森林是陸地生態系統的核心部分,其生物量約占陸地生態系統總生物量90%,承擔著65%以上的年碳固定量,在維持全球碳平衡、減緩溫室氣體增加等方面具有重要作用。天山云杉是新疆地區重要的林木資源,其種植覆蓋面積為75 8600 hm?,占新疆維吾爾自治區天山區域總面積的42.33%,蓄積量為0.17 km?,占總蓄積量的50.66%,構建其生物量時空數據集,可為新疆維吾爾自治區天山區域碳固存潛力評估和天山云杉林保護與可持續經營實踐提供科學依據。數據集以2002年、2007年、2012年和2017年天山云杉密集區野外樣地調查和相關多源遙感影像資料為基礎,利用時空地理加權回歸(GTWR)模型擬合生成各時期生物量分布圖。該數據集有助于探索天山云杉生長趨勢和生物量變化,同時在新疆天山地區生態保護和氣候變化研究領域具有科學價值,對區域生態系統管理具有實踐意義。

關鍵詞:天山云杉;生物量;時空地理加權;時空分布

1? 引言

新疆天山山脈位于中國西北部,是亞洲中部的一座巨大山系。該山脈全長近2500 km,由3座大山及其20余座山脈和10余個山間盆地或谷地等地貌單元組成。山脈擁有豐富的植被和動物種類,其獨特的自然景觀和生態系統為天山云杉等多種野生動植物提供了棲息地[1-2]。云杉主要生長在天山北坡海拔1.3至3 km的中山帶和亞高山帶[3],是天山山脈的典型地帶性植被和優勢樹種之一,總覆蓋面積約為758600 hm?,占山地總面積的42.33%,蓄積量為0.17 km?,占山地總蓄積量的50.66%。云杉在保持水分、防止水土流失及維持區域生態系統平衡方面發揮著關鍵作用,具有顯著的生態和經濟價值。森林生物量是森林生態系統結構和功能的重要定量指標之一。天山云杉森林生物量的準確計算不僅是區域森林生態系統有效監測評估的關鍵指標,同時也是森林科學管理和持續運作的重要前提[4-5]。

森林資源分布受到眾多因素的影響,具有多樣性和復雜性,并在特征上呈現空間連續性、隨機性和結構復雜性。這種復雜性不僅體現在資源的分布上,而且關系到森林生物量的估算。傳統上,森林生物量主要通過現場測量取得數據并計算得出,具體包括調查樣地內林分特征(例如樹種、樹高、胸徑等),建立樹種單木異速生長方程進而測算森林地上生物量(例如,皆伐法、平均木法和相對生長法等)。該方法以實地調查為基礎,計算結果較為準確,但存在工作量大、成本高、周期長、具有破壞性和空間局限性等不足[6]。近年來,綜合利用遙感數據、氣象數據、地形數據、土壤數據等多源數據的生物量估測模型逐漸得到廣泛應用,其中,地理加權回歸(Geographically Weighted Regression, GWR)方法被認為是解決林業和生態學應用中空間異質性問題十分有效的方法[7-8],原因在于其在回歸系數確定中引入了空間位置從而反映了空間的非平穩性,從而提供了更精確的局部估測結果。Wang等利用GWR與遙感數據估算了竹林地上生物量[9],Chen等結合GWR與光學、微波雷達數據計算長白山脈地上生物量,結果顯示GWR是有限樣本條件下預測和繪制AGB分布規律的最佳方法,其均方根誤差為0.08 Mg/hm2,展示了GWR在生物量估測中的應用潛力[10]。部分研究注意到森林生物量的時空屬性,提出了將時間維度納入GWR以構建時空地理加權回歸(Geographically and Temporally Weighted Regression, GTWR)模型[11],有效整合了時間序列數據和空間數據,更好揭示了森林資源的時空變化過程[12]。盧士欣等學者基于豐林縣地區 4 期 Landsat 影像和對應氣象站點數據開展的地上喬木生物量時空變化研究表明,加入時間特征的GTWR在模型評價指標上較GWR更為理想[13],表現出更好的擬合效果?;?,本研究采用GTWR處理2002、2007、2012、2017年收集的涵蓋生物量、地形、氣象和遙感因子等指標的多源時空數據,生成天山云杉生物量空間分布圖,以支持對生物量空間變化趨勢及其時空分布規律的分析。

對天山云杉生物量的研究近年來有所發展,出現了諸如2014年天山西部云杉生物量空間分布[14]、伊犁地區云杉生態因子數據集[15]等公開訪問數據集,然而整體上相關數據仍相對有限,同時時空分布與多尺度特征并不理想,在一定程度上限制了相關研究的發展。本數據集源于國家自然科學基金項目“天山北坡天山云杉生物量時空估測方法的優化研究”中開展的對2002-2017年間研究區(地理范圍為北緯41°48′至44°45′,東經80°39′至87°44′,圖1)天山云杉的4期野外調查。數據集由相關野外樣地調查數據和相關多源數據整合而成,目的是描述與說明天山云杉林生物量與各相關變量間的關系,為天山云杉生物量研究提供更大時空尺度和更多維度的數據。該數據同時也對天山云杉森林生態系統的監測評估與森林科學管理和持續運作具有實踐意義。

2? 數據采集與處理方法

2.1? 數據采集與預處理

數據集生成包括野外林分調查與數據處理、生物量估算和多源數據整合3個階段組成。

(1)野外林分調查與數據處理

研究團隊選擇天山云杉密集生長區域作為調查區(圖1)開展了多年(2002年、2007年、2012年及2017年)四期野外調查。調查區內共圈定了297個樣地,每個樣地規模為28米×28米,選定標準主要為未明顯受病蟲害影響且人為干擾最小。調查內容包括樣地的行政區劃、樣地位置和胸徑、樹高、齡組等林學測量因素。調查中依據國家林業和草原局提出的采樣標準采用GPS記錄樣地中心點的位置,樣木胸徑起測5厘米,測量位置在樹高1.3米[16]。

(2)調查數據處理與生物量估算

在數據處理后,本研究引入天山云杉異速生長模型[17],選擇區域內最優模型,決定系數R?為0.981的生長公式進行樣地單木生物量的估算。計算結果具有一定的適用性和準確性。

W = 0.1661×D 2.2528? ? ? ? ? ? ? ? ? ? ?(1)

公式(1)中,D為云杉胸徑(厘米),W為本地區云杉生物量的計算結果(千克)。

為了全面評估樣地級別的生物量,本研究首先對每個樣地的單木生物量進行了匯總。隨后,為了更準確地評估森林生態系統的碳儲存能力,進一步計算單位面積生物量。最終得到了不同調查年份的樣地生物量數據,結果如下:

(3)多源數據整合處理

當前覆蓋研究區的多源遙感數據來自谷歌地球引擎(Google Earth Engine, 簡稱GEE)包括地形因子(海拔)、遙感因子(植被指數)、氣象因子(降水、徑流、風速)。(1)海拔數據是由航天飛機雷達地形測繪任務(SRTM30)獲得,可以精確描述研究區域地形特征。實驗步驟:通過在gee上訪問SRTM數據集,裁剪出研究區范圍,導出研究區高程數據,分辨率為30×30;(2)植被指數數據選擇中分辨率成像光譜儀(MOD13A2)產品。實驗步驟:通過在gee上訪問MOD13A2數據集,裁剪出研究區范圍,質量控制篩選2002-01-01到2002-12-31時間區間的數據計算均值,選擇特定數據層(NDVI/EVI),同理可得2007、2012、2017年年均分布,分別導出研究區植被數據,分辨率為1000*1000;(3)年度氣象因子數據通過 ERA5-Land 數據集下載,實驗步驟:通過在gee上訪問ERA5-Land數據集,裁剪出研究區范圍,質量控制篩選2002-01-01到2002-12-31時間區間的數據計算均值,選擇特定數據層(降水、徑流、風速),同理可得2007、2012、2017年年均分布,分別導出研究區氣象數據,分辨率1000*1000。所有數據集通過采樣重投影到統一的空間分辨率和坐標系統(WGS1984_UTM_Zone_45N)中,通過 ArcGIS 轉換成結構化的數據格式,適用于時空地理的加權回歸分析。

2.2? 云杉生物量分布數據計算

本研究通過對天山云杉密集區生物量分布與環境因素之間復雜相互作用的時空地理加權回歸(GTWR)模型進行探索。在進行建模之前,研究通過方差膨脹因子(VIF)進行了解釋變量與生物量關系的共線性檢測。多重共線性,即模型中自變量相互之間的高度相關性,可能會影響模型估計的準確度[18],通過SPSS軟件的共線性檢測得到本研究的解釋變量VIF值均小于10。GTWR模型作為地理加權回歸(GWR)的進階版本,不僅考慮了空間異質性,還引入了時間維度的變化,從而能夠更全面地揭示生物量分布隨時間和空間的動態變化。

在GTWR模型中,自變量的回歸系數隨著時空的變化而不斷變化,從而提供了比傳統GWR模型更精確的分析框架來理解變量之間復雜的時空關系。GTWR模型的基本公式如下[19]:

yi=β0(ui,vi,ti)+∑βk(ui,vi,ti)×Xik+?i? ? ? ? ? ? (2)

公式(2)中,(ui,vi)表示第i個樣本點的地理坐標,ti表示觀測時間,yi表示第i個樣本點的因變量值,Xik表示第i個樣本點的第k個解釋變量,而β0(ui,vi,ti)和βk(ui,vi,ti)分別是回歸常數和回歸系數,?i代表模型誤差項。

回歸系數的估計公式為:

Β( ui,vi,ti)=(X'W(ui ,vi,ti)X)-1X'W(ui,vi,ti)y? ? ? (3)

公式(3)中,W(ui,vi,ti)表示時空位置的權重,時空地理加權模型決定不相同的本點對于返回樣本點的影響程度,是通過構造時空權重矩陣W(ui,vi,ti)。時空權重矩陣在時空地理加權回歸(GTWR)模型中起著核心作用,其構建過程是模型分析的關鍵環節。構造過程一般是通過構造時空距離計算并帶入權重函數(例如高斯函數或bi-square函數),從而計算得到權重矩陣,這一過程確保GTWR模型在進行回歸分析時可以將各個樣本點的時空特性考慮在內,從而在對復雜時空數據進行分析時提高模型的精確性和適應性 [11,20]。

3? 數據內容

數據集主要包括天山云杉密集區域樣地結構數據和分布數據。

(1)天山云杉密集區域樣地結構數據,內容包括2002年-2017年每期樣地情況,編號、行政區位置、單位生物量、海拔、歸一化植被指數、綠色植被密度指數共8個氣象生物因子(表2)。

(2)天山云杉密集區域生物量及背景數據。背景數據包括地形數據、遙感數據和氣象數據。地形數據為海拔(圖2),遙感數據包括歸一化植被指數和綠色植被密度指數(圖3),氣象數據包括年平均降水量、年最大降水量、年最小降水量、年平均徑流深度、年最大徑流深、年最小徑流深、年平均向北風速、年平均向東風速(圖4)。云杉密集區域生物量時空地理加權結果分布如圖5所示。

4? 數據質量控制

為確保數據的科學性和處理的精確性,從選擇樣點、測量樣本、檢查校驗、數據分析等過程盡可能標準化步驟,減少人為誤差。對于野外調查數據,項目團隊采樣嚴格執行國家林業和草原局公布的森林調查技術規程,依據天山實地隨機均勻設置多個未明顯受病蟲害影響且人為干擾最小云杉采樣點。每個樣點所有樣木調查數據以平均值的三倍標準差作為排除閾值排除實測數據中由于人為誤差所引入的異常值,并在此基礎上利用云杉異速生長方程獲取樣地生物量數據值。地形因素、氣象因素以及遙感因素的數據則借助于谷歌地球引擎(Google Earth Engine, GEE)的地理空間數據處理能力獲取。其中,高程資料源自SRTM30的航天飛機雷達地形測繪任務(SRTM30),植被指標資料則選擇了中解析度成像光譜儀(MOD13A2)產品。年度氣象因子數據,包括降水量、徑流量和風速等,均通過ERA5-Land 數據集下載。所有數據的獲取和處理均在GEE代碼編輯器中通過編寫腳本實現,嚴格指定了時間和空間范圍。此外,時空地理加權回歸模型的建立和分析工作在RStudio和ArcGIS 10.8環境下完成,通過對插值結果進行交叉驗證(RMSE為64.36Mg/ha)來確保實驗的精度。本研究在所有數據集的處理和分析過程中,嚴格遵循了相關技術規程和軟件操作指南,以確保數據質量的高度可靠性和分析結果的準確性。

5? 數據價值與使用建議

本數據集融合了2002年、2007年、2012年和2017年四期的297個樣地的生物量數據、SRTM30的高程數據、MOD13A2的植被指數和ERA5-Land的年度氣象因子,相對于分析天山云杉生物量的時空分布而言數據更加全面。對更好揭示天山云杉的生長趨勢和周期性變化極為關鍵,也為識別和保護關鍵生態區域、評估氣候變化對生態系統的影響、監測和模擬生態系統碳循環過程、全球碳預算研究提供數據支持,還為生態系統管理和相關領域的科研工作者提供了寶貴的數據資源[21]。

6? 數據可用性

中國科技資源標識碼(CSTR)碼為17058.11. sciencedb.agriculture.00089;

數字對象標識碼(DOI)為10.57760/sciencedb. agriculture.00089。

公開訪問。

7? 代碼可用性

本文所用代碼存儲于國家農業科學數據中心并允許公開訪問、下載與安裝,訪問地址為https://agri.scidb. cn/preview?dataSetId=89ae131046bd42369f0930abc21a1e31&version=V1。

作者分工與貢獻

胡嘯琦,數據處理分析與論文撰寫。

胡林,數據分析。

曹姍姍,數據采集。

孫偉,組織實施與數據校對。

倫理聲明

本研究不涉及倫理事項。

利益沖突聲明

全部作者均無會影響研究公正性的財務利益沖突或個人利益沖突。

參考文獻

[1] 盧雅焱,徐曉亮,李基才,等.基于InVEST模型的新疆天山碳儲量時空演變研究[J].干旱區研究,2022,39(6):1896-1906.

[2] 王敏,李貴才,仲國慶,等.區域尺度上森林生態系統碳儲量的估算方法分析[J].林業資源管理,2010(2):107-112.

[3] 羅慶輝,徐澤源,許仲林.天山雪嶺云杉林生物量估測及空間格局分析[J].生態學報,2020,40(15):5288-5297.

[4] 李宗英,羅慶輝,許仲林.西天山雪嶺云杉林分密度對森林生物量分配格局和異速生長的影響[J].干旱區研究,2021,38(2):545-552.

[5] 阿地來·賽提尼亞孜.天山北坡中段雪嶺云杉林8 hm?樣地群落特征10a變化[D].烏魯木齊:新疆大學,2022.

[6] 魏智海,張樂藝,李霞.森林地上生物量遙感估算研究進展[J].農業與技術,2021,41(11):78-84.

[7] Zhang B, Ou G, Sun X, et al. Application of spatial effect and regression model on forestry research[J]. Journal of southwest forestry university, 2016, 36: 144-152. https://doi.org/10.11929/j.issn.2095-1914.2016.03. 025.

[8] Kupfer J A, Farris C A. Incorporating spatial non-stationarity of regression coefficients into predictive vegetation models[J]. Landscape Ecology, 2007, 22: 837-852. https://doi.org/10.1007/ s10980-006-9058-2.

[9] Wang J, Du H, Li X, et al. Remote sensing estimation of bamboo forest aboveground biomass based on Geographically Weighted Regression[J]. Remote Sensing,2021, 13(15), 2962. https://doi.org/ 10.3390/rs13152962.

[10] Chen L, Ren C, Zhang B, et al. Estimation of forest above-ground biomass by Geographically Weighted Regression and Machine Learning with sentinel imagery[J]. Forests 2018, 9(10): 582. https:// doi.org/10.3390/f9100582.

[11] Fotheringham A, Charlton M, Brunsdon C. Geographically Weighted Regression: A natural evolution of the expansion method for spatial data analysis[J]. Environment and Planning. A, 1998, 30(11): 1905-1927. https://doi.org/10.1068/a3019.

[12] 肖宏偉,易丹輝.基于時空地理加權回歸模型的中國碳排放驅動因素實證研究[J].統計與信息論壇,2014,29(2):83-89.

[13] 盧士欣,賈煒瑋,孫毓蔓,等.基于局部回歸模型的森林生物量動態變化分析[J/OL].西南林業大學學報(自然科學):1-9[2023-12-15].

[14] 蔡潮勇,曹姍姍,孔繁濤,等.2014年新疆天山西部云杉地上生物量空間分布數據集[J].中國科學數據(中英文網絡版), 2022, 7(3): 250-263.

[15] 衛培剛,孔繁濤,胡林,等.2014年伊犁地區天山云杉分布區生態因子數據集[J].中國科學數據(中英文網絡版),2023,8(1):242-252.

[16] GB/T 38590-2020. 森林資源連續清查技術規程[S].北京:中國標準出版社,2020.

[17] 張繪芳,高亞琪,朱雅麗,等.新疆雪嶺杉生物量模型對比研究[J].西北林學院學報,2015,30(6):52-58.

[18] 田曉梅,崔洪軍,朱敏清,等.基于時空地理加權回歸的服務區駛入量影響因素分析[J].科學技術與工程,2023,23(20):8828-8838.

[19] 孫裔煜,高靜,仝德,等.基于GTWR的廣東省鄉村聚落規模時空演變研究[J].地理科學,2023,43(7):1249-1258.

[20] Zhang Y, Teoh B K, Zhang L M, et al. Spatio-temporal heterogeneity analysis of energy use in residential buildings[J]. Journal of Cleaner Production, 2022, 352: 131422. https://doi.org/10.1016/j.jclepro. 2022.131422.

[21] 張繪芳,張景路,侯曉巍,等.新疆天山山區喬木林碳密度變化特征及其影響因素[J].水土保持通報,2021,41(2):122-127.

引用格式:胡嘯琦,胡林,曹姍姍,孫偉. 2002-2017年新疆天山云杉區域生物量時空分布數據集[J].農業大數據學報,2024,6(1): 24-32. DOI:10.19788/ j.issn.2096-6369.100008.

CITATION: HU XiaoQi , HU Lin , CAO ShanShan , SUN Wei.Spatial and Temporal Distribution of Biomass in Dense Regions of Tianshan Spruce in Xinjiang, 2002-2017[J]. Journal of Agricultural Big Data, 2024,6(1): 24-32. DOI: 10.19788/j.issn.2096-6369.100008.

Spatial and Temporal Distribution of Biomass in Dense Regions of Tianshan Spruce in Xinjiang, 2002-2017

HU XiaoQi1,2 , HU Lin 1,2 , CAO ShanShan 1,2*, SUN Wei 1,2*

1. Agricultural Information Institute of CAAS, Beijing 100081, China; 2. National Agriculture Science Data Center, Beijing 100081, China

Abstract: Forests constitute the central part of terrestrial ecosystems, encompassing approximately 90% of the total biomass. They are responsible for over 65% of the annual carbon sequestration, playing a crucial role in maintaining global carbon balance and mitigating the increase of greenhouse gases. Tianshan Spruce, a vital forest resource in the Xinjiang region, covers an area of 758,600 hectares, accounting for 42.33% of the total area, with a volume of 0.17 cubic kilometers, representing 50.66% of the total volume. Constructing a spatiotemporal biomass dataset of Tianshan Spruce provides a scientific basis for assessing the carbon sequestration potential and for the protection and sustainable management of these forests in the region. In recent years, biomass estimation models integrating multisource data like remote sensing, meteorological, topographic, and soil data have been widely adopted. The geographically weighted regression (GWR) method is particularly effective in addressing spatial heterogeneity issues in forestry and ecological applications. This study's dataset is grounded on field survey data from dense Tianshan Spruce areas collected in 2002, 2007, 2012, and 2017 by the project team, adhering to the forest survey technical procedures of the National Forestry and Grassland Administration, and on multisource remote sensing images from the Google Earth Engine. The geographically and temporally weighted regression (GTWR) model was employed to generate biomass distribution maps for each period. This dataset is instrumental in exploring the growth trends and biomass variations of Tianshan Spruce, holding scientific value for ecological protection and climate change research in the Tianshan area of Xinjiang. It has practical significance for regional ecosystem management. Additionally, it offers data support for identifying and protecting key ecological areas, assessing the impact of climate change on ecosystems, monitoring and simulating the carbon cycle processes in ecosystems, and contributing to global carbon budget research. Furthermore, it provides valuable data resources for researchers in ecosystem management and related fields.

Keywords: Tianshan spruce; biomass; spatial and temporal geographic weighting; spatial and temporal distribution

猜你喜歡
時空分布生物量
輪牧能有效促進高寒草地生物量和穩定性
不同NPK組合對芳樟油料林生物量的影響及聚類分析
草地生物量遙感估算方法綜述
基于云模型的淮北平原參考作物蒸散量時空分布
基于云模型的淮北平原參考作物蒸散量時空分布
長江中下游地區近32年水稻高溫熱害分布規律
長江中下游地區近32年水稻高溫熱害分布規律
成都市人口時空分布特征分析
生物量高的富鋅酵母的開發應用
五壘島灣海域無機氮、無機磷的時空分布和氮磷比值變化
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合