?

不同植被類型森林生物量反演模型研究
——以湖南省公益林為例

2024-01-20 02:46劉慧婷王光軍樊紅波胡孔飛
西北林學院學報 2024年1期
關鍵詞:公益林決策樹波段

劉慧婷,潘 俊,符 玥,王光軍,樊紅波,胡孔飛

(1.核工業二三○研究所,湖南 長沙 410007;2.湖南省伴生放射性礦產資源評價與綜合利用工程技術研究中心,湖南 長沙 410007;3.中南林業科技大學 理學院,湖南 長沙 410004;4.中南林業科技大學 生命科學與技術學院,湖南 長沙 410004;5.湖南景輝農林生態科技有限公司,湖南 長沙 410004)

森林在全球碳循環和森林生態系統中發揮著不可替代的作用[1]。森林生物量是森林生態系統運行的能量基礎和物質來源,是判斷森林生態系統碳源、碳匯的重要標志[2-3]。為更好適應碳循環機制和提升森林生態質量,中國森林經營理念提出了維護和改善生態環境、保持生態平衡、保護生物多樣性的生態公益林[4]。因此,在全球氣候變化背景下針對生態公益林對其生物量的估測研究具有重要意義[5-6]。

傳統的森林生物量估測方法已經難以滿足森林結構參數的更新需求[7]。隨著森林信息化的發展,遙感技術不僅具有監測范圍廣、動態更新周期短的特點,且能夠準確反映植被分布、類型、長勢等情況,現已成為森林生物量估測研究的主要手段[8-9]。許振宇等[10]、蔣馥根等[11]、周蔚等[12]探討了不同遙感數據與森林生物量之間的關系,分別建立桂東縣森林生物量估測模型、旺業甸林場落葉松(Larixgmelinii)和樟子松(Pinussylvestris)地上生物量回歸估測模型、太平湖森林地上生物量估測模型。Landsat衛星因長期免費提供歷史檔案和空間分辨率而具有獨特的優勢,使其成為廣泛運用于估算森林生物量的光學遙感數據源[13-15]。Lu[16]利用Landsat TM影像對巴西亞馬遜地上生物量進行估計,發現遙感估測模型中加入紋理信息能提高森林生物量估算精度;Kelsey等[17]以2011年的Landsat影像和森林資源調查數據,采用性能最佳的神經網絡模型,生成了2011年圣胡安國家森林的生物量圖;周蓉等[18]基于Landsat 8數據,采用隨機森林特征重要性分析遙感特征的貢獻率,對比研究BP神經網絡算法的2種訓練算法、SVM支持向量機的3種核函數構建地上生物量模型。這些研究表明,遙感影像在森林生物量估算中具有一定潛力和優勢,但缺乏對區域代表性森林植被類型生物量的遙感監測和分布研究。

本研究以湖南省公益林為對象,利用2021年湖南省公益林固定樣地監測數據、Landsat 8遙感數據,基于不同植被類型,采用支持向量機模型、決策樹模型和隨機森林模型估算森林生物量,比較各模型的精度,最佳模型反演生成研究區域生物量分布圖,為湖南省公益林資源的動態監測、功能區劃和保護管理提供科學依據。

1 材料與方法

1.1 研究區概況

根據湖南省2021年森林資源管理“一張圖”,2021年湖南省省級以上公益林(以下簡稱“湖南省公益林”)總面積495.28×104hm2,約占全省總面積的23.36%,其中國家級公益林391.78×104hm2,省級公益林103.50×104hm2,涵蓋全省14個市(州)118個縣(市、區)。將湖南省公益林植被分為5種植被類型,即針葉林、闊葉林、針闊混交林、竹林和灌木(表1)。

表1 湖南省公益林的基本描述

1.2 樣地數據來源與處理

1.2.1 樣地數據 樣地數據采用湖南省2021年公益林面上固定樣地調查監測數據(圖1)。利用單木生物量方程,分類逐株計算每個樣地的單木生物量,通過匯總后得到樣地總生物量。根據植被類型劃分,將樣地分為針葉林、闊葉林、針闊混交林、竹林和灌木5種類型,樣地生物量統計結果見表2。

圖1 研究區森林固定樣地

表2 樣地生物量統計結果

1.2.2 遙感影像數據及提取 利用Google Earth Engine(GEE)平臺所提供的Landsat 8地標反射率產品(LC08),空間分辨率為30 m。為保證影像完整覆蓋以及與樣地調查活動同期,影像選取的時間范圍為2021年5-10月,并選擇云量<5%的266張圖像。為保證影像數據的質量,利用CFMask算法對云、陰影、水和雪覆蓋的像素進行掩蔽;應用Mosaic函數和Clip函數融合、拼接和裁剪能代表研究區植被生長最好狀態的地表反射率影像。

經過預處理后的遙感影像數據,在ENVI 5.3中提取各類遙感因子用于生物量建模研究中。本研究提取的影像因子包括原始波段、波段組合、植被指數、信息增強以及紋理特征5類(表3)。

表3 特征變量匯總

1.3 模型特征變量選擇

Boruta算法是一種以隨機森林為基礎進行特征提取的方法。該方法首先對原特征數據集進行重新排列,創建混合副本,并生成陰影特征。然后使用隨機森林方法對陰影特征集進行重要性排序,重要性得分越高,特征越重要[19]。在R 4.2統計軟件中執行Boruta算法,針葉林、闊葉林、針闊混交林、灌木林和竹林生物量為因變量,115個遙感特征因子為自變量,變量被確定為重要變量和非重要變量。

1.4 生物量估算模型

采用支持向量機(support vector machine,SVM)、決策樹(classification and regression tree,CART)模型、隨機森林(random forest,RF)3種模型進行研究區生物量遙感。

支持向量機是由Cortes等[20]提出的一種廣泛應用于分類和回歸問題的機器學習方法,可以高效地適用于高維空間的數據,有效處理具有許多特征的數據集,在非線性情況下可以使用核函數將數據點映射到高維空間中,通過選擇合適的核函數和正則化參數,可以避免過擬合。支持向量機模型在R語言中,使用Kernlab包。

決策樹是一種基本的分類與回歸方法,其中CART算法[21]是應用最廣泛的決策樹學習方法,包括特征選擇、樹的構建及樹的剪枝三部分。該算法使用基尼指數(gini index)作為分類節點的衡量指標,基尼指數系數越小,該節點的變量分類純度就越高。CART模型通過構建二叉樹實現預測目的,所構建的模型具有易于理解和解釋、可處理高維數據、具有較好的預測能力和魯棒性等優點。CART算法采用R語言Rpart包。

隨機森林(random forest,RF)是由Breiman[22]提出的一種分類和回歸算法,它是一種以決策樹為基礎的bagging并行集成學習算法,主要依靠樣本的隨機選取和特征的隨機選取消除過擬合問題。隨機森林模型具有確定變量重要性、減少過度擬合的穩健性、需要調整的參數更少、對參數調整的敏感度更低、訓練速度快等優點。模型用R語言random Forest包執行,需要調整的參數為建立的決策樹數量(ntree)和決策樹分裂時抽取的變量個數(mtry)。

1.5 模型精度評價

為充分利用樣本以提高模型的可靠性,選擇將數據集進行劃分,70%的數據作為訓練數據,30%的數據作為驗證數據,進行試驗?;貧w模型常用的評價指標有決定系數(coefficient of determination,R2)[23]和均方根誤差(root mean square error,RMSE)[23]。其中,決定系數R2是對回歸直線擬合程度的檢驗,值越接近1,表明關聯性越高,自變量對因變量的解釋能力也就更強。RMSE指的是估計值與實際數據的平方和與樣本量n之比的平方和,數值愈低,則說明該方法的預測效果越好。

2 結果與分析

2.1 基于Boruta變量選擇

篩選結果見表4,在所選的變量中,近NIR波段(光譜波段5)和SWIR波段(光譜波段6、7)及其紋理特征變量在森林生物量估測中具有重要作用。除了紋理特征變量之外,對于闊葉林和針葉林,植被指數變量占據重要地位;對于總林地生物量,原始波段、植被指數和信息增加也具有十分重要的作用。

表4 建模因子篩選結果

2.2 支持向量機生物量估測模型

5種植被類型以及不區分植被類型(總林地)生物量支持向量機模型驗證結果見圖2。利用支持向量機模型建模時,針葉林、竹林支持向量機模型擬合精度較好,其次是總林地,針闊混交林、灌木擬合精度較差。

2.3 決策樹生物量估測模型

5種植被類型以及不區分植被類型(總林地)生物量決策樹模型驗證結果見圖3。用決策樹CART模型建模時,針闊混交林、總林地決策樹模型擬合精度較好,其次是闊葉林、針葉林、灌木,竹林擬合精度最差。

圖3 基于決策樹的不同植被類型生物量模型精度

2.4 隨機森林生物量估測模型

5種植被類型以及不區分植被類型(總林地)生物量隨機森林模型驗證結果見圖4。利用隨機森林模型建模時,針葉林、闊葉林、針闊混交林、竹林和灌木植被類型的隨機森林模型精度擬合程度R2為0.73~0.79,RMSE為2.11~31.76 t·hm-2,結果明顯優于不區分植被類型(總林地)的模型,這說明對森林生物量進行分類可以提高模型擬合精度;在這5種不同植被類型的隨機森林模型中,竹林隨機森林模型的擬合程度最好。

圖4 基于隨機森林的不同植被類型生物量模型精度

2.5 模型精度對比

通過比較3類模型,隨機森林模型估計精度最高。同時,在隨機森林模型中,竹林(RMSE=26.50 t·hm-2,R2=0.79)的精度最高,其次是針闊混交林(RMSE=15.76 t·hm-2,R2=0.76)、針葉林(RMSE=29.76 t·hm-2,R2=0.74)、灌木(RMSE=2.11 t·hm-2,R2=0.74)、闊葉林(RMSE=21.57 t·hm-2,R2= 0.73),總林地(RMSE=30.77 t·hm-2,R2=0.67)精度最低。綜上所述,隨機森林算法較適用于湖南省公益林生物量估算,同時,對植被類型進行分類可以有效提高模型擬合精度。

3 討論

3.1 特征變量選擇

結合以往熱帶和亞熱帶地區的森林生物量研究,NIR波段(B5)和SWIR波段(B6、B7)比可見光起著更重要的作用[24-26]。在森林生物量估測模型中,Landsat 8 OLI的SWIR波段(B6、B7)對林分結構中固有的水分和陰影成分更敏感,并且大氣條件對光譜特征的影響小于其他較短波長(可見光)光譜帶[27];NIR波段(B5)可以有效排除水汽吸收影響,使它對不同類型的植被更為敏感[28];并且,SWIR波段(B6、B7)在生物量建模中比更短波長的光譜帶更有價值,對可見波段的森林光譜特征更為敏感。

不同植被類型(針葉林、闊葉林、針闊混交林、竹林和灌木)和不區分植被類型(總林地)的生物量反演模型在進行森林生物量估測時,紋理特征是關鍵變量,但在各模型中所占比重不同,這是由于研究區的公益林工程大多是土壤條件較差、水土流失易發生地帶,森林經營水平低、森林結構不合理,從而使得原本林分結構簡單的森林變得異常復雜。在針葉林模型和竹林模型中,由于樹種相對較少、結構簡單,紋理特征顯得更為重要。在多個冠層和復雜冠層結構的闊葉林和混交林中,模型傾向于選擇波段組合和信息增強變量。在不區分植被類型(總林地)生物量變量選擇過程中,單獨一個變量不能有效捕捉林分結構的復雜性,原始波段、波段組合、信息增強、植被指數和紋理特征的組合更有利于提高森林生物量模型的性能。

3.2 模型選擇對生物量估測的影響

機器學習方法可以在數據分布不確定的情況下,在植被信息和遙感圖像之間建立復雜的非線性關系,提高預測的準確性[26,29]。本研究選用3種機器學習算法構建湖南省公益林生物量估測模型,隨機森林(RF)模型在不同植被類型中始終表現出最佳的性能。與另外2種模型相比,RF模型可以更好地防止過度擬合以及解決變量間復雜非線性關系的問題[30-31]。在其他亞熱帶森林生物量估算研究中,同樣證明所選的隨機森林建模方法精度更高[32]。隨機森林模型雖然提升森林生物量遙感估測精度,但研究結果也顯示,它并沒有完全消除高值低估和低值高估,而這依然是影響森林生物量遙感估測精度的一個重要原因。

3.3 分類植被類型對生物量估測的影響

本研究表明,在建立RF模型時,對植被類型進行分類可以有效提高森林生物量的估測精度,但在建立SVM模型和CART模型時,對植被類型進行分類不足以提高模型擬合精度。植被類型通常反映不同的生長條件、土壤類型、環境因素等,將植被類型進行分類可以提高模型的泛化性能和準確性[26,33],而一些模型能夠從遙感特征中捕捉植被類型的信息,將植被類型分類可能只會增加噪聲,導致過擬合的問題。

RF不同植被類型公益林生物量估測模型的精度大小排序為:竹林>針闊混交林>針葉林>灌木>闊葉林。經比較發現,在對植被類型進行分類建模時,進行植被類型分類的模型精度大小順序并不是固定的。Li等[34]利用理論模型將闊葉林、針葉林和混交林這3個精度值分別提高到0.897、0.856和0.826,模型精度大小排序為:闊葉林>針葉林>混交林。Liu等[35]建立森林類型生物量的RF模型呈現出闊葉林>針葉林>混交林的特征,R2分別是0.742 5、0.738 6、0.690 9,Ma等[36]在回歸模型中加入地形和林分結構因素,擬合效果針葉林R2為0.98,混交林R2為0.96,闊葉林R2為0.96,這是因為土壤、海拔、氣候等因素造成了不同植被類型生物量具有各自的物種組成和林分結構,而且遙感數據的使用以及樣本量的大小都會造成生物量估測偏差。

4 結論

Boruta算法篩選變量,NIR波段(B5)和SWIR波段(B6、B7)及其紋理波段具有明顯優勢。

對于針葉林和竹林,紋理特征更為重要;闊葉林和混交林,波段組合和信息增強更為重要;對于總林地生物量變量選擇過程中,多類遙感因子組合更有利于提高森林生物量模型的性能。

隨機森林模型較之多元線性回歸、支持向量機和決策樹模型,公益林生物量模型擬合能力最佳。用隨機森林模型估測的針葉林、闊葉林、針闊混交林、竹林和灌木生物量驗證R2分別為0.74、0.73、0.76、0.79和0.74,RMSE分別為31.76、21.57、15.76、25.60 t·hm-2和2.11 t·hm-2,表明模型有較好的生物量估測精度。相對于總林地的隨機森林模型R2為0.67,RMSE為30.77 t·hm-2,對植被類型進行分類可以有效提高森林生物量的估測精度。

猜你喜歡
公益林決策樹波段
ArcGis在遼寧省國家公益林調整中的應用
龍泉七成公益林實現信息化管理
一種針對不均衡數據集的SVM決策樹算法
決策樹和隨機森林方法在管理決策中的應用
國家級重點公益林管理現狀與發展對策研究
生態公益林可持續經營的探討
基于決策樹的出租車乘客出行目的識別
M87的多波段輻射過程及其能譜擬合
日常維護對L 波段雷達的重要性
基于肺癌CT的決策樹模型在肺癌診斷中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合