?

森林火災時空分布特征及易發性分析研究

2023-12-22 03:38張國麗慈雪倫楊雪清蔣春穎孫志超孟海丁
林業資源管理 2023年5期
關鍵詞:林火易發火場

張國麗,慈雪倫,楊雪清,蔣春穎,孫志超,孟海丁

(國家林業和草原局林草調查規劃院,北京 100714)

森林火災是地球系統的重要擾動之一,是植被生態系統面臨的主要自然災害,對生態系統平衡、植被分布和人類生命財產等多方面都產生了深遠影響[1]。近年來,全球進入了森林火災的高發期,極具破壞性的火災事件激增[2]。研究表明,由于全球變暖,21世紀末期,全球火災易發區的面積將增加29%,火災季節長度顯著延長[3]。氣候變暖也將導致我國森林火災發生概率呈增加趨勢[4],我國仍將長期處于森林火災的易發期和高危期,森林防火形勢極其嚴峻[5]。森林火災易發性分析是自然災害研究的方向之一,也是制定防災減災對策的依據[6]。研究森林火災的時空分布特征和易發性空間分布格局,可為森林火災預防提供科學依據。

森林火災的發生受可燃物、地形、氣象條件和野外火源等多致災要素影響[3]。已有很多基于氣象因子建立林火發生模型方面的研究,如:高博等[7]通過分析氣象因子與林火的關系,使用逐步回歸方法建立大興安嶺地區森林火災發生模型;梁慧玲等[8]基于氣象因子,使用邏輯回歸和地理加權邏輯斯蒂回歸兩種模型,對比分析福建地區林火發生的可能性。目前,林火易發性模型多集中于區域尺度的研究,如:謝紹鋒等[9]基于泰森多邊形與條件熵構建林火易發性模型,分析廣州市林火空間分布規律;Zhuang et al[10]通過深度無監督表達學習,對森林地理信息進行建模并對區域林火易發性進行評估。由于森林火災受多致災要素影響,且林火易發性與野火驅動因子之間存在復雜的非線性關系,傳統線性模型在解釋非線性關系時具有局限性[11]。近年來,國內外學者對機器學習方法在林火易發性分析中的應用做了大量研究[12],如:Jain et al[13]系統總結了機器學習方法在林火科學和林火管理中的應用及未來面臨的挑戰;Zhang et al12,14]對比分析了多種機器學習模型在森林火災易發性建模中的應用。隨機森林(random forest,RF)算法是常用的機器學習方法之一,由于不受變量間多重共線性的影響,能自動選擇重要變量和處理變量間復雜的交互關系,RF模型已在我國林火發生預測研究中得到了廣泛應用[15]。如:潘登等[16]使用氣象因子對湘中丘陵地區構建林火預測模型,結果表明RF的預測準確率優于傳統二項邏輯斯蒂回歸模型;馬文苑等[17]對比分析了RF和邏輯斯蒂模型在山西省林火發生預測中的應用;蘇佳佳等[18]綜合應用增強回歸樹、RF和支持向量機這3個模型預測氣候變化對未來林火干擾的影響;高超等[11]對我國林火發生模型的研究現狀進行了系統總結,對比分析了多種傳統線性回歸方法和機器學習方法在林火發生預測中各自的優缺點,表明隨機森林方法具有更好的預測能力。近年來,我國森林火災研究逐步從僅考慮氣象條件向多致災要素發展,研究的空間尺度逐步從區域擴展到全國[19]。

根據上述研究總結,目前林火研究仍存在以下問題:第一,由于缺乏可燃物載量調查數據,以往林火易發性分析中未考慮此項因素;第二,從空間尺度上看,大多數研究是從省級或區域尺度進行研究,缺乏全國尺度的林火易發性分析;第三,林火發生模型多樣化,探討能夠考慮多致災要素的林火易發性模型十分必要。本研究基于全國第一次森林和草原火災風險普查數據,在完善林火驅動因素的基礎上,利用隨機森林算法構建林火易發性模型,量化分析31個省份的森林火災發生的時空特征和易發性空間分布格局。研究結果對于合理制定森林火災管理政策、減少森林火災對自然生態系統與人類社會系統的不利影響,實現可持續發展具有重要實際意義。

1 研究數據來源

根據全國森林和草原火災風險普查獲取的歷史火災調查數據(1)國家林業和草原局.全國森林和草原火災風險普查調查數據.2023.,提取31個省份2011—2020年歷史森林火災數據,其屬性信息包括森林火災次數、火源、起火地點、起火時間、經緯度、火場總面積、受害森林面積和人員傷亡等信息;對歷史森林火災數據進行數據質量檢查,剔除坐標信息不準確和屬性信息不完整的數據。

森林可燃物包括單位面積總可燃物載量和可燃性。在全國森林可燃物標準地實地調查數據的基礎上,全面獲取31個省份森林可燃物基本狀況信息,建立林分因子與喬木、灌木、草本、枯落物、腐殖質等不同層可燃物載量關系模型?;?019年森林資源管理“一張圖”,通過構建可燃物估算模型推算各類型可燃物載量,形成31個省份森林單位面積總可燃物載量空間分布數據??扇夹砸詢瀯輼浞N(組)燃燒的難易程度作為劃分依據,將優勢樹種(組)歸并難燃、可燃、易燃等3類。

氣象數據來自中國氣象數據共享網(http://data.cma.cn)。整理并統計2011—2020年中國逐月氣象數據,共計6個氣象要素,包括月大風日數(d/月)、月平均風速(m/s,10 m)、月平均降雨量(mm)、月平均氣溫(℃)、月最高氣溫(℃)和月最小相對濕度(%)等。6個氣象要素的空間分辨率為0.01°×0.01°。31個省份的DEM數據來源于2019年8月發布的ASTER GDEM V3版本中的數據(https://earthdata.nasa.gov),空間分辨率為30 m。通過使用ArcGIS 10.8.1軟件,從DEM數據中提取31個省份的坡度圖和坡向圖。我國七大地理分區劃分為華南、華中、東北、華北、西南、華東和西北地區。

2 研究方法

2.1 指標體系構建

森林可燃物是森林火災的重要致災因子之一,直接影響到森林火災的發生強度和林火行為。本研究主要選取可燃物、氣象和地形地勢這三大類指標,總計11個林火驅動因素(如表1所示)。根據各省份所設定的防火期,計算防火期內所有氣象要素2011—2020年的年平均值。以0.008°格網單元為基礎,將所有驅動因素數據統一到網格單元上,并采用最大、最小值歸一化方法對數據進行標準化處理。

表1 森林火災驅動因素

2.2 隨機森林算法

RF是一種非線性模型且能夠處理復雜的非線性關系,并自動處理森林火災驅動因素之間的交互效應,可以提高模型的穩定性和精度。RF利用Bootsrap自助抽樣法從原始數據集n中有放回地隨機抽取樣本數據,構建ntree株分類回歸樹。林火驅動因素為m個,在每株回歸樹的各節點上隨機抽取mtry個驅動因素。每次抽樣后,未被抽中的樣本形成袋外數據(Out-Of-Bag,OOB),作為測試樣本進行模型驗證。RF是基于Bagging集成的決策樹模型,對每個Bootsrap自助抽樣樣本進行決策樹建模,然后組合多棵決策樹,在處理分類問題時,由ntree個決策輸出的眾數作為最終預測類別[20]。相比于其它機器學習模型,RF不容易出現過擬合,對異常值和噪聲有較高的容忍度,預測準確率高。

根據2011—2020年31個省份的歷史森林火點數據,統計0.008°格網內發生森林火點的個數,并將其轉換為二進制作為林火發生的因變量(即1代表發生火災,0代表未發生火災);將11個森林火災驅動因素作為自變量。使用Python語言并通過Scikit-learn框架開發RF模型,隨機抽取70%的樣本數據作為訓練樣本集進行模型訓練,30%的樣本數據作為測試樣本集進行模型驗證。為消除樣本分布對模型結果的影響,重復3次劃分樣本。本文中,采用隨機搜索進行參數優化,RF模型的決策樹ntree為5 000,最大特征數m為11,每次迭代的驅動因素變量抽樣數值mtry設置為3,最大深度設置為16。

2.3 特征變量重要性評估

對于RF的每株分類樹,使用隨機抽取的訓練樣本構建回歸樹,可計算出OOB的誤差率。為了評價某一特征變量Xj對模型的重要程度,在其他變量保持不變的情況下,隨機置換變量Xj的觀測值后,再次構建回歸樹并重新計算OOB的誤差率,每變換一次就需重新計算OOB誤差率,通過比較誤差率的變化趨勢來評估該變量對模型的重要程度[21]。

2.4 模型校驗

受試者工作特征(Receiver Operating Characte-ristic,ROC)曲線和ROC曲線下方面積(Area Under Curve,AUC)是定量評價二分類機器學習模型預測精度的重要指標[22]。本研究采用ROC曲線和AUC值判斷RF模型對31個省份的林火易發性的空間預測能力。ROC曲線是通過設定多個不同臨界值計算一系列靈敏度和特異度,以真陽性率(靈敏度)為縱坐標,以假陽性率(1.0-特異度)為橫坐標繪制曲線來構建[23]。AUC值可以整體度量分類器性能的好壞,其取值范圍為0~1,AUC值越接近1,表明易發性模型的擬合精度越高。

3 結果分析

3.1 森林火災時空分布特征

基于2011—2020年31個省份歷史森林火災數據,統計結果表明,2011—2020年31個省份共發生森林火災49 042起,其中2014年森林火災最多,達6 049起。根據《森林防火條例》[24]所劃分的一般森林火災、較大森林火災、重大森林火災和特別重大森林火災,2011—2020年:31個省份一般森林火災35 457起,占比72.30%;較大森林火災13 370起,占比27.26%;重大森林火災201起,占比0.41%;特別重大森林火災14起,占比0.03%。2011—2020年,31個省份森林火災火場面積總計40.32 萬hm2,受害森林面積總計13.19 萬hm2(其中商品林受害森林面積為6.27 萬hm2,公益林受害森林面積為6.92 萬hm2),成林蓄積損失435.44 萬m3,人員傷亡總計493人。2011—2020年31個省份森林火災次數和火場面積的年際變化如圖1所示。由圖1可知:森林火災次數和火場面積呈現正相關,每年的3—5月和9—12月呈現兩個森林火災發生高峰期;3—5月波峰最高,年際變化整體呈現下降趨勢。2011—2020年31個省份受害森林面積和人員傷亡的年際變化如圖2所示。由圖2可知:受害森林面積整體呈下降趨勢,2012年和2017年受害森林面積最大;人員傷亡年際變化波動較大,春季達到峰值,特別是2019年和2020年這兩年春季發生的四川涼山州木里縣森林火災和西昌市森林火災,造成較大人員傷亡。

圖1 2011—2020年31個省份森林火災次數和火場面積年際變化

圖2 2011—2020年31個省份受害森林面積和人員傷亡的年際變化

根據我國七大地理分區,對31個省份林火發生次數和火場總面積進行統計分析,2011—2020年全國31省份林火發生次數和火場面積分區統計結果如圖3所示。就森林火災發生次數來講,各分區林火次數占31個省份林火發生總次數的百分比從高到低依次為西南地區(32.87%)、華南地區(19.73%)、華東地區(18.36%)、華中地區(16.32%)、華北地區(4.63%)、西北地區(4.54%)和東北地區(3.55%),其中重大和特別重大森林火災,西南、華東和華南地區占比最多。就火場總面積來講,各分區火場面積占31個省份火場總面積的百分比從高到低依次為西南(23.92%)、華東(19.86%)、華南(17.78%)、東北(14.89%)、華中(11.16%)、華北(7.8%)和西北(4.59%),其中特別重大森林火災,東北地區和華北地區占比最高。西南、華東和華南地區雖然林火發生次數較多,但單場火災火場面積較小,以一般森林火災為主;東北和華北地區雖然林火發生次數少,但森林火災發生后容易形成重大和特大森林火災,特別重大森林火災火場總面積高于南方地區。

圖3 2011—2020年31個省份森林火災發生次數和火場面積分區統計結果

根據森林火災發生的季節,分析31個省份不同季節下森林火災發生的空間分布情況。從季節上看,2011—2020年31個省份森林火災集中分布在春季和冬季,其中:春季23 421起,占比47.76%;冬季18 500起,占比37.72%;夏季2 863起,占比5.84%;秋季4 258起,占比8.68%。冬春季節的森林火災發生占比總計達到85.48%。森林火災的發生在季節上存在明顯的時空分異,不同季節下各分區森林火災發生次數的統計結果如圖4所示。春季和冬季是我國森林火災的高發期。春季,西南和華南地區森林火災發生次數最多,東北地區森林火災也以春季為主。冬季,森林火災主要集中分布在西南、華東、華南和華中地區,東北、西北和華北地區森林火點較少。夏季,森林火災與冬春季節相比明顯減少,且多發生于西南和華中地區。隨著夏季干旱和極端高溫天氣增多,近年來,南北方夏季森林火災呈現增多趨勢,且林火損失較為嚴重。秋季,森林火點主要集中在南方地區,華南、華東和華中地區的森林火災發生次數高于東北、華北和西北地區。

圖4 2011—2020年31個省份歷史森林火災不同季節各分區統計結果

3.2 重要性排序和模型精度

排列重要性算法是一種模型檢驗技術,通過隨機打亂單個特征值,然后查看模型得分的下降情況,模型性能的衰減量代表了該特征的重要程度。利用RF算法對bootstrap訓練樣本進行擬合,利用排列重要性算法對森林火災驅動因素進行特征重要性排序。從排序結果(圖5)來看,單位面積總可燃物載量的排列重要性得分最高(0.42),表明單位面積總可燃物載量是林火發生的最重要影響因素,其次是月平均溫度(0.39)、月最小相對濕度(0.37)和月平均降水(0.33);月最高氣溫、坡度、可燃性的重要性得分介于0.21~0.29之間;月平均風速、高程、月大風日數和坡向的重要性得分相對較低,對模型的影響相對較小。

注:“Fuelload”表示單位面積總可燃物載量;“Tas”表示月平均氣溫;“Rhumin”表示月最小相對濕度;“Pre”表示月平均降雨量;“Tasmax”表示月最高氣溫;“Slope”表示坡度;“Flamm”表示可燃性;“Windmean”表示月平均風速;“DEM”表示高程;“Windmax”表示月大風日數;“Aspect”表示坡向。

構建歷史森林火點和相對應的林火驅動因素數據庫。數據庫中隨機抽取的訓練樣本集用于模型訓練,測試樣本集用于檢驗模型的精度和泛化性能。使用python程序可視化測試樣本集的ROC曲線(圖6),預測模型的準確度(ACC)為0.84,AUC值為0.87(表明預測結果與測試樣本集的擬合度為87%)??梢?本研究所構建的易發性分析模型具有較高的精度。

圖6 預測模型的ROC曲線和AUC值

3.3 森林火災易發性分析結果

基于RF算法,經過模型訓練和模型精度驗證,構建了適用于我國林火易發性分析的預測模型。將所構建的林火驅動因素數據集輸入林火易發性模型中,即可得到31個省份的林火易發性概率分布結果。從空間分布結果看,31個省份的森林火災發生具有明顯的地域分異差異,空間異質性顯著,森林火災易發性高的地區主要分布在華南、華東、西南、華中和東北地區,西北和華北地區林火易發性明顯偏低。為了進一步分析31個省份的森林火災的空間差異,采用自然間斷法將森林火災易發性概率圖劃分為5個等級,分別為高易發區、中高易發區、中低易發區、低易發區和極低易發區。不同分區下各易發性等級面積占比結果如圖7所示。就各分區森林火災高和中高易發性等級面積占比來講,從高到低依次為東北(47.53%)、西南(47.16%)、華東(46.85%)、華中(32.65%)、華南(26.73%)、華北(25.10%)和西北(12.02%),東北、西南和華東地區的森林火災易發性明顯高于華北和西北地區,東北、西南和華東地區以高和中高易發性等級為主,華中和華南地區以中低易發性等級為主,華北和西北地區以低和極低易發性等級為主。

圖7 31個省份在不同分區中森林火災易發性等級占比

4 結論

基于全國森林和草原火災風險普查數據,分析了2011—2020年31個省份森林火災的時空分布特征。31個省份在不同分區中森林火災次數和火場總面積存在差異,冬季和春季仍是森林火災高發期。在這期間,重大和特大森林火災的發生占較大比例,常造成較大的經濟損失和人員傷亡。

首次將單位面積總可燃物載量和可燃性納入林火易發性分析,明確了單位面積總可燃物載量、月平均溫度、月最小相對濕度和月平均降水是林火易發性模型的主要影響因素。應加強營林管理,減少林內可燃物積累。全國森林火災發生具有明顯的地域分異差異,東北、西南和華東地區以高和中高易發性等級為主,華中和華南地區以中低易發性等級為主,華北和西北地區以低和極低易發性等級為主。準確把握我國森林火災時空分布特征和發生分布格局,在后續森林防火時,應特別關注森林火災高易發區和中高易發區,加大高和中高易發區的防火投入力度,實施分類指導、分區施策和重點防治,維護森林健康和國家生態安全。從森林資源分布來看,東北林區的大小興安嶺,西南林區的云南、四川和西藏3省交界地區以及東南林區的福建、浙江、湖南等地區森林火災易發性高,應堅持統籌兼顧,因地因林制宜,實施不同的林火管理策略。如:東北林區是我國國有森林資源集中分布區,易發生重特大森林火災,雷擊火多發,應立足于防,重點提升有效應對和迅速控制重特大森林火災的能力;西南林區天氣多變,地形地貌復雜,森林火災撲救難度大,應提升組織管理和科學撲救能力,堅決杜絕人員傷亡。

本研究還有進一步完善的空間:一是林火驅動因素中未考慮人類活動和野外火源,有待繼續補充和完善;二是主要基于2011—2020年歷史森林火災和林火驅動因素完成31個省份森林火災易發性分析,后續將在此易發性分析結果的基礎上,研建可燃物載量等動態林火驅動因素的年度更新方法,進而實現我國年度火災動態易發性分析;三是進一步優化和調整模型,將天氣數值預報數據作為模型輸入,實現多致災因子驅動下未來短期和中長期林火發生動態預測,以提高我國森林火災的預測精度。

猜你喜歡
林火易發火場
無錫惠山區堅持“六抓六強” 構建林火防治銅墻鐵壁
機用鎳鈦銼在乳磨牙根管治療中的應用
貴州省地質災害易發分區圖
夏季羊易發疾病及防治方法
林火監測系統在森林防火中的應用與發展
冬季雞腸炎易發 科學防治有方法
半邊天
基于無人機進行火場搜救設備的研究設計
前方火災,超人出動!
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合