?

信息量與多模型耦合的滑坡易發性評價研究

2021-12-09 02:43儀政宋琨黃海峰李輝
人民長江 2021年10期
關鍵詞:三峽庫區

儀政 宋琨 黃海峰 李輝

摘要:滑坡易發性評價是識別滑坡災害危險性“靶區”的基礎和關鍵。三峽庫區秭歸縣的侏羅系地層區是滑坡災害易發區,選取坡度、地表切割深度、曲率、距水系與路網距離等8個影響因子,通過信息量模型(I)與人工神經網絡(ANN)、隨機森林(RF)、XGBboost、支持向量機(SVM)等4種模型耦合,進行了滑坡易發性評價。通過受試者工作特征(ROC)曲線對比分析發現:信息量和支持向量機耦合模型的ROC曲線AUC值最大(0.848),滑坡易發性的分區圖顯示高易發區主要集中在水系和路網兩側,其結果與實際滑坡分布基本一致。研究成果可為區域滑坡易發性評價和滑坡災害的防治提供參考。

關鍵詞:滑坡易發性評價; 滑坡易發性分區; 信息量模型; 多模型耦合; 侏羅系地層; 三峽庫區

中圖法分類號: P642

文獻標志碼: A

DOI:10.16232/j.cnki.1001-4179.2021.10.022

0引 言

滑坡災害的頻繁發生會對山區居民的生命財產安全造成巨大威脅。為降低滑坡災害的損失,需要在滑坡易發“靶區”識別的基礎上進行合理的工程防治或監測預警。而滑坡易發“靶區”的識別主要是基于滑坡易發性的評價結果而進行的。因此,滑坡易發性的評價成為山區地質災害防治的基礎性工作。

滑坡易發性評價的方法主要有:信息量法[1]、確定性系數[2-3]、邏輯回歸[2-3]、層次分析法[4]、熵值法[5]、模糊度[6]、支持向量機[7]、人工神經網絡[7]、隨機森林[8]、決策樹[9]、XGBoost[10]等。目前國內外學者對此進行了較多研究,如Devkota[2]等運用確定性因子、熵值法、邏輯回歸模型對喜馬拉雅山區滑坡進行了易發性評價,并分析了各模型的準確度;喬德京等[7]將隨機森林和確定系數耦合,進行滑坡易發性評價,發現耦合后的模型精度更高;張玘愷[3]等將信息量法、確定性系數、邏輯回歸相耦合,對九寨溝縣滑坡進行易發性評價,并指出耦合后的模型要比單獨信息量模型的評價準確高。由于傳統信息量法無法體現各因子的權重,因此,將傳統信息量和確定性系數模型及其他模型耦合[3-8],可賦予信息量和確定系數相應的權重,使得滑坡易發性評價獲得更高的準確度和可靠度。

三峽庫區秭歸縣的侏羅系地層區(占秭歸縣土地面積的22%)是滑坡地質災害的多發區。李長冬[11]等以三峽庫區侏羅系軟硬相間地層作為研究對象,并對三峽庫區侏羅系軟硬相間地層中抗滑樁布設和結構優化進行了研究。據統計,秭歸縣39%的滑坡災害發生在該地層區。為評價該區域滑坡的易發性,采用信息量模型(I)與人工神經網絡(ANN)、隨機森林(RF)、XGBoost、支持向量機(SVM)等4種模型耦合,并對比各耦合模型的準確度尋找最優模型,以為其他區域滑坡易發性評價提供借鑒。

1研究方法

1.1信息量法

信息量法是以信息論為基礎的統計方法。信息量法把影響區域穩定性因素的數值轉化為能夠反映出對區域穩定影響程度的信息量值,信息量越大,滑坡發生的可能性越大,反之亦然。信息量模型計算公式如下[1]:

1.3隨機森林

隨機森林屬于一種特殊的自助抽樣集成(Bagging)方法,并以決策樹作為Bagging中的模型[12]。該模型對大小為N的原始樣本進行有放回的隨機抽樣,得到m個大小為N的新訓練集,之后對每個訓練集進行決策樹建模,然后對這些決策樹進行組合,最終采用投票的方式以少數服從多數的原則來得到最終的分類和預測結果。隨機森林模型不僅對數據選取隨機化,且對特征的選取進行了隨機化,通過平均決策樹極大減少了模型的過擬合。

1.4XGBoost

XGBoost模型是改進的梯度提升樹(GBDT)算法,模型使用牛頓法求解損失函數的極值,將損失函數通過泰勒形式展開到二階,另外損失函數中加入了正則化項。訓練時的目標函數由兩部分組成,第一部分為梯度提升算法損失,第二部分為正則化項[13]。

1.5SVM(支持向量機)

支持向量機(SVM)是Vapnik基于統計學理論提出的一種機器學習方法,通過尋求結構化風險最小化從而提高學習機的泛化能力[14]。為了減小歸納誤差,本文選取徑向基核函數作為核函數來進行滑坡易發性評價。

徑向基核函數為

1.6信息量與多模型耦合模型

傳統的信息量模型雖能客觀地獲取到各個因子對滑坡災害易發性的影響程度,但是沒有確定各影響因子的權重,而ANN、RF、XGBoost、SVM模型的可以確定各影響因子的權重。因此為了更準確地預測滑坡易發性地區區劃,本文將信息量模型和ANN、RF、XGBoost、SVM模型耦合,進而得到滑坡易發性區劃圖。

2研究區概況及評價流程

2.1研究區概況

三峽庫區秭歸縣是滑坡災害頻發的重點區域。近幾年曾發生多起大型滑坡災害事件,如2003年7月13日的沙鎮溪鎮千將坪滑坡、2014年9月2日的沙鎮溪鎮杉樹槽滑坡、2017年10月29日的歸州鎮鹽關滑坡和2019年12月5日的泄灘鄉卡門子灣滑坡等。這些新發生的滑坡災害所處地層均為侏羅系地層。因此,將秭歸縣侏羅系地層區作為研究區進行滑坡災害易發性評價。

研究區地理坐標為110°27′45″E~110°46′53″E,31°11′47″N~30°54′12″N,國土面積532 km2。地層主要為侏羅系的沙溪廟組、聶家山組和香溪組。巖性主要為紫紅色泥巖夾石英砂巖、灰綠色粉砂質泥巖、粉砂巖夾長石砂巖和炭質頁巖,以及中厚層砂屑灰巖和泥質白云巖等[15]。據調查數據統計可知,區域內共有滑坡災害點183處(見圖1),占秭歸縣全境滑坡總數(458處)的39%,多數分布在河流兩側。

2.2數據來源和滑坡易發性評價流程

本文研究所需要的數據包括遙感影像數據、滑坡數據、河流路網矢量數據等。高程數據采用分辨率為30m ASTER GDEM數據,遙感數據使用Landsat4-5 TM衛星數字產品,二者均從地理空間數據云(http:∥www.gscloud.cn)下載獲得?;聰祿ㄟ^秭歸縣地質災害點排查資料獲取。本文采用分辨率50 m×50 m的柵格作為滑坡易發性評價的基本單元,使用ArcGIS將整個研究區劃分為213 785個柵格單元。首先利用ArcGIS軟件提取各評價因子圖層,然后依據研究區內滑坡影響因子的分析結果,按照每個因子的不同類別及對滑坡的影響程度進行因子分級劃分,再將分級后的因子圖層和滑坡災害點圖層屬性連接,計算各分級因子信息量;之后為各分級圖層賦予信息量數據,進而得到各因子信息量圖層。使用GIS中柵格轉點工具將研究區的柵格單元轉換成點數據,之后使用多值提取至點工具與各因子信息量柵格圖層疊加分析,提取到整個研究區信息量屬性數據,建立滑坡易發性數據庫。將183個災害點和等數量的非災害點作為總樣本,從中隨機選取70%的樣本點作為訓練樣本,導入到各模型當中進行訓練;剩余的30%作為測試樣本,運用ROC曲線來檢驗模型分類的效果?;乱装l性評價流程如圖2所示。

3指標因子構建

指標因子的選取影響著滑坡易發性評價的精度。通過對研究區現場地質調查以及災害點的時空分布規律,選取了以下8種環境指標因子:坡度、地表切割深度、曲率、地形濕度指數(TWI)、歸一化植被覆蓋指數(NDVI)、距水系與路網距離、土地分類。其中,坡體的坡度直接影響到坡體內部的應力分布狀態,控制坡體的穩定性;地表切割深度直觀地反映了地表被侵蝕切割的情況;曲率將影響著坡面物質的搬運和沉積;歸一化植被覆蓋指數反映了地表植被覆蓋情況,植被頻繁的地區水土保持越好,有利于增強坡體的穩定性。研究區位于三峽庫區,水庫和河流旁的坡體坡腳常年受到沖刷掏蝕,加速了坡體的失穩,因此選取距水系距離及地形濕度指數作為環境指標因子。土地分類和離公路距離可反映人類活動的區域,交通建設削坡改變了坡體的自然地貌,增大了災害發生的概率。

通過整理收集的資料(高程數字模型DEM,水系圖,路網圖,遙感影像圖,滑坡點分布圖),利用ArcGIS空間分析功能和柵格計算器處理DEM數據得到坡度、地形濕度指數、地表切割深度、曲率因子圖層。對水系和路網進行緩沖區分析,緩沖距離均設置為0~300 m,300~600 m,600~900 m,>900 m。把獲得Landsat4-5 TM遙感影像數據導入到ENVI軟件中,利用波段運算得到研究區歸一化植被覆蓋指數,之后使用監督分類工具以最大似然法進行對遙感影像進行土地分類。最終得到的各評價因子圖層如圖3所示。

4滑坡易發性評價

4.1基于ArcGIS信息量計算

根據災害點和各因子圖層疊加分析,依據信息量模型計算出不同因子等級下的信息量值(見表1),然后將信息量值賦予各因子分級圖層中,利用ArcGIS柵格計算器將各因子信息量圖層疊加,得到研究區的滑坡總信息量。

4.2基于多模型與信息量耦合的滑坡易發性評價

選取含有信息量的災害點和等數量的非災害點作為總樣本,隨機抽取70%總樣本作為訓練樣本,30%總樣本作為測試數據。將樣本數據導入到SPSS Modeler以及Python進行訓練,得到ANN,RF,XGBboost,SVM易發性評價模型,然后將整個研究區信息量總數據代入模型中進行計算,得到研究區的滑坡易發性指數。將獲得的易發性指數導入ArcGIS當中,利用自然斷點法劃分5個等級,最終得到多種模型與信息量耦合的研究區滑坡易發性評價圖(見圖4)。

4.3精度分析

為評價各模型預測的精度,本文采用受試者工作特征曲線(ROC)對模型進行精度評價。ROC曲線越靠近左上方,表明預測結果的準確度越高,曲線與X坐標軸圍成的面積AUC值通常來衡量預測結果的精確度,AUC值越大,表明預測預測精度越高。ROC曲線縱軸代表真陽性率(敏感性),在滑坡災害易發性評價中代表研究區中各易發性等級內真實發生滑坡災害的累加百分比;其橫軸代表假陽性率(特異性),在滑坡災害易發性評價中代表研究區內各易發性等級面積累加百分比[3]。從ROC曲線(見圖5)可知,信息量模型,I-RF模型,I-XGBoost模型,I-ANN模型,I-SVM模型的AUC值分別為0.653,0.784,0.813,0.825,0.848。結果表明單獨的信息量模型預測效果遠不如耦合模型的準確度,且I-SVM耦合模型精度最高,耦合效果最好。

5結 論

(1) 本文以三峽庫區秭歸縣侏羅系地層區為研究區域,選取了坡度、曲率、地形濕度指數(TWI)、歸一化植被覆蓋指數(NDVI)、地表切割深度、土地分類、水系距離、路網距離共8個影響因子建立滑坡災害易發性評價指標體系,運用單一信息量模型以及信息量模型與多模型耦合模型,建立了滑坡易發性區劃圖。單一信息量模型預測精度不如信息量和機器學習耦合模型,各模型中水系距離和道路距離均占比較大。

(2) 根據滑坡易發性區劃圖可知,滑坡極高和高易發區主要分布在水系和路網的兩側,其結果與滑坡災害點分布基本一致。

(3) 不同信息量和機器學習耦合模型結果對比發現,信息量與支持向量機耦合模型(I-SVM模型)的ROC曲線其AUC值最大,為0.848,表明信息量與支持向量機耦合模型的預測效果最佳。

參考文獻:

[1]陳立華,李立豐,吳福,等.基于GIS與信息量法的北流市地質災害易發性評價[J].地球與環境,2020,48(4):471-479.

[2]DEVKOTA K C,REGMI A D,POURGHASEMI H R,et al.Landslide susceptibility mapping using certainty factor,index of entropy and logistic regression models in GIS and their comparison at Mugling-Narayanghat road section in Nepal Himalaya[J].Natural Hazards,2013,65(1):135-165.

[3]張玘愷,凌斯祥,李曉寧,等.九寨溝縣滑坡災害易發性快速評估模型對比研究[J].巖石力學與工程學報,2020,39(8):1595-1610.

[4]許嘉慧,孫德亮.基于GIS與改進層次分析法的奉節縣滑坡易發性區劃[J].重慶師范大學學報(自然科學版),2020,37(2):36-44.

[5]韓玲,張庭瑜,張恒.基于IOE和SVM模型的府谷鎮滑坡易發性分區[J].水土保持研究,2019,26(3):367-372.

[6]MENG Q,MIAO F,ZHEN J,et al.GIS-based landslide susceptibility mapping with logistic regression,analytical hierarchy process,and combined fuzzy and support vector machine methods:a case study from Wolong Giant Panda Natural Reserve,China[J].Bulletin of Engineering Geology and the Environment,2016,75(3):923-944.

[7]夏輝,殷坤龍,梁鑫,等.基于SVM-ANN模型的滑坡易發性評價:以三峽庫區巫山縣為例[J].中國地質災害與防治學報,2018,29(5):13-19.

[8]喬德京,王念秦,郭有金,等.加權確定性系數模型的滑坡易發性評價[J].西安科技大學學報,2020,40(2):259-267.

[9]楊永剛,殷坤龍,趙海燕,等.基于C5.0決策樹-快速聚類模型的萬州區庫岸段鄉鎮滑坡易發性區劃[J].地質科技情報,2019,38(6):189-197.

[10]林報嘉,劉曉東,楊川,等.XGBoost機器學習模型與GIS技術結合的公路崩塌災害易發性研究[J].公路,2020,65(7):20-26.

[11]李長冬.三峽庫區侏羅系地層滑坡中抗滑樁布設和結構優化研究[M].武漢:中國地質大學出版社,2015.

[12]劉堅,李樹林,陳濤,等.基于優化隨機森林模型的滑坡易發性評價[J].武漢大學學報(信息科學版),2018,43(7):1085-1091.

[13]雷明.機器學習[M].北京:清華大學出版社,2019.

[14]VAPNIK V.The nature of statistical learning theory[M].Boston:Springer Science &Bussiness Media,2013.

[15]彭令,牛瑞卿,趙艷南,等.區域滑坡災害風險評估:以長江三峽庫區秭歸縣為例[J].吉林大學學報(地球科學版),2013,43(3):891-901.

(編輯:胡旭東)

Abstract:Landslide susceptibility evaluation is the basis and key to identify landslide hazard target area.The Jurassic stratum area in Zigui County,the Three Gorges Reservoir area,is a landslide hazard prone area.Eight influencing factors including slope,surface cutting depth,curvature,and distance from water system to road network were selected.The information model(I)was coupled with four common machine learning models,namely artificial neural network(ANN),random forest(RF),XGBboostand support vector machine(SVM)to carry out the evaluation of landslide susceptibility.Through a comparative analysis on the receiver operating characteristic curve,it was found that the AUC valuein the ROC curve of the model coupled with information valuemodel and SVMmodel was the largest(0.848).The zoning map of landslide susceptibility showed that the high-prone areas were concentrated on both sides of the water system and the road network,and the results were basically consistent with the actual landslide distribution.The research results can provide reference for regional landslide susceptibility evaluation and landslide disaster prevention.

Key words:landslide susceptibility evaluation;landslide susceptibility zoning;information valuemodel;multi-model coupling;Jurassic stratum;Three Gorges Reservoir area

猜你喜歡
三峽庫區
三峽庫區農業生態化發展障礙、原因及對策分析
湖北三峽庫區農業面源污染負荷、評價及預警系統
生態原產地保護促進三峽庫區綠色發展探討
論金融支持三峽庫區經濟發展的策略
三峽庫區桑園間作草菇可行性分析
三峽庫區低碳經濟發展的困境與對策研究
三峽庫區的動植物資源概況
三峽庫區雕塑遺存憂思錄
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合