?

滑坡危險性預測模型研究進展

2023-03-09 07:06徐浩文譚永濱
北京測繪 2023年8期
關鍵詞:決策樹危險性滑坡

徐浩文 譚永濱

(東華理工大學 測繪工程學院,江西 南昌 330013)

0 引言

滑坡是一種易發生于山地且強突發性的地質災害。我國山地面積的比例較大[2],已成為受到滑坡危害最為嚴重的地區之一[3]。據國家統計局2021年公布的《中國統計年鑒》顯示,2005—2020年共計發生地質災害31.4萬余起,造成傷亡1.4萬余人,其中滑坡災害發生22.6萬起,約占地質災害總數的71.9%,如表1所示。對滑坡進行危險性預測與估計也是滑坡災情評估工作的核心內容之一,可在滑坡重點防治區域、滑坡災害損失預評估和滑坡防治工程評價等方面發揮著重要的作用?;挛kU性是指綜合考慮滑坡誘發因素的影響下,在確定區域內一定時期滑坡發生的強度及可能性,可包括滑坡易發性、時間頻率和滑坡強度三方面[5]。

表1 2005—2020年地質災害統計

本文從傳統滑坡危險性預測方法出發,探究機器學習中的預測方法,結合滑坡危險性預測進行深入分析。

1 傳統滑坡危險性預測方法

傳統滑坡預測方法主要分為定性階段、半定量階段、統計預測階段和綜合預測階段這四個部分[6]。在定性階段中,人們主要憑借個人對自然現象的觀察和實踐經驗來預測潛在的滑坡,該方式滯后性較強且可用的應急響應時間有限;隨著滑坡位移-時間曲線與齋藤模型的提出,滑坡的預測逐步由定性分析發展為定量評價;到了統計預測階段,研究人員融入了數學及統計學理論,加強了預測模型的合理性與科學性;在綜合預測階段,非線性理論與系統科學的提出將滑坡看作為一個開放的復雜系統,通過結合滑坡自身特性與定量預測方法,更加全面地對滑坡的預測研究進行剖析。

1.1 定性階段

在20世紀60年代之前,人類對于滑坡等自然災害的預測主要通過對自然現象的觀察和實踐經驗來判斷。與諸如火山、地震、海嘯等其他自然災害類似,滑坡災害在發生前也會呈現各種先兆[7],例如,地下水水位異常上升或下降、地表巖石內部和房屋裂縫處發生異響、動物變得躁動異常等。人們通過這些先兆總結出經驗,并以此來判斷滑坡是否發生以及可能發生的危險程度。我國在1963年利用這種定性的方法成功預報了寶成線須家河滑坡[8]。然而,定性的預測方法僅能觀測出具有明顯前兆的滑坡,且預測結果具有強滯后性、低精度的缺點,在實際生產生活中實用性較低。

1.2 半定量階段

20世紀60年代,日本學者齋藤首次提出了較為科學的滑坡預測方法,標志著滑坡預測從定性逐步進入定量化階段[9]。齋藤通過大量的實驗和研究,提出了滑坡位移與時間的預測模型,認為滑坡從開始變形到最終破壞結束需要經歷一段蠕變過程(蠕變曲線如圖1)。蠕變過程可分為三個階段,第一階段為初始蠕變階段(a~b),蠕變速率逐漸變緩;第二階段為等速緩慢蠕變階段(b~c),蠕變速率保持不變;第三階段為加速蠕變階段(c~d),滑坡快速蠕變直至最終破壞結束[10]。

圖1 滑坡位移與時間蠕變曲線

其中,第二、三階段的滑坡形變速率都與最終滑坡的結束時間有關,滑坡時間預測公式分別如式(1)、式(2)所示。

(1)

(2)

式中,tr為滑坡破壞的時間;ε為第二階段應變速率;±0.59為包含95%測量值的范圍;Δt為距離滑坡破壞時間。

利用齋藤模型,日本在1970年對高湯山滑坡進行了成功的預測,證明了該模型的實用性[11]。但是,僅根據蠕變第三階段的位移時間信息只能進行滑坡臨坡前短期預報且精度不足,眾多學者在齋藤模型基礎上進行了諸多改進工作。E.Hoek結合齋藤模型,針對智利的Chuquicamata礦滑坡監測曲線提出了外延法。由于齋藤蠕變經驗公式的局限性和滑坡的復雜性,這些改進模型方法仍無法進行長期預測,但卻給未來逐步定量化科學化的滑坡預測做了一個良好的開端。

1.3 統計預測階段

20世紀80年代,隨著概率論、數理統計、模糊數學等數學理論方法的普及和計算機技術的發展,研究人員將這些理論與技術應用于滑坡預測,嘗試通過數學模型模擬滑坡的變化規律,提高了滑坡預測的精度與科學性。在此階段的研究中,具有代表性的是灰色模型GM(1,1)和Verhulst模型。

灰色系統理論分析最早于1982年由中國學者鄧聚龍教授提出,主要針對具有不確定性且信息數據不完整的模型,通過挖掘其中的深層信息來建立對應的微分方程,進而預測未來的發展趨勢[13]。在整個灰色預測理論中,GM(1,1)模型是最為核心的部分,應用十分廣泛。陳明東等(1988年)首先將灰色系統理論中的GM(1,1)模型法引入滑坡位移—時間曲線的擬合外推,提出了濾波灰色分析法進行滑坡的中期預報[14]。其優點在于預測模型無須大量的數據,可用于解決歷史滑坡數據量少、信息不完整等問題。相應地,由于數據量較少且不完整,灰色預測模型只適用于中長期且成指數增長的預測,對波動性較大的數據預測結果差。

Verhulst生物生長模型也是灰色系統理論的組成部分之一,我國學者晏同珍認為滑坡的發生、生長、成熟與消亡過程與生物類似,將Verhulst模型融合進滑坡預測中,探究滑坡孕育過程的內在規律[15]。這種結合主要通過對原始地面位移監測數據通過累加、逆累減并求解非線性微分方程,預測滑坡發生時間。以此模型為基礎,在甘肅天水的黃龍西村滑坡、長江西陵峽的新灘滑坡和意大利的Vaiont壩庫滑坡這三個實例的驗證上取得了成功。殷坤龍等利用Verhulst模型對南京雞鳴寺滑坡進行了成功預報檢驗[16]。針對利用Verhulst模型進行滑坡預測存在的理論量化依據不足、以速度最大值作為判別依據等問題,李天斌等認為使用Verhulst生物生長模型的“S”型曲線來模擬滑坡形變的反“S”型曲線過程不合理,提出了使用Verhulst反函數來模擬滑坡的形變過程[17]。

總體上看,統計預測階段結合了數學、統計學的大量知識,更傾向于從方法上入手,不斷改進滑坡預測方法以求在精度上更進一步,意味著滑坡預測走向了定量化發展階段。但是,這個階段的研究過于關注方法上的創新改進,較少地將滑坡的自身特性與各種預測模型更緊密地結合。雖然能較好地擬合已經發生的滑坡災害,卻難以有效預測演化中的滑坡變形體。在分析篩選各類滑坡數據上、對各個滑坡影響因子的權重分配上、如何弱化和消除滑坡預測中的干擾信息等方面,還有待加強。

1.4 綜合預測階段

20世紀60年代以來,隨著系統科學以及非線性理論的發展,滑坡預測進入了綜合預測階段。在這期間,諸多相關領域的學者認識到了滑坡是一個極其龐大開放的復雜系統。它是一個充滿灰與白、確定性與隨機性、漸變性與突變性、平衡與非平衡、有序與無序的對立統一的體系[6]。在此階段,滑坡預測方面的研究發展迅速,許多學者將非線性系統的研究理論與滑坡預測相結合,創新性成果層出不窮。蘇愛軍等利用數值統計的解析與數值方法處理建立模型對滑坡進行預報[18]。秦四清等運用非線性動力學的思路和方法并結合確定性與非確定性預測,編制了滑坡時間預報綜合分析軟件[19]。在此階段,地理信息系統(geographic information system,GIS)與滑坡預測的結合也愈發緊密。文獻[20]從數字高程模型中得出了雨融雪事件引發的滑坡空間預測相關的環境屬性并將這些數據與統計和GIS相結合,為滑坡災害的空間預測提供了詳細的依據。文獻[21]結合GIS,開發了一種概率位移分析方法,利用偽靜態滑坡穩定性模型對滑坡危險性進行評估。

在綜合預測階段,研究人員認識到滑坡作為一個開放的復雜系統,滑坡的形成是其內多種因素共同作用導致的結果。此外,GIS在滑坡預測方面的應用,也給滑坡空間、時間數據的分析處理提供極大便利,在滑坡預測中起到了關鍵作用。針對非線性系統進行預測的方法陸續被應用于滑坡預測中,研究人員結合滑坡本身的特性,從一個完整系統的角度重新審視滑坡。

2 基于機器學習的滑坡預測模型

機器學習模型具有強大的學習與泛化能力,且能夠擬合非線性系統,被廣泛地應用于滑坡預測中,包括無監督學習與監督學習兩類。

2.1 無監督學習

無監督學習是指在不使用標簽的情況下對數據進行學習,從而發現數據內部的模式和結構。當滑坡數據缺少標簽或進行人工標注的成本過高時,通常選擇無監督學習方式對數據進行處理。然而,一方面,由于無監督學習的訓練數據不具備標簽,模型無法確定預測的準確度;另一方面,無監督學習對滑坡數據質量要求較高,如果滑坡數據質量不佳,容易得出錯誤的結論。

因此,無監督學習通常不能直接做預測,主要用于學習數據的內在結構和特征,調整模型的超參數,以此來對數據進一步分析,為監督學習提供有價值的信息。無監督學習算法包括兩類:降維和聚類,在滑坡危險性預測中,常用的算法有核主成分分析、譜聚類、K-Means聚類等。

2.1.1降維算法

降維算法是一種將高維數據映射到低維空間的方法,可在保留重要數據信息的同時進行降維,減少計算復雜度,還可以消除特征間的相關性,使得模型更加穩定,但也有可能會丟失重要信息。

常見的降維算法有主成分分析、核主成分分析和線性判別分析。對于滑坡這一復雜的非線性系統,通常選用核主成分分析來處理。核主成分分析是在主成分分析的基礎上加入了核函數的無監督學習算法,使其能處理非線性數據。它的目的是將原本的多維數據轉化為低維數據,同時盡可能保留原數據的信息。在滑坡危險性預測方面,可以認為某些滑坡影響因子間有一定相關關系,通過核主成分分析將重復的滑坡影響因子變量去除,在保持原有信息的基礎上建立盡可能少的新變量,使得這些新變量兩兩不相關,從而實現降維。文獻[22]基于核主成分分析,對變量進行加權,提取滑坡數據原始特征,再混合核函數最小二乘支持向量回歸模型預測滑坡。文獻[23]利用核主成分分析方法提取降雨、地下水等滑坡影響因素特征,構建BP神經網絡對白水河滑坡進行預測。

2.1.2聚類算法

聚類算法是一種將數據劃分成多個類別的方法,其中每個類別中的數據具有相似性。常見的聚類算法有K-Means、層次聚類和密度聚類等。在滑坡危險性預測中,聚類算法可將滑坡數據劃分成不同的簇,進而發現滑坡的內在結構和規律。文獻[24]利用不確定DM-Chameleon聚類算法有效地處理了大規模降水數據集,并在延安市寶塔區的滑坡數據中驗證了該滑坡危險性預測模型的精度,并基于聚類結果提取出致災因子與滑坡危險性等級之間的關系。文獻[25]比較了K-Means、譜聚類和層次聚類三種模型,研究其在海底滑坡危險性方面的性能,結果表明,譜聚類在海底滑坡危險性預測中表現最佳。

與降維算法類似,聚類算法通常也需要與其他預測模型結合,將聚類的結果作為輸入特征放入預測模型進行預測。聚類算法不需要人為指定數據的類別,可自動發現數據中的類別,但如果簇數不合適,可能會導致結果不理想,而且聚類算法對數據的密度和分布敏感,對于數據的輸入有一定的要求。

2.2 監督學習

監督學習通過對大量帶有標簽的訓練數據進行學習,來預測未知數據的標簽,在滑坡預測中,常用監督學習來預測其危險性。當滑坡數據具備代表其危險性的標簽時,通常選擇監督學習方式,其具有以下優點:①通過對帶有標簽的數據進行學習,能夠確定預測的準確度。②在滑坡發生后,通過分析標簽數據,能夠分析發現滑坡發生的原因。③監督學習能夠更好地利用數據信息,從而提高預測的準確性。相應地,由于監督學習對于獲取標簽數據的依賴性較大,如果標簽數據獲取不全或不準確,可能會影響預測的準確性;同時,監督學習需要較大的訓練數據集,以便模型能夠學習到足夠多的信息;并且監督學習的計算復雜性較高,運行所需硬件設備較高且所需時間較長。

常見的用于滑坡預測的監督學習算法有邏輯回歸、決策樹、隨機森林、支持向量機和人工神經網絡這五種。

2.3.1邏輯回歸

邏輯回歸(logistic regression)是一種廣泛用于解決二分類問題的機器學習模型,常用于預測一個樣本屬于某個類別的概率,其基本原理是利用一個線性回歸模型來預測概率值,然后將概率值轉化為類別預測。由于邏輯回歸模型簡單高效且易于理解,也廣泛運用于滑坡等地質災害的預測中。文獻[26]利用多元邏輯回歸和GIS技術來預測美國堪薩斯州東北部的山體滑坡災害。文獻[27]采用Gumbel分布計算降雨概率,結合邏輯回歸模型對韓國仁濟地區進行空間滑坡危險性預測。文獻[28]利用邏輯回歸方法,考慮滑坡壩的形態特征和顆粒組成以及上游堰塞湖的水動力條件,快速預測滑坡穩定性,借此評估其危險性。

邏輯回歸作為經典的二分類機器學習算法,用于滑坡危險性預測中較為理想。其優勢在于:①簡單易用。邏輯回歸模型結構簡單,容易理解和實現。②計算效率高。邏輯回歸模型在計算概率值時通常使用指數函數,計算效率較高。③輸出結果易解釋。邏輯回歸模型輸出的結果是一個概率值,可以直接解釋為發生概率。

2.3.2決策樹

決策樹(decision tree)是一種基本的分類與回歸方法,通過將數據分成若干個簡單的決策節點,每個決策節點對應一個特征值或者一個條件,從而形成一棵樹狀結構。每次決策時,模型會從根節點開始,根據每個節點的條件和特征值指向下一個節點,直到到達葉子節點,并返回最終的結果。在滑坡危險性預測方面,訓練決策樹模型時,使用大量的數據來學習滑坡危險性的特征和條件,并通過交叉驗證來評估模型的準確性。在使用決策樹模型預測時,輸入新的數據并跟隨決策樹的分支流程計算出最終的預測結果。文獻[29]利用遙感和GIS技術對滑坡、地形、地質等空間數據進行探測、采集和建庫,使用卡方自動交互檢測器和快速、無偏、高效地統計樹算法來構建決策樹模型,對韓國平昌地區進行滑坡危險性空間預測。

研究人員還對基礎決策樹做了諸多改進,擴展出表現更優的模型??尚艣Q策樹是一種基于統計方法的決策樹改進模型,它使用極大似然比和擬合度量來評估節點的信度。文獻[30]利用k折交叉驗證和可信決策樹的方法,研究伊朗厄爾布爾士省塔里干盆地的滑坡危險性程度。交替決策樹允許跳躍式決策并使用特征選擇和節點劃分的方式。文獻[31]運用交替決策樹的方法,對中國宜黃地區的滑坡危險性進行空間預測。這些改進模型均在決策樹的基礎上進行了改進,從而使得模型更加靈活,能夠更好地適應復雜的滑坡數據。

決策樹的優點在于可以自動從原始數據中提取特征,并且模型的決策過程是可解釋的。然而,模型可能過于簡單而無法適應復雜的數據,或者可能會由于過擬合現象而在新的滑坡數據上表現不佳。

2.3.3隨機森林

隨機森林(random forest)是一種通過建立多棵決策樹來對樣本進行訓練及預測的模型。在機器學習中,隨機森林因其簡單的結構和強大的性能,應用和影響非常廣,其在決策樹的基礎上做了如下改進:①通過隨機選擇數據的子集和特征的子集來訓練每棵決策樹,從而避免了決策樹過擬合的問題。②通過對每棵決策樹的訓練結果進行投票,從而使得預測的結果更加穩健。③通過計算決策樹的不純度來評估特征的重要性,從而進行特征選擇。

在滑坡危險性預測中,隨機森林的應用非常廣泛。文獻[32]將隨機森林分類器與GIS數據相結合,針對山區公路上降雨誘發型滑坡進行研究,預測其危險程度。文獻[33]結合SBAS-InSAR和粒子群優化的隨機森林算法,對魯甸縣地震頻發、河谷深切、地形高差大的復雜山區的滑坡危險性進行研究。

與基礎的決策樹模型相比,隨機森林模型的泛化能力更強,能夠處理高維數據且對缺失數據不敏感,不易產生過擬合現象。然而,由于隨機森林模型對噪聲數據不敏感,這樣就有可能導致模型在訓練數據上的表現不好,無法擬合有意義的滑坡數據信息。

2.3.4支持向量機

支持向量機(support vector machine,SVM)是一種對數據進行二元分類的廣義線性分類器。其主要思想是:建立一個最優決策超平面,使得該平面兩側距離該平面最近的兩類樣本之間的距離最大化,從而對分類問題提供良好的泛化能力。在滑坡危險性預測方面,通常將大量滑坡數據分為有潛在危險和無潛在危險兩類,作為正負樣本來訓練。文獻[34]基于最小二乘支持向量機和差分搜索算法,預測三峽水庫岸線上的白水河滑坡和譚家河滑坡的位移,進而評判其危險性。文獻[35]結合雙輸出最小二乘支持向量機和粒子群優化算法,對滑坡位移進行區間預測。

作為優秀的二分類機器學習模型,在滑坡危險性預測中,支持向量機具有以下優點:①在模型訓練后能夠達到較高的精度,因此在滑坡危險性預測中可以獲得較高的準確度。②在高維空間中也能有效地進行分類,因此在滑坡危險性預測中能夠處理多維特征。③能夠使用核函數將數據映射到高維空間,從而解決線性不可分問題,使得模型能夠對非線性數據進行分類。另一方面,支持向量機也存在一些缺點:①若滑坡數據維度遠大于樣本量,模型表現較差。②運算復雜度較高且需要花費一定的時間調整超參數來達到最佳性能。

2.3.5人工神經網絡

人工神經網絡是由大量處理單元互聯組成的非線性、自適應信息處理系統。它是在現代神經科學研究成果的基礎上提出的,試圖通過模擬大腦神經網絡處理、記憶信息的方式進行信息處理。人工神經網絡具有非線性、非局限性、非常定性和非凸性四大基本特性,在處理滑坡等非線性復雜系統中,可以充分逼近其中非線性關系,得到廣泛的應用。文獻[36]結合灰色理論和神經網絡理論的優點,提出了一種新的灰色神經網絡非線性預測模型,對滑坡位移進行預測。文獻[37]使用人工神經網絡的反向傳播對1990年伊朗北部地震受災地區的山體滑坡進行風險研究,采用Newmark位移分析方法繪制了地震震中附近察哈爾-瑪哈爾和查爾卡薩爾區塊的地震誘發滑坡災害圖,借此對地震誘發型滑坡進行預測。文獻[38]利用GPS監測三峽水庫的白水河滑坡,獲取其地表位移及誘發因素即庫水位、降雨量等,構建BP神經網絡預測模型對滑坡進行預測。

人工神經網絡是非線性的系統,人工神經元處于激活或抑制二種不同的狀態,具有閾值的神經元構成的網絡具有更好的性能,可以提高容錯性和存儲容量。其應用于滑坡的優勢在于:①強大的學習能力。人工神經網絡能夠從龐大的滑坡數據中學習復雜的模式,并能夠在未見過的數據上進行預測,這使得它能夠適應并識別各種滑坡特征。②強大的魯棒性和容錯性。所有定量或定性的滑坡信息都等勢分布貯存于網絡內的各神經元,便于存儲且容錯性較強。③效率高。人工神經網絡多采用并行分布處理方法,能夠同時快速進行大量運算。同樣,由于人工神經網絡會應對龐大的訓練數據集,也會產生過擬合、訓練較長等缺點,這些缺點可以通過調整數據集和優化模型來改善。

3 結論

滑坡危險性預測是滑坡災情評估工作的核心內容之一,傳統的滑坡危險性預測或是具有強滯后性、局限性,或是未能將滑坡本身特性與預測模型相結合,導致預測精度不理想。機器學習的方法因其具有強大的擬合能力,能夠對海量的滑坡數據處理,自動提取特征,被廣泛應用于滑坡危險性預測中。

隨著滑坡數據的多樣性與復雜程度逐漸上升,使用機器學習預測滑坡的一些問題逐漸顯露。在實際應用中滑坡發生的頻率相對較低,因此通常會存在類別不平衡的問題,這會導致模型在訓練和評估過程中偏向于預測負例,從而影響模型的準確性。此外,由于滑坡危險性預測需要考慮多個因子的影響,實際數據中某些因子可能會存在缺失值和異常值,進而影響模型效果。針對上述存在的問題,可以通過欠采樣、過采樣等技術使得正負樣本數目接近,結合均值填充、中位數填充等方法降低缺失值對模型的影響,進而提升模型整體水平。

盡管機器學習在滑坡危險性預測中尚存在些許不足,但不可否認的是,由于機器學習優秀的性能和表現,其仍是當前的主流方法。隨著科學技術的進步與發展,機器學習與深度學習新技術的融入,大量高質量的原始滑坡數據將被不斷挖掘以用于滑坡預測中,訓練數據的質量不斷提升。后續可利用這些高精度數據,結合更強大的深度學習模型,挖掘出原始數據中更關鍵的特征并應用至預測模型。針對滑坡這類非線性的復雜系統而言,對其危險性的預測正朝著全方位多元化綜合發展。

猜你喜歡
決策樹危險性滑坡
O-3-氯-2-丙烯基羥胺熱危險性及其淬滅研究
危險性感
滑坡推力隱式解與顯式解對比分析——以河北某膨脹土滑坡為例
輸氣站場危險性分析
基于AHP對電站鍋爐進行危險性分析
一種針對不均衡數據集的SVM決策樹算法
決策樹和隨機森林方法在管理決策中的應用
淺談公路滑坡治理
基于決策樹的出租車乘客出行目的識別
基于Fluent的滑坡入水過程數值模擬
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合