?

基于GIS 和CF-Logistic 回歸模型地質災害易發性評價:以青海湟中縣為例

2024-01-05 05:59張曉博劉寶山
沉積與特提斯地質 2023年4期
關鍵詞:巖組易發滑坡

張曉博,周 萍,張 焜,張 興,劉寶山,鄧 輝*

(1.青海省地質調查院,青海省青藏高原北部地質過程與礦產資源重點實驗室,青海 西寧 810012;2.成都理工大學地球科學學院,四川 成都 610059;3.自然資源青海衛星應用技術中心,青海 西寧 810012)

0 引言

在地球自身運動或者人類的工程實踐等因素的影響下,發生的危害人類生命財產、生產生活活動或破壞人類賴以生存與發展的資源與環境的地質事件被稱為地質災害。中國是全球地質災害高發區之一,地質災害不但會嚴重破壞該區域的生態環境,而且還會嚴重威脅人類的生命財產安全。近年來,國內外眾多學者對地質災害易發性評價模型進行了深入研究,并取得了豐碩成果。賀鵬等(2016)利用層次分析法對西藏札達地區重大滑坡災害進行易發性評價;洪增林等(2020)利用主成分分析法對榆神府地區進行地質災害危險性分級評估;向喜瓊和黃潤秋(2000)運用人工神經網絡的方法,結合GIS 對長江三峽示范區(巴東—新灘)地區的地質災害進行了危險性區劃;饒品增等(2017)利用地理加權回歸模型對云南省地質災害進行易發性評價;胡凱衡等(2012)采用聚類分析和最大似然法對汶川重災區震后地質災害進行易發性評價;沈玲玲等(2016)應用模糊邏輯法、信息量模型及熵改進的信息量模型,對岷縣地震誘發的滑坡災害進行了易發性評價;劉艷芳等(2014)基于確定性系數分析方法對秭歸縣滑坡災害進行易發性評價;覃乙根(2020)等采用確定性模型和Logistic 回歸模型兩種模型耦合的方法對貴州省開陽縣的地質災害易發性進行評價。各項研究表明,多模型耦合在評價精度、合理性等方面比單一模型具有更明顯的優越性。

東接青藏高原,西連黃土高原,地處二者結合部的湟中縣生態環境極為脆弱,而青藏高原獨特的地質構造以及湟中縣所處地段的特殊性,使得此處外力地質作用極易形成并誘發各種地質災害。由外力地質作用所誘發的災害現象主要包括崩塌、滑坡、泥石流、不穩定斜坡等。本研究區地處青海省東部,人口密集。該區域的人類工程經濟活動強烈,導致湟水河谷及其較大支溝谷與丘陵交接部位地質災害頻繁發生,形成這一地區最為嚴重的環境地質問題。本文結合湟中縣地質災害的空間分布狀況,共選取高程、坡度、坡向、地形起伏度、工程地質巖組,以及斷裂距離、距水系距離7 個地質災害孕災因子,并運用CF 模型和Logistic 回歸模型對研究區內的地質災害易發性進行分析,最終得到湟中縣地質災害易發性分級圖。合理判斷湟中縣地質災害的易發程度,可以有效地規避地質災害發生的風險,同時可以為該區域的地質災害防治與管理提供可靠的科學理論依據(陳緒鈺等,2019)。

1 研究區概況

本研究以青海省西寧市湟中縣(以下簡稱湟中縣)為研究區域。該研究區地處青海省東部,地理坐標為36°13'32″~37°03'19″N,101°09'32″~101°54'50″E,總面積達2 570 km2。湟中縣西起扎麻隆峽口,東至小南川,北起娘娘山,南至拉脊山,總體地勢呈東西走向,海拔向東降低,同時南北兩側高于中央腹地,地形條件復雜,高差大。從山區到河谷平原,現代地貌景觀反映了強烈的上升運動和地區性垂直氣候分布而產生的深切作用。海拔3 900 m 以下為水網強烈切割,河谷呈“V”字形,峽谷,谷坡呈直線形;基巖山區和中高山、低山丘陵區交接線外觀十分平直;中高山除大的河谷形成狹長沖積平原外,均為岡巒起伏的丘陵。該區的地貌可劃分為剝蝕中高山區、侵蝕低山丘陵區、侵蝕堆積平原區三個不同的地貌單元。其中剝蝕中高山集中分布在縣境南北兩側拉脊山和娘娘山一帶,海拔在3 500 m 以上,主要由元古界白云巖、石英巖、片巖、片麻巖和花崗巖組成,山體侵蝕強烈,溝谷形態為“V”型谷,由于本區人類工程活動較少,地質災害以局部崩塌為主,規模較??;剝蝕低山丘陵區主要分布于拉脊山北側、娘娘山南側的中高山山前地帶,主要由古近紀砂巖組成,上覆風積黃土。丘陵區蒸發量大,地形極不平坦,溝壑縱橫,水土流失比較嚴重??傮w上,該地人類活動較強烈,植被覆蓋率低,是崩塌、滑坡和泥石流等地質災害最容易發生的地區;侵蝕堆積平原主要分布于湟水、西納川、康城川和南川等河谷區,地勢相對低平,植被較發育。本區地質災害不發育,但在高階地前緣,崩塌、滑坡災害較常見??h域內大部分鄉、鎮分布在湟水河河谷及一級支流谷底與山間丘陵,屬于典型的山間河谷型縣區。

湟中縣內地質災害十分嚴重,主要的地質災害為滑坡、崩塌、泥石流等,如圖1 所示,區內地質災害以滑坡和崩塌為主,泥石流發育較少,該區域共有地質災害417 處,其中滑坡374 處,崩塌29 處,泥石流14 處。研究區滑坡和崩塌分為土質和巖質兩類,其中以土質滑坡為主,共355 處,占總滑坡數量的94.92%,巖質滑坡共19 處,其中有213 處滑坡處于不穩定狀態,161 處滑坡有輕微活動特征,處于基本穩定狀態;崩塌也以土質崩塌為主,規模以中小型為主,小型崩塌14 處,中型崩塌11 處。

2 研究方法

邏輯回歸模型在對地質災害易發性評價時能夠根據評價因子和災害點之間的關系確定評價因子的權重,但在變量處理時存在很大的主觀性;確定性系數模型能夠解決多因子數據的定量化問題,并且計算出評價因子各分級的相對權重。前人經驗表明,將兩種方法結合能得到更客觀準確的結果,因此本文采取兩種模型結合的方法,將計算得到的CF 值作為自變量代入邏輯回歸公式中進行二元邏輯回歸分析,得到湟中縣地質災害的易發性概率,以此作為易發性分區的依據。

2.1 確定性系數模型

確定性系數模型(CF)是1975 年由Shortliffe和Buchanan(1975)提出的一個概率函數,Heckerman(1985)對其進行改進。同其他統計模型一樣,確定性系數模型假設其將來發生地質災害的原因和過去發生地質災害的原因相同。CF 計算公式為:

式中:PPa為事件(地質災害)在因子分類數據a 里面發生的概率,在實際的研究中通常用因子分類a中的地質災害個數(或面積)與數據分類a 的面積比值比表示;PPs為整個研究區的災害總個數(或面積)與研究區總面積的比值。

CF代表地質災害發生的概率,其值在[-1,1]范圍內變化。若CF為正值,則意味著事件發生確定性的增長,即地質災害發生的確定性高,說明地質環境條件易于發生地質災害;負值則意味著事件發生的確定性降低,即地質災害發生的確定性低,不易發生地質災害,-1 表示不發生地質災害。

2.2 邏輯回歸模型

邏輯回歸模型是一種二分類因變量常用的統計分析方法。它描述的是二元因變量(通常,0 代表地質災害不存在,1 則代表地質災害存在)和多個致災因子(x1,x2···,xn)之間的關系。該模型不限定自變量是否連續,并且不要求自變量滿足正態分布。邏輯回歸模型公式如下:

式中:P為滑坡發生概率,范圍為0~1;α為邏輯回歸計算出的一個常數項;β為邏輯回歸計算而得出的回歸系數;i為評價因子種類數目。

將式(2)兩邊取自然對數,等式左邊作為因變量,將影響因子xi(i=1,2,···,n)作為自變量,得:

3 數據來源和評價因子的選擇及分級

3.1 數據來源

本研究所用到的樣本地質災害點數據包括滑坡149 處、崩塌9 處、泥石流14 處、不穩定斜坡225 處,共計417 個地質災害點,地質災害點空間分布位置如圖1。除了樣本數據以外,地質災害易發性評價的基礎數據有湟中縣DEM 數據、地質數據和水文數據。本研究區的坡度是根據對地觀測與數字地球中心(http://www.eorc.jaxa.jp/ALOS/en/aw3d30/)下載的分辨率為30 m 的DEM 數據生成。

3.2 評價因子的選擇和分級

3.2.1 高程

高程是區域宏觀地貌的一個表征,很多研究表明地質災害與高程分布具有明顯的區域規律(田春山等,2016)。湟中縣地勢大體呈東西走向,海拔由西向東降低,同時南北兩側高于中央腹地,地形條件復雜,高差大。如圖3(a)所示??紤]到研究尺度和湟中縣地貌實際情況,運用自然斷點法7 個等級,如圖2(a)所示,從圖中可以看出,地質災害點主要分布在2 285~2 745 m 之間,占總災害點數量的85.61%。

圖2 地質災害點與各評價因子之間的關系Fig.2 Relation between geological hazards and evaluation factors

圖3 地質災害易發性評價因子分級Fig.3 Classification of susceptibility evaluation factors of geologic hazard in Huangzhong

3.2.2 坡度因子

坡度是影響地質災害發生的一個重要因素,其大小決定了地表松散物質發生位移并且形成地質災害的可能性,同時也在很大程度上確定了斜坡造成破壞的形式和機制(楊德宏和范文,2015;趙艷南和牛瑞卿,2010)?;贒EM 數據,利用ArcMap10.5中的Slope 命令生成坡度分布圖,如圖3(b)所示。根據地質災害在每個坡度段內的分布特點,把坡度按照5°為間隔分為9 個級別,由于40°以上都地質災害點極少,故劃分為一個等級。利用ArcGIS 的空間分析功能,統計地質災害在各個坡度段的分布規律,如圖2(b)所示,從研究區坡度圖來看,區內坡度陡峭,區內坡度分布在0°~73.04°之間。整個研究區內地質災害總數為417 個,從地質災害與坡度的分布來看,地質災害主要發生在5°~25°之間,災害點個數為322 個,占研究區內災害點的77.22%。

3.2.3 坡向因子

坡向是指某一地面點處高程變化量最大的方向(湯國安等,2016)。坡向主要影響山坡面水熱的大小,以及小氣候作用的差異。向陽一面坡體水熱條件充足,自然活動頻繁,因而溝谷發育多陡坡,風化作用強烈,導致巖體裂隙發育易破裂,而陰坡土層多易于累積堆積。由圖2(c)和圖3(c)可知,地質災害主要發生在東—南坡向范圍內,地質災害占總數的55.64%,由此推出該區域斷層走向為東西向。

3.2.4 地形起伏度因子

地形起伏度是指某一確定區域內海拔最高點與海拔最低點的差值(程維明等,2009)。地形起伏度和坡度相互補充,兩者在地質災害評價中都發揮著獨具風貌的重要作用。這兩個因素均與地質災害具有良好的相關性,特別是在高山峽谷和深切河谷地區,地質災害容易發生。本次研究中的地形起伏度計算是借助ArcGIS 軟件,對DEM 數據進行鄰域分析和柵格計算器完成的。將地形起伏度按自然間斷點法分為4 類,研究區內的平坦起伏(0~15 m)地區面積占總面積的30.73%,小起伏(15~30 m)地區面積占總面積的35%,中起伏(30~50 m)地區面積占總面積的24.26%,山地起伏(50~205 m)地區面積占總面積的10.01%。這些統計結果如圖3(d)所示,研究區內地形集中以平坦起伏和小起伏變化呈現,同時在小范圍面積內分布著山地起伏地形。研究表明,平坦起伏和小起伏地區是地質災害發生的主要區域,占研究區災害點的79.38%。

3.2.5 水系因子

地質災害的發育會受到水系發育程度和分布密度的影響,因此水文條件也是影響地質災害形成和發育的一個重要因素(李鑫,2009)。湟中縣屬黃河一級支流湟水流域,主要河流有湟水、康城溝、西納川河等15 條,其中多年平均流量0.5 m3/s 以上的河流有10 條,河流眾多,河網密布。本文中水系是通過DEM 數據提取得到的,利用ArcGIS 軟件中歐式距離分析,以500 m 為間隔生成水系因子圖,如圖2(e)和圖3(e)所示,地質災害主要分布在距離河流1000 m 內,該區域共有地質災害341 個,占總災害數量的81.77%,距離河流越遠,地質災害發育越少。

3.2.6 斷裂構造因子

地質災害的發育一般都與斷裂構造密切相關,斷裂構造影響到區域的穩定性,尤其是在斷層附近,地質作用較活躍,巖土體容易遭到破壞,松散的巖土體為地質災害的形成和發育提供有力的構造條件和物質來源(郭芳芳等,2008;黃潤秋等,2008)。湟中縣的中部地區是新生代西寧斷陷盆地,南側為拉脊山,北側為娘娘山背斜褶皺帶,受達坂山南麓斷裂和拉脊山北麓斷裂控制。本文根據距離斷層的距離來刻畫斷層對地質災害易發的影響,把距斷層距離以2 km 為間距作距離分析,共分為9 級,如圖3(f)所示,從圖2(f)中可以看出,研究區地質災害主要分布在斷層附近10 km 的范圍內,一共發育地質災害264 處,占區域地質災害總數的63.31%。

3.2.7 工程地質巖組因子

工程地質巖組影響著地質災害的發育和形成,以往研究成果表明,地層巖性是產生地質災害的基本物質,巖性的類型不同,其具有的物理力學性質也不同,因此地質災害發生的類型及規模也往往各不相同,而且在不同地質年代中,地層的巖性與地質災害也高度相關(馮新科,2014)。本文根據巖石成因和性質將湟中縣的巖石劃分成7 個巖組大類:以元古界花崗巖、花崗閃長巖、變質巖為主的堅硬塊狀侵入巖巖組;以碎屑巖和變質巖為主的堅硬-較堅硬層狀及塊狀變質巖巖組;以三疊紀砂巖為主的較堅硬塊狀變質巖巖組;以古近系礫巖、砂巖、泥巖等組成的堅硬層狀碎屑巖巖組;由白堊系礫巖、砂礫巖等組成的較堅硬層狀碎屑巖巖組;以古近紀和新近紀泥巖、石膏巖等組成的軟弱層狀碎屑巖巖組;由風積黃土、礫石土、崩滑堆積體等組成的松散層狀沖洪積巖組。從圖2(g)中可以看出,研究區地質災害主要分布在軟弱層狀碎屑巖巖組和松散層狀沖洪積巖巖組。

4 基于CF 和Logistic 模型的地質災害易發性評價

本文對青海省湟中縣地質災害易發性的評價,首先基于統一的矢量范圍,對所有的評價因子柵格數據進行裁剪。同時,根據像元大小設置每個因子圖層的柵格大小為 30 m×30 m。采用CF 模型計算出高程、坡度、坡向、地形起伏度、距河流距離、距斷層距離、工程巖組7 個影響因子各分級的權重(即CF值),隨后把各評價因子的CF值視為自變量,把是否發生地質災害視為因變量(1 代表發生地質災害,0 代表不發生地質災害),采用SPSS25.0 軟件進行二元邏輯回歸分析,把分析結果中得出的各因子的回歸系數作為該因子的權重,從而計算出湟中縣地質災害的易發程度。具體計算步驟如下:

(1)確定性系數模型(式1)計算出7 個影響因子各分類級別的CF值。

根據災害編目中的417 個地質災害點在各因子分級中的分布,利用CF 模型可以計算出各分類級別在因子中的權重,該權重不僅可以比較同一評價因子下各分類級別的相對重要性,還可以在不同評價因子的分類級別之間進行比較,各分類級別的CF值見表1。

表1 各影響因子分類級別的 CF 值Table 1 Values of CF for the seven factors influencing geologic hazard in Huangzhong

(2)各因子之間獨立性檢驗

為了使選擇的因子更加合理,需要對各影響因子之間的獨立性進行分析,剔除關聯性較大的因子,各因子之間的相關矩陣見表2。表中數據顯示,地形起伏度與高程、坡度和工程巖組具有較高的相關系數,其值均大于0.3,其余各因子之間的相關系數基本則不足0.3。因此,舍去地形起伏度因子,保留剩余6 個因子。

表2 影響因子間的相關系數矩陣Table 2 Correlation matrix of seven factors

(3)利用邏輯回歸模型得到各因子權重

將各影響因子分級中的CF值作為自變量,是否發生地質災害作為因變量。本文將研究區內417 個地質災害點作為訓練樣本,并在距災害點1 km 范圍外隨機選取417 個點作為非地質災害樣本,這樣一共得到834 個具有獨立屬性的樣本,根據災害點與非災害點樣本進行各種因子的綜合評價?;貧w結果見表3。

表3 邏輯回歸分析結果Table 3 Results of logistic regression analysis

在本次研究過程中,B代表各因子權重的大小,由sig 值來判斷自變量在方程中的重要程度,若sig 值大于0.05,則沒有意義。從回歸結果可以看出,地形起伏度的sig 值為0.164,大于0.05,說明該因子是無效的,所以剔除地形起伏度這一因子。

(4)地質災害易發性的計算

基于各因子的回歸系數,根據式(2)和式(3)可以得到邏輯回歸方程:

其中,P表示發生地質災害的概率;x1為高程因子中各分級的CF值;x2為坡度因子中各分級的CF值;x3為坡向因子中各分級的CF值;x4為距河流距離中各分級的CF值;x5為距斷層距離中各分級的CF值;x6為工程巖組中各分級的CF值。

5 評價結果及檢驗

5.1 易發性評價結果分析

根據式(4)可以得到研究區地質災害發生的概率P。而地質災害易發性概率可以依照自然間斷點法歸類為五個級別:極低易發區、低易發區、中易發區、高易發區和極高易發區。通過對研究區地質災害易發性分區的面積和災害點數量進行統計分析,如表4 所示,研究區內地質災害極高、高度易發區的總面積為978.046 km2,占研究區總面積的38.051%,其中極高易發區分布216 個地質災害點,占研究區總數的51.799%,高易發區分布156 個地質災害點,占研究區總災害點的37.410%,而極低、低易發區面積較大但災害點分布極少,僅占地災點的2.158%。通過統計發現災害點的分布密度隨著易發性等級的升高而增加,兩者成正相關關系,說明地質災害的易發性分區與災害點的擬合程度較高,表明采用CF-Logistic 回歸模型進行湟中縣地質災害易發性評價能較好地反映區內地質災害易發性的空間分布情況。

表4 地質災害易發性分區統計表Table 4 Results of geological hazard susceptibility in different districts

研究區內極高和高易發區主要分布在湟水干流南北兩岸較大支流兩側低山丘陵地區,總體呈南北向展布,如圖4 所示,研究分析發現,極高和高易發區地層巖性以全新統、上、中更新統時期的沖洪積巖土為主,該土體具有大孔隙及垂直節理,其力學性質較差,在臨空條件下發育大量滑坡、崩塌等地質災害。從河流水系來看,高易發區和極高易發區河網水系密布,常年性河流和季節性河流數量較多,水資源豐富,河流對斜坡坡腳和坡面的沖刷、侵蝕作用明顯,易發育不穩定斜坡和泥石流等地質災害。北部和西南地區主要為低易發區和極低易發區,分布面積為1 105.909 km2,占研究區總面積的43.025%,海拔較高,主要為堅硬巖和較堅硬巖巖組,抗風化能力強,河流主要為支流,河網稀疏,沒有發生地質災害的條件。中易發區主要分布在高易發區兩側,地質災害發育較少。

圖4 地質災害易發性評價圖Fig.4 Assessment chart of geological hazard susceptibility

5.2 精度分析

ROC 曲線常被用來對易發性評價實驗結果做定性分析,AUC 曲線常被用來度量分析模型的有效性,其大小代表曲線下方的面積,AUC 值越大,表明模型的擬合度越高(鐘畝鋒,2019)。本文用ROC 曲線和AUC 對該模型進行驗證,ROC 曲線橫軸表示易發性面積比的累積量,縱軸表示災害點面積百分比的累積量,結果如上圖5 所示。驗證結果AUC 值為0.863,表明CF-Logistic 回歸模型能夠較為客觀準確地對湟中縣地質災害易發性進行評價。

圖5 邏輯回歸模型的ROC 曲線Fig.5 ROC curve of Logistic Regression model

6 結論

本文以青海省湟中縣為例,通過分別計算高程、坡度、坡向、地形起伏度、工程巖組等地質災害影響因子的確定性系數,并利用Logistic 回歸模型得到地質災害發生的概率,以此為基礎,對研究區進行地質災害易發性評價,主要結論有:

(1)本文結合CF 模型和Logistic 回歸模型對湟中縣地質災害易發性進行評價。確定性系數模型和邏輯回歸模型的結合能夠實現復雜多因子數據同區間的定量化,解決各因子之間存在的共線性問題,而且能夠客觀地計算出各因子的權重和各因子分類級別的權重,具有較強的客觀性。

(2)通過SPSS 和ArcGIS 計算,剔除地形起伏度因子,消除了因子共線性。從剩余的6 個地質災害影響因子的各分類級別的CF 值和各因子的邏輯回歸系數可以看出,高程、距河流距離、坡向和工程巖組對湟中縣地質災害易發程度貢獻相對較大。特別是在海拔2 560~2 750 m 內、坡向為東、東南方向、距河流500 m、松散層狀沖洪積巖組和軟弱層狀碎屑巖巖組是最容易發生地質災害的區域。

(3)從各易發程度分布狀況來看,湟中縣地質災害高易發區和極高易發區主要分布在湟水河干流南北兩岸及其較大支流兩側的低山丘陵地區,面積為978.046 km2,占研究區總面積的38.051%。低易發區和極低易發區主要分布在北部和西南高海拔地區,面積為1 105.909 km2,占研究區總面積的43.025%。

(4)基于CF-Logistic 回歸模型的易發性評價方法可以客觀準確地計算出地質災害影響因子與地質災害的發生之間的確定性關系。而ROC 曲線和AUC 值則說明該方法可以較為準確地對湟中縣地質災害進行易發性評價。

猜你喜歡
巖組易發滑坡
銀川市地下水賦存條件及動態特征
機用鎳鈦銼在乳磨牙根管治療中的應用
貴州省地質災害易發分區圖
夏季羊易發疾病及防治方法
滑坡推力隱式解與顯式解對比分析——以河北某膨脹土滑坡為例
冬季雞腸炎易發 科學防治有方法
淺談公路滑坡治理
淮南潘集深部勘查區15-2孔工程地質巖組劃分
白音華煤田三號露天礦區水文地質條件分析
基于Fluent的滑坡入水過程數值模擬
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合