?

基于熵權TOPSIS和神經網絡復合方法的廈門市雨洪災害風險評估*

2022-02-05 13:43羅紫元丁鍶湲
災害學 2022年4期
關鍵詞:雨洪脆弱性廈門市

羅紫元,田 健,丁鍶湲,王 寧,2,曾 堅

(1.天津大學 建筑學院,天津 300072; 2.廈門市城市規劃設計研究院,福建 廈門 361012)

降雨產生的洪澇災害是城市環境中最常見、最具破壞性的自然災害之一,對居民生活和財產構成多方面威脅。有效繪制災害風險圖,能夠為精準施策、減輕災害風險提供依據[1]。

參考聯合國國際減災戰略(UNISDR)的災害風險評價模型[2-4](式1)對城市雨洪災害風險進行評估。

Risk=H×V×E。

(1)

式中:H、V、E分別指代風險評估的三個維度,H代表災害危險性[5],即在誘發因素作用下產生雨洪災害的可能性;V代表城市系統的應災脆弱性[6],即城市物質環境和社會經濟面對雨洪災害影響的固有敏感性;E表示風險暴露度[6],即系統暴露在雨洪災害下引發生命財產損失的程度。

以往研究多采用多準則評價的方法對雨洪災害風險的各維度影響因子進行賦權,進而通過GIS疊加計算研究區的整體災害風險[7-8]。應災脆弱性和風險暴露度的影響因子選取多集中在風險源空間分布、救援疏散能力和人口經濟分布等方面。但災害危險性涉及的影響因子復雜,較難確定各項因子的實際貢獻,很大程度上影響著災害危險性的評價準確性。此外,雨洪災害危險性的評價與雨洪淹沒數據最直接相關,而所用雨洪災害數據的全面性和準確性仍有待提升,以上兩方面都意味著災害危險性的評價精度仍有進一步提升的空間。近年來,邏輯回歸[1]、隨機森林[9]、粒子群和支持向量機[10]等機器學習方法在城市暴雨洪澇災害危險性和易感性等評價中得到大量應用,其通過直接建立影響因子與洪澇發生可能性之間的關系,避免主觀因素的影響,提高模擬評價的準確性。

因此,本研究在以往多準則評價的基礎上,采用了一種機器學習與GIS多準則決策相結合的雨洪風險評估方法,以熵權TOPSIS模型評估廈門市的雨洪應災脆弱性和風險暴露度,以神經網絡模型模擬評價災害危險性,最終實現對廈門市雨洪災害風險的評估。其中主要對雨洪淹沒數據的獲取和雨洪災害危險性影響因子的篩選進行了創新。

1 研究區與數據來源

1.1 研究區

廈門市位于福建省東南沿海,是廈漳泉閩三角城市群的中心城市,市轄思明區、湖里區、海滄區、集美區、同安區和翔安區6個城區(圖1)。2000年以來,廈門市社會經濟活動高速發展、城鎮建設及人口高密度聚集,截至2020年全市排水管道長度已達到4 427.7 km,基本實現全覆蓋。但面對越來越難以預測的雨洪災害,城市仍存在排水系統壓力過載等沿海地區典型的城市問題,部分城區受到風暴潮、洪水、內澇積水的嚴重威脅。

圖1 研究區所在區位示意圖(該圖基于中國標準地圖(GS(2021)6026號)和福建省標準地圖(GS(2017)1268號)繪制,底圖無修改,下同)

1.2 數據來源

1.2.1 雨洪淹沒數據

雨洪災害風險評估的準確性很大程度上受到雨洪淹沒數據的影響。以往研究中常采用歷史洪澇信息[11]、無源淹沒算法[12]、水文水力計算[13]或遙感影像解譯[14]的方式獲取雨洪淹沒信息,開展災害危險性模擬評價,而這些方法一定程度上受到數據的影響和限制。在實際雨洪過程中,淹沒往往以面的形式存在,但歷史洪澇信息僅以坐標點的形式記錄各雨洪淹沒面的質心[11]。此外,受觀測點和數據完整性等方面影響,較難確定其他地點是否存在雨洪淹沒,也就意味著歷史洪澇信息中存在大量被省略和未統計的淹沒點,較難完整全面地表達實際災情。無源淹沒算法僅考慮降雨導致的水位上漲,而不考慮地表徑流的流動情況和城市排水系統的作用,計算得到的淹沒范圍往往與實際存在一定差距。同時,無源淹沒算法的輸入數據與DEM、坡度、坡向等常用的影響因子存在較高的同源性,較難反映真實的雨洪淹沒情況。水文水力計算的結果通常具有較高的準確率,但其對水文和管線數據要求較高[10]。這些數據的獲取存在一定難度,因此較少能夠在研究中普遍運用。遙感影像解譯為獲取實際雨洪淹沒范圍提供了經濟、便捷的方式,其誤差主要來源于水體識別過程中水體懸浮物、植被、山體陰影等產生的干擾。此外,未排除河流湖泊等永久性水體也會導致模型擬合度異常增高。

綜上,研究以衛星遙感影像獲取廈門市多年期(2010—2020年)的雨季(4—9月,包括梅雨季和臺風雨季)遙感影像[15],經過解譯并剔除常水位的永久性水體后,鑲嵌形成廈門市雨洪淹沒范圍。研究一方面選取解譯準確度較高的影像結果,另一方面從鑲嵌的雨洪淹沒范圍中剔除淹沒頻次小于3次的斑塊,以減少遙感解譯誤差可能帶來的影響。這雖然可能帶來一定淹沒范圍的損失,但同時也能夠排除其他因素導致的偶然性淹沒。研究以淹沒頻次作為災害危險性的劃分標準,淹沒頻次越高意味著發生雨洪災害的可能性越高,雨洪災害的危險性相應增加。將淹沒頻次3次以上的斑塊,以自然間斷點分級法分為從Ⅰ級偶發到Ⅴ級頻發的5類。統計結果表明,Ⅰ級偶發型淹沒是廈門市雨洪災害淹沒范圍的主體,占比65.9%,而Ⅲ、Ⅳ、Ⅴ級較多發區域占比14.5%。對非淹沒區和Ⅰ~Ⅴ級雨洪淹沒區隨機采取300個采樣點用于機器學習模型訓練模擬,其中隨機選取70%的采樣點作為訓練集,用于模型訓練驗證,另30%作為測試集,用于模型測試。

1.2.2 雨洪災害風險評價指標體系

根據公式(1),選取評價脆弱性、暴露度和危險性的指標因子(表1)。表1中匯總整理了既有研究中涉及的雨洪災害危險性指標因子,但指標因子種類繁多,因子自相關等潛在問題對機器學習準確模擬雨洪災害危險性存在較大影響。較少有研究在機器學習模擬前開展因子篩選[16],減輕模型的冗余和過擬合等問題[17-18]。因此研究在機器學習模擬雨洪災害危險性前,通過統計學和隨機森林算法等篩選適合研究區的雨洪災害危險性指標因子。

脆弱性是承災體的內在屬性,由影響人類社會面對災害敏感性的自然生態和社會經濟兩個方面要素決定(圖2)。自然生態系統中,城市受雨洪災害的影響與水系河網的分布密切相關,河網密度越高,與水體間的距離越小,用地受到雨洪災害影響的可能性越大。社會經濟系統中,城市的應災脆弱性與城市應災疏散能力的強弱有關,道路密度高、距離道路距離近的地區具有更好的應災疏散能力,面對雨洪災害的脆弱性相對更小。

雨洪災害風險的暴露度與承災體的人員、資源、生計、環境服務以及經濟、社會和文化資產的狀況有關。自然生態系統的價值損失可以表征為生態系統提供生態服務價值的降低。結合暴雨洪澇災害的影響特征,研究選取生態系統服務價值中的氣候調節、水文調節、土壤保持和生物多樣性作為暴露度評價的指標因子。社會經濟系統產生的災損與人口集聚、開發建設密度、經濟發展水平等密切相關,研究選取人口密度、經濟水平(GDP)、夜間燈光指數、農業生產價值、美學景觀價值作為反映城市社會經濟狀況的指標(圖3)。

表1 廈門市雨洪災害風險評價指標體系

圖2 廈門市雨洪災害應災脆弱性評價指標因子

圖3 廈門市雨洪災害風險暴露度評價指標因子

2 研究方法

2.1 基于熵權TOPSIS方法的雨洪應災脆弱性和風險暴露度評價

本研究整合多準則決策分析中的熵權法和TOPSIS法對城市雨洪災害的脆弱性和暴露度進行評估。熵權法根據指標自身的數據離散程度確定權重,是一種相對客觀的賦權方法[21],數據離散程度大的指標能夠提供相對較多的信息,從而影響綜合評價結果,因而被賦予更大的權重。TOPSIS法從一系列方案中選取解決方案,使所選方案與正理想解的距離最小,與負理想解的距離最大[22]。以熵權法確定各因子權重,繼而將指標因子與權重的乘積作為新的數據,通過TOPSIS模型度量新數據中各指標值與最優解間的距離,從而按距離進行綜合排序,其相較于傳統TOPSIS法更為客觀[22]。研究通過以下步驟實現熵權TOPSIS方法:

(1)數據標準化。根據測度對象涵蓋的m個類別和n項指標因子建立評價系統的原始數據矩陣(式2)。通過極差標準化法對數據進行標準化處理(式3)。

(2)

(3)

(2)熵權法確定指標因子權重。根據數據標準化結果,采用式(4)計算第i個類別中第j項指標的比重Yij,按式(5)至式(7)計算第j項指標的信息熵Ej和信息冗余度dj,從而計算指標權重ωj(式8)。

(4)

(5)

(6)

dj=1-Ej;

(7)

(8)

(9)

(10)

(11)

(12)

(13)

(14)

2.2 基于機器學習方法的雨洪災害危險性評價

研究首先通過多重共線性分析、地理探測器和隨機森林算法篩選雨洪災害危險性指標因子,隨后采用3種常用的機器學習方法進行模型訓練,從中選取效果最優的機器學習方法模擬雨洪災害危險性。

2.2.1 基于多重共線性分析篩選指標因子

多重共線性是一種統計學指標,意味著模型中的某些解釋變量以線性形式高度相關,從而可能導致模型估計失真[10]。通過方差膨脹因子 (VIF)和容忍值(TOL)分析多重共線性強度,剔除存在強自相關的因子能夠提高模型的計算能力。理論上,當VIF>10或TOL<0.1表示因子中存在多重共線性問題[23]。表2中顯示了剔除高度自相關因子后的多重共線性分析結果。

表2 剔除高自相關因子后的多重共線性分析結果

表3 雨洪災害危險性與所選因子間相對重要性的q、p值

2.2.2 基于地理探測器和隨機森林算法篩選指標因子

地理探測器不需要線性假設即可度量變量間的統計關系[24],但分析結果易受到因子多樣性、數據離散化等因素影響。隨機森林能夠處理多因子的高維數據并維持較好的準確性。綜合2種方法篩選因子以提高后續機器學習模擬的運算能力。

采用地理探測器分析雨洪災害危險性Y與表2中各指標因子X間的相對重要性,其相對解釋程度以q值(式15)表示。其中,N表示模型單元數,σ2表示Y值的方差,A表示X分層數,q取值在0~1之間,q值越大表示因子對Y的影響越大。

(15)

采用正則化隨機森林(Regularized Random Forest,RRF)算法對雨洪災害危險性的評價指標因子重要性進行排序。隨機森林算法能夠通過多決策分類樹判別輸入變量的重要性,而正則化能夠降低過擬合,其效果優于單一分類器[25]。

綜合地理探測器和隨機森林算法的分析結果,研究選取了表3所示的13項指標因子,其隨機森林模型擬合優度為74.3%,效果較好。

盡管土地覆蓋、降雨量等因子被證明和以往研究一樣是影響雨洪災害危險性的相對重要因素,但并非以往研究中采用的所有評價因子都對廈門市雨洪災害危險性具有較強的影響,如:沉積物輸送指數、平面曲率等。此外,本研究根據研究區特點補充的沿海壓力和以道路系統代替的排水系統相關指標因子也表現出較高的重要性。

2.2.3 機器學習模型的選擇和開發

在MATLAB中構建了包括支持向量機、提升決策樹和神經網絡的多種機器學習模型進行雨洪災害危險性評估,比較其模擬效果。

(1)支持向量機。支持向量機是一種基于結構誤差最小化原理的機器學習算法[26],具有出色的非線性分區能力,是在雨洪災害風險評估中得到大量運用的機器學習模型之一[17]。該算法的目的是確定一個最佳的分割超平面,對數據進行按維度分類,以減少泛化誤差并最大化不同類別數據之間的差異。

(2)提升決策樹。提升決策樹通過融合決策樹算法和提升方法,以決策樹為基礎分類器,將弱分類器組合成強分類器[27]。該算法在每次迭代中每一棵回歸樹以之前回歸樹的結論和殘差進行訓練,擬合形成當前的殘差回歸樹,已經被證明是一種具有高效率和低偏差的強大分類模型[22,28]。

(3)神經網絡。神經網絡模型是模擬真實神經系統的簡單建模,廣泛用于解決各種科學問題。其能夠在不同尺度上執行運算,解決高復雜性非線性問題,而不需要特定的統計分布優勢,已被應用于自然災害風險評估[12,15]。本研究根據數據特征選擇了由1個輸入層、1個隱含層和1個輸出層組成的神經網絡。

3 結果分析

3.1 廈門市雨洪應災脆弱性

通過熵權TOPSIS法評價應災脆弱性,根據理想解相對貼近度繪制廈門市雨洪災害應災脆弱性圖,并按照自然間斷點分級法分為從極低到極高的5類(圖4)。結果表明有29.1%的用地雨洪脆弱性較高或極高,主要分布在河網水系附近且距離救援疏散道路較遠的地區。在建成區范圍內,海滄區貞岱、浦邊等村莊、集美區大東山附近以及翔安區馬巷鎮表現出較高的應災脆弱性,廈門島的雨洪脆弱性較低。

圖4 廈門市雨洪災害應災脆弱性圖

3.2 廈門市雨洪風險暴露度

同理繪制廈門市雨洪災害風險暴露度圖,并按自然間斷點分為從極低到極高的5類(圖5),廈門市雨洪暴露度的高值區占比38.9%,主要集中在市域東部的同安區和翔安區。

圖5 廈門市雨洪災害風險暴露度圖

3.3 廈門市雨洪災害危險性

以擬合優度R2作為判別機器學習績效的指標,R2越接近1表示模型擬合效果越好。支持向量機、提升決策樹和神經網絡模型的R2依次為0.63,0.68和0.71。結果表明:神經網絡模型在模擬預測廈門市雨洪災害危險性上具有較好的表現。

根據經驗公式和實際模擬效果,采用神經網絡工具箱構建指標輸入層節點數為13,隱含層節點數為17,評價輸出層節點數為6的單隱含層神經網絡,設置最大迭代次數為1 000,采用Sigmoid激活函數和貝葉斯正則化算法對模型進行訓練和測試。訓練和測試集準確率分別為0.906,0.825,模型總準確率達到0.885,表明該模型能夠捕獲指標因子與災害危險性之間的關聯,網絡辨識精度較高。

根據訓練的神經網絡模型,計算廈門市當前雨洪災害危險性作為模型的輸出。繪制廈門市雨洪災害危險性圖,采用自然間斷點分級法將危險性分為圖6所示的5類。廈門市雨洪災害危險性較高區域主要分布在河流及海岸沿線,如海滄區嵩嶼街道、集美區集美街道、同安區大同鎮、西柯街道、翔安區前浯村、新店鎮等,其中,同安區及翔安區的雨洪災害危險性明顯高于其他城區。對于廈門島內地區,思明區湖濱南片區、廈港街道、沙坡尾和湖里區五緣灣片區、金山街道發生雨洪淹沒的可能性較高,與實際的城市洪澇情況較一致。這些區域不僅距離水體等風險源較近,且地形相對平坦、建筑物密集、地表不透水率較高,導致排水能力較弱。極低易感地區主要分布在海拔較高、地表透水性較好的林草地和耕地處。此外,馬鑾灣、杏林灣等水體濕地也表現出較低的雨洪災害危險性,并且隨著水體向岸線逐漸過渡,受降雨匯流等導致水深增加等影響,雨洪淹沒的危險性增加。結果表明:本研究中以淹沒頻次劃分的雨洪淹沒數據能夠保證較高的模型擬合優度,并在避免將既有水體錯誤識別為高危險區的基礎上,較準確的將水體附近的易淹沒區劃分為風險區域,從而取得較貼合實際的災害危險性評價結果。

圖6 廈門市雨洪災害危險性圖

3.4 廈門市雨洪災害風險評價

根據式(1)中的風險評價模型進行廈門市的雨洪災害風險評價制圖(圖7)。結果表明,廈門市大部分地區雨洪災害風險較低,占比56.7%,雨洪災害風險較高的區域占比5.9%,主要分布在同安區和翔安區,少量分布在集美區和思明區,其中有1.8%的地區雨洪災害風險極高,分布在同安區祥平街道、西柯街道及翔安區馬巷鎮和新店鎮。

圖7 廈門市雨洪災害風險圖

4 結論與討論

4.1 結論

研究采用熵權TOPSIS與神經網絡構建的復合模型評估廈門市雨洪災害風險,其中以熵權TOPSIS法評估廈門市面對雨洪災害的應災脆弱性和風險暴露度,以神經網絡模型模擬評價災害危險性。

(1)通過多重共線性檢驗、地理探測器和正則化隨機森林算法可以篩選具有研究區針對性的危險性指標因子,除土地覆被和降雨量等因子外,本研究采用的沿海壓力和排水系統相關指標因子也表現出較高的重要性。沿海城市有必要考慮將沿海壓力納入雨洪災害風險評價指標體系,排水管網高度普及的城市可以根據指標實際情況,將道路系統作為排水系統的數據替代。

(2)神經網絡模型在本研究的災害危險性評價中表現出最優的訓練精度(0.885),基于多年期雨季淹沒頻次的雨洪淹沒圖在取得符合實際的評價結果同時能夠保證較高的擬合優度。

(3)河道附近和遠離道路的用地應災脆弱性較高,占全市用地的29.1%。同安區和翔安區的用地風險暴露度較高,占比38.9%。廈門市56.7%的區域處于低雨洪風險,5.9%的區域雨洪風險較高,其中1.8%的用地面臨極高風險,分布在同安區祥平街道、西柯街道及翔安區馬巷鎮和新店鎮。

本研究對雨洪災害風險的評價可以作為雨洪災害管理的第一步,為高風險區的識別與施策提供支持。

4.2 討論

(1)本研究在整理常用的雨洪災害危險性評價因子的基礎上,結合研究區特點加入沿海壓力因子,并通過多重共線性檢驗、地理探測器和正則化隨機森林算法開展指標篩選,相比以往研究中根據經驗選取評價因子一定程度上提高了科學性。

(2)本研究根據解譯的多年期雨季遙感影像獲取雨洪淹沒數據,并按淹沒頻次制作了雨洪淹沒圖,在一定程度上規避了歷史洪澇信息、無源淹沒算法和水文水力計算中存在的數據局限,但本研究的雨洪淹沒圖也存在自身不足。一方面,受衛星重訪周期限制,研究所獲遙感影像的時期并不一定是處于最大淹沒范圍的時期,解譯也只能取得淹沒面積,而無法獲取淹沒時長信息。另一方面,雨洪淹沒范圍隨時間推移和城市雨洪管理也呈現一定變化,而多年期遙感影像疊加獲取的淹沒范圍弱化了這種動態性。

(3)由于目前對應災脆弱性和風險暴露度評價結果尚沒有公認的檢驗方法,本研究僅能夠對雨洪災害危險性采用機器學習方法進行模擬和檢驗,仍沿用多準則評價的方式評價應災脆弱性和風險暴露度。

猜你喜歡
雨洪脆弱性廈門市
工控系統脆弱性分析研究
基于集對分析的德州市雨洪資源潛力研究
七彩屋 福建省廈門市翔安區舫山第二小學
廈門市婦聯打造“愛在廈門”交友聯誼互動平臺
組織祭掃活動 緬懷革命先烈
低影響開發中植物應用研究
基于DWT域的脆弱性音頻水印算法研究
海綿城市概念在景觀規劃設計中的應用探究——以哈爾濱群力雨洪公園為例
丘陵地區大學校園景觀在雨洪應對中的作用
煤礦電網脆弱性評估
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合