?

基于機器學習-網格搜索優化的砂土液化預測

2024-03-19 07:07王昭棟王自法李兆焱苗鵬宇吳祿源
振動與沖擊 2024年5期
關鍵詞:砂土液化準確率

王昭棟,王自法,李兆焱,苗鵬宇,吳祿源

(1.河南大學 土木建筑學院,河南 開封 475004;2.中國地震局工程力學研究所,哈爾濱 150080;3.中震科建(廣東)防災減災研究院,廣東 韶關 512026)

地震是破壞威力極強的自然災害,砂土液化是由地震引發的主要地質災害之一。砂土液化區域內通常會出現噴水冒砂、地面凹陷及不均勻沉降等現象,對土地和建筑造成了大面積破壞,還會對橋梁、大壩、生命線工程等造成難以預估的損失,因此尋求可靠地預測液化破壞成為巖土地震工程領域最具挑戰的問題之一。

砂土液化判別方法主要有室內室外試驗判別法、經驗半經驗公式分析方法和數值模擬判別法。張思宇等[1]基于靜力觸探試驗數據提出雙曲線模型和液化判別公式,經與國內外方法對比表明該判別公式在不同地震動強度和砂層埋深下均可給出合理判別結果。Robertson[2]通過對案例數據進行總結研究,分別從排水條件、土壤變化、抗剪強度方面對靜力觸探砂土液化判別公式進行了更新補充,使其更具有更廣泛的適用性。王長虹等[3]以摩爾-庫倫屈服準則的圓錐孔擴張理論為基礎,建立了靜力觸探試驗過程的宏細觀轉換公式,同時以實際案例驗證了該公式對上海地區黏土或粉質黏土的適用性。

隨著科學技術手段的發展,國內外專家學者以數據分析的方式研究地震構造破壞發生原因[4],也將遠程遙感影像技術[5-6]和軟件技術[7-9]應用至地震研究中并取得豐厚成果。此外,具備適用云計算、大數據運轉及連續處理能力,且性能穩定效率更高等優點的機器學習方法也為研究人員提供了更多的思路,越來越多的研究人員開始探索機器學習-地震災害評估研究[10-12]。李程程等[13]利用二元Logistic回歸方法,以地表峰值加速度、場地平均剪切波速、復合地形指數和場地與河流的距離四個特征構建了區域性液化判別公式。姜禮濤等[14]通過收集吉林松原實例樣本,建立NRS-ISSA-SVM液化判別模型,選取地下水位、地震烈度、標貫擊數、非液化土層厚度4個因素作為影響因素。Kohestani等[15]以226組地震液化數據,選取液化層深度、錐尖阻力值、套筒摩擦比、有效垂直應力、豎向總應力、最大峰值加速度和震級等作為特征輸入,建立隨機森林模型進行預測。以上方法體現了機器學習計算迅速精確的優勢,但也存在以下缺點:

(1) 影響特征選取要素比較復雜,前期準備工作耗費一定時間。

(2) 小樣本的機器學習模型預測結果較好,但未能與國內及國際的傳統液化判別方法進行準確率對比。

(3) 雖然名為預測模型但并未體現預測過程,未用權威的第三方數據庫進行液化驗證。

本文基于新西蘭巖土數據庫(New Zealand Geotechnical Database,NZGD)中靜力觸探試驗報告,采用地表峰值加速度、地下水位、上覆土層厚度、液化/非液化層埋深、錐尖阻力值作為特征要素,基于Python語言構建具備液化判別、預測功能的砂土液化預測模型,使用網格搜索法對模型進行超參數優化,利用多項評價指標對模型進行性能評估,同時采用歷史震害數據進行模型驗證,并與國內外研究方法進行結果對比。將新西蘭數據和歷史震害數據集結合,通過經驗分析法確定靜力觸探初判條件,為快速判別液化情況提供參考依據。

1 數據集準備

1.1 數據來源

新西蘭巖土數據庫在坎特伯雷巖土工程數據庫的基礎上創新開發而成,其為研究2010—2011基督城序列地震的城區災后重建工作者提供更有效的巖土信息途徑。靜力觸探試驗(cone penetration test,CPT)是一種將探頭以定速推入土壤,通過與探頭相連接的傳感器獲得連續精確的數據并記錄。因其成本較低、結果一致性及可重復性高,受到工程師及研究人員青睞。本文從新西蘭巖土數據庫中下載位于基督城地區519組CPT報告,提取影響砂土液化的關鍵因素作為砂土液化研究的數據集,試驗數據來源如圖1所示。

圖1 新西蘭震害數據來源

1.2 數據統計分析

影響液化的因素可分為動荷因素、埋藏因素及土質因素,本文根據以上三個條件共選取了5個特征。

(1) 地表峰值加速度(amax)。地震動是砂土產生液化的重要前提條件,地表峰值加速度可作為反映震動強弱的重要參數,對比圖2和圖3可知,基督城地區液化場地PGA區間分布為0.14~0.7g,非液化場地數據較少,PGA分布范圍為0.14~0.65g。相同點是二者PGA均主要集中在0.3~0.4g之間,不同點是對于液化場地,PGA為0.4~0.7g占比24.08%,而對于非液化場地僅占比5.95%,差異顯著。

圖2 液化場地地表峰值加速度特征

圖3 非液化場地地表峰值加速度特征

(2) 地下水位(dw)。地下水位主要會影響土體的孔隙水壓和抗剪強度,進而影響砂土液化能力。每一個勘察點位在靜力觸探報告中提供具體的地下水位數值,可直接進行提取。對比圖4和圖5可知,除了非液化場地存在2.41%大于6 m的地下水位,二者地下水位分布特征類似,非液化場地地下水位略低于液化場地。

圖4 液化場地地下水位特征

圖5 非液化場地地下水位特征

(3) 上覆非液化土層厚度(du)。當上覆非液化土層厚度增加時,上覆有效應力也隨之增加,其越不容易產生液化現象。經統計,液化場地的上覆土層厚度平均值為3.59,中位數為2.76,眾數為2;非液化場地上覆土層厚度平均值為8.25,中位數為8,眾數為6。特征差異明顯,說明非液化場地的上覆土層較液化場地更厚,場地壓實度更高。

(4) 液化/非液化層埋深(ds)。液化/非液化層埋深是影響砂土液化的重要因素,與勘察地點的地質條件相關。液化場地的砂層埋深分布范圍為0.55~18.25 m,主要分布在3~6 m處,占比最多為48.58%,而非液化場地的砂層埋深分布范圍為1.61~21.83 m,主要分布在12~15 m處,二者差異顯著。對比圖6和圖7可知,液化場地在0~9 m處分布占比為95.46%,大于9 m的深液化層占比4.54%,為深層砂土液化提供了數據支持。

圖6 液化場地砂層埋深

圖7 非液化場地砂層埋深

(5) 錐尖阻力值(qc)。錐尖阻力值是依靠探頭與土壤擠壓觸碰并記錄實測曲線得到,其值大小反映了土壤的軟硬,為確定土層液化情況提供了重要的依據。經統計,液化場地的錐尖阻力平均值為1.99,中位數為0.96,眾數為0.69;非液化場地上覆土層厚度平均值為13.1,中位數為14.43,眾數為15.67。特征差異明顯,說明非液化場地的砂層硬度更強。

2 機器學習分類模型

本文選取三個應用較為廣泛的機器學習分類模型,其中包括支持向量機、隨機森林以及XGBoost,通過采用相同的性能指標評價所建立的砂土液化預測模型。

2.1 支持向量機

支持向量機(support vector machine,SVM)[16]最早由Lerner在1963年提出,是一種傳統的機器學習算法。

支持向量機解決問題一般可分為線性和非線性問題兩類。

2.1.1 線性問題

決策平面首先應滿足約束

yi(ωxi+b)≥1-ξi,ξi≥0,i=1,2,…,k

(1)

為了滿足線性求解,分類函數轉換為

(2)

對函數進行求解需要建立拉格朗日函數

(3)

根據庫恩塔克條件,得出:

(4)

(5)

至此得出線性優化問題的對偶形式,也轉變成求解函數最大值問題

(6)

式中:αi為拉格朗日乘子,αi≥0,i=1,2,…,k;ω*為最優超平面的法向向量。

最終可得出相應的分類函數

(7)

2.1.2 非線性問題

對于非線性問題,支持向量機引用非線性函數,將已有樣本映射至高維特征空間中,以此空間構造超平面,則目標函數為

(8)

式中,K為核函數。支持向量機中已有的核函數包括拉普拉斯核函數、高斯核函數、多項核函數、Sigmoid核函數等。

最終可得到相應的分類函數

(9)

支持向量機在求解小樣本條件下的二分類問題時能力顯著,可以進行硬間隔和軟間隔劃分,并能夠在多種特征空間條件下劃分出最優且唯一超平面。

2.2 隨機森林

隨機森林(random forest,RF)由Breiman[17]提出,它是基于Bagging基礎之上創新的優秀算法,其繼承了決策樹“分而治之”的思想。通過以多棵分類決策樹{h(X,θk),k=1,2,…,k}進行集成學習,從而得到組合分類器隨機森林模型。

由于{θk,k=1,2,…,k}是獨立同分布的隨機變量,因此促成隨機森林具備兩大隨機步驟,分別是Bagging思想與特征子空間思想,提升了隨機森林的效率和可擴展性。隨機森林單棵決策樹訓練過程如圖8所示。

圖8 隨機森林第k棵決策樹訓練過程

通過對每棵決策樹進行k輪訓練,進而得到每個分類序列{h1(X),h2(X),h3(X)…,hk(X)},采用簡單多數投票結果法得到最終的分類結果

(10)

式中:H(x)為匯總分類模型;hi為單棵決策樹分類模型;Y為目標函數;I( )為示性函數。

2.3 XGBoost

XGBoost(eXtreme gradient boosting,XGB)由Chen等[18]提出,是Boosting算法的一種子算法,XGB同樣以決策樹作為基模型,在數據上建立多個弱評估器,同時通過梯度提升算法不斷迭代提升形成強評估器,實現高效的分類與回歸功能。

XGboost的目標函數如下所示

(11)

(12)

3 砂土液化預測模型

3.1 模型訓練流程

Python語言是一種高效的膠水語言,其庫的類別豐富,功能強大;其中,以Scikit-learn為主的庫中包含了海量的機器學習方法,因此采用由Scikit-learn機器學習庫導出的支持向量機(SVM)、隨機森林(RF)、XGBoost(XGB)三種分類模型,在運行過程中結合了Numpy、Pandas及Matplotlab等數據分析環節,高效地完成了數據讀取、數據集劃分、建立模型、性能評估、可視化以及結果保存等程序,訓練流程圖如圖9所示。

圖9 砂土液化模型建立流程圖

Step1:讀取新西蘭震害數據資料庫;

Step2:對數據進行切片處理,指定模型輸入特征及輸出特征的類別;

Step3:調用Scikit-learn庫中的SVM,RF,XGBoost函數并設置模型初始超參數,建立3種初始預測模型;

Step4:對預測模型進行訓練,利用網格搜索法對3種分類模型進行超參數優化,尋找最佳超參數組合;

Step5:調整模型中訓練集和數據集的所占比例,以6∶4、7∶3、8∶2對數據集進行劃分;

Step6:通過超參數優化后獲得最佳砂土液化預測模型,預測測試集并打分;

Step7:通過整體精度(overall accuracy,OA)、精確率P、召回率R及F1指標對模型進行性能評估,對3種預測模型綜合性能進行對比分析;

Step8:利用最優預測模型對各輸入特征進行重要性排序,分析排序結果;

Step9:導入Moss[19]數據,分別以機器學習模型(SVM、RF、XGBoost)、Olsen方法[20]和GB 50021—2001《巖土工程勘察規范》[21](2009版)方法進行驗證;

Step10:對比驗證結果,分析模型適用性。

3.2 模型建立

選取位于基督城區域內519組靜力觸探試驗報告為基礎數據庫,建立砂土液化預測數據集,然后對數據進行劃分,以地表峰值加速度(amax),地下水位(dw),上覆土層厚度(du),液化/非液化層埋深(ds)和錐尖阻力值(qc)作為輸入特征,以液化情況(Y=液化,N=非液化)作為輸出特征。由于不同的特征在量級上存在差異,因此在建立模型之前,采用式(13)對數據集進行歸一化處理,使不同指標量級一致,保證數據的可運算性以及等效性。將數據集以.csv格式進行儲存以后,以Pandas庫中的read_csv()函數進行讀取,同時,調用Scikit-learn庫中的SVM、RF和XGBoost函數,分別將各影響因素導入到模型之中。

(13)

式中:Xi為各個特征中第i個樣本數據;Xmax為各個特征的最大值;Xmin為各個特征的最小值。

3.3 超參數優化

超參數是調控模型性能的參數值,不同的機器學習模型內部有不同的超參數。通過搜索出最佳超參數組合并應用,進而達到增強模型的泛化能力及運算速度的效果。

超參數優化方法有隨機搜索、網格搜索和貝葉斯優化三大類方法。隨機搜索(random search)法是在搜索范圍內隨機尋找最優的超參數值,將各最優超參數進行組合,盡管運算較為迅速,但是極有可能漏掉搜索空間中重要的點進而達不到最優值。貝葉斯優化(Bayesian optimization)通過在有限空間內構造代理函數,減少了運算時間,同時運用采集函數對評估點進行精準識別,但是貝葉斯優化一旦尋求到局部極值點就會不斷地在該區域內進行采樣,所以很容易陷入局部最值。網格搜索(GridSearchCV)法通過采用窮舉思路,在指定的參數范圍內,窮盡所有的參數組合,尋求精度最高的參數,進而達到優化模型的目的。

考慮到本研究計算規模較小,所需要時間成本有限,所以可利用網格搜索法得到最佳的參數組合,達到優化模型的目的?;赑ython語言引出Scikit-learn庫中網絡搜索法,對SVM,RF和XGBoost依次進行超參數優化,得到各個模型最優的參數值。對于關鍵參數最終結果如表1所示,非關鍵參數則采用默認數值。

表1 基于網格搜索后的三種模型最優超參數

3.4 性能評估

本文選取了整體精度OA、精確率P、召回率R、F1值作為性能度量指標,如表2所示。OA衡量模型預測準確目標的準確率,也即正確預測的樣本與所有樣本的比率。精確率P衡量模型預測真陽性目標的精準度,召回率R衡量模型預測真陽性目標的完整度,因精準率P與召回率R在特定情況下不能兼顧,可采用F1指標即可綜合評價考慮。

表2 預測模型評價指標

3.5 結果分析

各模型性能評價指標如表3所示。通過對比可知,在不同測試集、訓練集劃分下,三種機器學習分類模型得分均較高,所有值均在0.83以上,由表3分析可知,不同樣本劃分對模型的性能產生了影響,在訓練集∶測試集=7∶3時,支持向量機和隨機森林模型達到的性能得分最高,而XGB在訓練集∶測試集=6∶4時達到最優值。因此,在應用多種機器學習模型時,采用不同比例的樣本劃分是有必要的。隨機森林模型在不同比例樣本劃分下表現的更為穩定,各項性能指標間數值相差有限,在樣本比例為7∶3時,其OA值、P值、R值、F1值分別為0.92、0.94、0.95和0.94,綜合得分最高,超過在同樣本比例條件下的支持向量機模型,在OA、R、F1值方面也超過在樣本比例為6∶4的XGBoost模型。

表3 性能評價指標

綜合來看,相較于支持向量機與XGBoost,基于隨機森林算法的砂土液化預測模型準確率最高,性能穩定且具有良好的泛化能力,總體性能排序為RF>SVM>XGBoost。

隨機森林在訓練數據的過程中可以檢測到各個特征對分類結果的影響,特征重要性[22](feature importance)通過各影響因素進行權重打分而得到各影響因素排序,本模型選擇基尼不純度下降ΔG作為變量;置換重要性[23](permutation importance)通過打亂各變量后,計算誤差變化量大小進而得出排序,其變量為個別特征重要性ij。兩者的異同性如表4所示。兩者計算結果如圖10、圖11所示。在實際分析中,可考慮將兩種方法結合使用,以更全面地評估和理解特征對于機器學習模型的重要性。

表4 特征重要性與置換重要性的異同點

圖10 特征重要性排序

圖11 置換重要性排序

由于特征重要性、置換重要性的運算過程和評價指標不同,因此所得的排序結果也存在差異。綜合考慮后得出:錐尖阻力值、液化/非液化層埋深、上覆土層厚度是影響液化最重要影響因素,其中錐尖阻力值作為特征重要性與置換重要性最高值,表明是對模型影響的最關鍵因素,以上三個因素反映了土壤的軟硬程度及砂層埋深條件,因此有理由推斷土質情況是導致基督城發生液化的最主要原因,通過查文獻亦可知基督城土質與Waimakariri河、Heathcote河、Avon河形成的古河道區域及其周圍的沼澤區類似,這些區域地表被較新的礫石、沙子和淤泥沉積物覆蓋,為產生液化現象提供了重要條件[24-28]。其次是地表峰值加速度,地震動作為砂土液化產生重要前提,是不可或缺的動荷條件,考慮到本文中基督城地區范圍有限,因此特征差異性不顯著。通過查詢文獻[29-32]可知,基督城城區的地下水位雖然隨季節變化而增減,但絕大部分地區的地下水位較淺(深度為1~5 m),因此排名較為靠后。需要注意的是,因為本文考慮了選取因素的簡便性,所以不代表地下水位對液化的影響是可以忽略不計的,文獻[33]表明砂土導致的液化噴射沉積物與地下水壓力之間存在較強的空間相關性,因此也應作為一種重要因素考慮。

4 國內外液化判別方法對比

本文選取了Moss(2003)數據庫作為預測數據,將本文所建立的三種砂土液化模型、我國采用《巖土工程勘察規范》方法和國際上認可的Olsen方法五種方法進行結果對比,分析砂土液化模型的有效性。

4.1 規范法

目前我國使用最為廣泛的《巖土工程勘察規范》中的國家規范法(以下簡稱規范法)中包含有靜力觸探判別方法,其主要是依據唐山地震的實際震害資料得出的液化判別公式,使用雙橋試驗條件下飽和土靜力觸探錐尖阻力臨界值來做液化判別。判別表達式如下所示

qccr=qc0αwαuαp

(14)

αw=1-0.065(dw-2)

(15)

αu=1-0.05(du-2)

(16)

式中:qccr為飽和土靜力觸探錐尖阻力臨界值,MPa;qc0為地下水位dw=2 m,上覆非液化土層厚度du=2 m時,飽和土液化判別錐尖阻力基準值,MPa;aw為水位埋深修正系數,地下常年含水且與地下水存在水利聯系時取1.3;au為上覆非液化土層修正系數,深基礎時取1.0;ap為土性修正系數;dw為地下水位深度,m;du為飽和液化砂土層埋深,m。

當實測錐尖阻力值qc小于飽和土靜力觸探錐尖阻力臨界值qccr,即可判定為液化,否則判定為非液化。

4.2 Olsen方法

國際上主流的液化判別方法是循環剪應力比法,即土體在地震條件下產生的循環應力比(cyclic stress ratio,CSR)與相應動力條件下土體的抗液化應力比(cyclic resistance ratio,CRR)作數值比較。當CSR>CRR判別為液化,否則判定為非液化。CSR的計算公式為

(17)

1996年美國NCEER(National Center for Earthquake Engineering Research)專家組認可了基于CPT的Olsen判別方法,Olsen方法適用于所有土類情況,是一種使用更為廣泛的方法,其判別式為

(18)

(19)

4.3 歷史震害數據統計分析

Moss(2003)總結了從1964—1999年這35年中,世界各地共發生的19次地震砂土液化事件,數據全面、詳細且置信度高。

將歷史震害數據按照液化/非液化點區分,其中液化點139個,非液化點43個。繪制多Y軸柱狀圖可以直觀對比各烈度區內特征均值的變化情況,組內的誤差棒也反映了數據的偏離情況。按照現行GB/T-17742—2020《中國地震烈度表》[34]進行烈度劃分,對比圖12和圖13可知,液化點與非液化點的大部分特征基本呈現隨烈度區增加而增加的現象,對于地表峰值加速度,匯總統計知液化點以0.25g和0.4g最多,非液化點以0.17g最多,但兩者的均值在烈度區內差別不大。對于地下水位,由圖12和13可知,非液化區域的地下水位明顯低于液化區域的地下水位值,液化點集中在1~2 m,非液化點集中在2~3 m,因此均值差別較大,且由誤差棒知該特征的離散程度最大。上覆土層厚度與液化/非液化層埋深是所收集的五個影響因素中,液化/非液化點差別最不明顯的兩個特征,在各烈度區內基本呈現一致變化。錐尖阻力值的差距最為明顯,基本上非液化點的錐尖阻力均值為液化點均值的兩倍。

圖12 歷史震害數據集液化點特征分布

圖13 歷史震害數據集非液化點特征分布

矩陣散點圖可以快速發現成對變量之間的關系,通過矩陣圖中的箱線圖可知,地表峰值加速度、地下水位、上覆土層厚度、液化/非液化層埋深與錐尖阻力值的中位數分別為0.28g、2 m、3.4 m、4.45 m和3.9 MPa,同時,可以發現地下水位和錐尖阻力值存在較多異常值,說明歷史震害數據集中各地的地下水位置和土質軟硬程度區別較大。同時引用皮爾遜相關性系數進行數據分析,其主要描述了兩個變量之間線性相關強弱的程度。由圖14具體的相關數值可知,上覆土層厚度與液化/非液化層埋深呈現高度線性相關,地下水位與上覆土層厚度呈現顯著線性相關,地下水位與液化/非液化層埋深呈現低度線性相關,其余特征之間不存在線性相關性。

圖14 皮爾遜相關性分析

4.4 驗證結果對比

為了使計算更為系統、迅速,基于Python語言寫入了Olsen方法以及規范法判別公式。將已儲存完成的歷史震害數據導入到公式中進行判別并得到結果,以此進行傳統液化公式的準確率計算。

同時,將以新西蘭震害數據建立好的砂土液化預測模型,將SVM和RF的樣本比例劃分為7∶3,將XGboost樣本比例劃分為6∶4,使模型具備最佳超參數組合與最佳樣本比,引用.predict()函數進行驗證歷史震害數據并記錄,統計砂土液化預測模型的準確率,最終三種方法預測結果準確率如表5所示。

表5 液化驗證準確率對比

在與機器學習方法對比時,隨機森林準確率最高,且在各烈度區的準確率均超過支持向量機與XGBoost,其次是XGBoost模型,液化判別準確率略低于隨機森林,但仍超過規范法與Olsen方法,對于非液化點判別準確率較低。支持向量機模型對于歷史震害數據庫驗證準確率最低,證明了基于決策樹方法建立的模型對分類問題的優勢。

通過與國內外判別方法對比,隨機森林方法在液化點判斷準確率均較高且穩定,總體正確率為97.5%,為三種方法最高,在非液化點準確率為38.25%,高出Olsen方法6%左右,非常接近于規范法,證明隨機森林模型能夠達到與二者權威方法接近的準確率。此外,相較于無法判斷6度區液化情況的國家規范法,隨機森林模型適用范圍更為廣泛,準確率較Olsen方法更高。本文選取地震動峰值加速度、地下水位、上覆土層厚度、液化/非液化層埋深、錐尖阻力值作為特征要素,簡單易求,計算迅速,適用于動態數據及大數據運算,可作為一種良好的液化判別模型。值得注意的是,作為國際上通用的Olsen方法在判別8、9度區非液化點時準確率分別為6%和0%,判別過于保守,基本上不具備非液化判別能力,若以此結果進行布置抗液化工程則是不符合實際的。

5 靜力觸探判別的初判條件

5.1 錐尖阻力閾值的確定

通過參考GB 50011—2010/《建筑抗震設計規范》[35]中采用上覆非液化土層厚度和地下水位深度兩因素確定的液化初判公式,本文提出基于新西蘭震害數據、歷史震害數據和李兆焱等[36]的數據組成的734組新數據庫的靜力觸探初判條件(以下簡稱初判條件),即確定了在砂層埋深限制下錐尖阻力閾值。通過砂層埋深與錐尖阻力閾值即可快速判別液化情況,將 CPT進行烈度劃分如圖15~圖17所示,得出錐尖阻力閾值表如表6所示。

表6 錐尖阻力閾值表(僅適用于飽和砂土或粉土)

圖15 7烈度區閾值點分布

圖16 8烈度區閾值點分布

圖17 9烈度區閾值點分布

5.2 與規范法對比

通過與我國采用的規范法進行對比,選取新數據庫中的液化點作為驗證集,二者判斷液化的準確率如表7所示。經檢驗,初判條件在7度區、8度區、9度區的準確率分別為90%、98%和97%,與規范法各烈度區準確率接近,總體準確率與規范法相同。相比于基于唐山地震數據確定的規范法,初判條件可以作為一種更好的液化初判方法,優勢如下:①基于世界各地震害資料而建立,可信度更高,適用范圍更廣;②所考慮參數條件少且無需進行公式判別;③可解釋性強。

表7 液化判別準確率對比(僅液化點)

6 結 論

本文基于新西蘭地震液化數據,建立了可進行液化判別及預測功能的隨機森林模型,通過研究得出以下結論:

(1) 通過對新西蘭震害數據進行訓練、測試及性能評估后得知,隨機森林整體精度為0.92、精確率為0.94、召回率為0.95、F1值為0.94,為三種分類模型中性能最優的模型,說明隨機森林模型對數據的擬合及泛化能力較強,其次是XGBoost模型,最后是支持向量機模型。

(2) 選取了地震峰值加速度、地下水位、上覆土層厚度、液化/非液化層埋深、錐尖阻力值作為影響因素,分別代表動荷條件、埋藏條件及土質條件三大砂土液化前提。經過影響因素排序及閱讀文獻驗證可知,基督城地區產生地震液化的重要原因在于土質要素,其中以代表著土壤軟硬程度的錐尖阻力值特征為地震砂土液化的最主要原因。

(3) 將建立的模型使用Moss(2003)數據集進行驗證,通過與支持向量機、XGBoost、規范法、Olsen方法等方法進行預測結果對比可知,隨機森林模型在液化點判別總體準確率為97.5%,為五種方法中判別精度最高的方法,在非液化點判別總體準確率為38.25%,高出Olsen判別方法6%左右,非常接近于規范法。因此,相比于無法進行6度區判斷的規范法和非液化點判別準確率較低的Olsen方法,隨機森林適用范圍廣泛,要素簡單易取、計算迅速,避免了烈度劃分及復雜因素計算等諸多限制條件,證明了隨機森林模型在液化判別預測方向的可適用性及其優越性。

(4) 基于詳實的歷史液化震害資料得出不同烈度區的錐尖阻力閾值,通過與規范法進行驗證對比可知,靜力觸探初判條件具有準確率高、可適用性廣、無需計算等優點,可以作為一種準確快速的液化初判方法。

致謝

感謝新西蘭巖土工程數據庫為本文提供數據支持。

猜你喜歡
砂土液化準確率
乳腺超聲檢查診斷乳腺腫瘤的特異度及準確率分析
不同序列磁共振成像診斷脊柱損傷的臨床準確率比較探討
2015—2017 年寧夏各天氣預報參考產品質量檢驗分析
飽和砂土地層輸水管道施工降水方案設計
龍之中華 龍之砂土——《蟠龍壺》創作談
高速公路車牌識別標識站準確率驗證法
辨析汽化和液化
面部液化隨意改變表情
煤的液化原理及應用現狀
城市淺埋隧道穿越飽和砂土復合地層時適宜的施工工法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合