?

基于PCA-ERBF-SVM的邊坡穩定性分析模型*

2022-09-19 07:37王曉敏
災害學 2022年3期
關鍵詞:邊坡水庫穩定性

姚 怡, 王曉敏

(西安科技大學 高新學院,陜西 西安 710109)

本世紀以來,全球科技發展突飛猛進,與此同時各種工程活動也在不斷加劇,水利工程建設活動便成為了全社會重點關注的對象[1-2]。而隨著水利工程建設過程中所涉及的技術水平越來越先進,對工程地質環境的破壞越來越嚴重,尤其是工程開發區域的邊坡穩定性成為了工程建設者和相關研究人員關注的焦點[3-4]。

從20世紀開始,學者們就已經逐步開展了對坡體穩定性的研究[5]。最初,人們將結構面相關理論引入到邊坡穩定性研究中,就此形成了巖體結構的雛形[6]。20世紀70年代開始逐漸轉向對邊坡變形的機理及失穩過程的研究[7]。直至21世紀初以來,隨著計算機技術和通信技術的發展,研究方法開始從傳統的定性研究向現代的定量研究轉變[8-9]。

近年來,有學者采用快速拉格朗日有限差分法對巖體變形的過程進行數值模擬建立本構方程[10],該方法雖然可運用于對各類材料,但其過程繁瑣計算復雜,實際并未得到廣泛應用;有研究人員利用Morgenstern-price極限平衡法針對尾礦壩邊坡進行穩定性計算[11],但該方法本身需要假設破壞面,過于依賴經驗;也有研究者借助神經網絡構建邊坡穩定性分析模型[12],但這種方法需要大量的工程數據且神經網絡本身具有不可避免的缺陷,如“黑匣子”問題等,這就造成當預測失敗時很難針對原因進行改進;有研究者基于因子分析和模糊理論對邊坡穩定性進行研究[13],該方法有效解決了神經網絡的不可解釋性,同時也在一定程度上避免了對于經驗的依賴,但求解權重的過程難以找到最優途徑;還有研究人員將網格搜索SVM應用于邊坡穩定性分析[14],盡管取得了一定的效果,但網格搜索過于耗時,不適合參數過多的情況。

為了改善以上研究方法的缺點,同時,考慮到影響邊坡穩定性的各因子之間可能具有相關性,這種相關性可能會使輸入變得復雜且影響分析效果,因此研究中采用主成分分析PCA結合擴展RBF核支持向量機建立邊坡穩定性分析模型,并通過免疫算法對模型參數進行優化,以提高邊坡穩定性的預測精度并縮短模型的訓練時間。

1 研究區概況

1.1 氣象水文

崆峒水庫建于甘肅省平涼市西部的中山區和涇河峽谷內,距平涼市區約12 km[15]。涇河源于六盤山,經大陰山后到達崆峒山,位居黃河中游,是渭河主要支流之一,該流域所屬為半濕潤半干旱氣候帶。降水主要集中于第三季度,年均降雨量約680 mm,幾乎占到該區域全年降雨總量的70%。水源主要來源于雨水,暴雨成為徑流的重要補給方式。徑流變差系數為0.5左右,其年際變化較大。

1.2 地形地貌

崆峒水庫是平涼市西部唯一具有調蓄能力的水庫,屬于不完全年調節水庫,目前以服務地方農業為主,兼顧市區生活和發電站供水[16]。該水庫類型為峽谷型,河流由南向北蔓延,谷底狀似V字型,兩側距離30~90 m,河床兩側距離10~25 m,河道兩岸地勢陡峭。崆峒水庫的西面是崆峒主峰,邊坡與河道近似呈90°夾角;水庫東面地勢略微平緩,邊坡坡角大約為30°~50°,水庫兩側山坡的相對高差為400~500 m。

1.3 水庫容量

水庫控制積水面積約602 km2,多年平均流量為3.59 m3/s,多年平均徑流量1.13×108m3。崆峒水庫總容量為2.97×107m3,死庫容量為6×106m3,有效庫容量為2.23×107m3,改擴建工程將庫容提升至4.57×107m3。

2 基礎理論

2.1 RBF核SVM

SVM的基本想法是在樣本空間中構造最優超平面,滿足該平面與樣本間的距離最大化,從而使其泛化能力得到增強[17]。圖1所示為SVM示意圖。

圖1 支持向量機

SVM以分類間隔最大化為主要目標,目前已發展為一種優越的回歸預測方法[18]。設系統輸入為n維(n>1),輸出為1維,樣本集T={(x1,y1),…,(xi,yi),…(xl,yl)},其中xi∈Rn為輸入變量,yi∈R為輸出變量,i=1,2,…,l。以f(x)=ω·x+b為例,允許擬合存在誤差的情況下,選用ε誤差不敏感函數,則軟間隔SVM可表述為:

minω,b,ξ(*)

(1)

2.1.1ν-SVM

由于ε難以預先指定,由傳統SVM發展來的ν-SVM有效地避免了這一問題[19]。其描述為:

minω,b,ξ(*),ε

(2)

式中:v∈(0,1]用于控制支持向量數量。采用拉格朗日乘子,可得上述問題的對偶問題:

(3)

求解上式可得(α,α*),對新的輸入變量x構造線性回歸預測函數:

(4)

(5)

由于邊坡穩定分析模型非線性的特點,因此樣本T幾乎無法位于超平面上,所以將輸入變量x映射至高維空間Φ(x)?;貧w預測函數可表示為:

(6)

對于一般的多輸入變量問題,由映射到的映射幾乎無法預先指定,故引入核函數K(xi,x)=(Φ(xi)·Φ(x))。當前常用核函數有Sigmoid核函數、徑向基核函數、多項式核函數等[20]。

2.1.2 ERBF-SVM

正是因為徑向基核函數擁有極強的逼近能力,現已被用于各種工程領域當中。當輸入變量x為d維時,RBF核形式如下:

K(x,x′)=exp(-(x-x′)TQ(x-x′))。

(7)

上式說明計算RBF核時各輸入變量的分量被賦予同樣的權值。而實際工程問題中顯然無法滿足以上條件,當輸出受多因子影響時,各因素對結果的貢獻是不一致的。為此,這里考慮對角矩陣Q為對稱正定陣的情況,可以證明,此時由式(7)確定的K(x,x′)仍然可以成為一個核函數。

研究中考慮Q為正定對角陣,其主對角元素qii>0,i=1,2,…,d為核函數參數,可通過2.2節的優化方式確定。以擴展RBF為核函數的支持向量機記為ERBF-SVM。

2.2 參數優化

為了訓練ERBF-SVM,需確定的參數包括C、v和qii。為了尋找最合理的參數組合Ab,結合免疫算法,以待定參數(C,v,q11,…,qdd)為抗體,以最終值為抗原,抗體可以自適應學習抗原,具體流程如圖2所示。

圖2 免疫算法流程圖

2.2.1 親和力

設樣本集T中含有l個樣本,將其按照(l-1)∶1的比例劃分為訓練集和驗證集,假定誤差為ei,則

(8)

(9)

抗體Ab的親和力為:

(10)

2.2.2 動態繁殖算子

已知抗體親和力和抗體間距離的前提下,為了確定抗體繁殖數量,引入動態繁殖算子。再在該算子中引入δ(抑制半徑)、pr(抑制概率),具有較高親和力的Ab可以有效抑制具有較低親和力的Ab,被抑制的Ab就無法進行繁殖。算法的具體流程如圖3所示。

圖3 優化算法流程圖

抗體的抑制范圍取決于的大小,也就是說,δ與抗體間最大距離相關。

δ=η×maxi,j=1,…,n(d(Abi,Abj))。

(11)

這里,d(Abi,Abj)表示Abi到Abj的Euclid距離。

(12)

這里,iter表示當前迭代次數,表示最大迭代次數。

3 模型建立

結合基礎理論,建立了基于PCA-ERBF-SVM的邊坡穩定性分析模型如(圖4)。模型建立步驟如下。

步驟1:選取邊坡失穩的致災因子數據集;

步驟2:對Step1中所選數據進行歸一化[21]處理;

步驟3:對歸一化處理后的數據進行PCA分析,從初始影響因子中提取出主要影響因子;

步驟4:將Step3中選取的因子數據隨機劃分為訓練樣本、預測樣本和驗證樣本,以Step3的結果為輸入,穩定性系數為輸出建立PCA-ERBF-SVM模型;

步驟5:利用遺傳算法對模型進行優化,確定參數;

步驟6:利用預測樣本的數據對經Step5后訓練好的模型進行預測;

步驟7:利用驗證樣本數據對模型進行驗證并對結果作出分析。

4 算例分析

SVM的計算速度由輸入數據的維度所決定,因各因子之間存在相關性,所以借助PCA來篩選出不相關的主成分并將其剔掉,使得所建模型的分析效果得以提升。

4.1 主成分提取

此處選取邊坡穩定性分析中常用的6個影響因子[22]構成模型輸入矩陣,具體參數及符號表示如表1所示。

表1 影響因子符號表示

以前文所述工程為例,隨機選取200組數據作為算例分析的樣本集,并按照180∶15∶5的比例將樣本集劃分為訓練集、預測集和驗證集。其中,預測樣本數據和驗證樣本數據如表2和表3所示。

圖4 模型建立流程

表2 預測樣本集

表3 驗證樣本集

表4 相關系數矩陣

對表2中的各因子數據做相關性分析,得到相關系數矩陣,如表4所示。

從表4可以看出,因子之間相關性在0.8以上的有8個,根據PCA原理[25]可以判斷,這些因子間存在一定相關性。如果以以上6個因子作為模型輸入,輸出的準確度勢必會收到影響,為了保證結果的準確性,需要對輸入數據的主成分進行分析。

通過SPSS軟件對預測樣本集中的輸入數據進行分析,得到成分矩陣如表5所示,方差如表6所示。

表6數據顯示,第一個主成分的貢獻率達83.571%,第二個主成分的貢獻率為12.905%,這兩個的累計貢獻率已占到總貢獻率的96.476%,可以有效反應出輸入數據的信息。

表5 成分矩陣

表6 解釋的總方差

表7 主成分因子載荷數據

再將表5中的數據通過Transform-computer變換,得到主成分載荷因子矩陣,如表7所示。

根據表7數據,寫出主成分表達式,如式(13)所示。

(13)

4.2 仿真實驗

采用傳統SVM進行邊坡安全計算時,由于輸入變量之間可能具有相關性且輸入數據維數過大,因此結合PCA與SVM構建模型并利用免疫算法進優化,以期對邊坡穩定性系數做出合理的分析。

根據邊坡模型的特點,選用ERBF核函數作為支持向量核函數,需要調整的參數共有4個:C、v、q11、q22。其中,0.001≤C≤1 000,0.001≤v≤1,0.001≤qii≤1,i=1,2。為了找到最優的4個參數,采用前文所述的免疫算法進行尋優,具體設置如表8所示。

表8 免疫算法參數設置

利用前文選取的180組數據分別對經PCA處理后的PCA-ERBF-SVM模型和未經PCA處理的ERBF-SVM模型進行訓練,采用預測樣本集中的15個數據對邊坡穩定系數進行預測,將兩種模型預測結果進行對比,如圖5所示。

圖5中實際值為采用圓弧滑動法計算所得,后文與此一致。從圖5可以看出,PCA-ERBF-SVM的預測結果更接近實際邊坡穩定性系數。顯然,預測效果比ERBF-SVM更好,說明采用PCA對輸入數據進行降維是很有必要的。

再依次選取訓練樣本集中的10組數據、20組數據、…、180組訓練數據,將PCA-ERBF-SVM的預測結果與目前研究中常見GA-BP神經網絡[23]進行比較,GA-BP的參數設置如表9所示,誤差如圖6所示,穩定性預測結果如圖7所示。

表9 GA-BP參數設置

圖6 不同訓練樣本數誤差對比

圖7 不同訓練樣本穩定系數對比

圖6中,PCV-ERBF-SVM表示PSV-ERBF-SVM的誤差曲線,GA-BP表示GA-BP神經網絡的誤差曲線??梢钥闯?,當訓練樣本數據較少時,二者的誤差均較大,隨著樣本的增加誤差均逐漸減小。但是當樣本數達到180個時,PSV-ERBF-SVM的誤差已經降至0.001以下,而GA-BP的誤差在0.01以上。這說明PSV-ERBF-SVM在處理小樣本集時更具優勢。

圖7中,PSV-ERBF-SVM-50、PSV-ERBF-SVM-100、PSV-ERBF-SVM-180分別表示樣本為50個、100個、180個時PSV-ERBF-SVM的預測結果,GA-BP-50、GA-BP-100、GA-BP-180分別表示樣本數為50個、100個、180個時GA-BP神經網絡的預測結果。從整體上看,樣本數越多,PSV-ERBF-SVM的預測值越接近于實際值,而GA-BP的趨勢則表現的不明顯,這也與樣本數較少有關,再次說明PSV-ERBF-SVM更適合小樣本集的數據處理。同時,PSV-ERBF-SVM-180的預測結果與實際值已非常接近,說明將PSV-ERBF-SVM模型用于邊坡穩定性分析是有可能的。

為了進一步分析該模型的有效性,用同樣的數據分別訓練傳統的網格搜索SVM模型(PCA-SVM)、一般RBF核SVM[24](PCA-v-SVM)、多尺度SVM[25](PCA-MS-SVM),分別以均方根誤差RMSE[26]、LOO誤差和訓練時間TIME為指標與擴展RBF核SVM(PCA-EBRF-SVM)的結果進行比較,如圖8和表10所示。

圖8 四種模型的預測效果

表10 四種模型的指標評價

從圖8可以大致看出,整體上PCA-ERBF-SVM和PCA-SVM的預測結果都十分接近實際值,在個別樣本點處,PCA-SVM的表現甚至更優于PCA-ERBF-SVM。PCA-MS-SVM的預測效果較弱,而PCA-v-SVM的預測值偏離實際值最遠。

表10數據表明,從誤差來看,PCA-EBRF-SVM和PCA-SVM的性能十分接近,PCA-ERBF-SVM并沒有表現出明顯的優勢,但從訓練時間來看,PCA-ERBF-SVM僅是PCA-SVM的4.16%,優勢相當明顯。隨著實際工程中所采集的數據越來越多,PCA-EBRF-SVM的優勢將更加明顯。

利用表3中所列的崆峒水庫五個測試點處的邊坡影響因子數據再次對PCA-ERBF-SVM模型的有效性進行驗證,分別與PCA-v-SVM模型、PCA-MS-SVM模型和PCA-ERBF-SVM模型進行比較,邊坡穩定性系數如圖9所示,絕對誤差如表11所示。

圖9 四種模型在不同測試點處的邊坡穩定性系數

表11 四種模型在不同測試點處的誤差

圖8曲線表明,PCA-ERBF-SVM在五個測試點處的結果最接近實際值,從表11可以看出,PCA-ERBF-SVM在五個測試點處的絕對誤差和LOO誤差均為所有模型中最小的。圖9和表11的結果再次驗證了PCA-ERBF-SVM在邊坡穩定性分析中的有效性。

5 結論

(1)本研究將PCA和擴展RBF核的支持向量機相結合構建PCA-ERBF-SVM邊坡穩定性分析模型,并通過免疫算法對模型中的參數進行了優化。首先通過PCA對輸入矩陣進行簡化,很大程度上減小了因影響因子間存在相關性所引起的計算誤差,然后利用化簡后的數據對邊坡穩定性進行預測,實驗結果證實了該方法的有效性。

(2)PCA-ERBF-SVM模型輸出的邊坡穩定性系數與RBF-SVM模型輸出的邊坡穩定性系數表明,經PCA處理后的預測準確率更高,誤差更小,表明將PCA算法對邊坡穩定性影響因子作用的有效性。

(3)PCA-ERBF-SVM模型與常用的GA-BP模型、PCA-SVM模型、PCA-v-SVM模型和PCA-MS—SVM模型分別進行對比,結果表明PCA-ERBF-SVM模型的輸出結果與實際值最接近,同時均方根誤差、LOO誤差和訓練時間也最小,研究區的驗證結果再次驗證了該模型的有效性和可行性。

(4)考慮到研究中所用工程數據的局限性,該模型的普適性還有待進一步驗證,后期還需通過更多的邊坡數據類型和樣本量對其普適性加以驗證。

猜你喜歡
邊坡水庫穩定性
漳河有一水庫群
一類k-Hessian方程解的存在性和漸近穩定性
SBR改性瀝青的穩定性評價
陡幫強化開采邊坡立體式在線監測技術研究
邊坡控制爆破施工
二維極限平衡法在高邊坡工程中的應用研究
出山店水庫
出山店水庫
半動力系統中閉集的穩定性和極限集映射的連續性
水利水電工程高邊坡的治理與加固探討
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合