?

基于時間序列與CNN-GRU的滑坡位移預測模型研究

2024-03-26 09:52符振濤李麗敏王蓮霞任瑞斌崔成濤封青青
人民珠江 2024年2期
關鍵詞:時間序列

符振濤 李麗敏 王蓮霞 任瑞斌 崔成濤 封青青

摘要:滑坡位移預測是滑坡預警的重要依據之一。針對以往預測模型在預測精度上存在的不足,提出了一種基于時間序列與卷積門控循環單元(CNN-GRU)的滑坡位移動態預測模型。首先,利用小波分析確定存在趨勢項位移后,利用指數平滑法對累計位移分解得到趨勢項與周期項位移,將趨勢項采用五次多項式擬合;之后,采用自相關函數檢驗位移的周期特征,利用灰色關聯法判斷各因子與周期項之間的關聯度,并將周期項與影響因子一起輸入CNN-GRU模型進行預測;最終,疊加得到累計位移預測值。以三峽庫區白水河滑坡為例,選取2004年1月至2012年12月數據進行研究,最終預測結果平均絕對誤差百分比僅為0.525%,RMSE為9.614、R2為0.993。試驗結果表明,CNN-GRU具有更高的預測精度。

關鍵詞:位移預測;時間序列;卷積門控循環單元;白水河滑坡

中圖分類號:X43文獻標識碼:A文章編號:1001-9235(2024)02-0001-08

Landslide Displacement Prediction Model Based on Time Series and CNN-GRU

FU Zhentao,LI Limin,WANG Lianxia,REN Ruibin,CUI Chengtao,FENG Qingqing

(School of Electronics and Information,Xian Polytechnic University,Xian 710600,China)

Abstract:Landslide displacement prediction is an important basis for early landslide warning.This paper proposes a prediction model of landslide moving states based on time series and convolutional gated recurrent unit (CNN-GRU) to deal with the shortcomings of previous prediction models.Firstly,after employing wavelet analysis to determine the displacement of the trend term,the exponential smoothing method is adopted to decompose the cumulative displacement to obtain two displacement types of the trend term and the periodic term,and the trend term is fitted by a five-order polynomial.Then,the autocorrelation function is utilized to test the periodic displacement characteristics,and the gray correlation method is applied to determine the correlation degree between each factor and the periodic term.Meanwhile,the periodic term and the influencing factor are input into the CNN-GRU model for prediction,and finally the predicted cumulative displacement value is obtained by superposition.By taking the Baishui River landslide in the Three Gorges Reservoir area as an example,this paper selects the data from January 2004 to December 2012 for study,and the average absolute error percentage of the final prediction results is only 0.525%,with RMSE of 9.614 and R2of 0.993.Experimental results show that CNN-GRU has higher prediction accuracy.

Keywords:displacement prediction;time series;convolutional gated recurrent unit;Baishui River landslide

滑坡是常見的自然災害之一,據國家統計局報告,2021年中國發生滑坡災害2 335起,占全年地質災害總數的48.9%,造成直接經濟損失數十億,因此通過歷史地質數據綜合判斷滑坡的演變工程,并對滑坡的變化趨勢做出預測成了防災減災的必要手段。

時間序列分解方法以其完善的理論獲得廣大學者的青睞。在趨勢項的分解上,楊背背等[1應用移動平均法,將白水河滑坡累積位移分解為周期項和趨勢項。黃海峰等2使用平滑先驗法分離了趨勢項位移,對白家包滑坡進行了預測,以上方法雖然取得了一定成果,但分離的趨勢項中仍然具有周期項的階躍特征,導致最終預測結果誤差較大。本文采用指數平滑法對實驗區累計位移進行多次分解,將最后一次分解的結果作為趨勢項,克服了傳統方法在階躍變化時分解得到的趨勢項仍具有明顯周期性的問題。

在周期項的預測上,鄢好等[3、宋麗偉4分別將循環神經網絡(RNN)改進的門控循環單元(GRU)與長短時記憶網絡(LSTM)引入滑坡位移預測,以上網絡通過增加“門”解決了RNN網絡梯度爆炸的問題,可以實現位移預測,但是考慮了滑坡變形的動態演化過程,單一網絡不能同時滿足特征提取與趨勢學習,導致其預測誤差較大,亟待改進?;挛灰频臄祿哂羞B續性、周期性[5等特點,CNN神經網絡能夠自動發現并提取輸入數據的波形特證[6。GRU神經網絡可以通過更新門和遺忘門實現對數據變化趨勢的學習[7,因此,本文將CNN-GRU網絡模型引入位移預測領域,提出基于CNN-GRU的滑坡位移預測方法。

本文以白水河滑坡為研究區,首先,利用小波分析確定存在趨勢項位移后,使用指數平滑法分解累計位移,對于趨勢項位移本文采用五次多項式進行擬合,得到趨勢項預測值;隨后,采用自相關函數檢驗位移的周期特征,引入灰色關聯度法量化影響因子與周期項位移間的相關性,保留具有較高關聯度的影響因子;之后,選擇CNN-GRU神經網絡進行周期項預測。將該結果和GRU、LSTM和CNN-LSTM預測結果一同與真實值作對比,從而驗證本文所使用模型的準確性。最后將周期項與趨勢項疊加得到累計位移預測值,并利用均方根誤差、平均絕對百分比誤差等評價方法分析計算預測精度。

1 滑坡位移預測模型

1.1 位移序列檢驗

a)趨勢項檢驗。小波變換是一種信號分析方法,它可以將信號分解成不同尺度的成分,從而更好地理解信號的頻率和時間特性。與傅里葉變換不同,小波變換可以同時提供時間和頻率信息,可以將信號分解成不同頻率的子信號,因此在處理非平穩信號時更為有效,見式(1):

式中 α——尺度,控制小波函數的伸縮;τ——平移量,控制小波函數的平移。

在累計位移中,趨勢項通常對應著低頻信號,如果存在趨勢項位移,那么整個信號的低頻部分會發生變化,因此可以通過小波變換檢驗是否存在趨勢項位移。

b)周期項檢驗。自相關函數(autocorrelation function)是一種用于衡量時間序列中自身相關性的統計量,是信號在時域中的平均度量,它用來描述隨機信號x(t)在任意2個不同時刻s、t的取值之間的相關程度,分析自相關函數值即可得到時間序列數據的是否存在周期項,見式(2):

式中 r(k)——自相關系數;cov(Xt,X{t-k})——Xt、X{t-k}之間的協方差;std(Xt)、std(X{t-k})——Xt和X{t-k}的標準差。

1.2 位移時間序列分解

滑坡位移按時間序列分解理論可分解為趨勢項位移與周期項位移[8,滑坡位移時間序列模型見式(3):

y(t)=ω(t)+c(t) ???(3)

式中 y(t)——累計總位移;ω(t)——趨勢項位移;c(t)——周期項位移。

由于研究區坡體不同年份階躍幅度變化較大,采用傳統方法得的趨勢項位移曲線仍具有明顯的周期特點,為了解決這個問題,本文引入指數平滑法對累計位移進行分解,將多次分解后的結果作為最終的趨勢項。

指數平滑法是一種特殊的加權平均法,其基本原理為對t期真實值和t-1期平滑值賦予不同的權重,從而求得當前平滑值的方法[9。指數平滑法基本原理為:

St=ayt+(1-a)St-1(4)

式中 St——第t期的趨勢項;yt——第t期真實值;St-1——第t-1期平滑值;a——平滑指數。

由式(4)可知,當a越接近1時,第t期平滑結果越接近第t期觀察值。

1.3 CNN算法

CNN網絡是一種深度學習模型,由于其具有局部區域連接、權值共享、降采樣的結構特點,使得其在圖像處理領域具有獨特的表現,并獲得了廣泛應用[10。本文針對位移數據建立了一維卷積神經網絡。CNN通過卷積核實現特征提取,具體步驟如下,首先初始化一個特征向量集M,然后在反向傳播中循環更新這個集合,讓其不斷逼近真實解,從而實現對位移數據的特征F的提取。一維卷積計算見式(5):

式中 xl-1J——l-1層第j個輸出;f——激活函數;wlij——卷積核的權重矩陣;xlj——l層第j個輸出;blj——偏置項。

1.4 GRU算法

GRU(Gate Recurrent Unit,門控循環單元)是為了解決RNN梯度爆炸問題[11而提出來的一種循環神經網絡。GRU模型在RNN基礎上引入了2個門:更新門和重置門。結構見圖1。

圖中的zt和rt分別表示更新門和重置門。其數學表達式為:

式中 ωr——重置門的權重;ωz——更新門的權重;tanh——雙曲正切函數;σ——sigmoid函數。

其中ωz、ωr、和ω0為需要訓練的參數。

1.5 CNN-GRU算法

滑坡位移數據在時間序列上具有連續性及周期性,單獨使用GRU神經網絡時,通過構建多個GRU單元雖然可以學習位移數據的變化趨勢,從而實現位移預測,但無法提取位移數據特征導致結果出現較大誤差。因此本文提出將CNN-GRU組合網絡應用于滑坡周期項位移預測中,首先通過CNN網絡提取輸入特征,構建時序性的特征向量,并將結果輸入到GRU模型中學習這些特征的時間變化趨勢[12,從而實現對滑坡位移的預測。

網絡結構見圖2。CNN部分本文設計了2層一維卷積層,卷積核數目分別為4、8,每次卷積后都對應一次最大池化,選取ReLU作為激活函數。在經過2次卷積、池化、扁平處理后,得到一維全局特征向量并將其作為GRU層的輸入,經過全連接層后輸出預測結果。將CNN與GRU相結合可以實現對位移數據時空特征的完整學習。

1.6 模型精度評價

本文采用均方根誤差(Root Mean Square Error,RMSE)、平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE)、決定系數(R-Square,R2[13以及絕對誤差指標評估模型預測精度。

2 白水河滑坡概況

2.1 工程地質概況

白水河滑坡地處湖北省秭歸縣,距離三峽大壩56 km,屬于三峽庫區范圍?;虑熬墰]入長江;左右兩側以基巖山脊為界[14;后緣以巖土分界處為界?;轮骰较蚣s為 NE20°,NS向長約 600 m,EW向寬約700 m,平均厚度30 m,體積約1.26×107m3,屬大型堆積層滑坡[15。白水河滑坡歷史上已發生多次較大的變形。2005年8月至2006年8月,滑坡地表多處出現下沉拉裂縫。2007年6月30日,預警區后緣發生較大規模坍塌。2009年8月,滑坡西部邊界裂縫呈羽狀斷續擴展。

2.2 滑坡特征分析

白水河滑坡平面見圖3,本文選取白水河滑坡區ZG118監測點數據進行研究。

通過整理實驗區自2004年1月至2012年12月的降雨量和庫水位數據,分別得到滑坡位移變化與庫水位、降雨量的關系見圖4、5,圖4顯示白水河滑坡在庫水位減少后往往會發生階躍性增長,如2008年12月至2009年8月,庫水位由170.5 m減少至152.8 m,位移由828.4 mm增加至1 072.8 mm。白水河滑坡變形也受降雨的影響,見圖5。每年6—9月為汛期,汛期時因為降雨滲入土壤,會破壞坡體水-土力學平衡[15,導致發生階躍性增長。

3 滑坡位移預測

3.1 趨勢項位移檢驗

小波分解中,信號被分解成多個子信號,每個子信號對應著不同頻率的成分。小波系數反映了每個子信號中不同頻率成分的能量大小,可以用來描述信號的頻率特征。如果小波系數在高尺度上較大,而在低尺度上較小,則說明存在趨勢項,依據式(1)編寫程序,計算各個尺度下的小波系數。第四層小波系數的最大值要大于低層小波系數最大值,故可知存在趨勢項位移,見圖6。

3.2 趨勢項提取及預測

本文取2004年1月至2012年12月的滑坡位移數據作為原始數據。由于需要取前12月位移均值作為平滑初值,在此步驟使用了2004年1月至2006年12月的數據,最終得到的趨勢項時間范圍為2007年1月至2012年12月。

3.2.1 指數平滑法

為了解決傳統方法提取的趨勢項仍然具有明顯周期性特點的問題,本文采用指數平滑法提取趨勢項位移,該方法分解結果由α取值決定,α的取值范圍為0~1,取值趨近于1時,平滑曲線與真實值越接近,曲線趨近于0時,曲線越接近直線。

不同α取值結果見圖7。測試中當α大于0.5后雖然趨勢項曲線更加平滑,但會失去滑坡位移特征。當α小于0.3時,得到的趨勢項位移中仍然具有周期項特征。所以,當α處于0.3~0.5時,分解效果最好。

指數平滑法使用次數越多,得到的曲線越平滑,但最終預測精度會受到影響。綜合考慮分解效果和預測精度,取α=0.35,平滑次數為3次。

趨勢項提取結果見圖8。只使用1次平滑時結果具有明顯的階躍變化,此時結果仍然具有周期性特征。重復使用3次平滑后,去除了累計位移中的周期性特征部分,取此結果作為趨勢項位移。

3.2.2 趨勢項位移預測

將分解得到的趨勢性位移的各時段數據進行五次多項式擬合,擬合計算式為:

y=a1x5+a2x4+a3x3+a4x2+a5x+a6(14)

式中 y——趨勢項位移預測值;a1、a2、a3、a4、a5、a6——多項式系數;x——從1至N依次取值。

計算得到的擬合函數公式見式(15)。

y=-1.62×105x5+0.002234x4-0.109x3+2.219x2+1.718x+703.9 ???(15)

趨勢項位移擬合結果見圖9,且計算可得均方根誤差(RMSE)為10.48 mm,虛擬優度R2為0.998 1,預測效果較好。

3.3 周期項位移預測

3.3.1 周期項檢驗

依據式(2)計算各時間段的自相關函數,計算結果見圖10。自相關函數會在一個周期時出現明顯的峰值,分析圖10可知,峰值出現在每年的12月份,因此位移數據存在周期項,并且周期為12個月,與現實相符合。

3.3.2 周期項位移提取

從累積位移中剔除趨勢項位移,即可得到周期項位移,見圖11。將2007年1月至2012年12月的位移分解為趨勢項與周期項,將2012年以前的數據作為訓練集,2012年1—12月數據作為測試集。

3.3.3 影響因子關聯度評價

一個灰色系統中,各個因素之間發展趨勢的相似或相異程度,稱為灰色關聯度[16。在演變過程中,如果兩者的變化顯示出較高的相似度,則認為兩者具有關聯。本文采用該方法計算單月降雨量、雙月降雨量等影響因子與滑坡位移變化之間的關聯度系數,從而判斷該因子是否會對坡體位移演變產生影響,各個影響因子與滑坡位移關聯度見表1。

當影響因子的關聯度超過0.6,即可認為該因子滑坡位移的推進起到正向作用。由此可知,降雨量與庫水位對位移變化量有相關性,因此本文將單月降雨量、雙月降雨量、庫水位高程、當月庫水位平均值作為CNN-GRU預測模型中的輸入數據,可以提高模型的預測精度。

3.3.4 周期項位移預測及結果對比分析

選用LSTM、GRU與CNN-LSTM 3種動態神經網絡與CNN-GRU做對比,4種神經網絡參數保持一致。

4種動態神經網絡對周期項位移的預測結果見圖12,基本上都能保持與周期項位移真實值保持一致。但是在階躍式劇增部分GRU與LSTM預測效果并不好。4種網絡預測效果排名依次為CNN-GRU網絡模型、CNN-LSTM網絡模型、GRU網絡模型、LSTM網絡模型。

各模型相對誤差誤差見圖13,評價指標結果見表2,具體分析如下。

a)在1—6月份未出現劇增數據前,4種預測模型都可以較好地跟隨位移真實值的變化趨勢。預測誤差普遍較小,最大誤差為LSTM網絡模型6月份的2.953%。6—7月,位移出現劇烈增長,此時LSTM網絡模型與GRU網絡模型誤差較大,分別為13.151%與10.656%。CNN-LSTM網絡模型誤差較小為6.84%,CNN-GRU網絡模型精度最高,誤差僅為3.789%。

b)7月之后位移進入遞減階段,分別于8、10月發生了2次較大幅度衰減,4種模型網絡均可跟隨變化,其中CNN-GRU的預測誤差最低,分別為-0.903%與-0.578%。

c)CNN-GRU的RMSE為4.986,MAPE為1.447%,R2為0.997。指標結果均優于其他神經網絡。

3.4 累計位移預測

將趨勢項位移預測值與周期項位移預測值疊加,即可得到滑坡位移累計預測值。累計位移及誤差見圖14,預測值能夠很好地跟隨實際值,平均絕對誤差百分比為0.525%,絕對誤差百分比最高僅為0.742%,RMSE為9.614、MAPE為0.525%、R2為0.993。預測結果顯示:CNN-GRU動態神經網絡對于滑坡位移的預測精度比較高,能夠很好地反映坡體的動態演化過程。

4 結論

本文將特征提取能力較強的CNN網絡和變化趨勢學習能力較強的GRU網絡相結合,提出了基于時間序列和CNN-GRU動態神經網絡的滑坡位移動態預測模型,并將此模型應于白水河滑坡監測點進行預測。

本文基于時間序列理論,使用小波分析與自相關函數分別檢驗滑坡位移的趨勢特征與周期特征,保證了后續研究的合理性與可行性。引入指數平滑法,將累計位移分解為周期項與趨勢項,相較于傳統的移動平均法,能夠保證得到的趨勢項更加平滑,且更符合客觀規律。對趨勢項位移采用五次多項式函數進行擬合,擬合結果能夠較好地跟隨趨勢項真實值演化過程。對周期項與各類影響因子采用灰色關聯度分析,得到對周期項有影響的因子分別為單、雙月降雨量、當月庫水位高程、當月平均庫水位。并采用CNN-GRU模型對周期項進行預測,將趨勢項預測結果與周期項預測結果疊加得到累計位移預測值,累計位移預測值平均絕對誤差百分比僅為0.525%,絕對誤差百分比最高為0.742%,RMSE為9.614、R2為0.993。取得了較好的位移預測效果,可以為相似滑坡體提供預警服務。

參考文獻:

[1]楊背背,殷坤龍,杜娟.基于時間序列與長短時記憶網絡的滑坡位移動態預測模型[J].巖石力學與工程學報,2018,37(10):2334-2343.

[2]黃海峰,易武,易慶林,等.滑坡位移分解預測中的平滑先驗分析方法[J].水文地質工程地質,2014,41(5):95-100.

[3]鄢好,陳驕銳,李紹紅,等.基于時間序列和GRU的滑坡位移預測[J].人民長江,2021,52(1):102-107,133.

[4]宋麗偉.基于經驗模態分解和LSTM模型的滑坡位移預測[J].人民長江,2020,51(5):144-148.

[5]張明岳,李麗敏,溫宗周.RNN與LSTM方法用于滑坡位移動態預測的研究[J].人民珠江,2021,42(9):6-13.

[6]楊飛,郝曉莉,楊建,等.基于多車型CNN-GRU性能預測模型的軌道狀態評價[J].西南交通大學學報,2023,58(2):322-331.

[7]彭偉,熊佳藝,江顯群,等.基于神經網絡的小型水庫洪水預報研究[J].人民珠江,2023,44(3):1-8.

[8]郭子正,楊玉飛,何俊,等.考慮注意力機制的新型深度學習模型預測滑坡位移[J/OL].地球科學:1-21[2023-12-05].http://kns.cnki.net/kcms/detail/42.1874.P.20220823.0908.004.html.

[9]南驍聰,劉俊峰,張永選,等.基于多源時間序列的滑坡位移動態預測[J].人民珠江,2023,44(4):54-62.

[10]王連云,陶洪峰,徐琛,等.基于多層訓練干擾的CNN軸承故障診斷[J].控制工程,2022,29(9):1652-1657.

[11]王錦濤,文曉濤,何易龍,等.基于CNN-GRU神經網絡的測井曲線預測方法[J].石油物探,2022,61(2):276-285.

[12]WAN J,FU J F,TAN D M,et al.Solar Flare Forecast Model Based on Resampling and Fusion Method[J].Research in Astronomy and Astrophysics,2022,22(8):240-250.

[13]李麗敏,張明岳,溫宗周,等.基于奇異譜分析法和長短時記憶網絡組合模型的滑坡位移預測[J].信息與控制,2021,50(4):459-469,482.

[14]陳銳,范小光,吳益平.基于數據挖掘技術的白水河滑坡多場信息關聯準則分析[J].中國地質災害與防治學報,2021,32(6):1-8.

[15]喬素云,馬云彪,尹思杰,等.基于巖土參數變異特性的三峽庫區白水河滑坡失穩概率分析[J].中國地質災害與防治學報,2018,29(5):38-43,51.

[16]程立文,黃生志,李沛,等.耦合二次因子篩選和深度學習的徑流預報研究[J].人民珠江,2023,44(6):41-52,69.

(責任編輯:李澤華)

猜你喜歡
時間序列
基于分布式架構的時間序列局部相似檢測算法
基于嵌入式向量和循環神經網絡的用戶行為預測方法
醫學時間序列中混沌現象的初步研究
基于時間序列分析南京市二手房的定價模型
云南銀行產業集聚與地區經濟增長研究
基于Eviews上證綜合指數預測
上證綜指收益率的影響因素分析
基于指數平滑的電站設備故障時間序列預測研究
基于時間序列的我國人均GDP分析與預測
基于線性散列索引的時間序列查詢方法研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合