?

基于EMD-LSTM耦合模型的趵突泉巖溶地下水水位預測應用

2023-09-11 07:17侯金霄黃林顯胡曉農邢立亭
水資源與水工程學報 2023年4期
關鍵詞:趵突泉巖溶分量

侯金霄, 黃林顯, 胡曉農, 錢 永, 邢立亭, 韓 忠, 梁 浩

(1.濟南大學 水利與環境學院, 山東 濟南 250022; 2.中國地質科學院 水文地質環境地質研究所, 河北 石家莊 050061; 3.山東省第六地質礦產勘查院, 山東 威海 264209; 4.山東省國土空間生態修復中心, 山東 濟南 250014)

1 研究背景

趵突泉屬于濟南市四大泉群之一,位于濟南泉域北部中心地區。自20世紀50年代以來,趵突泉流量總體呈衰減趨勢[1],近幾年在降水量較少時期,趵突泉水位常在黃色警戒線(水位降至28.15 m)波動,甚至逼近于紅色停噴預警線(水位降至27.60 m)[2-3]。因此,準確預測趵突泉水位對濟南泉域保護和巖溶地下水的開發利用具有重要意義。但由于巖溶含水介質具有強烈的不均一性和各向異性,使其水位動態體現出非線性及非平穩波動特征,使得水位預測結果易產生較大誤差[4]。過去幾十年間,國內外學者探討了各種方法來進行巖溶地下水水位預測,如:趙丹等[5]在對蘭村泉域巖溶地下水水位埋深進行預測時選用了灰色GM(1,3)模型(grey model (1, 3)),平均預測準確率為87.79%;郭藝等[6]通過構建時間序列分析法對趵突泉水位進行預測,發現當采用逐日數據進行短時間序列預測時具有較高的精度;張鄭賢等[7]構建了差分整合移動平均自回歸(autoregressive integrated moving average, ARIMA)模型對濟南趵突泉地下水水位進行預測,結果表明該模型預測精度優于灰色模型。陳奐良等[8]對趵突泉水位進行預測時,構建了多個BP(back-propagation)神經網絡預測模型,預測結果證明加入GA(genetic algorithm)或Levenberg-Marquardt訓練方法的神經網絡模型具有更高的預測精度。以上研究雖然探討了不同方法在巖溶地下水水位預測中的應用,但均存在一定的局限性:GM模型法預測時易受到地下水系統隨機性的影響,造成中長期預測精度較差;時間序列類模型僅是對歷史數據變化趨勢的簡單擬合,無法考慮外部因素(如降水、開采量等)變化帶來的影響;ARIMA模型易受數據波動影響,在對巖溶地下水水位預測時存在較大的局限性;BP神經網絡僅為淺層神經網絡,不具備長時間記憶功能,通常只適用于短時間序列地下水水位的預測[9]。

深度學習方法在近年來發展迅速,長短期記憶(long short-term memory,LSTM)神經網絡模型由于具有長時間記憶功能并能有效解決梯度爆炸問題而得到廣泛應用[10-11]。閆佰忠等[12]對泰安市岱岳區地下水水位進行預測時建立了單、多變量LSTM模型及BP模型,并通過對比得出多變量LSTM模型的預測精度更好。但LSTM神經網絡模型存在對具有非平穩波動特征的時間序列(如巖溶地下水水位)預測精度低、尤其是在數據突變處預測誤差較大的問題。

綜上所述,本文采用一種基于經驗模態分解(empirical mode decomposition,EMD)和LSTM神經網絡的巖溶地下水水位EMD-LSTM耦合預測模型,該耦合模型已在河流水量水位預測、降水量預測、洪水預測等方面得到有效應用[13-15]。EMD-LSTM耦合模型首先利用EMD將不平穩的巖溶地下水位數據分解為有限個較平穩的分量,有效降低了原始時間序列的非線性及波動性特征;其次構建了多變量LSTM預測模型,利用與巖溶地下水水位動態密切相關的降水量、氣溫值、最高氣溫值、最低氣溫值和水汽壓值(月平均數據)對分解后的平穩分量分別進行預測;再累加重構各分量預測結果,實現對巖溶地下水水位的預測。

2 數據來源與研究方法

2.1 研究區及數據來源

濟南市位于魯中山地與魯北平原的過渡帶,地勢南高北低,南部邊界由太古代變質巖為主的泰山余脈區域構成,東部以東塢斷裂為界,西部以馬山斷裂為界,北部邊界以奧陶紀、第四紀石灰巖為主。因受地形影響,濟南市地下徑流沿地形坡向自南向北流動,從南部補給區到北部排泄區均有泉水出露,其中以上升泉趵突泉最為有名[16]。趵突泉所在區域水文地質狀況如圖1所示。

圖1 趵突泉區域水文地質狀況

據前人研究可知,濟南巖溶地下水的動態變化與降水量、氣溫和水汽壓等氣象要素緊密相關[17-18]。因此分別選取表征地下水補給項動態變化的降水量和表征地下水排泄項動態變化的氣溫(包含月平均氣溫值、月最高氣溫值和月最低氣溫值)、水汽壓作為地下水水位預測模型的輸入數據。本文利用趵突泉2012年5月至2021年12月的月均水位及同時間段的月均氣象數據作為預測模型的研究數據,其中水位數據來自于濟南市城鄉水務局網站(http://jinan.gov.cn),氣象數據來自于中國氣象科學數據網(http://data.cma.cn)。降水量和地下水水位的動態變化如圖2所示。

圖2 2012年5月至2021年12月研究區降水量及地下水水位動態變化

通過圖2可以看出,二者動態變化基本一致,均表現出明顯的周期性(周期為12個月),以上動態特征說明降水是含水層的主要補給來源。

選用地下水水位數據與氣溫、降水和水汽壓值進行互相關分析,分析結果如圖3所示,其中最大時滯值為20個月。根據圖3中虛線之間的95%置信區間檢驗的時滯值可以看出,水位的動態變化分別滯后于氣溫、降水、水汽壓2~3個月、2~3個月、1~2個月時其相關系數最大。以上分析說明,巖溶地下水水位的動態特征主要受各氣象要素的影響,因此可以利用氣象要素對巖溶地下水水位進行預測。

2.2 經驗模態分解

經驗模態分解(EMD)是一種新型信號分解方法,該方法自適性強,能夠依據原始信號本身的特征,在不需要設置基函數的前提下對其進行處理[19-20],這也使得EMD非常適用于對非平穩和非線性特征數據的前期處理[21-22]。EMD的本質是將不平穩的原始序列分解為有限個較平穩波動的序列,包括本征模函數項(intrinsic mode function, IMF)和殘余項,從而降低原始序列的復雜程度[23]。EMD的算法步驟如下:

首先輸入原始信號x(t),根據三次樣條及所識別出的所有極大、極小值點繪制極大、極小值包絡線,并計算二者平均值m1(t),用x(t)減去m1(t)得到較低頻率的新信號h1(t)。

此時判斷通過以上步驟獲得的h1(t)信號是否能滿足IMF分量確定的假設條件,滿足時h1(t)成為可以獲取的第一個IMF分量;如無法滿足則將得到的h1(t)作為新的待分解序列返回上一步驟進行處理,再得到一個新分量h2(t),然后對h2(t)做同樣的判斷和處理。假設經過K次后求得的結果滿足定義,則求得的第一項IMF分量C1(t)為:

(1)

r1(t)為原始信號中減去一個高頻信號的新信號,其計算公式如下:

r1(t)=x(t)-C1(t)

(2)

重復上述步驟n次,直到得到第n階IMF分量Cn(t)以及余量rn(t)。最終的EMD可以表示為:

(3)

2.3 長短期記憶神經網絡

LSTM神經網絡模型由Hochreiter等[24]于1997年提出,具有長時間記憶功能,能夠有效解決梯度爆炸問題。一個LSTM單元包括遺忘門(forget gate)、輸入門(input gate)和輸出門(output gate)3個門[25]。LSTM模型計算流程如下:

(1)遺忘門。決策刪除不重要的信息,其計算公式如下:

ft=σ(Wfxt+Ufct-1+bf)

(4)

(2)輸入門。和tanh函數共同控制輸入多少新信息,其計算公式如下:

it=σ(Wixt+Uict-1+bi)

(5)

(3)輸出門??刂戚敵龆嗌傩畔?其計算公式如下:

ot=σ(Woxt+Uoct-1+bo)

(6)

(4)3個門控系統ft、it、ot組合公式為:

st=ft⊙St-1+it⊙tanh(Wsxt+Wsct-1+bs)

(7)

ht=ot⊙tanh(st)

(8)

式中:ft、it、ot分別為遺忘門、輸入門、輸出門;Wf、Wi、Wo、Uf、Ui、Uo為權重項;bf、bi、bo為偏置項;σ為激活函數; tanh為雙曲正切激活函數;st表示cell單元; ⊙表示矩陣以元素相乘。

2.4 EMD-LSTM耦合模型

本文所采用的EMD-LSTM耦合模型的算法流程如圖4所示。

圖4 EMD-LSTM耦合模型算法流程圖

具體步驟如下:

(1)對巖溶地下水水位數據進行經驗模態分解,得到有限個趨勢項和一個殘余項,將不平穩的水位數據分解為有限個較平穩波動的分量,從而降低原始序列的復雜程度,實現序列平穩化。

(2)構建多變量LSTM神經網絡預測模型,將密切影響研究區地下水水位動態變化的降水量(補給項)和氣溫值、水汽壓值(排泄項)作為輸入項對各平穩分量分別進行預測。

(3)累加步驟(2)中的預測結果獲得地下水水位預測值。

2.5 模型評價指標

為了評估所構建EMD-LSTM模型的預測精度,采用均方根誤差RMSE作為評價指標,其值越接近于0,表示模型的預測精度越高。RMSE定義為:

(9)

3 結果與分析

3.1 經驗模態分解及結果

利用經驗模態分解法對2012年5月至2021年12月趵突泉巖溶地下水月均水位數據進行分解,將不平穩的地下水水位值分解為有限個平穩波動的分量,其中包含4個IMF分量和1個殘余項,分解結果見圖5。

圖5 2012年5月至2021年12月研究區巖溶地下水月均水位經驗模態分解圖

由圖5可知,巖溶地下水水位數據經EMD后,分量1的頻率最高、波動性最強,隨著分解階數的增加,分量的頻率不斷變小,分量2、3、4及殘余項呈現出峰值減少、頻率降低、坡度變緩的規律,并逐漸趨于平穩。因此經EMD后,水位數據的非平穩性大幅降低,能夠有效減少水位波動性帶來的預測誤差。

3.2 LSTM模型構建

本文所構建的LSTM模型為3層多變量神經網絡模型,每層神經元個數為80個。由前文互相關分析可知,地下水水位在滯后氣象要素1~3個月時相關性最大,因此采用前兩個月氣象數據對當月地下水水位進行預測。本次研究選用2012年5月至2021年12月趵突泉區域月均數據,包括降水量、氣溫值、最高氣溫值、最低氣溫值和水汽壓值作為LSTM神經網絡模型輸入數據,并將訓練集和預測集按照大致4∶1的比例進行劃分(如表1所示)。同時,為驗證EMD-LSTM預測模型的有效性及精確性,分別將其與未進行EMD的單一LSTM模型和差分整合移動平均自回歸模型ARIMA進行對比。ARIMA模型是一種時間序列預測分析方法,其通過參數估計和擬合逼近觀測值來建立數學模型,以此來實現對輸入序列的評價預測。

表1 LSTM神經網絡模型訓練和預測集劃分

3.3 結果分析

(1)訓練集結果分析。EMD-LSTM耦合模型、LSTM神經網絡模型和ARIMA模型對訓練集的預測結果RMSE值分別為0.261、0.307和0.329 m,可見3種模型中EMD-LSTM耦合模型的RMSE值最小,說明其與巖溶地下水水位的擬合效果最佳。

(2)預測集結果分析。EMD-LSTM耦合模型對預測集水位各分量的預測結果如圖6所示。通過對比各分量的預測曲線可以發現,分量1的預測曲線與原始數據曲線擬合度較低,預測效果最差,分析其原因主要是由于分量1作為高頻分量,具有較強的不平穩性,從而導致LSTM神經網絡模型對其難以獲得較精準的預測結果,而分量2、分量3、分量4和殘余項的波動性均顯著降低,因此其預測效果較好。由此可以進一步看出,通過EMD將波動性較強的水位數據分解為平穩性更高的分量數據能夠顯著提高LSTM模型的預測精度。

圖6 EMD-LSTM耦合模型對預測集水位各分量的預測結果

將4個分量和1個殘余項的預測結果進行累加,獲得地下水水位數據的預測值。EMD-LSTM耦合模型、LSTM神經網絡模型和ARIMA模型預測結果的RMSE值分別為0.290、0.402和0.724 m,表明EMD-LSTM耦合模型的預測誤差最小,預測效果最好,其次為單一LSTM神經網絡模型,ARIMA模型的預測效果最差。

3種模型的地下水水位預測值與觀測值動態曲線對比如圖7所示。由圖7可以看出,EMD-LSTM耦合模型和單一LSTM神經網絡模型預測得到的地下水水位變化曲線與實際觀測曲線變化較為一致,分析其原因是由于這兩種模型的輸入變量均與水位變化密切相關,充分考慮了補給和排泄兩方面多種因素的影響,因此能夠有效提高預測精度。而ARIMA模型僅是對歷史數據趨勢的簡單擬合,未考慮外部因素的影響,因此造成預測誤差較大。此外,由于經EMD后水位分量的波動性顯著降低,使得EMD-LSTM耦合模型相較于單一LSTM神經網絡模型在水位突變處也能實現較好的擬合,與實際水位的波動趨勢更加接近。

圖7 3種模型的地下水水位預測值與觀測值動態曲線對比

以上結果說明,EMD-LSTM耦合模型通過EMD將不平穩的巖溶地下水水位原始序列分解為有限個較平穩的波動序列,能夠有效減少水位數據的非線性和不平穩波動特征,從而顯著提高LSTM神經網絡模型的預測精度。

3.4 討 論

孫虹潔等[26]利用LSTM模型對濟南市巖溶地下水水位進行預測時,得出該模型能夠較為準確地實現水位預測,但是在水位突變處誤差較大的結論。本文通過構建EMD-LSTM耦合模型進行巖溶地下水水位預測,利用EMD有效減小水位波動帶來的影響,從而提高預測精度,并與單一LSTM神經網絡模型、ARIMA模型預測結果進行對比,取得了一些有益成果,但仍存在一些問題值得進一步討論:

(1)受數據收集困難的限制,本研究僅收集到2012年5月至2021年12月的趵突泉區域月均地下水水位和氣象數據,相對較短的時間序列會在一定程度上影響3種模型的預測精度。

(2)本文構建的預測模型輸入項包括降水量、氣溫值和水汽壓值,沒有充分考慮其他影響地下水水位動態變化的因素,如復雜賦存條件等的影響,也會對耦合模型的預測精度產生影響。

(3)在模型結構方面,本研究沒有深入討論模型構建層數以及單層神經元個數變化對預測精度的影響。

在今后的研究中,一方面需要收集更長時間序列的數據并考慮增加其他地下水水位影響因子作為模型的輸入數據,另一方面還要充分考慮模型結構和參數設置對預測精度的影響,以進一步提高模型的預測精度。

4 結 論

由于巖溶地下水水位具有非線性和非平穩波動特征,造成水位預測結果易產生較大的誤差。本文通過構建EMD-LSTM耦合模型,首先利用EMD將不平穩波動的水位數據分解為較穩定的4個IMF分量和1個殘余項;再利用降水量值、氣溫值和水汽壓值作為LSTM神經網絡模型的輸入項分別對各個分量進行預測,以此達到提高預測精度的目的。采用濟南市趵突泉2012年5月至2019年12月的月均水位值和月均氣象數據進行模型訓練,并利用2020年1月至2021年12月的月均氣象數據對地下水水位進行預測,得出以下結論:

(1)EMD-LSTM耦合模型、LSTM神經網絡模型和ARIMA模型對地下水水位預測結果的RMSE值分別為0.290、0.402和0.724 m,說明EMD-LSTM耦合模型的預測精度最高,ARIMA模型的預測精度最差。

(2)EMD-LSTM耦合模型能夠很好地體現出地下水水位的豐枯變化,在水位突變處也能實現較好的擬合,與實際水位動態相接近。

(3)EMD-LSTM耦合模型預測精度高的原因主要有以下兩方面:一方面EMD-LSTM耦合模型能夠通過EMD將不平穩的巖溶地下水水位原始序列分解為有限個較平穩的波動序列,使得水位數據的非平穩性大幅降低,有效減小了水位波動帶來的預測誤差,從而提高耦合模型的預測精度;另一方面,通過將與地下水水位動態密切相關的降水量(表征補給項)及氣溫、水汽壓(表征排泄項)作為LSTM神經網絡模型的輸入變量,不同變量之間相互作用、相互驗證,也有效提高了預測精度。

猜你喜歡
趵突泉巖溶分量
某石灰巖礦區巖溶涌水治理處理方法
帽子的分量
探討巖溶區高速公路勘察技術方法
趵突泉
神奇的趵突泉
論《哈姆雷特》中良心的分量
分量
高密度電法在巖溶區隧道勘察中的應用
趵突泉水位近十年同期最低 濟南啟動“保泉行動”
基于瞬時對稱分量法的三相四線制D-STATCOM控制研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合