?

基于時間卷積網絡的長江下荊江航道水位預測

2024-01-12 12:55李有為舒章康
水利水運工程學報 2023年6期
關鍵詞:荊江豐水期站點

李 港,李有為,舒章康,張 宇,王 江,查 偉

(1.長江航道勘察設計院(武漢)有限公司,湖北 武漢 430040; 2.國家內河航道整治工程技術研究中心,湖北 武漢 430040; 3.南京水利科學研究院 水災害防御全國重點實驗室,江蘇 南京 210029)

水路運輸在國民運輸中有著極其重要的地位,航道水位是影響船舶通航安全的重要因素[1-2]。長江作為貨運量全球第一的內河航道,其下荊江河段蜿蜒曲折,河槽沖刷下切,通航條件相對較差[3]。因此,開展長江中游下荊江河段的水位預測研究,對保障船舶通航安全具有重要意義。

目前水位預測方法主要包括基于機理過程的水動力模型和基于數據驅動的統計模型[4-6]。水動力模型能夠較好地實現水位變化的精細模擬,陳煉鋼等[7]采用EFDC 模型模擬鄱陽湖的水位變化,提出適宜越冬水鳥的生態水位調控方案;戴凌全等[8]基于MIKE Flood 構建江湖一體化耦合水動力模型,實現洞庭湖白鶴棲息地水位波動的模擬。然而,水動力模型的構建需要非常完善的數據作為支撐,計算復雜,耗時較長,水位預測依賴于邊界條件的預測,易造成誤差累積,降低水位預測精度[9]。統計模型通過數理統計方法建立水位與影響因素之間的關系,進而實現水位的預測,計算效率高,操作簡便,得到了廣泛應用[10]。然而,早期的回歸方法難以刻畫水位與其影響因素之間的非線性關系,預測精度較低[11]。隨著機器學習的發展,人工神經網絡(Artificial Neural Network,ANN)[12]、支持向量機(Support Vector Machine,SVM)[13]等模型提高了水位預測精度,但均未考慮水位時間的相關性[14]。深度學習模型中的循環神經網絡(Recurrent Neural Network,RNN)可考慮短期歷史信息的影響[15],能有效提升水位預測精度,但其網絡結構仍存在梯度消失和梯度爆炸的問題,導致模型易陷入局部最優解或訓練無法收斂[16]。而長短時記憶神經網絡(Long Short-term Memory,LSTM)作為RNN 的變體,通過加入門控單元,實現了高精度的水位預報[17];郭燕等[18-19]利用LSTM 準確預測了洞庭湖和鄱陽湖的水位變化;Barzegar 等[20]基于LSTM 模型進行了不同尺度湖泊的水位預測,取得了較好的預測效果。時間卷積網絡(Temporal Convolutional Network,TCN)結構中的因果卷積和膨脹卷積可以將時間序列與歷史記憶有效結合,計算效率高,在部分時序任務的預測中取得了優于LSTM 的效果[21-22]。然而,目前在水位預測領域對TCN 模型的相關應用還有待進一步探索。

基于此,本研究以長江下荊江河段為研究對象,利用TCN 模型建立荊江下游河段水位站點的日尺度水位預測模型,同時構建相應的LSTM 和SVM 水位預測模型進行對比分析,探究TCN 模型在下荊江水位預報中的適用性,以期為航道內船舶通航安全提供技術支撐。

1 研究區域及數據資料

長江中游荊江河段起于湖北枝城,止于湖南城陵磯(圖1),全長約347 km。以藕池口為界,分為上荊江和下荊江,其中下荊江河長約175 km,屬于典型的彎曲型河道,由石首、調關及七弓嶺等10 個彎曲段組成,各彎道平均曲折系數為1.82,大部分屬于急彎河段,通航條件較差[23]。

圖1 研究區域及水文水位站點分布Fig.1 Study area and distribution of hydrological stations

研究選用的數據資料包括宜昌站、枝城站和沙市站2019—2021 年的逐日平均流量數據,以及石首站、調弦口站和監利站2019—2021 年的逐日平均水位數據,監測站點分布見圖1。建模前需對各站點的水位流量時間序列數據進行歸一化處理,消除數據量綱影響,加快模型訓練過程中的收斂速度。采用minmax 方法將數據歸一化至[0,1]。

2 模型與研究方法

2.1 模型基本原理

循環神經網絡(RNN)是處理時間序列任務回歸預測的重要手段,卷積神經網絡(Convolutional Neural Network,CNN)則主要用于解決圖像識別、機器視覺等相關問題。TCN 本質是一維卷積神經網絡針對時序問題的優化和改進,網絡結構見圖2(a),通過使用因果卷積,使TCN 能夠適用于序列建模,同時采用擴張卷積讓網絡能夠學到更長的時序依賴信息,避免歷史數據信息的丟失,即使不做任何池化操作也可增大感受野的范圍 ,使卷積核能夠學習更大范圍的信息,并且可以并行處理序列數據,所需訓練參數較少,計算效率較高[24-25]。擴張因果卷積的計算式為:

圖2 時間卷積網絡結構和基礎單元示意Fig.2 Structure of TCN and schematic diagram of TCN basic unit

式中:X={x1,x2, …,xt}為輸入的時間序列;F={f1,f2, …,fK}表示大小為K的卷積核,fK表示卷積操作中filter 的數量;d為擴張率。

此外,TCN 還增加了殘差連接,將數據跳過中間的卷積操作,經過 1×1 的卷積后直接與經過中間卷積操作的數據相加作為本層最終的輸出數據,可有效避免中間層堆疊導致模型在訓練過程中出現梯度消失的問題[26]。因果擴張卷積加上殘差連接構成了TCN 模型的基本單元,其結構如圖2(b)所示。

為了探究TCN 模型在水位預測中的適用性和優越性,同時構建了LSTM 模型及SVM 模型進行水位預測,并進行TCN 模型和兩者預報精度的對比分析。LSTM 結構主要包括輸入門、輸出門和遺忘門3 個門控單元,能夠緩解RNN 的梯度消失和梯度爆炸問題,是目前常用于時間序列回歸預測的深度學習模型[27]。SVM 是建立在統計學VC 維理論和結構風險最小化原理上的機器學習模型,能夠根據樣本在模型復雜性和預測學習能力之間取得最佳平衡,在水位預報領域得到了較為廣泛的應用[5,28-29]。

2.2 水位預測方法

研究以2019 年和2020 年流量水位數據為模型的訓練數據集,2021 年的水位數據為驗證數據集;采用宜昌站、枝城站及沙市站的日均流量,以及待預測站點的水位作為輸入數據,分別預測下荊江河段石首、調弦口及監利站2021 年的水位??紤]到下荊江各站點的水位與上游各站點的流量之間存在時間滯后,分別設置宜昌站、枝城站、沙市站3 個站點及待預測站點前1 d 至前10 d 共30 種滯時方案下的流量水位作為輸入,進行下荊江河段石首、調弦口及監利站未來1 d 的水位訓練與預測,以確定最優的輸入時間窗口,獲得最佳的水位預測效果。由于網絡訓練過程中,初始權重賦值的隨機性,會使模型的水位預報結果存在一定差異,因此,最終的水位預報結果為同一參數下進行10 次數值試驗的平均值。

本研究所有的數值試驗均在Windows 系統上(CPU: AMD R7-5800H@3.2GHz,GPU: NVIDIA GeForce RTX 3050Ti),采用Python 開發語言(3.6.12)基于TensorFlow(2.1.0)和Keras(2.3.1)深度學習框架實現。

模型選取納什系數(Nash-Sutcliffe Efficiency Coefficient,ENS)、均方根誤差(ERMS)及決定系數(R2)3 個指標進行石首、調弦口及監利站水位的模擬預測精度評價。

3 結果與分析

3.1 模型參數確定

3.1.1 模型超參數 超參數設置對模型的預報精度具有較大影響。模型采用的優化算法是適應性動量估計算法(Adaptive moment estimation, Adam),能自適應學習率加快網絡收斂速率,沿梯度的負方向更新參數,是目前深度學習中應用最為廣泛的優化算法[14];激活函數選用ReLU 函數,其優勢在于能夠快速訓練網絡,防止模型訓練過程中出現梯度消失問題[30];同時模型的Dropout 層以一定比例隨機丟棄神經元,能有效防止模型發生過擬合。此外,對模型性能影響較大的超參數還包括卷積核尺寸和卷積核個數。分別設置Dropout 為0.2、0.3、0.5,卷積核尺寸為2、3、4、5,以及卷積核個數為8、16、32、64,采用網格搜索法確定最優的參數組合;其余如初始學習、率膨脹因子等敏感性較低的超參數按照經驗值設置[31],最終TCN 模型的超參數取值見表1。

3.1.2 最優輸入時間窗 除了模型的超參數外,輸入時間窗口對水位的預報精度也有較大影響,因為流量和水位并不是同步變化,存在一定的時間滯后,進行模型不同輸入時間窗的優選計算,分析滯后時長對當前水位的影響程度,確定流量-水位之間最優滯后關系,進而獲得最佳的水位預測效果。本研究計算并比較了輸入時間窗為1~10 d 時各站點在訓練期和預測期水位的模擬預測精度,計算結果見圖3??梢?,不同時間窗下,TCN 模型在訓練期和測試期的水位模擬預測精度存在一定差異,各站點訓練期最優精度對應的輸入時間窗口與測試期的相同,模型訓練期和測試期模擬預測精度均較高,具有較好的一致性,不存在過擬合現象,這表明模型具有較好的魯棒性和泛化能力??傮w而言,TCN 模型在合適的輸入時間窗口下能夠獲得高精度的水位預測效果,監利站、調弦口站及石首站對應的最優輸入時間窗口分別為2、2 和3 d。

圖3 不同輸入時間窗口下3 個站點訓練期和測試期的水位預測效果Fig.3 Water level prediction in training and testing periods of three stations under different input time windows

3.2 不同模型預測精度分析

圖4 是TCN 模型在對應最優輸入時間窗口下,訓練期和測試期3 個站點未來1~3 d 的水位模擬預測結果??傮w而言,TCN 在下荊江不同水位站點處訓練期和測試期的水位預測值與實測值吻合較好,能較好捕捉水位的峰谷值。

圖4 TCN 模型在不同站點處未來1~3 d 的水位預測值與實測值對比情況Fig.4 Comparison of predicted and measured water level of TCN model at different stations in the next three days

表2 是TCN 模型與LSTM 模型及SVM 模型在不同站點處測試期的水位預測精度對比。整體上TCN 預測效果最好,SVM 預測效果較差。TCN 在監利站和調弦口站的3 個水位預測精度評價指標均略優于LSTM,但差異較??;在石首站的水位預測中,TCN 的ENS和ERMS略低于LSTM,R2優于LSTM,這表明TCN 模型對石首站水位的擬合程度較高,但預測的絕對偏差略大,兩種深度學習模型在下荊江河段3 個站點未來1 d 的水位預測精度均較高,在對應的最優輸入時間窗口下,ENS和R2均能達到0.995 以上,ERMS基本小于0.2 m。隨著預測時間尺度的增加,TCN 和LSTM 的預測精度均呈現不同程度的降低,TCN 在未來2 d 和未來3 d 的預測精度相較于LSTM 有了一定的提升,3 個精度評價指標結果均優于LSTM 模型??傮w而言,LSTM 的水位預測已達到較高精度,而TCN 的水位預測精度更高,這主要是因為LSTM 雖然通過門控單元緩解了RNN 的梯度問題,但遺忘門還是會以一定的概率丟棄歷史信息,當序列長度超過一定值后,仍會出現梯度消失問題[32],而TCN 反向傳播路徑是沿著網絡深度方向,而非LSTM 的序列時間方向,避免了LSTM 在過長時間序列上的梯度問題,能夠在一定程度上提高預測精度。

表2 TCN、LSTM、SVM 在不同站點處2021 年的水位預測精度Tab.2 TCN, LSTM and SVM prediction accuracy of water level in 2021 at different stations

3.3 不同時期預測精度分析

表3 是各站點TCN 模型水位預測結果在豐水期和枯水期不同區間絕對誤差出現天數,其中,豐水期統計時段為5—10 月,枯水期統計時段為11 月—翌年4 月。在未來1 d 的水位預測結果中,枯水期的絕對誤差基本小于0.2 m,而豐水期則基本小于0.5 m;未來2 d 和未來3 d 的預測結果中,預測精度隨預測時間尺度的增加呈降低趨勢,絕對誤差大于0.5 m 的天數增加,豐水期絕對誤差大于0.5 m 的最大出現天數為27,枯水期為13??傮w而言,各站點枯水期在不同時間尺度的預測絕對誤差均顯著優于豐水期,這主要是因為歷史數據中豐水期的水位流量高值數據相對較少,模型訓練過程中,為達到最優精度,預測結果會向樣本數量較多的枯水期低水位值趨近[33]。對于航道水位預測,保證枯水期的水位預測精度可以有效保障船舶的通航安全,而豐水期的水位預測可以在后續研究中通過加入更多年份的歷史數據進行模型訓練,進而提升豐水期水位預測精度。

表3 3 個站點未來1~3 d 預測結果不同區間絕對誤差在豐、枯水期出現天數Tab.3 The number of days with different absolute error in the next three days in dry season and wet season單位:d

4 結 語

本文利用TCN 模型進行了下荊江航道不同站點未來1~3 d 的水位預測,并與當前廣泛應用的LSTM和SVM 模型進行預測效果的對比,分析了TCN 模型在水位預測中的適用性和優越性,可為船舶通行安全提供技術支撐,主要研究結論如下:

(1)監利站、調弦口站及石首站對應的最優輸入時間窗口分別為2、2 和3 d 時,TCN 模型能夠獲得下荊江各站點未來1 d 的最佳預測效果,ENS和R2均大于0.995,ERMS基本小于0.2 m;但隨著預測時間尺度的增大,預測精度整體呈降低趨勢。

(2)TCN 模型和LSTM 模型的預測效果顯著優于SVM 模型,在水位預測領域具有較好的應用潛力,TCN 模型在不同時間尺度下的預測精度整體優于LSTM 模型。

(3)TCN 模型在枯水期的水位預測效果優于豐水期,枯水期各站點未來1~3 d 水位預測絕對誤差大于0.5 m 的最大天數為13,大部分時段水位預測的絕對誤差低于0.2 m,可有效保證枯水期的船舶通航安全。

猜你喜歡
荊江豐水期站點
用18S rRNA 高通量測序分析比較萬峰湖豐水期和枯水期生物多樣性
南寧市主要地表水系放射性水平及不同水期放射性水平研究
2016-2019年天橋區城鄉生活飲用水水質檢測結果分析
基于Web站點的SQL注入分析與防范
2017~2018年冬季西北地區某站點流感流行特征分析
頻率曲線在荊江三口輸沙量計算中的應用
首屆歐洲自行車共享站點協商會召開
怕被人認出
荊江航道整治工程完工長江航運“瓶頸”初步打通
滇池流域入湖河流水文形貌特征對豐水期大型底棲動物群落結構的影響
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合