?

深度學習提高有效波高預報精度的實驗分析*

2024-02-28 11:46葉佳承于華明葛晶晶李松霖萬江岳
關鍵詞:波高海浪數值

葉佳承, 于華明,**, 葛晶晶, 李松霖, 萬江岳

(1. 中國海洋大學海洋與大氣學院, 山東 青島 266100; 2. 中國海洋大學三亞海洋研究院, 海南 三亞 572025; 3. 解放軍31110部隊)

有效波高是重要的海浪波要素,是衡量海洋動力災害的重要指標,在海洋工程設計中至關重要。有效波高的精準預報不僅能為海岸工程保駕護航,更能節省工程建設的成本,具有顯著的社會效應與經濟效應[1-2]。

當前有效波高預報主要依賴數值模式,該模式基于波浪生成、傳播、耗散的物理過程,對海浪進行數值模擬,獲得海浪的有效波高、平均周期等波浪信息,成為世界上研究海浪的最有力工具之一[3-4]。然而,當前數值模式仍無法準確刻畫海浪生消、反射、折射、繞射等復雜機制,此外強迫場的誤差,參數化方案的選取以及系統誤差等因素仍制約著數值模式的精度[5-6]。根據前人的研究,當前模式預報的有效波高均方根誤差(RMSE)在0.25~1.10 m之間[7-9]。由于中國東海近岸有效波高在2.50 m以下[10],這些數值模式誤差較大,無法忽略不計。為使數值模式能更好地應用于近岸區域的海浪預報,需要對預報結果進行優化與訂正。

目前,數值訂正方法主要有三種。第一種是完全預報方法(Perfect prognostic method,PP)。PP法認為模式輸出的值與實測值完全一致,然而數值預報結果與實際值之間存在偏差,故PP法訂正不可避免地產生誤差,對數值模式依賴較強[11]。第二種是模式輸出統計法(Model output statistics,MOS),即將后報的數值產品與預報要素的歷史數據通過統計的方式建立聯系,設計訂正經驗方程,預報的時候將結果代入方程中,進而進行訂正。MOS方法具有非線性映射較差的問題[12]。第三種是基于人工智能算法的訂正方法,該方法將神經網絡技術應用到訂正領域,利用神經網絡方法建立預報結果與實測數據的非線性關系進行預報,具有分布并行處理、非線性影射、自適應學習等特性,有著廣泛的應用前景[13-16]。本文主要基于神經網絡技術開展海浪有效波高的訂正方法研究。

神經網絡已廣泛應用于數據訂正中,例如,齊義泉等[17]結合了人工神經網絡(Artificial neural network,ANN)與第三代海洋數值模式,建立了臺灣北部的海浪數值預報訂正模型,使預報誤差減小了17.1%。Zhang等[18]將ANN與數值同化相結合,應用于西北太平洋的海浪模擬,有效提高了海浪模擬準確性。

綜合以上可以發現,使用神經網絡進行數據訂正具有可行性,而具有多層隱藏層結構的深度學習神經網絡訂正方案是否可行還有待實驗。與單隱藏層的傳統神經網絡相比訂正效果如何,是否能通過加入其他量提高訂正模型的訂正效果,這是本文探討的主要問題。

本研究主要基于董家口港的實測數據與近岸波浪模擬模式(Simulating wave nearshore model,SWAN)的數值模擬數據,采用深度學習長短期記憶(Long short-term memory,LSTM)[19]模型對該港口有效波高預報進行訂正。在數據與方法中,將介紹LSTM模型建立的詳細原理與實驗數據的相關信息;在結果與討論中根據相關系數(COR)、絕對平均誤差(MAE)、均方根誤差(RMSE)等相關指標對訂正結果進行評價。

1 數據與方法

1.1 數據選取

本研究使用的數據資料有兩種:

(1)董家口港區站點的海浪監測數據,經緯度坐標為119.78°E,35.58°N,采樣間隔為1 h,使用要素為有效波高與平均周期。該觀測站于2020年5月25日開始布設運行,截至2021年8月28日已獲取超過一年以上的海浪觀測數據。圖1為實測點位的具體位置。

圖1 董家口港以及潛標投放位置

(2)數值模擬數據采用SWAN海浪模式,對山東近海區域的有效波高等波浪數據進行數值計算。模擬區域為0°—55°N,94°E—155°E,空間分辨率為0.1°×0.1°,時間分辨率為1 h,預報時效為24 h;所用風場是通過氣象研究與預報模式(Weather research and forecast model, WRF)獲得,地形使用的是美國國家海洋和大氣管理局發布的全球水深地形數據ETOPO1。為得到站點預報數據,采用雙向線性插值的方式將數據插值到預報站點。

1.2 數據預處理

為使LSTM模型進行梯度下降處理時能盡可能快速的收斂最優點,需對數據進行歸一化處理。本研究中采用的歸一化方案為離差標準化,計算方式如下:

ji=(hi-hmin)/(hmax-hmin),i=1,2,…,n。

(1)

式中:ji是i時刻下的數據離差標準化的結果;hi是實測的i時刻海洋數據,本次實驗使用的要素是有效波高與周期;hmax和hmin是實測數據中的最大值和最小值;n為時間序列的長度。

1.3 LSTM網絡建立

1.3.1 LSTM網絡運行原理 LSTM是循環神經網絡(Recurrent neural network, RNN)網絡的一種變體,其神經元內部引入了一個新的狀態門Ct專門進行線性循環信息的傳遞處理,同時設置了非線性輸出信息給隱含層的外部狀態門ht記憶存儲單元,其計算方法如下式:

(2)結合遺忘門ft和輸入門it更新記憶單元Ct;

(3)結合輸出門ot將內部狀態的信息傳遞給外部狀態ht,并輸出數據yt。

圖2為LSTM網絡單元內部結構[20]。

圖2 LSTM網絡單元內部結構

1.3.2 LSTM模型方案設計 為訂正SWAN模式有效波高的預報結果,考慮到近岸區域水深與岸線對波浪的影響,挑選某一時段內的預報有效波高(Forecast significant wave height,FSWH)、預報平均周期(Forecast mean period,FMP)作為訓練數據的輸入變量,對應時段下的實測有效波高(Actual significant wave height,ASWH)為訓練數據中的輸出變量,其中單一時刻下實測有效波高對應該時刻下的一組預報有效波高與預報平均周期,這些數據經過歸一化處理輸入LSTM模型中進行訓練,流程為圖3所示。

圖3 LSTM網絡訓練流程

再選用另一時段下的預報有效波高與預報平均周期作為待訂正數據,采用訓練后的LSTM訂正模型進行訂正,獲得訂正有效波高(Correct significant wave height,CSWH),同時以相同時段下的實測有效波高作為驗證數據,通過訂正后的數據與驗證數據的RMSE、MAE與COR評價模型訂正效果。

本實驗設置的LSTM訂正模型有4層結構,存在1個輸入層,2個隱藏層與1個輸出層,隱藏層設置為100個神經元,網絡結構如圖4所示。該模型使用adam優化算法進行樣本訓練,訓練次數為2 000次,激活函數為sigmoid。選取2020年5月25日—2021年6月11日作為訓練時段,每小時1組訓練數據,共9 168組訓練數據,2021年6月12日—7月12日作為驗證時段,共720組驗證數據,LSTM模型的方案設定見表1。

表1 LSTM模型的方案設定Table 1 Scheme setting of LSTM model

圖4 LSTM網絡訂正流程

2 結果與討論

2.1 SWAN模擬結果與觀測數據對比結果

SWAN主要輸出的波浪要素為有效波高、平均周期與平均波向,其中由于研究區域靠近海岸線,根據海浪運動基本原理,該區域的波浪傳播方向常年與海岸線保持垂直,平均波向基本不變。因此,本文僅討論有效波高與平均周期的情況。

圖5為2020年5月25日—2021年7月12日實測有效波高與預報有效波高的時間序列圖。由圖可知,SWAN模式在董家口港的有效波高模擬結果比實際數據偏大,RMSE為0.26 m,而兩個序列存在較好的相關性,COR為0.76,滿足自由度為5,顯著性水平為0.05檢驗。從圖中可以發現,SWAN模式對海浪的生成、傳播復雜物理機制的模擬效果較好,故其模擬結果與實際數據的相關性較高,而SWAN模擬結果偏大的問題仍待解決。通過LSTM模型對SWAN模式的模擬結果進行訂正,有望提高SWAN模式模擬的準確性,彌補SWAN模式結果偏大的缺陷。

(散點圖紅色線代表觀測數據與預報數據完全吻合時的擬合線,黑色線為實際的預報數據與觀測數據的線性擬合線,黑線與紅線的夾角越小,兩組數據的吻合程度更高。The red line in the scatter diagram represents the fitting line when the observation data is completely consistent with the prediction data. The black line is the linear fitting line between the actual prediction data and the observation data. The smaller angle between the black line and the red line, the higher coincidence degree of the two groups of data.)

圖6為實測有效波高與預報平均周期的時間序列圖。為了更好的對比二者的時間序列,本文采用歸一化的方法,對兩者進行處理。由圖6可知,預報平均周期與實測有效波高存在一定的相關性,COR為0.59,相較于預報有效波高降低了0.17。

(散點圖紅色線代表觀測數據與預報數據完全吻合時的擬合線,黑色線為實際的預報數據與觀測數據的線性擬合線,黑線與紅線的夾角越小,兩組數據的吻合程度更高。The red line in the scatter diagram represents the fitting line when the observation data is completely consistent with the prediction data. The black line is the linear fitting line between the actual prediction data and the observation data. The smaller angle between the black line and the red line, the higher coincidence degree of the two groups of data.)

根據以上討論,預報有效波高與實測有效波高的相關性更高,采用預報有效波高進行神經網路的訓練更具合理性;而預報平均周期與實測有效波高存在一定的相關性,在訂正預報方面仍具有一定的應用潛力,因此本文采用二者結合的方式進行訓練。

2.2 LSTM訂正結果對模擬效果的改善

LSTM模型訓練階段,觀測數據和同期的SWAN模式結果相匹配,按照表1所列的計算方案進行訓練,從而建立了相應的LSTM模型。圖7、8為訂正結果對比圖,經過分析表明:經過訓練后的LSTM模型能有效提高SWAN模式結果的精確度,訓練后的有效波高的時間序列更接近觀測值,RMSE和MAE分別為0.15與0.10 m,降幅分別為34.6%與46.2%。

圖7 實測有效波高、預報有效波高與訂正有效波高的時間序列對比圖

圖8中右圖的夾角比左圖的夾角更小,即訂正有效波高與預報有效波高更吻合,誤差更小。訂正后的散點值明顯比預報散點值更低,證明深度學習LSTM能夠改善模式出現過大值的問題,彌補了SWAN模式結果偏大的缺陷。

2.3 其他訂正方案平行對比

2.3.1 預報周期在LSTM模型中的作用 為評估預報平均周期在LSTM模型的訂正效果,本研究重新構建了一套僅用有效波高進行訓練的LSTM訂正模型,第二套模型的設置與原模型相同,但輸入變量剔除了預報平均周期,方案設定如表2所示。在該方案的訂正下,RMSE降低為0.17 m,MAE為0.12 m,COR為0.76。圖9、10為有無周期訓練得到的訂正有效波高對比圖。

表2 第二套LSTM模型的方案設定Table 2 scheme setting of the second set of LSTM model

圖9 有無周期的訂正有效波高對比折線圖

圖10中右圖的夾角比左圖的夾角更小,表示有周期訂正有效波高與實測有效波高更吻合,且有周期訂正的RMSE、MAE均比無周期訂正的低,COR比無周期訂正的COR更高,表示有周期訂正的結果從數值與運動趨勢上都更加接近實測數據。

(紅色線代表觀測與預報完全吻合時的擬合線,黑色線為實際的預報與觀測的線性擬合線,黑線與紅線的夾角越小,兩組數據的吻合程度更高。The red line in the scatter diagram represents the fitting line when the observation data is completely consistent with the prediction data. The black line is the linear fitting line between the actual prediction data and the observation data. The smaller angle between the black line and red line, the higher coincidence degree of the two groups of data.)

對比圖10左圖與圖8左圖可以發現,僅加入有效波高作為輸入并不能很好的改善COR指標,而將預報平均周期納入輸入變量中,COR的改善效果極為明顯。COR是衡量兩組數據的運動趨勢的擬合程度,COR越高,兩組數據的運動趨勢越相似。因此,平均周期能有效提高LSTM模型的訂正效果,主要表現為對預報結果運動趨勢的訂正。

該現象體現了深度學習LSTM優秀的非線性映射能力。由于周期與波高為非線性關系,深度學習LSTM能夠通過自適應學習的方式模擬波高與周期的非線性關系,進而通過預報平均周期改善訂正結果,具體體現為對波高運動趨勢的訂正,具有更好的訂正能力。

2.3.2 相較于傳統方案的改善 為評估本實驗訂正方案,本文需要與傳統單隱藏層訂正方案的結果進行對比。國內學者通常采用人工神經網絡(Artificial neural network, ANN)的方法對海浪進行訂正,因此本實驗采用齊義泉于2005年使用的單層ANN神經網絡作為對比,配置方案與表1相同。在該方案的訂正下,RMSE降低為0.17 m,MAE為0.12 m,COR為0.76。根據ANN模型的訂正有效波高與加入周期后的LSTM模型訂正有效波高進行對比,結果見表3與圖11、12。

表3 ANN與LSTM模型的方案對比Table 3 ANN and LSTM model scheme comparison

圖11 ANN、LSTM訂正數據與實測數據對比折線圖

(紅色線代表觀測與預報完全吻合時的擬合線,黑色線為實際的預報與觀測的線性擬合線,黑線與紅線的夾角越小,兩組數據的吻合程度更高。The red line in the scatter diagram represents the fitting line when the observation data is completely consistent with the prediction data. The black line is the linear fitting line between the actual prediction data and the observation data. The smaller angle between the black line and red line, the higher coincidence degree of the two groups of data.)

由圖11、12可以發現,相較于ANN訂正方案,本實驗采用的訂正方案訂正效果更好,RMSE與MAE均小于ANN的訂正結果,COR大幅超越了ANN的COR,說明將預報平均周期與預報有效波高作為輸入的深度學習LSTM訂正結果從數值上與運動趨勢上都更加貼近實測數據。

傳統的ANN訂正方案中雖加入了預報平均周期,但COR沒有得到改善,證明傳統的單層結構對非線性關系的映射能力較差,無法很好的映射周期與波高的關系。而使用深度學習LSTM能夠通過加入其他相關變量,增強自身的訂正能力,具有更強的訂正潛力與能力,可更好的適用于近岸海浪預報中。

2.3.3 全實驗方案總結 表4匯總了本次實驗的全部結果。由表4可以看出,加入預報有效波高與預報平均周期的深度學習LSTM具有最好的訂正效果,與其他方案相比,COR的改善效果最為明顯。而只加入預報有效波高的深度學習LSTM與加入預報有效波高與預報平均周期的單隱藏層ANN二者訂正效果大致相同。

表4 各方案結果Table 4 Results of each scheme

只加入預報有效波高的深度學習LSTM由于缺少周期的加入,導致訂正效果降低;單隱藏層ANN無法很好的學習周期與波高之間的關系,導致其訂正效果與只加入預報有效波高的訂正效果大致相同。而加入預報有效波高與預報平均周期的深度學習LSTM能夠通過學習周期與波高之間的關系,獲得更好的訂正效果。這些現象證明,加入相關變量進行訂正將有效提高深度學習LSTM的訂正能力,深度學習LSTM訂正方案擁有許多未挖掘的潛力,具有廣闊的研究前景。

3 結論

本研究在現場觀測數據的基礎上,將LSTM方法應用在訂正近岸有效波高的模式結果中,獲取了更加精確的訂正結果,主要結論如下:

(1)SWAN模擬的有效波高與觀測有效波高存在差異,RMSE為0.26 m。而經過深度學習LSTM訂正模型的訂正,能有效地減小SWAN模式數據與觀測數據的誤差,使RMSE與MAE等指標分別下降至0.15和0.10 m,降幅分別為34.6%與46.2%,證明深度學習LSTM訂正模型具有很強的訂正能力。

(2)將平均周期從輸入變量中剔除,發現深度學習LSTM訂正模型的訂正效果下降,具體體現為COR下降了0.07。該現象表明,將平均周期納入輸入變量對LSTM訂正模型的訂正效果有明顯改善,主要體現在對COR的改善。將平均周期納入訓練變量中,與有效波高共同訓練訂正模型,能進一步提高有效波高訂正結果,COR提升了10%。

(3)與傳統訂正方案相比,深度學習LSTM訂正模型能夠通過加入相關變量提高訂正能力,證明該模型擁有許多未挖掘的潛力,具有廣闊的研究前景。

本研究證明深度學習可應用于近岸有效波高的數值模擬與預報的研究中,同時加入平均周期作為輸入變量可作為提高訂正精度的手段,為近岸海域設計波高的推算以及船舶泊穩領域的應用提供參考。

猜你喜歡
波高海浪數值
基于FHDI-GNWM 數據的全球超越概率波高宏觀分布特征分析
用固定數值計算
丫丫和小海浪
海浪
數值大小比較“招招鮮”
基于漂流浮標的南大洋衛星高度計有效波高研究
非平整港池的多向不規則波試驗研究
樊應舉
海堤設計波高計算
基于Fluent的GTAW數值模擬
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合