?

基于LSTM和先驗知識的高速公路路面溫度預報

2024-01-29 10:38熊國玉包云軒3王可心
應用氣象學報 2024年1期
關鍵詞:氣象站時效準確率

熊國玉 祖 繁 包云軒3)* 王可心

1)(南京信息工程大學氣象災害預報預警和評估協同創新中心, 南京 210044) 2)(中國氣象局交通氣象重點開放實驗室/南京氣象科技創新研究院, 南京 210009) 3)(無錫學院江蘇省物聯網設備超融合應用與安全工程研究中心, 無錫 214105)

引 言

高速公路路面溫度變化是交通氣象條件的重要指標,是目前交通氣象災害研究的重要內容之一。路面高溫易導致路面大面積損壞,對車輛和駕駛員產生負面影響[1],增加出現交通事故的風險。路面低溫則易導致瀝青路面開裂[2],在特定天氣條件下可能出現路面白霜、結冰、積雪等,減小路面摩擦系數,加長車輛制動距離,易引發交通事故,嚴重影響交通安全和運輸效率[3]。因此,準確預報路面溫度,及時進行路面狀況預警,提醒相關人員采取防御措施,對保障人民生命財產安全具有重要意義。

目前,路面溫度預報方法主要有3種:理論模型法、數值模擬法和統計分析法[4-5]。理論模型法基于地表能量平衡、熱量收支和水分收支等原理建立路面溫度變化機理模型[6-8],模型利用氣象和地理環境要素對地表溫度變化進行數學物理建模,通過解決計算問題預測未來溫度變化。然而,由于該類模型依賴于經驗假設而非嚴格求解偏微分方程,其結果可能與實際存在差距。數值模擬法則將計算域劃分為元素,并在各元素上求解熱傳導的偏微分方程[8-9],該方法對計算資源和模型輸入要求較高,限制了其廣泛應用。統計分析法通?;谂c路面溫度變化相關變量的統計關系,開發數學關系模型,而非求解傳熱偏微分方程[10],該方法的優點在于模型簡單、參數和數據易于獲取、便于應用,學者們多采用統計分析法構建路面溫度預報模型[4]。

統計分析模型主要包括線性回歸模型[11-12]和非線性回歸模型[12]。線性回歸模型簡單,預報準確性有待提升,因此人們引入了正弦函數模型[13]、自回歸求和滑動平均模型[14]、GIS技術[15-16]等,研發了多種非線性回歸模型,有效提高了預報準確性。近年隨著人工智能技術的快速發展,人們將機器學習方法應用于路面溫度預報。與傳統統計分析模型相比,機器學習算法可選擇更為復雜的函數對原始數據進行處理。1997年首次將反向傳播神經網絡(back- propagation neual network,BPNN)應用于路面溫度預報[17],此后采用人工神經網絡[18]、BP神經網絡[19]、支持向量機[20]、隨機森林[21]、梯度提升回歸樹[22]等方法進行路面溫度預報,取得顯著效果。目前,機器學習算法在路面溫度預報中通常使用交通氣象站觀測數據建模。而近年將先驗知識融入機器學習模型已成為提升預報性能的重要方法之一[23],如路面溫度受傳熱理論和熱量平衡方程的影響,與輻射、潛熱、感熱等因素密切相關[4],同時呈現明顯的日變化[24]和季節變化[25]。將這些先驗知識融入機器學習模型有望顯著提升路面溫度預報性能。此外,目前的機器學習算法應用于路面溫度預報主要集中在未來1個時次的單步預報,較少涉及多步預報。多步預報有助于更好地捕捉序列變化的趨勢和周期性,更貼近交通氣象短時臨近預警的需求。

據此,本文以2019—2022年南京市4個高速公路交通氣象站觀測數據為基礎,結合ERA5-land再分析數據引入物理機制先驗知識,通過特征工程技術考慮路面溫度的日變化、季節變化以及溫度變化趨勢,建立結合先驗知識的長短時記憶網絡(long-short-term memeory network,LSTM)多步路面溫度預報模型,預報未來3 h逐10 min的路面溫度。同時,將已建立的模型應用于其他5個交通氣象站,探討模型的適用性,從而應對因新建或設備維護導致歷史數據樣本量較少的交通氣象站路面溫度預報問題。研究結果有望為高速公路路面溫度產品的精細化氣象服務和高低溫災害預警提供技術支持。

1 數據與方法

1.1 數 據

1.1.1 交通氣象站觀測數據

本研究所使用的交通氣象站數據均來源于江蘇省高速公路交通氣象監測系統,觀測要素包括氣溫、路面溫度、10 cm路基溫度、相對濕度、風向、風速、能見度以及降水量。選取南京市繞城高速公路(編號G2503)沿線9個交通氣象站,包括馬群站(M9126)、六合南站(M9293)、橫梁站(M9513)、老山站(M9516)、高旺橋北站(M9518)、東善橋站(M9520)、上坊站(M9521)、北象山隧道北站(M9522)和陳橋樞紐站(M9526)(圖1)。其中,M9518、M9520、M9522和M9526 4個站用于建立和驗證模型, 2019—2021年數據作為訓練數據集,2022年數據作為驗證數據集。其他5個站則以2022年數據進行模型適用性檢驗。此外,本研究使用中國國家基礎地理信息中心研發的30 m分辨率全球土地覆蓋數據(GlobeLand30數據)[26],將1 km半徑內人造下墊面占比高于45%的交通氣象站定義為城市氣象站,低于20%的交通氣象站定義為鄉村氣象站,介于20%和45%之間的交通氣象站定義為城郊氣象站[27],用于研究不同下墊面背景對模型效果和適用性影響。根據該分類方法,M9126、M9521和M9522 3站為城市氣象站,M9293、M9518和M9520 3站為城郊氣象站,M9513、M9516和M9526 3站為鄉村氣象站。為保證數據的科學性和有效性,對所有數據進行10 min平均處理,并進行閾值控制、異常值剔除、缺失數據插補等質量控制。

圖1 南京市繞城高速公路交通氣象站地理位置分布

本文插圖中所涉及的行政區域界線基于審圖號為GS(2019)1822號標準地圖制作,底圖無修改。

1.1.2 再分析數據

本研究采用ERA5-land再分析數據,選取與路面溫度變化密切相關的8個物理變量,包括裸土蒸發量、地表反射率、地表土壤溫度、地表潛熱通量、地表凈太陽輻射、地表凈熱輻射、地表顯熱通量和地表總蒸發量。該數據通過重新運行ERA5再分析模型中的陸地組分生成[28],空間分辨率為0.1°×0.1°(約9 km)[29]。采用線性插值方法將ERA5-land小時分辨率數據插值為10 min分辨率數據[30],并采用最鄰近點法空間匹配再分析數據與交通氣象站數據[31]。

1.2 LSTM模型設計

LSTM模型是1997年提出的一種改進型時間遞歸循環神經網絡(recurrent neural network,RNN)[32]。與傳統RNN相比,LSTM模型有效解決了RNN中存在的長期依賴問題,并一定程度上緩解了訓練長序列時出現的梯度消失問題[33]。

本研究建立的LSTM路面溫度預報模型包括輸入層、LSTM層、全連接層和輸出層。為了避免過擬合,模型引入隨機丟棄層(dropout),并采用tanh函數作為激活函數。在測試中發現多層LSTM模型性能提升有限,計算效率卻顯著降低。因此,本研究選擇采用單層LSTM模型。進一步采用網格搜索法,認為當驗證集誤差和訓練集誤差趨于穩定且二者接近時,模型結果最優[34]。通過試驗,確定最佳超參數:隱藏層數為1,隱藏層神經元數量為64,丟棄率為0.01,訓練批次大小為128,迭代次數為500。

目前,多步預報主要采用直接法、遞歸多步預報法、直接遞歸混合多步預報法和多輸入多輸出預報法4種模型策略[35]。本研究為了提高預報精度和模型效率,采用多輸入多輸出預報法。模型的訓練和預報均基于滾動窗口的原則進行有監督學習[35]??紤]到路面溫度的短時預報需求,本研究選擇未來3 h的路面溫度作為預報目標。通過測試,確定最優輸入步長為6 h。

1.3 模型方案設計

在深度學習領域中,數據和特征工程占據相當重要的地位。經過特征工程處理后的數據決定了數據挖掘的潛力上限,而模型的作用則在于最大程度地利用這些數據[35]。本研究通過引入與路面溫度變化密切相關的再分析物理量,結合對原始數據集的理解,人工構建時間序列特征,以期使模型達到最佳性能。經過測試,主要構建以下4種時間序列特征:①時間特征拆解,將原始時間變量拆分為月、日和小時變量;②時間序列趨勢特征,引入10 min、1 h、3 h及6 h的路面溫度變化量;③時間序列聚合特征,引入最近24 h路面溫度平均值及標準差;④周期性時間特征,采用獨熱編碼形式,定義09:00—12:00(北京時,下同)為路面溫度上升時段,13:00—16:00為路面溫度最大值時段,17:00—次日04:00為路面溫度下降時段,05:00—08:00為路面溫度最小值時段。由于各個特征具有不同的量綱和單位,為了提高模型精度,所有數據均采取標準化處理,對風向以整數形式進行離散化處理[23]。

針對不同的輸入變量組合,本研究設計5種模型方案,具體方案如表1所示。

表1 模型方案設定

1.4 模型評價指標

為了檢驗模型的預報效果,本文采用均方根誤差、平均絕對偏差[36]、預報準確率[21,37]及TS評分[38]4個統計指標。其中預報準確率為預報值與觀測值差值的絕對值不大于3 ℃的次數與觀測總次數之比,該值越大表示預報效果越好。

2 結果與分析

2.1 模型預報能力評估

使用本文構建的模型對M9518、M9520、M95-22、M9526 4個交通氣象站的路面溫度進行模擬預報。每種方案下模型各運行5次,并取平均值作為最終統計結果。計算5種方案不同預報時效的模型評價指標(圖2)。不同交通氣象站的同一方案模型表現出相似的預報性能,但不同方案間存在較大差距。方案1模型表現最差;方案2模型預報效果略好于方案1,表明物理機制相關數據輸入模型,效果優于觀測數據;方案3和方案4在引入時間序列特征變量或物理機制相關變量后,模型預報性能均有一定提升,其中方案4的提升效果更為明顯;方案5在引入時間序列特征變量和物理機制相關變量后,表現出最佳預報性能,其準確率為85%~99%,平均絕對偏差為0.54~1.81 ℃,均方根誤差為0.74~2.98 ℃。這表明增加輸入特征有助于全面考慮周圍環境的影響[39],增強了LSTM模型的特征提取能力,從而實現更精確的路面溫度預報。隨著預報時效的延長,4個交通氣象站的預報準確率下降,平均絕對偏差和均方根誤差增加。預報時效小于60 min時,各方案間準確率差異不大。但當預報時效超過60 min時,各方案間的差異逐漸顯現。方案1的預報準確率急劇下降,而方案5的下降速度最為緩慢。預報時效為1 h時,方案5相較于方案1,準確率提升8%~15%;預報時效為2 h時,準確率提升16%~27%;預報時效為3 h時,準確率提升22%~36%。表明隨著預報時效的延長,方案5的效果提升最明顯。

圖2 4個交通氣象站不同方案預報能力評估

為全面檢驗預報效果,以交通氣象站M9522為例,對預報時效較短的1 h和較長的3 h兩個時效進行深入分析。2022年交通氣象站M9522路面溫度在大部分時間為3~35 ℃,但最低可達-5 ℃,最高可達63 ℃。對于1 h時效的預報(圖3),各方案間預報準確率相近,方案5表現最優,方案1最差。對于擬合斜率,方案5的擬合線斜率最高,為0.97,其他方案也在0.9以上。對于散點分布,方案5的散點分布相對集中,5種方案散點均呈現上寬下窄特點,即在路面溫度低于35 ℃時,預報性能明顯優于高于35 ℃的情況。這可能是因為樣本主要分布在0~40 ℃范圍內,而高于40 ℃的樣本較少,導致模型在訓練對高溫情況的擬合不足,影響預報準確性。

圖3 2022年交通氣象站M9522 1 h預報時效5種方案模型預報效果及對比(a)方案1,(b)方案2,(c)方案3,(d)方案4,(e)方案5,(f)各方案預報能力評價指標對比(各指標均進行歸一化處理)

對于3 h時效的預報,5種方案的預報效果較1 h時效的預報效果明顯下降(圖4)。對于散點分布,3 h時效的預報結果分布更為離散,且等值線上的點減少。方案1、方案2和方案3的模型散點分布呈S型趨勢,即30 ℃以上的散點集中在等值線下方,預報值偏低,而10 ℃以下的散點集中在等值線上方,預報值偏高。這表明高溫時預報溫度偏低,低溫時預報溫度偏高,對實際路面溫度預報應用存在較大局限性。方案3和方案4相較方案1的預報效果均有一定提升,尤其是方案4表現更優。這說明引入時間序列特征變量后,對于較長時效的預報效果提升明顯。與前4種方案相比,方案5的預報效果最為優越,但當路面溫度高于35 ℃時預報效果較差。

圖4 同圖3,但為3 h預報時效

2.2 路面極端高低溫狀況下模型預報能力評估

交通氣象應用尤其關注路面極端高溫和低溫的預報效果。根據相關行業標準,路面溫度高于55 ℃時為高溫[40],低于0 ℃時為低溫[41],這兩種情況均對交通運行產生不利影響。鑒于此,本研究采用效果最佳的方案5模型,選取測試集中M9518、M9520、M9522、M9526 4個交通氣象站高于55 ℃和低于0 ℃的極端溫度樣本進行評估(表2)。由表2可見,低溫狀況下模型表現出色,1~3 h時效內預報準確率均高于90%,TS評分也均高于0.4。而高溫狀況下各交通氣象站的預報效果普遍較差。這是因為路面高溫受多種因素影響且變化迅速[1]。除了交通氣象站M9518外,其余交通氣象站在1 h時效內的表現均相對較好,預報準確率在60%左右,TS評分在0.5以上。交通氣象站M9518因為前期高溫樣本較少,導致模型對高溫擬合不理想。同時還注意到,不同交通氣象站的極端高低溫預報效果存在明顯差異,特別是鄉村氣象站M9526的預報效果明顯優于其他城市氣象站和城郊氣象站。

表2 低溫和高溫路面狀況下方案5準確率和TS評分

挑選測試集4個交通氣象站24 h內路面溫度出現小于0 ℃且無缺測數據(2022年2月21日)以及高于55 ℃且無缺測數據(2022年8月8日)的個例,評估模型在路面極端溫度狀況下的預報效果。

2022年2月21日凌晨4個交通氣象站夜間路面溫度持續降低,08:00達到最低且低于0 ℃。對于1 h時效,4個交通氣象站路面極端低溫的預報表現較好,預報準確率均達到97%以上,平均絕對偏差平均值約為0.7 ℃,均方根誤差平均值約為0.88 ℃(表3)。隨著預報時效的延長,預報效果均有所下降。3 h時效的預報準確率約為96%,平均絕對偏差約為1.2 ℃,均方根誤差約為1.42 ℃,模型仍保持較好的預報效果。此外,模型可準確預報4個交通氣象站的路面最低溫度及其出現時間(圖5)。而在當日路面溫度出現最高值的11:00—14:00,預報出現明顯偏差。隨著預報時效的延長,這種偏差更加明顯,但偏差多在3 ℃以內,總體預報結果仍較理想。

表3 路面極端低溫和極端高溫個例中方案5模型評估

2022年8月8日11:00—16:00 4個氣象站的路面溫度均高于55 ℃。路面極端高溫情況下模型預報能力有所下降。對1 h時效,4個氣象站的預報效果尚可。其中,交通氣象站M9520和氣象站M9522的預報準確率在88%以上,平均絕對偏差約為1 ℃,均方根誤差不高于1.5 ℃(表3)。然而,對更長的預報時效,模型的預報效果明顯下降。除交通氣象站M9518外,其余3個交通氣象站路面最高溫度出現時間預報超前約為1 h且預報值偏低4 ℃(圖6)??傮w上,極端高溫的預報存在一定挑戰,但模型仍能提供有用的預報信息,對于交通管理和安全決策仍具有應用價值。

2.3 模型空間普適性驗證

本研究利用已建立的4個交通氣象站方案5模型對其他5個交通氣象站進行路面溫度預報,驗證已建立模型的適用性,同時解決數據完整性較差的氣象站路面溫度預報和缺測路面溫度的插補問題。

從預報效果看,模型預報能力有所下降,尤其在較長預報時效時表現更為顯著(表4)。從模型選擇看,下墊面類型對預報效果產生明顯影響。具體而言,對于城市氣象站(M9521、M9126),基于城郊氣象站M9518、氣象站M9520的模型預報效果最優。對1 h時效,預報準確率超過86%;對3 h時效,預報準確率超過68%。對于城郊氣象站(M9293),應用城郊氣象站M9520建立的模型預報效果最佳。對1 h時效,預報準確率為84%;對3 h時效,預報準確率為66%。對于鄉村氣象站(M9513、M9516),應用鄉村氣象站M9526建立的模型預報效果最佳。對1 h時效,預報準確率超過84%;對3 h 時效,預報準確率超過62%。這說明對于歷史數據較短的交通氣象站,可以通過遷移應用具有相似下墊面背景類型的交通氣象站已建立的模型實現路面溫度預報。

表4 模型遷移應用預報效果評估

3 結論與討論

本文使用物理機制相關變量融合、引入時間序列特征等5種方案,建立多元多步LSTM路面溫度預報模型,預報未來3 h逐10 min路面溫度,并對不同方案下及路面極端高低溫條件下的預報結果進行檢驗,并驗證模型適用性,得到以下結論:

1) 加入時間序列特征和先驗物理知識顯著提升了LSTM模型的預報效果,尤其是同時引入兩者后模型準確率達到85%~99%,且隨著預報時效延長,提升越明顯,準確率最高提升36%。表明增加先驗知識有助于模型更全面考慮周圍環境的影響,增強了LSTM模型的特征提取能力,模型能夠從路面溫度的歷史變化及物理機制方面更深入、更貼近實際考慮路面溫度變化,實現路面溫度預報更精確。

2) 對于路面極端溫度的預報,模型在低溫預報方面表現出色,準確預報了路面低溫極值及發生時間。模型的高溫預報能力相對較弱,且隨著預報時效延長,效果顯著降低。對于路面最高溫度的預報提前大約1 h,且預報偏低約4 ℃。這可能是由于路面極端高溫樣本相對較少,模型在訓練過程中未能充分擬合。

3) 應用已建立的模型預報其他交通氣象站的路面溫度準確率超過62%,預報時效較短時預報效果較佳,準確率可達80%以上。鄉村氣象站的預報效果明顯優于城市和城郊氣象站,特別是預報時效延長時,優勢更加顯著。

4) 模型選擇方面,交通氣象站的下墊面類型對模型選擇起關鍵作用,城郊氣象站模型在城市氣象站和城郊氣象站的預報效果相對最優,鄉村氣象站模型在鄉村氣象站的預報效果相對最優。因此,推測只需選擇1個城郊氣象站模型和1個鄉村氣象站模型就能在很大程度上滿足南京周邊高速公路的路溫預報需求,有助于有效解決數據質量較差的交通氣象站路面溫度預報和缺測路面溫度的插補問題。

與以往研究相比,目前路面溫度預報主要集中在高溫或低溫兩個方向,而本研究旨在開發一種同時適用于高低溫且能進行多步預報的模型,以擴展模型應用范圍。但需要指出的是,該模型對路面溫度的短時波動預報存在一定局限性,觀測發現云量等因素對路面溫度短時波動影響較大,未來研究需更細致地考慮這些影響因素,以實現對路面溫度短時波動的準確預報。此外為改善極端高溫預報效果,可以嘗試通過增加高溫樣本量或提高模型對極端路面溫度的敏感性進行改進。

猜你喜歡
氣象站時效準確率
珠峰上架起世界最高氣象站
乳腺超聲檢查診斷乳腺腫瘤的特異度及準確率分析
不同序列磁共振成像診斷脊柱損傷的臨床準確率比較探討
2015—2017 年寧夏各天氣預報參考產品質量檢驗分析
心靈氣象站
高速公路車牌識別標識站準確率驗證法
J75鋼的時效處理工藝
一種新型耐熱合金GY200的長期時效組織與性能
環保執法如何把握對違法建設項目的追責時效?
自動氣象站應該注意的一些防雷問題
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合