?

機器學習方法在湖南夏季降水預測中的應用

2022-05-12 23:13黃超李巧萍謝益軍彭嘉棟
大氣科學學報 2022年2期
關鍵詞:機器學習預測

黃超 李巧萍 謝益軍 彭嘉棟

摘要利用湖南97個國家站的逐月降水資料、國家氣候中心130項氣候指數集以及國家氣候中心和美國國家環境預報中心兩套季節預測模式的降水預測資料,采用遞歸特征消除法確定預測因子并使用多層前饋神經網絡、支持向量回歸和自然梯度提升三種算法建立了兩種湖南夏季降水統計預測方案的模型,檢驗了預測效果。結果表明:基于機器學習的預測模型對湖南夏季雨型分布有較好的預測能力,兩種統計方案提前1~6mon起報的夏季降水平均距平相關系數分別為0.15和0.19,相比于NCEP和NCC模式有較大提升,平均PS評分分別為69.3和69.2,高于NCC模式的63.1,略低于NCEP模式的71.5;進一步分析表明,3—5月起報的機器學習模型的預測技巧可能來源于前冬極地和中高緯環流,12—2月起報的模型預測技巧則可能來自海溫的前兆信號。

關鍵詞機器學習;夏季降水;預測

湖南地形具有三面環山、南高北低的特點,氣候復雜多變,夏季旱澇轉換(李易芝等,2017),易出現洪澇、干旱等氣象災害。在全球變暖背景下,湖南夏季極端降水明顯增加(周莉等,2018),因此進一步提升夏季降水預測水平對湖南防災減災具有重要現實意義。

目前降水季節趨勢預報主要分為統計學、動力學和動力統計相結合三類方法。統計方法充分利用歷史資料規律,選取有明確物理意義和顯著相關的因子進行建模。范可等(2007)通過前期因子建立統計模型對長江中下游夏季降水年際增量進行預測,顯著提高了業務預測技巧。杜良敏等(2016)針對不同氣候分區建立統計模型對我國夏季降水進行預測。李春暉等(2018)采用時空投影方法建立廣東省降水統計預測方法。Yimetal.(2014)使用統計模型對中國南方夏季降水進行預測。但由于各預測因子相互作用過程復雜,不同時間尺度的預測信號不一致,加大了預測的難度。隨著數值模式的發展,動力模式成為氣候預測的主要工具,許多國家建立了數值預報模式(丁一匯,2011)。近年來,我國季節預測模式對大氣環流、ENSO(ElNioSouthernOscillation)現象、亞洲夏季風等的預測能力已有明顯提升(吳捷等,2017),但對降水預測技巧依然有限,特別是對東亞地區夏季降水的預報技巧相對較低(王予等,2021)。在這樣的現實情況下,專家學者在此基礎上發展了動力和統計相結合的預測方法(封國林等,2013),充分利用歷史資料并考慮大氣海洋物理機制,進一步提高了降水預測準確率??伦诮ǖ龋?009)提出了最優子集回歸方法。賈小龍等(2010)發展了變形典型相關分析(CombinationofEmpiricalOrthogonalFunctionandCanonicalCorrelationAnalysis,BPCCA)方法。舒建川等(2019)在此基礎上使用BPCCA方法在西南地區進行了應用。組合統計降尺度方法(LiuandFan,2014;劉穎等,2020)也能夠提升一定的降水預測技巧。此外,國家氣候中心多模式解釋應用集成預測系統(MultimodelDownscalingEnsemblePredictionSystem,MODES)(劉長征等,2013)和動力統計相結合的季節預測系統(ForecastSystemonDynamicAnalogueCombinedSkills,FODAS)(王啟光等,2011)的研發對我國夏季降水預測業務水平提升起到了關鍵作用。

機器學習強調從歷史數據中學習規則,對新數據進行推理和預測。區別于傳統統計方法,機器學習擅長處理非線性問題,利用機器學習的優勢可以從地球系統中發現并提取新的相互關聯信號(賀圣平等,2021)。近年來,機器學習在氣象領域的應用越來越廣泛,常用的機器學習算法有支持向量機、貝葉斯算法、神經網絡、決策樹算法等(馮漢中和陳永義,2004;孫照渤等,2013;張宇彤等,2013;苗春生等,2017)。隨著計算能力的提高和深度學習理論的發展,以卷積神經網絡(ConvolutionalNeuralNetworks,CNN)和長短期時間記憶網絡(LongShortTermMemory,LSTM)為代表的深度學習方法在氣候領域得到應用,例如CNN算法對ENSO指數的預測技巧超過了主流動力模式(Hametal.,2019),沈皓俊等(2020)采用的LSTM算法對中國夏季降水預測評分超過了同期業務模式。

湖南夏季降水時空分布不均,影響因子復雜,當前對其機理和預測的研究還存在短板,動力模式預測水平與業務服務需求存在差距,有必要利用機器學習的優勢進一步提高當地預測水平??紤]到湖南降水觀測資料年份較少,不適合深度學習方法,因此本文采用隨機森林算法進行遞歸特征消除來挑選預測因子,使用多層前饋神經網絡、支持向量回歸和自然梯度提升方法建模,結合動力模式降水預測結果,建立適用于湖南本地的夏季降水統計預測方法。

1資料和方法

1.1數據來源和預處理

預報因子資料來源于國家氣候中心提供的氣候系統監測指數集(下載地址:http://cmdp.ncccma.net/Monitoring/cn_index_130.php),共包含130項氣候系統指數的月平均值。其中大氣環流指數88項,主要包括副高、東亞槽、極渦、歐亞環流型、遙相關、太平洋信風等大氣環流指數。海溫指數26項,主要包括厄爾尼諾(各區及類型)、暖池、印度洋、親潮區、黑潮區等海溫指數。其他指數16項,主要包括冷空氣、臺風、南方濤動、北太平洋年代際振蕩、準兩年振蕩、次表層海溫等指數。時間尺度為1980年1月—2020年12月,若出現缺測,直接將該因子剔除。

美國國家環境預報中心(NationalCentersforEnvironmentalPrediction,NCEP)和國家氣候中心(NationalClimateCenter,NCC)氣候預測模式數據來自MODES系統,空間分辨率均為1°×1°,NCEP模式歷史回算時間范圍為1982—2020年(其中2011年資料缺失),模式氣候態取1982—2010年,NCC模式歷史回算時間范圍為1991—2020年,氣候態取1991—2010年。分別計算模式不同起報時間的夏季(6—8月)降水距平百分率,并采用雙線性插值將網格數據插值到站點上。實況夏季降水資料來自湖南省97個國家站1981—2020年的觀測數據,夏季降水沒有明顯的線性趨勢,因此未做去趨勢處理,直接處理成降水距平百分率進行分析。

樣本集共包含1981—2020年共40a、6個起報時間、10個模態共計2400個樣本(40×6×10);根據起報時間和模態劃分為60個子樣本集,每個子樣本集40個樣本;訓練集時間段為1981—2010年,測試集為2011—2020年。建模時挑選對應起報時間和模態的樣本集,其中訓練集30個樣本進行訓練和交叉驗證,測試集10個樣本進行獨立檢驗。

1.2評估方法

對湖南夏季降水評價指標采用趨勢異常綜合評分PS(PS)和空間距平相關系數ACC(AnomalyCorrelatiomCoefficent,ACC)。PS評分的計算公式為:

其中:N為總站數,本研究中取97;P1=0.5,P2=1.0;N0為預報與實況距平符號相同站數或符號不同但相差只有1級站數之和;N1為預報與實況同為2級5級的站數,N2為預報與實況同為1級、6級的站數。

ACC的計算公式為:

其中:n為站點數,yi和oi分別表示預測值和觀測值;和分別表示預測值和觀測值的平均值。

1.3建模方法

為了減少建模過程中機器學習算法的隨機性影響,本文采用多層前饋神經網絡、支持向量機和決策樹集成三種不同的機器學習方法進行建模,這三種算法均屬于機器學習中的分類和回歸方法,對數據的識別和擬合過程具有一定差異。

1)多層前饋神經網絡

本文使用的神經網絡算法為多層前饋神經網絡,其一般包含輸入層、隱含層和輸出層(韓力群,2006;LeCunetal.,2015)。隱含層越多,模型數據表示能力越強,更易造成過擬合,因此本文僅采用兩層隱含層,神經元個數也不超過預報因子個數。模型的表達式為:

其中:xi為節點i的輸入值;Pk為節點k的輸出值;g1為隱含層激活函數;g2為輸出層激活函數;m和n分別為輸入層和輸出層神經元個數;wj0為隱含層第j個神經元的偏差;wk0為輸出層第k個神經元的偏差;wkj為輸出節點k與隱含節點j的權重;wji為輸入節點i與隱含節點j的權重。

2)支持向量回歸

支持向量回歸是支持向量機的拓展,算法通過核函數在高維或有限維空間中構造一個或一組超平面使數據與其距離最?。愑懒x等,2004),在處理小樣本、高維和非線性問題上具有優勢。本文選用高斯核函數,因此表達式為:

其中:L為支持向量的個數;ai、a*i、b為通過訓練樣本確定的最優超平面參數;xi為預報因子;σ為控制高斯核參數寬度的參數。

3)決策樹集成

決策樹是機器學習中的分類回歸算法,對于回歸問題,算法目標是盡量使劃分同一類別的平方誤差最小,但也易造成過擬合,可通過決策樹集成方法克服。本文使用的隨機森林和自然梯度提升樹均屬于決策樹集成算法。隨機森林回歸算法通過對訓練集重復隨機采樣進行決策樹建模,取多個決策樹平均值作為預測結果(Breiman,2001);而自然梯度提升樹算法通過梯度提升方法進行預測,不斷對預測殘差進行建模并集成多個決策樹,從而達到減少預測誤差的目(Pengetal.,2020)。

4)遞歸特征消除法

遞歸特征消除法是機器學習中常用的特征處理方法,起到挑選重要因子的作用。該方法通過反復構建模型剔除重要程度最低的因子,并遍歷所有因子達到確定因子重要程度的目的。本文采用的重要性衡量方法為基尼重要性,在隨機森林內部節點中通過反復將數據集分為兩個獨立的集合,計算每次分類后的集合內部方差,依據分類前后集合的方差差值確定氣候因子的重要性,方差差值越大表示因子重要性越高。

2機器學習在降水預測中的應用

2.1湖南夏季降水預報方案

將機器學習方法應用預測因子篩選及湖南夏季降水預測建模中,圖1給出了降水預測的主要流程:

1)資料處理:分為三部分,第一部分獲取前期因子集,將起報時間前3mon的130項氣候系統指數作為前期因子集,例如5月起報的模型使用的是2、3、4月的氣候因子。第二部分是降水數據,對1981—2010年湖南夏季觀測降水的距平百分率采用經驗正交函數分析方法(EOF)進行分解,時間系數為預測目標。第三部分是模式預報降水場,使用觀測降水場EOF分解后的空間系數對模式降水場進行投影,得到模式預報的時間系數。

2)篩選關鍵因子組合:基于機器學習的遞歸特征消除思想,采用隨機森林算法獲取重要的氣候因子,再通過交叉驗證選取合適的關鍵因子組合。

3)建模:分為兩個方案,方案一直接使用篩選的關鍵因子組合與EOF時間系數進行建模;方案二將NCEP模式預報的降水場時間系數與方案一中的因子共同作為預報因子進行建模。

4)輸出預報結果:利用模型預報的時間系數和觀測降水EOF分解的空間系數還原成預報降水場,對不同機器學習模型的預報結果進行等權集合平均作為最終的預報結果。

2.2確定預測因子及EOF模態個數

使用隨機森林算法進行遞歸特征消除來篩選預測因子,隨機森林算法通過計算預測因子的基尼重要性對其進行排序,從而剔除不重要的預測因子,達到降維的目的。將所有候選氣候因子與前10個EOF模態時間系數分別進行遞歸特征消除(決策樹數量參數設置為100,持續增大后誤差并無顯著減少),采用五折交叉驗證進行誤差分析。圖2給出了5月起報的前10個模態通過遞歸特征消除法剔除因子后均方根誤差,當因子數達到某一閾值,誤差趨于平穩。在因子重要性排序之后,選取該閾值之前的關鍵性因子即能在降低模型誤差的同時達到降維的目的,依據此方法便得到提前1~6mon起報和不同模態的預測因子(表2)。

采用交叉驗證方法分析不同EOF模態個數對預測結果的影響。圖3給出了利用1981—2010年湖南夏季降水數據分別截取前1~20個不同EOF模態進行五折交叉驗證的結果,ACC和PS評分均為提前1~6mon起報的平均值。從圖中可以看出,EOF模態個數超過6個,PS和ACC變化趨于平穩,當EOF個數取8和10時,ACC和PS分別達到最大值。結合圖3中所示的不同EOF模態的累計方差貢獻率以及還原后降水場與觀測場的相關系數來看,EOF模態個數越多,越能反映降水的時空變化,因此這里將EOF模態個數定為10,此時累計方差貢獻率為89.1%,ACC和TCC分別達到0.86和0.94,能夠反映降水的時空分布特征。

2.3參數設置及模型建立

表3中給出了多層前饋神經網絡、支持向量機回歸、自然梯度提升樹三種算法的參數范圍,為避免

過擬合,參數設置盡量簡單,降低模型復雜度,所有數據進行標準化處理。神經網絡層數為2層,節點數取20~50,激活函數使用Relu;支持向量機使用高斯核;自然梯度提升樹的決策樹數量在20~500間取值。建模時取訓練集對參數取值范圍內的不同參數組合分別建模。例如對5月起報的EOF第一模態時間系數使用多層前饋神經網絡建模時,隱含層數量為2,對應隱含層節點數分別為{50,50}、{40,40}、{30,30}、{20,20}共4組,正則化參數分別為0.0001、0.001、0.01、0.1、1共5個,不同參數組合共計20個;然后采用五折交叉驗證方法計算得到20個模型的平均均方根誤差,其中隱含層節點數為{40,40}、正則化參數為0.01的模型誤差最小,作為最終預測模型;重復該步驟即得到2種方案3種算法10個模態提前1~6mon起報的共計360個預測模型。

對比三種算法不同起報時間的平均均方根誤差(圖4a),提前1、3、4mon起報的模型中支持向量回歸誤差最小,提前2、5、6mon起報的模型中,自然梯度提升樹誤差最小;通過不同模態的平均均方根誤差來看(圖4b),預測誤差主要位于前兩個模態。

兩種統計方案分別使用2011—2020年和2012—2020年數據進行獨立樣本檢驗,得到對應年份97個國家站夏季降水距平百分率數據并評估預報技巧。圖5分別給出氣候模式本身及兩種方案的統計模型提前1~6mon起報的降水距平空間相關系數(ACC)和PS評分。整體來看,方案一提前1~6mon起報的ACC分別為0.25、0.15、0.09、0.23、0.15、0.05,平均為0.15;方案二提前1~6mon起報的ACC分別為0.25、0.23、0.19、0.26、0.24、-0.01,平均為0.19;NCEP和NCC模式預報的平均ACC分別為0.08和0.02,統計方案有明顯提高;兩種方案提前1~6mon起報的平均PS評分分別為69.3和69.2,相比NCEP模式的71.5略低,但優于NCC模式的63.1。從不同起報時間來看,2月起報(Lead4)的ACC最高,4月起報(Lead2)的PS評分最高。與動力模式結果相比,機器學習模型的平均ACC比NCEP、NCC模式高,這種優勢在提前3~6mon起報的模型上更加明顯,兩套動力模式在提前3mon以上預報夏季降水幾乎沒有技巧,但在PS評分上,NCEP模式則更具優勢。上述結果說明兩種基于機器學習的預測方法在降水空間分布的預測技巧上有優勢,并且方案二比方案一效果更好,但在降水異常級的預測能力上比NCEP的動力模式要差,可能因為統計方法更加傾向于預測平均狀態,對降水異常級的預測能力不足。

圖6給出了方案一的2011—2020年和方案二的2012—2020年逐年夏季降水預測ACC和PS評分,可見預測評分表現出明顯的年際差異。兩種方案的預測模型在2012、2013、2016、2018年提前1~6mon起報的平均PS評分均超過70,預測效果較好,對應的ACC評分在上述年份也較高。相比之下,方案二的平均ACC除2015年為負值,其余年份均為正值,整體預測技巧高于方案一。眾所周知,ENSO是熱帶太平洋地區海氣系統年際氣候變率最強信號(宗海鋒等,2010;Wenelal.,2015),ENSO對湖南降水預測有重要指示意義,分析機器學習模型在ENSO年的預測情況可以進一步了解其預測水平。2016和2020年為典型的厄爾尼諾衰減年,兩種方案在2016年不同起報時間的預測均有較高的正技巧,平均ACC分別達到0.37和0.36,PS評分分別達到79.8和75.3,但2020年的預測并不穩定,3月起報的降水預測為評分較低。從拉尼娜衰減年預測來看,2013和2018年的預測均有較高的正技巧;整體來看,機器學習建模方法在一定程度上能夠識別ENSO對湖南降水的影響。

4討論

上述結果表明機器學習方法能夠改善湖南夏季降水空間分布的預測技巧,但機器學習算法通常屬于黑箱模型,在解決氣候問題時難以給出合理的物理過程解釋,為了能夠進一步了解機器學習方法預報技巧的來源,同時考慮到相近起報月份的預測因子相近,這里僅給出3月和12月起報的預測因子中前4個模態通過顯著性檢驗的因子(表4)??梢钥闯?,3月起報模型的前3個模態相關顯著的預測因子以前冬極地和中高緯環流指數為主,第四個模態中的南方濤動和赤道中東太平洋200hPa緯向風指數均反映與ENSO的高相關性,并且4月和5月起報的預測因子具有相似特點。12月起報的模型因子第一模態與前期東亞槽和西太副高位置有顯著相關,后3個模態與海溫相關顯著,2月和1月起報的預測因子也與海溫顯著相關。這可能說明,3—5月起報的模型預報技巧主要來自前冬極地和中高緯環流的信號,而12月—次年2月起報的模型預報技巧主要來自前期海溫,而這些因子如何影響湖南降水還需要進一步研究。

本文僅考慮了起報時間前3mon的氣候因子,相關研究表明湖南夏季降水與前冬的大氣海洋狀態有重要聯系(李瑜等,2015;趙俊虎等,2016;高輝等,2017;余榮和翟盤茂,2018;謝傲和羅伯良,2020),而5月起報模型的預測因子并未包含整個冬季,本文嘗試將預測因子時間擴大至起報時間前6mon的范圍,結果表明5月起報的方案一和方案二模型對于湖南夏季降水預測的平均ACC分別為0.12和0.15,PS分別為65.1和68.7,效果并不如前者,將其他起報時間的預測因子范圍也擴大至前6mon,整體來看二者的平均ACC分別為0.16和0.17,PS分別為68.8和69.1,相比前者也并沒有顯著的提升,說明機器學習模型挑選的預測因子也存在一定的局限性,通過簡單增加預測因子數量的方式對于機器學習模型的預測效果并不會有顯著的提升。此外,地形的動力和熱力作用對降水的發生有重要影響,湖南三面環山的特殊地形是影響湖南區域性降水的因素之一,本文基于大尺度氣候信號構建的模型沒有考慮地形因素,對降水異常級預測能力有限,如何在機器學習模型中加入地形因素的影響還需進一步研究。

5結論

本文采用機器學習算法篩選預測因子并結合動力模式的降水預報建立了湖南夏季降水預測模型。主要結論如下:

采用隨機森林算法進行遞歸特征消除確定預測因子,通過交叉驗證確定最優EOF模態個數后,使用多層前饋神經網絡、支持向量回歸以及自然梯度提升分別建模并對預測結果進行集合平均,比較了兩種方案的預測模型及兩套動力模式對于湖南夏季降水的預測性能。評估結果表明基于機器學習的預測模型對湖南夏季雨型分布有較好的預測能力,ACC技巧優于動力模式,但對降水異常級的預測不如NCEP模式,兩種方案的預測模型不同起報時間的平均ACC分別為0.15和0.19,平均PS評分分別為69.3和69.2;并且機器學習建模方法能夠較好地識別ENSO對湖南降水的影響。

進一步分析機器學習模型挑選的預測因子與降水關聯,3—5月起報的機器學習模型的預測技巧可能來源于前冬極地和中高緯環流,12月—次年2月起報的模型預測技巧則可能來自海溫的前兆信號,由于機器學習的黑箱特點,很難了解這些因子之間相互調制的物理過程,有待通過診斷分析及模式敏感性試驗等方法進一步研究。

參考文獻(References)

BreimanL,2001.RandomForests[J].MachineLearning,45(1):532.

陳永義,俞小鼎,高學浩,等,2004.處理非線性分類和回歸問題的一種新方法(Ⅰ):支持向量機方法簡介[J].應用氣象學報,15(3):345354.ChenYY,YuXD,GaoXH,etal.,2004.AnewmethodfornonlinearclassifyandnonlinearregressionⅠ:introductiontosupportvectormachine[J].JApplMeteor,15(3):345354.(inChinese).

丁一匯,2011.季節氣候預測的進展和前景[J].氣象科技進展,1(3):1427.DingYH,2011.Progressandprospectsofseasonalclimateprediction[J].AdvMeteorSciTechnol,1(3):1427.(inChinese).

杜良敏,柯宗建,劉長征,等,2016.基于聚類分區的中國夏季降水預測模型[J].氣象,42(1):8996.DuLM,KeZJ,LiuCZ,etal.,2016.SummerprecipitationpredictionmodelsbasedontheclusteringregionalizationinChina[J].MeteorMon,42(1):8996.(inChinese).

范可,王會軍,ChoiYJ,2007.一個長江中下游夏季降水的物理統計預測模型[J].科學通報,52(24):29002905.FanK,WangHJ,ChoiYJ,2007.AphysicalstatisticalpredictionmodelforsummerprecipitationinthemiddleandlowerreachesoftheYangtzeRiver[J].ChinSciBull,52(24):29002905.(inChinese).

封國林,趙俊虎,支蓉,等,2013.動力統計客觀定量化汛期降水預測研究新進展[J].應用氣象學報,24(6):656665.FengGL,ZhaoJH,ZhiR,etal.,2013.Recentprogressontheobjectiveandquantifiableforecastofsummerprecipitationbasedondynamicalstatisticalmethod[J].JApplMeteorSci,24(6):656665.(inChinese).

馮漢中,陳永義,2004.處理非線性分類和回歸問題的一種新方法(Ⅱ):支持向量機方法在天氣預報中的應用[J].應用氣象學報,15(3):355365.FengHZ,ChenYY,2004.AnewmethodfornonlinearclassifyandnonlinearregressionⅡ:applicationofsupportvectormachinetoweatherforecast[J].JApplMeteor,15(3):355365.(inChinese).

高輝,袁媛,洪潔莉,等,2017.2016年汛期氣候預測效果評述及主要先兆信號與應用[J].氣象,43(4):486494.GaoH,YuanY,HongJL,etal.,2017.Overviewofclimatepredictionofthesummer2016andtheprecursorysignals[J].MeteorMon,43(4):486494.(inChinese).

HamYG,KimJH,LuoJJ,2019.DeeplearningformultiyearENSOforecasts[J].Nature,573(7775):568572.doi:10.1038/s4158601915597.

韓力群,2006.人工神經網絡教程[M].北京:北京郵電大學出版社:2936.HanLQ,2006.Artificialneuralnetworktutorial[M].Beijing:BeijingUniversityofPostsandTelecommunicationsPress:2936.(inChinese).

賀圣平,王會軍,李華,等,2021.機器學習的原理及其在氣候預測中的潛在應用[J].大氣科學學報,44(1):2638.HeSP,WangHJ,LiH,etal.,2021.Machinelearninganditspotentialapplicationtoclimateprediction[J].TransAtmosSci,44(1):2638.doi:10.13878/j.cnki.dqkxxb.20201125001.(inChinese).

賈小龍,陳麗娟,李維京,等,2010.BPCCA方法用于中國冬季溫度和降水的可預報性研究和降尺度季節預測[J].氣象學報,68(3):398410.JiaXL,ChenLJ,LiWJ,etal.,2010.StatisticaldownscalingbasedonBPCCA:predictabilityandapplicationtothewintertemperatureandprecipitationinChina[J].ActaMeteorolSin,68(3):398410.(inChinese).

柯宗建,張培群,董文杰,等,2009.最優子集回歸方法在季節氣候預測中的應用[J].大氣科學,33(5):9941002.KeZJ,ZhangPQ,DongWJ,etal.,2009.Anapplicationofoptimalsubsetregressioninseasonalclimateprediction[J].ChinJAtmosSci,33(5):9941002.(inChinese).

李春暉,潘蔚娟,王婷,2018.廣東省降水的多尺度時空投影預測方法[J].應用氣象學報,29(2):217231.LiCH,PanWJ,WangT,2018.AmultiscalespatialtemporalprojectionmethodformonthlyandseasonalrainfallpredictioninGuangdong[J].JApplMeteorSci,29(2):217231.(inChinese).

李易芝,羅伯良,霍林,2017.湖南夏季旱澇轉折異常特征分析[J].暴雨災害,36(4):339347.LiYZ,LuoBL,HuoL,2017.AnalysisonanomalouscharacteristicsofthesummerdroughtfloodtransitionsinHunan[J].TorrentialRainDisasters,36(4):339347.(inChinese).

李瑜,李維京,任宏利,等,2015.長江中下游地區冬夏干濕韻律特征分析[J].氣象學報,73(3):496504.LiY,LiWJ,RenHL,etal.,2015.Analysisofdry/wetrhythmsinwinterandsummerprecipitationsoverthemidlowerreachesoftheYangtzeRiverBasin[J].ActaMeteorolSin,73(3):496504.(inChinese).

LeCunY,BengioY,HintonG,2015.Deeplearning[J].Nature,521(7553):436444.doi:10.1038/nature14539.

劉長征,杜良敏,柯宗建,等,2013.國家氣候中心多模式解釋應用集成預測[J].應用氣象學報,24(6):677685.LiuCZ,DuLM,KeZJ,etal.,2013.Multimodeldownscalingensemblepredictioninnationalclimatecenter[J].JApplMeteorSci,24(6):677685.(inChinese).

LiuY,FanK,2014.AnapplicationofhybriddownscalingmodeltoforecastsummerprecipitationatstationsinChina[J].AtmosRes,143:1730.doi:10.1016/j.atmosres.2014.01.024.

劉穎,任宏利,張培群,等,2020.中國夏季降水的組合統計降尺度模型預測研究[J].氣候與環境研究,25(2):163171.LiuY,RenHL,ZhangPQ,etal.,2020.ApplicationofthehybridstatisticaldownscalingmodelinsummerprecipitationpredictioninChina[J].ClimEnvironRes,25(2):163171.(inChinese).

苗春生,何東坡,王堅紅,等,2017.基于C4.5算法的長江中下游地區夏季降水預測模型研究及應用[J].氣象科學,37(2):256264.MiaoCS,HeDP,WangJH,etal,2017.ResearchandapplicationofsummerrainfallpredictionmodelinthemiddleandlowerreachesoftheYangtzeRiverbasedonC4.5algorithm[J].JMeteorSci,37(2):256264.(inChinese).

PengT,ZhiXF,JiY,etal,2020.Predictionskillofextendedrange2mmaximumairtemperatureprobabilisticforecastsusingmachinelearningpostprocessingmethods[J].Atmosphere,11(8):823.doi:10.3390/atmos11080823.

沈皓俊,羅勇,趙宗慈,等,2020.基于LSTM網絡的中國夏季降水預測研究[J].氣候變化研究進展,16(3):263275.ShenHJ,LuoY,ZhaoZC,etal.,2020.PredictionofsummerprecipitationinChinabasedonLSTMnetwork[J].ClimChangeRes,16(3):263275.(inChinese).

舒建川,蔣興文,黃小梅,等,2019.中國西南夏季降水預測的統計降尺度建模分析[J].高原氣象,38(2):349358.ShuJC,JiangXW,HuangXM,etal.,2019.StatisticaldownscalingmodelinganalysisofsummerprecipitationinsouthwestChina[J].PlateauMeteor,38(2):349358.(inChinese).

孫照渤,譚桂容,趙振國,等,2013.中國東部夏季雨型的人工神經網絡集合預測[J].大氣科學學報,36(1):16.SunZB,TanGR,ZhaoZG,etal.,2013.EnsemblepredictionofsummerrainfallpatternsoverEasternChinabasedonartificialneuralnetworks[J].TransAtmosSci,36(1):16.doi:10.13878/j.cnki.dqkxxb.2013.01.001.(inChinese).

王啟光,封國林,鄭志海,等,2011.長江中下游汛期降水優化多因子組合客觀定量化預測研究[J].大氣科學,35(2):287297.WangQG,FengGL,ZhengZH,etal.,2011.AstudyoftheobjectiveandquantifiableforecastingbasedonoptimalfactorscombinationsinprecipitationinthemiddleandlowerreachesoftheYangtzeRiverinsummer[J].ChinJAtmosSci,35(2):287297.(inChinese).

王予,李惠心,王會軍,等,2021.CMIP6全球氣候模式對中國極端降水模擬能力的評估及其與CMIP5的比較[J].氣象學報,79(3):369386.WangY,LiHX,WangHJ,etal.,2021.EvaluationofCMIP6modelsimulationsofextremeprecipitationinChinaandcomparisonwithCMIP5[J].ActaMeteorolSin,79(3):369386.(inChinese).

WenN,LiuZY,LiuYH,2015.DirectimpactofElNioonEastAsiansummerprecipitationintheobservation[J].ClimateDyn,44(11/12):29792987.doi:10.1007/s0038201526052.

吳捷,任宏利,張帥,等,2017.BCC二代氣候系統模式的季節預測評估和可預報性分析[J].大氣科學,41(6):13001315.WuJ,RenHL,ZhangS,etal.,2017.EvaluationandpredictabilityanalysisofseasonalpredictionbyBCCsecondgenerationclimatesystemmodel[J].ChinJAtmosSci,41(6):13001315.(inChinese).

謝傲,羅伯良,2020.湖南夏季降水與前期北太平洋海溫異常的關系[J].氣象與環境科學,43(4):4957.XieA,LuoBL,2020.RelationsbetweentheprecedingSSTAinnorthernPacificOceanandsummerprecipitationinHunan[J].MeteorEnvironSci,43(4):4957.doi:10.16765/j.cnki.16737148.2020.04.007.(inChinese).

YimSY,WangB,XingW,2014.PredictionofearlysummerrainfalloverSouthChinabyaphysicalempiricalmodel[J].ClimateDyn,43(7/8):18831891.doi:10.1007/s0038201320143.

余榮,翟盤茂,2018.厄爾尼諾對長江中下游地區夏季持續性降水結構的影響及其可能機理[J].氣象學報,76(3):408419.YuR,ZhaiPM,2018.TheinfluenceofElNioonsummerpersistentprecipitationstructureinthemiddleandlowerreachesoftheYangtzeRiveranditspossiblemechanism[J].ActaMeteorolSin,76(3):408419.(inChinese).

張宇彤,矯梅燕,陳靜,2013.基于模式先驗信息的貝葉斯集合降水概率預報試驗[J].氣象,39(10):12331246.ZhangYT,JiaoMY,ChenJ,2013.Bayesianensembleprobabilisticforecastingmodelexperimentofprecipitationbasedonmodelprioriinformation[J].MeteorMon,39(10):12331246.(inChinese).

趙俊虎,楊柳,曾宇星,等,2016.夏季長江中下游和華南兩類雨型的環流特征及預測信號[J].大氣科學,40(6):11821198.ZhaoJH,YangL,ZengYX,etal.,2016.AnalysisofatmosphericcirculationandpredictionsignalsforsummerrainfallpatternsinSouthernChina[J].ChinJAtmosSci,40(6):11821198.(inChinese).

周莉,胡瑞卿,李偉,等,2018.湖南省夏季極端降水異常時空特征及其成因分析[J].氣象科學,38(6):838848.ZhouL,HuRQ,LiW,etal.,2018.CharacteristicsofsummerextremeprecipitationanomalyandthecauseofconcurrentanomalypatterninHunanProvince[J].JMeteorSci,38(6):838848.(inChinese).

宗海鋒,陳烈庭,張慶云,2010.ENSO與中國夏季降水年際變化關系的不穩定性特征[J].大氣科學,34(1):184192.ZongHF,ChenLT,ZhangQY,2010.TheinstabilityoftheinterannualrelationshipbetweenENSOandthesummerrainfallinChina[J].ChinJAtmosSci,34(1):184192.(inChinese).

PredictionofsummerprecipitationinHunanbasedonmachinelearning

HUANGChao1,2,LIQiaoping3,XIEYijun1,2,PENGJiadong1,2

1HunanClimateCenter,Changsha410118,China;

2HunanKeyLaboratoryofMeteorologicalDisasterPreventionandReduction,Changsha410118,China;

3CMAEarthSystemModelingandPredictionCentre(CEMC),Beijing100081,China

Againstthebackgroundofglobalwarming,summerextremeprecipitationinHunanhasincreasedsignificantly.Therefore,improvingthepredictionaccuracyofprecipitationisofgreatpracticalsignificancefordisasterpreventionandmitigationinHunanProvince.UsingthemonthlyprecipitationdatafrommeteorologicalstationsinHunan,theclimateindexsetsfromtheNationalClimateCenter(NCC)andtheprecipitationdatafromthehindcastexperimentsareperformedusingseasonalpredictionmodelsofNCCandNCEP(NationalCentersforEnvironmentalPrediction).Therecursivefeatureelimination(RFE)methodisusedtodeterminethekeyfactors,andtwostatisticalpredictionschemesofsummerprecipitationinHunanareestablishedbythreealgorithms:multilayerfeedforwardneuralnetwork(FNN),supportvectorregression(SVR)andnaturalgradientboosting(NGBoost).Theresultsshowthatthepredictionmodelbasedonmachinelearning(ML)hassuperiorabilitytopredictthedistributionpatternofsummerprecipitationinHunan.TherespectiveaverageACCskillsofthetwostatisticalschemeswithleadtimesof1to6monthsare0.15and0.19,whichisagreatimprovementcomparedwiththedynamicmodel.TherespectiveaveragePSscoresare69.3and69.2,whicharehigherthantheNCCmodel.ThefurtheranalysisindicatesthattheprecedingwinterpolarandmidandhighlatitudelatitudecirculationmaybethemainpredictabilitysourcesofMLmodelswithleadtimesof1to3months.Finally,thepredictionskillsofmodelswithleadtimesof4to6monthsarelikelyderivedfromtheprecursorysignalofseasurfacetemperature.

machinelearning;summerprecipitation;forecast

doi:10.13878/j.cnki.dqkxxb.20210903001

(責任編輯:劉菲)

20210903收稿,20211210接受

湖南省氣象局研究型業務預報預測專項(XQKJ21C011);中國氣象局預報員專項(CMAYBY2020087);國家重點研發計劃項目(2018YFC1505806)

猜你喜歡
機器學習預測
選修2—2期中考試預測卷(B卷)
選修2—2期中考試預測卷(A卷)
選修2—2期中考試預測卷(A卷)答案與提示
選修2—2期中考試預測卷(B卷)答案與提示
基于詞典與機器學習的中文微博情感分析
基于網絡搜索數據的平遙旅游客流量預測分析
前綴字母為特征在維吾爾語文本情感分類中的研究
基于支持向量機的金融數據分析研究
機器學習理論在高中自主學習中的應用
《福彩3D中獎公式》:提前一月預測號碼的驚人技巧!
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合