?

基于聚類分析的浙江省汛期OCF降水預報分區訂正試驗

2024-01-04 03:37潘欣馬依依毛程燕鄭倩
暴雨災害 2023年6期
關鍵詞:落區實況分區

潘欣,馬依依,毛程燕,鄭倩

(浙江省衢州市氣象局,衢州 324000)

引言

隨著數值預報技術的迅速發展,數值預報產品的精度、準確度不斷提升,其已逐漸成為各級氣象臺站預報員制作天氣預報的重要依據。然而,由于數值模式初值的不確定性和模式本身存在的系統偏差,模式預報往往與實況存在偏差(穆穆等,2011;武英嬌等,2019;趙寧坤等,2021)。因此,采用各種釋用方法對模式預報產品進行后處理以改進預報效果,已成為目前解決模式預報偏差的常用手段。

降水量是氣象預報中重要的預報要素之一,由于其本身的非正態性和不連續性,預報難度較大,因此研究模式降水預報的訂正釋用方法是氣象預報關鍵技術研究中的重要課題。李俊等(2014)根據模式降水預報的偏差特征,采用基于頻率(或面積)匹配的偏差訂正方法顯著改善了模式降水預報中雨量和雨區范圍的系統性偏差。曹萍萍等(2018)基于地形地理分區,采用概率匹配方法有效訂正了西南地區的逐12 h降水預報。趙瑞霞等(2020)將最優評分訂正(Optimal Threat Score,OTS)、模式輸出統計(Model Output Statistics,MOS)和納入超前空間實況信息的模式輸出統計(MOS with prior-spatial observation predictors,OMOS)方法及其優化組合應用于逐3 h 降水預報中,結果表明MOS-OTS 綜合預報性能最好。曹萍萍等(2020)基于“配料法”有效訂正了四川夏季的大雨、暴雨預報。從靖等(2021)將Gamma 累積概率分布曲線應用于預報-實況概率匹配方法中,并以此改善了海河流域東北冷渦背景下ECMWF 小雨、大雨和暴雨預報技巧。

浙江汛期多暴雨過程、強度較大,模式對其預報偏差大,其精準預報一直是氣象預報中的難點和重點。研究表明,頻率匹配法能夠有效利用歷史降水資料對模式降水預報進行有效訂正(智協飛和呂游,2019),此法是一種簡便且實用的降水訂正方法。然而,由于浙江地形復雜多樣,呈“七山一水二分田”特征,同時降水天氣氣候背景復雜,浙西為梅汛期暴雨區,浙東為臺汛期暴雨區。如果將全省作為整體進行頻率匹配,顯然缺乏合理性,而以降水分區為基礎進行頻率匹配降水訂正更為合適。目前常用的降水分區方式是根據地形等地理信息進行人為主觀分區(曹萍萍等,2018;智協飛和呂游,2019)。而為了保證降水分區的客觀性和合理性,本文聚類分區方式采用Kmeans聚類算法(王偉等,2011;茍浩鋒等,2020),其被廣泛應用于數據分析、數據挖掘、模式識別等領域,是在科研和工業中應用最廣泛的聚類算法之一。本文旨在通過聚類分析,對復雜地形地區的降水進行合理分區,在此基礎上,對李俊等(2014)基于頻率(或面積)匹配的偏差訂正方法進行改進,獨創基于聚類分析的偏差訂正方法。利用該方法,對數值模式降水預報進行分區訂正,以期提升降水(特別是暴雨以上)預報能力,為汛期防災減災提供參考。

1 資料與方法

1.1 資料說明

1.1.1 降水實況資料

降水實況資料為2016─2021 年每年汛期(4月15日─10 月15 日)浙江省2 227 個氣象站(包括國家氣象站和區域自動氣象站,其站點分布見圖1)逐日(以20∶00為日界,北京時,下同)降水資料,該資料來源于浙江省氣象信息中心,對其中的缺測樣本已剔除。

圖1 浙江省2 227個氣象站(黑色點)空間分布Fig.1 Spatial distribution of 2227 automatic meteorological stations(black dots)in Zhejiang Province

1.1.2 降水預報資料

降水預報資料為2017—2021 年每年4—10 月浙江省氣象臺下發的多模式客觀集成預報(Objective Consensus Forecasting,OCF)降水資料(空間分辨率0.05°×0.05°)??紤]到日常預報業務中的實時性與實用性,選取每日08∶00起報的未來12—36 h的降水預報值作為后一日的降水預報值(該預報值與以20∶00為日界的日降水量實況值匹配)。采用最近鄰法根據降水預報格點資料得到各個氣象站點的降水預報資料。

1.2 研究方法

首先,選取2016—2020 年汛期浙江省2 227 個氣象站逐日降水實況數據作為訓練數據,采用Kmeans聚類算法,根據站點日降水序列間的相似性對所有站點進行分區。然后,對偏差訂正進行時空上的改進。將改進后偏差訂正法與分區結合形成分區訂正方法。最后,以2021年汛期降水預報數據及降水實況數據為例,對OCF 降水預報進行分區訂正(如下文1.2.2所述,分區計算降水頻率,分區訂正降水),對分區訂正和全區訂正(即不對站點進行分區,而是全區統一訂正)的預報結果進行對比檢驗。

1.2.1 Kmeans聚類算法

Kmeans聚類算法作為一種無監督聚類算法,廣泛應用于科研與工業,特別是數據分析和數據挖掘方面(王偉等,2011;茍浩鋒等,2020)。Kmeans 聚類算法分類原理是將n個樣本劃分為k個簇,各個簇內的樣本具有高度相似性而各個簇的樣本間具有較大差異性。相似度的度量可以根據不同的需求采用不同度量方式。Kmeans 聚類算法優點是不需要通過任何先驗知識或標簽,僅僅需要數據本身就可以對數據進行合理分類。雖然算法開始要求指定簇數,但可以通過嘗試不同簇數,根據肘部法則和平均輪廓系數來確定聚類簇數,提升聚類合理性。

1.2.2 基于頻率匹配的偏差訂正法

采用基于頻率匹配的偏差訂正法,在原有的預報偏差訂正法(李俊等,2014)基礎上做時間和空間上的改進。Kmeans 聚類算法中頻率匹配方面和原預報偏差訂正法一致,通過預報降水累積頻率和實況降水累積頻率的匹配來訂正預報降水量??紤]到數據年限較短,為提升降水頻率計算的合理性,根據Kmeans聚類降水分區結果,將原有的點對點或點對全區頻率匹配改為點對區域匹配,將原本通過全區或單點預報/實況降水數據來計算得到的全區或單點預報/實況降水頻率修改為各個區域所有站點集合計算得到區域預報/實況降水頻率(李俊等,2014;曹萍萍等,2018)。為了進一步擴充數據,將過去20 d滑動平均法計算平均頻率修改為過去、未來n天滑動平均(準對稱滑動訓練期,n根據訓練數據試驗選取),并包含過去幾年同時段數據計算平均頻率,以便充分利用歷史數據,提高對于極值降水的預測能力。如圖2 所示,準對稱滑動訓練期采用的數據包括當年當日及之前n天的預報、觀測資料和過去1年到i年的當日及前后n天的預報、觀測資料(i為歷史預報和觀測資料年限)。為了提升降水訂正效果,根據訓練數據試驗以降水檢驗評分指標選定n(n的取值范圍在5~15之間)。

圖2 準對稱滑動訓練期Fig.2 Quasi-symmetric sliding training period

1.2.3 降水檢驗方法

本文采用點對點的方法,對降水量的預報值與實況值之間的誤差進行檢驗(趙濱和張博,2018)。檢驗指標包括TS 評分、ETS 評分、命中率POD、BIAS 偏差評分。

TS(技巧評分,Threat Score,記為TS),表示在預報區域內滿足某降水閾值的降水預報技巧。

ETS(公平技巧評分,Equitable Threat Score,記為ETS),表示在預報區域內滿足某降水閾值的降水預報結果相對于滿足同樣降水閾值的隨機預報的預報技巧。

POD(命中率,Probability of Detection,記為POD),預測的降水站點數占全部實際降水站點數的比重。

BIAS(偏差評分,Bia Score,記為BS),主要用來衡量模式對某一量級降水的預報偏差,該評分在數值上等于預報區域內滿足某降水閾值的總站點數與對應實況降水總站點數的比值,其值越接近于1,表明預報范圍越接近實況。

式(1)─(4)中,TP為預報出現且實況出現站點數,即命中數;FP為預報出現但實況未出現站點數,即空報數;FN為預報未出現但實況出現站點數,即漏報數;TN為預報未出現且實況未出現站點數,即真負數。

2 氣象站點分區

將2016—2020年汛期浙江省2 227個氣象站逐日降水量數據作為訓練數據,以歐氏距離作為相似度度量標準進行Kmeans 聚類分區。為提升聚類合理性,根據肘部法則和平均輪廓系數來確定聚類簇數。綜合肘部法則和平均輪廓系數(圖略),7 為Kmeans 聚類分區合適的分區數。本文Kmeans聚類采用的各站訓練數據中,僅包含逐日降水量數據,未加入任何站點空間地理位置信息。圖3 為浙江省氣象站點分區結果,呈現明顯的區域特征,存在南北、東西和海陸差異。分區結果與胡波等(2011)根據1961—2008 年浙江省38 個國家氣象站汛期日降水資料,通過旋轉經驗正交函數(Rotated Empirical Orthogonal Function,REOF)方法得到的浙江省梅汛期降水分區類似,其中浙北北部區與4區對應,浙東南部區與1、3、6區對應,浙西南區與2、5區對應,浙中東區與7區對應。將以上分區結果與毛程燕等(2018)根據衛星資料反演得到的年平均降水空間分布對比,結果表明2 000 mm 以上降水區對應5區,1 800~2 000 mm降水區對應2、3區,1 400 mm以下降水區對應4、7區。分區區域與浙江省地貌地形存在明顯相關性,用數字1~7 及7 種不同顏色代表浙江各區域(圖3),其中1 區為溫州東部(甌江流域),2 區為衢州南部、金華南部和麗水西北部(仙霞嶺區域),3 區為溫州南部、麗水東南部(洞宮山及南雁蕩山區域),4 區為嘉興、湖州及杭州北部(杭嘉湖平原地區),5 區為杭州中南部、衢州北部、金華北部和紹興西部(浙西山區,包含白際山、千里崗山、龍門山),6 區為臺州和寧波、紹興、金華、麗水、溫州與臺州交界小部分區域(括蒼山及北雁蕩山區域),7 區為寧波、紹興東部和舟山(會稽山、四明山、天臺山以及浙北沿海區域)。

圖3 基于Kmeans聚類算法的浙江省降水分區Fig.3 Precipitation division of Zhejiang province based on the K-means clustering algorithm

3 對OCF降水預報的分區訂正效果

根據2021年汛期降水實況分別對OCF預報、全區訂正及分區訂正預報結果按不同降水閾值進行檢驗,檢驗評分結果如表1 所示。從小雨以上量級降水(≥0.1 mm,即晴雨)評分指標來看,相較于OCF 預報,全區訂正和分區訂正TS均由0.69提升至0.74左右,預報降水范圍有所縮小,更接近實況(BS更接近于1),但命中率由0.97 下降至0.93。分析發現,全區訂正和分區訂正預報均通過合理減少降水預報數,以損失一定命中率的代價,有效減少空報率(消空),明顯提升預報技巧(包括TS和ETS,下同),改善預報降水落區;其中全區訂正預報方法消空效果略好于分區訂正。從中雨以上量級降水(≥10 mm)評分指標來看,相較于OCF預報,全區訂正和分區訂正TS均由0.49 下降至0.48,ETS均由0.48提升至0.49,中雨以上預報范圍擴大,明顯大于實況范圍,命中率均由0.74 提升至0.80 左右;全區訂正和分區訂正預報相較OCF 無明顯優勢。從大雨以上量級降水(≥25 mm)評分指標來看,相較于OCF預報,全區訂正和分區訂正預報技巧均有提升,特別是ETS由0.27提升至0.36,大雨以上范圍明顯擴大(OCF預報范圍大小更接近實況),命中率由0.46提升至0.64(全區訂正和分區訂正均值)左右;全區訂正和分區訂正將漏報率由0.54下降至0.35左右,空報率由0.51提升至0.59左右,以提升較小空報率為代價較明顯提升命中率;全區訂正和分區訂正預報提升效果基本一致。從暴雨以上量級降水(≥50 mm)評分指標來看,相較于OCF 預報,全區訂正和分區訂正預報技巧均有提升,分區訂正提升更明顯,暴雨以上范圍大小更接近實況,OCF 預報范圍明顯小于實況,全區訂正和分區訂正預報范圍比實況略偏大),全區訂正、分區訂正預報命中率從OCF 預報命中率的0.25 分別提升至0.38、0.41。經分析發現,全區訂正和分區訂正預報均通過合理增加暴雨以上降水預報數(擴大預報范圍),以增加一定空報率為代價(全區訂正提升28%,分區訂正提升24%),明顯提高命中率(全區訂正提高52%,分區訂正提高64%),提升暴雨以上預報技巧,改善暴雨以上預報落區。綜上,全區訂正和分區訂正預報均對OCF 降水預報有較明顯提升,對于小雨以上量級降水預報(晴雨預報),通過明顯降低降水空報率,從而提升晴雨預報能力;對于大雨以上量級降水預報,通過合理擴大降水預報范圍,提升預報能力,特別是對于暴雨以上量級降水分區訂正方法提升更明顯。

根據降水分區,進一步針對暴雨以上量級降水的OCF、全區訂正和分區訂正預報結果進行檢驗。檢驗結果如表2 所示。從中可見,不同區域暴雨以上降水OCF 預報評分差異明顯,7 區最優,1 區最差。全區訂正和分區訂正預報對1、2、3、4、5區暴雨以上預報均有明顯提升效果,但6、7區提升效果不明顯(僅有命中率一項有明顯提升)。從兩種訂正方法評分指標對比來看,除5區分區訂正預報評分略差于全區訂正預報,其它區域分區訂正的大多數評分優于全區訂正。特別是4 區,TS全區訂正提高15%,分區訂正提高44%;ETS全區訂正提升13%,分區訂正提升44%;全區訂正命中率提升至0.43,分區訂正命中率提升至0.52。綜合來看,對于暴雨以上量級降水,分區訂正和全區訂正除對浙中北沿海地區(6、7區)訂正效果不佳外,其它地區效果較好,且分區訂正明顯優于全區訂正。其中6、7區訂正效果不佳主要原因是2021年汛期浙中北沿海地區(即6區)暴雨以上量級降水多為對流性降水,局地性強、突發性強,訂正效果較差;OCF 預報對7 區的預報效果較好,較難進行有效訂正。

表2 OCF降水預報、全區訂正以及分區訂正預報方法在2021年汛期浙江省暴雨以上量級降水中的檢驗評分Table 2 Test scores of OCF precipitation forecast,overall correction,and regional correction method for the magnitude of rainfall above in Zhejiang province during the flood season of 2021

4 分區訂正預報方法在2021 年汛期降水預報中的應用效果

以兩次降水過程為例,對分區訂正預報效果進行分析、檢驗。第一次過程為2021年第6號臺風“煙花”登陸前其外圍影響造成的一次系統性暴雨到大暴雨過程(7 月23 日20∶00—24 日20∶00)。給出此次過程OCF、全區訂正、分區訂正降水預報和實況分布圖4。從中可知,OCF 預報降水主要集中在浙中北地區,降水量級為大雨,暴雨預報區域主要分布于浙中沿海小部分區域,范圍小且較分散。經全區訂正后,大雨區和暴雨區范圍有所擴大,浙北和浙中沿海預報了較明顯的暴雨區。經分區訂正,大雨區范圍擴大,暴雨區主要集中在浙北和浙東沿海地區,范圍明顯擴大,且在浙東沿海(寧波)、浙北(湖州、杭州交界處)預報有大暴雨區。與降水實況對比發現,OCF預報暴雨區范圍明顯偏小,落區與實況偏差大,降水中心強度明顯小于實況;全區訂正對暴雨落區和強度有所改善;經分區訂正后,暴雨區范圍明顯擴大,與實況暴雨區范圍最為接近,且基本覆蓋了大部分浙北和浙東沿海的實況暴雨區,同時預報出了大暴雨區(其中四明山區、天目山區大暴雨落區與實況基本重合)。綜上,從暴雨以上降水的落區和強度來看,經分區訂正后降水預報效果有明顯提升。

圖4 2021年7月23日08∶00起報的OCF(a)、全區訂正(b)、分區訂正(c)的浙江省12─36 h降水量與24 h降水量實況(d)Fig.4 Diagram of future 12-36 hour precipitation forecasted by(a)OCF,(b)overall correction,(c)regional correction forecast and(d)observed precipitation in Zhejiang province starting from 08∶00 BT on 23 July 2021

第二次過程為2021年8月12日20∶00—13日20∶00的一次對流性暴雨、局部大暴雨過程。給出此次過程OCF、全區訂正、分區訂正預報和實況降水分布情況圖5。從中可見,OCF 預報此次過程大雨以上降水位于浙北,暴雨區集中在杭嘉湖交界處。經全區訂正,大雨范圍擴大至浙中北,暴雨擴大至浙北大部分地區。經分區訂正,暴雨區向浙東沿海擴大,浙北出現大暴雨區。由于此次降水過程為對流性降水,暴雨區小而分散,整體預報效果較差。OCF預報暴雨落區整體偏北,與實況有較明顯偏差,且存在大暴雨漏報。全區訂正后預報的暴雨落區囊括了杭州北部、杭州紹興嘉興交界處的暴雨區,但漏報衢州西北部、浙東沿海暴雨區以及大暴雨區。相對而言,分區訂正后降水預報效果更好,在全區訂正的基礎上進一步預報出了浙東沿海暴雨區,且預報出大暴雨區(與實況相比落區偏北)。綜上,對于分散性對流降水,在原始預報暴雨落區偏差較大的情況下,分區訂正方法能夠在一定程度上改進暴雨落區和強度預報,但出現較大范圍空報。

綜合來看,相較于OCF 預報,分區訂正預報方法對于受臺風“煙花”外圍影響造成的系統性暴雨到大暴雨過程有明顯的訂正效果,可以有效提升暴雨以上降水的預報效果;對于對流性暴雨到大暴雨過程分區訂正預報方法能夠在一定程度上改善暴雨以上落區和強度,但出現較大范圍空報。同時也可以從圖4 中OCF 預報、分區訂正與實況降水分布的對比中發現,雖然分區訂正預報暴雨落區與實況接近,但大暴雨落區中心(紹興與杭州交界處)漏報。此外,分區訂正預報最大降水量為123.4 mm,雖然高于OCF預報最大值(78.9 mm),但仍然與實況最大值(256.6 mm)存在較大偏差。圖5中同樣存在大暴雨落區和極值偏差問題。

5 結論與討論

首先,利用2016—2020 年每年汛期浙江省2 227個氣象站逐日降水資料作為訓練數據(不包含任何地理特征信息),采用Kmeans 聚類算法,以歐氏距離為相似度度量標準,度量各站逐日降水序列相似性,對2 227個站點進行分區。然后,對偏差訂正進行時空上的改進,將改進后偏差訂正法與分區結合形成分區訂正方法。最后,以2021年汛期OCF降水預報數據及浙江省同期降水實況為例,對該訂正方法進行檢驗。主要結論如下:

(1)采用Kmeans 聚類算法,將浙江省分為7 個降水相似區,分區結果具有明顯的區域特征,與浙江省主要山區、平原、流域分布密切相關。

(2)2021 年汛期降水訂正檢驗結果表明,相較于OCF預報,全區訂正和分區訂正預報均能明顯提升汛期降水預報效果。在晴雨預報中,全區訂正預報消空能力略好,預報結果略優于分區訂正。針對中雨以上量級預報,全區訂正和分區訂正預報均無明顯訂正效果。針對大雨以上量級預報,全區訂正和分區訂正預報結果有所提升。針對暴雨以上量級預報,全區訂正和分區訂正后預報效果有較明顯提升,特別是分區訂正提升幅度更大,暴雨以上降水預報落區接近實況,命中率全區訂正由0.25提升至0.38,提升51%;分區訂正提升至0.41,提升64%。分區檢驗表明,針對暴雨及以上量級降水,分區訂正預報對于各個分區訂正效果不一,對浙中北沿海地區訂正效果不佳,其它地區分區訂正效果明顯提升。主要原因是浙中北沿海地區(即6區)暴雨以對流性降水為主,局地性強、突發性強,訂正效果較差;OCF預報對7區的預報效果較好,較難進行有效訂正。

(3)選取2021年臺風“煙花”登陸前造成的系統性暴雨、局部大暴雨過程和一次對流性暴雨、局部大暴雨過程對分區訂正預報方法進行檢驗。對于系統性暴雨、局部大暴雨過程,分區訂正后暴雨落區更接近實況,且預報出大暴雨區(其中四明山區、天目山區大暴雨落區與實況基本重合)。針對對流性暴雨、局部大暴雨過程,暴雨以上落區和強度預報效果有所改善,但出現較大范圍空報。

值得注意的是,不論是系統性降水過程還是對流性降水過程,雖然訂正后暴雨預報范圍接近實況,但對于大暴雨中心位置和強度的預報仍存在明顯偏差。其主要原因在于:偏差訂正法是通過對原有的預測值進行放大和縮小來調整降水量,它能有效訂正降水量的大小,通過訂正降水量可在一定程度上對降水落區做出訂正,但很難直接對整體降水落區進行修正;同時它訂正的基礎來源于歷史觀測和預報數據的內插,很難預報極端或大量級降水(特別是超歷史極值的降水)。這是分區降水訂正方法的缺陷,也是需要繼續提升的方向。分區訂正預報方法是由偏差訂正方法改進而來,經過2021 年汛期檢驗,結果表明該方法能依據各個降水相似區的降水特征對汛期降水預報進行有效訂正(特別是暴雨以上量級降水預報)。但它仍存在偏差訂正法固有的難以改進強降水落區偏差、極端降水預報訂正能力欠缺等問題??梢钥紤]采用機器學習方法如隨機森林、梯度提升樹模型等根據“配料法”來建立降水分類模型或總結分析不同天氣形勢下預報大量級降水偏差特征,根據該特征對大量級降水落區進行修正。極端降水預報訂正還可以結合集合預報(李俊等,2020)來做進一步探索。

猜你喜歡
落區實況分區
我國運載火箭落區控制技術取得新突破
上海實施“分區封控”
鄉村小學的愿望與現實——宜君鄉村教育實況
臺風“威馬遜”和“海鷗”與大尺度環流相互作用對云南暴雨落區的影響
掘進工作面管棚支護過冒落區探究與實踐
浪莎 分區而治
天舟一號貨運飛船發射實況掠影
可愛潮咖們的獨門彩妝實況直播
1209號臺風“蘇拉”登陸福建后垂直結構和暴雨落區關系
基于SAGA聚類分析的無功電壓控制分區
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合