?

建立我國數值預報同化診斷系統的行動方案頂層設計

2023-05-11 02:50朱國富
關鍵詞:數值觀測資料

朱國富

(中國氣象局地球系統數值預報中心,北京 100081)

0 引言

數值天氣預報已成為公認的現代氣象事業及其發展的最核心的科技。資料同化是數值天氣預報的一個主要組成部件,它基于統計最優估計方法產生大氣狀態的最優估計,來提供預報模式的盡可能準確的初始條件。更精確的資料同化方法的使用,諸如“四維變分同化方法”和“同化系統誤差參數設定的優化改進”這些主要科學進展,連同“可利用觀測資料的大量增加”,使得預報模式的初始條件得以改善,真正帶來了數值預報性能的顯著提高[1]。

歷經多年,數值天氣預報中資料同化系統已經發展成非常復雜的系統?,F在的同化系統要處理非常廣泛的空基、地基多種來源的氣象觀測數據,將這些數據與大氣狀態的先驗信息結合起來,并使用綜合復雜的預報模式線性化模型進行四維資料同化以確保觀測信息得到與模式動力一致的傳播和吸納。對如此復雜的系統,進行有效和協調的診斷是必要的,例如,僅就被同化的觀測數量,近幾十年來呈“指數級”增長,未來還將繼續增長;這需要基本的診斷工具進行一整套日常例行的觀測信息監控來保障正常的信息輸入,并需要復雜先進的診斷工具評估數據質量和信息冗余,以便對最有希望的觀測進行優先排序處理。同化診斷中觀測信息監控的一個經典例子是,利用1981年月平均資料,歐洲中期天氣預報中心(ECMWF)同化系統發現,在距離開普敦東南2300 km的一個南印度洋孤島(南非Marion Island)上,背景風和觀測報告風之間平均有10°~12°的系統性差異。對此進行的一項調查顯示,多年前安裝計算風向的軟件時,指定的風向參考是磁北極,而不是地理北極!之后ECMWF在1982年開啟了一個業務和研究部門間的重點合作研究項目,發現一些觀測平臺在持續地發送不正確的天氣報告,甚至有些簡直不按照約定標準編寫數據代碼!1985年,ECMWF被世界氣象組織(WMO)指定為監測全球高空資料的領導中心[2]。這是ECMWF之所以成為領導中心地位的一個具體經歷??梢?,也正是源自觀測信息監控,可以理解對分析場產生有害影響的觀測黑名單是作為基礎一環的質量控制方式。

診斷一直是ECMWF研究和開發的一個活躍領域。而且,數值預報系統的診斷是ECMWF總體戰略所必需的組成部分:面向ECMWF發展“從此處向何處去”,一個診斷戰略是必不可少的[3]。

診斷工作不僅僅是獲得一個總體了解,因為診斷是面向數值預報系統的所有環節及其組成部分,所有的研究人員都需要在自己的特定領域中制作相應的詳盡診斷。另一方面,隨著數值預報的發展,不可避免地,制作出預報的所有環節任務更加細分化和專門化。正是如此,提出了一個問題:未來我們是否需要加強跨傳統部門界線的溝通、協調和協作。面對這一問題,2010年ECMWF成立了“診斷工作組”(WGD:Working Group on Diagnostics),并作為WGD的第一個主要成果撰寫出技術報告“診斷研究進展”(Developments in diagnostics research)[3]。這份報告為考慮一般意義的診斷策略提供了借鑒,并為從無到有地開展常態化同化系統診斷工作提供了參考,包括診斷的要義、診斷工作定位的角色作用及其實現途徑或方式、診斷工作內容的框架等基本方面,例如數值預報的診斷框架(圖1)。

從圖1可以一般地描述數值預報意義上診斷工作的目的:深入動力框架、物理過程、資料同化各個組成部分,通過識別系統的缺陷、減小各環節的偏差、改進物理過程不確定性和觀測不確定性的描述等工作,來識別、調查和理解數值模式系統的預報性能問題和模式氣候狀態,以助力數值預報系統發展戰略的實現;并在所涉及的工作中將研究和業務的各個部門聯合起來。

后來ECMWF的診斷工作[4],其目的不變。診斷工作的發展體現在以下方面:診斷的施展空間面向預報系統在“所有預報時效”敏銳度和可靠性的改進;診斷以“極端天氣預報”為目標;與診斷關聯的互動超越ECMWF內部的研究和業務各部門而擴大到ECMWF成員國之間。而且,預報系統(以及觀測)的準確性不斷提高,意味著誤差比以往任何時候都要小,需要發展更精確的診斷工具來量化這些誤差。

本文將面向中國氣象局(CMA)四維變分同化系統自主研發的現實狀況和發展需求,思考國際上氣象數值預報先進業務中心的相關工作,結合在CMA同化系統自主研發實踐中的理解,形成建立CMA常態化同化診斷系統的頂層設計,旨在初步形成一套日常例行的同化診斷能力。

1 ECMWF診斷工作的啟示

1.1 診斷的要義(是客觀要求的“問題導向”,不是主觀的“找事情”;是“理解”,不是“較真”)

對于不同工作和人群的視角,“診斷”看似有不同的解釋,但所有的解釋都體現了“理解”這一概念。像ECMWF這樣的業務預報中心的診斷工作屬于“對(預報系統)誤差的診斷”(diagnosis of error),是調查、發現和理解數值預報系統中觀測、分析或預報各環節的誤差,進而解決問題來推動數值預報的發展。ECMWF診斷工作組從成立之初的2010年到2019年,盡管具體的診斷工作和診斷工具有了發展更新,但不變的是診斷要義:理解[2-3]。這對開展診斷工作的啟示是:數值預報系統的診斷是通過“問題導向”來調查研究制作出預報的各環節的誤差,和通過“理解”來推動數值預報的發展,也就是它“基于問題、歸于理解和終于協作”來解決問題。

事實上,這對于我國CMA數值模式的自主研發更有著現實意義。自主研發基于理解,理解是科技自主自強的首要要求,是氣象核心科技數值預報高質量發展的前提條件,不追求理解的自主研發是不可思議的。注重理解也是科學家精神的基本內涵。

1.2 認識診斷工作的出發點(首要在“前端”和“基本”)

在ECMWF最初成立的診斷工作組的診斷研究進展[3]中,觀測信息監控(Observation monitoring)是ECMWF診斷系統的一個關鍵組成部分;其中的許多診斷是基于觀測空間下背景場(B)和分析場(A)與觀測(O)的離差,即所謂的(O-B)和(O-A)。對于再分析的診斷,重點是數據的時間一致性。ECMWF集合預報系統的診斷集中關注“集合離散度和集合平均誤差之間的不一致性”如何與“初始條件和預報模式中不確定性原因的描述缺陷”關聯起來。從中我們能聯系到其中內在的原因和事實:

1)對于觀測信息監控,許多診斷基于(O-B)和(O-A)。這是因為對(O-B)和(O-A)進行的數據統計為觀測、同化或預報等方面的特征描述提供了強有力的基礎,而且其中的(O-B)(稱作“新息”(innovation))是同化系統的基本輸入,是用來更新背景場而得到分析場的、用作訂正的新信息;如果基本輸入錯誤,則直接對分析場產生有害影響,如引言中的觀測信息監控的一個經典例子[2]。

2)對于再分析,它是基于觀測、同化、預報三個串聯方面的先進性和一致性來得到先進的穩定一致的長時間序列格點資料。其中觀測數據的時間一致性不僅處在這個串聯鏈條的最前端,而且是再分析的關鍵性重點;因為再分析是基于使用當下最先進的業務同化系統和預報模式系統而制作出來的,這樣再分析中同化和預報這兩個方面的先進性和一致性而自然得到了保障。

3)對于集合預報,評估集合預報可靠性的一個通用診斷是集合離散度和集合平均誤差之間的關系[5]?!案怕暑A報崩潰”被定義為當集合離散度很小、但集合平均誤差很大時發生的情況。因此集合離散度和集合平均誤差是集合預報診斷中必需首要考慮的“基本所在”。

這些對我們開展診斷工作的啟示是:診斷工作首要和首先從“鏈條前端”和“基本所在”開始。為此,需要在認知上理解清楚“哪些是基本的”和在實施上考慮哪些是“現在能做的”和“客觀上必須做的”。

1.3 診斷工作的架構和范圍(所有環節及其組成部分)

數值預報的步驟過程表現為:通過資料同化方法得到分析場,由它作為預報模式的初值;然后積分預報模式到未來某一時刻,便得到該時刻的預報場。相應地,數值預報系統有兩個主要組成部分:初值形成的資料同化系統和時間積分的預報模式系統。資料同化系統包含引入各類觀測的若干觀測算子和作用于每一個觀測來傳播觀測信息的一個核心框架;預報模式系統包含一個動力框架和若干物理過程。通常地,預報模式動力框架是指預報模式方程的絕熱、無摩擦的網格尺度動力過程,各個模式物理過程是指不同的源、匯項或不同的次網格尺度物理過程(如深/淺對流過程、輻射過程、大氣邊界層過程和陸面過程)。

診斷是面向數值預報系統的各個環節及其組成部分。因此,數值預報系統診斷工作的架構包括資料同化診斷和預報模式診斷兩個部分。預報模式的診斷范圍包括動力框架診斷和各個物理過程診斷。

因為資料同化是上接各類觀測、下連預報模式的一個綜采工作面(coal-face),因此它的診斷范圍是巨大的,而且隨著觀測日益增加在不斷增長擴大。資料同化的診斷范圍包括面向觀測(O)的觀測信息監控、面向(O-B)和(O-A)統計特征描述的診斷及其觀測質量的監測和評估、面向得到分析場之求解過程的監控和分析、面向同化系統預先設定的誤差參數的診斷、面向分析場(A)的觀測對分析的敏感性評估、面向模式預報效果的觀測對預報質量的影響評估等。

1.4 診斷工作組的角色定位(把各個部門聯合起來,加強跨部門的“交流”“協調”和“協作”)

隨著數值預報的發展,生產出預報的所有環節任務更加細分化和專門化;同時,把各個部門聯合起來的作用(the unifying role)又隨之日益變得越來越重要。正是在這個背景下,ECMWF成立了診斷工作組(WGD),來加強跨部門的交流、協調和合作[3]。WGD的第一個任務就是明確界定這些角色作用:

1)合作課題的監督(the over-sight of collaborative projects)。一些很好的例子如:現有同化或預報問題需要協作開展的診斷;預報系統升級時所需的各環節診斷評估;改善災害性天氣預報的交叉性診斷課題(涉及該類天氣的識別方法,預報系統對其預報能力相關的所用資料的同化和關鍵物理過程的描述等評估,集合預報系統是否能夠足夠地表示其發生的可能性等調查研究)。除了這些明確主題的合作課題,還可能從中產生未來的診斷領域或開發新的診斷工具。

2)診斷工具研發的戰略協調(the strategic coordination of diagnostic developments)。包括:共同感興趣的新診斷工具的研發,如對于物理過程診斷工具的研發,因為未來隨著模式變得更好,物理過程的改換對模式氣候的影響應該會更小并需要更精確的診斷工具,以及物理過程數量的增加大大增加了相互作用的范圍,這些因素都要求新診斷工具的研發及相關環節的研發協作;使現有診斷工具得到更廣泛應用的戰略協同,如診斷工具的通用腳本語言的使用和更廣泛可操作的界面接口,以及診斷工具的持續維護和文檔化;需要確保診斷在計算和存儲資源方面得到滿足。

正是通過這些角色作用,ECMWF診斷工作組利用診斷研究,理解業務數值預報的優勢與不足,發現問題并研討確定解決問題的方案,確立了它在模式進展中的中心地位,推動數值預報系統多年來取得了許多重要的進展[6]。

這些對我們開展診斷工作的啟示是:把各個部門聯合起來的“融合發展”是診斷工作組的工作屬性;“能協作得起來”的客觀要求是數據存取格式和圖表繪制顯示的通用性、共用性,而且特別是高度的靈活性,因為它們是診斷工作的基礎性支撐:診斷中為了發現、分析問題,需要大量的數據和圖表,來以此為基礎進行各種各樣的對照比較和數據統計。

上述合作、協調和交流的角色作用對我們建立診斷工作組以及如何發揮作用和從無到有地開展診斷工作提供了直接參考。事實上,在ECMWF專家的一直關注下[6],中國氣象局地球系統數值預報中心的一個實體診斷小組已經成立;ECMWF專家還建議:應該考慮制定一項戰略來確定診斷小組的主要優先任務,包括建立一整套日常例行的診斷,旨在監測和指導數值預報系統的改進。

2 CMA常態化同化診斷系統的頂層設計

CMA同化系統采用四維變分同化方案。變分同化方法是大氣狀態的后驗概率最大時取眾數的統計最優估計方法;導出變分同化目標泛函的一個基本假定是“觀測和背景場的誤差無偏且為正態分布”。CMA四維變分同化系統在業務實施上利用一種增量方法[7],考慮內外循環,進行目標泛函的極小化迭代數值求解,來減少計算開銷。

CMA同化診斷系統面向CMA同化系統的各個組成部分和業務同化系統研發的環節步驟,理清“現在能做的”和“客觀上必須做的”基本所在,以程序流的全過程和業務研發的內在邏輯進行頂層設計。

2.1 同化診斷的總體架構

首先理清楚任一同化系統運行的組成部分和業務同化系統研發的基本環節步驟:

1)同化系統中的程序流表現為觀測輸入、求解過程和結果輸出。

2)現行的先進同化方法都屬于統計最優估計方法,因為它們基于數據誤差是高斯分布等假定,所以都存在預先設定的參數;對于一個業務的同化系統,在其建立之后,不論是必需的不斷優化改進,還是要考慮系統中參數的季節變化,都首先是需要診斷預先設定的參數是否合適。

3)對于不斷涌現和更替的新資料,是否能進入業務數值預報系統,必需對新資料的準入進行診斷評估;面向觀測—預報交互式數值預報,需要診斷評估觀測對分析或預報的敏感性影響。這些都是基于同化系統的診斷。

1.1.3 CKD-MBD診斷標準 參照2013年中華醫學會腎臟病學分會頒布《慢性腎臟病礦物質和骨異常診治指導》[8]擬定:(1)血清鈣(Ca)、磷(P)、甲狀旁腺激素(iPTH)或維生素D代謝異常;(2)骨轉化、礦化、骨量、骨線性生長或骨強度異常;(3)血管或其他軟組織鈣化。符合以上三點之一即可診斷為CKD-MBD。

由此按照同化系統的程序流和業務同化系統研發的內在邏輯,形成同化診斷的總體架構:

1)利用同化系統的“輸入信息”進行診斷。

2)利用變分同化的“執行過程”進行診斷。

3)利用同化系統的“輸出結果”進行診斷。

4)面向業務同化系統研發精雕細刻的“參數優化”進行診斷。

5)面向業務同化系統的新觀測資料準入進行診斷評估。

這些在一起能夠初步形成一套日常例行的同化診斷能力。

2.2 同化診斷的內容及其途徑和作用

2.2.1 輸入信息的診斷

這在內容上屬于觀測信息監控。觀測信息監控處在整個數值預報系統診斷的前端,也是ECMWF診斷系統的一個關鍵組成部分。

觀測信息監控包含了觀測資料計數及其空間分布的監控和輸入信息的診斷。資料計數包括到報的資料數、被篩除的資料數、被同化的資料數,空間分布包括各類觀測的總體和不同層(或通道)的空間分布。輸入信息的許多診斷是基于觀測空間下(O-B),如它的統計特征描述,包括均值、均方差、偏差訂正、頻數分布(對應概率密度分布PDF)等。利用(O-B)的信息,在了解數據、認識數據上有諸如以下的許多作用:

1)用來監控資料同化中觀測亦或背景場的誤差是否無偏和正態分布,以及監控觀測資料處理的偏差訂正。

2)它的時序資料可用來監控觀測資料的時間穩定性、質量控制有效性和觀測質量,確保只有始終如一好質量的資料在業務中被同化使用。

3)利用它和其他觀測進行比較,來監控觀測的質量。

事實上,觀測空間下(O-B)和(O-A)數據統計為觀測、同化或預報等方面的特征描述提供了強有力的基礎,許多診斷是基于此,因為(O-B)和(O-A)的監控對資料同化過程的上、下游都發揮作用,除了上面的作用,如對上游:用于同化系統中誤差參數的預先設定即下面2.2.4節“參數優化的診斷”;如對下游:當不同觀測都一致發現(O-B)的系統性的非零值時可突顯出預報模式問題。

2.2.2 執行過程的診斷

這是面向得到分析場的求解過程進行的診斷。極小化求解迭代是否收斂和收斂程度,分析值受其直接影響。所以一個基本的方面是需要通過極小化的迭代步數、目標泛函值下降率、目標泛函梯度下降程度等的監控和分析,來診斷目標泛函求解的收斂情況。

2.2.3 輸出結果的診斷

這是面向分析結果進行觀測對分析的敏感性評估。通常地,根據分析場(xa)與觀測(yo)和背景場(xb)的關系:xa=xb+W[yo-H(xb)](其中,H為觀測算子,W為最優權重矩陣),利用變分同化系統核心框架中的變量變換和同化系統觀測算子的切線性模式及其伴隨模式,通過伴隨技術可以相當嚴謹地得到各個觀測對分析場的敏感性。還可以比較簡單地利用變分同化系統目標泛函的觀測項(Jo),通過由(O-B)和(O-A)計算的目標泛函值來大致地評估各個觀測對分析場的相對貢獻。

面向分析場的診斷可用來評估不同觀測的貢獻作用多少、是否信息冗余和可能的數據質量,以便對最有希望的觀測進行優先排序處理和應用于觀測—預報交互式數值預報。

2.2.4 參數優化的診斷

同化系統誤差參數包含于xa=xb+W[yo-H(xb)]中的最優權重矩陣W,所以直接左右了分析結果xa。因此,診斷預先設定的誤差參數是否合適是同化系統自主研發在系統建立之后需要考慮的固有步驟,以及應用已有或他人同化系統時進行參數優化改進的必備環節。

可以利用(O-B)和(O-A),通過觀測空間的后驗診斷方法[8-9]進行新息、背景場誤差、觀測誤差的一致性診斷和分析誤差的診斷:,R表示觀測誤差協方差矩陣,B表示背景場誤差協方差矩陣,H表示H的切線性模式,上角標T表示矩陣(或向量)的轉置,HBHT為觀測空間下的背景場誤差協方差,HAHT為觀測空間下的分析場誤差協方差)。

通過計算出的后驗診斷值與同化系統中的預先設定值的比較,用來診斷同化系統中預先設定的誤差參數是否合適,以及如果不合適時給出調優改進的方向。

2.2.5 新種類觀測資料準入的診斷評估

這是面向模式預報進行觀測對預報的影響評估。通常地,對現有的所有觀測,通過觀測系統試驗(OSE)(考慮逐個觀測排除的一個時段預報試驗(data denial experiments),即逐個觀測排除敏感試驗),來診斷評估不同設置的各種類觀測對預報質量的影響。對于新種類觀測,通過一體化設計的觀測系統模擬試驗(OSSE)和OSE,來評估新種類觀測資料是否準入。正是這樣的診斷評估保障了使用所有資料的控制預報試驗的預報質量最好。

3 開展這項工作的主要優先任務和開端性思考

3.1 主要優先任務

巧婦難為無米之炊。同化診斷工作的前提和基礎是必需同化診斷必備數據的數據庫建設。首要是觀測空間的數據,其最基本內容包含:觀測值yo、觀測誤差標準差σo、質量控制標識IQC、觀測偏差bo、背景場的觀測相當量yb、分析場的觀測相當量ya。也由此得到(O-B)和(O-A)數據。

必須用利于通用性、共用性、特別是高度靈活性的觀測空間數據庫和模式空間數據庫的數據存取格式;它們是診斷工作的最基礎性工作和保障性支撐,也是保障“能協作得起來”的客觀要求。

在同化診斷工作的內容上,首要是針對觀測資料數統計和利用觀測空間的(O-B)和(O-A)數據,建立一套日常例行的同化診斷系統,來實現觀測信息監控、觀測項(Jo)中觀測對分析作用大小的診斷評估和同化系統參數的觀測空間后驗診斷。

3.2 開端性思考

診斷是“基于問題、歸于理解和終于協作”來解決問題而推動數值預報系統的進展。診斷的出發點在“問題導向”,且是以過程為導向的面向各個組成環節的問題,診斷的要求是“追求理解”,完成診斷工作依靠“團結協作”。這些是診斷工作的客觀固有的工作屬性,是診斷工作的應有之義和實際樣子。特別是,把各個部門聯合起來的“融合發展”是診斷工作組的工作屬性。開啟診斷工作在觀念上首先需要這些基本共識,來了解這是一份在作風上不在說好話、在過程上還是個急不來的工作,而營造和增加工作上的理解氛圍和克服“找事情”“較真”“各自為戰”的主觀性傾向。

在行動上特別需要把各個部門聯合起來的“融合發展”來開展同化診斷工作,例如:

1)對于不斷更替的衛星輻射率新資料,衛星觀測信息監控的研發需要同化診斷部門和衛星資料同化部門的共同協作。

2)對于極小化求解過程的診斷和利用觀測算子的切線性模式及其伴隨模式的觀測對分析或預報的敏感性影響的診斷評估,需要同化診斷部門和同化系統研發部門的共同協作。

而且,貫徹落實“充分發揮組織優勢,強化與上下游氣象業務單位的合作銜接,統籌用好全國資源”①http://www.cma.gov.cn/2011xwzx/2011xqxxw/2011xqxyw/202203/t20220303_592682.html。,來優勢互補、團結協作地推進同化診斷系統的技術攻關和業務建設,例如:

1)可以通過CMA數值預報中心與國家衛星氣象中心、國家氣象信息中心、CMA氣象探測中心的通力協作,針對數據管理,建立通用、共用、特別是高度靈活的觀測空間和模式空間診斷必備數據庫存取平臺,筑牢診斷工作的前端基礎。

2)可以通過CMA數值預報中心與國家氣象中心、國家衛星氣象中心、華風氣象傳媒集團有限責任公司的通力協作,針對軟件系統的開發和管理,研討一體化、模塊化的軟件系統封裝技術、界面接口頂層設計和避免自說自話的開發工作方式,建立靈活、豐富的數值預報診斷輸出圖表繪制顯示平臺,在技術上支撐診斷工作的現實需要和規范化發展。

3)預報員有著在數值預報產品應用中通過天氣場景分類的模式產品表現而更具象化地發現問題的優勢,研發者有著在數值預報系統診斷中通過物理和數值模型的理解而更深入地發現問題的優勢?;趩栴}導向,建立和加強一線研發人員和全國有經驗的優秀預報員的聯系橋梁,通過課題合作機制和定期交流機制,共贏地促進研發人員對數值模式問題的診斷與改進和預報員對數值模式產品的理解與更好應用。

對于開啟同化系統的診斷工作,觀念上有共識至關重要,是團結奮斗的思想基礎和前提;行動上通用、共用、特別是高度靈活性的診斷必備數據至關重要,是開展診斷工作的前端基礎任務和團結協作的支撐條件。需要遵循診斷工作的實際樣子,開啟和推動同化診斷系統研發基于“問題導向、科學理解和團結協作”的高質量發展。

猜你喜歡
數值觀測資料
觀測到恒星死亡瞬間
用固定數值計算
數值大小比較“招招鮮”
Party Time
PAIRS & TWOS
JUST A THOUGHT
天測與測地VLBI 測地站周圍地形觀測遮掩的討論
可觀測宇宙
基于Fluent的GTAW數值模擬
高分辨率對地觀測系統
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合