呂泓柯, 鞏遠發, 王桂華
1. 成都信息工程大學大氣科學學院, 四川 成都 610225;
2. 湖南省人工影響天氣領導小組辦公室,湖南 長沙 410118;
3. 氣象防災減災湖南省重點實驗室,湖南 長沙 410118;
4. 復旦大學大氣與海洋科學系, 上海 200438;
海洋表面鹽度(sea surface salinity, SSS)和海洋表面溫度(sea surface temperature, SST)是海洋表面的基本物理狀態, 在水循環、海洋環流、海洋生態系統乃至天氣和氣候變化等方面都發揮著至關重要的作用(Lin et al, 2001)。
相比SSS, 人們對SST 的研究深入得多。SST的觀測技術發展相對較長, 目前國際上有多種較為完整的SST 產品 (Guan et al, 2003; Thiébaux et al,2003; Reynolds et al, 2007; Woodruff et al, 2011;Donlon et al, 2012), 其應用也相當廣泛和成熟(Srivastava et al, 2000; Guo et al, 2004; Zhan et al,2011)。然而, 受觀測資料的限制, 鹽度的研究則相對較為匱乏。在20 世紀末Argo 計劃實施前, 全球海洋每年的鹽度觀測數據只有溫度的15%左右。Argo 計劃實施后, 對海洋鹽度的觀測能力得到極大提升, 至2005 年左右, 每年的鹽度觀測數量與溫度基本相當(王輝贊 等, 2012)。進一步, 隨著海洋鹽度衛星 SMOS(Soil Moisture and Ocean Salinity)、SAC-D(Scientific Application Satellite-D)等的成功發射, 逐漸積累了一定量的鹽度數據, 這為開展鹽度方面的研究乃至預報工作提供了極大保障。
印度洋作為印—太暖池的重要組成部分, 對我國天氣和氣候所起的作用被廣泛關注。印度洋是印度季風的發源地和流經地, 印度季風是亞洲季風的主要成員, 而印度洋的變化能通過影響具有行星尺度的亞洲季風系統在中—高緯度的相互作用來影響中國天氣氣候的異常變化(晏紅明 等, 2000)。海洋上層鹽度對天氣過程、季節內振蕩以及季節與年際等更為低頻的海氣耦合模態, 都有重要的反饋作用(Qiu et al, 2012)因此, 開展印度洋SSS 的預報工作,對預報預測中國天氣氣候具有一定的指導意義。
現有海洋模型HYCOM、MOM、NEMO、ROMS和POM 等, 可以對全球海洋進行模擬預報(方長芳等, 2013)。但是, 多變量經驗正交函數(multi-variate empirical orthogonal function, MEOF)和線性馬爾可夫相結合的預報模型(簡稱線性馬爾可夫模型, 下同)憑借著計算便捷, 開發成本低且預報效果好等因素,被廣泛應用于各種海洋要素的預測, 如太平洋海表溫度異常(Johnson et al, 2000)、南極海冰(Chen et al,2004)、ENSO(Xue et al, 1994)、東亞季風降水變化(Wu et al, 2013)等。尚未發現利用該模型對鹽度進行預測的研究, 故本文嘗試將線性馬爾可夫模型初步應用于印度洋SSS 的預測, 從混合層鹽度收支方程出發, 選擇海表面高度(sea surface height, SSH)、SST、SSS 等物理量的異常值作為模型的組成部分,對印度洋SSS 進行逐月預報, 并進一步考慮遙相關關系, 提高線性馬爾可夫模型的預報能力。
基于鹽度方程進行物理量的選擇。由于模式是在MEOF 的基礎上構建的, 因此需要考慮大氣、海洋動力學和熱力學因素對SSS 變化的作用, 故我們根據混合層鹽度收支方程(Foltz et al, 2004)選擇物理量。
除了SSS 可以明顯地影響自身變化以外; SSH也可以通過影響海洋水平速度進而影響SSS; 再者,海溫也可以通過影響大氣環流和降水來間接影響SSS?;诖朔治? 本文選用的資料包括: 來自Argo項 目 (http://apdrc.soest.hawaii.edu/las/v6/constrain?var=204)的月均SSS 數據, 格點為1°×1°。月均SSH數據來自哥白尼海洋環境監測服務中心 (center for marine environmental monitoring service, CMEMS)(https://marine.copernicus.eu/), 并插值到 0.5°×0.5°的網格上。1°×1°分辨率的SST 數據由美國國家環境預測中心(National Center for Environmental Prediction, NCEP)(https://psl.noaa.gov/data/gridded/data.ncep.reanalysis.html)提供。此外, 方程中包含的蒸發、降水等物理量, 因對預報效果改善并不明顯(詳見3.1), 這里一并略去。最后, 參與模型構建的時間尺度選擇2005—2017 年, 模型使用的區域覆蓋了印度洋地區(40°S—30°N, 30°E—110°W)。
關于線性馬爾可夫模型構建細節(Chen et al,2004)大致分為以下幾個步驟:
1) 計算各變量的逐月異常值, 即各變量減去各月在13 年(2005—2017 年)內的平均值, 并分別歸一化。再將上述各異常值保持時間尺度不變, 并在空間上進行累加, 組合成一個時間和空間的二維數組。
2) 將這個數組進行MEOF 分解:
式中,V為進行MEOF 分解的數據矩陣,E和P分別為MEOF 分解后所得到的空間模態和相應的時間序列,T為矩陣轉置符號。
3) 將時間序列按月拆分。假設相鄰的PC 之間存在線性關系, 計算自然月間的馬爾可夫過渡矩陣A:
式中,Pi和Pi+1分別為第i個月、第i+1 個月的時間序列,ei為誤差。從上式得到
式中, 尖括號表示時間平均, 對于最優的模型配置來說誤差ei與PT i線性無關, 故轉移矩陣A為:
由上式得到的轉移矩陣一共有12 個, 即1 月與2 月, 2 月與3 月……12 月與翌年1 月間的過渡矩陣。
4) 保留適當的模態, 通過依次應用馬爾可夫過渡矩陣預測時間序列, 并將相應的預測值與各自的空間場相結合, 最終達到對所選變量預測的目的。
本文主要運用統計學的方法來衡量模式預報結果的優劣性, 包括均方根誤差(RMSE)和相關系數(r)。其中均方根誤差是真實值與預報值之間的偏差,用于衡量模式結果的準確度。相關系數則是反應觀測值與預測值之間相關關系的密切程度。設X(ii= 1,2, …,n) 為預報值,Yi(i= 1,2,… ,n)為相應的觀測值。和σ X(σY)分別為X i(Yi)的平均值和標準差, 有如下的統計關系:
傳統線性馬爾可夫模型總是選擇同一區域的物理量進行構建, 本文一開始對印度洋鹽度預報模型的構建亦是如此, 但實際影響印度洋SSS 的物理量遠不止于此, 比如太平洋可以通過印度尼西亞輸運量(Indonesian throughflow, ITF)(劉凱 等,2011)、印度洋偶極子(Indian Ocean Dipole, IOD)(Saji et al, 1999)、熱容量和海洋羅斯貝波等對印度洋產生影響(李雁領 等, 2004; 王健 等, 2014)。所以我們需要考慮遙相關關系, 即向該模型里加入不屬于同一區域但相關聯的物理量, 提高模型的預報水平。
為合理預估保留的MEOF 模態數, 我們首先分別對各個物理量的異常值進行EOF 分解并計算其方差貢獻率。圖1 分別為印度洋區域海表面高度異常(sea surface height anomaly, SSHA)和海表面溫度異常(sea surface temperature Anomaly, SSTA)以及海表面鹽度異常(sea surface salinity anomaly,SSSA)在EOF 分解后的方差貢獻分布情況。當EOF模數大致小于 5 時, 所有物理量的方差貢獻率都較大, 反之方差貢獻率相對較小。這表明前幾個模態就能強烈地捕獲這些參數的主要信息。因此, 在后續的工作中, 我們只需要為該模型保留 5 個左右的模態。
圖1 各物理量在不同EOF 模態上的方差貢獻分布圖Fig. 1 Distribution diagram of the variance contribution of the EOF
MEOF 方法是常用的包含多個氣象要素場的分析方法, 圖2 便是由SSS、SST 和SSH 組合而成的數組在前三個模態的空間變化。前三模態方差貢獻率分別為13.2%、8.6%和5.9%。第一模態里, SSS隨緯度的分布呈帶狀變化, 正值極區位于印度洋北部, 負值極區位于印度洋中部, 隨后在印度洋南部呈現偏正的特征。在第二模態中, SSS 存在反相變化的偶極模式, 并呈現東西分布的狀態, 這與第二模態的SST 空間場較為相似。最后, 在第三模態中,SSS 空間場在大部分海盆內都呈現了偏負值的情況,而SSH 空間場的絕大部分海域在前三個模態也呈現負值。故在模型中加入SSH 和SST, 能更好地模擬印度洋SSS 的空間變化。
圖2 由SSS、SSH、SST 組成的數組進行MEOF 分解得出的前三模態的空間場Fig. 2 First three MEOF modes of the combined SSS, SSH and SST
首先使用非交叉驗證方法來討論線性馬爾可夫的后置預測模型, 這是一種不破壞數據連續性的方法。為使結果差異明顯, 我們先對每一個網格點隨時間變化的基礎上求得相關系數, 再進行區域平均(下同)?;谏鲜鲇懻摰慕Y果, 保留前3、5、7 個模態數, 提前0~12 個月預測場與觀測場之間的區域平均相關性如圖3 所示(其中每個點的相關系數都通過了顯著性檢驗, 下同)。在大部分提前時間范圍內,保留模態數越多, 預測效果越好, 所以這里討論保留前7 個模態的模型。同時, 本文以相關系數r=0.5為參考,r>0.5 代表較好的預報,r<0.5 則代表不理想的預報。如圖3a 所示, 如果實驗中只包含SSSA, 大致可提前6 個月在印度洋進行海表鹽度預報。如果考慮加入SSTA(圖3b)或者SSHA(圖3c), 提前8 個月的預報效果也是較好的。包含SSHA 或SSTA 的模型似乎顯示了更多與原始場相匹配的細節, 這可能是因為海洋包含了系統的大部分信息。最后, 當我們添加了SSSA、SSHA、SSTA(圖3d)之后, 改善效果更為明顯, 甚至可提前9 個月進行印度洋海表鹽度的預報。
圖3 預測和觀測SSSA 的相關性折線圖Fig. 3 Line plot of non-cross-validation correlation coefficients for the predicted and observed SSA
選擇適宜的物理量不是一蹴而就的, 從混合層鹽度收支方程中可以發現, 還有很多物理量會影響鹽度的變化, 如蒸發、降水、海表面風場等等。但如圖4 所示, 這些物理量的加入并不能提高模型的預報能力, 因此后續工作中都將其舍棄。
圖4 預測和觀測SSSA 的相關性折線圖Fig. 4 Line plot of non-cross-validation correlation coefficients for the predicted and observed SSSA
運用交叉驗證, 保留不同MEOF 模態數進行后置預測實驗, 進一步探討模型的構造?;谏鲜鲇懻? 模型的技能似乎隨著保留的模態數增加而增加。但從理論上講, 馬爾可夫模型只需要保留一定數量的模態數, 因為使用太多的模態可能會有很多噪聲污染模型。此外, 在上述非交叉驗證的預報中存在一定人為影響, 因為該模型用于驗證的數據與參與模型構造的數據是存在重疊的情況。所以我們運用交叉驗證的實驗來解決上述問題, 一般方法如下: 首先, 對多變量矩陣進行MEOF 分解, 得到對應的空間模態和時間序列(步驟只做一次); 再對每年的PC 進行一一驗證, 這里設定用于驗證的數據是時間范圍為1 年的PC 數據, 用于驗證的PC 從頭開始逐月向后, 直至時間序列的末尾, 共計156 次(13 年×12 月=156 次)。這里保留對應的物理量和一定的模態數, 建立線性馬爾可夫的驗證模型。圖5顯示保留了13 年的SSSA、SSHA 和SSTA 組合而成的樣本, 在不同的模態數和預報時間基礎上, 預測SSSA 和觀測場之間交叉驗證的相關性。我們得出, 模型預報技能并沒有隨著保留模態數的增加而增加, 當保留前5 個模態時, 預報效果最好。此外,印度洋區域海表鹽度的后置預報技能較為可觀, 即便提前8 個月, 該相關性也會在0.4 左右浮動。
圖5 后置預測和觀測SSSA 之間的交叉驗證相關性在印度洋地區保留不同模態數, 由SSSA、SSTA、SSHA 組合而成Fig. 5 Line plot of cross-validation correlation coefficients for the predicted and observed SSSA
為更直觀的對比分析, 把僅包含SSSA 的模型和包含SSSA、SSTA、SSHA 的模型從上述交叉驗證實驗中得到的相關系數在空間上進行繪制。其中,所有小于0 的點都設置為0。如圖6 所示, 2 個模型雖然都存在隨著預報時間的增加, 預測效果變弱的情況。但是, 即使提前預報時間較長(如圖所示提前9 個月), 模型所擁有的相關性較好的區域(紅色區域)也相當多, 這說明該預報模型是可行的, 甚至在部分區域的預測效果是很好的。此外, 包含SSSA、SSTA 和SSHA 的模型預測結果較好的區域是完全大于僅包含SSSA 的模型, 這也進一步說明了多元成分模型的優越性。
圖6 后置預測與觀測SSSA 的相關系數空間分布圖Fig. 6 Spatial distribution of cross-validation correlation coefficients for the predicted and observed SSSA
綜上所述, 通過上述各種關于模型構造的討論,我們將保留SSSA、SSTA、SSHA 和前5 個模態, 進行后續預報實驗。
為提高預報效果, 有必要對傳統模型進行改進。由于傳統模型僅由同一區域的部分物理量進行構造, 但是影響該區域物理量(預報量)的物理量遠不止于此, 因此, 這里考慮向模型中添加有遙相關關系的因子?;谝汛_定的物理量, 特別添加南太平洋的SSHA、SSTA 以及IOD 系數(方法2), 挑選合適物理量的方式與3.1 一致, 這里不再贅述。最終基于“實時”預報的評估結果如圖7 所示。為避免結果的偶然性, 我們把新“實時”預測得到的物理量(預測量)放入模型中對應物理量(觀測量)的末尾,保證模型中數據時間尺度不變, 去掉前端的數據,從而構成新的模型。并一次又一次地預測得到新的量, 重復上述步驟, 直至時間序列的末尾, 最后做時間平均。從圖7 可知, 當模型添加這些遙相關量以后, RMSE 明顯變小, 相關系數增加。從相關系數的均值計算得出, 這樣的預報效果大約提高10%。這意味著這種方法是可行的, 故下文利用改進后的模型對印度洋SSS 進行“實時”預測, 進一步檢驗該模型的效果。
圖7 觀測與預測SSSA 場之間的RMSE 及相關系數Fig. 7 The RMSE and the correlation coefficients between the observed and predicted SSSA fields
所謂“實時”預測, 預測的目標周期都超過模型的訓練周期。本文從2017 年12 月開始, 逐月對印度洋SSS 進行預測, 其預測效果(RMSE 和相關系數)隨時間的變化如圖8 所示。在預測的前7 個月內,RMSE 從0.24 降低到0.1, 相關系數從0.95 增加到0.99。不僅如此, 為比較原始數據和預測數據隨時間的變化, 我們選擇大洋東西分界78°E 和南北分界線赤道為斷面。同時, 把HYCOM 在2008 年SSS 的逐日后置預報數據處理成逐月平均數據(https://www.hycom.org/dataserver/gofs-3pt0/analysis), 一同參與比較。如圖9、10 所示, 首先, 線性馬爾可夫模型預測得到的SSS 的空間分布特征與觀測場較為吻合,均呈現出西高東低(圖9)和南高北低(圖10)的分布態勢。此外, 在赤道斷面, 本文模型預測的SSS 極值在冬季相對較大, 在夏季相對較小, 這與觀測場隨時間的變化情況是一致的, 這說明本模型的預報場能捕捉與觀測場一致的季節變化特征。然而, HYCOM 后置預報場的預報能力相對較弱, 特別是在赤道斷面上的負值區域。這也進一步表明本模型對印度洋SSS的時空變化特征具有較好的預報優勢。
圖8 觀測與預測SSS 之間的RMSE 及相關系數(印度洋區域)Fig. 8 RMSE and correlation coefficients between the observed and predicted SSS in the Indian Ocean
圖9 印度洋區域赤道斷面提前1~11 個月的SSS 觀測(左)、馬爾可夫模型預報結果(中)和HYCOM 后置預報結果(右)Fig. 9 SSS observations (left),Markov modelforecast results (center) and HYCOM hindcast results (right)for 1-11months earlier, onthe equatorial section of the Indian
本研究建立了一個MEOF 與線性馬爾可夫相結合的模型來預測印度洋區域SSS 的變化。采用交叉驗證和“實時”預測的方式評估了該模型的預測能力?;?13 年逐月樣本的統計模型, 使用印度洋的SSSA、SSTA 和SSHA, 保留前5 個模態, 對印度洋海表鹽度進行預報, 結果表明該模型具有較好的性能, 大致可提前9 個月進行較好的預報。進一步考慮遙相關作用, 向該模型中添加南太平洋的SSHA, SSTA及IOD 系數, 預報效率平均提高10%(相關系數)。
本文采用的預報方法, 計算便捷且開發成本低,為變量的預測提供了一個很好的選擇。但是, 在本文模型中, 加入蒸發量、降水量和海表面風場等物理量并不能給印度洋SSS 帶來更好的預報效果, 目前尚不清楚原因, 需要進一步探究。未來我們將考慮更多的變量來拓展本文的工作, 并進一步推廣至全球海洋SSS 的預測。