?

基于深度學習的閩浙贛GPM降水產品降尺度方法

2023-12-28 07:26李新同史嵐陳多妍
自然資源遙感 2023年4期
關鍵詞:氣象站降水量尺度

李新同, 史嵐, 陳多妍

(南京信息工程大學地理科學學院,南京 210044)

0 引言

在地球水循環的環節中,水循環通過降水連接陸地、大氣和海洋的水分交換過程。降水對氣候、水文、植被等方面有著重要的意義,降水量影響大氣中的水循環過程、局地氣候和全球糧食作物的收成[1-4]。研究降水的空間分布,有利于監測洪澇災害,做到提前預警,同時也能提前應對干旱地區的缺水情況。雖然獲得降水數據依靠地面氣象站點監測,但是受到地形的限制和氣象儀器設備缺少的影響,有些區域甚至沒有完整連續的多年降水數據,因此很難獲取某些地區的實測降水數據[5]。在海洋上,由于沒有地面氣象站點,所以對研究降水時空分布造成了很大的困擾,而衛星遙感則沒有這些限制,它為獲得全球降水數據提供了便利。

全球降水測量計劃(Global Precipitation Measurement,GPM)衛星于2014年由美國國家航空航天局地球科學辦公室和日本空間發展署發射,目的是為星載定量降水估計建立新的標準,提供下一代新的降水產品[6-7]。GPM產品與上一代的衛星降水產品熱帶降雨測量(Tropical Rainfall Measuring Mission,TRMM)比較,觀測范圍更大,由原來的50°N~50°S擴大成90°N~90°S,也更加適用于研究中國區域降水。

GPM的空間分辨率(0.1°×0.1°)雖然比TRMM高,但在地形復雜的地區,其精度仍然不高,需要用降尺度的方法提升GPM降水產品的精度。目前已有國內外學者基于降水主導因子對GPM降水衛星產品建立降尺度模型,如Lu等[8]以中國天山山脈為研究區域,基于地形因子和植被指數構建地理加權回歸降尺度模型,與逐步回歸降尺度模型進行對比; 史嵐等[9]引入水汽數據,結合地形因子和植被因子,構建地理加權回歸降尺度模型; 胡實等[10]研究將GPM降水產品與植被指數和高程結合,構建時滯地理加權回歸模型; Brocca等[11]結合GPM早期降水產品、雨量計和歐洲中期降水中心天氣預報再分析3種降水產品,提出3種不同的降水徑流模型。雖然GPM降水產品基于降水主導因子的研究眾多,但是運用深度學習方法研究降水降尺度的相關研究較少。

深度學習由Hinton等[12]在2006年提出,它由機器學習演變而來,可以一次性學習所有特征,具有更強大的學習能力。深度學習有多種算法,如前饋神經網絡、卷積神經網絡、循環神經網絡(recurrent neural network,RNN)等。深度學習在其他領域獲得了不小的成果,使得更多的學者將深度學習應用在降尺度方面。如Afshin等[13]選取了卡隆盆地的降水量、南方濤動指數、海平面氣壓和海表面溫度等數據,將人工神經網絡、模糊邏輯和小波函數結合,海平面氣壓和海表溫度達到了最佳的結果。國內外學者不僅將深度學習方法應用在海溫降尺度方面,而且更偏向于利用深度學習方法預報降尺度的研究。Bonnet等[14]運用視覺預測深度學習算法預測巴西圣保羅的降水量,指出視覺預測深度學習算法作為輔助臨近預報具有很大的潛力; 王慧媛[15]基于雷達回波數據和氣象站數據,運用多時間尺度支持向量機估測華東地區短時動態降水; 周康輝等[16]結合多源觀測數據和高分辨率數值天氣預報,運用深度學習算法,可視化強對流天氣并解釋預測過程,發現該算法得出的結果比單一數據的預報更加可靠; 郭瀚陽等[17]利用卷積循環網絡模型預報高分辨率的強對流天氣; 徐海龍等[18]基于長短時記憶網絡(long short-term memory neural network,LSTM)算法,結合最小二乘法,提高了日長變化預報的精確性; 袁建剛等[19]根據遞歸神經網絡算法建立全球電離層模型,成功模擬出電離層的物理變化; Xiang等[20]提出了新的基于參考和梯度引導的降尺度深度學習模型。深度學習的算法多應用于圖像識別、無人機和預測等領域[21-24],在降水降尺度研究領域應用較少。

目前,降水降尺度研究大多基于年尺度、季尺度和月尺度,很少研究日尺度,同樣也缺乏構建深度學習降尺度模型。本文選擇閩浙贛作為研究區,基于2015—2019年日降水數據,對GPM衛星遙感降水產品運用深度學習方法構建降尺度模型,獲得研究區高精度的降水數據,并對模型結果進行評估。

1 研究區概況及數據源

1.1 研究區概況

閩浙贛地區(如圖1)位于中國的東南部,處于中國地形第三級階梯,東瀕東海,西臨湖南和湖北,南近廣東,北與江蘇和安徽接壤。該區域經緯度范圍為E113.5°~122°,N23.5°~31°。研究區包含福建、浙江和江西三省行政區域,有杭州市、南昌市、福州市等31個地級城市,三省總面積大約是39萬km2。海拔由西向東升高,地勢起伏較大,地形多為高山、山地、丘陵,同時也有平原。該研究區域的氣候類型屬于亞熱帶季風氣候和亞熱帶季風性濕潤氣候,具有雨熱同期的特點,夏季高溫多雨,盛行東南季風,冬季低溫少雨,盛行西北風。研究區域的年降水量可以達到1 000~2 000 mm左右。從春末到夏季都是多雨時節,容易發生滑坡、泥石流等地質災害和洪澇災害,同時也容易出現風雹、臺風等氣象災害。因此,研究閩浙贛地區降水的時間和空間分布具有十分重大的意義,可以為監測、預測自然災害提供技術支撐。

圖1 閩浙贛地區的地形和氣象站點分布圖(該圖基于自然資源部標準地圖服務網站下載的審圖號為GS(2016)2923號的標準地圖制作,底圖無修改。下文同。)

1.2 數據源及其預處理

1.2.1 GPM數據

本文采用的GPM數據來自美國國家航空航天局(http: //disc.gsfc.nasa.gov/datasets?keywords=i-merg&page=1)。該降水產品的數據范圍是180°W~180°E,產品格式是nc4。研究時間為2015年1月—2020年12月,時間分辨率為1 d,空間分辨率為0.1°×0.1°。在ArcGIS軟件平臺上對GPM降水數據進行預處理操作。

1.2.2 氣象數據

氣象站點數據來自于中國氣象科學共享服務網(http: //cdc.nmic.cn/)的中國地面日值數據集(V3.0),時間為2015年1月—2020年12月。數據文件有站點編號、高程、逐日降水量和站點的經緯度等信息。常規氣象站點一共有78個,鄱陽湖流域加密站84個,經質量控制之后得到了153個站點,根據氣象觀測數據與GPM IMERG降水產品的觀測時間不一致,將觀測數據的北京時間訂正為世界時(UTC)時間。其中將常規氣象站點2015—2019年數據集作為訓練集,2020年降水數據集作為個例年驗證數據集,鄱陽湖流域84個加密站作為加密站驗證數據集。

1.2.3 基礎地理數據

數字高程模型 (digital elevation model, DEM)來自國家基礎地理信息數據庫(http: //www.g-scloud.cn),分辨率為1 km×1 km,比例為1∶100萬,采取正軸等積割圓錐投影(Albers equal area project),在ArcGIS軟件平臺上投影,提取DEM的坡度、坡向等地形信息。

1.2.4 植被指數數據

歸一化植被指數 (normalized difference vegetation index,NDVI)數據為MOD13A2中國區域NDVI合成產品,來自于美國國家航空航天局的官方網站(http: //ladsweb.modaps.eosdis.nasa.gov/),空間分辨率是1 km×1 km。NDVI產品從MODIS的TERRA衛星上獲取,產品格式是HDF。數據前期處理包括: 校正、拼接、裁剪、投影轉換、單位換算等。

2 研究方法

2.1 降尺度模型構建

2.1.1 模型構建

根據前人的研究[25-26],地理因子和植被指數均對Integrated Multi-satellite Retrievals for GPM(GPM IMERG)降水精度有影響。本文引入高程(H)、坡向(aspect)、坡度(slope)、經度(lon)、緯度(lat)和植被指數(NDVI)作為自變量的因子,模型運行成功后的GPM降水數據作為降水主導因子,建立降尺度模型,公式為:

GPM=f(Lon,Lat,Slope,Aspect,H,NDVI) 。

(1)

將降水主導因子輸入深度學習降尺度模型中,構建空間分辨率1 km×1 km的GPM降尺度模型。

2.1.2 基于LSTM的降尺度模擬

RNN與普通神經網絡相比沒有太多的限制因素,應用于序列數據集更優,但是在訓練過程中容易出現梯度消失或者梯度爆炸的問題,尤其是長序列的時候,問題更加明顯。在此基礎上,Hochreiter等[27]對RNN進行了算法提升,提出了LSTM,LSTM克服了RNN的不足之處[28]。如圖2所示,LSTM由

圖2 LSTM結構圖

單元狀態(cell state)和門控(gates)構成,在每個序列索引位置t的門是由輸入門、遺忘門和輸出門構成,輸入門控制信息流入,遺忘門控制狀態更新,輸出門控制信息輸出。圖2中,Xt和ht分別為t時刻的輸入和輸出,σ和Tanh分別為sigmoid和Tanh激活函數,?表示乘法,輸出結果的值域為[0,1],表示允許輸出多少數據,值越小,表示輸出數據越少,反之,輸出數據越多,⊕為加法,A為其他時刻的LSTM結構。

一般LSTM可解決長時間序列的問題,隨之而來的局限性是當前時間t的目標值不僅與t-1時刻的變量有關,還和當前時間t的變量有關,事實上,當前時間t的變量并不存在,因為t時間的變量與輸出結果共同存在。在此基礎上,本文考慮將第一個數據集輸入LSTM模型中,輸出的結果和下一個數據集再次輸入到LSTM模型中,對LSTM進行優化,得到優化后的LSTM(optimized LSTM, OLSTM)算法,具體如下: ①調整算法網絡,初始化權重值、迭代次數等參數; ②將2015—2019年的數據集分為訓練集和測試集,輸入第一個訓練集主導因子,輸出的結果和下一個訓練集主導因子輸入模型中,得到OLSTM模型; ③將數據的測試集輸入降尺度模型中進行測試并計算精度指標,以檢驗降尺度模型。

2.2 誤差驗證

本文從加密站和個例年2方面進行驗證,以說明模型在空間和時間上的普適性。采用相關系數R、平均相對誤差(mean relative error, MRE)以及均方根誤差(root mean square error, RMSE)對估算降水量與實測降水量比較,分析兩者之間的誤差,評估降尺度模型結果精度。采用標準差σ、相關系數R和RMSE,3個指標組成一個極坐標圖,評估降尺度模型在極坐標圖中的監測精度。各指標計算公式分別為:

,

(2)

,

(3)

,

(4)

,

(5)

,

(6)

3 分析與討論

3.1 模型調整參數

不斷調整隱含層L、神經元N和迭代次數epochs,得到降水數據的訓練集和測試集的決定系數R2、RMSE和MRE,根據降水數據集的長度,神經元數量N為300,隱含層L和迭代次數的調整結果如表1所示。從表1可知,當L=5,N=300,epochs=250時,訓練集的決定系數R2為0.89,RMSE為0.39 mm,此時決定系數最高,RMSE最低,擬合出的降水精度理論上是最優的,但是此時的測試集R2和MRE不是最優解,過分追求評估指數最優,導致結果過于擬合,模型將會表現出極差的泛化能力,甚至得到的降水精度不如預期的理想,這是因為迭代次數過多,擬合了訓練集數據的噪聲和訓練樣例中沒有代表性的特征。為了解決過擬合的問題,本文逐漸減少隱含層的層數和迭代次數,直到隱含層為4,迭代次數為150時,損失值(loss)慢慢收斂穩定,故選取模型的參數為:L=4,N=300,epochs=150,將參數和降水數據集輸入模型中,得到2015—2019年降水數據集。

表1 模型調整參數表

3.2 降尺度的結果分析與驗證

圖3—6分別為2019年四季中某一天的氣象站降水、遙感衛星GPM IMERG和降尺度結果的對比圖,可以看出降尺度結果降水的分布圖比氣象站降水分布圖和遙感衛星GPM IMERG降水分布圖具有更高的空間分辨率,還精細地刻畫了研究區降水的空間分布差異。從整體上來看,GPM IMERG降水產品對研究區進行了嚴重的低估,降尺度結果則與氣象站降水量比較接近,但是在7月12日,GPM降水產品對研究區局地進行了高估,比如江西宜春。降尺度結果的空間分布情況與氣象站降水數據的空間格局也更為一致,但是空間差異性較氣象站降水數據更為精細,在降水的最值區域三者有差異: 在1月17日(圖3),氣象站降水最大值在浙江玉環,降水量是42.1 mm,GPM和降尺度結果的最大降水量分別在浙江上虞和平湖,數值較低,分別是11.2 mm和25.1 mm; 在4月7日(圖4),浙江云和的氣象站降水量最大,為52.8 mm,GPM和降尺度結果的最大降水量都位于福建福鼎; 在7月12日(圖5),福建福安的氣象站最大降水量達到了75.7 mm,GPM和降尺度結果的最大降水量都在福建永定; 在10月16日(圖6),江西靖安的氣象站降水量最大,為14.5 mm,GPM降水量在江西遂川最大,達6 mm,降尺度結果的最大降水量位于江西靖安,為13.5 mm,與氣象站最大降水量所在位置和數值都更為一致??傮w而言氣象站降水的最值區域與GPM的最值降水區域有區別,與降尺度結果的最值區域更為接近。

(a) 氣象站降水 (b) GPM降水 (c) 降尺度結果

(a) 氣象站降水 (b) GPM降水 (c) 降尺度結果

(a) 氣象站降水 (b) GPM降水 (c) 降尺度結果

(a) 氣象站降水 (b) GPM降水 (c) 降尺度結果

從降水時間分布來看,1月17日,圖3(a)和圖3(c)可知,閩浙贛地區降水分布由西北向東南方向遞減,降水集中在浙江北部,浙江東北沿海地區降水量最多,達到了大雨級別,而降尺度結果的級別仍是中雨,在福建地區降水最少; 4月7日,從圖4(a)和圖4(c)可以看出,氣象站降水集中在浙江和福建交界處、江西中部和西部,降尺度結果在浙江和福建交界處降水量較多,在其他地方是少量降水; 7月12日,由圖5(a)可以見到,研究區大部分地區是少雨,除了福建地區沿海和南部地區仍有降水,降尺度結果的空間分布格局與氣象站一致; 10月16日,圖6(a)和圖6(c)可知,氣象站降水集中在江西西北部,其他地方仍有少量降水,而降尺度結果也集中在江西西北部。運用深度學習算法訂正降水數據的方法提高了原始GPM IMERG數據的精度,該方法在一定程度上是可靠的。本文降尺度結果雖然能夠較好地反映出閩浙贛降水的時間和空間分布情況,但是在一些細節上仍有偏差。主要在4月7日這一天,降水集中在浙江南部和福建北部,處于暴雨強度,而降尺度結果并沒有達到暴雨強度,即降尺度結果在4月7日訂正效果并不好,未來將引入水汽含量、風向等其他降水因子,提升深度學習降尺度模型的效果。

3.3 模型驗證

3.3.1 典型區域加密站驗證

利用鄱陽湖流域84個加密氣象站點2015—2019年平均月降水量對OLSTM降尺度模型進行驗證。為更好地驗證OLSTM深度學習的降尺度效果,本文將降尺度結果繪制成平均月降水的泰勒圖。從圖7可知,平均月降水量的相關系數R都超過了0.7,其中,10月的降尺度結果最優,比其他月份表現更佳,R達到了0.91,RMSE為1.19 mm,標準差是2.46,最接近標準差之比2.5; 7月和4月次之,7月的R是0.9,RMSE是3.01 mm,標準差是5.23,4月的相關系數是0.8,RMSE是1.66 mm,標準差是1.66。但是1月誤差偏差較大,R是0.7,RMSE是1.9 mm,標準差是0.78。這是因為1月降水量少,降尺度模型存在高估的現象。

圖7 平均月降水的泰勒圖

3.3.2 個例年驗證

為了驗證深度學習降尺度模型在時間尺度的模擬水平,本文選取未參與模型訓練的2020年降水數據,對研究區的空間降水進行降尺度,將降尺度后的降水數據與氣象站點數據分別從日尺度和月尺度2個時間尺度進行精度評估,計算降尺度前后的精度指標R,RMSE和MRE以評估模型的實用性。

1) 日尺度降水精度評估。為對比分析日尺度下GPM降水數據與降尺度結果的降水數據的精度,圖8是氣象站點降水數據分別與GPM降水數據、降尺度結果據的對比圖。從圖8可知,降尺度結果在R指標上相比較GPM有提升,提升了0.115,MRE和RMSE均有降低,MRE從26.71%降至9.43%,RMSE從10.26 mm降到了5.23 mm,通過深度學習降尺度模型,降尺度后的降水數據誤差更小,相關系數更大,說明降尺度結果的精度比GPM IMERG更高。

(a) 站點降水量與GPM降水量散點圖 (b) 站點降水量與降尺度結果散點圖

2) 月尺度降水精度評估。為對比分析月尺度下GPM降水數據與降尺度結果的精度,表2是2020年各月的2種降水數據的誤差對比。從表2可以看出,降尺度結果的質量比降尺度前更優一點,每月的相關系數R都提升了,R的平均值達到了0.882,10月的R甚至達到了0.893,但4月的R比較低,只有0.879,2個月相差了0.14,體現出降尺度結果與實測值有較好的一致性; 4個月的MRE在5.71%~7.87%之間,大大降低了GPM降水數據與實測數據的誤差; 每月的RMSE在0.324~4.123之間,降低了0.359~3.269,提升了GPM 降水產品的精度。其中,降尺度結果最好的是7月和10月,1月和4月降尺度結果稍微較差,這與以前學者研究的結果一致[29]。GPM由于自身的算法的限制,對微量降水和固態降水敏感,有可能出現少雨強高估的現象[30],也有臺風登陸,帶來強降水,造成誤差的原因??偟膩碚f,利用深度學習降尺度模型對GPM降水產品進行降尺度具有一定的效果。

表2 GPM降水數據與降尺度結果精度指標

4 結論

本文根據深度學習模型的特點,構建OLSTM深度學習降尺度模型,基于2015—2019年的逐日降水數據和植被數據以及高程數據,對GPM降水產品訂正,得到研究區的降水空間分布。通過降水實測值和降尺度結果的誤差驗證,得出如下結論:

1)從降水空間分布來看,降尺度結果與氣象站降水數據的空間分布趨于一致,比GPM IMERG降水產品更能體現出閩浙贛地區的降水空間分布,氣象站降水的最值區域與降尺度結果的最值區域相同; 從降水的時間分布來看,降尺度結果在1月17日,7月12日和10月16日與氣象站降水具有一致性,1月17日降水都集中在浙江北部,7月12日降水全集中在福建地區沿海和南部地區,10月16日降水中心皆集中在江西西北部。

2)加密站驗證表明,OLSTM降尺度模型在7月和10月的降水量表現較好,1月和4月相對較差,即在每月的降水量的相關系數大于0.7,說明該模型較為可靠。

3)個例年驗證表明,OLSTM降尺度模型的空間降水估算方法效果良好,能夠在一定程度上提升GPM產品的降水精度和空間分辨率,2020年降水數據經過降尺度后R在0.8以上,說明模型適用于閩浙贛區域。但是2020年降尺度結果有季節性區別,7月和10月擬合效果較好,1月和4月次之。主要原因是4月臺風登陸南邊沿海城市,帶來的強降水使得GPM產品的捕捉降水能力減弱。

綜上,本文提出的優化深度學習降尺度模型無論在日尺度還是月尺度都有較高的精度,且在時間和空間具有一定的普適性,后續將引入水汽含量、風向等其他降水因子,以期進一步提升深度學習降尺度模型的效果。

猜你喜歡
氣象站降水量尺度
珠峰上架起世界最高氣象站
財產的五大尺度和五重應對
降水量是怎么算出來的
心靈氣象站
黃臺橋站多年降水量變化特征分析
1988—2017年呼和浩特市降水演變特征分析
宇宙的尺度
基于小波變換的三江平原旬降水量主周期識別
自動氣象站應該注意的一些防雷問題
9
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合