?

日平均氣溫遙感估算方法綜述

2023-12-26 02:51王巖汪利誠武晉雯
自然資源遙感 2023年4期
關鍵詞:平均氣溫反演氣溫

王巖, 汪利誠, 武晉雯

(1.沈陽建筑大學交通與測繪工程學院,沈陽 110168; 2.中國氣象局大氣環境研究所,沈陽 110166; 3.遼寧省農業氣象災害重點實驗室,沈陽 110166)

0 引言

日平均氣溫作為氣象站測定的關鍵要素之一,是反映氣候特征的重要指標,同時也是城市熱島效應、農業生態環境等眾多研究領域的重要指標。溫度異常會導致低溫冷害、高溫熱害、森林火災以及干旱等農業災害頻發[1-4]; 甚至會影響病蟲害、流行病菌等的繁殖和傳染[5-6],對糧食安全和人民健康造成嚴重危害。

日平均氣溫作為衡量大氣溫度的關鍵指標,一直廣泛應用在農學、生態學等眾多領域。學者們經常用日平均氣溫的累積值,定量地描述植物生長所需的熱量[7-8]。目前大多都是以日為研究單位,構建作物生長模型,以日平均氣溫為衡量作物生長狀況的變量,來研究土壤水分、植被覆蓋等分布狀況和變化趨勢[9-11]; 以日平均氣溫的累積值作為判斷作物不同生育期界限的積溫指標[7]、作為衡量作物生長狀況的重要指標。氣象學中將每日2時、8時、14時、20時4個時刻氣溫的平均值作為每日平均氣溫[12]。目前,遍布在全球的氣象站點能夠不間斷地提供較為準確的氣溫數據,這也為日平均氣溫的獲取提供了可靠的數據支持,但是所有站點并不是均勻排列的,導致在空間上很難描述日平均氣溫的異質性??臻g插值作為研究者們常用的日平均氣溫估算方法,能夠實現數據由點向面尺度的轉換。盡管空間插值的精度不斷改進提高[13-14],但是利用有限的臺站數據進行日平均氣溫反演精度仍然滿足不了區域尺度研究需要。

隨著衛星遙感領域的高速發展,遙感技術可以實時、動態、宏觀監測大區域尺度地理狀況的特點,已在霜凍、高溫熱害等農業災害空間監測研究中得到充分體現[15-17]。近年來,隨著基于遙感數據反演地表溫度(land surface temperature,LST)算法的精度不斷提高[18-20],通過研究日平均氣溫和LST之間的相關特性來估算日平均氣溫成為目前研究的新方向。本文通過文獻綜述,總結了近年來國內外日平均氣溫所存在的問題和具體的解決方案,最后論述了各種日平均氣溫遙感估算方法的優缺點,并對未來發展方向和內容進行了展望。

1 日平均氣溫遙感估算研究進展

熱紅外數據雖然很難直接反演得到日平均氣溫,但可以利用本身波段觀測值(亮度溫度)或者以波段觀測值為基礎,利用相關反演算法獲取的LST這2種方式間接估算日平均氣溫,如表1所示。

表1 日平均氣溫遙感估算方法一覽表

1.1 多元線性回歸法

隨著對地氣溫熱交換原理的不斷探究[35],許多研究者通過開發不同的統計模型來提高日平均氣溫估算精度,其中最主要的就是多元線性回歸模型,即

T=a0+a1x1+a2x2+a3x3+…+anxn+ε,

(1)

式中:T為平均氣溫;a0,a1,a2,a3,…,an分別為模型回歸系數;x1,x2,x3,…,xn分別為影響日平均氣溫的變量因子,如LST、經緯度、高程、下墊面類型(植被指數)、太陽天頂角等[36-37];ε為擾動項。隨著研究不斷深入,發現儒略日、夜間LST等在日平均氣溫估算中的重要性相比緯度、太陽天頂角等輔助數據要略高一些。Janatian等[37]利用中分辨率成像光譜儀(MODIS)日間和夜間時間產品和儒略日、海拔和波段反射率等共11個影響因子建立統計模型,進行氣溫的估算,實驗結果證明,夜間產品數據、海拔和儒略日是研究氣溫變化最有效的變量。為了處理單時相遙感數據與對應的日平均氣溫地面監測數據構建的反演模型估算結果無法大范圍使用且估算誤差較大等問題,研究者們提出了分季度、分時相建模,以滿足不同情況下的日平均氣溫反演需求。Vancutsem等[36]將日間MODIS LST數據與日最高氣溫實測值進行相關性分析,結果表明,隨著季節性的變化,太陽輻射和云量等不斷變化,兩者的差異也不斷變化,表明了地區不同或季節發生改變都會使LST和氣溫之間的相關性發生顯著變化; 祝善友等[38]將極軌氣象衛星熱紅外數據和對應的氣象臺站監測數據進行耦合,創建分季度和分時相的2種氣溫估算模型,最后綜合兩者的優勢,建立較為穩定和適用的模型。

為了進一步降低日平均氣溫遙感估算誤差,研究者們進行了多次模型算法的改進。姚永慧等[21]先估算日間和夜間LST的平均值,再將平均值作為輸入參數代入多元線性回歸模型中,日平均氣溫估算的標準誤差在2.22~3.05 ℃之間; Colombi等[22]基于LST數據求出衛星過境時刻的瞬時氣溫,然后依據瞬時氣溫與日平均氣溫之間的相關關系推出日平均氣溫,估算的均方根誤差RMSE為1.89 ℃; Zhang等[23]通過實驗也證明耦合日間和夜間的LST進行平均氣溫的估算結果更加準確(殘差標準偏差小于3.22 ℃),但會導致可利用的像素大大降低,并提出利用夜間LST進行平均氣溫的估算適用性更好; Benali等[24]將夜間LST數據作為唯一變量輸入日平均氣溫估算模型中,日平均氣溫估算誤差RMSE為1.5 ℃,相比單獨使用日間LST估算的結果(RMSE為2.4 ℃)更精確; Yang等[25]和Golkar等[26]同樣證明了利用夜間LST數據進行日平均氣溫的估算結果更加準確。

1.2 機器學習方法

近年來,隨著研究范圍的不斷擴大,機器學習方法在氣溫估算的研究中廣為關注,如神經網絡、支持向量機和隨機森林等。在利用遙感數據估算氣溫的方法中,機器學習方法已經被證明在具有復雜和異質景觀地區,融合LST和其他變量進行氣溫遙感估算的實用性。

神經網絡是一個不斷學習的系統,根據邏輯規則進行信息的推理,通過調節系統內部節點與節點之間的關聯關系,進行信息的高效處理。在氣溫遙感估算的研究中通常需要考慮眾多影響因子,神經網絡學習方法具備處理復雜問題的能力,近年在氣溫估算中被廣為使用。Agathangelidis等[27]利用多時相MSG-SEVIRI遙感數據,采用多項式回歸和人工神經網絡的方法,將LST和氣溫觀測值相結合估算希臘雅典的氣溫,RMSE為1.0~2.0 ℃。

支持向量機是機器學習的一種,具有很強的稀疏性和穩健性。近年來,被廣泛用在氣溫遙感估算相關研究中。使用支持向量機來模擬衛星遙感數據與氣象臺站觀測數據之間的關系,基于支持向量機的監督模式識別方法,進行氣溫反演。Li等[28]使用隨機森林和支持向量機 2種機器學習方法,基于MODIS LST數據進行氣溫動態估算的算法精度比較,實驗證明這2種機器學習算法都能夠提供很好的結果。與支持向量機相比,隨機森林在很少的參數設置和可變性下具有更大的優勢; 相反,支持向量機具有更大的機動性來調整核函數,以更好地處理多種復雜的數據集。Moser等[29]將基于支持向量機監測陸地和海洋表面溫度的方法推廣到氣溫估算上,提出了基于支持向量機的衛星影像周期氣溫估算新方法。氣溫估算平均絕對誤差MAE為2.37 ℃。

隨機森林是由多個決策樹共同構成的分類器,是目前最盛行的回歸算法之一,已經在遙感信息處理中得到廣泛的使用。近年來,隨著對氣溫估算結果的精度要求越來越高,隨機森林已經開始用于氣溫的遙感估算當中。隨機森林方法最早是由Zhang等[30]和Ho等[31]用于氣溫估算,Ho等[31]使用2種機器學習方法支持向量機和隨機森林以及普通最小二乘回歸,根據陸地衛星數據繪制溫哥華的城市氣溫變化圖,RMSE為2.31 ℃; Zhang等[30]根據氣溫估算精度隨著MODIS LST項和其他項之間的組合不同、數據質量差異不同而不斷變化的規律,利用隨機森林機器學習方法動態整合可用的LST項來估算青藏高原的日平均氣溫,有效地提高了青藏高原低云干擾下氣溫遙感估算的準確性,日平均氣溫遙感估算誤差RMSE為2.0 ℃; Xu等[39]采用多元線性回歸和隨機森林2種統計方法,根據MODIS數據估算哥倫比亞省2003—2012年夏季日最高氣溫,結果顯示這2種方法都適用于復雜地形山區的氣溫估算,RMSE分別為2.41 ℃和2.02 ℃; 邢立亭等[40]基于隨機森林算法,利用MODIS LST數據估算蘭州市日最高和最低氣溫,估算誤差MAE分別為1.344 ℃和1.218 ℃。

1.3 特征空間外推法

日平均氣溫遙感估算通常有2種形式,一種是利用熱紅外數據反演的LST與日平均氣溫之間的相關性推算出來; 另一種則是利用Prince等[41]最早提出的三角形或梯形特征空間,將LST變化與歸一化植被指數(normalized difference vegetation index,NDVI)聯系起來估算日平均氣溫。由于LST對植被覆蓋區土壤含水量的敏感程度遠遠低于裸土區,所以LST與NDVI在空間上呈三角形或梯形關系。如圖1所示,其中橫軸代表NDVI,縱軸代表LST,AB對應植被指數較低的裸土情況,CD則對應濃密植被冠層下的情況,AC和BD相交于O點,OA稱為干邊,OB稱為濕邊,兩線之間的斜線代表土壤的不同植被狀態。

圖1 NDVI-Ts特征空間示意圖[41]

1.3.1 瞬時氣溫的估算

Zhu等[42]采用溫度植被指數分析法(temperature vegetation indes,TVX),將LST和植被指數之間的負相關系閾值降至0.1后,成功利用TVX方法基于MODIS陸地衛星估算了日最高和最低氣溫,估算誤差MAE分別為3.03 ℃和2.37 ℃。Nemani等[43]研究認為LST隨著NDVI的增大而降低,在全覆蓋條件下,植被冠層的溫度和空氣溫度幾乎相等,因此基于NDVI和LST兩者的空間特征關系估算近地表氣溫; 侯英雨等[34]通過分析NDVI和LST之間的相關關系,建立了梯形空間特征模型,對中、高植被區域的近地表氣溫進行了估算,稀疏植被區域和中高植被區域的近地表氣溫反演絕對誤差分別為1.5~1.8 ℃和1.61 ℃,但隨著NDVI的不斷變化,地表水分的易變性增強,NDVI和LST之間的三角形或梯形關系不明確,這種情況下很難保證TVX關系的準確性; Sun等[44]提出了利用MODIS晝夜LST數據和增強植被指數(enhanced vegetation index,EVI),從晝夜LST差值和光譜植被指數特征空間改進TVX方法估算氣溫,結果表明該方法在EVI和晝夜LST差值較大的地區適用性相對來說較高,估算誤差RMSE為2.38 ℃左右。另外,在研究特征空間的干邊時,通常都是通過回歸等經驗方案直接從遙感散點圖中得到,所以研究結果通常具有一定的主觀性和不確定性。為了克服這些缺點,Sun等[44]開發了一種高級溫度干燥指數,通過表面能量平衡原理確定理論干邊,但是該方法需要輸入大量參數,結果的誤差來源較多,難以控制; Zhu等[42]針對這個問題提出了一種新的指數——修正溫度植被干度指數,以減少參數化方案對干邊的依賴,氣溫估算誤差RMSE為2.28 K,與Zhu等[33]和Sun等[44]反演精度相當。

1.3.2 日平均氣溫的估算

通過建立LST和植被指數之間的三角形或梯形特征空間關系,達到LST向瞬時氣溫空間轉換的目的,而瞬時氣溫又與日平均氣溫高度相關,所以學者們在瞬時氣溫向日平均氣溫的時間轉換上也做了很多研究,Colombi等[22]基于日間和夜間LST數據求出衛星過境時刻瞬時氣溫,然后利用正弦曲線近似擬合氣溫日變化規律,最后通過模擬的氣溫日變化曲線,估算日平均氣溫,但是衛星的過境時刻和日最高最低氣溫出現的時刻常常是不重疊的,日變化曲線擬合誤差較大; Zhu等[42]考慮了日長和最低最高氣溫出現時間的滯后性等,對簡單的正弦擬合曲線做了調整,氣溫估算誤差MAE為2.54 ℃。除了依賴于正弦曲線擬合,Sun等[44]提出了一種結合晝夜LST數據和EVI數據估算日平均氣溫的方法,該方法擺脫了TVX法的局限性,完全獨立于輔助數據,分別對平原、山區和高山區3個不同區域進行日平均氣溫的估算,RMSE分別為1.84 ℃,2.34 ℃和2.45 ℃,具體算法如表2所示。

表2 特征空間外推估算氣溫方法一覽表

2 存在問題及展望

2.1 云干擾的影響

LST數據產品的質量不僅跟反演的精度有關,而且跟云干擾的程度和范圍有很大關系。Bisht等[45]使用MODIS云產品為MODIS衛星過境時刻內的云覆蓋區域提供有關云頂溫度、云分數、云發射率和云光學厚度等信息,結合地面測量數據進行統計回歸,估算近地表氣溫,全覆蓋范圍近地表氣溫估算誤差RMSE為2.76 ℃,整體上基本實現了只利用遙感數據就能獲取較為精確的全覆蓋近地表氣溫。

利用LST數據估算日平均氣溫時,僅使用晴空像元可以得到較高的估算精度,但會造成像元的大量缺失,對數據連續性造成很大影響,需要對云干擾像元進行空間插值,直接利用氣象臺站觀測值進行插值誤差較大,Zhu等[42]基于MODIS數據產品,對中國柴達木盆地東部和美國南部大平原2個氣候條件完全不同地區的晴空和多元條件下的氣溫進行估算,結果表明,晴空條件下的估算誤差RMSE分別為1.95 ℃和2.5 ℃; 多云條件下的估算誤差RMSE分別為3.42 ℃和2.91 ℃。特別是多云條件下的估算精度已達到了與傳統利用氣象站數據進行空間插補方法相當的水平,有很大的應用前景。

云干擾導致數據的大量缺失,限制了很多溫度相關的應用研究,特別是積溫的計算方法,從而限制了以積溫作為評價指標的作物農業災害監測方法的研究。針對云干擾下的氣溫遙感估算,研究者們嘗試利用微波遙感進行研究[46-48],但是微波遙感空間分辨率較低、時間連續性較差,這些都嚴重阻礙了微波遙感在氣溫估算研究中的進展。針對這些問題,學者們也提出了綜合微波和熱紅外數據進行LST的估算[49],但是時空差異極大地限制了兩者在LST估算中的應用,如何降低兩者LST反演的差異是提高最后氣溫估算精度的關鍵。所以,如何提高云干擾下的日平均氣溫遙感估算精度仍然值得進一步的探究。

2.2 大氣效應

LST遙感估算的準確性直接影響到日平均氣溫估算的精度,多通道算法是目前應用最廣泛的LST遙感估算方法之一,該算法對傳感器限制條件少且不依賴于大氣廓線數據,所以一直被廣泛使用[50-52]。多通道算法是基于不同通道對水汽吸收具有不同的特性,利用相近或相鄰熱紅外通道信息線性化處理輻射傳輸方程。但是,季節和區域的變化會對該方法的處理結果精度造成很大的影響。相比其他季節,夏季的校正精度較高一些; 與低緯度地區的亮度溫度與水汽之間的函數關系相比,中、高緯度地區要穩定一點。因此,在實際的LST反演時,根據區域和季節的不同,建立不同的模型,以保證大氣校正的準確性。

多通道算法在校正大氣水汽吸收時,對于氣溶膠的影響基本都是忽略不計的,但大氣氣溶膠對輻射傳輸過程會造成很大的影響: 太陽總輻射量減少、LST降低等。隨著城市工業化發展進程不斷加快,大氣氣溶膠含量不斷升高,氣溶膠對LST反演算法性能影響不容忽視。近年來,研究者們也不斷嘗試各種算法來降低LST反演時氣溶膠的影響[53-55]。

2.3 大氣環流的影響

太陽輻射、下墊面性質和大氣環流是空氣溫度的3大驅動因子。研究區的氣象條件和地表性質是決定近地表氣溫的主要因素,而大氣環流下的水平平流是決定它們的外來因素。在太陽輻射和下墊面2個驅動因子影響下得到的空氣溫度僅具有局地代表性,想要獲取區域尺度上真實的空氣溫度還必須加權計算大氣環流下的水平平流驅動因子形成的外來空氣溫度。Zhang等[56]考慮局部驅動力和水平平流的影響,利用遙感數據和氣象數據估算地面氣溫,發現估計值與氣象站測量值有很強的相關性,實驗3 d氣溫估算RMSE分別為0.42 K,0.35 K和0.20 K。如何充分認識和利用大氣環流驅動力實現氣溫數據的高精度估算很值得做進一步的探究。

2.4 氣溫日變化模型的優化

氣溫日變化情況隨著地理位置和季節的不同會隨之改變。目前大多數的研究都是基于簡單的正弦曲線來進行氣溫日變化的研究。而日平均氣溫的估算和日最高、最低氣溫密不可分,由于每日最高、最低溫度出現的時間和衛星數據采集時間不一致,因此利用LST數據模擬氣溫日變化曲線仍需進一步研究,日平均氣溫遙感反演的關鍵是如何精確地估算衛星過境時刻的LST數據和日最高、最低氣溫之間的關聯關系。

2.5 溫度真實性檢驗

目前廣泛使用的多元線性回歸方法、機器學習法和基于特征空間外推法等日平均氣溫遙感估算方法,在日平均氣溫空間異質性的描述上都表現出較強的適用性,但是其估算結果的真實性還有待考證。結合以往的研究發現,日平均氣溫遙感估算結果的真實性檢驗還停留在只利用地面站點觀測值作為像元尺度真值對基于遙感數據的估算結果進行驗證,但是絕對理想的地面站點是不存在的,真實性檢驗的參考值并不是像元尺度的絕對真值,驗證結果受到多個不確定的影響: ①地面觀測數據和不同分辨率遙感數據本身的誤差; ②數據源之間在空間位置上匹配誤差; ③不同數據源的空間尺度效應的影響; ④各種不同誤差的傳遞影響。

基于遙感的估算結果真實性檢驗還受限于地面數據的真實性和可利用性,整體的研究還處于定性階段,定量刻畫還是十分的困難。利用氣象站實測的日平均氣溫作為真值進行估算結果的真實性檢驗,并不能很好地反映氣溫空間上的異質性。由于地面站點測量儀器的不同,測量誤差的不統一,數據觀測時間的差異性等,缺乏一個完整、統一、連續、可信度高的參考數據集,日平均氣溫真值的獲取難度極大,怎么進行地面優化采樣,對不確定性進行分析,提高像元尺度“真值”的估算能力,在不確定性最小的原則下怎樣找到最合適的數據和升尺度方法獲取最接近空氣溫度真值的參考值是很值得進一步研究的。

3 結論

綜上所述,日平均氣溫遙感估算方法主要是依靠熱紅外數據間接反演得到,但熱紅外數據受氣候影響較大,每種估算方法的精度都會受到一定的影響。多因子統計法的精度基本能夠滿足日常需求,操作簡單,但模型對研究條件要求高,不同地區或時間跨度都可能會對估算的精度造成影響。近年來,機器學習方法在氣溫估算中廣泛使用,該方法對數據具有很好的包容性,具備處理復雜和異質性數據的能力,適用于處理不同地區,甚至地理環境變化較大區域的氣溫估算,且估算精度高。但對于統計建模者來說,機器學習內部就是一個黑匣子,無法控制模型的內部操作,只能在不同的參數和隨機分配之間進行不斷的嘗試。機器學習方法對現有數據的模擬效果很好,但是用于預測和估計時,其精度可能會突然下降,會導致建模時出現過度擬合。特征空間外推法所需要的參數少(僅需遙感變量),方法操作簡單,但是該方法只適用于植被覆蓋率高的地區,在植被覆蓋率低的城市地區則并不適用。而且,LST和NDVI之間的線性關系受季節性、土壤濕度和土地覆蓋等許多因素影響,但對于定量能量平衡建模困難,景觀復雜、異質的城市,多元回歸模型和機器學習方法就能很好估算氣溫,對于異常值和缺失值的處理也更加準確,基本不會出現過度擬合現象。

猜你喜歡
平均氣溫反演氣溫
反演對稱變換在解決平面幾何問題中的應用
基于FY-3D和FY-4A的氣溫時空融合
深冬氣溫多變 蔬菜管理要隨機應變
烏蘭縣近38年氣溫變化特征分析
從全球氣候變暖大背景看萊州市30a氣溫變化
1981—2010年拐子湖地區氣溫變化特征及趨勢分析
基于低頻軟約束的疊前AVA稀疏層反演
基于自適應遺傳算法的CSAMT一維反演
近50年來全球背景下青藏高原氣候變化特征分析
與氣溫成反比的東西
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合