?

聯合GEE與多源遙感數據的土地利用分類研究

2024-02-24 14:46黃仲
資源導刊(信息化測繪) 2024年1期
關鍵詞:光學土地利用精度

黃仲

(江西省贛西土木工程勘測設計院,江西 宜春 336000)

1 引言

有效、快速地獲取土地覆被信息對于土地資源監測、土地資源統一規劃、農業快速發展、水資源合理配置具有重要意義。土地目標對象的提取和分類是土地要素變化的基本內容,為土地覆被變化提供了數據依據。過去,人們通過實地調查和匯總統計了解覆蓋信息,既費時又費力。遙感技術目前用于地面的實時監測,影像信息時效性好,可實現大規模土地利用的實時監測,顯著提高土地資源信息獲取效率。

隨著遙感技術的日漸成熟,高精度的土地分類成果已成為趨勢,通常會通過時間序列的多期影像方法來提高土地分類精度。如朱永森等以多期HJ/AB 星為數據源,創建PCI、NDVI 指數和模型閾值,提取城市群土地分類利用信息[1]。

高分辨率光學影像具有清晰的光譜和地物紋理信息,在破碎區域能獲取更高的精度?;诟叻直媛视跋竦耐恋胤诸愌芯坎捎玫姆椒ㄖ饕V波、支持向量機、機器學習、高斯核函數等。然而,在實際應用中,對于大尺度和云雨較多地區,受云雨、光照等因素的影響,經常造成數據缺失形成無效觀測,一定程度上限制了土地分類的準確提取[2]。

合成孔徑雷達(Synthetic Aperture Radar,SAR)數據,對云層的穿透力很強,具有不受云雨天氣影響、全天時、全天候監測等特點,彌補了光學影像的不足。然而,單一時相的SAR 數據很難對地物進行精確提取,主要是因為SAR 數據的信號易受其他地物相干斑噪聲的干擾,影響對目標地物的提取。

有學者認為,多時相或者多極化SAR 數據能夠獲得更好的分類結果[3]。利用光學數據和SAR 數據融合,可以最大限度地提升地物分類精度。除數據源外,根據地區環境選擇合適的分類算法,也會提升分類精度結果[4]。

近年來,隨著機器學習算法的發展,利用機器學習算法進行地物分類被廣泛應用。隨機森林算法是機器學習分類算法的一種,具有模型訓練時間少、計算精度高等特點,同時對訓練樣本的數量和質量要求較低,因此可用于復雜的地物分類中。

GEE 是一個結合海量衛星遙感影像以及地理要素數據的網絡平臺,存儲了Sentinel 數據、MODIS 數據集、降水數據、海洋表面溫度數據、Landsat 數據、氣候數據和海拔數據等海量數據,可以解決大面積土地覆蓋制圖方面最重要的數據存儲下載問題[5]。用戶可以輕松訪問、選擇和處理待研究區域的大量數據。GEE 云平臺也允許用戶上傳自己的柵格和矢量數據(例如GeoTIFF 或Shape 文件)進行分析,完全控制訪問[6]。因此,該平臺被科研人員廣泛應用?;诖?,本文借助GEE 云平臺數據資源和計算資源,將Sentinel-1 SAR 極化數據所包含的地物結構信息、Sentinel-2 光學數據的光譜信息和機器學習RF 算法相結合,探究時間序列SAR 數據、融合時間序列SAR 和光學數據的不同特征值組合對土地利用分類精度的影響,初步驗證了利用JM 距離尋找最優特征的可行性。

2 研究區域與數據來源

2.1 研究區概況

研究區為江西省南部的贛州市(113°54′~116°38′E ,24°29′~27°09′N),區域范圍如圖1 所示。該地區受地質構造和成土因素等條件影響,具有土地類型地域性強、土地利用差異明顯、山地多平原少、耕地面積小、后備耕地資源不足等特點。

圖1 江西省贛州市

2.2 數據來源及預處理

Sentinel-1 主動微波遙感衛星由兩顆極軌衛星A星和B 星組成,搭載C 波段的合成孔徑雷達(SAR)傳感器,重訪周期小于10 天,本文采用分辨率為10m,極化方式為“VV”和“VH”的后向散射系數數據。Sentinel-2 由Sentinel-2A 和Sentinel-2B 兩顆高分辨率衛星組成,單顆衛星的重訪周期為10 天,兩顆互補,重訪周期為5 天。

本文選取的研究區范圍較大(3.9 萬平方公里)且時間序列長久,因此在GEE 云平臺上進行調用、處理Sentinel-1 微波遙感數據(811 景)和Sentinel-2 MSI 多光譜遙感數據(374 景)。SAR 數據雖不受云雨氣候影響,但由于距離成像中心越遠的像元噪聲越強,因此調用GEE 預處理參數完成軌道參數定標、輻射定標和熱噪聲去除等操作。多光譜數據易受云雨影響,因此調用平臺云掩膜算法對影像進行計算,將云量參數設置為小于10%,并將去云影像重采樣至10m。遙感影像參數及日期如表1 所示。

表1 遙感影像參數及日期

2.3 特征集構建

結合研究區植被的生態環境特點,共計24 個特征變量。其中選取Sentinel-1 高度、坡度2 個地形特征,選取Sentinel-2 光譜反射率及相關植被、水體、紅邊指數共16 個特征變量。選取Sentinel-1 SAR 數據的極化特征變量和紋理特征變量,選取灰度共生矩陣(Gray-level Co-occurrence Matrix,GLCM)生成的角二矩陣(Angular Second Moment,ASM)、對比度(Contrast,CONTRAST)、相關性(Correlation,CORR)和熵值4 個紋理特征變量,具體如表2 所示。

表2 特征變量及其計算公式

根據《贛州市第三次全國國土調查主要數據公報》現行的土地利用分類體系,結合研究區土地利用/覆被特點,將研究區分為建設用地、水體、林地、裸地和耕地5 大類。

結合多期Google Earth 遙感影像,在遙感影像上進行采樣。建設用地包括房屋、道路等,林地包含林地、草地、城市綠地等,裸地包括裸土、裸巖以及采石場等。在Google Earth 上,采用隨機采樣方法在研究區采集樣本點,一共獲得總樣本8657 個樣本點,根據目前常用解譯分類習慣,將訓練樣本和驗證樣本比例設置為7∶3,分別為6493 個和2164 個,樣本數據集如表3 所示。

表3 樣本數據集

3 研究方法

3.1 總體技術流程

利用SAR 影像和光學影像特性,提取地物光譜特征、極化特征、紋理特征、指數特征和地理特征,基于JM 距離特征優選,實現特征最優解,構建特征組合,融合時序SAR 影像和時序光學影像,實驗驗證不同特征不同融合影像信息的提取地物分類差異,分析分類精度及在不同組合下的優勢。技術流程如圖2 所示。

圖2 技術流程

3.2 特征優選

采用JM 距離確定研究區土地分類最佳特征組合。JM 距離是評價不同類別之間分離程度的有效辦法,其表達式為:

公式(1)中,d表示某一特征的巴氏距離。通常情況下假設多變量正態分布,巴氏距離d的公式為:

公式(2)中,mk表示某一特征的均值,∑k表示某一特征的協方差。JM 距離表示樣本間的可分離程度,其值在0 ~2之間,值越大表示分離度越高。

3.3 隨機森林算法

隨機森林(RF)是機器學習和監督分類算法的一種。隨機森林算法的預測結果是通過求解組成森林的不同決策樹的多數決策結果得到的。隨機森林算法具有運算速度快、分類準確率高、對噪聲數據敏感等特點。隨機森林模型訓練速度比較快,可以創建高精度的分類器,分類效果更好。但是隨機森林中決策樹的數量會極大地影響隨機森林算法的效率。如果決策樹的數量太少,分類精度會下降;如果決策樹較多,分類精度趨于穩定,但工作速度較慢[7]??傮w來說,隨機森林的數據公式模型如公式(3)所示,本文在保證分類精度的同時也確保工作效率,因此基于大量的實驗研究選取決策樹數量為50 最為合適。

公式(3)中,F(x)表示隨機森林的預測結果,f_i(x)表示第i棵決策樹的預測結果。

4 實驗結果與分析

4.1 特征優選

利用GEE 云平臺調用特征去相關函數模塊,計算特征集相關系數矩陣,設置保留相關系數絕對值小于0.9 的特征集,完成特征去相關。然后調用JM 距離函數模塊,分別統計計算不同特征對5 類覆被類型的JM距離的分離程度。

按照分離程度由高到低增加特征變量。當特征數為21 時,林地制圖精度達到最大;當特征數為23 時,建設用地制圖精度達到最大;當特征數為23 時,水體制圖精度達到最大;當特征數為22 時,裸地制圖精度達到最大;當特征數為21 時,耕地制圖精度達到最大。以上地物覆蓋類型之后會隨著特征繼續增加分類精度,開始趨于穩定并有所下降。因此可利用特征優選確定最少代入計算的特征,篩選排名靠前的5 至10 個特征作為最優特征進行后續分類,減少信息冗余。具體特征增加過程如圖3 所示。

圖3 制圖精度隨特征變化情況

4.2 融合Sentinel 主被動遙感數據分類

單利用某一時相的SAR 極化特征數據有極大局限性[8]。將月尺度上SAR 觀測數據進行均值合成,可降低云雨天氣對分類精度的影響,提高土地利用分類的精度[3]。本研究選取2021 年11 月到2022 年6 月的Sentinel-1 SAR 數據,在月尺度上進行均值合成,用于土地利用分類研究。在GLCM 計算紋理特征共生矩陣大小的選擇上,選取4、8、16 鄰域數值進行計算,分類精度最高為4 鄰域。融合多時相Sentinel-1 極化特征和紋理特征的分類總體精度為85.02%,Kappa 系數為0.79。分類效果不是特別理想,結果如表4 所示。

表4 多時相Sentinel-1 SAR的極化特征分類結果

受研究區地理位置及氣候環境影響,在2021 年11 月到2022 年6 月期間,難以獲取單天覆蓋整個研究區的Sentinel-2 光學影像。因此,選取2022 年1月到6 月覆蓋整個研究區的合成光學數據,探究融合主被動遙感數據對土地利用分類精度的影響。首先,對光學數據進行分類研究,分類結果如表5和圖4所示。

表5 Sentinel-2光學數據分類結果

圖4 Sentinel-2光學數據(左)及其分類結果(右)

由表5 和圖4 可知,Sentinel-2 光學數據的分類總體精度為89.36%,Kappa 系數為0.85。相對融合Sentinel-1 SAR 數據的分類總體精度提升4.34%,Kappa 系數提升6.40%。

其次,融合時序Sentinel-1 SAR數據、SAR紋理特征和Sentinel-2 光學數據,進行土地分類研究,結果如表6 和圖5 所示。此時,融合主被動遙感數據的土地分類總體精度為94.96%,Kappa 系數為0.93,相對于單獨使用光學數據,分類總體精度提升5.63%,Kappa 系數提升7.82% ;相對于融合時序Sentinel-1 SAR 數據,分類總體精度提升9.94%,Kappa 系數提升14.22%。

圖5 SAR VH極化圖(左)和多時相Sentinel-1 SAR數據的極化特征、紋理特征融合單期光學數據分類結果(右)

多源融合后的影像分類成果精度更加精準,耕地、水體、林地等在圖像上的分類更加精細。這主要是由于SAR 數據的地物后向散射特性異于光學遙感影像。光學數據反映的是目標體的光譜特性,SAR 數據的穿透性不僅能夠獲取植被表面信息,對植被的葉、莖、枝干等信息也有一定反映,獲取的是不同于光學數據的地物信息[9]。此外,時序SAR 數據相對于光學數據和融合主被動遙感數據,在有云霧覆蓋時同樣能夠進行土地利用分類。在氣候濕潤、多云多霧的江西省贛州地區,當缺乏光學數據時,使用長時序SAR 數據是最優選擇。

5 結論

研究在GEE 云平臺上,利用時序Sentinel-1 SAR數據和Sentinel-2 光學影像,在RF 算法上,構建不同的特征向量組合,驗證了利用JM 距離尋找最優特征的可行性,對比分析了不同特征向量組合對土地利用分類的精度,得到如下結論:

(1)在缺乏光學數據的情況下,融合時序月平均SAR 數據對土地利用分類的精度能夠達到85%,特別是對水體的識別精度能夠達到96%以上;相對于光學數據,時序SAR 數據能夠穿透云霧,對云覆蓋區域的土地利用分類有一定指導作用。

(2)利用JM 距離探索了不同地物的最優特征選擇,并將特征數降低,且相對提升了制圖精度。

(3)時序月平均SAR 數據與光學數據融合時,土地利用總體分類精度最高,達到94.96%,Kappa 系數達到0.93。

猜你喜歡
光學土地利用精度
滑輪組的裝配
光學常見考題逐個擊破
基于DSPIC33F微處理器的采集精度的提高
土地利用生態系統服務研究進展及啟示
GPS/GLONASS/BDS組合PPP精度分析
濱??h土地利用挖潛方向在哪里
改進的Goldschmidt雙精度浮點除法器
光學遙感壓縮成像技術
Endress+Hauser 光學分析儀WA系列
巧用磨耗提高機械加工精度
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合