?

基于多源遙感特征融合與卷積神經網絡(CNN)的丘陵地區水稻識別

2024-03-20 05:08曾學亮
江蘇農業學報 2024年1期
關鍵詞:晚稻精度水稻

曾學亮, 郭 熙, 鐘 亮, 吳 俊

(1.江西農業大學國土資源與環境學院,江西 南昌 330045; 2.江西省鄱陽湖流域農業資源與生態重點實驗室,江西 南昌 330045)

水稻作為中國重要的糧食作物之一[1],其種植面積和產量是影響中國農業經濟的重要因素。南方丘陵地區作為中國水稻種植的主要區域之一,在水稻生產中有重要地位[2],因此,及時、準確地獲取丘陵地區水稻種植面積尤為重要。傳統作物面積統計方式以抽樣調查、實地測量等為主,但是這些方法在調查時不但效率低、成本高,而且準確率也有待提高[3-4]。隨著遙感技術的發展,使用遙感信息及時、準確地對水稻種植區域進行識別是重要的做法。然而,丘陵地區地形環境復雜,耕地斑塊不規則,水稻空間分布破碎化嚴重,水稻識別難度較大[5],因此,探究適用于丘陵地區的水稻種植區遙感識別方法具有重要意義。

根據數據源的不同,水稻遙感識別可分為單一遙感數據源、時間序列遙感數據源、多源遙感數據融合等方法[6-7]。根據選用分類特征變量的不同,又可分為基于影像、單一特征變量、多特征變量等的識別[8]。對于大尺度區域水稻的提取,常使用中分辨率成像光譜儀(MODIS)、美國國家海洋大氣局第三代實用氣象觀測衛星(NOAA)等中低分辨率衛星數據;對于中等尺度或小尺度范圍水稻的提取,使用較廣泛的是Landsat、H-J等中高分辨率衛星數據[9]。但對于南方丘陵地區,基于MODIS等中低分辨率或Landsat等中高分辨率數據的水稻識別精度顯然不能滿足實際生產要求。目前,Sentinel-2衛星影像數據由于具有較高空間分辨率、重返周期短、具有多個光譜波段信息等優勢,已經被廣泛用于農作物識別[10],此外,高分辨率衛星遙感影像憑借其高空間分辨率的特點,在近年的研究中得到了廣泛運用[11]。

在水稻遙感識別的分類算法中,傳統監督分類算法有馬氏距離法(Mahalanobis distance,MD)、最大似然法(Maximum likelihood,MLC)等,機器學習算法主要有隨機森林(Random forest,RF)法、支持向量機(Support vector machine,SVM)法等。在丘陵地區,水稻田塊的破碎化和遙感影像的異質化現象導致分類結果更加復雜[11],傳統的分類算法對于水稻種植區的識別存在穩定性和適用性不足[12]、分類精度不能滿足實際生產要求等問題。深度學習可以從要素之間的復雜非線性關系中挖掘特征和進行自動化學習,實現高效率運算,已逐步成為遙感影像分類和圖像識別領域研究的新熱點[13]。卷積神經網絡(Convolutional neural networks,CNN)是遙感分類中最常用的深度學習算法之一,相對其他算法在遙感影像分類中具有較大的優勢[14]。

目前,國內外研究者對水稻遙感識別進行了大量研究并取得了不錯的成果,但中國南方丘陵地區水稻種植受地形、氣候等條件的限制,云霧天氣較多,稻田呈現規模小、破碎分散的特點,水稻遙感識別存在困難,因此選擇合適的數據源和分類算法進行水稻遙感識別對于獲取丘陵區水稻種植信息尤為重要。此外,利用CNN算法結合多源遙感特征數據對中國南方丘陵地區的水稻進行識別的研究較少。因此,本研究擬以地處丘陵區的江西上高縣為研究區,基于Sentinel-2與GF-1衛星遙感影像,結合光譜波段特征、指數特征、紋理特征和地形特征等特征變量,篩選與水稻分離度較高的優選特征,利用CNN分類算法,借助Sentinel-2優選特征數據、GF-1優選特征數據、Sentinel-2與GF-1優選特征融合數據進行水稻識別,并與SVM、MLC分類算法進行對比,旨在探究適用于南方丘陵水稻種植區的提取方法,以期為南方丘陵區水稻遙感識別提供參考。

1 材料與方法

1.1 研究區概況

研究區為江西省宜春市上高縣(圖1),為江西省農業生產大縣和重要商品糧生產基地,所處地理位置為114°28′~115°10′E,28°02′~28°25′N,位于中國長江中下游,是典型的南方丘陵區域,縣域耕地面積3.47×104hm2,占土地總面積的25.73%,主要糧食作物為水稻,種植方式為雙季稻和單季稻混種。

圖1 研究區范圍示意

1.2 數據來源及處理

Sentinel-2衛星是高空間分辨率、高重訪周期的多光譜成像衛星[15]。GF-1衛星是中國高分辨率對地觀測系統的首發星,具有高空間分辨率、高時間分辨率的特點。水稻生長期與成熟期的遙感識別精度較發育期的遙感識別精度更高[16]。結合上高縣晚稻生長周期與可獲取數據情況,確定本研究的遙感影像獲取時間為晚稻孕穗期。如表1所示,本研究選取了Sentinel-2衛星影像數據2景、GF-1衛星PMS影像4景,成像時間分別為2021年9月21日、2021年9月26日,均處于晚稻孕穗期,云量均在5%以下[Sentinel-2影像數據來源于美國地質勘探局(USGS),網址http://glovis.usgs.gov/;GF-1影像數據來自江西省遙感中心]。

表1 多源遙感影像數據

對獲取的遙感影像數據進行輻射定標、大氣校正、幾何精校正等預處理,同時對Sentinel-2影像的各波段運用三次卷積法將其空間分辨率重采樣為8 m,使之與GF-1影像的空間分辨率一致[17],之后對其進行影像拼接與裁剪,得到研究區內的影像(圖2)。

圖2 預處理后的遙感影像

為方便訓練樣本的選取、野外實際數據的驗證和精度計算,于2021年10月到實地進行調查,共獲取113個研究區內晚稻樣本點,采樣借助全球定位系統(GPS)定位儀進行坐標的確定,結合GF-1全色影像(2 m分辨率)對樣本點進行定位。其他數據還包括30 m數字高程模型(DEM)數據(數據來源:USGS;網址:http://glovis.usgs.gov/)等。

1.3 研究方法

在本研究中,首先對Sentinel-2、GF-1及DEM數據提取光譜波段、植被指數、水體指數及地形與紋理特征等特征變量,組成特征變量集,再利用分離閾值法(SEaTH)從特征變量集中篩選出對各類別分離度較大的特征變量,即為優選特征。然后用卷積神經網絡算法對Sentinel-2優選特征數據、GF-1優選特征數據及Sentinel-2與GF-1優選特征融合數據進行研究區晚稻的識別,并用支持向量機與最大似然分類法進行分類得到晚稻識別結果。最后對不同數據情況下各分類方法得到的結果進行識別精度與效果的對比分析。

1.3.1 分類特征的選取 識別過程中使用的分類特征集基于不同數據源的光譜波段、植被指數、水體指數及地形與紋理特征[18]進行選取??紤]到水稻具有植物特征及需水生長的特性,本研究選取了基于Sentinel-2的植被指數與水體指數等變量,基于GF-1的植被指數與水體指數共14個(表2)。此外,本研究選取了8個基于二階矩陣的紋理濾波,包括均值、方差、協同性、對比度、相異性、信息熵、二階矩和相關性??紤]到南方丘陵區地形復雜的特征,利用DEM數據提取坡度、坡向、地形起伏度。加上遙感影像原始波段,分別得到基于Sentinel-2影像的42個分類特征和基于GF-1影像的29個分類特征。

表2 分類特征指數信息

續表2 Continued 2

如果將上述選取的42個Sentinel-2分類特征與29個GF-1分類特征全部用于分類,不僅會使分類時間加長,還會因數據冗余而影響分類精度。為減少數據冗余,利用分離閾值法進行篩選。用SEaTH[37]的J-M(Jeffries-Matusita)距離判斷類別間的可分離性,其值范圍為[0,2],其值接近0,代表2個類別在某一特征上幾乎無差異;其值為2,代表2個類別在某一特征上能夠完全區分開。根據公式(1)和公式(2)計算不同類型特征值的分離度(J):

J=2(1-e-B)

(1)

(2)

式中:J為分離度;B為巴氏距離,用于計算因子之間的距離;m1、m2為2種不同樣本的某一特征分布的均值;σ1、σ2為2種不同樣本的某一特征分布的標準差。

結合野外調查數據與GF-1全色遙感影像輔助進行目視解譯,在研究區內選取訓練樣本且樣本圖斑不覆蓋野外采樣實際驗證點所在田塊,其中水稻、林地、水域、建設用地和其他地類樣本圖斑數量分別為504個、557個、193個、458個和337個。計算各類樣本中各分類特征的均值、標準差,根據公式(1)計算J值,選取前8個水稻類別參與計算且J>1的分類特征,保留涉及其他類型的J值最大的2個分類特征,包括重復分類特征,即為優選分類特征集。

1.3.2 分類方法 CNN能夠對神經元進行局部連接、權重共享、池化,在處理二維結構數據時具有快速、高效等優勢[38]。將不同分類特征集與特征樣本添加到CNN模型中進行訓練、驗證及分類,能夠將輸入的特征層層變換,把原先的空間特征轉換到新的特征空間,實現特征的分層抽象,方便分類和特征的可視化。在本研究中,CNN算法模型框架包括7層(由于池化層無需更新權值參數,因而未算在層數里面),模型框架如圖3所示。在卷積層中,卷積核數量分別為24個、24個、48個、48個,采用最大池化層,卷積核大小為(3,3),池化范圍為(2,2),全連接層神經元數量分別為1 000個、200個。

SVM是機器學習中較為常見的遙感影像分類方法,其算法簡單,具有較好的魯棒性[39];MLC是傳統遙感圖像監督分類中運用得比較廣泛的方法,該方法由各個類別的均值和方差等確定分類函數,從而對每個待分類對象進行類別歸屬。以上算法模型均在Python 3.7軟件中實現,其中CNN利用Keras深度學習庫搭建,其他算法利用Sklearn庫中相應的機器學習模塊實現。

1.3.3 精度驗證 晚稻提取精度從2個方面進行驗證,一是結合GF-1全色影像進行目視解譯后在研究區內隨機選取測試集樣本,其中水稻類型樣本圖斑1 329個,林地、水域等非水稻類型樣本圖斑共1 864個,基于所選測試集樣本的像元構建混淆矩陣,計算水稻分類用戶精度(UA)、制圖精度(PA)、總體精度(OA)及Kappa系數對分類精度進行評價,其計算方法如公式(3)~公式(6)所示:

(3)

(4)

(5)

(6)

式中:mi為第i類分類正確的驗證樣本像元數量;Ci為第i類真實的驗證樣本像元總數;Gi為第i類分類的驗證樣本像元總數;n為分類數;N為驗證樣本像元總數。

y:輸出的結果。

驗證晚稻提取精度的另一個方法是利用野外調查數據計算實際驗證精度,由于實地驗證點的地物均為水稻,非隨機選取且未在研究區域均勻分布,因此僅計算其實際驗證精度(VA)用于評估研究區晚稻分布圖的準確性[40],計算方法如公式(7)所示:

(7)

式中:m為正確分類的調查點數量;M為調查點總數。

2 結果與分析

2.1 分類特征篩選

基于Sentinel-2遙感數據篩選的特征為波段特征B2、B4、B7、B8、B8A、B11與CIgreen(綠葉綠素指數)、NDVIre2(歸一化植被指數紅邊2)、EVI(增強植被指數)、EVI2(增強植被指數2)、MTCI[中分辨率光譜成像儀(MERIS)陸地葉綠素指數]、RVI(比值植被指數)、MNDWI(修正歸一化水體指數)、NDVI(歸一化植被指數)、OSAVI(優化的土壤調節植被指數),其中6個為波段特征,6個為植被指數,1個為水體指數,2個為紅邊指數?;贕F-1遙感數據篩選的特征為B1、B2、B3、B4、CIgreen、NDVI、RVI、EVI、MSR(優化簡單比值指數)、NDWI(歸一化水體指數)、OSAVI,其中4個為波段特征,6個為植被指數,1個為水體指數。

篩選結果表明,植被指數、波段特征在水稻與其他地類的分類中分離度較高,紋理、地形特征在水稻與其他地類的分類中分離度較低,對分類效果無明顯影響。此外,在特征融合數據集中,對于不同數據源計算得到的同一指數特征(如NDVI、EVI等),在訓練模型中發現,如果全部將其加入融合數據集中,與只保留對水稻類別J值較大的融合數據集進行對比,訓練精度略有下降,故本研究中的融合數據集只保留J值較大者。

2.2 水稻識別精度分析

分別對Sentinel-2優選特征數據集、GF-1優選特征數據集及Sentinel-2與GF-1優選特征融合數據集在不同分類方法下得到的結果進行精度的對比與分析。表3為3種數據集利用CNN、SVM、MLC算法得到的識別結果,包括用戶精度、制圖精度、總體精度、Kappa系數及實際驗證精度。Sentinel-2優選特征數據集識別結果顯示,CNN算法所得識別結果的各精度指標皆高于SVM、MLC算法識別精度指標,其中總體精度、實際驗證精度分別為92.59%、92.04%。GF-1優選特征數據集識別結果顯示,CNN算法識別結果的用戶精度為95.13%,高于SVM、MLC算法識別結果,但在制圖精度上,CNN算法識別結果低于SVM、MLC算法識別結果,說明在用CNN算法對GF-1優選特征數據集進行水稻識別的過程中,有部分水稻地類被錯位劃分為其他地類,實際驗證精度僅為86.73%,低于SVM、MLC算法識別結果的實際驗證精度,進一步說明有部分水稻區域未被識別。Sentinel-2與GF-1優選特征融合數據集識別結果顯示,CNN算法所得識別結果的各精度指標皆高于SVM、MLC算法識別精度,總體精度為96.19%,分別比SVM與MLC識別結果總體精度高6.26個百分點、8.13個百分點,其Kappa系數與實際驗證精度分別為0.93、94.69%,高于SVM、MLC識別結果的Kappa系數與實際驗證精度,與總體精度呈現出相同的變化趨勢,表明基于野外調查點驗證得出的實際驗證精度與總體精度接近,總體一致性較好。

表3 優選特征水稻遙感識別精度

識別結果顯示,水稻制圖精度總體低于用戶精度,說明有部分水稻區域被錯誤劃分為非水稻區域,這也表明在這3種數據集條件下,依然無法排除混合像元對水稻識別的影響。其中利用CNN算法對Sentinel-2與GF-1優選特征融合數據集進行識別所得結果的制圖精度與用戶精度之間的差異最小,說明在此方案下,水稻的識別精度最好,各項精度評價指標皆高于其他方案,在整個研究區范圍內用CNN算法對Sentinel-2與GF-1優選特征融合數據集進行識別有最佳效果。

2.3 識別結果對比與分析

2.3.1 典型區域識別結果分析 對上述3種分類優選特征數據集在不同分類方法下的各方案進行晚稻識別結果制圖,選擇典型區域對不同方案下的識別結果進行對比。由圖4可以看出,3種分類算法得出的結果中,SVM、MLC算法分類結果存在不同程度的“椒鹽”噪聲現象,而CNN算法分類結果中此現象較少,說明與SVM、MLC算法相比,CNN算法可以在一定程度上克服“椒鹽”噪聲現象。圖4b1、圖4b3和圖4c1中“椒鹽”噪聲現象較為明顯,地塊內部比較粗糙,水稻區域與其他地物之間的邊界比較模糊,3個結果均是由Sentinel-2優選特征數據參與的SVM、MLC分類,而在GF-1優選特征數據分類得到的結果(圖4a2、圖4b2、圖4c2)中此現象不明顯。在水稻區域的邊緣,CNN算法較SVM、MLC算法識別得到的水稻種植區域邊緣更加平滑。對比CNN算法下的分類結果可以看出,與圖4a1、圖4a2相比,圖4a3在細小水稻區域的識別過程中,既能識別細碎的水稻區域,又能夠在一定程度上保證其田塊的完整性。綜合對比9種識別結果,不難發現CNN算法分類結果在水稻識別細節上優于SVM、MLC算法分類結果,且通過對Sentinel-2與GF-1優選特征數據的融合,其識別效果能夠得到一定提升,與精度的變化趨勢相符。

CNN、SVM、MLC見表3注。RGB:紅、綠、藍。

2.3.2 研究區晚稻空間分布 對比上述水稻識別方法,用CNN分類算法、Sentinel-2與GF-1優選特征融合數據集對研究區晚稻種植區域進行識別,獲得2021年上高縣晚稻種植分布結果(圖5)。從晚稻種植空間分布上看,主要分布在上高縣東北部的泗溪鎮、新界埠鎮及中部的錦江鎮等地,集中分布在錦江及其支流兩側。2021年上高縣晚稻種植總面積為10 761.80 hm2,其中泗溪鎮、新界埠鎮晚稻種植面積分別為3 678.80 hm2、1 801.36 hm2,分別占全縣總種植面積的34.18%、16.74%。利用晚稻野外調查樣本點對分類結果進行驗證,有107個樣本點落在分類的水稻區域中,實際驗證精度達94.69%,有6個樣本點出現分類錯誤,經實地調查發現有4個樣本點由于晚稻田中存在較多雜草,抑制了水稻的生長,有2個樣本點為早稻收割后生長的晚稻,屬再生稻,長勢不如正常栽種的晚稻。

圖5 研究區晚稻種植分布

3 討 論

本研究基于GF-1遙感影像數據與Sentinel-2遙感影像數據,通過構建優選特征分類特征集的組合方案,用CNN、SVM及MLC分類算法對南方丘陵地區晚稻進行識別,研究結果表明:(1)在所有分類方案中,Sentinel-2與GF-1優選特征融合數據在CNN分類算法下對水稻的識別效果最好,其總體精度、Kappa系數分別為96.19%、0.93,結合野外調查數據得到的實際驗證精度達94.69%。與CNN分類算法下的Sentinel-2、GF-1單一數據源優選特征識別結果的總體精度相比,CNN算法下Sentinel-2與GF-1優選特征融合數據識別結果的總體精度分別提高了3.60個百分點、5.30個百分點,實際驗證精度分別提高了2.65個百分點、7.96個百分點,說明Sentinel-2與GF-1優選特征融合數據較單一數據源在丘陵區水稻識別上有一定的優勢。(2)3種分類算法中,與SVM、MLC算法相比,CNN算法在對丘陵地區水稻識別上在精度與識別效果方面有明顯優勢。CNN能夠分析水稻的特征信息,進而對特征變量中的不同地物特征信息進行提取,在一定程度上克服丘陵地區水稻識別過程中出現的“椒鹽”噪聲現象,對丘陵地區水稻種植區有較好的識別能力。同時在CNN算法下,Sentinel-2與GF-1優選特征融合數據集較單一數據源(Sentinel-2或GF-1)優選特征數據集對水稻的識別效果更好;而在SVM、MLC算法下,隨著數據源的增加,即分類特征數量的增加,分類精度總體會有所降低。

盡管本研究利用Sentinel-2與GF-1優選特征融合數據、CNN分類算法在南方丘陵地區取得了較好的水稻識別效果,但是在實際應用時仍然有一定的局限性,在南方地區,由于云雨天氣較多,往往難以獲取質量較好的遙感影像數據,對水稻遙感識別工作開展有較大的影響,因此可結合雷達遙感數據協同識別[41]。

猜你喜歡
晚稻精度水稻
什么是海水稻
水稻種植60天就能收獲啦
一季水稻
水稻花
基于DSPIC33F微處理器的采集精度的提高
早熟蓮藕-晚稻栽培技術
GPS/GLONASS/BDS組合PPP精度分析
改進的Goldschmidt雙精度浮點除法器
2014年晚稻新品種生產試驗
洞庭湖區蓮藕套種晚稻高效栽培技術
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合