?

高分五號衛星高光譜遙感分類方法研究綜述

2024-01-03 06:45杜潤鳳王霄鵬張佳華尚曉笛嚴傳奇
關鍵詞:光譜衛星分類

杜潤鳳, 王霄鵬, 張佳華, 尚曉笛, 熊 瑄, 嚴傳奇

(1. 青島大學計算機科學技術學院遙感信息與數字地球研究中心, 山東 青島266071;2. 中國科學院空天信息創新研究院數字地球重點實驗室, 北京 100094)

目前,衛星遙感廣泛應用于農業、環境、地礦、海洋、軍事等多個領域[1-3],衛星遙感圖像分類的研究目標是通過識別衛星遙感圖像數據中對應的地物特征,識別目標地物信息[4]。高分五號衛星是“高分專項”中一顆重要的科研衛星,自投入運行以來,為我國遙感科研領域提供了大量優質的高光譜遙感數據,也支撐了眾多的研究成果。高光譜遙感技術因其波段數量多、光譜分辨率高和光譜信息連續適用于多個研究領域,成為當前研究的熱點。高光譜遙感技術的出現,使許多使用寬波段遙感技術無法探測的地物信息,更容易被探測,提供了更多的地表信息。隨著機器學習技術的迅速發展,更多的分類算法被發展并運用在高光譜遙感應用領域,使高光譜遙感數據的分類技術成為目前研究主流[5]。本文介紹了高分五號01衛星和02衛星的載荷和數據特點,結合前人的研究,對當前使用的主要分類算法進行了詳細的分析,同時通過分析機器學習和深度學習分類算法在高光譜圖像分類過程中的應用,對各種分類算法性能進行評估,找出其中分類效果最好的幾種分類方法,并指出高光譜衛星遙感圖像在分類過程中可能出現的問題。該研究為高光譜圖像分類領域上的研究提供了一些參考。

1 高分五號衛星及數據特點

1.1 高分五號衛星

中國高分系列衛星是我國高分辨率對地觀測系統重大專項研制和發射的衛星系列,累計發射32顆衛星[6-7]。2018年,高分五號01衛星成功發射,這是全球首顆實現對大氣和陸地綜合觀測的全譜段高光譜衛星。該衛星能夠有效探測國產衛星無法覆蓋的大氣污染氣體,滿足了環境綜合監測等領域的迫切需求。2021年9月7日,高分五號02衛星在太原衛星中心成功發射,與“高分”五號系列衛星相比,高分五號02衛星提高了高光譜成像的最高光譜分辨率,達到了2.5 nm;幅寬為60 km,同時最高的大氣探測光譜分辨率可達0.03 nm,綜合性能指標在同類衛星中處于先進水平。高分五號01衛星軌道參數如表1所示,高分五號02衛星軌道參數如表2所示。

表1 高分五號01衛星軌道參數

表2 高分五號02衛星軌道參數

1.2 高分五號衛星載荷

高分五號01衛星是世界首顆對大氣和陸地綜合觀測的全譜段高光譜衛星,搭載了6個載荷,其中4個是大氣觀測載荷,分別是大氣主要溫室氣體探測儀(greenhouse gas monitoring instrument,GMI),光譜范圍為四段0.759~0.769 μm、1.568~1.583 μm、1.642~1.658 μm、2.043~2.058 μm;大氣痕量氣體差分吸收光譜儀(exhaled breath molecular ions,EMI),光譜范圍為240~710 nm,光譜分辨率為0.3~0.5 nm;大氣環境紅外甚高分辨率探測儀(atmospheric infrared ultra-high resolution spectroscopy ,AIUS)光譜范圍為2.4~13.3 μm,光譜分辨率為0.75 px;大氣多角度偏振探測儀(atmospheric multi-angle polarimetric detection instrument,DPC),光譜范圍分為8段433~453 nm、480~500 nm(p)、555~575 nm、660~680 nm(p)、758~768 nm、745~785 nm、845~885 nm(p)、900~920 nm。這些載荷可用于探測大氣中的氣體成分和物理參數。另外2個載荷是對地觀測載荷,分別是可見短波紅外高光譜相機(visible and shortwave infrared hyperspectral imager,AHSI)和全譜段光譜成像儀(full spectrum spectral imager,VIMI)。VIMI是一款從可見光到熱紅外光譜范圍的星載多光譜成像儀,譜段范圍覆蓋0.45~125 μm,分為可見光近紅外(visible and near-infrared supplement,VNIR)、短中波紅外(shortwave and midwave infrared supplement,SWIR/MWIR)和長波紅外(longwave infrared supplement,LWIR)3個影像數據通道,共12個譜段。載荷的運行大大提高了衛星的觀測效果,具有重要的應用價值,可在資源調查、環境監測、災害預警等方面發揮作用。其中可見光-短波紅外譜段的空間分辨率為20 m,而中長波紅外譜段的空間分辨率為40 m[8],可見短波紅外高光譜相機(AHSI)的光譜覆蓋范圍在0.4~2.5 μm之間,空間分辨率為30 m,幅寬達到了60 km[9]。這些性能參數作為實際應用中非常關鍵的指標,決定衛星在資源調查、環境監測、災害預警等方面的精度和應用范圍。

高分五號02衛星搭載了7個有效載荷,其中2個是對地成像載荷,分別為AHSI和VIMI,可用于環境綜合監測和國土資源調查等方面;另外還有5個大氣探測載荷,包括GMI、(electromagnetic measurement technology,EMT)、DPC、(precision position and orientation sensor,POSP)和(atmospheric aerosol spectrometer,AAS),被用于探測大氣中的溫室氣體、氣溶膠、偏振等參數,可監測溫室氣體、PM2.5、污染氣體等大氣環境要素。這些載荷的運行提升了衛星的能力和效果,在環境監測、氣象預報、災害預警、資源調查等領域具有重要的應用價值,為保障國家重大戰略和長期發展提供了有效的手段和技術支持。

1.3 高分五號衛星高光譜遙感數據的特點

高光譜遙感技術結合了成像和光譜技術,利用多個很窄的電磁波波段從目標上獲取大量光譜數據,同時探測目標的二維空間信息和一維光譜信息,因此可以獲得非常詳細的物質光譜特征信息[10]。高光譜遙感數據的光譜分辨率高且連續,對材料的光譜特性有更高的識別和分辨能力,可以識別出更多的地表材料信息,如土地類型、植被覆蓋、水體、巖石等,還能夠檢測大氣成分、污染物、溫度等環境參數。高光譜遙感技術廣泛應用于環境監測、農業生產、自然資源調查、城市規劃等領域,對于保護環境、推動可持續發展具有重要的意義。和其他寬波段遙感圖像相比,高光譜遙感圖像主要具有以下特點:

1) 光譜分辨率高,波段多,這種多波段的光譜數據能更好的的對地表物質進行區分。

2) 波段間相關性較強。地物光譜反射特性導致高光譜圖像在一定光譜區域內表現出相似性。

3) “圖譜合一”技術能夠同時提供光譜信息和空間信息。

4) 高光譜圖像的波段增多,使其數據量也在急速增長。

和其他高光譜圖像數據相比,高分五號衛星上裝載的可見短波紅外高光譜相機(AHSI),在提高性能的同時,大幅改善了圖像清晰度,高光譜遙感技術在圖像采集時可以使用成像儀器獲取目標的二維圖像。但是由于不同波長下光的傳播和吸收具有不同的特性,因此在傳統光學系統中,圖像的光譜信息往往會發生畸變。高光譜遙感技術利用的光譜成像儀器可以通過過濾器或光柵分離不同波長的光線,保證了光譜信息的準確性和精度。 因此,高光譜遙感技術著重解決了圖像光譜畸變問題。同時AHSI配置了豐富的定標手段,確保了數據的精度和穩定性。2005年,自美國Hyperion[11]停止工作以來,國際上星載短波紅外高光譜數據獲取一直處于空白狀態。高分五號衛星的成功發射,極大地豐富了高光譜遙感信息資源的獲取方式,顯著提高了高光譜遙感圖像的質量;光譜分辨率更高,能識別更多物質;波段更多,波段之間的信息校正更加容易;高光譜圖像數據維度更高,在高維空間中不同類別的樣本重疊率更低,更容易區分。這些優勢對于提高遙感數據的精確度、準確性和實用性具有非常重要意義。

2 高光譜衛星遙感分類的一般過程及面臨問題

2.1 高光譜衛星遙感分類一般過程

高光譜影像分類是根據影像中的像素向量為每個像素向量分配類別標簽[12],高光譜圖像分類一般過程如圖1所示。

圖1 高光譜圖像分類一般過程

1) 光譜數據預處理是高光譜影像分類中非常重要的一步,包括波段剔除、輻射定標、大氣校正和幾何校正等部分。其目的在于消除高光譜圖像中由大氣散射、折射以及幾何畸變等因素引起的干擾噪聲,提高高光譜圖像數據的精度和可靠性。預處理后的數據更加準確,為后續處理和應用提供更好的基礎數據支撐。

2) 對于預處理后的數據,需要進行目視解譯來區分特征的類型,確定分類類別的數目,并選擇每個分類類別的訓練樣本來訓練分類器。

3)為了減少計算量,有些數據需要通過波段選擇和特征提取進行數據降維。常用的特征提取算法包括獨立成分分析(independent component analysis,ICA)[13]、主成分分析(principal component analysis,PCA)、因子分析(factor analysis,FA)[14]、線性判別分析(linear discriminant analysis,LDA)[15]、局部線性嵌入(locally linear embedding,LLE)[16]和核主成分分析(kernel principal component analysis,Kernel PCA)[17]等。這些算法能夠將高維度的高光譜數據轉換為低維度的特征空間,并保留了原始數據的主要信息,方便后續的數據處理和分析。

4) 對于不同的高光譜圖像數據集,需要選擇合適的模型以獲得最佳的分類效果。在模型選擇過程中,需要考慮多個因素,如數據集的特征、數據量的大小、計算資源的限制等。同時,也需要進行實驗評估,選擇最優的分類模型,以保證高光譜圖像分類的準確性和可靠性。

5) 在分類高光譜數據后,采用主成分濾波等方法消除孤立點和噪聲,進一步提升分類效果[18]。這些濾波手段可以去除高光譜數據中的異常點和噪聲,使處理后的數據更加平滑和準確。通過濾波處理后的分類結果,可以更好地對高光譜數據進行分類和分析。

6) 在高光譜圖像分類中,除了選擇適合的模型之外,對分類結果進行評估非常重要,可以通過混淆矩陣、Kappa分析、漏分誤差和多分誤差等方法對分類結果進行評價?;煜仃嚳梢哉故痉诸惤Y果的詳細信息,包括真實分類和預測分類的數量,以及各個類別之間的分類情況。利用混淆矩陣可以計算分類的準確率、召回率和F1值等指標,以全面評估分類效果。Kappa分析是一種常用的分類評估指標,用來反映分類結果與隨機分類的差異,它將觀測數據與期望數據進行比較,計算出Kappa系數來衡量分類結果的準確性。漏分誤差和多分誤差是衡量分類結果錯誤的指標。漏分誤差是指將某個類別的樣本錯誤地分為另一個類別,而多分誤差是指將不同類別的樣本錯誤地分為同一個類別。通過計算漏分誤差和多分誤差,可以更全面地評估高光譜圖像分類結果的準確性和可靠性??傊?在高光譜圖像分類中,需要根據不同的評估指標對分類結果進行全面、準確、可靠的評價,為后續處理提供更加精確可靠的數據支持。

2.2 高光譜衛星遙感分類面臨的問題

早期的遙感圖像分類方法是人工提取圖像特征,如顏色、形狀、紋理和光譜等信息,這需要具備專業知識和實踐經驗的專家設計不同的特征。雖然這些特征包含了大量可以用于目標分類的有用信息,但是這種方法存在局限性,因為設計特征的專家經驗對其描述能力會產生影響,在處理復雜圖像時表現不佳,無法發揮機器學習算法的最佳效果。隨著深度學習技術的發展,越來越多的方法使用卷積神經網絡(convolutional neural network,CNN)等深度學習架構自動學習圖像特征并進行分類。與傳統人工特征設計方法相比,深度學習方法更為通用、準確,且具有更強的魯棒性,并廣泛應用于各種遙感圖像分類任務。通過使用深度學習方法,可以自動學習數據中優秀的特征,與手動選擇的特征相比,能夠更有效地提高遙感圖像分類的準確性和效率。因此,深度學習算法已成為遙感圖像分類中的一種重要技術手段。

隨著遙感技術的不斷發展,遙感圖像分辨率越來越高,圖像中包含的細節越來越多。為解決單一特征無法全面表達目標對象的問題,多特征融合方法被廣泛運用于遙感圖像分類中。這種方法將來自圖像不同方面的特征結合起來,從而提高了分類的準確性和魯棒性。通過融合多個特征,可以充分挖掘不同特征之間的相關性和互補性,更全面地描述遙感圖像中的情況。例如,可以同時使用深度學習模型獲取紋理、形狀和光譜等不同特征,并將它們融合在一起,以增強分類算法對復雜遙感圖像的處理能力。在多特征融合方法中,可以采用不同的融合策略,如加權平均、層次式融合、元學習等方法,以最大限度地提高分類效果。因此,目多特征融合方法是遙感圖像分類領域的一個重要研究方向,它有望進一步提高遙感圖像分類的準確性和魯棒性,為智能化遙感應用提供更加精確的支持。常見的多特征融合方法包括特征層疊方法、特征疊加方法、特征加權方法等。這些方法在實際應用中取得了很好的效果,成為遙感圖像分類領域的重要研究方向之一。2021年,馮凡等人[19]提出了一種基于多特征融合和深度學習的精細分類方法,用于機載高光譜影像作物的精細分類。這種方法利用了形態剖面、灰度共生矩陣(gray-level co-occurrence matrix, GLCM)紋理和端膜豐度特征以及高光譜影像的空間信息,并將多個空間信息和原始光譜信息融合,生成分類結果。為了實現多特征融合,該方法考慮了特征堆疊、決策融合和概率融合三種方法。此外,該方法采用具有條件隨機場(DNN+CRF)模型的深度神經網絡來進行分類,進一步提高了分類的準確性和魯棒性。該方法在實驗中取得了非常令人滿意的分類結果,證明了多特征融合和深度學習技術的有效性和優越性,為機載高光譜影像作物分類研究提供了新思路。2022年,HUANG L P等人[20]利用高分一號全景多光譜掃描儀(panchromatic and multispectral scanner, PMS)傳感器模擬,和真實的高分五號,高光譜成像(hyperspectral imaging, HSI)、多光譜成像(multispectral imaging,MSI)和全色成像(panchromatic imaging,PAN)影像作為實驗數據,提出了一種新的分步融合策略來提高高光譜成像(Hyperspectral Imaging)的空間分辨率,并將其與傳統的融合策略(HSI + PAN)進行對比。研究結果表明,與傳統的融合策略相比,分步融合策略更能提高高光譜影像的空間分辨率,并且對于不同種類的遙感圖像,需要選擇不同的融合策略。

高光譜數據存在著異譜同物和異物同譜的現象,這些現象會影響到圖像的分類精度。早期的研究者通常只關注圖像在光譜維度上的信息,而忽略了空間維度上的信息[21]。隨著研究的不斷深入,空間信息也被應用于分類過程中,以提高分類精度。近年來,深度學習算法的應用進一步提高了分類的精度。針對自然場景中高光譜圖像中端元光譜可變性的問題,王艷紅等人[22]提出了一種新型的高光譜解混算法。該算法基于多尺度的頻譜空間加權與擴展線性混合模型,能更有效地解決光譜可變性的問題。特別是對于具有復雜光譜混合問題的高光譜圖像,效果更明顯。同時,該算法的復雜度較低,適用于大規模遙感圖像的處理。該研究為解決高光譜圖像混合問題提供了一種新思路和方法,并且在實驗中取得了良好的解混結果,證明了算法的有效性和可行性。劉穎等人[23]提出了一種改進的空譜聯合協同表征分類算法,旨在解決高光譜圖像分類中空間和光譜信息利用不充分的問題。該算法通過計算訓練像素與測試像素之間的歐式距離,能夠充分挖掘光譜信息,同時,還能計算測試像素與訓練像素之間的空間信息,更好地利用空間結構。將這兩種信息進行聯合建模,并使用最小殘差法進行高光譜圖像分類。通過實驗比較,該方法在高光譜圖像分類方面表現出較高的分類精度,遠勝于傳統算法。該研究方法在解決高光譜圖像分類中空間和光譜信息利用不充分的問題上提供了一種新思路和方法,并取得了良好的實驗效果。此外,該方法的優勢在于能夠更好地利用高光譜圖像中的各類信息,并有效地提高分類精度。因此,針對高光譜圖像分類問題,該算法具有重要的實際應用價值。利用3D-CNN對高光譜圖像進行分類時,通過空間光譜聯合信息的加入,可在一定程度上減弱異譜同物和異物同譜的影響,提高分類精度。雖然深度學習算法的出現已經在一定程度上降低了這些問題的影響,但是在真實應用場景中,仍然存在許多亟待解決的難題。比如,高光譜圖像中存在著很多與目標物體無關的背景噪聲,這些噪聲會對分類結果產生干擾;同時,由于高光譜圖像數據量較大,處理速度過慢也是一個需要解決的難題。因此,在未來需要進一步研究和改進相關算法,以提高高光譜圖像分類的準確性和效率。

3 高分五號高光譜圖像分類方法研究現狀及進展分析

近年來,基于概率統計原理的機器學習方法為遙感圖像分類提供了多種可行方案。傳統的機器學習分類方法主要包括監督分類和無監督分類。其中,監督分類通過基于部分訓練樣本的練習構建分類器,使其根據輸入的自變量值確定最可能的離散因變量,即分類結果。無監督分類是一種不需要進行訓練樣本選擇的遙感圖像分類方法,它可以僅利用有限的初始輸入數據,按照一定的規則將像元劃分到某一集群組中,然后通過與參考數據的比較,將每個集群組劃分到某一類別[24]。無監督分類不需要先驗知識,也不需要事先確定類別的數量和類型,因此具有很強的靈活性和實用性。在遙感圖像分類中,無監督分類通?;谙袼氐奶卣餍畔?可以先使用聚類算法將像素分成不同的類別,再根據它們的相似性來對應不同的地物類型。由于無監督分類算法對數據質量的要求比較高,因此在處理遙感圖像之前需要進行數據預處理和去噪。

3.1 監督分類

常用的監督分類方法包括支持向量機分類(support vector machine,SVM)、神經網絡分類(neural network,NN)、隨機森林分類(random forest,RF)、決策樹分類(decision tree classification,DTC)、最小距離分類法(minimum distance classification,MDC)、最大似然法分類(maximum likelihood classification,MLC)等。

3.1.1 支持向量機

SVM是一種用于二類分類的模型,它利用特征空間中的最大間隔超平面進行分類,是一種線性分類器,不同于感知器。此外,SVM還可以使用核函數將樣本數據從原始特征空間映射到高維空間,以解決原始特征空間中的線性不可分離性問題[25]。SVM通過硬間隔最大化來學習線性分類器,從而使得訓練數據集能夠被完全分開。當訓練數據不滿足線性可分時,SVM通過軟間隔最大化來學習線性分類器,在允許一定程度上的誤分類的同時,盡可能減小分類錯誤的數量和程度。此外,當訓練數據線性不可分時,SVM利用核技巧將其映射到高維空間,從而實現非線性分類器的學習。在這種情況下,SVM仍然應用軟間隔最大化來學習分類器,以平衡較高的復雜性和較低的誤差率,提高分類精度,并減小過擬合風險。SVM在圖像識別、文本分類等任務中具有廣泛的應用。2008年,T.OOMMEN等人[26]為提高圖像分類的可靠性和準確性,引入基于統計學習理論的支持向量分類(support vector classification,SVC)方案,旨在降低模型結構的不確定性和數據的適應性,并與最大似然法(maximum likelihood classification,MLC)比較分析。研究結果表明,SVC提高了分類準確性,穩健性。2017年,李斌[27]提出了一種改進型相關向量機算法,該算法利用主成分分析法和線性判別分析法,對高光譜數據進行二次降維。該算法可以增大數據的類間距離、減小數據的類內距離、降低數據維度,并保留主要信息,從而提高相關向量機的分類精度。這些實驗結果表明,改進型相關向量機算法具有優秀的遙感圖像分類效果,可以在實際應用中發揮重要作用。2022年,為探究國產高分五號(GF-5)高光譜和高分六號(GF-6)多光譜遙感數據及其不同特征組合在中高緯度濕地信息分類中的能力,潘煜琳等人[28]利用SVM、RF和KNN等3種分類器提取濕地信息,實驗結果表明基于GF-5和GF-6波段組合后的特征組合與SVM算法的結合獲取的濕地信息總體分類效果最好。

近年來,基于SVM與其他方法的混合模型應用越來越廣泛。居紅云等人[29]提出基于K-means與SVM結合的遙感圖像全自動分類方法;2020年,O.OKWUASHI等人[30]提出整合DL和SVM,以形成一種混合的由四個核函數實現的DSVM(dual support vector machine),并在印度松樹和帕維亞大學2個公開的高光譜數據集進行實驗,實驗結果表明,在高光譜遙感圖像分類中,DSVM具有很強的魯棒性,明顯優于傳統的SVM;2022年7月,陳珠琳等人[31]利用GF-5數據,研究了3種降維方法和3種分類方法(隨機森林、支持向量機和K鄰近KNN),實驗發現SVM在高維空間具有非常好的抗噪能力,分類精度高于RF和KNN。實驗結果也證明了含有SVM的具有23維輸入的L1-SVM-SBS分類模型總體分類精度最高。

3.1.2 決策樹分類

決策樹是一種基于樹形結構的分類算法,通過遞歸地進行劃分來實現分類。該算法會在訓練數據上學習一個類似于流程圖的樹形結構,其中每個內部節點表示一個屬性判斷,每個分支表示判別結果的輸出,每個葉節點則表示一種分類結果。在構建決策樹分類器的過程中,需要確定哪些特征用于分類及如何將數據進行劃分。通常決策樹分類算法(decision tree classification algorithm,DTCA)包括決策樹的生成和修剪2個步驟,其生成算法采用自上而下的遞歸方式,在決策樹內部節點進行屬性值的比較,并根據不同的屬性值進行分支。通過反復迭代,決策樹可以不斷細化屬性之間的關系,最終在葉節點處得到輸出結果,完成分類[32-33]。 2015年,針對高光譜遙感應用中地類光譜混淆性問題,沈聰穎等人[34]基于GF-5影像數據,構建了一種單波段閾值法與構建的陰影水體指數相結合的決策樹水體提取模型,與傳統的單分類算法相比,該方法能夠有效抑制山體陰影和裸地影響,顯著提升了山區水體提取精度;2021年,Y.C.SINGH等人[35]提出了一種新的框架,即混合多關系決策樹學習算法,克服了現有決策樹學習算法存在的技術缺陷和其它異常,減少了決策樹學習算法執行時間。在不同數據集上的實驗結果表明,混合多關系決策樹學習算法是一種綜合性較好的方法。

3.1.3 隨機森林

隨機森林算法將多個決策樹結合在一起,每次從數據集中隨機選擇一部分樣本(有放回地抽樣),同時隨機選取部分特征作為輸入,所構造的“森林”是決策樹的集成。2016年,李壘[36]提出了一種基于隨機森林的高光譜遙感圖像分類方法,充分利用高光譜圖像的光譜信息和空間結構信息,提高遙感圖像分類的精度。與單一特征的分類方法相比,該方法可以同時處理多個特征,包括光譜、空間和上下文信息等,更全面地描述像素點的特征。該方法使用隨機森林算法進行分類,通過組合多個決策樹的結果,減少過擬合情況,提高分類的穩定性和準確性。實驗結果表明,該方法在AVIRIS和ROSIS高光譜圖像上的分類性能優于傳統的高光譜圖像分類方法,具有較高的分類精度和泛化能力,并能有效降低數據噪聲和復雜度對分類結果的影響。2019年,王懷警等人[37]針對高光譜遙感數據樹種識別精度不高現有多分類器組合策略難以避免人為因素干擾的問題,利用自適應權值模型組合支持向量機和隨機森林2種機器學習算法,有效改善森林類型精細識別精度,對GF-5星載高光譜遙感數據應用具有借鑒意義和參考價值。2021年,楊紅艷等人[38]以內蒙古荒漠草原遙感圖像為例,使用無人機搭載高光譜成像系統采集數據,構建了包含24個變量的隨機森林分類模型。該分類模型融合了光譜、植被、地形和紋理等多種特征,能夠更全面地描述圖像的特征。與支持向量機、K近鄰算法和最大似然分類法相比,隨機森林分類方法的分類效果最好,總體分類精度達到91.06%,Kappa系數達到0.90,表明隨機森林算法具有較高的分類準確性和泛化能力,而且對于高光譜遙感圖像的特征提取和分類任務具有較強的適應性和優勢。因此,隨機森林算法可以被廣泛應用于高光譜遙感圖像的分類和解譯等領域,為自然資源管理和環境保護等提供重要的技術支持。

3.1.4 神經網絡分類

人工神經網絡(artificial neural network,ANN)是一種基于生物學中神經系統的模擬數學模型,模擬人類大腦的信息處理方式,可以分為前饋型網絡(feedforward neural network,FFNN)和反饋型網絡(recurrent neural network,RNN)2大類。其中前饋型網絡是一種大規模的非線性映射系統,常用于分類和回歸問題等,而反饋型網絡則是一種大規模的非線性動力系統,常用于時序預測、控制和優化等方面。人工神經網絡根據學習方法的不同,分為有監督學習、無監督學習和半監督學習;根據工作模式,可以分為確定性和隨機性;根據時間特性,可以分為連續型和離散型等。人工神經網絡在圖像處理、語音識別、自然語言處理、機器翻譯和智能控制等領域都有廣泛的應用,具有良好的適應性和擴展性。

2021年,P.LEVENTE等人[39]利用高光譜遙感數據監測入侵植物種類,將SVM 和ANN分類算法應用于高精度的野外參考數據。在SVM分類的情況下,總體準確率達到92.95%,利用ANN模型,總體精度達到99.61%。針對高光譜圖像分類中存在的樣本標簽有限和3D-CNN網絡特征提取不全面的問題,王立國等人[40]提出了一種改進的3D-CNN算法,該算法采用生成式對抗網絡,對原始數據進行數據增強,并解決部分樣本標簽少,導致分類模型出現過擬合的問題;同時,在3D-CNN網絡中,加入紋理信息增強模型,以更好地提取圖像的空譜特征。實驗結果表明,在小樣本數據情況下,該方法比原始網絡具有更高的分類精度,能夠自適應地提取高光譜圖像的空譜聯合特征。該方法對于解決高光譜圖像分類中的問題具有一定的優勢和實際意義,為高光譜遙感圖像的分類與解譯等領域提供一種新的技術手段和思路。2022年,劉一鳴等人[41]利用GF-5高光譜影像,設計并開發了基于人工神經網絡的神經網絡校正器,對懸浮泥沙濃度反演結果進行二次校正,實驗結果表明,校正后的模型在高分五號高光譜圖像得到的精度最高。

3.1.5 最小距離分類法

最小距離分類法是最基本的分類方法之一,該方法計算未知類別向量到預先已知類別中心向量的距離,然后將向量分配到這些距離中最小的類別中,從而實現分類。歐氏距離和曼哈頓距離是最常用的計算距離的方法,但由于該方法只考慮了待分類樣本與每個類別中心的距離,而沒有考慮已知樣本的分布,雖然分類速度很快,但準確率不高。此外,當特征維數很高時,最小距離分類法的運算量和計算復雜度會明顯增加,影響分類效率和準確性。因此,在應用最小距離分類方法時,需要充分考慮不同情況下的適用性和限制性,以確保其正確性和有效性。近年來,部分學者對其進行研究,但在高光譜領域研究較少,通常被用于和其他算法進行對比。2018年,朱培樂[42]提出基于自適應最小距離分類法的水質反演模型,對MNDWI(modified normalized difference water index)、NDTBI(normalized difference temperature and brightness index)、AWEI(automated water extraction index)、RNDWI(ratio normalized difference water index)4種水體指數中最佳水體提取結果進行優化。2015年,QIN F P等人[43]采用基于圖論的譜聚類算法解決波段選擇問題,用支持向量機和最小距離分類法對高光譜圖像進行分類,得到SVM的總體精度約為94.08%和94 .24%,MDC的總體精度約為87.98%和89.09%。

3.1.6 最大似然分類法

最大似然分類法(maximum likelihood classification,MLC)又被稱為貝葉斯(Bayes)分類法或極大似然估計法,它是一種使用概率模型進行參數估計的方法。利用已知的樣本結果,構建概率模型,并在此基礎上,通過求解模型參數,反推最有可能產生這個結果的模型參數值[44]。最大似然分類法的分類過程可以分為3步。首先確定訓練樣本,計算每個樣本的特征值,利用這些特征值建立判別模型函數,最后將每個像元的特征向量代入判別模型函數,根據所得到的概率值,將像元劃分為概率最大的一組類別[45]。MIC考慮了待分類樣本與已知類別中心的距離和已知類別的分布特征,可以更準確地對待分類樣本進行分類。與最小距離分類法相比,MIC分類方法具有更高的分類精度,能夠更好地處理數據集中的噪聲和變異。此外,MIC算法還可以通過先驗概率來調整分類結果,提高分類的準確性。因此,在實際的分類任務中,MIC算法也是常用的分類方法之一,但最大似然法在應用時存在一些問題。為解決這些問題,2012年,周國瓊等人[46]提出了一種基于模糊C均值聚類改進的最大似然分類法,并將其應用于遙感領域。實驗結果表明,改進后的最大似然分類法具有更高的分類精度,遠高于傳統的最大似然分類法。

3.2 無監督分類

常用的無監督分類方法有K均值聚類法(K-means)及ISODATA動態聚類。

3.2.1 K均值聚類算法

K-means聚類算法是一種基于歐氏距離的迭代聚類算法。該算法首先隨機選擇k個對象作為初始的聚類中心,然后計算每個對象與所有聚類中心之間的距離,并將其分配到距其最近的聚類中心所在的簇中。對于每個簇,重新計算其中所有對象的重心,并將其作為該簇的新聚類中心,形成新的k個聚類中心和k個簇。接下來,繼續重復上述過程,直到滿足某個終止條件,終止條件可以是沒有(或最少數量的)對象被重新分配到不同的簇或沒有(或最少數量的)簇中心再次改變或誤差平方和為局部最小。通過這個過程,K-means算法能夠將數據點分為k個不同的簇,使同一簇內數據點相似度較高而不同簇之間數據點的相似度較低。該算法在數據挖掘和機器學習領域有廣泛的應用,例如在圖像分割、文本聚類、人群分析等方面都有所應用。2018年,K.YASSER等人[47]將K-means方法應用于高光譜數據立方體,成功檢測出光譜組織差異,驗證了在高光譜圖像分析中,圖像處理算法K-means在構建能夠識別和分類正常和導管原位癌組織的半自動化系統方面的巨大潛力。2019年,李玉等人[48]在解決高光譜數據的"維數災難"問題方面,提出了一種新的高光譜圖像分類算法。該算法是在K-means聚類算法的基礎上進行改進,考慮了各個波段對不同聚類的重要程度,并且綜合類間信息,提高了分類的精度。這種算法被稱為熵加權K-means全局信息聚類。

這種算法的核心思想是使用熵權法對波段進行權重分配,以將各個波段的重要程度考慮在內。此外,算法還引入了一種新的距離度量方法,以更好地反映不同類別之間的差異。通過這些改進,該算法可以更準確地區分不同的類別,從而獲得更好的分類效果。相比傳統的K-means聚類算法,這種算法在處理高光譜數據時表現更為出色,分類精度更高。因此,在實際應用中,熵加權K-means全局信息聚類算法可以更好地應用于高光譜圖像分類任務中。2020年,汪凌志等人[49]提出了一種新的高光譜數據分類方法,以應對其典型問題。該方法基于光譜和空間特征相結合,通過空間特征與光譜特征相結合,并進行降維處理,最后使用K-means算法得到更佳分類結果。與普通的K-means算法不同,該算法在分類之前引入了空間特征的提取和處理過程,從而有效地利用了圖像的空間信息。通過將空間特征與光譜特征相結合,該方法可以更全面、更準確地描述圖像中的信息,從而提高了分類的準確度。該算法已成功應用于長波紅外的高光譜圖像分類中,并在實驗中獲得了較好的分類精度。因此,這種基于光譜和空間特征的K-means分類方法為高光譜數據的處理提供了一種新的思路和方法。

3.2.2 ISODATA動態聚類

迭代自組織數據分析技術(iterative self-organizing data analysis technique, ISODATA)聚類算法是K均值算法改進后的算法,它與K-means算法不同,一是ISODATA算法采用了批量樣本校正法,而不是逐樣校正法,這使算法更加高效;二是ISODATA算法允許自動合并和拆分聚類,從而生成數量合理的聚類結果。這種自動化的特性可以幫助ISODATA算法更加準確、快速地完成聚類任務,因此該算法在實際應用中得到了廣泛的運用。HONG P等人[50]提出的改進型ISODATA聚類算法結合了高光譜圖像的頻譜信息和空間信息,使用加權矩陣,分別計算2個像素之間的相似度,更準確地確定它們是否屬于同一類別。這種方法在高光譜圖像的空間目標材料識別任務中取得了非常好的效果,證明了該方法的有效性。實驗結果也證明了這種新方法在在空間目標材料識別相關的高光譜圖像上十分有效。

3.3 深度學習方法

深度學習是一種新興的機器學習技術,在圖像分類領域得到廣泛應用。與傳統的機器學習算法不同,深度學習旨在建立一種類人腦進行分析學習的神經網絡模型,從而能夠在處理大量訓練數據和多層隱藏層的深度模型中提取更有用的特征,并提高分類準確性。近年來,在遙感圖像分類應用方面,深度學習取得了重大的突破,越來越多的研究者開始將深度學習技術應用于遙感圖像處理中。利用深度學習技術,可以有效地獲取遙感圖像中的豐富信息,從而更好地描述圖像特征,并提高分類準確性。同時,深度學習方法還能夠自適應地對不同類型的遙感圖像進行處理,具有較強的泛化能力和魯棒性??傊?深度學習技術在遙感圖像分類應用中具有廣闊的發展前景和重要的應用價值。隨著這一領域的不斷發展和深入研究,深度學習技術將會在遙感圖像處理中發揮越來越重要的作用。

常用的深度學習方法包括自動編碼器[51]、卷積神經網絡[52]、深度信念網絡[53]和遷移學習[54]。近幾年,利用深度學習解決高光譜數據分類問題在GF-5數據上得到應用。2022年,ZHOU S Y等人[55]使用一份GF-5數據和兩份PRISMA衛星數據,通過深度學習和經光譜特征訓練的機器學習模型,檢測和識別飛機中不同類型塑料,利用CNN、RF和SVM等算法,取到了較好的實驗效果。2022年,季超[56]使用數據融合和降維等預處理技術,以及光譜角匹配法、支持向量機和基于深度學習的ENVINet5模型進行GF-5高光譜遙感數據的地物特征提取及分類研究,并對3種方法的結果進行綜合分析。實驗結果表明,3種方法的總體分類精度均達到80%以上,證明GF-5高光譜數據在地物特征提取與分類方面表現良好,且在精細化分類方面具有較好的應用前景。

4 展望

綜合以上相關研究的分析,高分五號衛星影像數據的高光譜遙感分類主要呈現以下發展趨勢:

1) 高效及高精度的分類算法研發仍然是高光譜影像分類的主要研究方向。

2) 將空譜特征與其他高分辨率影像聯合進行分類仍然是遙感圖像處理領域的研究熱點。通過將高光譜遙感影像與其他高分辨率影像進行融合,可進一步提高圖像分類精度,為實現更加準確和可靠的地物分類任務提供技術支持。

3) 探索和開發具有強大泛化能力的分類器,使其能夠在實際應用中有效地解決地物精細分類問題。

4) 深度學習是近幾年來的研究熱點,越來越多的學者將重心轉移到深度學習算法模型的構建上,提高了高光譜圖像的分類精度。

5 結束語

本文通過研究國內外高光譜及GF-5數據在不同分類算法下的分類性能差異,并根據前人的經驗,對高光譜圖像分類未來的發展提出一些建議:

1) 減少人力消耗。高光譜圖像包含了大量豐富的信息,但由于數據量龐大,初期處理往往需要依靠大量的人力,耗時費力。因此,考慮有效的自動化算法解決該問題,使高光譜圖像的處理更加高效、準確和可靠,這也成為遙感圖像處理領域的一個重要研究方向。

2) 將機器學習與深度學習相結合。在高光譜圖像分類研究中,不斷涌現出各種機器學習或深度學習算法,但是將兩者結合的算法卻較少。通過分析GF-5高光譜圖像分類實驗或者進行對比實驗可以看出,支持向量機有很大的發展前景,基于SVM的分類模型分類精度依舊處于前端。未來,高光譜圖像分類算法可以將研究重點放在如何有效地結合支持向量機、神經網絡等機器學習和其他深度學習方法上,從而實現更加準確可靠的高光譜圖像分類。

3) 將基于空譜聯合的分類方法應用到具體場景。盡管傳統的基于光譜特征的分類方法已經取得一定成果,但是由于未考慮高光譜數據的空間信息,因而其分類精度較低且在實際場景中的應用也不夠廣泛。因此,基于空譜聯合的方法成為解決未來實際應用問題的重要研究方向。結合高光譜數據和其他遙感影像數據,將傳統的基于光譜特征的分類方法拓展至基于空譜聯合的范疇,可以提高分類精度,促進高光譜圖像分類算法在實際應用中的推廣和應用。

猜你喜歡
光譜衛星分類
基于三維Saab變換的高光譜圖像壓縮方法
miniSAR遙感衛星
分類算一算
靜止衛星派
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
Puma" suede shoes with a focus on the Product variables
星載近紅外高光譜CO2遙感進展
苦味酸與牛血清蛋白相互作用的光譜研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合