?

聯合超像素降維和后處理優化的高光譜圖像分類方法

2024-03-20 01:09黃媛賀新光萬義良
遙感學報 2024年2期
關鍵詞:集上鄰域光譜

黃媛,賀新光,萬義良

1.湖南師范大學 地理科學學院,長沙 410081;

2.湖南師范大學 地理空間大數據挖掘與應用湖南省重點實驗室,長沙 410081

1 引言

高光譜圖像HSI(Hyperspectral Image)是由成像光譜儀在數十甚至上百個波段內對地面物體成像的結果,與多光譜圖像相比,HSI包含了大量的地物信息,有效提高了在遙感圖像分類方面的識別精度,被廣泛地應用于農業(Liang 等,2015)、軍事(徐棟 等,2020)和礦產資源開發(Carrino等,2018;董新豐 等,2020)等領域。然而由于HSI 的高維特性,導致圖像在分類過程中產生Huge 現象,致使分類精度隨著參與運算波段數目的增加而先升后降(董安國 等,2019)。因此,如何從HSI中提取高識別力特征以促進分類精度的提高仍是一個非常值得研究的問題。

為提高HSI 分類的準確率,提出了包括支持向量機SVM(Support Vector Machine)(Melgani 和Bruzzone,2004)、極限學習機(Li 等,2015)、K-近鄰法(Blanzieri 和Melgani,2008)和決策樹(華曄 等,2012)等在內的許多基于譜特征的機器學習分類方法。由于SVM 具有能夠以穩健有效的方式處理高維數據和小訓練樣本數據的特性,從而在高光譜圖像分類任務中脫穎而出(閆敬文 等,2019;Camps-Valls 和Bruzzone,2005)。到目前為止,SVM 仍被廣泛作為模型分類器而應用于HSI的分類任務(Jiang 等,2018;Duan 等,2021;李丹 等,2021)。已有文獻表明(李非燕 等,2019;付青 等,2020;魏祥坡 等,2020),僅依靠高光譜圖像的譜特征,而忽略空間信息的分類方法,其分類效果往往不是很理想。對此,眾多學者(Duan 等,2021;程文娟和陳文強,2020;張祥東 等,2021;高奎亮 等,2021)相繼提出了多種聯合空間和光譜信息的特征提取方法,致力于高精度地識別出HSI 的地物類型。例如,Duan等(2021)在光譜信息的基礎上,構建了一種基于自適應紋理平滑的雙通道空間特征提取算法;程文娟和陳文強(2020)利用卷積核提取HSI的空間—光譜特征并跨層融合,發展了一種多尺度跨層特征融合注意力機制的分類方法;張祥東等(2021)設計了一種能同步提取HSI空間信息和光譜信息的卷積神經網絡模型。然而,這些基于空—譜聯合特征的分類方法并沒有很好的關注到HSI的空域與譜域信息之間的聯系。值得注意的是,HSI的同一類別像素通常以不同的區域聚集在一起,導致圖像是由許多均勻的同質區域組成。目前,已經有學者(李丹 等,2021;Zheng 等,2019;Jiang 等,2018)關注到了這個現象。如李丹等(2021)基于局部鄰域集合提取圖像的高斯混合特征,充分捕獲了HSI的空間紋理結構信息、不同譜段間聯系和空—譜變化信息;Zheng等(2019)根據超像素分割和距離加權線性回歸分類器設計了一種分類方法,并應用于HSI的分類得到了良好的結果。尤其是,Jiang等(2018)提出的一種以均勻同質區域為混合特征提取單元的超像素主成分分析SPCA(Superpixelwise Principal Component Analysis)方法,該方法可有效提取HSI 的高區分性特征信息,并在小樣本標簽下具有優良的分類性能。但是,SPCA 方法中采用的熵率超像素分割算法(宋熙煜等,2015)生成的超像素緊密度和邊緣貼合度一般,不能很好的形成均勻區域。然而,Xu等(2018)基于簡單線性迭代聚類SLIC(Simple Linear Iterative Clustering)發展了一種區域聚類RC(Regional Clustering)算法。該方法可自然平衡HSI 的空間信息和光譜信息,是一種適合HSI 分類的空間預處理方法。另一方面,Li等(2020)在傳統線性判別分析的基礎上考慮了巴氏誤差界優化和非凸問題,提出了一種魯棒的稀疏線性判別分 析SLDA(Sparse Linear Discriminant Analysis)方法。受SPCA 的啟發,本文通過有效結合RC 和SLDA 發展了一種超像素稀疏線性判別分析SSLDA(Superpixelwise SLDA)方法。然而,預實驗表明,基于SSLDA 方法提取的HSI 空譜特征信息盡管能夠很好地表征高光譜圖像信息,但在部分異質邊緣區域的像元識別率欠佳。為了優化HSI的初始類別概率向量,Kang等(2015)基于擴展的隨機游走ERW(Extended Random Walker)構建了一種分類方法,并應用于三組常用的高光譜數據集,獲得了良好的分類結果。為了彌補SSLDA 在部分異質邊緣區域像元識別率欠佳的問題,本文應用ERW 進一步優化基于SSLDA 獲得的初始類別概率向量。相較于Kang等(2015),本文首先利用SSLDA提取HSI的高判別性稀疏混合特征,然后輸入SVM 獲得HSI 的初始類別概率向量,以期提高分類方法的精度和效率。

綜上所述,為了充分利用高光譜圖像的空間—光譜信息,且在樣本標簽量少的情況下提高圖像的分類精度,本文提出一種聯合超像素降維和后驗概率優化的高光譜圖像分類方法。首先基于HSI的空間—光譜信息,利用已發展的超像素稀疏線性判別分析法在空間鄰域信息的基礎上為每個樣本分配不同的局部鄰域,并在局部鄰域集合中提取超像素稀疏混合特征;再將全局稀疏混合特征代表HSI的空間—光譜特征輸入支持向量機分類器中,生成像素的類別概率向量;最后采用后驗概率模型—隨機游走法刻畫HSI相鄰像素之間的空間相關性,并優化類別概率向量且依據概率最大值得到分類標簽圖,從而完成圖像分類任務。為了驗證所提出的方法是否可以在HSI的圖像分類任務中取得優良的識別性能,將其應用到3組小規模數據集Indian Pines、Pavia University 和Salinas,以及一組大規模數據集HoustonU 上進行分類實驗,并與7種先進方法進行對比分析。

2 研究方法

2.1 超像素稀疏線性判別分析法

為有效提取高判別性的HSI特征信息和減少模型的整體運行時間,本文首先拓展了一種超像素稀疏線性判別分析方法,致力于獲取一組超像素稀疏混合特征來充分表征HSI的空間—光譜信息及其相關變化信息。相比于歸一化切割算法(Shi 和Malik,2000)、分水嶺分割算法(Vincent和Soille,1991)、基于圖的分割算法(Felzenszwalb 和Huttenlocher,2004)和SLIC(Achanta 等,2012)。SSLDA 方法中采用的區域聚類不僅降低了計算復雜度,還同時集成了HSI的空間—光譜信息,得到一組既表現出空間相關性又表現出光譜相似性的聚類分區。SSLDA 方法在這些聚類子塊集合中應用稀疏線性判別法降低HSI的光譜維度,并提取混合特征。因此,超像素降維方法主要分為局部鄰域集合的提煉和稀疏混合特征的提取兩大步驟,具體操作如下:

令X∈表示HSI 數據集,其中m1×m2為圖像尺寸,d為原始光譜維度。把3D立方體矩陣X重塑成2D 矩陣為X=[x1,x2,…,xi,…,xN]∈Rd×N,N=m1×m2,其中xi=[xi1,xi2,…,xij,…,xid]T是列向量,表示HSI中的第i個像素向量。

(1)初始化聚類。根據預先設置的分區數S,等距離初始化聚類中心C={c1,c2,…,ck,…,cS}∈Rd×S,其 中ck=[xck1,xck2,…,xck j,…,xckd]T;根據聚類中心初始化局部鄰域集合Ζ={Z1,Z2,…,Zk,…,ZS},其中Zk=表示局部鄰域集合Zk包含的第o個像元。

(2)計算空間距離和光譜距離。定義像元xi和聚類中心ck的空間坐標分別為和在ck的Nx×Ny矩形搜索范圍內計算像元xi到ck的空間距離DSpa和光譜距離DSpe。其中DSpa利用歐氏距離度量獲得,而DSpe采用光譜信息散度—光譜角獲得。具體定義為(Xu等,2018):

式中,r表示歸一化搜索范圍的對角線長度。且

(3)計算空—譜距離D(xi,ck)。根據空間距離DSpa和光譜距離DSpe計算像元xi與聚類中心ck的空—譜距離(Xu等,2018):

式中,σ∈[0,1]表示平衡空間項和光譜項的權重因子。

(4)更新聚類中心。根據式(1)—(5)計算各聚類中心ck的Nx×Ny搜索范圍內所有像元xi與ck的距離,以各聚類中心子塊內距離最小值對應的像元更新聚類中心,為Cu=其中的表達式為

式中,Zk表示第k個局部鄰域集合;u表示更新迭代次數。

(5)終止迭代。一般迭代次數設置為10 次,完成迭代后輸出最終局部鄰域集合Z={Z1,Z2,…,Zk,…,ZS}和中心C={c1,c2,…,ck,…,cS},否則重復步驟2—4直到完成迭代。

(6)降低局部鄰域集合Zk的光譜維度。由于SLDA 方法不僅能最大程度減少數據冗余信息,還能提取出最具判別性的稀疏特征,并對圖像中包含的異常值和噪聲具有一定的魯棒性。因此,為了準確表征HSI 的空間—光譜特征,利用SLDA 提取鄰域集合Zk的稀疏混合特征。為此,求解以下目標函數得到線性變換矩陣(Li等,2020):

式中,wk≠ 0;?和δ為調整參數,值均大于0;為類內散度矩陣。然后,通過以下公式得到局部鄰域集合Zk的稀疏混合特征

(7)輸出HSI的所有鄰域集合的稀疏混合特征Yk,并表示為Y={Y1,Y2,…,Yk,…,YS}={y1,y2,…,yi,…,yN}。

2.2 核主成分分析法

基于同質局部鄰域集合的SSLDA 方法所提取的超像素稀疏混合特征,雖然能夠充分挖掘HSI的紋理結構信息和判別性光譜特征,但是卻忽略了不同局部鄰域集合之間存在的內在聯系,從而導致得到的稀疏混合特征仍存在一定的數據冗余??紤]到核主成分分析KPCA(Kernel Principal Component Analysis)(Yu 等,2021)利用核函數,不僅獲得數據的主成分信息,還能使非線性數據線性可分(Sch?lkopf 等,1997)。因此,本文對超像素稀疏混合特征應用KPCA,以至于能夠得到更加精簡和高區分性的特征信息。KPCA 的主要步驟如下:

(1)針對HSI 的全局稀疏混合特征Y,利用非線性映射函數?(·)把Y映射到高維空間。由于?(·)不能顯性給出,因此令K=[?(Y)]T?(Y),則Y的主成分特征ti計算如下(Yu等,2021):

式中,K∈RN×N表示通過高斯核函數得出的矩陣,αi表示K的第i個特征值λi對應的特征向量。

(2)根據Kαi=λiαi計算出特征值λ1≥λ2≥…≥λn,并取前K個特征值對應的特征向量{α1,α2,…,αK}。K個主成分組成的特征矩陣T=[t1,t2,…,tK]T∈

(3)利用特征向量αi和式(9)計算出Y的前。

2.3 擴展的隨機游走法

由于超像素降維提取的空譜特征容易導致分類方法在部分異質邊緣區域的錯分率較高,然而擴展的隨機游走算法(Grady,2006)具有計算簡單、搜索速度快、不受噪聲影響和能夠同時識別多個對象的特點。因此,本文采用ERW 編碼HSI的空間信息至加權圖中,以刻畫相鄰像素之間的空間相關性,并用之優化由SVM 得到的初始類別概率向量。

首先,利用已計算的主成分特征矩陣T代表高光譜圖像的空間—光譜特征輸入SVM 分類器中,得到的初始類別概率向量R1={r1,r2,…,ri,…,rN}∈RM×N,其中且1,M表示類別數量。ERW 對不同類別m的空間概率優化通過以下能量函數(Duan 等,2021)來實現:

式中,Qm表示根據訓練樣本的位置索引和標簽值形成的類別m的區域像元集合;表示第m類像元集合相鄰像素之間的空間相關性;表示第m類像元初始類別概率的拉普拉斯—貝爾特拉米算子;γ表示權重因子;且有:

式中,Λ表示由初始類別概率組成的對角線矩陣;L表示對原始HSI 利用KPCA 計算的第一主成分特征的拉普拉斯矩陣(Grady,2006):

式中,vi和vj表示圖的頂點,其中圖是依據圖像尺寸構建而成。表示連接vi和vj兩個頂點的邊界的權重值,其中β為自由參數;di=∑ωij表示頂點vi的階數。

然后,利用(10)式對不同類別的初始概率向量優化后得到所有類別的后驗概率向量R2。最后,根據概率最大值獲得HSI的分類標簽圖。

2.4 本文的算法

聯合上述的超像素稀疏線性判別分析、核主成分分析和擴展的隨機游走方法,本文提出一種聯合超像素降維和后驗概率優化的高光譜圖像分類模型,為方便表達簡稱為SKERW_SVM。其模型框架如圖1所示,算法的詳細流程如下:

圖1 聯合超像素降維和后驗概率優化的高光譜圖像分類模型(SKERW_SVM)框架圖Fig.1 Outline of Hyperspectral-image classification method combining superpixel dimension reduction with post-processing optimization(SKERW_SVM)

(1)初始化聚類中心C={c1,c2,…,ck,…,cS}和局部鄰域集合Z={Z1,Z2,…,Zk,…,ZS};

(2)基于式(5)—(6)和迭代次數不斷更新C和Z,并獲得最終的局部鄰域集合;

(3)利用式(7)—(8)計算Z中各鄰域集合的超像素稀疏混合特征,即得Y={Y1,Y2,…,Yk,…,YS};

(4)采用式(9)獲得Y的前K個主成分特征組成的矩陣T=[t1,t2,…,tK]T;

(5)針對T并按照一定比例選取訓練樣本和測試樣本;

(6)將訓練樣本和測試樣本輸入SVM分類器中,得到初始類別概率向量R1={r1,r2,…,ri,…,}rN;

(7)應用式(10)來優化初始類別概率,得到R2,并依據概率最大值獲得高光譜圖像的類別標簽圖。

輸出:HSI的類別標簽圖。

2.5 評價指標

為了定量評估不同算法的分類性能,本文采用總體精度OA(Overall Accuracy)、平均精度AA(Average Accuracy)和Kappa 系數作為評價指標。OA是指正確識別像素占圖像總像數的百分比。AA是指每類正確識別像素百分比和的平均值。Kappa系數是利用混淆矩陣計算出的統計量,用來衡量預測標簽和真實標簽之間的一致性。

各評價指標的具體定義為

式中,M表示高光譜圖像的類別數量;F表示混淆矩陣;Ni表示圖像第i類測試樣本總數;且CAi=和其中Fi·和F·i表示混淆矩陣第i行和第i列的和。OA、AA 和Kappa系數的值通常在0—1,三者值越高,模型的分類性能越好。

3 實驗與分析

實驗在Windows10 平臺,內存為16GB 的Intel(R)Core(TM)i7-10750H CPU 2.60GHz計算機硬件環境中運行。軟件環境為MATLAB 2018b。

3.1 數據集介紹

本文采用3 組常用的小規模數據集Indian Pines、Pavia University 和Salinas,以及一組大規模數據集HoustonU 來評估分類方法的性能。圖2 繪制了這4組數據集的假彩色圖像和標準地物分類圖像,并給出了合成各數據集假彩色圖像的波段序號。

圖2 可視化4組數據集的假彩色圖像和標準地物分類圖像Fig.2 Pseudo color and Ground-truth for following four datasets

(1)Indian Pines 是由AVIRIS傳感器在1992年美國印第安納州西北部的印第安松樹場上空采集,有145 × 145 個像素和224 個光譜帶,波長范圍為0.4—2.5 μm。實驗中選擇去除24 個吸水通道后的200 個波段圖像作為輸入數據。其包含16 類地物,如圖2(a)所示。其中大部分地物為處于不同生長階段的作物,由于不同作物之間具有相似的光譜反射率,因此具有一定的挑戰性(Mou 等,2020)。

(2)Pavia University 是2003 年在Pavia 大學上空由ROSIS 傳感器采集的610 × 340 圖像大小的場景影像,波長范圍為0.43—0.86 μm。將12 個噪聲波段篩出后,剩余103 個波段圖像應用于本次實驗。圖像包含瀝青(Asphalt)、碎石(Gravel)和裸露土壤(Bare Soil)等9 類地物,如圖2(b)所示。

(3)Salinas 是由AVIRIS 傳感器在加利福尼亞州的Salinas山谷采集的224個波段圖像組成的數據集,各波段圖像尺寸為512 × 217 像素,其中包含了16 個地物類別。除未分類像素外,標準地物分類圖像共54129 標簽像素可用,如圖2(c)所示。在分類實驗中,選擇去除了20個吸水帶后的204個波段圖像作為實驗數據。

(4)HoustonU 是2018 年IEEE GRASS 數據融合分類挑戰大賽發布的競賽數據集,由搭載在飛機上的CASI 高光譜成像儀于2017 年2 月16 日在休斯頓大學校園及其附近區域拍攝的場景圖像,包括50 個波段和20 類地物,波長范圍為0.38—1.05 μm,圖像的尺寸為601 × 2384 像素,有標簽的像元共504856 個,如圖2(d)所示。與上述3組常用數據集相比,HoustonU 的地物類型和有標簽樣本量多,空間范圍廣,分類任務更加復雜。有關本文數據集的詳細介紹可參考網站http://www.ehu.eus/ccwintco/index.php?title=Hyperspectral_Remote_Sensing_Scenes和http://hyperspectral.ee.uh.edu/?page_id=1075[2021-07-23]。

3.2 參數分析

本節對SKERW_SVM 方法中降維后的光譜維度l、超像素數量S和用于分類的核主成分數量K3個重要參數進行優化分析。為檢驗所提出的方法在少量標簽樣本下的分類能力,本文將3組常用的Indian Pines、Pavia University 和Salinas 數據集的有標簽樣本分別隨機劃分為訓練、驗證和測試樣本集,具體的劃分樣本數如表1—3所示。在這一節,選取訓練樣本訓練模型,而依據驗證樣本集上的總體分類精度確定最優參數值,然后,在下一節利用測試集評估模型的分類性能。圖3展示了l、S和K的不同取值對SKERW_SVM 方法在3 組常用數據集上分類性能的影響。首先,初始化S=100 和K=20,取l=1,3,5,10,15,20,25,30,35,40,和50 分別對3 組數據集進行分類實驗,以識別參數l的最優值,如圖3第1行的3小圖所示,當l為30、20 和15 時,對應在Indian Pines、Pavia University 和Salinas 上獲得最大OA 值。然后,在l為最優值的條件下,討論參數S的最優值。由于無論KPCA 中的主成分數K取何值,與未使用KPCA的分類方法相比,其分類效果均有不同程度的提高。因此,在分析參數S時,不考慮KPCA 的使用,以強調S對分類結果的影響。取S=10,15,20,25,30,35,40,50,60,80,100 和120,分別對3 組數據集進行分類實驗,圖3 第2 行的3 小圖呈現了所獲得的總體分類精度。從圖3 第2 行的3 小圖可知,在設置的參數范圍內,Indian Pines、Pavia University和Salinas數據集對應的最優S值分別為50、20和15。由于參數S的最優取值與圖像的紋理結構關系密切,合適的超像素數量有利于充分挖掘同質區域的高區分性特征。然而,無論S的大小如何,SKERW_SVM 的分類性能總是高于未進行超像素分割的方法,這與Jiang等(2018)中的結論是一致的。因此,對于Salinas 數據集,盡管SKERW_SVM 的最優參數S值稍小于該數據集的類別數,但本文提出的SSLDA 方法仍能對模型的分類性能起到提高的作用。最后,在{1,3,5,10,15,20,25,30}的集合中,當l和S均為最優值的條件下,討論3 組數據集上的最優K值。由圖3 第3 行的3 小圖知,在Indian Pines、Pavia University和Salinas數據集上的最優參數K值依次為20、25和20。

表1 Indian Pines數據集劃分情況Table 1 Data partitioning of the Indian Pines dataset

表2 Pavia University數據集劃分情況Table 2 Data partitioning of the Pavia University dataset

表3 Salinas數據集劃分情況Table 3 Data partitioning of the Salinas dataset

圖3 SKERW_SVM方法中參數l、S和K的不同取值對Indian Pines、Pavia University和Salinas數據集總體分類精度的影響Fig.3 The influences of the size of parameters l,S and K on the overall classification accuracy(%)of the proposed SKERW_SVM method for the Indian Pines,the Pavia University,and the Salinas datasets

3.3 實驗設置

為評估SKERW_SVM 在HSI分類任務上是否具有優良的分類性能,本文實驗選擇5個相關分類方法與SKERW_SVM 在已選用的高光譜數據集上進行仿真對比實驗。對比方法分別是:(1)傳統的支持向量機分類器(Melgani 和Bruzzone,2004),簡稱為SVM;(2)利用主成分分析(PCA)提取HSI 的光譜特征并將其作為HSI 的圖像信息輸入SVM 中的方法(Prasad 和Bruce,2008),簡稱為PCA_SVM;(3)采用一種結構輪廓SP(Structural Profile)自適應地提取HSI 的空—譜特征并輸入SVM 的方法(Duan 等,2021),簡稱為SP_SVM;(4)一種以均質區域為混合特征提取單元的SPCA并結合SVM 的方法(Jiang 等,2018),簡稱為SPCA_SVM;(5)應用ERW 編碼HSI 的空間信息至加權圖中,并用之優化由SVM 獲得的類別概率向量的方法(Kang 等,2015),簡稱為ERW_SVM。此外,為評估SSLDA、KPCA 和ERW 對SKERW_SVM 分類結果的階段性貢獻,本研究也進行了消融實驗。其對比方法包括:(1)僅利用SSLDA 提取混合特征即輸入SVM 的方法,簡稱為SSLDA_SVM;(2)利用SSLDA 和KPCA 提取混合特征并輸入SVM 的方法,簡稱為SKPCA_SVM。在所有對比方法的分類實驗中,涉及與本文提出的SKERW_SVM 方法同樣的參數時,均設置一致。其中,SVM分類器采用徑向基核函數,通過5次交叉驗證方法選擇分類模型參數。

由于訓練樣本和測試樣本是按照一定比例隨機分布,從而導致分類精度容易產生較小的誤差,因此對所有方法均重復10 次,取平均值作為最終的分類精度。

3.4 結果與分析

根據表1—3 所示的各數據集訓練樣本和測試樣本的數量隨機生成訓練集和測試集,分析SKERW_SVM 與所選對比方法分別在小規模數據集Indian Pines、Pavia University 和Salinas上的分類效果,各分類模型的OA、AA 和Kappa,及單個類別的精度結果分別如表4—6 所示,可視化各模型的分類標簽圖分別如圖4—6所示。

表4 8種算法在Indian Pines數據集上的分類精度Table 4 Classification accuracy of eight methods on the Indian Pines dataset/%

表5 8種算法在Pavia University數據集上的分類精度Table 5 Classification accuracy of eight methods on the Pavia University dataset/%

圖4 8種算法在Indian Pines 數據集上的可視化分類結果Fig.4 Classification maps obtained by eight methods on the Indian Pines dataset

圖6 8種算法在Salinas 數據集上的可視化分類結果Fig.6 Classification maps obtained by eight methods on the Salinas dataset

由表4—6 可見SKERW_SVM 方法在3 組小規模數據集的少訓練樣本分類實驗中都獲得了最高的OA 和Kappa 值,以及多個單類別精度的最高值。這是由組成所提方法的SSLDA、KPCA 和ERW 共同作用產生的結果,因方法依次利用了高判別性的稀疏混合特征信息、不同局部鄰域之間的內在聯系以及相鄰像素之間的空間相關性,從而在訓練樣本有限的條件下,SKERW_SVM 仍能表現出優良的分類性能。如在Indian Pines 和Salinas 數據集的分類實驗中,SKERW_SVM 的OA值和Kappa 系數都以超過98%的分類精度,成為對比方法中的最優模型;在Pavia University 的實驗中,SKERW_SVM 取得了高達98.13%的平均精度。其次,在Salinas 的實驗中,與SVM 相比,由于PCA_SVM、SP_SVM、SPCA_SVM、SSLDA_SVM、SKPCA_SVM 和SKERW_SVM 均考慮了對原始譜域降低維度,提取判別性的特征信息后再輸入分類器進行標簽識別,從而減少了數據冗余和避免了休斯現象,因此他們的分類精度較SVM 有很大幅度的提升。如表6所示,SKERW_SVM 在Salinas數據集上的OA、AA 和Kappa 值比SVM 分別提高了13.14%、7.63%和14.61%。然而,在Indian Pines和Pavia University 數據集上,除PCA_SVM 外,其余6 種方法均比SVM 的識別率高,這可能是由于本文確定的降維參數值不是PCA_SVM 方法的最優參數,從而導致提取的譜特征信息不夠充分。然后,從表4—6 可以明顯發現,聯合空譜信息的SKERW_SVM 等HSI分類方法明顯高于僅考慮光譜信息的PCA_SVM,正如閆敬文等(2019)和Duan等(2021)所指出:僅利用光譜信息的方法難以實現HSI 的精確分類。最后,觀察在Indian Pines和Pavia University 數據集上的實驗結果,SKERW_SVM 的OA值較SP_SVM分別提升了1.11% 和1.37%的正確率,較SPCA_SVM 分別提高了6.17%和7.75%的正確率。且在Salinas 的分類實驗中,SKERW_SVM 較SP_SVM 和SPCA_SVM分別提升了0.56%和1.02%的正確率。這是由于,雖然SP_SVM 關注到光譜信息和空間信息的重要性,卻未考慮兩者之間的相關性,而SKERW_SVM 不僅利用了HSI的空間—光譜特征,還注意到HSI圖像存在均勻同質區域,并基于這些局部鄰域集合結合稀疏算法提取混合特征,有效提高了屬于不同目標的像素可分性;另一方面,由于圖像分割生成的聚類區域并不能與所有地物的邊緣貼合一致,導致在部分超像素分割邊緣的目標像素中識別率普遍偏低,而SKERW_SVM 利用HSI相鄰像素之間的空間相關性彌補了這一問題,從而使得SKERW_SVM在分類精度上大于SPCA_SVM。

表6 8種算法在Salinas數據集上的分類精度Table 6 Classification accuracy of eight methods on the Salinas dataset/%

觀察圖4—6,并對比圖2 中的標準地物分類圖像可以發現,SVM 和PCA_SVM 得到的分類結果圖像產生類似于“椒鹽噪聲”的現象,SKERW_SVM、SP_SVM 和ERW_SVM 得到的分類標簽圖最接近標準地物分類圖像,這與表4—6 得到的結果一致。受制于光譜信息的局限性,SVM 和PCA_SVM 對HSI 的分類能力不高。由于SPCA_SVM、SSLDA_SVM 和SKPCA_SVM 考慮了高光譜圖像的空間結構信息、光譜信息和空—譜變化信息,因此分類精度較僅基于譜域的SVM 有一定程度的提高,這種現象在Indian Pines 數據集上尤為明顯。但因為SPCA_SVM、SSLDA_SVM 和SKPCA_SVM 方法在部分分割區域邊緣貼合度一般,導致基于這些區域的光譜降維容易在異質邊緣產生“噪聲”。而SKERW_SVM 利用了后驗概率模型—擴展的隨機游走算法彌補了超像素降維帶來的“后遺癥”,從而提高了模型整體的識別能力。

在消融實驗中,對比SKPCA_SVM 和SSLDA_SVM 可以發現,KPCA 整體上提高了模型的分類性能,這是由于KPCA 把不同區域的稀疏混合特征融合在一起,進一步增強了不同類別像元之間的區分度和降低了數據冗余。觀察SKERW_SVM 和SKPCA_SVM 的分類精度(表4—6)和分類結果圖像(圖4—6)可以發現,ERW 解決了基于局部鄰域集合提取的稀疏混合特征輸入SVM 后在異質邊緣區域產生的“噪聲”問題,顯著提高了模型的性能。如在Indian Pines 數據集上,SKERW_SVM的OA 值比SKPCA_SVM 提升了6.81 的百分點。此外,本文提出的SKERW_SVM 在3個數據集上的分類性能均較優于ERW_SVM方法,這間接體現了所提出的SSLDA 方法可有效提高模型的分類精度。這是由于SSLDA 在利用高光譜圖像空間紋理信息構建的局部鄰域集合的基礎上,挖掘了HSI的高判別性稀疏混合特征,那充分表達了HSI的空譜信息和相關變化信息,從而減少了光譜維度,以及在分類的過程中加大了樣本間的可分性,從而提高了SKERW_SVM的分類性能。

為了進一步驗證本文提出的SKERW_SVM 在大規模數據集上是否仍然具有優良的分類性能,本文選取HoustonU 數據集作為實驗對象,分析SKERW_SVM 與5 種對比方法的分類效果。為確定SKERW_SVM 在HoustonU 上的最優參數,把該數據集的有標簽樣本隨機劃分為訓練集、驗證集和測試集,具體的劃分樣本數量分布如表7所示。首先,利用訓練集和驗證集獲得SKERW_SVM 的參數l、S和K的最優值分別為25、15 和25。然后,依據劃分的訓練集和測試集開展對比實驗,表8列出了各分類方法的分類精度,且圖7展示了他們的分類標簽圖。從表8 可以看到,本文的SKERW_SVM 在HoustonU 數據集上以最高的OA、AA 和Kappa值成為對比方法中的最優方法,尤其是相較于SPCA_SVM 和PCA_SVM,SKERW_SVM 的OA值分別提高了3.56%和9.32%的正確率,這表明本文提出的HSI分類方法在大規模數據集上具有一定的有效性。觀察圖7 可以發現,利用SKERW_SVM、SP_SVM 和ERW_SVM 獲得的分類標簽圖比應用SVM 和PCA_SVM 得到的結果圖像更不容易產生類似于“椒鹽噪聲”的現象,且更接近于HoustonU 的標準地物分類圖像,這也進一步驗證SKERW_SVM具有優良的分類性能。

表7 HoustonU數據集劃分情況Table 7 Data partitioning of the HoustonU dataset

表8 6種算法在HoustonU數據集上的分類精度Table 8 Classification accuracy of six methods on the HoustonU dataset/%

圖7 6種算法在HoustonU 數據集上的可視化分類結果Fig.7 Classification maps obtained by six methods on the HoustonU dataset

與此同時,為了更好的說明本文提出方法的分類性能,實驗記錄了各對比方法在4組數據集上的仿真運行時間,如表9 所示。通過比較發現,PCA_SVM 在Pavia University 數據集上的運行時間最少,而SPCA_SVM 在另外3 組數據集上耗時最短,但PCA_SVM 和SPCA_SVM 的分類精度較SP_SVM、ERW_SVM 和SKERW_SVM 方法卻相對較低。其次,盡管ERW_SVM 的分類精度僅次于SKERW_SVM,然而它的實驗運行時間在所有對比方法中最長,尤其是在Indian Pines 數據集上,ERW_SVM 的時間成本約為SKERW_SVM 的四倍。因此,綜合考慮分類精度和時間成本,本文提出的方法在高光譜圖像分類任務上是更可取的。

表9 6種算法在Indian Pines、Pavia University、Salinas和HoustonU數據集上的運行時間Table 9 The computing time of six methods on the Indian Pines,Pavia University,Salinas and HoustonU datasets/s

4 結論

本文提出了一種聯合超像素降維和后驗概率優化的高光譜圖像分類方法,旨在解決小樣本標簽條件下空間—光譜信息利用不充分導致的圖像分類精度較低的問題。提出的方法采用區域聚類的圖像分割方法,為HSI 的像元構建局部鄰域集合,這準確地利用了高光譜圖像的空間信息。其次,基于同質的局部鄰域集合應用降維方法提取高判別性的稀疏混合特征,深度挖掘了HSI的空間紋理信息、不同維度光譜間的聯系以及空間—光譜變化信息。同時,應用的后驗概率模型有效降低了因超像素降維導致的部分分割邊緣像素錯分率較高的現象,這在很大程度上提高了分類精度。在4組高光譜數據集上的實驗結果充分證明了所提方法的有效性,結果表明:本文方法能夠自適應地提取高光譜圖像的高判別性特征信息,并在少量的樣本標簽下,分類精度均優于目前幾種先進的分類方法,且時間損耗適中。

志 謝由衷地感謝巴斯克大學計算情報小組分享了開源可用的Indian Pines、Pavia University和Salinas 數據集,以及IEEE GRSS 圖像分析和數據融合技術委員會與休斯頓大學的高光譜圖像分析實驗室分發的HoustonU數據集!

猜你喜歡
集上鄰域光譜
基于三維Saab變換的高光譜圖像壓縮方法
Cookie-Cutter集上的Gibbs測度
稀疏圖平方圖的染色數上界
鏈完備偏序集上廣義向量均衡問題解映射的保序性
基于鄰域競賽的多目標優化算法
復扇形指標集上的分布混沌
關于-型鄰域空間
星載近紅外高光譜CO2遙感進展
苦味酸與牛血清蛋白相互作用的光譜研究
鋱(Ⅲ)與PvdA作用的光譜研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合