?

融合空譜特征的MR?鄄KRVFL高光譜地物識別模型研究

2024-04-26 20:08郭國璐范玉剛馮曉蘇
化工自動化及儀表 2024年2期
關鍵詞:正則光譜像素

郭國璐 范玉剛 馮曉蘇

基金項目:工業控制技術國家重點實驗室(浙江大學)開放課題(批準號:ICT2022B06)資助。

作者簡介:郭國璐(1994-),碩士研究生,從事圖像處理、模式識別的研究。

通訊作者:范玉剛(1973-),副教授,從事系統狀態監測、圖像處理等方向的研究,931320583@qq.com。

引用本文:郭國璐,范玉剛,馮曉蘇.融合空譜特征的MR-KRVFL高光譜地物識別模型研究[J].化工自動化及儀表,2024,51(2):284-293.

DOI:10.20030/j.cnki.1000-3932.202402018

摘 要 針對高光譜圖像復雜空譜特性影響地物識別模型分類精度的問題,提出一種融合空譜特征的流形正則化核隨機向量函數連接網絡(MR-KRVFL)高光譜圖像地物識別方法。首先,對高光譜圖像進行熵率超像素分割(ERS),獲取對應的同質區域;其次,利用主元分析(PCA)對同質區域進行降維并提取其空譜聯合特征;最后,基于空譜特征信息,構造核隨機向量函數連接網絡(KRVFL)地物識別模型,并對模型進行流形正則化約束,提高高光譜圖像地物識別模型的泛化性能。將該模型應用于Indian Pines和Pavia University高光譜數據集,分類精度達到了96.84%和98.83%,證明所提模型的有效性。

關鍵詞 熵率超像素分割 高光譜圖像 核函數 流形正則化 分類精度 地物識別

中圖分類號 TP751;P407.8? 文獻標志碼 A? ?文章編號 1000-3932(2024)02-0284-10

高光譜圖像含有數十至上百個窄波段的地物光譜信號,成為土地利用分類相當豐富完備的光譜信息來源,在地質學[1]、精細農業[2]、林業[3]等領域都具有較高的應用價值,近年來,已逐漸成為機器學習和機器視覺領域的研究熱點,并取得了大量的研究成果。

在發展之初,學者們只采用光譜信息對高光譜圖像進行分類,由于缺乏空間特征的有效利用,分類效果往往不理想。利用高光譜圖像所蘊含的空間信息,可進一步強化每個像素點所代表目標的特征辨識度,提高分類識別精度[4]。文獻[5]利用超像素提取高光譜圖像空譜特征的方法,有效降低了計算量并提高了分類精度;文獻[6]將熵率超像素分割(Entropy Rate Hyperpixel Segmentation,ERS)引入自適應字典中,充分利用其空譜信息,解決了高光譜圖像小樣本情況下分類精度低的問題;文獻[7]將主元分析(Principal Component Analysis,PCA)延展到超像素分割領域,提出一種聯合空譜信息的特征提取方法,極大地改善了高光譜圖像的分類效果。

充分利用所提取到的空譜信息,建立穩定的地物識別模型是實現高光譜圖像分類的關鍵。極限學習機(Extreme Learning Machine,ELM)以其良好的非線性擬合能力和高效的學習效率廣泛應用于高光譜圖像分類領域,但ELM網絡中隱含層參數的隨機輸出容易導致部分神經元成為無效神經元,為此文獻[8]提出了核極限學習機(Kenel Extreme Learning Machine,KELM)用于高光譜圖像的分類,通過核函數代替ELM的隱含層,使其輸出神經元更為穩定。隨機向量函數連接網絡(Random Vector Functional Link Network,RVFL)的學習行為類似于ELM,不同的是RVFL采用輸入層與輸出層直連的方式,有效增強了輸入輸出數據的關聯,但RVFL具有隨機參數特征,模型不穩定。文獻[9]提出一種值偏差約束的RVFL模型,基于結構風險最小化理論和加權最小二乘法對權重參數進行限制,提高了模型的魯棒性。

上述模型在訓練過程中都忽略了數據樣本間的結構信息。因此,筆者通過核隨機向量函數連接網絡(Kenel Random Vector Functional Link Network,KRVFL)與RVFL的輸出層結合,提出融合空譜特征的流形正則化核隨機向量函數連接網絡(Manifold Multilayer Kenel Random Vector Function Link Network,MR-KRVFL)高光譜地物識別算法,以樣本間的局部幾何信息構造拉普拉斯特征映射,作為輸出層的正則項,以提高KRVFL模型的地物識別精度。

1 研究方法

1.1 高光譜圖像空譜信息特征提取

ERS算法的核心是圖論思想[10],其熵率能促進高光譜圖像分割形成結構均勻、緊湊的同質區域,僅覆蓋圖像中的單一目標,其工作流程如圖1所示。

高光譜數據集形如X∈R,M、N、D分別代表其行、列和波段數。將X轉變為二維矩陣X=[x,x,…,x]∈R,元素i的波譜為x(1≤i≤m),m=M×N。首先對X進行主元分析,提取其第一主成分Υ,由Υ的像素點構造無向圖G=(V,E),其中V為Υ構成的超像素點集,E為相鄰超像素點的邊構成的集合,即采用帶權的無向圖G=(V,E)代替源圖像,把圖像從分割問題轉化為劃分問題。最優化目標函數為:

c*=arg{F(c)+θE(c)}? ? (1)

其中,c*為E中的子集c所對應的最優值;F(·)為隨機游動熵率;E(·)為平衡項;θ為調節權重。

求解式(1)可得高光譜圖像Υ被分割為:

Υ=L,L∩L=?芰,i≠j? ? (2)

其中,L和L為Υ中第i和j個超像素;m為Υ中的超像素數量。

1.2 高光譜地物識別模型

1.2.1 核隨機向量函數連接網絡(KRVFL)

RVFL網絡是一個經典的單層前饋神經網絡[11],結構如圖2所示。為了進一步提高模型的識別能力,將RVFL網絡與核函數相結合,用核函數代替RVFL網絡中隱含層的特征映射,構建KRVFL模型,由此將數據特征升維,使高光譜圖像分類更加精準。此外,輸入層和輸出層之間的直接連接是一種簡單有效的正則化技術,可防止RVFL網絡數據過度擬合。

圖2 RVFL結構示意圖

{(x,y)|x∈Rn,y∈Rm,i=1,2,…,N}為輸入樣本,即擁有p個增強節點的RVFL網絡為:

Hω=Y? ? ? ? ?(3)

其中,H是輸入層和增強層輸出的串聯矩陣;ω為輸出權值向量;Y是輸出標簽矩陣。

H和ω表達式如下:

H=[H1;H2]? ? ? ? (4)

H=x … x ?塤 x … x

H=G(a·x+b) … G(a·x+b)? ? ?塤? G(a·x+b) … G(a·x+b)

ω=[ω … ω]? ?(5)

其中,G(·)為激活函數;a和b(j=1,2,…,p)是輸入層和增強層間的權值和偏差。

圖1中,輸出權值可以直接通過Moore-Penrose偽逆計算得到,即:

ω=HY? ? ? ?(6)

KRVFL重新構造新的映射代替HH,則核矩陣Ω的計算式為:

Ω=HH=K? ? ? ?(7)

其中,K為核函數K(x,x)建立的核矩陣,i和j表征矩陣的元素位置。

為了增強KRVFL網絡的魯棒性,引入參數ρ,KRVFL的輸出權值為:

ω*=H(Ω+ρI)Y? ? ?(8)

結合式(8),KRVFL模型輸出為:

F(x)=h(x)ω*=[K(x,x1)…K(x,xN)](Ω+ρI)Y (9)

1.2.2 流形正則化核隨機向量函數連接網絡(MR-KRVFL)

流形正則化的核心是將數據做映射處理并控制部分結構不變[12]。假設有兩個樣本x和x,它們擁有高度相似的分布特性,則在新的投影空間中y和y的距離應十分接近。目標函數為:

L=minw‖y-y‖? ? ?(10)

其中,w為樣本x和x間的相似程度。

為了計算兩個樣本間的相似度,通常采用k近鄰的方法,構建k近鄰矩陣,而后基于高斯核函數計算其相似度。即:

w=

exp-,N(x,x)=1 and C(x)=C(x)

0? ? ,C(x)≠C(x)?搖(11)

其中,N(x,x)=1表示x與x兩者相鄰;σ表示高斯分布函數的標準差;C(x)=C(x)表示x和x為同一類別。

對式(10)作進一步推導:

L=w(yy+yy-2yy)

=wyy+wyy-2wyy

=2tr[Y(D-W)YT]

=2tr[YLYT]

(12)

其中,Y=[y,y,…,y]為訓練樣本的預測輸出向量組成的矩陣,即L=D-W,D=w,L為拉普拉斯矩陣,D為對角矩陣。

根據上述推導分析,將流形學習理論思想引入KRVFL中,構造MR-KRVFL地物識別模型的目標函數為:

min D=‖β‖+‖Ω β-Y‖+tr(βΩLΩ β) (13)

對式(13)中的β求偏導可得:

=ρβ+(ΩΩβ-ΩY)+λΩLΩβ? (14)

其中,ρ是外部正則化系數;λ是流形正則化參數;L=L。

令式(14)為0,有:

β=(ρI+ΩΩ+λΩLΩ)ΩY? ? (15)

MR-KRVFL識別模型的輸出為:

Q(x)=h(x)(ρI+ΩΩ+λΩLΩ)ΩY? ?(16)

2 融合空譜特征的MR-KRVFL高光譜地物識別模型構建

本研究提出了融合空譜特征的正則化核隨機向量函數連接網絡的高光譜地物識別模型,其構建流程如下:

a. 獲取高光譜圖像X并提取其第一主成分Υ;

b. 將ERS和PCA方法作用于X,確定超像素數量m,并提取空譜聯合特征樣本;

c. 將所獲取的特征樣本劃分為訓練集和測試集;

d. 設定MR-KRVFL模型的核函數類型,核參數γ、外部正則化系數ρ和流形正則化系數λ的值;

e. 將訓練樣本映射到KRVFL特征空間中,構建拉普拉斯矩陣L,由式(15)計算輸出權值矩陣β;

f. 將測試樣本作為地物識別模型的輸入,得到高光譜圖像分類結果。

3 實驗結果與分析

3.1 實驗數據和評價指標

采用兩組高光譜遙感數據集作為實驗對象,分別為Indian Pines和Pavia University高光譜數據集,即為對應的原始圖(IP)(圖3)和標簽圖(PU)(圖4)。IP由AVIRIS拍攝于美國印第安納州西北部的農業試驗場,空間尺寸145×145,空間分辨率為20 m,擁有400~2 500 nm的200個通道波段,并去除了24個噪聲波段;可分類像元10 249個,包含16種地物類別。PU在2003年由ROSIS拍攝于意大利北部的Pavia大學,空間尺寸610×340,用于標注作為高光譜圖像地物識別測試用途,ROSIS的波長范圍在0.43~0.86 μm,光譜儀共采集到115個波段,在實際應用中,去除帶有低信噪比的12個波段,共取其他103個波段作為研究對象,空間分辨率可以達到1.3 m,包含9類地物,總樣本點共記42 776個像元。

評價指標采用總體分類精度(Overall Accuracy,OA),平均分類精度(Average Accuracy,AA),第i類分類精度(Class-specific Accuracy,CA),Kappa系數[13]和混淆矩陣對分類結果進行綜合評價。

3.2 參數設定

筆者所提MR-KRVFL算法中,需要對5個參數進行設定分析,分別為超像素數量m、主成分數d、核參數γ、外部正則化系數ρ和流形正則化系數λ,其中核函數為高斯核函數。為了驗證以上參數對OA值的影響,對于兩個高光譜數據集,在{10-3,10-2,

10-1,1,101,102,103}上對γ、ρ和λ進行取值,設置對比實驗。首先將ρ和λ在上述范圍內隨機選取,驗證γ值變化時的影響,發現在IP和PU中,當γ為10-3時,整體分類效果最好。保持此條件,對ρ和λ對比分析,得到當ρ為10-2時,隨著λ在上述區間內取值,OA值達到了最高,如圖5所示,分別為IP在m取100、d取30、ρ取10-2時,λ變化對OA結果的影響,PU中m、d和ρ分別取60、30和10-2時,λ所對應的OA值??梢钥闯?,當λ從10-3變為10-2時,其OA值增幅較大;在λ取10-1及之后,OA達到最高且趨于穩定。

圖5 不同λ值對OA的影響

為了探索超像素分割算法中超像素數量m的選取對高光譜圖像分類結果的影響,在IP和PU中分別對m在10~200區間內,間隔為10進行驗證,在此保持其他參數不變。不同的主成分數d對高光譜圖像分類精度的影響如圖6所示,IP和PU分別在m取值區間為10~100和10~60之間,隨著超像素數量m的增加,其空間信息逐漸豐富,OA快速提升,當其取到峰值后,隨著m值進一步的增加,過多的空間信息開始對精度造成干擾,OA值開始緩慢下降。

從圖6可以看出,IP在d取10~60,光譜信息逐漸豐富,OA逐漸增長,在d達到60之后,隨著主成分數的進一步增加,OA的值趨于平緩且幾乎無波動。PU隨著d的增加,在d為30之后精度曲線的變

化緩慢增加,考慮到PU像素數目巨大,其地物分布更加密集,空間特征具有更高的利用率,綜合d

圖6 不同m和不同主成分數d對OA的影響

值對OA的影響,權衡之下d取30。

3.3 實驗對比結果分析

本節選取了M-CNN[14]、RVFL、ELMCK[15]、CCJSR[16]和RMGE[17]5種分類模型進行對比實驗,其參數設置與所提文獻中一致,為了避免實驗結果出現偏差,不同方法在IP和PU上分別進行10次重復實驗,取其均值作為最終結果。同時,為了驗證所提方法在小樣本條件下的表現,統一將兩個高光譜數據集的每類地物樣本隨機選取10%作為訓練樣本,其他全部作為測試樣本。

表1列出了IP和PU不同方法對比實驗的結果,可以看出筆者所提方法優于其他方法。在IP中,相較于RMGE方法,其分類指標OA、AA、Kappa值分別提升了0.86%、2.18%、1.34%,與CCJSR方法對比,OA、AA和Kappa值分別提升了5.65%、6.35%、6.20%,且筆者方法明顯優于M-CNN、RVFL和ELMCK,印證了其高效性。同時,PU整體分類精度優于IP,這是因為IP數據樣本分布不均勻,圖像分辨率低,而PU樣本數據量大,分布密集,空間利用率高。筆者方法對比CCJSR、RMGE和ELMCK,其分類指標OA、AA、Kappa值分別提升了2.38%、4.33%、4.96%,1.65%、3.09%、2.15%和4.29%、8.29%、6.38%,相較于其他經典算法,分類指標都得到了提升。

IP和PU不同模型所對應的識別效果分別如圖7、8所示。由圖中可以看出,兩個高光譜數據集在筆者所提方法MR-KRVFL下,其實際效果圖與真實標簽圖最為接近,各區域相對平滑,錯分點最少。而M-CNN和RVFL方法所生成的識別圖像產生了較為嚴重的多樣本混疊現象,誤分點較多,且分布雜亂無章,ELMCK、CCJSR和RMGE方法雖然相比而言得到了一定程度的改善,但在小區域內還是存在像素點誤分的情況,整體表現依然欠佳。

綜合上述實驗結果,證實所提方法充分利用了空譜特征,獲得了較優的分類結果。

3.4 消融實驗

本節設計驗證MR-KRVFL地物識別模型的有效性。在ERS與PCA結合的超像素特征提取方法下,分別采用RVFL、KRVFL和MR-KRVFL地物識別模型對兩個高光譜數據集IP和PU進行實驗對比,其對應的分類指標見表2。在IP中,MR-KRVFL地物識別模型相比較KRVFL和RVFL模型的分類指標OA、AA和Kappa值分別提升了1.65%、3.76%、1.96%和0.52%、1.27%、0.93%,印證了引入核函數使空譜特征輸出更加穩定,而流形正則化約束更加注重樣本間的結構信息,提高了地物識別模型的性能,特別是在IP這種本身分辨率較低的高光譜數據集中,同樣取得了較好的效果。觀察PU發現,筆者所提模型相較于RVFL和KRVFL模型,其分類指標OA、AA、Kappa值分別提升了2.31%、4.52%、2.78%和0.59%、0.82%、0.46%,雖然在不添加流形正則化約束的KRVFL模型中,其分類性能已經達到較高水平,但經多次實驗結果表明,流形正則化的加入依然提高了其分類精度。

表征IP和PU對應的RVFL、KRVFL和MR-KRVFL地物識別模型分類效果的混淆矩陣可視化圖如圖9所示,對角線即為正確分類的樣本數,其他位置為錯分樣本數??梢钥闯?,筆者所提模型對于各個樣本類別的識別錯分數量最少,正確識別樣本數量相較于RVFL和KRVFL方法進一步增多。證明筆者模型能夠有效提升高光譜地物識別模型的分類性能。

4 結束語

融合空譜特征的MR-KRVFL地物識別模型充分利用空間像素的結構信息,獲取了良好的地物識別效果。在MR-KRVFL模型中核函數避免了其隨機參數特性,有效加強了輸出神經元的穩定性,提高了分類精度,將流形正則化約束作用于KRVFL模型,進一步增強了模型的泛化性能。實驗證明,MR-KRVFL地物識別模型在Indian Pines和Pavia University兩個高光譜數據集上表現出優越的性能,較其他方法更為出色。該模型在高光譜圖像分類問題上有良好的表現,因此可以為分析工業材料的成分、純度、形態及缺陷等提供有益借鑒。

參 考 文 獻

[1] GORE R,MISHRA A,DESHMUKH R.Exploring the mineralogyat lonar crater with hyperspectral remote sensing[J].Journal of the Geological Society of India,2021,97:261-266.

[2] 馮權瀧,牛博文,朱德海,等.土地利用/覆被深度學習遙感分類研究綜述[J].農業機械學報,2022,53(3):1-17.

[3] 趙慶展,江萍,王學文,等.基于無人機高光譜遙感影像的防護林樹種分類[J].農業機械學報,2021,52(11):190-199.

[4] HE N J,FANG L Y,LI S T,et al.Feature extraction with multiscale covariance maps for hyperspectral image classifition[J].IEEE Transactions on Geoscience and Remote Sensing,2019,57(2):755-769.

[5] TU B,ZHOU C, LIAO X,et al.Spectral-spatial hyperspectral classification via structural-kernel collaborative representation[J].IEEE Geoscience and Remote Sensing Letters,2021,18(5):861-865.

[6] 虎曉紅,司海平.基于自適應字典的小樣本高光譜圖像分類方法[J].農業機械學報,2021,52(1):154-161.

[7] JIANG J,MA J,CHEN Z,et al.SuperPCA:A superpixelwise PCA approach for unsupervised feature extraction of hyperspectral imagery[J].IEEE Transactions on Geoscience and Remote Sensing,2018,56(8):4581-4593.

[8] YU X,FENG Y,GAO Y,et al.Dual-weighted kernel extreme learning machine for hyperspectral imagery classification[J].Remote Sensing,2021,13(3):508.

[9] 張政煊,楊翊卓,代偉,等.基于整體辨識策略的非線性自適應控制方法[J].控制理論與應用,2023(11):2039-2048.

[10] LIU M Y,TUZEL O,RAMALINGAM S,et al.Entropy-Rate Clustering:Cluster analysisvia maximizing a submodular function subject to a matroid constraint[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2014,36(1):99-112.

[11] PRATAMA M,ANGELOV P P,LUGHOFER E,et al.Parsimonious random vector functional link network for data steams[J]. Information Sciences,2017,430-431:519-537.

[12] ZHAO H,ZHENG J,DENG W,et al.Semi-supervised broad learning system based on manifold regularization and broad network[J].IEEE Transactions on Circuits and Systems I-Regular Papers,2020,67(3):983-994.

[13] LI R,ZHENG S,DUAN C,et al.Classfication of hype- rspectral image based on double-branch dual-atttention mechanism network[J].Remote Sensing,2020,12(3):582-607.

[14] HAMIDA A B,BENOIT A,LAMBERT P,et al.3-D deep learning approach for remote sensing image classification[J].IEEE Transactions on Geoscience and Remote Sensing,2018,56(8):4420-4434.

[15] ZHOU Y,PENG J,CHEN C.Extreme learning machine with composite kernels for hyperspectral image classification[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2015,8(6):2351-2360.

[16] TU B,ZHANG X,KANG X,et al. Hyperspectral ima- ge classification via fusing correlation coefficient and joint sparse representation[J].IEEE Geoscience and Remote Sensing Letters,2018,15(3):340-344.

[17] MIAO Y,CHEN M,YUAN Y,et al.Hyperspectral ima- gery classification via random multi-graphs ensemble learning[J].IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing,2021,99:1-11.

(收稿日期:2023-05-08,修回日期:2023-05-20)

Research on Hyperspectral Ground Object Recognition Model of

MR-KRVFL Based on Space Spectrum Features

GUO Guo-lu1,2 , FAN Yu-gang1,2, FENG Xiao-su1,2

(1. Faculty of Information Engineering and Automation , Kunming University of Science and Technology;

2. Key Laboratory of Artificial Intelligence of Yunnan Province)

Abstract? ?Considering the fact that the complex spatial spectrum characteristics of hyperspectral images influence the classification accuracy of ground object recognition model, a manifold regularization kernel random vector function network (MR-KRVFL) method for hyperspectral image recognition based on spatial spectrum features was proposed. Firstly, having the hyperspectral image segmented by super-pixel with entropy rate(ERS) to obtain corresponding homogeneous regions; and then having the spatial spectral joint features extracted by principal component analysis (PCA) to reduce dimension of the homogeneous regions; and finally having the spatial spectrum feature information based to construct the kernel random vector function connected network(KRVFL) model and having the manifold regularization constraint applied to improve the generalization performance of the ground object recognition model. Applying this model to the hyperspectral data sets of Indian Pines and Pavia University shows that, the classification accuracy can reach 96.84% and 98.83%, which proves the validity of the model proposed.

Key words? ?entropy rate super-pixel segmentation, hyperspectral image, kernel function, manifold regularization, classification accuracy, ground object recognition

猜你喜歡
正則光譜像素
趙運哲作品
基于三維Saab變換的高光譜圖像壓縮方法
像素前線之“幻影”2000
“像素”仙人掌
剩余有限Minimax可解群的4階正則自同構
類似于VNL環的環
高像素不是全部
星載近紅外高光譜CO2遙感進展
有限秩的可解群的正則自同構
苦味酸與牛血清蛋白相互作用的光譜研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合