?

基于不同降維方法的PPI端元提取效果對比研究

2017-02-15 17:47黃晨張運張立偉
安徽農學通報 2017年1期

黃晨+張運+張立偉

摘 要:傳統PPI算法采用最大噪聲分離(MNF)方法進行降維,MNF變換中均設定數據之間線性相關,在某些情況下會使變換后的結果具有某些人為特征,在降維過程中會丟失信號較弱的信息,導致端元數量少;分段主成分分析(SPCA)降維方法具有不改變圖像的物理意義,且信息保存較完整的優勢。該研究采用不同降維方法利用純凈像元指數法(PPI)對不同下墊面地表提取端元,結果表明,在地表破碎區域SPCA降維后可找出信號較弱的端元提取的端元數量多與MNF降維提取的端元數,而地物聚集區MNF降維方法提取的端元質量更好。研究結果可以為不同下墊面的高光譜影像端元提取以及降維方法的選擇提供參考。

關鍵詞:端元提??;最大噪聲分離;分段主成分分析;純凈像元指數法

中圖分類號 TH744.1 文獻標識碼 A 文章編號 1007-7731(2017)01-0013-06

Abstract:The traditional PPI algorithm uses the maximum noise separation (MNF) to reduce dimension,MNF transform was set linear correlation between the datas,and in some cases,the results of the transform will have some human characteristics.In the process of dimension reduction,the weak signal will be lost,which leads to a small number of end elements.Segmented principal component analysis (SPCA) does not change the physical meaning of the image and the information will be relatively complete preservation.This paper use the pure pixel index (PPI) for different dimensionality reduction methods and for different underlying surface to extract endmember.The results shows that the SPCA dimensionality reduction is more suit in broken underlying surface,it could find the weak signal endmember;and the MNF dimensionality reduction will find the better quality endmember in ground gathering area.The results of this research can provide reference for the endmember extraction of hyperspectral image and the selection of dimension reduction method for different underlying surfaces.

Key words:Endmember extraction;MNF;SPCA;PPI

1 引言

混合像元分解是高光譜數據處理中較為重要的組成部分,混合像元的分解分為兩步,第一步是端元提取,即某一像元對應區域內僅存在一種地物類型,這個地物的光譜就是要提取的端元;第二步是豐度反演,即不同純凈地物所占像元的比例,端元提取是混合像元分解的重要前提和關鍵步驟。純凈像元指數法(Pure Pixel Index,簡稱 PPI)[1-2]是以線性光譜混合模型的幾何學描述為基礎,利用端元是遙感圖像在特征空間中所形成的單形體的端點的特點、單形體的向量投影性質進行端元提取。PPI算法在端元提取中較為成熟,且便于實現,方法靈活,很多軟件都將此方法作為端元提取的模塊。但該算法不是迭代算法,投影向量均是隨機產生,可能導致同一幅圖多次PPI提取的端元并不同,針對以上不足,Chang、Plaza等提出快速迭代PPI(FPPI)[3],每次迭代都對上一次的端元集合進行擴充,算法逐漸收斂到一個合適的集合。徐君等[4]在其研究中提出一種區別于PPI算法的最大距離純凈像元指數法,克服了PPI算法因隨機向量而產生的端元提取結果不確定的問題。郭杰[5]等針對PPI算法耗時長、運算量大等不足提出了FPGA實現方案,可以在較短時間內完成計算;同時PPI算法對圖像噪聲很敏感,通常使用MNF降維后再使用,使用MNF降維后的維度和波段選擇沒有合適的規則,且張兵等[6]在其研究中對幾種降維方法做了比較,MNF雖對噪聲處理較好,但是數據信息損失和數據結構變化都較大,在地表破碎的情況下該方法降維后分類精度會大大降低,而SPCA降維后不僅不會改變圖像物理意義,還可以保留更多信息。劉鋒[7]將PPI端元提取的數據降維算法換成小波主成分分析(Principal component analysis,PCA),增加了地物細節,端元提取取得了較好的效果;牛貝貝[8]在其研究中提出了基于獨立主成分分析(Independent component analysis,ICA)特征提取的N-FINDR算法并與傳統的MNF特征提取算法比較,結果解譯誤差減小,表明了其算法的優越性;王強[9]等在對PPI算法的降維處理方法上選擇MNF正反變換,再利用圖像的加減運算去除噪聲,有效地去除了圖像噪聲;崔賓閣等[10]在對黃河口濕地的高光譜遙感端元提取的研究中表明特定區域對端元提取的方法也需要特別選取。針對不同下墊面降維分類后的效果不同,本文采用分段主成分分析的方法對高光譜數據進行降維,再利用PPI端元提取方法提取端元,與MNF降維后PPI提取端元結果做對比,嘗試在不同下墊面情況下選擇更適用的端元提取方法,以期為高光譜影像的處理提供參考。

2 數據處理

本研究采用的是Hyperion L1R數據,條代號119,行編號38。分別對數據進行未定標及水汽吸收嚴重波段剔除、絕對輻射值轉化、條紋修復及壞線去除、Smile效應校正、FLAASH大氣校正、幾何校正及裁剪范圍。Hyperion L1R產品一共有242個波段,其中1~70波段是可見光近紅外波段,71~242波段是短波紅外波段,有些波段未定標或者受水汽影響較大,基本上反應不出地表信息,剔除后保留176個波段,分別是8~57、79~120、128~166、179~223波段(表1)。將8~57波段(可見光近紅外波段)除以40,其余波段(短波紅外波段)除以80,合并后完成絕對輻射值轉換。逐個波段查看并記錄有壞線的波段集壞線出現的行列位置,利用壞線周圍數值的平均值填補壞線處的數值,采用“全局區條紋”法去除條紋噪音。Smile效應校正采用移動線性擬合內插大方法,將每個樣本波段的中心波長插值到該波段的平均成像中心波長。FLAASH大氣校正以及幾何校正不做贅述,裁剪選擇的是地物較為復雜的區域,研究區主要地物有林地、耕地、裸地、水體和建筑,其中林地、水體、耕地所占面積較多且分布聚集,裸地和建筑相對較少且分散分布與圖像中。研究區見圖1,位于江蘇省常熟市。

3 PPI原理

單形體在空間中的任意投影都是線段,且線段的端點必是單形體的頂點,單形體的頂點即是端元。PPI算法就是利用這一性質,在特征空間內隨機投影,并記錄投影在端點位置的像元,投影在端點位置的次數越多被視為越純凈,即是端元。PPI算法的示意圖如圖2所示:

經過多次投影后被投影到隨機向量兩端的像元次數達到閾值即可視為端元。由于PPI算法對圖像噪音敏感,在對高光譜數據降維時常采用MNF降維,該方法相當于2次主成分分析疊加,第一次是對數據中的噪聲進行分離,第二次是對噪聲白化數據的標準主成分分析。MNF降維方法有較好的去噪效果,但有時會將信息較少的信號視為噪聲剔除。

4 基于SPCA的PPI端元提取

4.1 分段主成分分析(SPCA) 分段主成分分析(SPCA)是Jia和Richards[12]提出,先將各波段按相關性進行分組,并對每組進行主成分分析,最后將每組的分析結果組合一起再進行分析。這種方法不改變圖像的物理意義,不會忽略信息量少但仍然很重要的波段??紤]到PPI算法對噪聲敏感,本文采用SPCA方法降維,降維前采用小波去噪。常用的小波基有Harr小波、Daubechies小波、Coiflets小波、Symlets小波。對于正交小波而言,Daubechies小波在算法速度,模擬和分析信號的精度上都發揮了巨大作用;Harr小波是指上就是一階的Daubechies小波,可以很方便的通過數值積分將微分方程轉換為代數方程,在求解微分方程的應用中已經有很多成果;Coiflets小波在信號處理,數值分析,故障診斷和圖像壓縮方面應用廣泛,與其他正交小波相比,它具有更多的對稱性,數值分析更加緊致;Symlets小波是對Daubechies小波的改進,它不僅具有雙正交性,近似對稱性,并對在實際應用中細節處理上具有很好的效果。本章節選用一個波段隨機加噪聲,然后選擇以上4種小波對圖像分解,設置閾值向量,對高頻小波系數進行閾值處理最后重構圖像。圖3是4種小波去噪對比結果,由圖3可知,4種濾波去噪都能有明顯的效果,從細節上看,方框內haar小波去噪的效果不如其他3種小波,存在明顯的噪聲痕跡;而Coiflets小波去噪效果雖然好,但是細節模糊得最厲害。而Symlets小波是Daubechies小波改進后的方法,效果在4種小波中最好,因此本文選擇Symlets小波對圖像進行去噪。

分段主成分分析(SPCA)變換方法是利用高相關塊沿對角線分布分特性,將整個圖像分成高度相關的子集,再從每個子集中進行特征提取。這種方法不僅可以保留局部信息,還可以減少計算量。具體算法流程圖如圖4所示:

對研究區遙感影像各波段做相關性分析,相關性矩陣圖如圖5所示,顏色越亮表示相關性越高,顏色越暗表示相關性越低。橫縱坐標分別是這176個波段,對角線表示相關性為1。根據相關性矩陣圖將176個波段劃分為4個子集,單個子集中各波段的相關性很高,波段間最低相關性都在0.7以上(表2)。

將分組后的各波段子集做主成分分析,按照貢獻率從各組中提取波段重新組合進行降維,最后降維保留7個成分。部分成分對應的圖如圖6所示。

經過小波SPCA變換后保留7個成分,貢獻率達到85%,圖像較為清晰,該方法變換后地物輪廓清晰,基于分塊地算法也節省了計算時間,去除噪聲的同時保留局部信息,且原始數據的變化對變換后的數值影響并不大。

4.2 PPI端元提取 將降維后的數據進行PPI計算,利用可視化工具尋找聚集在一起的點作為純凈像元,提取純凈像元的波譜曲線與波譜庫對比,確定像元對應的地物類型。在進行波譜分析時采用波譜角分類(SAM)方法、波譜特征擬合(SFF)方法、二進制編碼方法(BE)分別對未知波譜與波譜庫中物質波譜匹配程度打分,權重都設置為1,總分為3。SAM法是利用弧度來衡量未知波譜與波譜庫波譜的匹配程度,鍵入的最大值和最小值都用弧度表示。SFF是用RMS擬合誤差來衡量二者的匹配程度,二進制編碼法則是輸入的最大值和最小值都用正確匹配的波段百分比(0~1)表示。本研究分別用MNF降維和小波去噪后SPCA降維,通過PPI計算和可視化工具提取7個像元視作端元,由于選取的研究區主要地物只有5類,分別是林地、耕地、水體、裸地和建筑,因此提取出的端元分別與波譜庫這5類的波譜匹配得分,匹配結果相同取分數較高的端元保留。結果如表3所示。表3中MNFPPI表示經過MNF降維后利用PPI算法提取的端元波譜;SPCAPPI表示經過SPCA降維后利用PPI算法提取的端元波譜。從二者的對比上看,MNF降維后提取的端元有4種,分別是水體、裸地、林地和耕地,SPCA降維后提取的端元種類有5種,分別是水體、裸地、林地、耕地和建筑。從得分上看,MNFPPI提取的4種地物得分都不低于于SPCAPPI,且裸地的分差遠遠高出SPCAPPI提取的裸地波譜得分。SPCAPPI提取的林地、耕地、水體得分與MNFPPI提取的地物得分相差較小,多識別出的建筑用地,且得分較高。從表3中得出,SPCA降維后提取的端元數大于MNF降維后提取的端元,多出來的建筑類型可能在影像中分布零散且分布較少,使得MNF降維中丟失這樣的信號。而MNF降維后提取的端元與波普庫對比的得分幾乎都大于SPCA降維后提取的端元得分,由此視為MNF降維后提取的端元質量更好,可能是這幾類地物較為聚集,在去除噪聲后提取的端元質量更好。

4.3 對比分析 將二者提取的同一類型端元波譜進行合并后對圖像進行線性混合像元分解,圖像分類結果如圖7所示。圖7(a)是MNF降維后利用純凈像元指數法提取端元的分類結果,圖7(b)是SPCA降維后提取的端元分類結果。從圖7中可以看出:圖(a)內容充實,林地、耕地、水體、裸地提取的面積都較大,其中林地集中分布與圖的北邊方向,圖的中間夾雜少許看in地識別區;耕地主要分布與圖的中間和西邊,裸地在西南及西邊中間區域有部分聚集分布,其他的都零散分布與整個圖中;圖(b)未識別的區域較大,主要是裸地識別面積較少,只有西南角和西邊中間位置的聚集區域識別出來,林地幾乎全在圖的北邊方向分布,耕地分布在圖的中間和南邊及西邊方向,水體識別較少,且建筑零星分布在圖的中間。從二者的對比上可以發現,圖(a)提取的林地面積更大,成塊分布,耕地分布區中夾雜很多土地被分類為林地,裸地識別區幾乎零星分布與整幅圖像,水體識別較少;圖(b)提取的林地面積較小且聚集程度較圖(a)分散,耕地區幾乎沒有林地分布,裸地和水體識別少,且比圖(a)多識別出建筑用地,建筑用地分布較少且特別分散。

從圖7還可以看出,研究區中林地、水體、耕地和裸地雖混合分布,但每種地物類型都相對聚集,且面積較大,這4類的分解結果MNF/PPI方法提取較好,分類結果中這4類地物面積大且聚集;建筑零星分布在圖中,MNF/PPI并沒有提取出,SPCA/PPI提取出零星的建筑其他4種地物也提取出,但面積相對較小,且相對破碎。因此,可以得出在選擇PPI端元提取方法時,地物分布特征對降維方法的選擇有要求,地物分布集中時選擇MNF降維可以消除噪聲,地物破碎分布時,SPCA可以保留更多信息,提取被MNF忽視的有效信號,提取的端元數量多于MNF降維后提取的端元。

5 結論

本文采用SPCA降維方法與傳統的MNF降維方法比較,利用純凈像元指數法對研究區進行端元提取,通過對比二者端元提取的數量和質量,得出以下結論:在地表破碎時,經過SPCA降維后可保留更多信息,提取的端元數量較多;在地物聚集且分布較廣的情況下,MNF降維后提取的端元質量優于SPCA降維后提取的端元。因此,在對高光譜數據處理時,可針對下墊面情況和處理目的具體討論并選擇合適的降維方法,實現對數據更高效的利用。

參考文獻

[1]ChaudhryF,Wu CH-CH,Liu W-m,et al.Pixel purity index-basedalgorithms for endmember extraction from hyperspectral imagery[J].Transword Research Network 37/661(2),Fort P.O.,Trivandrum-695 023,Kerala,India,2006:29-62.

[2]Bateson A,Curtiss B.A method for manual endmember selection and spectral unmixing[J].Remote Sensing of Environment,1996,55(3):229-243.

[3]Chang C,Plaza A.A fast iterative algorithm for implementation of pixel purity index[J].IEEE Geoscience and Remote Sensing Letter,2006,3(1):63-67.

[4]徐君,徐富紅,蔡體健,等.一種基于最大距離的純像元指數端元提取算法[J].地球信息科學學報,2015,17(1):86-90.

[5]郭杰,李云松,弋方,等.高光譜圖像純像元指數計算的FPGA實現[J].華南理工大學學報(自然科學版),2014,42(1):84-89.

[6]張兵,高連如.高光譜圖像分類與目標探測[M].北京:科學出版社,2011:81-82.

[7]劉鋒.高光譜數據降維及端元提取[D].北京:北京理工大學,2008:43-45.

[8]牛貝貝.高光譜遙感影像端元提取算法研究及應用[D].長沙:中南大學,2014:14-23.

[9]王強.Hyperion高光譜數據進行混合像元分解研究[D].哈爾濱:東北林業大學,2006:23-25.

[10]崔賓閣,莊仲杰,任廣波,等.典型高光譜圖像端元提取算法在黃河口濕地應用評價研究[J].海洋科學,2015,39(2):104-109.

[11]許寧,胡玉新,雷斌,等.一種基于PPI的高光譜數據礦物信息自動提取方法[J].測繪科學,2013,38(1):138-141.

[12]Jiaxiuping,J.A.Riehards.Segmented principal components transformation for efficient hyperspectral remote sensing image display and classification[J].IEEE Geoscience and Remote Sensing,1999,37(l):538-542.

(責編:張宏民)

91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合