?

結合深度學習的多通道InSAR高程反演方法

2024-01-05 11:10耿佃強謝先明曾慶寧胡高洋鄭展恒
遙感信息 2023年5期
關鍵詞:反演高程像素

耿佃強,謝先明,曾慶寧,胡高洋,鄭展恒

(1.廣西科技大學 電子工程學院,廣西 柳州 545006;2.桂林電子科技大學 信息與通信學院,廣西 桂林 541004)

0 引言

干涉合成孔徑雷達(InSAR)[1-5]探測技術可以從空間中直接獲取廣泛精細的地表高程信息,同時具備全天時、全天候的對地觀測特點,已經成為極具發展潛力的對地觀測技術。不同于單通道InSAR技術,多通道InSAR技術主要利用承載多路基線的衛星系統,獲取多幅干涉相位圖進行聯合處理,可以有效解決懸崖、山谷、城市建筑群等不連續地形的高程反演問題。近20年,基于不同準則與策略的多通道InSAR高程反演方法被相繼提出,包括中國余數定理(CRT)算法[6-7]、最小范數算法[8-9]、最大似然(ML)算法[10]、最大后驗(MAP)算法[11]、聚類分析(CA)算法、圖割(GC)算法[12-13]等。CRT算法利用互質基線長度之間的線性關系來恢復地形的高程值,在干涉相位無噪聲的條件下可以精確反演出目標高程信息,當干涉圖存在較大噪聲時,CRT高程反演幾乎失效。最小范數法利用多幅干涉圖的梯度信息進行后續處理并求解高程,但易受Itoh相位連續性假設的限制,難以恢復復雜地形。ML算法和MAP算法通過構造概率密度函數實現最佳參數估算,進而重建高程,當干涉圖信噪比較低時,高程估計精度往往不高。Yuan等[14]提出基于閉式魯棒聚類分析(CFRCA)算法,通過求解同余方程組的方式得到聚類中心模糊向量的閉式解,增強了算法的魯棒性。GC算法直接計算多幅干涉圖的高程值,可以避開相位解纏過程,有效提升了高程估計精度,但該算法需要消耗較大內存,不利于大規模干涉圖的處理。

深度學習(DL)是機器學習的一種,在自然語言處理、語音及圖像識別等方面已經取得豐碩成果。隨著DL的不斷突破與發展,它逐漸應用到SAR目標檢測[15-16]、干涉圖去噪[17]、InSAR干涉圖相位解纏等領域。Zhang等[18]利用語義分割網絡DeeplabV3+求取纏繞相位的纏繞數并通過3×3窗口像素平均化進行后處理,得到了較為準確的解纏相位。鄭順心[19]利用Transformer-CNN網絡實現聯合干涉相位濾波與解纏,可以同時得到較純凈的干涉圖和精度較高的解纏相位圖。Zhou等[20]提出了一種基于深度學習的枝切線部署方法,使用BCNet得到枝切線結果并經過后處理得到解纏結果,取得了有效進展。上述研究為后續結合深度學習的多通道InSAR高程反演技術的發展提供了思路。

本文提出一種結合深度學習的多通道InSAR高程反演方法,通過構建MCFCF Net來實現多通道干涉圖和高程圖的直接映射關系。MCFCF Net使用嵌入了壓縮-激勵(squeeze-excitation,SE)注意力機制[21]的殘差模塊[22],在有效防止網絡退化的同時,提高了網絡對干涉圖細節的捕獲能力和重要通道的關注力。此外,密集連接[23]可以不斷連接前向通道和后向通道,在減少參數量的同時保證了訓練的精度和效率。更重要的,MCFCF Net為一種簡潔有效的對稱網絡,在并行處理多通道干涉圖的同時可以緊密連接和融合不同干涉圖間的重要信息,從而較好地還原高程。完成訓練后的網絡能夠有效完成各種復雜地形的高程反演。實驗結果表明,本文方法具有較好的魯棒性和泛化能力。

1 結合深度學習的高程反演模型

多通道InSAR高程反演技術本質是同時對多幅干涉圖(通常指目標場景所對應的、不同基線參數條件下的多幅干涉圖)進行處理,精確獲得目標場景高程的技術。本文提出的MCFCF Net通過構建3通道神經網絡,對目標場景的3幅不同基線參數條件的干涉圖進行處理來獲取目標高程信息,建立多通道干涉圖和高程圖的直接映射關系。通過制作不同地形的數據集,選擇網絡中合適的網絡層數與通道數,定義合適的損失函數以及選擇恰當的訓練策略,即可使神經網絡精確描述這種非線性映射關系。訓練過程如圖1所示,3幅干涉圖作為神經網絡的輸入,網絡輸出為地形高程圖。3通道干涉圖聯合處理,相較于其他通道數,兼顧了高精度與運行時間的優勢,減少了內存等資源的消耗,可以更有效地處理復雜地形并獲得更高精度的高程估計。

圖1 MCFCF Net訓練過程

1.1 MCFCF Net架構

MCFCF Net的主體結構如圖2所示,多通道干涉圖依次通過Block1、Block2、Block3、Block4后輸出高程圖,從而建立多通道干涉圖和高程圖的映射關系。MCFCF Net核心在于3個擁有多分支的Block,即Block1、Block2、Block3作為多通道干涉圖特征連接與融合模塊,增強網絡建立多通道干涉圖與目標真實高程信息之間的非線性映射關系的能力。Block1、Block2、Block3結構相同(通道數除外),以Block1為例,3個并行的支路接收多通道干涉圖,每個支路由卷積層、融合了SE的殘差模塊(SE-Res)、卷積層組成,可以分別提取不同干涉圖的有用信息,最后合并3個支路的特征圖,傳入Block2的3個并行支路。Block2、Block3依次循環Block1中的操作。每個Block中設計3個分支可以更優地處理多通道干涉圖,整體上提高網絡對多通道特征圖的處理能力。Block1、Block2、Block3之間以跳躍合并的方式形成密集連接,加強了特征圖的重用和不同干涉圖通道間的聯系。Block4中包含3個串聯的卷積層,將來自Block3的特征圖整合處理并不斷降維后輸出最終的高程圖。

圖2 MCFCF Net結構

圖3展示了圖2中SE-Res結構。其中,殘差網絡作為神經網絡中經久不衰的模型,其容易優化、通過增加深度以提高準確率的特點被應用到許多復雜場景下。圖3中,Conv為普通卷積層,1×1和3×3為其卷積核大小,BN為批歸一化,ReLU為激活函數。

圖3 SE-Res結構

SE如圖4所示,其本質是一種通道注意力模塊,主要分為壓縮和激勵兩部分。壓縮部分利用一個全局池化層對輸入特征圖進行空間壓縮,通過調整每個特征通道的實數權重以提高對重要通道的關注力。激勵部分利用了前一步聚合的通道信息,學習不同干涉圖通道之間的相關性,兩個全連接層可以限制模型復雜性并增強泛化能力。通道權重調整操作將通道權重作用于原始輸入特征圖,加強了重要特征圖的輸出。SE結構可以使網絡聚焦于對高程反演更為關鍵的多通道特征圖信息,繼而提高高程反演的效率和準確性。從整體來看,SE-Res模塊保持了瓶頸殘差單元的基本結構,SE模塊直接接入瓶頸殘差單元中,可以調整網絡對不同干涉圖通道的關注程度,增強了網絡的干涉圖特征提取能力。

圖4 SE結構

密集連接的特點是通過特征圖的不斷級聯來實現特征重用,緊密聯系前向和后向通道,進一步實現干涉條紋特征與高程細節信息的聚合機制。這些特點使得網絡在保持模型精度和穩定性的同時大幅減少參數量,減緩了梯度消失的問題,加強了特征圖的傳遞。圖5展示了前向和后向通道間的密集連接方法。

圖5 密集連接

1.2 MCFCF Net具體參數

表1網絡參數中,B1~B4分別代表圖2中的Block1~Block4??傮w來看,MCFCF Net的結構簡潔有效,其主體由Block1、Block2、Block3組成,其中每一個Block的并行支路可以分別處理多通道特征圖,捕捉到更多的干涉圖細節信息,最后的Block4整合處理特征圖后還原真實高程。MCFCF Net總參數量為0.41 M左右。

表1 MCFCF Net 結構參數

2 多通道InSAR數據集

網絡訓練過程中,把多通道干涉圖作為輸入,其對應的高程圖作為標簽,亦即多通道干涉圖與相應的高程圖構成一組數據。訓練所用數據包含連續地形和不連續地形兩種,對應有不同的生成方式。

2.1 連續地形數據集

連續地形數據按如下兩種方式生產。

方式Ⅰ:按文獻[24]的方法構建連續地形數據,生成真實高程圖,隨后根據InSAR技術原理[25]和表2所示InSAR系統參數生成多通道干涉圖,并添加噪聲水平為0.5的高斯噪聲。圖像尺寸為256像素×256像素,標簽高程范圍為0~200 m。按上述方式共生成6 000組數據。圖6(Ⅰ)為上述方法產生的部分數據,包括真實高程圖和添加噪聲的干涉圖。

表2 多通道InSAR系統基本參數

圖6 連續地形高程圖和多通道干涉圖

方式Ⅱ:由中國四川省地區DEM數據經過高度轉化后作為高程圖;隨后根據InSAR技術原理和表2所示InSAR系統參數生成多通道干涉圖,并添加噪聲水平為0.5的高斯噪聲。圖像尺寸為256像素×256像素,標簽高程范圍為0~200 m。按上述方式共生成6 000組數據。圖6(Ⅱ)為上述方法產生的部分數據,包括真實高程圖和添加噪聲的干涉圖。

2.2 不連續地形數據集

首先通過連續地形高程圖局部區域置零或重新賦值的方式得到不連續地形高程圖,隨后根據InSAR技術原理和表2所示InSAR系統參數生成多通道干涉圖,并添加噪聲水平為0.5的高斯噪聲。圖像尺寸全部為256像素×256像素,標簽高程范圍為0~200 m。按上述方式共生成12 000組數據。圖7(Ⅰ)、圖7 (Ⅱ)分別為上述方法產生的部分數據,包括真實高程圖和添加噪聲的干涉圖。

圖7 不連續地形高程圖和多通道干涉圖

綜上,連續地形數據集共生成12 000組,由連續地形生成的突變地形數據集共12 000組??倲祿癁?4 000組,充分打亂后分為訓練數據集20 000組,驗證數據集4 000組,用于訓練MCFCF Net。

2.3 網絡訓練策略以及計算機參數配置

使用自適應矩估計優化器訓練網絡參數,損失函數選用均方誤差,初始學習率為0.001,訓練輪數為98輪,最小訓練批次為8,訓練時間約16.8 h。MCFCF Net開發平臺為python3.7,Keras版本為2.3.0。用于數據生成及實驗測試的計算機主要參數如下:NVIDIA GeForce RTX 2080Ti GPU、Xeon-W2145CPU+64 GB RAM。

3 實驗結果分析

為了有效驗證MCFCF Net高程反演的性能,對不同天線系統參數下3種不同類型包括連續地形、城市不連續地形以及突變地形進行高程反演實驗,利用已經訓練好的網絡對不同的干涉圖進行高程反演并且與其他傳統多通道算法如ML、TV+MAP、GC相對比,采用歸一化均方根誤差(NRMSE)判斷本文方法的性能,其定義如式(1)所示。

(1)

3.1 高程反演實驗

圖8(a)為模擬山峰Peaks二維高程圖,圖8(b)~圖8(d)為根據表3所列多基線InSAR系統參數生成的干涉圖,信噪比約為6.10 dB,圖像大小為256像素×256像素。圖9(a)為模擬城市建筑A二維高程圖,圖9(b)~圖9(d)為根據表3所列多基線InSAR系統參數生成的干涉圖,信噪比約為9 dB,圖像大小為256像素×256像素。圖10(a)為美國LONG’S山脈地形二維高程圖,其地形圖右側有一道最大高程差近130 m的斷崖式突變,圖10 (b)~圖10(d)分別為根據表3所列多基線InSAR系統參數生成的干涉圖,圖像大小為458像素×152像素,信噪比約為7.44 dB。依次用ML算法、TV+MAP算法、GC算法以及MCFCF Net算法對3組干涉圖進行高程反演。

表3 多通道InSAR系統基本參數

圖8 Peaks高程圖和干涉圖

圖9 城市建筑A高程圖和干涉圖

圖10 LONG’S 山脈高程圖和干涉圖

圖11(a)~圖11 (d)、圖12(a)~圖12 (d)、圖13(a)~圖13(d)分別為各算法高程反演圖,圖11(e)~圖11 (f)、圖13(e)~圖13 (f)分別為各算法高程反演誤差圖。對于連續地形,4種方法皆可以基本恢復出原始高程,其中,ML算法恢復的高程圖中密布雜亂的噪聲群,表明其抗噪性能差,高程反演誤差較大。TV+MAP算法反演的高程圖中仍存在雜亂的噪聲點,難以準確還原高程。GC算法的恢復效果較為良好,但圖11(c)中仍有無法正確反演的區域,即如圖11(g)黃色框所示。MCFCF Net獲得的高程與原始高程圖最為接近,幾乎沒有明顯可見的噪聲點。對于城市不連續地形,3種傳統算法仍然存在魯棒性不強的缺點,在突變區域處誤差較大,相對地,MCFCF Net的高程反演較為貼近原始高程圖,誤差主要集中在突變區域邊界處,誤差范圍較小。針對突變地形,圖13(a)中全局出現了范圍較大的高程誤差,且有十分明顯的分散噪聲點,而圖13(b)中同樣存在雜亂的噪聲點,從整體來看ML算法、MAP+TV算法的魯棒性不強,圖13(c)中左半區域有成片的重建錯誤區域,即如圖13(g)黃色框所示,造成高程反演誤差較大。

圖11 Peaks地形高程反演實驗結果

圖12 城市建筑A地形高程反演實驗結果

圖13 LONG’S地形高程反演實驗結果

MCFCF Net的反演效果圖如圖13(d)所示,誤差主要集中在右側突變區域處,左半區地形恢復程度良好。表4為4種方法對3組干涉圖高程重建30次的平均誤差結果和平均運行時間對比??梢钥闯鯩CFCF Net在保持高精度的同時,時間消耗亦極小。

表4 各算法性能對比

4 結束語

本文方法以MCFCF Net為框架,利用深度學習神經網絡強大的函數擬合能力建立多通道干涉圖與高程圖的映射關系,實現了從多幅干涉圖到高程圖的直接映射關系,有效解決了復雜地形尤其是不連續地形的高程反演問題。在多類地形的高程反演實驗中,該方法都能獲得較為穩定和精確的結果。同時,與ML、TV+MAP和GC算法相比,MCFCF Net能更充分利用多通道InSAR系統不同基線數據潛力,使其高程反演的精度和效率大幅提升,在不同場景與不同信噪比的地形高程反演中展現了良好的泛化能力與穩定性。

猜你喜歡
反演高程像素
趙運哲作品
反演對稱變換在解決平面幾何問題中的應用
像素前線之“幻影”2000
8848.86m珠峰新高程
“像素”仙人掌
基于低頻軟約束的疊前AVA稀疏層反演
基于自適應遺傳算法的CSAMT一維反演
GPS控制網的高程異常擬合與應用
高像素不是全部
SDCORS高程代替等級水準測量的研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合