?

深度卷積網絡在航空高光譜巖性識別中的應用
——以塔木素鈾礦床北部地區為例

2024-03-14 02:11張川易敏童勤龍葉發旺徐清俊李泊凇
世界核地質科學 2024年1期
關鍵詞:巖性試驗區光譜

張川,易敏,2,童勤龍,葉發旺,徐清俊,李泊凇

1 核工業北京地質研究院 遙感信息與圖像分析技術國家級重點實驗室,北京 100029

2 北京智信遙感地理信息技術有限公司,北京 100032

高光譜遙感是利用窄且連續的光譜通道對地物進行連續遙感成像的技術,其本質上改變了傳統的遙感監測方式,能夠直接檢測在寬波段遙感影像中無法檢測的物質組分。礦物識別是迄今為止高光譜遙感最為成功的應用方向之一,特別是對于指示找礦的蝕變礦物,如含鐵礦物、白云母族礦物、綠泥石族礦物和碳酸鹽礦物等[1-6]。在區域地質調查中,巖性識別亦是一項基礎而又十分重要的工作,對于研究一個地區的成礦潛力和礦產遠景規劃具有重要意義。然而,當前高光譜遙感的巖性識別遠不及礦物識別應用廣泛,主要有以下方面的原因:1)巖石是多種礦物的自然混合物,然而,巖礦光譜混合機理目前仍不明確;2)巖石的光譜主要體現的是主導礦物的光譜特征或光譜組合特征,故傳統巖石類型分類主要依據不同端元礦物及其含量差異的三角圖解進行,然而長石、石英等許多造巖礦物在高光譜遙感常用的0.4~2.5μm 波長范圍內缺少明顯的診斷性光譜特征;3)盡管熱紅外高光譜能夠識別造巖礦物,但數據噪音大且數據源較少。上述原因導致高光譜遙感在巖性識別中的應用受限。

近年來,機器學習越來越多地引入到遙感地質勘查中[7-9]。這類方法是數據驅動的,能夠自動學習遙感數據與所需特征之間的關系。在機器學習領域,深度學習是目前最受關注的技術,它是一種通過深度神經網絡(Deep Neural Networks,DNNs)進行特征學習的方法,一些學者將深度學習引入到高光譜遙感圖像分類中,獲得了超過90 %甚至95 %以上的高分類精度,展示了深度學習在高光譜圖像特征挖掘方面的巨大潛力[10-11]。卷積神經網絡(Convolutional Neural Networks,CNNs)是深度學習的代表算法之一,它是一類包含卷積計算和深層結構的前饋神經網絡,由交替的卷積層和池化層組成,在網絡的末端通常使用幾個全連接層作為分類器,十分適合處理遙感圖像[12]。尤其是針對傳統方法對高光譜遙感影像“圖譜合一”特征挖掘的不足,近年來發展了圖(圖像)-譜(光譜)聯合的CNN 方法,已在多個公開的高光譜影像數據集上獲得了較好的地物分類識別效果[13-15]。然而這些公開的高光譜影像數據集中的地物類型大多為均勻穩定的農田、林地、水體以及人工地物,它們與地質環境存在差異,是否適用于巖性識別還需要進一步評估。

因此,本文將引入多種深度CNN 架構,將其應用于高光譜遙感影像的巖性識別,探討其應用效果,為高光譜遙感的巖性識別應用提供參考。試驗區為巴丹吉林盆地東部,塔木素鈾礦床的北部地區,近年在這一地區獲取了大面積的航空高光譜遙感影像數據,是良好的數據源。

1 試驗區與數據源

1.1 試驗區概況

試驗區位于巴丹吉林盆地東部盆山結合帶,屬于巴丹吉林盆地與巴音戈壁盆地相接地帶,巴音戈壁盆地西部的宗乃山—沙拉扎山構造巖漿帶中段。大地構造上屬于塔里木板塊、哈薩克斯坦板塊、西伯利亞板塊和華北板塊四大板塊在古生代發生陸-陸碰撞的結合部位,具有復雜多變的地質構造背景[16]。試驗區主體位于塔木素特大型砂巖鈾礦的北部,屬于塔木素鈾礦床的蝕源區宗乃山隆起(圖1a)。受區域性EW 向走滑斷裂活動影響,形成一系列NE、NW 向次級斷裂。區內巖漿多期次侵入,大面積出露晚古生代侵入巖,包括華力西期和印支期的花崗巖、華力西期的花崗閃長巖和石英閃長巖等(圖1b)。試驗區北部和東南部除大面積第四系蓋層外,還發育下白堊統和中下侏羅統,前者主要為河流相雜色碎屑巖與沼澤相暗色泥質巖,后者下部為礫巖、砂礫巖、粉砂巖夾煤線,上部為火山角礫巖、流紋巖、英安質晶屑巖晶粗凝灰巖和粉砂質凝灰巖。區內少量石炭系地層發育,主要分布在試驗區的北部。受巖漿和熱液活動的影響,區內發育不同程度的蝕變,主要有絹云母化、高嶺土化和硅化等。

圖1 試驗區位置和巖性分布圖Fig. 1 Location and lithology distribution map of test area

1.2 數據源及預處理

本研究數據源為加拿大ITRES 公司生產的航空高光譜成像儀SASI(Shortwave-infrared Airborne Spectrographic Imager),該儀器為短波紅外光譜區域的推掃式成像高光譜傳感器。短波紅外是地質遙感常用的譜段區域,光譜范圍涵蓋了多種熱液蝕變礦物的吸收光譜。SASI 對其垂直軌道方向的600 個成像像元同步獲取在950~2 450 nm 波長范圍內具有連續光譜覆蓋的100 個光譜波段。飛行相對高度約為2 000 m,獲取影像的空間分辨率達到2.5 m,獲取的SASI 數據的技術指標如表1 所示。

對于飛行范圍較大的航空高光譜影像采集來說,受飛行時間、外界條件等變化因素影響,獲取不同航帶的輻射信號具有一定的差異,造成航帶間輻射亮度不均一,二向反射分布函數(Bidirectional Reflectance Distribution Function, BRDF) 校正能消除遙感影像中由于太陽高度角、觀測角與真實角度偏差引起的色差不一致,但由于機載遙感圖像相對星載遙感圖像的分辨率高、視場角大,對光照、環境等因素更為敏感,造成目前機載環境的遙感圖像BRDF 校正效果不佳,如圖2 所示。雖然還可以通過一些其他預處理減弱這些影響,但亦可能影響到地物原始的輻射特征。因此,為避免預處理過程中引入其他噪聲,對試驗區的航空高光譜影像僅進行了系統級輻射定標處理、大氣校正和反射光譜重建和BRDF 校正等。大氣校正統一采用6S 輻射傳輸模型,通過計算和反演飛行時的大氣參數,基于大氣輻射傳輸方程進行大氣校正。通過對比校正后的影像像元光譜和野外實測蝕變巖光譜驗證大氣校正的效果。如圖3 所示,為試驗區絹云母化蝕變巖所在位置的光譜曲線對比圖,絹云母的波譜形態和Al-OH 診斷性光譜特征基本一致,特征吸收峰波長位置偏移僅1 nm,表明光譜重建效果較好。

圖3 絹云母化蝕變巖光譜曲線圖Fig. 3 Spectral curve of sericitization altered rock

2 試驗方法

本研究試驗流程包括航空高光譜數據預處理、樣本制作、模型構建和模型應用等,如圖4 所示。其中,航空高光譜數據預處理在第1.2節中已經敘述。經過預處理后,SASI 高光譜圖像的DN 值被轉換為反射率值。最后,對各波段影像質量進行檢查,剔除1 400、1 900 和2 400 nm 附近受水汽吸收影響的異常值。剔除的波段包括1 332~1 482 nm 的11 個波段、1 797~2 052 nm 的18 個波段和2 382~2 442 nm的5 個波段,剩余66 個波段。樣本制作主要基于試驗區地質圖結合野外調查進行,并按照深度學習模型訓練的要求進行比例劃分為訓練集、驗證集和測試集。模型部分針對高光譜影像“圖譜合一”的特點,重點設計了1 種基于光譜特征和2 種基于圖-譜聯合特征的CNN 模型進行對比研究,分別是一維卷積神經網絡(One-dimensional Convolutional Neural Network,

圖4 試驗區航空高光譜數據試驗流程圖Fig. 4 Test flow chart of aerial hyperspectral data in test area

1D CNN)、一維+二維卷積神經網絡(Onedimensional and Two-dimensional Convolutional Neural Network, 1D+2D CNN)和三維卷積神經網絡(Three-dimensional Convolutional Neural Network, 3D CNN)。最后,對結果進行評價分析。

2.1 樣本制作

深度學習任務需要合適的樣本數據來挖掘數據中的特征信息,并抽象出高級信息映射到輸出。前人經驗表明:深度學習技術作為一個黑箱運行,通過大量的輸入和給定的結果提供穩定的處理,訓練樣本數量越多,黑匣子的工作性能越穩定[19]。從理論上講,真實數據是最可靠的。然而,深度學習對樣本數量的需求較大,并且地面數據與航空高光譜數據存在顯著的尺度差異。因此,本文利用影像數據來構建巖性樣本數據集。

根據試驗區地質圖資料及野外調查,在影像上初步圈定8 類,分別是:印支期花崗巖、華力西晚期花崗巖、華力西晚期花崗閃長巖、華力西中期石英閃長巖、石炭系碎屑巖、中下侏羅統火山凝灰巖、第四系沉積物和絹云母化蝕變巖。為評價模型對不同時期的同類巖性的區分能力,花崗巖樣本分為印支期和華力西晚期的2 類花崗巖。對初步圈定的樣本區域,均進行了野外調查驗證,以保障樣本的可靠性。另外野外調查發現,下白堊統河流相碎屑巖與第四系沉積物特征基本一致,從影像上看亦如此,故將其歸入第四系類。地質圖中沒有的蝕變巖類,通過影像分析結合野外調查發現,圖2影像中偏黃綠色的為蝕變巖(以絹云母化為主),基于此對蝕變巖進行初步圈定。采用影像光譜可視化工具,對每類巖性的像元光譜進行查驗,剔除同類樣本中與其他光譜差異較大的點,同步計算各類樣本的平均光譜,如圖5 所示,以構建光譜變化相對平穩的樣本數據。從各類巖性平均光譜反映的特征來看,除絹云母化蝕變巖具有與其他巖性差異較大的光譜特征以外,其他巖性的光譜特征較為相似。因此從理論上來說,為了更好地區分這些巖性,不能僅從光譜特征挖掘的角度來構建模型,而應該從圖像-光譜結合的角度來構建模型。為提高模型對每個類別的公平性和性能,從每類樣本隨機抽樣2 萬個點作為數據集樣本,再按照7:2:1 的比例劃分為訓練集、驗證集和測試集,分別用于模型訓練、模型調參和模型測試。

圖5 每類巖性樣本的平均光譜曲線圖Fig. 5 The average spectral curve of each type of lithology sample

由于3 種CNN 模型的結構不同,在數據的輸入方面存在差異,1D CNN 輸入為像素光譜,1D+2D CNN 輸入為像素光譜和圖像的空間信息,3D CNN 輸入為高光譜數據立方體。因此,在樣本數據集制作方面,1D CNN 在高光譜數據進行歸一化之后,選取光譜曲線作為輸入;1D+2D CNN 在1D CNN 的樣本數據集基礎上,增加了每個樣本點周圍的空間信息,以歸一化的高光譜數據進行主成分分析后的第一主成分表示,范圍依據經驗設為像素周圍30×30[20];3D CNN 是以樣本點為中心,取30×30的立方體。

2.2 模型構建

深度神經網絡模型基于目前流行的PyTorch 深度學習框架進行設計、訓練與構建。本研究重點測試和對比基于光譜特征的1D CNN、基于圖-譜特征的1D+2D CNN 和基于圖-譜特征的3D CNN 的巖性識別效果。

1D CNN 通過多個交替的一維卷積層和池化層提取特征,最后使用全連接層進行分類。1D CNN 將像素的光譜曲線作為一維向量輸入,利用相應的一維卷積結構來提取高光譜影像的光譜信息特征,結構如圖6 所示,卷積層采用的激活函數為ReLU,與其他激活函數如sigmoid、tanh 函數相比,ReLU 函數具有良好的稀疏性和較小的計算量,既避免了梯度消失,又加快了神經網絡訓練的速度,是目前深度學習中主流的激活函數[21]。

圖6 基于光譜特征提取的1D CNN 結構圖Fig.6 The 1D CNN structure based on spectral feature extraction

1D+2D CNN 通過增加一系列交替的2D 卷積層和池化層來提取圖像的空間特征,并與1D卷積層提取特征進行融合,最后,使用全連接層進行分類。用于提取圖-譜聯合特征的1D+2D CNN 的結構如圖7 所示,在光譜分支上,采用了上述相同的一維卷積模型的結構對光譜特征進行提??;空間信息分支上利用二維卷積層、激活函數以及池化層的堆疊提取圖像特征。卷積層采用的激活函數為ReLU,池化層為常用的最大池化。提取獲得圖像特征和光譜特征后,將圖像特征重構成一維張量,再采用Concate 融合法將圖像特征與光譜特征進行連接,并使用全連接層對聯合圖-譜特征進行分類。

圖7 基于圖-譜特征提取的1D+2D CNN 結構圖Fig. 7 The 1D and 2D CNN structure based on image and spectral feature extraction

3D CNN 在結構的組成上,分為基本的三維卷積塊、光譜殘差塊、空間殘差塊和分類輸出層,結構如圖8 所示。三維卷積塊由三維卷積層、激活函數和歸一化層組成,如圖9a 所示。光譜殘差塊和空間殘差塊在結構上類似,由兩個三維卷積塊堆疊而成,輸入X 經過兩個三維卷積塊后與輸入相加,再通過一個激活函數,如圖9b 所示。分類輸出層包含一個池化層與全連接層。

圖8 基于圖-譜特征提取的3D CNN 結構圖Fig. 8 The 3D CNN structure based on image and spectral feature extraction

圖9 三維卷積塊和殘差塊結構示意圖Fig. 9 The structure of 3D convolution block and residual block

光譜殘差塊和空間殘差塊用同一個結構,主要區別在于核大小。光譜殘差塊中的三維卷積層通過(1,1,7)的核進行光譜維度的信息提取,保持空間大小不變??臻g殘差塊中的三維卷積層通過(3,3,1)的核進行空間維度的信息提取,保持光譜維度不變。整體結構上由淺入深,逐步增強光譜與空間的特征表示。兩部分特征學習模塊通過殘差連接構建深層網絡,提高了模型的表示能力。

上述神經網絡均使用當前流行的深度學習框架PyTorch 進行搭建和訓練,損失函數均使用CNNs 中最常用的交叉熵損失函數進行計算[22]。模型訓練使用SGD 優化器,batch size 設置為256。為了提高模型訓練的穩定性和效率,在初始訓練階段采用了學習率warmup 策略[23]。具體而言,在訓練的初始幾個周期(epoch),學習率從一個較小的值逐漸增加到預定的最大值。這一策略的引入旨在減少模型訓練初期由于學習率過高而導致的不穩定性。學習率的初始值設定為Lrstart,在預定的Nwarmup周期內,學習率線性增加至Lrmax。因此,第t個周期的學習率可由公式(1)得出:

在完成warmup 階段后,為了實現更加精細的模型優化,還采用了學習率的線性遞減策略[23]。具體來說,從第Nwarmup+1 個周期開始,學習率從Lrmax開始逐漸減小,直至訓練結束。這種遞減策略有助于在訓練的后期訓練階段更細致地調整模型參數,從而避免過擬合,并提高模型的泛化能力。根據公式(2)得出從第t個周期的學習率Lrt:

式(2)中:Ntotal—總訓練周期;Lrend—結束時學習率。在本研究中,Ntotal—200;Nwarmup—10;Lrstart—0.000 01;Lrmax—0.000 1;Lrend—0.000 000 1。

模型訓練獲得收斂之后,使用測試集評估模型的泛化性能,完成整個深度卷積神經網絡模型構建過程。最后,采用多個評價指標對模型的測試精度進行評估。本文采用的指標包括總體精度、生產者精度、平均精度和Kappa系數,它們都是遙感分類模型的重要評價指標[24-25]。表2展示了不同的CNN模型在試驗區巖性樣本集上的測試精度評價指標的計算結果。三個CNN模型的總體精度和平均精度均在80 %以上,其中,3D CNN 模型的總體精度和平均精度最高,均大于90 %,1D+2D CNN的精度優于1D CNN,Kappa 系數亦表現為3D CNN>1D+2D CNN> 1D CNN,表明聯合圖-譜特征的提取方法優于僅考慮光譜特征的提取方法。

表2 卷積神經網絡模型測試精度表Table 2 Test accuracy of the CNN models

利用混淆矩陣方法計算各個樣本類別的生產者精度,各CNN 模型的混淆矩陣如圖10 所示?;煜仃囍械拿恳涣斜硎疽粋€預測類別,每一列之和表示該類別預測的數據點總數。每一行代表真實的數據類別,每一行的總和代表該類別中數據實例的數量?;诨煜仃?,可以計算出每個類別的正確和錯誤分類比例。表3 是根據混淆矩陣計算的各CNN 模型在測試集上各個類別的生產者精度。

表3 卷積神經網絡模型生產者精度表Table 3 Producer’s accuracy of the CNN models

圖10 模型測試混淆矩陣Fig. 10 The confusion matrix of the models for the test set

從模型在測試集上的表現來看,聯合圖-譜特征的1D+2D CNN 和3D CNN 在各類別的精度上均優于僅考慮光譜特征的1D CNN。3D CNN在中下侏羅統火山凝灰巖、華力西晚期花崗閃長巖、華力西中期石英閃長巖、石炭系碎屑巖和華力西晚期花崗巖的精度上優于1D+2D CNN;1D+2D CNN 在印支期花崗巖、絹云母化蝕變巖、第四系沉積物的精度上優于3D CNN??梢娨敫吖庾V圖像的空間特征對于提高巖性識別模型精度是有意義的,但具體以哪種方式進行圖-譜聯合還有待進一步的評價分析。

3 應用結果與評價

3.1 模型應用結果

作為構建CNN 模型的最終目的,為了更好地評估其在高光譜遙感巖性識別中的實際效果,將訓練好的各個CNN 模型用于試驗區SASI航空高光譜影像進行巖性識別,并將識別結果通過模型進行輸出。最后,通過ArcGIS 軟件平臺對輸出結果進行分類和可視化制圖,實現巖性識別與分類。圖11 展示了分別使用1D CNN、1D+2D CNN 和3D CNN 模型對試驗區SASI 航空高光譜影像進行巖性分類識別的結果圖及與參考地質圖的對比,各圖幅的地理范圍與圖2 完全一致。

圖11 試驗區巖性識別結果與參考地質圖的對比圖Fig. 11 Comparison of identified lithology results to the reference geological map in the test area

3.2 結果評價

根據各深度CNN 模型在試驗區SASI 航空高光譜影像上的巖性識別結果與參考地質圖的對比情況,總體上看,1D CNN 模型和1D+2D CNN 模型的巖性識別結果(圖11a、b)有較為明顯的、與航空高光譜飛行方向一致的EW 向條帶效應,使得試驗區的巖性識別成圖效果受到顯著的影響,而3D CNN 模型的巖性識別結果(圖11c)的條帶效應明顯減弱了許多。由于航空高光譜影像采集受飛行時間、外界條件等變化因素影響,獲取不同航帶的輻射信號差異造成了航帶間輻射亮度的不均一屬于正?,F象,也是航空影像獲取中較為常見的,這導致航帶之間色差成為多航帶大區域高光譜巖性填圖的技術難點[26]。因此,鑒于試驗結果中的3D CNN 模型在克服條帶效應方面的顯著效果,在航空影像的處理和信息識別方面具有更好的應用前景。

在巖性的識別方面,相對而言,3D CNN 模型的巖性識別結果與參考地質圖的匹配程度最佳,具有最好的視覺效果;而1D CNN 模型的識別結果與參考地質圖的匹配程度最差。對不同巖性來說,首先,對絹云母化蝕變巖的識別,三種模型識別的范圍與圖2 中黃綠色巖石發育區域基本一致,這是因為絹云母化蝕變巖具有較為明顯的診斷性光譜特征(圖3),因此,無論是基于光譜的CNN 模型和基于圖-譜聯合的CNN 模型,均能夠較好地學習并提取絹云母化蝕變巖的特征。然而,對于參考地質圖中的其他巖性,它們在1.0~2.5μm 波長范圍內的診斷性特征不明確,且光譜較為相似(圖5),因此在不同模型結果中的差異體現得較為明顯。試驗區西南部是巖性最復雜的區域,涉及印支期花崗巖、華力西晚期花崗閃長巖、華力西中期石英閃長巖等多種巖性,如圖11 所示,1D CNN 模型和1D+2D CNN 模型將印支期花崗巖和華力西晚期花崗閃長巖大量混淆,華力西晚期花崗閃長巖和華力西中期石英閃長巖的混淆程度亦較大,相對而言,3D CNN 模型盡管有所混淆,但混淆程度較小,與參考地質圖的巖性分布大體上一致。在試驗區北部,1D CNN 模型和1D+2D CNN 模型將部分第四系沉積物識別為石炭系碎屑巖,尤其是1D CNN 大量錯分,而3D CNN 對于該地段的第四系沉積物和石炭系碎屑巖的區分效果較好。在試驗區東南部,對于大面積第四系沉積物中的中下侏羅統火山凝灰巖的識別,三種模型均有所反映,受條帶效應的影響,1D CNN 模型和1D+2D CNN 模型將部分第四系沉積物識別為火山凝灰巖,1D CNN模型錯分相對更為嚴重,對東南角的一片火山凝灰巖,各模型均未識別。在試驗區東部,涉及華力西晚期花崗巖、華力西晚期花崗閃長巖的區分,從識別結果來看,只有3D CNN 模型獲得了較好的區分效果。

因此,3D CNN 模型無論是對試驗區航空高光譜影像條帶效應的克服方面,還是對各類巖性的區分識別方面,均獲得了最佳的應用效果,這與各模型的測試精度計算結果具有較好的一致性。相比之下,1D CNN 模型對各類巖性的混淆度還要甚于1D+2D CNN 模型,可見,在高光譜遙感常用的反射光譜段,僅依靠光譜特征進行巖性的區分誤差較大,圖-譜結合是高光譜遙感巖性識別的正確思路。

4 結 論

以巴音戈壁盆地西部的塔木素鈾礦床北部區域為試驗區,以巖性識別為應用目的,基于SASI 航空高光譜數據進行了多種深度CNN模型的試驗應用及效果評價,主要結論如下:

1)通過對8 類巖石進行樣本構建,分別基于光譜特征的1D CNN、基于圖-譜聯合特征的1D+2D CNN 和3D CNN 三種深度CNN 進行模型訓練、構建與測試,結果表明:3D CNN 模型具有最高的測試精度;

2)通過對三種深度CNN 模型進行巖性分類識別和評價,結果表明:與其他兩種模型相比,3D CNN 模型對各類巖石的區分和識別與真實參考具有最佳的匹配度,因此,引入高光譜圖像的空間特征進行圖-譜特征的聯合挖掘,對于高光譜遙感圖像識別能力具有明顯的提升效果;

3)3D CNN 模型能夠較好地克服多航帶拼接后的航空高光譜影像條帶效應,對大面積航空影像處理具有較好的應用前景。

本研究主要針對巖石大類進行了分類識別,如何對巖性進一步細分還需結合光譜特征、紋理特征等進行更深入的特征分析和挖掘,這也是未來主要的研究方向。

猜你喜歡
巖性試驗區光譜
基于三維Saab變換的高光譜圖像壓縮方法
一種識別薄巖性氣藏的地震反射特征分析
18個自貿試驗區
各試驗區先行先試 探索創造模范做法
我國自由貿易試驗區發展現狀以及未來展望
K 近鄰分類法在巖屑數字圖像巖性分析中的應用
4個自貿試驗區總體方案實施率超過90%
星載近紅外高光譜CO2遙感進展
苦味酸與牛血清蛋白相互作用的光譜研究
低滲巖性氣藏壓降法計算庫容量改進
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合