?

生成式對抗神經網絡的改進及其在地震數據壓噪中的應用

2024-02-03 13:09彭海龍孫文釗魯統祥
石油物探 2024年1期
關鍵詞:損失噪聲神經網絡

彭海龍,李 明,孫文釗,李 列,周 凡,魯統祥,江 凡

(中海石油(中國)有限公司湛江分公司,廣東湛江524057)

地震數據在采集和處理過程中受隨機噪聲的影響,造成地震數據品質的降低,進而影響后續地震解釋工作對地質信息的解讀,不利于目標圈閉和油氣藏的評價[1]。為此,地震數據處理需要一種能夠高效率高質量壓制地震隨機噪聲的技術,以提高油氣勘探成功率,這也是當前地震數據處理技術的終極目標。隨著計算機技術的發展,深度學習技術已經得到廣泛應用,并在地震數據處理中發揮了重要作用。

目前地震隨機噪聲去除方法主要有兩大類。一類是根據信號與噪聲差異性特征進行去噪的傳統方法,主要包括各種變換域去噪方法和時-空域去噪方法[2],如雙邊濾波[3]、高斯濾波[4]、三維塊匹配濾波算法[5](block-matching and 3D filter,BM3D)、加權偏振濾波[6]、曲波變換去噪算法[7]等。上述算法具有良好的去噪效果,但是計算效率相對低,對地震數據的邊緣細節保護性差。另外一類是基于深度學習的去噪方法,此類方法根據地震數據有效信號與噪聲的特征差異進行地震數據的去噪[8]。早期深度學習方法在進行地震數據去噪時,主要是基于前饋神經網絡以及多層感知器開展處理工作[9],對地震數據的構造信息及邊緣細節信息具有較好的識別及檢測能力,在地震數據去噪過程中能夠發揮一定的作用。但是常規深度學習算法大多采用判別模型來模擬噪聲模型,并且需要對其進行監督。因此,GOODFELLOW等[10]在2014年首次提出生成對抗神經網絡架構(generative adversarial networks,GAN),被稱為是“近二十年來機器學習領域中最酷的想法”。但是利用該神經網絡開展地震數據去噪時存在梯度消失和對地震數據的邊緣等細節信息保護不到位等問題。2016年,U-net卷積神經網絡被首次提出,相比較而言,U-net神經網絡應用范圍廣泛,使用拼接式的跳躍連接,可以有效實現特征融合[11],但是該神經網絡結構主要采用二維卷積算法,未充分利用地震數據的三維信息,因此,在實際應用中存在訓練速度慢、處理效果不夠理想的不足。隨后RADFORD等[12]提出了基于深度卷積生成對抗神經網絡的無監督表征學習神經網絡(deep convolutional generative adversarial networks,DCGAN),該神經網絡結構穩定,但有效信息未能得到較好的保護,且隨著地震噪聲等級的提升,其去噪能力下降明顯。ARJOVSKY等[13]提出了一種基于Wasserstein距離的生成對抗神經網絡(wasserstein generative adversarial networks,WGAN),該神經網絡可以開展盲去噪,但是需要Lipschitz-1條件約束。2019年,CHEN等[14]采用廣義損失感知對抗神經網絡(generalized loss sensitive generative adversarial networks,GLS-GAN)進行盲去噪,通過估計輸入數據的噪聲分布,實現數據的盲去噪,該神經網絡算法需要設置不同的損失函數,因此對于噪聲類型和強度存在限制。

在地震數據處理方面,深度學習應用的最大挑戰之一就是需要大量帶注釋的訓練樣本來支持推斷,但地震數據往往是數量有限的注釋樣本,現有的地震數據在表征地下信息時存在很大的不確定性,因此很難進行可概括的特征模式學習[15]。為解決上述問題,常用方法就是通過隨機的理論地質構造模型正演得到大量無噪聲干擾的地震正演數據,對正演結果進行各種簡單修改實現數據擴充,如坐標旋轉的方式[16],該方式能夠對地震信號樣本的有效邊緣信息進行修改,由于未引入新的地震信息,故能夠獲得大量不含噪聲的正演模型數據,但是難以模擬得到真實的地質構造地震信息,所以存在過度擬合的問題。為應對這一挑戰,有學者提出了基于實際地震數據生成復雜類型數據的合成地震數據增強方法,該方法能夠衍生更多的數據來填充數據集,其中的生成式對抗神經網絡模型則是合成地震數據增強方法的代表[17-18],該神經網絡對于地震數據分布具備很好的生成能力,能夠完成端到端的生成任務,將地震數據去噪問題轉為地震信息翻譯問題,即給定具備統一空間特征的地震數據集,神經網絡模型能夠學習對應的映射函數,從而能夠生成另外一種具有統一空間特征的數據集。因此生成式對抗神經網絡能夠很好地表現上述映射關系,生成與原始無噪數據盡可能相似的地震數據。該方法在用于地震數據去噪時,將含噪地震數據和無噪地震數據視為兩種不同類型的數據,因二者都具有多層次的不同特征,故在生成式對抗神經網絡的數據信息翻譯原理下開展監督學習,能夠使生成器學習到兩種數據之間的映射關系,從而能夠實現地震數據去噪的目標。該方法對于含有特定類型及強度噪聲的地震數據處理效果較好,但是面對噪聲種類及噪聲強度多變的地震數據時存在訓練不穩定、模型難收斂的問題,因此,該方法在地震數據處理時依舊存在提升空間。

為進一步提高地震數據的去噪效果,本文在上述研究成果的基礎上,提出一種改進的生成式對抗神經網絡建立方法,對常規生成式對抗神經網絡的生成器和判別器進行優化,改進了神經網絡的模型結構。同時從損失函數入手,結合對抗損失函數、結構信息損失函數等的優勢,形成全新的綜合性損失函數,然后利用正演模擬數據集進行神經網絡訓練和測試,最后利用實際地震數據進行測試驗證。

1 方法理論

1.1 U-net神經網絡結構

U-net神經網絡模型與全卷積神經網絡(full convolutional networks,FCN)的結構較為相似[19],U-net神經網絡結構如圖1所示。

圖1 U-net神經網絡結構示意

U-net神經網絡和FCN神經網絡均含有編碼器和解碼器,二者都存在跳躍連接的拓撲結構[20-21]。U-net神經網絡在結構形態上左右對稱,其左側神經網絡結構用來捕獲上、下文信息的收縮路徑,右側用于執行精確定位的擴展路徑。編碼器輸出的數據信息經過復制裁剪之后,同對應的解碼器中經過反卷積的特征圖進行特征融合,融合結果作為下一層的輸入進行上采樣。U-net神經網絡在上采樣過程中需要大量的特征通道,以保證將上、下文信息傳輸至具有更高分辨率的層上。

1.2 神經網絡模型的改進

1.2.1 基于U-net的生成器神經網絡設計

利用U-net神經網絡進行地震數據去噪時,由于其生成器模型深度不夠,導致對地震數據特征的數據集信息提取能力不夠,因此,該神經網絡對噪聲和有效信息的區分效果差。U-net神經網絡結構中存在最大池化層,使得神經網絡模型難以保留原始地震數據的復雜細節特征信息。受ReLU激活函數的影響,神經網絡的梯度計算不能持續更新該神經元的權值信息,導致神經網絡存在大量的冗余參數,不利于模型的進一步學習[22]。最后,U-net神經網絡在批量標準化(batch normalization,BN)層的訓練中引入不同批次、不同樣本的特征性關系與信息,在一定程度上弱化了單一地震數據的有效信息,不利于地震數據有效信息的還原。

為解決上述問題,本次研究采用更深層次神經網絡以增強對原始地震信號的特征提取和還原能力,直接對下一層級的模型和上一層級的輸出結果進行卷積或者反卷積,從而避免U-net結構中上采樣和下采樣層丟失或者損傷地震信息,能夠最大程度保持原有的地震信息的細節紋理、結構特征等多維信息。

為解決批量地震信號樣本的特征關系信息對于單個地震信號的影響,剔除U-net神經網絡結構中的BN層,在神經網絡訓練中對單個地震信號的均值和標準差進行標準化處理,以確保不同信號之間的獨立性,避免批量標準化引發的信息干擾問題。

基于上述策略,改進的生成器神經網絡結構如圖2 所示。

圖2 改進的生成器神經網絡示意

由圖2可知,生成器前端的收縮神經網絡中每一個模塊都包含一個尺寸為4×4的卷積層和LeakyReLU激活層,其中方框頂端的數據表示特征圖尺寸,方框底部的數據表示通道層數。從左到右,前4個模塊用于對地震數據特征圖尺寸進行縮小,由128×128逐步縮小至16×16,同時信號的通道由32層逐步擴展到256層;后3個模塊將通道擴張為512層,但特征圖的尺寸進一步縮小至2×2。在后端的擴張神經網絡部分,全部為尺寸4×4的反卷積層和LeakyReLU激活層。每一個特征圖和收縮神經網絡均通過跳躍連接在通道上實現嵌合,因此該層的特征圖尺寸、通道數和收縮神經網絡一致。然后利用尺寸為4×4的反卷積層依次進行反卷積操作,輸出與原始信號相同尺寸的信號。

1.2.2 判別器神經網絡結構設計

生成器的功能是生成與無噪地震信號盡可能相似的信號,判別器則是對兩個信號進行區分。因此判別器需要具備監督和對抗生成器的作用,要想實現上述目標需要判別器具有優秀的判別能力[23]。在神經網絡的迭代學習中,隨著兩種信號之間的相似性逐漸增加,對判別器的要求也隨之升高。為進一步提升U-net神經網絡中判別器對生成信號和原始地震信號的判別能力,本次研究在降采樣層中依次降低地震信號的尺度,讓判別器從不同的尺度來分析判斷地震信號,改進后的多尺度判別器神經網絡結構如圖3所示。

圖3 改進后的多尺度判別器神經網絡結構

由圖3可知,在判別器神經網絡結構中,存在3個不同尺度、相同結構的子神經網絡。在訓練過程中,首先利用第一個子神經網絡判斷原始尺度,然后通過降采樣的方式利用后兩個子神經網絡,分別判別低尺度的地震信號,最終以權值疊加的方式輸出結果。改進的判別器神經網絡結構可以從多個角度提升生成器的性能,其中大尺度判別器有利于生成器生成與全局更為一致的地震信號,小尺度判別器有利于提升生成器對細節的生成能力。

1.2.3 改進后的神經網絡模型結構

利用上述生成器和判別器,得到改進的生成式對抗神經網絡模型結構如圖4所示。

圖4 改進的生成式對抗神經網絡模型結構示意

1.2.4 損失函數的優化改進

U-net神經網絡的損失函數只考慮了對抗損失,因此存在魯棒性不強的缺陷[24]。其目標函數很難描述復雜地震信號對邊緣細節的特征需求,導致生成式對抗神經網絡難以準確描述地震信號的特征。為進一步提高對抗神經網絡的性能,需要優化神經網絡模型的損失函數。

1.2.4.1 對抗損失

目前常用的生成式對抗神經網絡目標函數為LSGAN函數,其表達式為[25]:

(1)

(2)

式中:D表示判別器神經網絡;G表示生成器神經網絡;E表示期望;x表示服從真實地震信號分布的地震數據;z表示服從隨機噪聲分布的地震數據;a和b分別表示去噪地震數據標準和真實地震數據的標注;c表示判定為真實地震信號的標準;Pr表示真實樣本數據;Pz是輸入的隨機樣本數據。鑒于本文研究的是一種監督學習條件的生成式對抗神經網絡,需要生成器生成波阻和相位等更接近真實地震數據的結果,因此需要在損失目標函數中引入原始含噪地震信號的分布數據、服從無噪地震信號分布的數據、服從隨機噪聲分布數據以及L1損失函數,改進后的判別器的損失函數LG和生成器損失函數La分別如(3)式和(4)式所示:

(3)

(4)

式中:i表示第i個尺度;Dk表示與其對應的判別器;xr表示服從無噪地震信號分布的地震數據;x0表示服從原始含噪地震信號分布的地震數據;ξ表示權重系數;×代表乘積。

1.2.4.2 結構信息損失

U-net神經網絡執行去噪任務的最終目的就是將含噪的地震信號轉化為不含噪的信息矩陣[26]。在實際數據處理中沒有考慮到地震數據內部含有的地質結構信息,以往用于描述該項情形的目標函數均為L1函數或者L2函數,但是上述兩種函數易存在梯度爆炸或者梯度穩定性較差的問題。因此本文引入地震結構相似度函數,建立新的結構信息損失函數。該函數根據地震數據的不同結構特征將其劃分為結構規律區域和結構復雜區域,不同的區域采用不同的結構信息損失函數,兩個區域的損失函數公式分別如(5)式和(6)式所示:

(5)

(6)

(7)

式中:Lc表示結構復雜區域的損失函數;Ls表示結構規律區域的損失函數;X0表示初始圖像的構造特征信息;Θ表示Hadamard乘積;XG表示生成器生成的數據結果;Xr表示原始地震數據;S表示地震結構相似度指數;Ax,Ay分別表示兩個地震數據振幅的均值;σx,σy分別表示兩個數據的協方差;ai,bi分別表示不同的穩定系數;α,β表示權重系數;M表示地震信號的尺度個數。

1.2.4.3 配準損失

上述損失函數主要從神經網絡結構方面入手,在生成能力和地震信號能量層面上進行神經網絡訓練。在實際去噪過程中,對抗損失函數不能完全約束復雜地震信號,建立的神經網絡結構會帶來外部噪聲,從而對去噪結果產生不利影響。為得到更真實的有效地震信號,提出一種多尺度配準函數,結合多尺度判別器特征,利用多尺度不變特征變換(scale invariant feature transform,SIFT)開展特征匹配。去噪結果與無噪數據之間匹配程度越高,對應的匹配特征數目越多,特征點之間的歐式距離越小,表明去噪結果越好。利用該項匹配損失函數實現去噪數據與無噪數據之間差異的度量,可以得到準確的去噪結果,改進的目標函數表達式LF如下:

(8)

式中:N表示匹配特征數目;hj表示第j個匹配特征點的SIFT特征向量。

1.2.4.4 感知損失

利用對抗神經網絡進行地震信號去噪時,需要考慮其中的地質結構細節信息,同時還要確保去噪前、后地震信號在波阻抗特征層面上的一致性。常規做法采用L2函數來約束地震信號細節的提取過程,但是該函數并不能與感知信息相匹配[27]。為解決上述不足,本文采用VGG19神經網絡作為特征提取器,分別提取真實地震數據、生成數據和去噪結果的特征圖,然后應用一種多尺度感知損失函數對生成器生成信號和真實信號進行感知比較,從而對信號之間的波阻抗特征進行約束,損失函數Lp表達式為:

(9)

式中:j表示第j個神經網絡層;K表示神經網絡層數目;Nj表示第j層整體元素數目;ωj表示第j層感知結構權重;ψr,ψG,ψde分別表示真實地震數據、生成器生成的地震數據、去噪結果數據經過VGG19神經網絡的第j個池化層提取的特征圖。

1.2.4.5 綜合損失函數

為充分利用各項損失函數的優勢,本文將上述損失函數進行綜合,同時基于建立的多尺度神經網絡模型,得到最終建立的損失函數為:

(10)

(11)

式中:μ1,μ2,λ,θ表示不同的約束權值。(10)式表示判別器的多尺度損失函數,(11)式表示生成器的綜合損失函數。對生成器生成結果的總振幅數值大小、結構等不同層次進行約束和訓練,可以有效提升生成器的去噪能力。優化器則采用自適應運動估計梯度下降(adaptive momentum,Adam)優化進行損失函數的迭代優化,通過參數空間的估計實現自適應更新步長,通過多階矩陣修正偏差,訓練魯棒性和參數泛化性,訓練過程中收斂速度快,算法流程如下。

參數:學習步長α,衰減因子β1,β2∈[0,1],目標函數f(θ),初始參數θ0,初始一階矩估計m0←0,初始二階矩估計v0←0,初始時間步長t←0,常數ε。

whileθt未收斂 do

t←t+1

更新一階矩估計:mt←β1·mt-1+(1-β1)·gt

end

至此,得到本文提出的改進的神經網絡訓練流程(圖5)。

圖5 改進的神經網絡訓練流程

2 數據測試

2.1 數據集及評價指標

2.1.1 訓練與測試數據集

地震數據受采集、處理及地質情況的影響,其子波、相位、振幅及頻率等信息存在較大的差異,即使同一時期采集的不同位置的地震數據也存在上述差異,因此選擇樣本數據時需要充分考慮上述情況充分考慮。當前較為適用的方式是通過正演方式建立無干擾地震數據,該過程參照WU等[15]提出的數據集建立思路,通過反射系數模型和子波褶積生成無噪聲的正演模型數據,將此數據作為樣本數據進行神經網絡的學習訓練。但是實際情況下,很難獲取能夠反映地下真實地層情況的反射系數,因此采用提取偽反射系數的方式來近似研究地下地層反射系數的分布情況,從而獲取復雜程度等同于地下真實情況的反射系數。

經過大量分析可知,工區目標層位的地震主頻分布范圍為15~45Hz,本次研究在建立訓練測試樣本數據集時,設定地震子波的主頻在該范圍內隨機變化,對應的子波選擇雷克子波和俞氏子波,通過正演建立不同的訓練樣本,樣本獲取過程具體如圖6 所示。構建訓練樣本數據集時,結合南海北部某工區地震資料的振幅、相位、信噪比和頻帶分布特征,確定本次訓練樣本集為200個。為實現三維地震數據處理,建立的樣本數據和標簽數據均為200×200×200的三維數據體。

圖6 樣本獲取過程示意

2.1.2 超參數配置

模型訓練之初,需要設定一些超參數,本次測試模型應用統一超參數設置,各個模型初始學習率為0.0005,先進行150輪的固定效率學習,再進行150輪的線性下降效率學習。其中,Adam優化器中,β1=0.7,β2=0.999,ε=10-1。

2.2 模型驗證

2.2.1 消融實驗驗證

為驗證本次優化的神經網絡模型的各項功能,需要評價神經網絡模型各模塊的性能優化方式,因此采用消融模型實驗對用于優化神經網絡的各個模塊性能進行測試。利用Marmousi模型進行消融實驗,原始模型數據和含噪模型數據如圖7所示。在保持神經網絡模型單一優化功能程度的基礎上分別計算不同實驗結果的信噪比,不同程度的優化神經網絡模型的消融實驗指標如表1所示,不同實驗結果的信噪比如表2所示。其中表1測試項1表示不做任何改進的原始U-net神經網絡,將其作為生成器,對應的判別器為單一結構,損失函數也為單一對抗損失函數,測試項2是本文設計的損失函數,其它功能保持不變,測試項3則是采用本文設計的生成器和損失函數,測試項4則是采用本文設計的判別器和損失函數,測試項5則是采用本文設計的生成器、判別器和損失函數。由表2中的實驗結果可知,僅具有原始對抗損失函數的模型在訓練中不夠穩定,難以生成有效的去噪圖像。

圖7 實驗數據a 模型數據; b 含有高斯隨機噪聲的模型數據

表1 消融實驗指標

表2 不同實驗結果的信噪比

2.2.2 模型數據驗證

為更好地驗證本文方法的有效性,在合成地震數據上添加25dB隨機噪聲,分別應用常規U-net、GLS-GAN方法和本文方法進行測試,對比不同方法的去噪結果。原始模型和含噪模型如圖8a和圖8b 所示,不同的去噪結果如圖8c至圖8e所示。

圖8 測試模型及不同方法的去噪結果(剖面)a 原始無噪模型; b 含噪模型; c 常規U-net方法結果; d GLS-GAN方法結果; e本文方法結果

由圖8可知,與含噪模型相比,不同方法去噪結果的信噪比提升明顯。其中,采用常規U-net方法得到的結果相對較差,淺層的層狀地層和中、深層的波狀地層中存在部分“斑狀”噪聲。采用GLS-GAN方法得到的剖面質量較好,但是剝蝕地層頂部信息和斷層區域斷點和斷面較為模糊。采用本文方法去噪后得到的結果在地層結構及層次性方面更清晰,斷面識別度高,邊緣細節效果保持更好,其去噪能力明顯優于其它方法。為進一步驗證本文方法的去噪能力,我們對利用不同方法去除的噪聲進行對比,如圖9所示。

圖9 不同方法去除的噪聲剖面a 常規U-net方法結果; b GLS-GAN方法結果; c 本文方法結果

由圖9可以看到,利用常規U-net方法和GLS-GAN方法去除的噪聲中存在部分地層有效反射信息,利用本文方法去除的噪聲中地層有效反射信息最少,大部分為雜亂無規律的噪聲,證實本文方法去噪能力強,對地震有效反射信息保護較好。

2.3 實際地震數據測試

為進一步驗證本文方法對實際地震數據的去噪效果,利用南海北部某工區實際地震數據進行測試,該工區地質構造復雜,存在多種類型的斷層,地層產狀多樣,且因地震采集受到相關條件的影響,地震數據中存在隨機噪聲,影響了地層和斷層等地質結構信息的識別判斷。為提升該工區地震數據的質量,采用不同方法去除噪聲并進行對比,不同方法的去噪結果和去除的噪聲如圖10至圖13所示。

圖10 原始數據和不同方法的去噪結果(剖面)a 原始地震數據; b 常規U-net方法結果; c GLS-GAN方法結果; d 本文方法結果

由圖10可知,3種方法去噪結果均能改善原始含噪地震剖面的質量,但是不同方法去噪結果差異明顯。常規U-net神經網絡的去噪結果中,地層反射同相軸邊緣連續性較差,存在“鋸齒”和“階梯”狀現象,部分區域甚至出現虛假斷層。利用GLS-GAN方法和本文方法得到的結果相對較好,地層反射連續性好,識別能力強。利用本文方法得到的結果中地層反射同相軸連續性好,邊界和斷面識別效果更勝一籌,證明本文方法去噪能力優于另外兩種方法的去噪能力。為進一步驗證不同方法對于有效信息的保護情況,對不同方法去除的噪聲剖面進行了對比,具體結果如圖11 所示。

圖11 不同方法去除的噪聲(剖面)a 常規U-net方法去除的噪聲; b GLS-GAN方法去除的噪聲; c 本文方法去除的噪聲

由圖11可知,常規U-net方法和GLS-GAN方法去除的噪聲中均不同程度地存在地層和斷面的有效反射信息,GLS-GAN方法去除的噪聲中有效信息相對較少。本文方法去除的噪聲中,幾乎看不見地層和斷層的有效反射信息,表明本文方法對有效信息保護更好。為更好地展示不同方法的去噪結果,我們對比了不同去噪結果的時間切片,如圖12所示。

圖12 不同方法的去噪結果(時間切片)a 常規U-net方法結果; b GLS-GAN方法結果; c 本文方法結果

從圖12可以看出,常規U-net方法去噪結果中,地質結構的邊緣有效信息呈現“鋸齒”狀特征,細節不夠連續光滑。GLS-GAN方法去噪結果中,部分區域存在“線性”噪聲。本文方法去噪結果中地層反射的邊緣信息平滑,地質結構識別清晰度高,同相軸連續性好。不同方法對地震有效信息的保護情況,如圖13 所示。

圖13 不同方法去除的噪聲(時間切片)a 常規U-net方法去除的噪聲; b GLS-GAN方法去除的噪聲; c 本文方法去除的噪聲

由圖13可知,不同的去噪方法均能去除一定的噪聲,但是去除的噪聲均存在一定量的有效反射信息,表明各種方法對于地層有效反射信息均存在不同程度的損傷。相比較而言,利用本文方法去除的噪聲中地層有效信息最少,證明本文方法的去噪效果最佳,對有效信息保護得最好。

3 結論

1) 針對常規生成式對抗神經網絡在開展地震數據去噪中存在的去噪效果差、神經網絡不穩定問題,對其中的神經網絡模型結構以及損失函數進行了優化,設計了一種神經網絡層次更深的生成器模型和多尺度判別器模型,從而有效提升了去噪神經網絡對于地震數據細節的保護能力。

2) 經理論模型和實際地震數據驗證,改進后的生成式對抗神經網絡在面對復雜噪聲時具備很好的去噪能力,表明本文方法對于地質結構有效信息保護較好,可以在地震數據去噪處理中推廣應用。

猜你喜歡
損失噪聲神經網絡
胖胖損失了多少元
噪聲可退化且依賴于狀態和分布的平均場博弈
神經網絡抑制無線通信干擾探究
玉米抽穗前倒伏怎么辦?怎么減少損失?
控制噪聲有妙法
基于神經網絡的拉矯機控制模型建立
復數神經網絡在基于WiFi的室內LBS應用
一般自由碰撞的最大動能損失
損失
基于支持向量機回歸和RBF神經網絡的PID整定
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合