?

基于多級殘差注意力的X-ray圖像超分辨率重建

2023-11-02 12:36張建波劉佳琦
計算機應用與軟件 2023年10期
關鍵詞:基本塊特征提取殘差

張建波 楊 璐 劉佳琦 張 禎

1(天津理工大學天津市先進機電系統設計與智能控制重點實驗室 天津 300384)

2(機電工程國家級實驗教學示范中心(天津理工大學) 天津 300384)

3(天津醫科大學總醫院重癥醫學科 天津 300052)

0 引 言

醫學影像作為臨床醫學中發展最迅速的學科之一,從最初的X-ray到CT、MRI、CR等,醫學影像設備及技術在不斷地更新換代。由于我國醫療資源分布不均衡,多數基層醫院及鄉鎮醫院只具備X-ray影像設備,通常情況下均使用X-ray來完成日常體檢以及各種肺部疾病的前期檢查。但是在X-ray圖像采集過程中,受到成像設備以及成像參數(輻射量)的影響,獲取的圖像分辨率往往有限。通過更新硬件設備來提升圖像分辨率不僅成本高、難度大,而且實用性不強。而超分辨率重建技術可以有效提升圖像質量,使醫生能夠更清晰地觀察到相關病灶的細節信息,為相應的診斷及診療方案的制定提供便利。

超分辨率重建技術[1-3]旨在通過一幅或者多幅低分辨率的圖像恢復出高分辨率圖像[4-6],在醫學影像、視頻復原、軍事偵察等多個領域已得到了廣泛的應用?,F有超分辨率方法主要分為基于插值[7]、基于重建[8]和基于學習[9]的方法。最常見的基于插值的超分辨率重建方法包括雙線性插值和雙三次線性插值,但經過插值獲得的超分辨率圖像往往過于平滑,容易在邊緣處理上因丟失高頻信息而出現細節模糊以及鋸齒問題?;谥亟ǖ姆椒ㄍǔ@枚鄮瑘D像及先驗知識約束解空間進而完成圖像的超分辨率重建,相對于插值方法的重建效果有一定改善,但是對配準算法和先驗知識依賴性過高。通過學習高低分辨率圖像之間非線性映射關系完成圖像重建是目前主流的基于學習的重建方法,常見方法有Yang等[10]提出的稀疏編碼方法、Chang等[11]提出的鄰域嵌入法、Timofte等[12]提出的鄰域回歸法(ANR)等。Dong等[13]首次利用卷積構造出包含特征提取、非線性映射、重建模塊的卷積神經網絡SRCNN實現高效的圖像的超分辨率重建,其計算復雜度低,且能夠在保證高質量圖像的同時完成圖像快速重建。自SRCNN提出后,基于CNN的圖像超分辨率算法逐漸成為主流圖像重建方法。隨著神經網絡的不斷深入研究,學者們陸續提出了FSRCNN[14]、VDSR[15]、D-DBPN[16]等超分辨率重建算法,并在自然圖像超分辨率重建上取得了較好的效果。

雖然深度學習與超分辨率的結合在自然圖像上獲得了良好的重建效果[17],但是在語義簡單且結構較為固定的肺部X-ray醫學圖像重建上仍存在特征提取時大量高頻信息的丟失導致的重建圖像邊緣不清晰以及細節模糊等問題。針對上述問題,提出一種基于多級殘差通道注意力的X-ray圖像超分辨率重建方法。主要貢獻歸納如下:

(1) 提出一種超分辨率重建方法MRAN(Multistage Residual Attention Network)。以殘差神經網絡為基礎框架,去除原殘差塊中批歸一化層并嵌入通道注意力機制,構造模型基本塊,自適應地校正各信道的特征響應,強化肺部器官圖像的紋理細節特征;利用多級殘差學習逐步簡化信息流,加速網絡訓練;設計多尺度融合模塊進行特征提取,進而獲取圖像更加完整的結構信息;使用Bicubic生成圖像與亞像素卷積圖像融合,彌補信息提取時造成的特征損失,完成最終圖像的超分辨率重建。

(2) 將提出的MRAN應用于肺部X-ray圖像的超分辨率重建,實驗結果表明,該方法取得了更高的PSNR和SSIM值,并且重建出的肺部圖像邊緣清晰、紋理豐富,更接近真實圖像。

1 相關工作

1.1 殘差學習

隨著CNN的不斷發展,學者們發現網絡層次是影響網絡性能的重要因素之一,網絡的深度越深,模型的性能就會越好。因此學者們對于網絡的設計更趨向于不斷加深網絡層次,以獲取更高的評價指標值。這不僅加大了網絡計算量和內存開銷,還帶來了梯度消失以及模型退化等問題。針對上述問題,He等[18]提出了ResNet模型,并且在模型中提出了殘差學習的思想,通過添加跳躍連接(Skip Connection)的方式,保證信息實現更好的回傳,加快網絡的收斂速度。殘差學習結構如圖1所示。

圖1 殘差學習結構

殘差學習將原先學習恒等映射φ(x)=x的任務轉化為學習輸入與輸出之間的殘差F(x)。相對于擬合恒等變化關系,擬合殘差更加容易,這可以使學習任務變得更加輕松。在網絡的反向傳播中,通過添加跳躍連接使得各網絡層之間梯度信息能夠更好地傳遞,有效地緩解了梯度消失和網絡退化問題。本文將進一步改進原始殘差塊,以殘差學習方式簡化學習過程,并以多級嵌套方式逐步添加跳躍連接,進一步簡化信息流,加速網絡的收斂速度。

1.2 通道注意力機制

近年來,由于注意力機制在建模全局依賴關系[19]以及降低無關圖像域特征信息[20]方面表現出的良好性能,被廣泛用于深度神經網絡之中。通道注意力機制通過使用不同的激勵權重對各個通道進行激勵,使網絡更加關注于高頻信道特征,達到加速網絡收斂和提升網絡性能的目的。Hu等[21]提出的SENet表明在神經網絡中,不同通道的卷積核所提取到的特征圖是不同的,其對于超分辨率重建中恢復高頻細節信息的重要程度也是不一樣的。若在網絡中同等處理各信道特征,會導致網絡在處理高低頻信息時缺乏靈活性,難以充分利用上下文信息進行有效的特征學習。

如圖2所示,通道注意力機制主要由擠壓、激勵、注意力三部分組成。該模塊首先對輸入圖像進行全局平均池化,完成各通道像素值的壓縮,獲取逐通道統計z∈RC,然后通過兩個卷積層學習各個通道的激勵權重,最后將激勵權重與各通道像素進行Hadamard乘積實現對不同特征通道的調節,得到最終輸出。具體實現如下:

圖2 通道注意力機制

(1)

S=σ(W2δ(W1z))

(2)

Uc=Sc×Uc

(3)

式中:zc為z的第c個元素;Hsq表示特征壓縮操作;uc(i,j)為特征圖的第c個通道(i,j)位置的像素值;σ和δ分別表示Sigmoid和ReLU激活函數;W1和W2分別為激勵權重。網絡通過通道注意機制自適應的校正各個信道的特征響應,強化高頻信息通道,利于超分辨率圖像邊緣細節的重建。對于肺部X-ray圖像而言,其紋理細節特征對疾病的分類診斷尤為重要,因此本文將通道注意力機制嵌入到殘差塊中構成網絡基本塊,在保證強化高頻信道特征的同時,加速網絡收斂,進一步提高網絡的性能。

2 方法設計

本文設計的X-ray圖像超分辨率重建網絡MRAN主要由三部分構成:特征提取模塊、基于特征融合的通道注意力信息提取模塊、重建模塊。網絡的整體架構如圖3所示。

圖3 MRAN網絡整體結構

2.1 特征提取模塊

特征提取模塊用于從ILR中提取特征,該模塊由雙層3×3卷積構成,特征維度均為64。ILR為原始輸入,由IHR經圖像退化得到,特征F-1、F0的提取過程通過式(4)-式(5)實現。

F-1=Hconv(ILR)=σ(W-1×ILR+B-1)

(4)

F0=Hconv(F-1)=σ(W0×F-1+B0)

(5)

式中:W表示權重矩陣;B表示偏置項;σ表示非線性ReLU激活函數。相較于SRResnet以及EDSR等模型使用單層卷積完成特征提取,雙層卷積提取的特征更加精細,能較好地抑制卷積層在進行特征提取時特征的丟失問題。

2.2 基于特征融合的通道注意力信息提取模塊

信息提取模塊將對特征提取模塊傳入的特征圖進行深度特征提取和殘差信息學習,該模塊由多尺度特征融合模塊和多級殘差注意力基本塊構成,FLF的提取過程由式(6)實現。

FLF=HDF(F0)

(6)

式中:F0為特征提取塊提取到的特征;HDF為信息提取操作。經過信息提取模塊進行信息充分提取后,獲取的信息FLF經過全局殘差學習得到特征FGF,FGF將用于最終高分辨率圖像的重建。

2.2.1多尺度特征融合模塊

在深層提取圖像特征的過程中,各種特征信息往往是不同尺度的,但目前多數網絡都是用單一卷積核來實現特征提取,這往往會導致信息提取過程中結構信息的缺失。本文對Inception結構[22]進行改進,使用不同大小的卷積核通過并行路徑完成特征提取后進行特征融合,以此來獲取圖像更加完整的結構信息。本文設計的多尺度特征融合模塊如圖4所示。

圖4 多尺度信息融合模塊

在多尺度信息融合模塊中,對于上層輸出的特征,通過三種不同的卷積路線進行特征提取,其中以兩個3×3卷積核替代5×5卷積核,在保證感受野相同的前提下,減少模型參數量。各卷積路線的輸出特征維數分別為32、48、32,然后使用concat層進行特征信息融合。concat層按通道維度對各卷積路線的輸出特征進行疊加,例如上述三條卷積路線共包含112個卷積層,則經過concat層后的輸出可由式(7)獲得。

(7)

式中:W表示權重矩陣;B表示偏置項;σ表示非線性ReLU激活函數,經過拼接后輸出的特征圖通道維數變為112維。最后,在保持concat層所有特征的前提下,使用1×1卷積核完成特征降維,從而縮減多尺度特征圖的數量,進一步減少網絡的參數數量。

2.2.2基于殘差注意力機制的基本塊

基礎塊是網絡架構中的基本組成單元,也是圖像超分辨率重建任務中重要的非線性特征映射模塊,它直接影響圖像的重建效果。本文以殘差網絡為基礎實現網絡架構搭建,刪減原殘差塊中影響高頻信息表達的批歸一化層,嵌入利于高頻信息提取的注意力機制模塊,完成模型基本塊RCAB(Residual Channel Attention Block)的構建。模型基本塊RCAB如圖5所示。

圖5 基本塊RCAB

RCAB基本塊中將上層輸入使用兩個連續的3×3卷積核進行特征信息提取后,輸入到通道注意力模塊中,對各個通道進行不同的權重激勵,獲取特征Fd,LF?;A塊通過通道注意力機制使網絡強化高頻信道特征,有利于圖像細節的重建。使用殘差結構完成實現Fd,LF與Fd-1的連接以獲取輸出Fd,進一步改善信息流,提升了網絡表達能力。Fd獲取過程由式(8)實現。

Fd=Fd-1+Fd,LF

(8)

如圖3中虛線框所示,將6個RCAB基本塊以多級嵌套方式進行殘差連接,構成一個中級殘差注意力模塊。每個RCAB基本塊的輸出都將作為后續基本塊的輸入,并且后續RCAB基本塊通過多級殘差連接實現圖像特征的復用,在每個中級殘差注意力模塊末端添加卷積層,進一步實現各級特征融合后的特征整合。網絡中共設置了10個中級模塊,每個中級塊的輸出將通過跳躍連接進行有效前傳,使得所有塊的輸出都得到充分利用。

考慮到輸入圖像與輸出圖像具有較高的相似性,引入全局殘差學習來解決網絡難以收斂問題。各個中級模塊的輸出特征最終融合后使用卷積層進行特征整合,并與全局特征進行殘差學習,減少網絡冗余,進而獲得用于最終重建的特征FGF。

2.3 重建模塊

重建模塊利用網絡學習到的各層次特征,重建生成最終的高分辨率圖像ISR。首先,使用Upsampler模塊實現低分辨率到高分辨率的非線性映射,完成高分辨率圖像Frec1的獲取。本文的Upsampler模塊是由亞像素卷積和3×3卷積層構成,通過從低分辨率到高分辨率的非線性映射實現圖像超分辨率的重建。網絡在進行特征學習時不可避免地存在一定程度上的特征損失。為彌補該損失,本文采用雙三次線性插值方法對原始圖片進行插值,生成高分辨率圖像Frec2。最后,將所獲得的兩幅圖片進行像素加法,獲得最終的輸出ISR。

2.4 損失函數

在MRAN模型訓練中,優化網絡的損失函數是整個網絡模型的調度中心。本文采用均方誤差(MSE)作為衡量模型輸出的ISR與真實圖像IHR之間差異的損失函數[23],如式(9)所示。

(9)

式中:L(θ)代表均方誤差損失;F(Yi;θ)和Xi分別代表重建后的高分辨率圖像ISR和原始高分辨率圖像IHR;n代表訓練樣本總數目。在網絡訓練中,通過不斷計算ISR和IHR之間差異,持續更新各層網絡參數θ=(W1,W2,…,B1,B2,B3,…),最終獲取最佳的網絡參數模型。

3 實驗分析與結果

本文使用Ubuntu系統,并在該系統下利用PyTorch框架進行模型搭建。服務器配置為NVIDA RTX 2080 Ti×2,軟件配置為Cuda 9.2。在網絡訓練中,設置batch_size為8,初始學習率為1E-4,采用Adam算法[24]作為模型優化算法,設置每200個epoch時將學習率減半,保證模型在逐步迭代中達到最優。

3.1 數據集

使用兩種不同的數據集進行實驗仿真。第一種是美國蒙哥馬利縣公開的Montgomery County X-ray Set數據集,從中選取120幅紋理豐富、清晰度高的X-ray圖像作為訓練集的HR圖像,使用圖像退化獲取LR-HR圖像對用于網絡訓練,將剩余的18幅圖像作為測試集,用于模型重建效果的測試。第二種是由NIH發布的Chest X-ray14數據集,包含十四種常見肺部疾病的X-ray圖像,共計112 120幅。從中隨機選取520幅圖像,并以不同分辨率的圖像對各個模型的重建效果進行測試,以此來充分驗證模型的魯棒性與泛化能力。

在模型訓練中,為防止因訓練數據集圖像較少可能帶來的模型過擬合問題,采用三種方法對訓練集進行數據增強:(1) 圖像旋轉,旋轉角度為90°、270°;(2) 圖像翻轉,將圖像進行上下翻轉和左右翻轉;(3) 圖片縮放,縮放比例為0.9、0.7。

3.2 量化指標

本文采用峰值信噪比(PSNR)和結構相似度(SSIM)作為量化指標,來客觀衡量各圖像超分辨率方法的重建性能。其中,PSNR是一種最常見的基于像素間誤差靈敏度的圖像客觀評價指標[25]。而SSIM將失真建模為亮度、對比度、結構的組合,進而客觀衡量ISR和IHR的相似度。本文采用這兩種指標(式(11)-式(12))在YCbCr顏色空間的Y通道上評估模型重建圖像的質量。

(10)

(11)

(12)

式中:MSE代表均方誤差;H和W分別代表圖像的高和寬;μ和σ分別代表兩幅圖像的均值與方差。PSNR與SSIM可以客觀反映出重建圖像相對于原始圖像的失真程度,其數值越大,表明失真越小。通過計算各個模型在同一測試集上的平均評價指標值,可以客觀地衡量各網絡模型的超分辨率重建性能。

3.3 實驗對比

為更好地評估網絡性能,在同一臺服務器上使用×2的拉伸倍數,將本文設計的MRAN網絡與Bicubic、SRCNN、VDSR、LapSRN四種超分辨率重建方法進行比較。SRCNN具有三層卷積層網絡結構,以雙三次線性插值圖像作為網絡輸入;VDSR在結合殘差學習思想基礎上,將網絡層次增加至20層;LapSRN模型在網絡中融入了拉普拉斯金字塔模型的思想,以搭建的24層網絡實現圖像的超分辨率重建。在對比實驗的實現過程中,使用MATLAB interp2函數實現Bicubic方法,其余對比模型均根據相關作者的開源代碼實現。

本文提出的MRAN模型相對于SRCNN以及VDSR等算法具有更深的網絡層次,模型的復雜度更高。在少量增加模型參數的同時,使得模型性能得到較大的改善。MRAN模型可以實現端到端的模型訓練,完成圖像的快速重建,完全滿足醫學圖像超分辨率重建對速度的要求。圖6展示了網絡訓練過程中各模型的量化指標增長曲線,MRAN模型在逐步迭代訓練過程中,能夠在最短的時間內實現模型收斂,并且獲得了更高的PSNR量化指標值。

圖6 各模型的PSNR值隨迭代次數增長曲線

表1展示了各模型在不同測試數據集上的平均量化指標值??梢钥闯?傳統方法Bicubic重建出的超分辨率圖像的評價指標值最低,而其余對比模型較于Bicubic都有了不同程度的提高。值得注意的是,本文提出的MRAN模型在PSNR和SSIM兩個量化指標上,均超過了幾種對比的超分辨率模型。充分說明,MRAN模型性能相較于其他模型有了一定的提升。

表1 不同測試集上各模型的平均量化指標值

為更加直觀地說明各模型的超分辨率重建效果,使用各個模型對Montgomery County X-ray Set數據集中同一圖像進行超分辨率重建,重建效果如圖7所示??梢钥闯?圖7(b)的重建效果最為模糊,而圖7(c)雖然在一定程度上提升了模型的清晰度,但是邊緣輪廓仍然不清晰,對于圖像細節的重建效果不佳。圖7(d)和圖7(e)分別為VDSR和LapSRN兩種算法重建出的高分辨率圖像,其整體重建效果較為清晰,在邊緣細節上也展現了良好的連續性,但是可能出現棋盤格子偽影現象。圖像的超分辨率重建效果不佳,很大程度上是由于圖像重建過程中對高頻信息利用不足導致的。本文提出的MRAN算法模型能有效地提取LR空間中更多的有用特征,增強網絡對高頻信道的關注度,進而實現更好的重建效果。圖7(f)是MRAN模型重建出的高分辨率圖像,優于其他網絡的重建圖像,具有清晰的邊緣和紋理細節,更加逼近真實的高分辨率圖像。

圖8和圖9展示了各個模型在Chest X-ray14測試集上的重建效果??梢钥闯?本文提出的MRAN模型在不同像素的圖像上獲得了與Montgomery County X-ray Set測試集相近的重建效果。并且,重建效果均優于其他模型,更加接近真實的高分辨率圖像,充分證明MRAN模型具有較高的魯棒性和泛化能力。

(a) Original (b) Bicubic (c) SRCNN

(a) Original (b) Bicubic (c) SRCNN

4 結 語

本文提出一種基于多級殘差注意力的X-ray圖像超分辨率算法模型MRAN。通過使用注意力機制來改進原始殘差塊,構建模型基本塊RCAB,在優化模型收斂的同時,使網絡更加關注充滿邊緣細節的高頻信道特征,進一步提升網絡對于圖像邊緣細節的重建效果;使用多尺度特征融合模塊,將不同卷積核提取的多尺度特征進行融合,更好地實現圖像結構信息的完整提取;以多級嵌套方式進行殘差學習,并使用卷積層對各基本塊輸出進行特征調和,加速網絡收斂,進一步提升網絡性能;將亞像素卷積圖像和Bicubic生成圖像進行融合,彌補特征提取過程中的特征損失,最終完成圖像的超分辨率重建。實驗證明,本文設計的模型在PSNR和SSIM上都有較大程度的提升,且重建出的圖像細節更加清晰豐富,能夠更好地幫助醫生發現病變部位,從而提升診斷準確率。在未來的工作中,將針對圖像的多尺度超分辨率重建進行研究。

猜你喜歡
基本塊特征提取殘差
基于雙向GRU與殘差擬合的車輛跟馳建模
基于級聯森林的控制流錯誤檢測優化算法
距離與權重相結合的導向式灰盒模糊測試方法
基于殘差學習的自適應無人機目標跟蹤算法
一種檢測控制流錯誤的多層分段標簽方法
基于遞歸殘差網絡的圖像超分辨率重建
基于Daubechies(dbN)的飛行器音頻特征提取
Bagging RCSP腦電特征提取算法
平穩自相關過程的殘差累積和控制圖
基于MED和循環域解調的多故障特征提取
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合