?

基于級聯網絡的肝臟腫瘤CT 圖像分割

2024-04-01 06:41莫亞霓陳曉婕張本鑫
電視技術 2024年1期
關鍵詞:級聯注意力卷積

莫亞霓,陳曉婕,張本鑫

(1.桂林電子科技大學 數學與計算科學學院,廣西 桂林 541004;2.桂林電子科技大學 計算機與信息安全學院,廣西 桂林 541004;3.桂林電子科技大學 電子工程與自動化學院,廣西 桂林 541004)

0 引言

肝癌是一種常見且致命的腫瘤,嚴重威脅人們的生命健康。計算機斷層掃描成像(Computed Tomography,CT)具有快速掃描和高分辨率的優點,目前被廣泛用于肝臟病變診斷。然而,目前臨床上對肝臟腫瘤的分割通常需要經驗豐富的醫生手動繪制輪廓,這是一項耗時且煩瑣的任務。而且,同一患者的肝臟CT 圖像在不同醫生標記下可能會導致不一致的結果,分割的準確性嚴重依賴醫生的經驗和技能。因此,研究精確且高效的肝臟腫瘤自動分割方法對于肝癌的臨床診斷和治療具有重要意義。

為進一步提高肝臟腫瘤分割的精度,實現既能相對完整地分割體積較大的腫瘤,又能檢測出體積較小的腫瘤,本文提出一種基于級聯網絡的CT 圖像肝臟腫瘤分割網絡MCPUNet。該網絡以殘差UNet 網絡作為骨架,解決因網絡過深而出現的梯度彌散問題,在此基礎上加入混合深度可分離卷積模塊(MDconv Block)并嵌入坐標注意力機制(Coordinate Attention,CA)?;旌仙疃染矸e(MDconv)通過使用不同尺寸的卷積核在不同的通道上進行運算,將多尺度的卷積核融合到一個單獨的卷積操作中,從而捕獲不同分辨率的特征模式,實現對邊緣細節以及更深層的小目標特征的提取。坐標注意力機制能夠捕獲跨通道的信息,使得模型能夠更精準地定位并識別病變區域。此外,MCPUNet 采用級聯操作來解決數據不平衡的問題,特別是當腫瘤在整個CT 圖像中所占比例較小時可以更好地處理不同大小和位置的腫瘤。提出的模型在公共數據集LiTS 驗證了肝臟腫瘤分割任務上的有效性。

1 相關工作

1.1 醫學圖像分割

近年來,深度學習技術迅速發展并在醫學圖像分割中得到廣泛應用。全卷積網絡(Fully Convolutional Network,FCN)[1]通過端到端實現對醫學圖像進行像素級分類,解決了語義級別的圖像分割問題。U 形卷積網絡(UNet)[2]首次引入了跳躍連接,通過編碼-解碼操作實現圖像的語義分割。編碼器用于下采樣提取特征以捕捉圖像的上下文信息,解碼器則用于上采樣,精確定位分割區域。LI等人提出的瓶頸監督UNet 模型(BS-UNet)[3]采用混合的緊密連接結構,充分利用網絡各層之間的信息進行分割。SCHLEMPER J 等人將注意力機制融入UNet 網絡,提出了A-UNet(Attention UNet)模型[4],能夠自動學習與分割任務相關的區域特征并抑制不相關特征。UNet及其各種變體網絡不斷涌現??傮w而言,UNet 及其變體網絡是廣泛應用于醫學圖像分割的強大深度學習模型。

1.2 注意力機制

本文通過使用坐標注意力機制CA[5]來提高網絡對醫學圖像的分割性能。CA 是一種高效的注意力機制,能夠將橫向和縱向的位置信息嵌入通道注意力中,使得移動網絡能夠有效地關注大范圍的位置信息,同時保持較低的計算復雜性。與傳統的注意力機制相比,CA 不僅關注通道間的信息,而且考慮了方向相關的位置信息,從而有助于模型更精準地定位和識別目標。

2 方法

本文提出的級聯肝臟腫瘤分割網絡MCPUNet的結構如圖1 所示。CT 圖像中,肝臟腫瘤通常具有對比度低、邊界模糊、形狀不規則和位置不固定等特點,直接采用端到端的網絡模型難以準確識別腫瘤組織[6]。針對這個問題,本文提出一種級聯肝臟腫瘤分割網絡MCPUNet,采用級聯的方式自動提取CT 圖像中肝臟區域。該網絡架構主要由肝臟分割網絡和肝臟腫瘤分割網絡兩部分組成。肝臟分割網絡和腫瘤分割網絡的結構完全相同。肝臟分割網絡先從CT 圖像中分割肝臟,提取出腫瘤感興趣區域(Region of Interest,ROI),再將該區域作為腫瘤分割網絡的輸入,進一步實現對腫瘤的精準分割。

圖1 MCPUNet 網絡結構

2.1 肝臟分割

肝臟分割網絡用于提取CT圖像中的肝臟區域。該網絡整體采用編碼-解碼架構,并以殘差網絡作為基本骨架。編碼器用于提取圖像的多尺度特征并獲取上下文信息,解碼器用于上采樣從而精準地定位肝臟區域。由于肝臟分割網絡和腫瘤分割網絡結構完全相同,有關網絡的詳細結構將在腫瘤分割部分中重點描述。使用預處理后的CT 切片輸入肝臟分割網絡,得到肝臟的掩膜圖,將輸入的CT 切片與肝臟掩膜綜合處理,僅保留肝臟區域的原始圖像,以該肝臟區域作為ROI 進行下一步的腫瘤分割。

2.2 腫瘤分割

盡管肝臟腫瘤與正常肝臟組織在密度上存在差異,但與腹部其他器官組織相比,它們的密度非常接近,導致在直接使用網絡對腫瘤進行分割時,其他組織的干擾使得分割結果難以達到理想效果。因此在原始的CT 切片上只保留肝臟區域的像素,將其他腹部器官的影響降到最低。

經過肝臟分割網絡得到的肝臟區域作為腫瘤分割網絡的輸入。腫瘤分割網絡由編碼器和解碼器構成,其中編碼器由5 個MDB(MDconv Block)和4 個混合池化模塊MP(Mixing Pooling)構成,MDB用于提取圖像特征,MP 用于下采樣降低圖像的分辨率。經過MDB 后特征圖的通道數依次為64、128、256、512、1 024,經過MP 后特征圖的通道數依次為128、256、512、1 024,輸入網絡的特征圖經過第一個MDB 的通道數由3 升至64。解碼器由4 個上采樣結構Up Sample 和4 個殘差注意力機制模塊RAB(Residual Attention Block)構成。在上采樣結構中,采用雙線性插值擴充圖像尺寸,并將擴充后的特征圖與編碼路徑中對應的特征圖進行拼接,達到更好的特征重建效果。4 個經過Up Sample的特征圖通道數分別為1 536、768、384、192,4 個經過RAB 的特征圖通道數依次為512、256、128、64,經過最后一個RA-Block 輸出的特征圖再通過1×1 卷積將腫瘤分割的結果進行輸出。

原始UNet 網絡中的卷積感受野范圍有限,導致網絡提取的高分辨率肝臟邊緣及腫瘤的圖像特征不足。對于此問題,本文將混合深度可分離卷積加入MDB?;旌仙疃瓤煞蛛x卷積對通道進行分組,利用不同尺寸的卷積核進行卷積,從而獲取混合的感受野,同時捕獲高分辨率特征和低分辨率特征。本文將輸入的圖像的通道均勻分成4 組,分別使用{3×3,5×5,7×7,9×9}的卷積核進行卷積,最后將卷積后的4 張特征圖進行拼接。在MDB 結構中,對于輸入的特征圖先進行3×3 卷積操作,再進行混合深度可分離卷積操作得到特征圖F1。與此同時,輸入的特征圖再經過1×1 卷積和坐標注意力機制,生成特征圖F2。最后將F1 和F2 相加,并使用批歸一化和非線性激活函數PReLU 以更好地優化網絡訓練。

3 實驗及結果分析

3.1 實驗配置及參數設置

本實驗硬件平臺為1 塊Tesla V100 圖形處理器(Graphics Processing Unit,GPU),共32 GB 顯存,Gold Intel 處理器,共24 核。軟件環境是Ubuntu 16.04、Python 3.7.4,深度學習框架是PaddlePaddle 2.4.0,Gcc 版本為7.3.0。肝臟分割網絡訓練60 個epoch,腫瘤分割網絡訓練50 個epoch,在腫瘤分割過程中使用翻轉裁剪、隨機旋轉和隨機填充裁剪進行數據增強。

3.2 對比實驗

不同網絡在進行肝臟腫瘤分割時,交并比(Intersection over Union,IoU)、準確度和召回率指標的性能如表1 所示。

表1 不同網絡進行肝臟分割的定量指標性能對比

從表1 可以看出,所提模型相對于原始的UNet在IoU、準確度和召回率指標上分別提高了3.8%、2.5%和2.0%,相對于Topformer 分別提升了17.2%、10.3%和12.3%,在肝臟腫瘤分割任務上的整體表現優于其他網絡,對腫瘤的分割更加精準,對于肝癌的診斷和治療具有重要的參考價值。

4 結語

本文提出了一種基于級聯網絡的CT 圖像肝臟腫瘤分割模型MCPUNet,在編碼路徑上設計了MDB 和MP 以提取圖像的多尺度特征,捕獲上下文信息;在解碼路徑上引入殘差注意力模塊RAB,加快網絡的收斂速度,使模型重點關注感興趣區域,抑制冗余特征。為了排除其他器官對肝臟腫瘤分割的干擾,模型使用了級聯架構。實驗結果表明,與UNet 等先進的醫學圖像分割網絡相比,本文方法整體表現較優,在肝臟腫瘤分割任務上獲得了較好的效果,具有很強的健壯性。

猜你喜歡
級聯注意力卷積
讓注意力“飛”回來
基于3D-Winograd的快速卷積算法設計及FPGA實現
從濾波器理解卷積
基于傅里葉域卷積表示的目標跟蹤算法
“揚眼”APP:讓注意力“變現”
級聯LDPC碼的STBC-OFDM系統
A Beautiful Way Of Looking At Things
基于級聯MUSIC的面陣中的二維DOA估計算法
LCL濾波器在6kV級聯STATCOM中的應用
H橋級聯型STATCOM的控制策略研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合