?

基于改進YOLOv5s的乳腺癌有絲分裂病理圖像檢測

2024-04-18 06:00劉雅楠李靖宇郝利國趙添羽鄒鶴孟洪顏許東濱董靜
中國醫療器械信息 2024年5期
關鍵詞:注意力卷積病理

劉雅楠 李靖宇 郝利國 趙添羽 鄒鶴 孟洪顏 許東濱 董靜

1 齊齊哈爾醫學院醫學技術學院 (黑龍江 齊齊哈爾 161006)

2 齊齊哈爾大學通信與電子工程學院 (黑龍江 齊齊哈爾 161006)

3 齊齊哈爾醫學院基礎學院 (黑龍江 齊齊哈爾 161006)

內容提要:乳腺癌病理圖像的有絲分裂結果過程中,由于形態相近的細胞存在干擾,有絲分裂細胞目標小,難以分割標記,從而限制乳腺癌分級診療效率和準確性。因此,提出了一種基于改進YOLOv5s的乳腺癌病理圖像檢測算法。在骨干網絡中加入Transformer結構,增強對圖像小目標的檢測能力。并通過引入ACMix結構,融合圖像特征,提高檢測性能,強化卷積神經網絡對小目標的注意力機制。在檢測頭部分添加SK-attention,確保捕捉小目標的準確度。結果顯示,改進的YOLOv5s的檢測性能較改進前傳統模型性能更加優秀,檢測準確率達97.12%,能較好識別乳腺癌病理圖像有絲分裂細胞,進而為后續診療提供決策依據。

乳腺癌較高的發病率和病死率對女性生命健康威脅較大,傳統病理診斷借助顯微鏡直接對病理切片進行檢查,借助醫師主觀經驗和手動技術作出診斷。病理切片能較好地顯示乳腺癌細胞的形態和組織結構,在制作難易程度和貯存條件上都具有優勢,在臨床中發揮重要作用[1]。在癌癥病理診斷實際操作中,由于病理圖像中的細胞數目眾多,且細胞的形態相似,醫師需較長時間能作出決策,且由于可能出現的疲勞觀察、主觀誤判現象,需要借助計算機技術輔助病理圖像檢測,而深度學習方法為自動檢測乳腺癌有絲分裂病理圖像提供了技術環境[2]?;趫D像特征提取方式,醫學圖像可分為傳統圖像自動提取和基于深度學習的提取。傳統的圖像自動提取主要憑借機器學習方法,需要手工提取特征,如Hog特征、Sobel邊緣檢測特征等,這類算法一方面需要手動提取圖像的紋理、形狀等特征,另一方面并不具備較強的泛化能力,特別是鑒于乳腺癌病理圖像細胞數目龐大,所需時間較長,提取效果不明顯[3-5]。

因此,基于深度學習的方法能解決手動提取圖像特征的問題,縮短提取時間,同時能獲得更多的有效特征[6]。深度學習已成為解決醫學圖像分類問題的首要手段。Joseph等提出YOLO(You Only Look Once)目標檢測模型,此類算法借鑒人的大腦識別特性進行目標檢測模型開發,表示人在對目標進行觀察時,只需看一下就可基本確定目標類型以及目標所在位置,并不按順序進行判斷識別。YOLO目標檢測算法原理是將圖像分為S×S形式的像素方格,然后對落在方格中心的目標進行檢測,從而實現對整張圖片所有目標區域的目標類別及概率預測,提升了檢測速度。但是,檢測精度有所下降。

為強化YOLO檢測性能,彌補YOLO目標檢測漏檢率高的問題,研究人員先后提出了單次多盒探測器(Single Shot Multi Box Detector,SSD),算法復雜性更小,精確度更高的YOLOv2及YOLOv3,但YOLOv3并沒有很好地解決YOLO系列在邊界框定位不夠準確的問題。YOLOv4整體增加了新的算法思想并對各個子結構優化改進,主要是通過測試數據集數量的增加實現優化目的。YOLOv5官方模型包括4個版本的檢測框架,讓人可以根據不同檢測目標的類型進行模型選擇,增加靈活性[7-9]。但是,目前結合知網查找相關文獻,利用YOLOv5進行乳腺癌病理圖像輔助診斷的研究較少。因此,研究改進YOLOv5網絡,發揮其在小目標檢測優勢,進而滿足乳腺癌有絲分裂病理圖像檢測的臨床需要。

1.乳腺癌有絲分裂病理圖像數據集

1.1 乳腺癌有絲分裂病理圖像特點

在乳腺癌診斷中對病理圖像進行分級的諾丁漢分級系統中的有絲分裂指標可以評價癌癥的侵襲性。通過病理切片進行有絲分裂的診斷并非易事,病理切片在制備過程中經由不同中心、不同設備制作最終呈現出染色結果會有較大差異[10]。除外部因素,有絲分裂現象是分為四個時期的復雜過程,前中后末四個時期各自特點不同各的特點。當有絲分裂處于末期時已經產生了兩個細胞核,但是還沒有分裂成兩個獨立的細胞時,這種情況只能計作一個有絲分裂。另外,切片中兩種細胞的類間差異較小。一些非有絲分裂細胞在形態等方面與有絲分裂細胞之間的相似性極高,給診斷造成了很大的困難。一些凋亡細胞與有絲分裂細胞會有很大的相似性,極易產生干擾性,這也是有絲分裂精確檢測的一大障礙。

1.2 乳腺癌有絲分裂病理圖像數據集

本文使用的數據集是ICPR14 競賽公開數據集,共有1696張圖像。每張病理圖像的大小為1539×1376像素,其中,訓練集和測試集的病理圖像的數量分別為1200張和496張。

2.檢測算法及改進模塊

2.1 YOLOv5s算法

YOLOv5s整體網絡結構如圖1所示,包括Backbone、Neck和Prediction 3個部分。其中Back bone網絡由Focus、CBL、CSP和SPPF模塊組成,承擔提取輸入圖像信息作用。Backbone網絡最后是SPPF(Spatial Pyramid Pooling-Fast)模塊,在增加感受野的同時提取圖片特征,SPPF相較于傳統算法具有更少的計算量和更快的運行速度。Neck網絡主要作用是實現對Backbone網絡中所提取的特征進行特征融合,進而形成能被檢測的目標信息。YOLOv5s的3個目標檢測頭分支,各自實現對乳腺癌有絲分裂細胞位置目標的小目標、中目標和大目標的檢測。

圖1.YOLOv5s的基本結構示意圖

2.2 YOLOv5s算法改進

為解決乳腺癌有絲分裂病理圖像檢測目標特征復雜、干擾細胞繁多,檢測時間長,檢測難度大的問題。

本文提出的適用于乳腺癌有絲分裂病理圖像的改進型YOLOv5s模型,如圖2所示,改進點包括:①在骨干網絡的最后添加ACMix模塊;②將CSP結構更改為Transformer結構;③在小目標檢測頭上添加SK-attention,加強對小目標的檢測能力。最終改進后的結構如圖2所示。

圖2.改進后YOLOv5s網絡模型

2.2.1 ACMix模塊

在骨干結構最后設計ACmix注意力模塊,旨在提高網絡對微小目標的敏感度,強化特征融合效果,便于最后提取結果。ACmix注意力模塊由卷積注意力和自注意力兩個模塊并行構建,如圖3所示,原理如下。先將H×W×C的特征通過3個1×1×C的卷積進行映射,分割為N個部分,得到3×N個尺寸為H×W×C/N的子特征。在上半部分(以K為內核的卷積路徑),網絡如同傳統的卷積注意力模塊,從局部感受野中抽取信息,子特征通過3N×K2N的全連接層,對生成的特征進行位移、融合和卷積處理,從而得到H×W×C/N的特征,共N組。而在下半部分(自注意路徑),網絡在全局信息的考量下,同時關注關鍵區域。3N個子特征對應的3個H×W×C/N尺寸的特征圖各自充當查詢、鍵和值的功能,嚴格遵從傳統的多頭自注意力模型。通過位移、聚合和卷積處理后,得到H×W×C的特征。接著,兩條路徑的輸出經過Concat操作,其強度由兩個學習的標量控制,如公式(1)所示。

圖3.ACmix模塊

兩個分支的輸出在合并之后,全局特征與局部特征得到了平衡的考慮,從而增強網絡對微小目標的識別能力。

2.2.2 替換CSP結構

CSP結構更改為Transformer結構,Transformer是一種基于注意力機制的網絡模型架構,最先應用于自然語言處理領域,并逐漸在計算機視覺領域中得到廣泛應用。Transformer在模塊上是基于編碼器和解碼器架構的,而編碼器和解碼器是由多個層構成。在編碼器和解碼器的結構中,編碼器負責提取特征,解碼器負責將提取到的特征轉化為結果。一個標準的Transformer編碼器由兩大部分組成:注意力層和全連接層,注意力層提取特征信息,由全連接層輸出所需結果。其基本結構如圖4所示。

圖4.Transformer編碼器結構

2.2.3 添加注意力機制

將SK-attention結構添加到小目標檢測頭上,能夠通過該機制顯著增強對小目標檢測能力。SK注意力機制中的SK是Selective Kernel的縮寫,表示選擇性融合不同尺度大小的卷積核。SK注意力機制結構如圖5所示,由Split、Fuse和Select 3部分組成。在Split部分分別對輸入圖像進行3×3和5×5的卷積操作,得到U1和U2兩個特征圖。Fuse是計算兩個卷積核權重的部分,將兩者的特征圖按元素求和,然后沿著H和W維度求平均值,得到一個C×1×1的一維向量,權重信息表示了各個通道信息的重要性。如公式(2)所示。

圖5.SK-attention機制

3.實驗結果分析

3.1 實驗評價指標

本文從準確率、召回率、平均精度(mean Average Precision,mAP)3個評價指標去衡量模型的性能,如公式(3)~(5)所示。

準確率(Precision):準確率表示正樣本被預測正確的實例占總正樣本預測個數的比例。見公式(3)。

其中:TP、FP分別表示正確預測的文本區域數、誤判的文本區域數。

召回率(Recall):召回率為正樣本被預測正確的實例占所有真實正樣本實例數量的比例。見公式(4)。

平均精度(mAP)是模型檢測精度的評價指標,它與準確率和召回率相關,AP(c)表示類別c的平均準確率,N(classes)表示多目標分類任務中類別的個數。見公式(5)。

3.2 實驗結果分析

選用Transformer、ACmix、SK-attention方法分別作為獨立的變量模塊,在相同的環境及訓練技巧的前提下,研究各個模塊在YOLOv5s網絡的改進效果。改進的模型對目標的預測置信度要高于未改進的模型。通過開展消融實驗,最終得到如表1的結果。

表1.消融實驗結果

由表1可看出,將SK-attention添加至檢測頭后模型的準確率P、召回率R、平均精度均值mAP均有所提升;加入ACmix后,模型加強了干擾目標區域檢測,增加了模型對干擾目標排除率;同時加入Transformer和ACmix模塊以及添加SK-attention后網絡檢測準確率進一步提高,提升了算法的穩定性。

4.小結與展望

本文提出了一種基于改進的YOLOv5s的乳腺癌有絲分裂病理圖像檢測方法,通過改變CSP結構為Transformer結構提升性能,增加ACMix模塊提升對圖像特征融合能力,在檢測頭特別是針對小目標的檢測頭添加SK-attention結構增強卷積能力,提升對目標圖片的檢測性能。經實驗,改進后的模型在檢測整體準確率、召回率、平均精度均值等方面均優于改進前。今后,將持續結合臨床應用實際情況不斷改進模型。

猜你喜歡
注意力卷積病理
讓注意力“飛”回來
基于3D-Winograd的快速卷積算法設計及FPGA實現
病理診斷是精準診斷和治療的“定海神針”
開展臨床病理“一對一”教學培養獨立行醫的病理醫生
從濾波器理解卷積
基于傅里葉域卷積表示的目標跟蹤算法
“揚眼”APP:讓注意力“變現”
A Beautiful Way Of Looking At Things
不一致性淋巴瘤1例及病理分析
一種基于卷積神經網絡的性別識別方法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合