?

單域泛化X-ray乳腺腫瘤檢測

2024-03-20 10:32史彩娟鄭遠帆任弼娟孔凡躍段昌鈺
中國圖象圖形學報 2024年3期
關鍵詞:實例特征性能

史彩娟,鄭遠帆,任弼娟,孔凡躍,段昌鈺

1.華北理工大學人工智能學院,唐山 063210;2.河北省工業智能感知重點實驗室,唐山 063210

0 引言

乳腺腫瘤成為女性患者中常見的癌癥類型。在臨床實踐中,乳腺腫瘤的病癥診斷主要由專業醫療從業人員完成,但由于病灶小及腺體組織的遮擋等,使得人工產生假陰性診斷(Marmot 等,2013),從而使患者錯過最佳治療時間?,F有很多研究使用醫學影像輔助診斷技術(computer-aided diagnosis,CAD)對乳腺腫瘤病灶進行檢測(Zhang 等,2022a;Kolchev等,2022;Aly 等,2021;Ibrokhimov 和Kang,2022)。此外,基于雙模態的乳腺分類方法(趙緒 等,2022)增強模型對噪聲樣本的抑制能力來提升分類精度,基于語義拉普拉斯金字塔的乳腺腫瘤分割模型(王黎 等,2021)有效融合不同尺度的語義特征來提升腫瘤的分割精度?,F有的大部分方法是基于全監督學習,首先將醫學圖像中的腫瘤人工標記出來,然后將標記的數據送入模型進行訓練。然而,人工標記腫瘤工作量巨大,且依賴醫生的臨床經驗,使得現有標注數據稀少,不能很好地滿足全監督學習的需要。

另外,由于噪聲影響,圖像數據分布存在不可知的域偏移,如圖1 所示,不能滿足全監督場景下訓練數據與測試數據分布一致的要求,導致基于全監督范式下的目標檢測模型性能受損(Chen等,2018)。

圖1 域偏移數據分布Fig.1 Data distribution of domain shift

目前緩解域偏移的方法主要有兩種,即域自適應方法(Li等,2020)和域泛化方法(Li等,2019)。域自適應方法的源域和目標域設定如圖2 所示,其中源域為正常天氣下的城市街道場景,目標域為霧天下的城市街道場景。近年域自適應目標檢測方法不斷涌現(Liu 等,2023;Zhao 和Wang,2022;Zhang 等,2022b;Li 等,2023),這些方法將源域與目標域在核空間上對齊以解決域差異,但其泛化能力受域偏移復雜度的影響(Liu等,2020)。

圖2 域自適應Fig.2 Domain adaptation((a)source domain;(b)target domain)

域泛化方法的訓練集和測試集的設定如圖3 所示,Li 等人(2021)和Zhou 等人(2023)在多個已知域進行訓練,提取域不變信息向未知域進行遷移,但是性能高度依賴于訓練集域數量(Choi 等,2021)。因此,面對醫學圖像有標注數據稀少的情況,這兩種方法均不能有效緩解域偏移問題。

圖3 域泛化Fig.3 Domain generalization((a)train-set;(b)test-set)

為了克服上述兩種方法的缺點,Volpi 等人(2018)提出了用于分類任務的單域泛化方法,僅需對單一域進行訓練然后泛化至目標域,其訓練集和測試集的設定如圖4所示。

圖4 單域泛化Fig.4 Single-domain generalization((a)train-set;(b)test-set)

單域泛化學習范式非常適合醫學圖像中域未知與數據量小的特點。受此啟發,本文擬將單域泛化引入到 X-ray 乳腺腫瘤檢測中,以緩解乳腺腫瘤圖像中的域偏移問題。本文單域泛化X-ray 乳腺腫瘤檢測的設定如圖5 所示,其中訓練集為不包含域偏移的原始圖像,測試集為引入域偏移后的圖像。

圖5 單域泛化X-ray乳腺腫瘤檢測Fig.5 Detection of breast tumor by single-domain generalization((a)train-set;(b)test-set)

然而,研究發現將單域泛化中常用的正則化與白化方法(switchable whitening,SW)(Pan 等,2019)直接引入到目標檢測模型將導致檢測性能降低(Wu和Deng,2022)。本文研究發現,基于分類的單域泛化采用的整體對齊方式并不適用于目標檢測任務。圖6 給出了特征空間樣本對齊的過程,其中紅色虛線表示域決策邊界,三角形與矩形表示樣本數據,顏色表示目標類別。圖6(a)為分類對齊范式,在分類任務中每幅圖像僅包含一個實例,直接對整體進行對齊即可。圖6(b)為目標檢測整體對齊范式,目標檢測任務由于目標的局部特性,且單一圖像中包含多個目標,采用整體對齊導致了域類別的錯誤匹配。為此,本文擬提出目標檢測實例對齊范式,如圖6(c)所示,以實例為對齊單位將正則化與白化方法SW嵌入至檢測頭,并采用參數共享僅對分類特征圖進行正則化與白化處理。這種以檢測頭處的單一實例為對齊單位,避免了對全局特征處理時導致的域類別錯誤匹配,同時有效緩解了整體對齊時的模型性能驟降問題。

圖6 特征空間中樣本對齊過程Fig.6 Sample alignment process in feature space((a)classification alignment paradigm;(b)global alignment paradigm for object detection;(c)instance alignment paradigm for object detection)

另外,為了降低醫學圖像中過度特征融合所引入的噪聲,本文擬設計域特征增強模塊,將其嵌入FPN(feature pyramid network)全局特征融合部位。具體來說,域特征增強模塊通過可變性卷積網絡(deformable convolutional network,DCN)(Dai 等,2017)增強前景目標信息,為后續實例泛化提取特征更好地抑制噪聲。

綜上,本文提出一種單域泛化X-ray乳腺腫瘤檢測模型,通過實例泛化與特征增強來有效緩解模型在未知域上性能驟降的問題,同時以更少的數據量獲得比全監督方法更優的檢測性能。

1 相關工作

1.1 域自適應目標檢測

域自適應方法旨在通過無標注的目標域與有標注的源域來緩解域偏移問題。當前,絕大多數域自適應方法都采取對抗訓練的形式(Ganin 和Lempitsky,2015),即采取域判別器與梯度反轉層提取域不變特征以消除域偏移的影響。Chen 等人(2018)首次將該方法應用于目標檢測領域,在此研究基礎上,針對淺層特征強對齊、高層特征強弱對齊的域自適應方法(Saito等,2019)被提出。

此外,基于圖像增強的ConfMix 模型(Mattolin等,2023)被提出,該方法通過將源域多幅圖像進行混合拼接以提升模型在目標域的泛化性能。

盡管上述研究取得了較好的效果,但域自適應需獲取源域與目標域數據,并盡可能確保源域與目標域較小的數據分布差異以維持遷移學習的穩定性。在醫學圖像領域,醫療數據數量少且域偏移未知,使源域與目標域難以劃分,因此,域自適應的方法并不適于醫學圖像領域。

1.2 單域泛化

單域泛化是指通過在無域偏移或較少域偏移的數據集上進行模型訓練,然后將該模型泛化至域偏移未知的測試集。目前,單域泛化一般采用數據增強與正則化方法來解決分類任務(Qiao等,2020),此外,Fan 等人(2021)提出一種通用正則化方法提升分類任務的泛化能力?;谏鲜鲅芯?,Wu 和Deng(2022)首次提出基于單域泛化的目標檢測模型Single-DGOD,但該研究發現不同的正則化與白化方法降低了目標檢測性能。因此,本文在醫學數據場景下探索性能驟降的原因并解決正則化與白化方法對單域泛化目標檢測的負面影響。

1.3 正則化與白化

域偏移現象本質為數據分布上的偏移,因此通過對數據分布的調整可以有效緩解域偏移問題。提升泛化性能可以采用正則化方法與白化方法。常用的正則化方法有BN(batch normalization)(Ioffe 和Szegedy,2015)和IN(instance normalization)(Ulyanov等,2017)。BN 通過對每一批次的期望與方差進行統計以調整數據分布,IN 利用通道上的信息對數據分布進行調整。常用的白化方法主要有natural neural network(Desjardins 等,2015)和decorrelated batch normalization(Huang 等,2018)等。白化操作根據協方差矩陣的過濾掉圖像風格信息從而廣泛應用于風格遷移等領域(Li等,2017)。

2 單域泛化X-ray乳腺腫瘤檢測模型

針對單域泛化場景下目標檢測性能有限的問題。本文提出了一種單域泛化模型(single-domain generalization model,SDGM)進行X-ray 乳腺腫瘤檢測,其中著重設計了實例泛化模塊(instance generalization module,IGM)和域特征增強模塊(domain feature enhancement module,DFEM)來提升模型對于未知域偏移上的泛化能力。SDGM結構如圖7所示,采用ResNet-50(residual network-50)作為主干特征提取網絡,然后通過域特征增強模塊融合上采樣與下采樣中的全局信息以抑制噪聲,并在檢測頭處加入實例泛化模塊對每個實例的類別語義信息進行正則化與白化處理。下面對所提單域泛化模型SDGM 進行理論分析,并對實例泛化模塊和域特征增強模塊進行詳細介紹。

圖7 SDGM結構圖Fig.7 Structure diagram of SDGM

2.1 模型理論分析

定義x為輸入圖像,y為圖像標簽。a,b,c,d代表未知域圖像。xJoint、yJoint表示未知圖像及其對應的標簽。首先在輸入圖像與未知域圖像在數據分布上滿足P(x)≠{P(xa),P(xb),P(xc),P(xd) }的設定??紤]到域泛化優化的目標是獲取域不變特征,這里將采取聯合分布代替上述等式,即P(x)≠{P(xa),P(xb),P(xc),P(xd)}表示為P(x) ≠P(xJoint)。因此,單域泛化的目標是使P(x,y)=P(xJoint,yJoint) 成 立,即單域 泛化下 的特征提取器所提取的域不變特征的數據分布與未知域的聯合數據分布相等。根據貝葉斯公式,有

為了使P(x,y)=P(xJoint,yJoint) 成 立,需保證P(x|y)P(y) 或P(y|x)P(x)與未知域上的保持相等。假設未知域與當前域目標都為腫瘤,腫瘤標簽樣本服從獨立同分布,因此標簽框概率P(y) 分布相等。則可以得到條件:P(y) ≈P(yJoint)。

因此,只需保證P(x|y) ≈P(xJoint|yJoint)即可以保證整體分布近似相等。由于P(x) ≠P(xa,xb,xc,xd),該式為不同域風格變化所導致。然而,不同域中實例特征相對保持不變,即獲取域不變實例特征后P(x) ≈P(xJoint),進而保證整體在多個域下的泛化性能。本文所設計的實例泛化模塊與域特征增強模塊著重提取其域不變特征來保證P(x) ≈P(xJoint)成立。

2.2 實例泛化模塊IGM

目標檢測任務由分類與回歸兩項子任務構成,Song等人(2020)首次針對分類與回歸中特征圖的差異性進行研究,并證明分類子任務與回歸子任務間存在差異性,其影響目標檢測性能。受該研究的啟發,本文探究了分類與回歸之間的差異性對實例泛化是否也存在影響。

回歸子任務主要是預測目標的具體位置,而在腫瘤檢測中,不同域偏移下的回歸偏移數據分布相對離散,無明確域類別決策邊界,若針對其回歸子任務進行正則化與白化處理將會引入更多的噪聲;分類子任務主要是判別不同子目標的類別,在分類分支中,樣本的數據分布存在清晰的類別與域決策邊界,以此進行實例級別的細粒度泛化對齊將能夠有效提升腫瘤檢測性能。

上述分析表明,域泛化中分類子任務與回歸子任務間存在耦合性,因此,本文僅在分類子任務中采用正則化與白化方法SW(Pan 等,2019)。另外,Volpi 等人(2018)指出在分類子任務中正則化與白化方法通常需對特征圖進行多次處理,因此本文采取共享參數的形式對特征圖進行N次正則化與白化處理來設計實例泛化模塊IGM。

實例泛化模塊IGM 的具體結構如圖8 所示,該模塊由一組3 × 3的卷積及正則化與白化方法SW 構成,共計N組。N為超參數,表示實例泛化處理的次數。

圖8 實例泛化模塊IGMFig.8 Instance generalization module

在基于深度學習的卷積神經網絡(convolutional neural network,CNN)的模型中,圖像數據維度一般為(B,C,H,W)4 個維度,其中,B表示bath size,即批次數量,C表示通道數,H(high)和W(width)分別表示高和寬。假定從數據集中隨機抽取樣本Xn∈R,n∈{1,2,3,???,N},N為數據集中的樣本數量。SW 化處理計算需要計算均值與協方差統計量。方差矩陣計算中,wk與為可學習參數,E={bw,iw,bn,in,ln}表示計算方式的集合。具體計算為

式中,covk表示協方差矩陣。SW 方法正是利用上述操作統一正則化與白化,將原有的2個步驟歸為1個步驟,極大提高了計算效率。對于醫學圖像,較少的操作將極大保護原始信息,能夠在緩解域偏移的同時保留紋理細節以保證召回率。雖然實例泛化模塊對每一個目標進行泛化性增強,但是對比常規目標檢測圖像,醫學圖像中殘留有更多無關病理信息,這些細節信息無可避免地會對模型產生干擾。為此下一節將詳細介紹緩解全局噪聲的域特征增強模塊。

2.3 域特征增強模塊DFEM

為了降低乳腺腫瘤的漏檢率,本文設計了域特征增強模塊DFEM,通過關注腫瘤目標的語義信息來增強模型的泛化能力,不同于實例泛化模塊直接提升模型的遷移性與泛化性。傳統3 × 3 卷積的采樣方式為矩形規則采樣,如圖9(a)所示,當采樣目標為遮擋目標或密集目標時,傳統卷積將引入大量無關噪聲。為此,Dai 等人(2017)提出可變性卷積(DCN),該卷積能夠改變采樣軌跡,可以對目標可能出現的位置進行有效采樣,如圖9(b)所示。然而,面對結構更為復雜的目標時,DCN 效果仍不理想。針對此問題,基于DCN 構建的尺度感知、空間感知和任務感知的多級感知策略的dynamic head(Dai等,2021)被提出。但是dynamic head 的多級感知注意力方法太冗余,引入了大量噪聲。

圖9 卷積與可變性卷積Fig.9 Convolution and deformable convolutional network((a)traditional 3 × 3 convolution;(b)DCN)

在醫學乳腺腫瘤圖像中,全局性信息可能包含不同的尺度目標與類別信息,由于結構信息的不對稱性,多尺度信息融合將會引入大量的噪聲,導致尺度感知存在耦合性。相反,空間感知只對單個實例進行處理,避免了對整體采樣引入噪聲。因此,本文在dynamic head 基礎上設計了一種僅具有空間感知的域特征增強模塊(DFEM),以減小特征空間上的離群點,DFEM具體結構如圖10所示。

圖10 域特征增強模塊DFEMFig.10 Domain feature enhancement module

由圖10 可知,域特征增強模塊DFEM 對比dynamic head 結構主要有兩部分不同:1)在不同尺度特征上,本文所提出的特征融合模塊沒有通過SE(squeeze-and-excitation)注意力融合不同層間的特征。這是由于dynamic head 常用于常規場景下的目標檢測。常規場景下一幅圖像中存在多個不同尺度的目標,而醫學圖像中的腫瘤病灶尺度較為單一。因此,減少醫學圖像中不同尺度層級間的融合可以有效減少噪聲。2)在每一層中的特征增強模塊中,所提方法先利用DCN 進行細粒度特征采樣,再通過SE 注意力模塊抑制噪聲。由于腫瘤一般存在隱蔽性,直接采用通道注意力將引入背景紋理信息。因此,先采用DCN 可變性卷積進行針對性采樣來緩解該問題。在后續實驗部分,本文所提方法SDGM 也與dynamic head(Dai 等,2021)進行了比較,性能提升4.7%,表明本文設計的域特征增強模塊DFEM 更適合醫學乳腺腫瘤檢測。

3 實 驗

3.1 數據集

為了驗證所提方法SDGM 的單域泛化性能,將其在域內泛化場景與域間泛化場景下分別進行實驗。其中,域內泛化場景由多個域噪聲的INbreast(Moreira 等,2012)數據集組成,域間泛化場景由CBIS-DDSM(curated breast imaging subset of DDSM)(Lee等,2017)數據集組成。

1)INbreast 是一個公開醫學圖像數據集,包含115 個病例的X-ray 圖像,且具有像素級別的語義分割標簽與目標檢測標簽。本文對INbreast 數據集引入多個域偏移,如圖11所示。

圖11 域偏移圖像Fig.11 Domain shift images

為了驗證所提模型的域內泛化能力,本文采用兩種不同構造方式獲得具有不同數據分布的數據集,即全監督數據集和單域泛化數據集。全監督訓練集通過圖像增強與數據增強構造獲得,單域泛化數據集中的訓練集不進行圖像增強,僅進行數據增強,而測試集僅進行圖像增強。

INbreast 在全監督場景下設定的訓練集與測試集的圖像如圖12 所示。訓練集數據通過隨機裁剪、平移、旋轉、鏡像等一系列數據增強方法將其擴充為5 148 幅圖像;測試集為177 幅圖像。全監督數據集將用于評估單域泛化場景下模型的上限性能。

圖12 INbreast全監督數據集劃分Fig.12 INbreast fully supervised dataset splitting((a)train-set;(b)test-set)

INbreast 全監督場景下的圖像數據概率分布如圖13第1行所示(綠色線表示訓練集,紅色線為測試集),訓練集與測試集的數據分布幾乎一致,符合全監督的隱式假設。INbreast 單域泛化場景下的圖像數據概率分布如圖13 第2 行所示,數據分布發生偏移,屬于本文所要解決的域偏移問題。

圖13 數據集在RGB 3個通道上的概率分布Fig.13 Probability distribution of the dataset on the RGB channels

單域泛化設定如下:INbreast訓練集僅包含唯一的域,不進行圖像增強,測試集包含多個域,具體設定如圖5 所示。訓練集為728 幅通過隨機裁剪、平移、旋轉和鏡像等一系列數據增強方法的X-ray 圖像;測試集為177 幅引入域偏移的圖像。INbreast 單域泛化數據集用于評估模型在域內偏移場景下的泛化能力。

2)CBIS-DDSM 是乳 腺X-ray 圖 像數 據集,由2 620個醫學膠片樣本組成。本文首先過濾掉CBISDDSM 數據集中的噪聲標簽與對應圖像,將剩余的1 206 幅圖像作為訓練集。CBIS-DDSM 的訓練集和INbreast測試集用于評估域間泛化能力。

3.2 實驗細節及評估方式

實驗采取PyTorch 深度學習框架,在Nvidia GTX 3080TI 上進行實驗。優化器選取SGD(stochastic gradient descent),初始學習率為1E-4。評價模型的性能指標采用mAP(mean average precision),閾值為0.5。模型同時在全監督與單域泛化數據集上進行性能評估,性能差距越小表示其泛化性能越強。實驗訓練超參數設定如下:backbone 采用在ImageNet進行預訓練的ResNet-50權重。圖像輸入尺寸為 600 × 1 000 像素,Batch size 設置為2。訓練總周期為12 epoch,8—11 epoch學習率衰減0.1。

為了驗證所提方法SDGM 的有效性,將其與如下方法進行比較,包括one-stage 方法中的Anchorfree 方 法FCOS(fully convolutional one-stage object detection)(Tian 等,2019)和FoveaBox(Kong 等,2020);Anchor-based 方法RetinaNet(Lin 等,2017)、ATSS(Zhang 等,2020)和TOOD(task-aligned onestage object detection)(Feng 等,2021)。two-stage 方法Faster R-CNN(Ren 等,2015)和Cascade-RCNN(Cai 和Vasconcelos,2018)。同時,為了評估不同類型的注意力機制的影響,本文也比較了基于Transformer 的PVTv2(pyramid vision Transformer)(Wang等,2022)與基于CNN 的注意力方法ResNeSt(Zhang等,2022c)。

3.3 性能比較

表1 給出了INbreast 數據集域內全監督場景與單域泛化場景下的乳腺腫瘤檢測性能的比較。從表1 可以觀察到,引入域偏移后所有模型性能驟降,以RetinaNet 為例,相比于全監督場景,單域泛化場景中其性能驟降9%。進一步分析兩場景下的性能,可得到如下結論:

表1 INbreast數據集域內泛化性能比較Table 1 Comparison of performance in the intra-domain on INbreast dataset

1)所提方法SDGM 優于現有的方法,在單域泛化場景下有著絕對優勢。與TOOD 等沒有使用注意力機制的方法相比,SDGM 在單域泛化場景下的域偏移性能損耗至少降低了3.6%;與采用不同注意力機制的ResNeSt 和PVT-Transformer 等方法相比,所提方法SDGM 在單域泛化場景下的域偏移性能損耗分別降低了21.1%和2.8%,表明SDGM 具有更為好的魯棒性與泛化能力。

2)局部和全局注意力機制對單域泛化場景下模型的性能具有不同的影響。如在baseline 方法中加入具有局部注意力的主干ResNeSt 后,在單域泛化場景下性能有著更大的域偏移性能損耗,表明局部注意力造成的過擬合降低了模型性能。相反,基于全局注意力的PVTv2-Transformer 在單域泛化場景下性能顯著提升,表明全局信息對泛化性能至關重要。因此本文設計了域特征增強模塊,用于FPN 處來有效抑制噪聲,從而獲取全局信息。

3)基于CNN 的baseline 方法和所提SDGM 方法比基于Transformer的方法PVTv2具有更好的單域泛化能力。在單域泛化場景下,所提SDGM、baseline和PVTv2 的域偏移性能損耗分別為7%、9% 與9.8%。這表明Transformer 雖然具有更好的特征提取能力,但比CNN 具有更差的遷移性。另外,Transformer 需要消耗更多的顯存與計算資源。因此本文所提方法SDGM具有更好的單域泛化能力。

4)在域偏移性能損耗存在性能優勢的前提下,方法在全監督場景下的性能越好,其在單域泛化場景下的性能也越好。如在全監督場景下TOOD 方法比Cascade-RCNN 方法的性能提升了13.5%;在單域泛化場景下TOOD 方法比Cascade-RCNN 方法的性能提升了4.8%;本文所提SDGM 模型在單域泛化場景下的域偏移性能損耗降低了7%。當域偏移性能損耗不存在性能優勢時,則方法在全監督場景下的性能越好,其在單域泛化場景下的性能則越差。如RetinaNet+ResNeSt 方法域偏移性能損耗為15.4%,盡管該方法在全監督場景下性能優于Cascade-RCNN,但其在單域泛化場景下的性能更差。

5)one-stage 方法比two-stage 方法具有更好的泛化能力。two-stage方法由于需要RPN(region proposal network)對目標進行候選,導致其在不同域上造成更大的域偏移性能損耗。相反,one-stage方法更為簡潔,受域偏移影響更小,因此相對域偏移性能損耗更低。

此外,表2 展示域間泛化性能的結果,即訓練集采取CBIS-DDSM 泛化性能比較。由表2可知,在不同數據集之間,所提方法SDGM 比RetinaNet 方法性能提升了5.8%,表明了所提方法SDGM 在域間也具有很好的泛化性與魯棒性。

表2 CBIS-DDSM域間泛化性能比較Table 2 Comparison of performance in the inter-domain on CBIS-DDSM

表3 給出了在INbreast 數據集上當前SOTA(state of the art)全監督X-ray乳腺腫瘤檢測方法的性能比較。由于訓練集與測試集劃分不同,以及數據預處理方法存在差異,導致不同的benchmark 性能不同??梢钥闯?,所提方法SDGM 比現有方法有著顯著的性能優勢。

表3 全監督場景下X-ray乳腺腫瘤檢測性能Table 3 Breast tumor detection performance in X-ray images in supervised scenarios

綜上,所提方法SDGM 能夠有效緩解域偏移帶來的性能損失,在單域內泛化場景下達到SOTA,在使用更少數據的情況下SDGM 優于baseline 全監督方法,在域間泛化場景也具有很好的普適性。對比當前全監督場景下的方法,所提方法也具有顯著的性能優勢。SDGM 能夠取得優異性能主要歸因于本文所設計的實例泛化模塊IGM 和域特征增強模塊DFEM。

3.4 消融實驗

3.4.1 模塊消融實驗

本節通過消融實驗驗證實例泛化模塊與域特征增強模塊的泛化能力,實驗結果見表4。

表4 消融實驗Table 4 Ablation experiments

從表4 可知,實例泛化模塊與域特征增強模塊分別從特征角度與正則化白化角度提升了模型SDGM 的泛化性。在INbreast 數據集的單域泛化場景下,單獨使用域特征增強模塊,模型性能比baseline 方法提升了6.4%;單獨使用實例泛化模塊,模型性能比baseline 方法提升了7.7%;同時采用二者的SDGM,性能比baseline 方法提升了9.7%。該結果充分說明了本文設計的域特征增強模塊和實例泛化模塊能夠有效提升單域泛化能力,避免了相同處理方法產生的過擬合問題或干擾問題。

3.4.2 實例泛化模塊分析

Wu 和Deng(2022)首次將單域泛化任務從分類任務引入目標檢測領域,但該研究并未采取單域泛化分類任務中常用的正則化與白化方法SW,并通過實驗驗證了SW 有損于目標檢測性能。該文并沒有給出合理的分析和解釋。本文分析認為這是由于目標檢測任務的耦合性,即將分類與回歸任務耦合至一體所致。因此,本節采取不同的組合形式進行實驗來進一步驗證本文上述觀點。

另外,實驗對參數共享和參數獨立也進行了對比。實驗中超參數N設置為4,結果見表5,其中第1行是baseline 方法的性能。從表5 可以看出:1)僅在分類任務中引入實例泛化模塊IGM,特別是在參數共享情況下,目標檢測性能比baseline 方法提升了5%;而僅在回歸任務中引入實例泛化模塊IGM,目標檢測性能迅速降低;在回歸和分類任務中同時引入實例泛化模塊IGM,目標檢測性能也迅速降低。因此,只要是在回歸任務中引入實例泛化模塊IGM,目標檢測性能都會受到很大影響,即正則化白化SW對回歸任務有負面影響。2)僅在分類分支中采用實例泛化模塊IGM 時,參數共享時的目標檢測性能比參數獨立時的性能提升了5.2%。由此可知,參數共享比參數獨立具有更好的泛化性能。

表5 實例泛化模塊性能分析(N =4)Table 5 Performance analysis of instance generalization module(N =4) /%

因此,本實驗為Wu 和Deng(2022)的研究中目標檢測性能驟降找出了可能存在的原因:1)沒有對分類與回歸進行解耦合;2)參數沒有共享;3)正則化白化SW嵌入的部位不正確等。

3.4.3 超參數N分析

對實例泛化模塊重復次數,即超參數N進行實驗分析,驗證了其在乳腺腫瘤場景下對泛化性能的影響,實驗結果見圖14。由于醫學圖像存在較多的背景噪聲,不同N對性能影響很大。當N為6 時實例泛化模塊能達到較好的性能。對比默認超參數N=4,N增大可以更好地提升性能。

圖14 超參數N對泛化能力的影響Fig.14 Effection of hyperparameter N on generalization ability

3.4.4 域特征增強模塊分析

對域特征增強模塊進行實驗分析,并與采取相同思想的文獻(Dai 等,2021)進行了對比,實驗結果見圖15,圖中,B表示baseline方法RetinaNet。

圖15 域特征增強模塊分析Fig.15 Domain feature enhancement module analysis

由圖15 可知,本文所設計的域特征增強模塊能夠有效提取域不變特征,并抑制噪聲。與Dai 等人(2021)所提方法相比,mAP0.5 和泛化能力均提升了4.7%。域特征增強模塊使得模型取得良好的目標檢測性能,主要是因為其能夠有效克服dynamichead(Dai等,2021)中采用的冗余的注意力機制和卷積操作。

3.5 實例泛化對性能的影響

為了進一步驗證實例泛化范式對單域泛化的性能影響,本節對原圖與不同細粒度增強圖像的性能進行了比較,視覺比較結果見圖16,性能比較結果見圖17,圖中不同的sample 代表不同程度的細粒度增強圖像。數據集為CBIS-DDSM,其中訓練集與測試集的比例為8∶2。細粒度圖像增強同時作用于訓練集與測試集。

圖16 不同細粒度增強圖像的視覺對比Fig.16 Visual comparison of different fine-grained enhanced images

圖17 不同細粒度增強圖像的性能比較Fig.17 Performance comparison of different fine-grained enhanced images

從圖16 和圖17 可以看出:1)原圖(raw)與sample 1 進行比較,圖16 中紅色框中的特征更為顯著,同時圖17中對應的檢測性能也更高。2)圖16中sample 2 紅框中的特征比sample 1 紅框中的特征更為明顯,但是圖17 中對應的性能卻下降了,這是由于背景中的無關特征也增強了。3)圖16中sample 3中目標周圍的腺體組織相對增強,使得網絡更易于區分前景與背景,因此圖17 中sample 3 相對于sample 2 性能有所上升。綜上,由于本文所提實例泛化的增強范式能夠同時考慮目標特征與背景特征的差異關系,從而實現對目標實例處的噪聲的有效抑制,提升X-ray乳腺腫瘤的檢測性能。

3.6 視覺比較

在單域泛化場景下將所提方法SDGM 與baseline方法進行視覺比較,結果如圖18所示。圖18(a)表示所提方法SDGM 的檢測結果;圖18(b)表示baseline 方法RetinaNet 檢測結果;圖18(c)表示標簽框(真值框)。由圖18 知,第1 行圖像中本文所提方法SDGM 檢測準確,而baseline 方法產生了誤檢,主要是因為所提SDGM 得益于所設計的域特征增強模塊的細粒度特征抽??;第2 行圖像中由于域偏移的影響,baseline 方法回歸預測框不準確,而本文所提方法SDGM 能夠獲得更為準確的預測框;第3 行圖像中,相比于baseline 方法,所提方法SDGM 能夠有效檢測出隱蔽病灶。以上結果再次表明,本文通過設計的實例泛化模塊與特征增強模塊能夠有效提升模型SDGM的目標檢測性能。

圖18 單域泛化檢測結果視覺比較Fig.18 Vision comparison of single-domain generalization detection results((a)SDGM;(b)RetinaNet;(c)ground truth)

4 結論

為了緩解乳腺腫瘤圖像標注匱乏問題,提升乳腺腫瘤檢測精度,本文提出了一種針對X-ray乳腺腫瘤檢測的單域泛化目標檢測模型SDGM,其中著重設計了實例泛化模塊和域特征增強模塊。實例泛化模塊有效解決了單域泛化目標檢測方法在正則化與白化SW 中性能驟降的問題,域特征增強模塊則有效緩解了多尺度特征融合在腫瘤檢測中所引發的噪聲問題。

所提SDGM 模型與one-stage 和two-stage 方法以及兩類注意力機制進行了性能比較。在引入域偏移的INbreast 數據集的benchmark 中,SDGM 比baseline方法的檢測性能提升了9.7%,甚至優于全監督下的檢測方法;SDGM 在CBIS-DDSM 數據集的域間泛化場景也具有很好的泛化能力。另外,所提SDGM 在結構與效率上優于現有的two-stage 腫瘤檢測方法,對數據的依賴程度優于基于K-means 聚類范式的one-stage 腫瘤檢測方法。上述結果表明,所提SDGM 方法在X-ray 醫學圖像腫瘤檢測中具有重要的應用價值和廣泛的應用前景。

雖然本文所提SDGM 很好地提升了X-ray 圖像下的單域泛化腫瘤檢測性能,但是其在臨床實踐中仍然存在較大的局限性,不能滿足MRI(magnetic resonance imaging)、CT(computed tomography)、PET(positron emission tomography)、SPECT(single-photon emission computed tomography)等多模態或跨模態的腫瘤檢測需求。因此,未來的一個研究方向是充分利用互補且異構的多模態乳腺腫瘤圖像數據,設計多模態或跨模態檢測模型,在保障多模態圖像間的魯棒性的同時提升檢測精度。

猜你喜歡
實例特征性能
如何表達“特征”
提供將近80 Gbps的帶寬性能 DisplayPort 2.0正式發布
不忠誠的四個特征
抓住特征巧觀察
Al-Se雙元置換的基于LGPS的thio-LISICON的制備與性能表征
強韌化PBT/PC共混物的制備與性能
完形填空Ⅱ
完形填空Ⅰ
RDX/POLY(BAMO-AMMO)基發射藥的熱分解與燃燒性能
線性代數的應用特征
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合