?

基于影像特征建立乳腺癌腋窩淋巴結轉移機器學習預測模型

2023-05-25 07:55吳澤琪馬夢偉劉仁懿曾鳳霞陳衛國秦耿耿
國際醫學放射學雜志 2023年3期
關鍵詞:征象腫塊乳腺

吳澤琪,馬夢偉,劉仁懿,曾鳳霞,陳衛國,秦耿耿

近年來乳腺癌的發病率呈快速上升趨勢,已超過肺癌成為全球第一大癌癥。早期發現并進行有效的系統治療是降低乳腺癌死亡率的關鍵[1]。腋窩淋巴結(axillary lymph node, ALN)轉移情況是影響乳腺癌病人預后和治療決策的重要因素[2]。目前,ALN清掃和前哨淋巴結活檢是評估ALN 狀態的標準方法,但兩者均為有創性操作,可能導致上肢淋巴水腫、手臂外展受限等并發癥的發生[3]。影像學檢查作為一種無創性的手段,在乳腺癌的診斷及預后評估中發揮著重要作用。機器學習作為人工智能的重要分支,可以通過復雜的算法來分析大量數據,識別數據中的模式并做出預測,在醫學領域應用廣泛。然而,機器學習模型是一種“黑盒模型”,模型內部機制難以理解,使得醫生未能充分信任其結果。SHAP(SHapley Additive exPlanation)可解釋技術能夠評估每個特征對模型輸出的貢獻,可視化模型的決策過程。將醫生提取的影像學征象與可解釋機器學習算法相結合,有望構建一個可重復性好且易理解的預測模型。既往ALN 轉移的相關研究大多僅納入單模態的影像數據進行研究,而針對多模態影像征象對預測模型評價的研究尚少[2]。本研究旨在利用基于第5 版乳腺影像報告和數據系統(breast imaging reporting and data system,BI-RADS)[4]的乳腺癌原發灶全視野數字化乳腺X 線攝影(full-field digital mammography, FFDM)和超聲(US)征象構建乳腺癌ALN 轉移預測模型,探索乳腺癌原發灶的FFDM 及超聲影像特征術前預測ALN 轉移的價值,以期尋找一種準確、無創預測乳腺癌ALN 轉移的新方法。

1 資料與方法

1.1 一般資料 回顧性分析南方醫科大學南方醫院2012 年1 月—2018 年12 月經病理證實為浸潤性乳腺癌320 例女性病人的臨床及影像資料,年齡28~77 歲,平均(49±11)歲。納入標準:(1)術前1 個月內行FFDM 和乳腺US 檢查;(2) 原發病灶在FFDM 和US 影像上均可見;(3)所有病人均經病理明確了ALN 狀態。排除標準:(1)行影像學檢查前接受過活檢或乳腺癌治療(包括新輔助化療、放射治療、內分泌治療等);(2)影像學資料或臨床資料不完整;(3)影像質量無法評估;(4)合并其他惡性腫瘤。根據ALN 病理結果是否有轉移灶,將病人分為ALN 陽性組(154 例)和陰性組(166 例)。陽性組年齡28~76 歲,中位年齡48(38,56)歲,ALN 陰性組病人年齡30~77 歲,中位年齡49(43,57)歲,2 組年齡差異無統計學意義(Z=-1.764,P=0.078)。

1.2 FFDM 檢查及影像分析 采用Siemens Mammomat Novation 及Hologic Selenia Dimensions 全數字化乳腺X 線機。掃描體位常規包括雙側內外斜位和頭尾位,部分病例不能明確診斷時,加拍局部加壓攝影或點壓放大攝影。由2 名具有10 年及以上乳腺影像診斷經驗的影像科醫師,在對ALN 病理結果不知情的情況下,根據第5 版BI-RADS 對乳腺癌病人的FFDM 影像進行分析并提取征象,2 名醫師意見不一致則商討確定。共分析15 個征象,包括(1)乳腺腺體類型,分為脂肪類(a 型)、散在纖維腺體類(b 型)、不均勻致密類(c 型)、極度致密類(d型);(2)有無腫塊;(3)腫塊最大徑(cm);(4)腫塊密度,分為高密度、等密度、低密度或含脂肪密度;(5)腫塊形狀,分為圓形或卵圓形、不規則形;(6)腫塊邊緣,清晰/遮蔽、微分葉、毛刺、模糊;(7)可疑鈣化;(8)鈣化形態,模糊不定形、粗糙不均質、細小多形性、細線樣或細分枝狀鈣化;(9)鈣化分布,分為彌漫分布、區域性分布、成簇分布、線樣或段樣分布;(10)結構扭曲;(11)非對稱致密;(12)乳頭回縮;(13)皮膚增厚;(14)皮膚回縮;(15)懸韌帶牽拉。

1.3 乳腺US 檢查及影像分析 采用Philips IU 22彩色多普勒超聲診斷儀,實時線陣高頻探頭,頻率為7.5~10 MHz。由2 名具有10 年及以上經驗的超聲診斷醫師,在對ALN 病理結果不知情的情況下,根據第五版BI-RADS 評估乳腺癌原發灶情況并提取征象,2 名醫師意見不一致則商討確定。共分析8個征象,包括(1)腫塊最大徑(cm);(2)腫塊形態,圓形或卵圓形、不規則形;(3)腫塊邊緣,清晰、模糊、成角、微分葉、毛刺;(4)腫塊方向,不平行、平行;(5)病灶內部回聲,回聲均勻、回聲不均勻;(6)病灶后方回聲,不變、增強、衰減;(7)強回聲光點;(8)腫塊血供,無血供、內部血供、外部血供。

1.4 預測模型構建與驗證 采用Python 3.7 進行模型的構建與驗證,將數據集以8∶2 的比例隨機分為訓練集(256 例)和測試集(64 例)。分別基于乳腺癌原發灶FFDM 征象、US 征象以及兩者聯合征象,采用隨機森林(random forest,RF)、極端梯度提升(extreme gradient boosting, XGBoost)、邏 輯 回 歸(logistics regression,LR)、支持向量機(support vector machine,SVM)算法構建ALN 轉移預測模型。對數據集中的連續變量進行最大最小值歸一化處理,采用最小絕對值收斂和選擇算子(least absolute shrinkage and selection operator,LASSO)回歸算法篩選出與ALN 轉移相關的影像學征象,使用四折交叉驗證調整模型參數,防止模型過擬合。在測試集中評價模型效能,評估指標包括準確度、敏感度、特異度、陽性預測值(positive predict value,PPV)、陰性預測值(negative predict value, NPV)及受試者操作特征(receiver operating characteristic, ROC)曲線下面積(area under curve,AUC)。以AUC 作為主要的評價指標,選出效能最優的FFDM 模型、US 模型以及聯合模型并比較3 種模型效能,選出最優預測模型。采用SHAP 值評估每個特征對最優模型輸出的貢獻,以實現模型的可解釋性,分析乳腺癌ALN 轉移的影像預測因子。

1.5 統計學方法 采用SPSS 25.0 軟件對數據進行分析。非正態分布的計量資料以中位數[M(P25,P75)]表示,2 組間比較采用Mann-Whitney U 檢驗。計數資料以例(%)表示,2 組間比較采用卡方檢驗或Fisher 確切概率檢驗。采用Delong 檢驗比較各模型的AUC。P<0.05 為差異有統計學意義。

2 結果

2.1 2 組間FFDM 和超聲表現的比較 FFDM 上乳腺癌病灶表現為腫塊者282 例,可疑鈣化者149例。ALN 陽性組的腫塊最大徑大于陰性組(P<0.05),且更多見乳頭回縮和皮膚增厚(均P<0.05)。2組其余FFDM 征象的差異均無統計學意義(均P>0.05),詳見表1。US 上,ALN 陽性組的腫塊最大徑也大于陰性組(P<0.05),強回聲光點的發生率高于ALN 陰性組(均P<0.05)。其余US 征象的差異均無統計學意義(均P>0.05),詳見表2。

表1 2 組病人FFDM 表現比較 例(%)

表2 2 組病人US 表現比較 例(%)

2.2 模型預測效能評估 在測試集中,對基于3 種特征建立的不同機器學習模型的AUC 比較顯示,RF 分類器的診斷效能最優,如圖1 所示?;? 種特征構建的RF 預測模型的AUC 比較顯示,與2 種單一特征模型相比,聯合特征模型的AUC 值較高(0.747),但3 種模型間AUC 值差異無統計學意義(均P>0.05);其中,FFDM 模型的特異度和陽性預測值最高,分別為0.893 和0.850。詳見表3、圖2。

圖1 測試集中基于3 種特征構建的不同機器學習模型AUC比較

圖2 測試集中基于RF 分類器的3 種模型預測ALN 轉移的ROC 曲線

表3 基于RF 分類器的3 種模型對測試集乳腺癌ALN轉移的預測效能

2.3 特征重要性分析 使用SHAP 值評估每個特征對最優聯合模型輸出的貢獻,其中影響模型輸出最重要的5 個征象包括2 個US 征象(腫塊最大徑、強回聲光點)和3 個FFDM 征象(皮膚增厚、乳頭回縮、乳腺密度散在纖維腺體類),且特征對模型輸出的影響依次減?。▓D3)。其中,US 顯示腫塊越大、FFDM 上表現為皮膚增厚或乳頭回縮時,模型預測更傾向于ALN 陽性;而在US 上未發現強回聲光點或在FFDM 上乳腺腺體類型表現為散在纖維腺體類時,模型預測更傾向于ALN 陰性。圖4 列舉了模型對病例個體預測的決策過程。

圖3 最優模型的特征SHAP 圖。橫軸表示SHAP 值,值為正數表示支持陽性預測,為負數則支持陰性預測;縱軸為模型納入的特征,并根據其對模型預測結果的影響,按重要性進行降序排列;圖中每個點代表一個樣本,點的顏色表示特征的原始值,越接近紅色表示值越大,越接近藍色表示值越小。

圖4 病人女,31 歲,左乳浸潤性導管癌Ⅱ級伴左側ALN 轉移。左側FFDM 頭尾位(A 圖)及內外斜位片(B 圖)示左側乳腺腺體類型為不均勻致密類,內見高密度不規則形腫塊,邊緣模糊,皮膚未見增厚,乳頭無回縮。左側乳腺B 超影像(C圖)示不規則形實性低回聲團,邊緣部分呈“蟹足樣”改變,內部回聲不均勻,其內可見散在強回聲光點。左側乳腺彩色多普勒血流成像(CDFI)(D 圖)示病灶內部及周邊可探及條狀彩色血流信號。E 圖為最優模型預測的個體病例SHAP 特征貢獻分析圖,紅色條表示支持陽性預測,藍色條表示支持陰性預測,特征條的長度代表貢獻的大小,模型預測該病例ALN 轉移陽性的概率為0.62。

3 討論

近年來,多項研究[5-7]基于乳腺癌原發腫瘤的MRI、US、FFDM 影像組學特征構建了ALN 轉移預測模型,其AUC 分別為0.780、0.710、0.740,與本研究構建的最優模型性能相似。然而,影像組學紋理分析過程受圖像采集和重建方法的影響,使得研究的可重復性及研究間的可比性減低[8]。同時,組學特征可解釋性差,醫生難以理解,不能對其充分信任,從而限制其在臨床上的推廣。與之相比,由影像科醫生歸納總結的統一的影像特征(如BI-RADS)更具普適性,更易為醫生理解和接受。本研究采用不同算法構建了基于BI-RADS 提取乳腺癌FFDM、US 及聯合2 種特征的ALN 轉移預測模型,基于RF算法構建的3 種特征模型的AUC 均達到最高,分別為0.626、0.705、0.747,證實了結合原發腫瘤的FFDM 和US 征象所構建的機器學習模型預測乳腺癌ALN 轉移具有一定的可行性。本研究構建的FFDM 模型、US 模型及聯合模型的AUC 有遞增的趨勢,但3 種模型的診斷效能差異無統計意義,聯合模型的AUC 僅略高于單模態模型,這可能與樣本量較少有關,后續將增加樣本量行進一步研究。

SHAP 可解釋技術是一種基于博弈論最優Shapley 值來解釋個體預測的方法,可直觀地顯示特征與模型輸出結果之間的關系,包括各特征對模型輸出的影響力的大小及正負性,適用于各類機器學習模型的可解釋性分析[9]。此外,SHAP 還能針對病例個體給出ALN 轉移預測概率,并可視化模型決策過程,評估每個特征對模型輸出的貢獻,增加醫生對模型預測結果的信任。本研究中SHAP 對模型整體預測分析結果表明,在US 征象中,腫塊最大徑對模型輸出結果的影響最大,腫塊最大徑與ALN 轉移陽性呈正相關,與既往文獻[10-11]報道的結果相符。此外,在US 上未發現強回聲光點時,模型更傾向于預測ALN 轉移為陰性。Zong 等[12]研究也認為US 影像上表現為腫塊微鈣化是乳腺癌ALN 轉移的獨立預測因子,與本研究一致。在FFDM 影像中,乳腺癌出現皮膚增厚或乳頭回縮時,模型傾向于預測ALN 轉移為陽性。Dietzel 等[13]及牟等[14]對乳腺癌MRI 征象進行研究,也得出了類似的結論。此外,當乳腺腺體類型為散在纖維腺體類時,模型更傾向于預測乳腺癌無ALN 轉移。既往研究[15-16]發現,乳腺X 線密度與淋巴結轉移呈正相關??赡苁怯捎谥旅苄腿橄賹Σ≡罹哂醒谏w效應,使得腫瘤在被發現之前已進展至更具侵襲性的階段;此外,致密腺體與乳腺癌的發生發展之間可能存在潛在的生物學關系[17]。在本研究中,乳腺腺體類型對模型預測結果的影響相對較小,后續可擴大樣本量研究。

本研究僅對乳腺癌原發灶的影像特征進行研究,未納入ALN 征象。既往研究[18]表明,納入ALN特征可以進一步提高模型的預測效能,但將會不可避免地在重要征象分析中占重要權重,從而影響病灶本身征象與ALN 轉移之間關系的分析[19]。在對ALN 轉移陽性的預測病例回顧時發現,對于FFDM 及US 表現為ALN 陰性或ALN 征象難以評估的病例,本模型依舊能正確預測ALN 轉移陽性。本研究不依賴于ALN 影像征象,所構建的聯合模型有望應用于FFDM 及US 上ALN 表現為陰性或淋巴結征象難以評估的病例。后續將對ALN 征象進一步研究。

本研究存在一些局限性:(1)FFDM 及US 檢查對乳腺癌的成像各有優勢,互相補充,本研究是基于雙模態影像征象構建的預測模型,模型效能較單模態模型有所提高,但實際工作中部分病例僅行一種影像檢查,后續將進一步提高單模態模型效能以滿足臨床多方面需求;(2)本研究數據僅來自于單一醫療機構,缺少多中心數據對模型進行驗證。

綜上所述,基于FFDM 和US 征象的可解釋機器學習模型能較好地預測乳腺癌ALN 轉移,模型的可解釋性可直觀地展示ALN 轉移預測概率及模型決策過程,揭示ALN 轉移的影像預測因子,有望成為術前無創預測乳腺癌ALN 轉移的新手段。

猜你喜歡
征象腫塊乳腺
超聲造影在周圍型肺腫塊穿刺活檢中作用
產前超聲間接征象在部分型胼胝體發育不全診斷中的價值
乳房有腫塊、隱隱作痛,怎么辦
體檢查出乳腺增生或結節,該怎么辦
得了乳腺增生,要怎么辦?
Ki-67、p53、CerbB-2表達與乳腺癌彩色超聲征象的關系
急性球形肺炎的CT征象分析
容易誤診的高回聲型乳腺病變
慢性腫塊型胰腺炎診斷和外科治療
針吸治療乳腺增生
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合