基于雙參數MRI影像組學構建的支持向量機模型對乳腺癌人表皮生長因子受體-2和激素受體表達的預測效能

2024-03-28 06:54朱銀杏王太宇劉志鵬

實用臨床醫藥雜志 2024年4期

侯慧,朱銀杏,王太宇,張翼,劉志鵬

(1.江蘇省泰州市第四人民醫院影像科,江蘇泰州,225300;2.南京醫科大學附屬泰州人民醫院信息科,江蘇泰州,225300;3.江蘇省泰州市中醫院甲乳外科,江蘇泰州,225300)

2020年乳腺癌在全球女性惡性腫瘤中的發病率及病死率均居首位[1]。人表皮生長因子受體-2(HER-2)陽性乳腺癌約占全部乳腺癌的20%～30%,相較于HER-2陰性,HER-2陽性乳腺癌復發轉移率高、預后差[2]。激素受體(HR)陽性乳腺癌是最常見的乳腺癌亞型,占所有乳腺癌的60%～70%[3],其特點是生長相對緩慢,總生存期相對更長[4],而HR陰性乳腺癌復發轉移率高、生存率低[5]。目前,主要通過免疫組化(IHC)和(或)原位熒光雜交(FISH)[6]檢測HER-2和HR表達水平,但需手術或穿刺活檢標本,為有創性檢查。因此,臨床急需尋找快速、有效、無創的方法來預測乳腺癌的HER-2和HR表達水平。MRI具有無射線傷害、多方位及多參數成像、敏感性高等優點,其在乳腺癌的診斷評估、術后復查中發揮重要作用[7]。乳腺富含脂肪組織,磁共振T2WI 反轉恢復壓脂(TIRM) 序列使得缺乏脂肪成分的乳腺病灶對比度增加,可有效提高病變檢出率[8]。擴散加權成像(DWI)序列通過衡量乳腺細胞中水分子擴散運動的微觀狀態,檢測組織細胞的生理學改變,間接反映出腫瘤細胞的侵襲能力。機器學習作為一種高效數據處理工具,目前已廣泛應用于預測模型的構建。其中,支持向量機(SVM)在小樣本訓練數據上表現較好[9]。故本研究利用TIRM和DWI序列圖像的影像組學特征,借助SVM算法構建乳腺癌HER-2及HR表達水平的預測模型,并評估模型的性能,篩選出權重較高的特征,以進一步指導個體化治療。

1 資料與方法

1.1 一般資料

回顧性收集2015年6月—2023年5月在泰州市人民醫院、泰州市第四人民醫院及泰州市中醫院就診的患者,經病理(手術或穿刺活檢)診斷為乳腺癌。收集乳腺癌患者臨床資料(發病年齡、病理結果、免疫組化及原位熒光雜交結果)及磁共振成像檢查影像資料。納入標準:① 乳腺磁共振成像檢查在手術及穿刺活檢前進行者; ② 磁共振成像檢查圖像完整且包含TIRM、DWI序列圖像者; ③ 手術及穿刺病理結果明確者; ④ 臨床一般資料、免疫組化及熒光原位雜交結果完善者。排除標準:① 患者磁共振檢查前接受過治療,如手術、放化療、內分泌治療等; ② 患者有乳腺疾病方面手術史或其他腫瘤病史; ③磁共振檢查圖像質量不佳,如偽影較大,無法診斷及分析者; ④ 邊界不清的非腫塊樣病灶及長徑小于1 cm的腫塊樣病灶者。經上述納排標準,最終入組128個病灶,其中108例來自泰州市人民醫院。按照8∶2的比例采用隨機分層方法分為訓練組及驗證組,15例來自泰州市第四人民醫院,5例來自泰州市中醫院作為外部測試組。在訓練組及驗證組中,HER-2陽性26例,HER-2陰性82例; HR陽性71例,HR陰性37例。在外部測試組中,HER-2陽性6例,HER-2陰性14例; HR陽性13例,HR陰性7例。本研究經泰州市人民醫院倫理委員會批準,倫理批件號為KY 2023-044-01。

1.2 MRI檢查方法

本研究所有乳腺磁共振檢查均在德國西門子3.0 T超導型磁共振掃描儀上進行?；颊咝写殴舱駫呙枨敖?～6 h?；颊吒┡P于乳腺專用線圈上,身體軸線與檢查床軸線保持一致,將雙側乳腺分別懸垂于乳腺線圈的2個凹槽中心內,掃描過程持續20～30 min。掃描平掃序列包括橫斷位TIRM序列、橫斷位T1WI序列、橫斷位DWI序列及左、右乳矢狀位脂肪抑制T2WI序列。

1.3 影像特征提取

采用ITK-SNAP(版本 3.6.0)軟件在TIRM、DWI原始圖像上手動逐層勾畫感興趣區面積,完成病灶感興趣區體積的分割。所有病灶的容積感興趣區(VOI)勾畫均由同一位具有3年乳腺影像診斷經驗的影像科醫師在不知道HER-2及HR表達水平的情況下完成,再由另一位具有20年乳腺影像診斷經驗的影像科醫師確認。同時結合對照矢狀位脂肪抑制T2WI序列、橫斷位動態對比增強序列圖像確定腫瘤位置,避開周邊正常乳腺組織、液化壞死區(見圖1及圖2)。采用Python平臺開發的開源軟件包 PyRadiomics(版本 3.0.1),將病灶的原始圖像與勾畫的VOI圖像同時導入以提取特征。最終,每個序列分別提取1 321個影像組學特征。

患者52歲女性,左乳12點～1點方向差分化癌,HER-2表達為陰性,HR表達為陰性。

患者53歲女性,左乳1～2點方向浸潤性導管癌,HER-2表達為陰性,HR表達為陽性。

1.4 模型的構建與驗證

采用Z-score數據標準化處理,以消除所提取的影像組學特征間的尺度差異。對提取的特征數據集,采用基于支持向量機的遞歸特征消除法,即SVM-RFE算法篩選出最佳的影像組學特征。最終,TIRM、DWI、TIRM+DWI模態分別篩選出10個最具預測性的影像組學特征。利用降維后的特征,分別構建HER-2和HR表達水平的SVM預測模型。

本研究使用5折交叉驗證方法保證模型性能的穩定性,通過受試者工作特征(ROC)曲線來評估模型的鑒別能力,包括曲線下面積(AUC)、準確度、靈敏度、特異度、精準率和f1-score等定量指標。使用DeLong檢驗評價各影像組學模型AUC之間的差異。采用SHAP算法獲取TIRM、DWI序列的每個影像組學預測特征的權重,并按重要性依次排序列出前10位的特征,SHAP值表示每個特征對最終預測的貢獻程度。P<0.05為差異有統計學意義。

2 結果

2.1 HER-2受體表達水平預測

基于10項影像組學特征構建的TIRM序列圖像的SVM預測模型訓練組的AUC為0.85(95%CI,0.82～0.88); 驗證組的AUC為0.80(95%CI,0.70～0.89)。DWI預測模型訓練組的AUC為0.88(95%CI,0.80～0.95); 驗證組的AUC為0.66(95%CI,0.48～0.84)。聯合模型訓練組的AUC為0.94(95%CI,0.90～0.98); 驗證組的AUC為0.90(95%CI,0.81～0.98),見圖3。在驗證組中采用Delong檢驗比較上述3種模型的性能,TIRM+DWI模型對HER-2表達的預測效能高于TIRM模型和DWI模型,差異有統計學意義(P<0.05),見表1。

表1 不同模型評估乳腺癌HER-2表達水平的預測效能

A:訓練組的ROC曲線; B:驗證組的ROC曲線; C:測試組的ROC曲線。

TIRM+DWI模型外部測試組的AUC為0.89(見圖3),SHAP算法得出DWI_wavelet-HLL_glszm_SmallAreaHighGrayLevelEmphasis特征貢獻較大,其他特征的貢獻程度如圖4所示。

圖4 預測HER-2狀態聯合模型測試組的SHAP特征權重分布峰圖及權重均值直方圖

2.2 HR受體表達水平預測

基于10項影像組學特征構建的TIRM序列圖像的SVM預測模型ROC曲線中訓練組的AUC為0.84(95%CI,0.81～0.88),驗證組的AUC為0.68(95%CI,0.48～0.88)。DWI序列圖像的SVM預測模型訓練組的AUC為0.92(95%CI,0.90～0.93),驗證組的AUC為0.86(95%CI,0.82～0.91)。聯合TIRM、DWI序列圖像的SVM預測模型訓練組的AUC為0.96(95%CI,0.95～0.97),驗證組的AUC為0.88(95%CI,0.78～0.98),見圖5。采用Delong檢驗比較上述3種模型AUC之間的差異,在驗證組中,TIRM+DWI模型(AUC=0.88)、DWI模型(AUC=0.86)對HR表達的預測效能高于TIRM模型(AUC=0.68),差異有統計學意義(P<0.05); TIRM+DWI模型的AUC稍高于DWI模型,但差異無統計學意義(P>0.05),見表2。

表2 不同模型評估乳腺癌HR表達水平的預測效能

A:訓練組的ROC曲線; B:驗證組的ROC曲線; C:測試組的ROC曲線。

TIRM+DWI模型外部測試組的AUC為0.90(見圖5),TIRM_ wavelet-HHL_glrlm_GrayLevelVariance特征的預測貢獻較大,其SHAP權重均值為0.11(見圖6),高于篩選出的其他9個特征。

圖6 預測HR狀態聯合模型測試組的SHAP特征權重分布峰圖及權重均值直方圖

3 討論

乳腺癌是一種具有高度異質性的疾病,不同的受體表達狀態,其治療方式、生存期長短存在顯著差異[10-12]。除接受常規的手術治療、放化療外,HER-2陽性亞型可接受單克隆抗體的靶向治療,HR陽性亞型還可采用內分泌治療,因此對HER-2和HR表達水平的早期評估具有重大意義。乳腺癌多參數MRI廣泛應用于臨床常規成像檢查,并用于腫瘤診斷和治療反應評估[13]。影像組學已被用作一種定量分析方法,可提供關于腫瘤生物學特征的全面客觀信息[14]。目前,研究[15]表明,MRI磁共振影像組學模型在預測乳腺癌分子亞型、腋窩淋巴結轉移、新輔助化療反應方面具有較好效能。本研究共收集128例乳腺癌病灶,其中HER-2陽性32例、HER-2陰性96例,HER-2陽性例數占樣本總量的25.0%; HR陽性84例、HR陰性44例,HR陽性例數占樣本總量的65.6%; 整體分布水平與大多數乳腺癌受體表達水平相關的流行病學調查一致[2-3]。

既往研究[16-17]表明,MRI影像組學可作為預測乳腺癌HER-2表達狀態的有效工具。研究[18]發現,聯合多序列MRI的總特征構建的多層感知器(MLP)模型具有較佳的預測乳腺癌分子亞型效能,證明了多模態MRI特征早期預測HER-2表達狀態的可行性。另一研究[19]結果也表明,基于對比增強的影像組學在預測乳腺癌組織學亞型方面表現良好。

本研究與既往研究不同,本研究采用TIRM和DWI序列圖像,即在平掃的圖像上構建預測模型,評估不同模型的預測效能,發現基于TIRM和DWI序列圖像特征構建的聯合模型評估HER-2及HR狀態的效能優于單一序列,聯合模型在訓練組和驗證組均表現出良好的預測效能,外部測試組同樣證明了聯合模型的預測效能處于較高水平。這可能跟多序列圖像信息更加全面、綜合地反映病灶特點等相關。本研究采用SVM分類器構建用于預測乳腺癌HR表達的模型時,TIRM和DWI序列分別篩選了10個影像組學特征,大多數為高階變換特征,與相關研究[20]結果一致。本研究在訓練組及測試組中表明,形態學特征和低階統計學特征與HER-2與HR表達狀態的相關性較小,而基于變換的高階紋理特征與受體表達狀態存在較大的相關性,機器學習模型解釋可視化工具SHAP結果表明高階變換特征DWI_wavelet-HLL_glszm_SmallAreaHighGrayLevelEmphasis和TIRM_ wavelet-HHL_glrlm_GrayLevelVariance在最優預測HER-2和HR表達狀態方面具有較大貢獻力?？赡艿脑蚴歉唠A特征能夠反映出空間上體素之間的差異[21],從而更加能夠量化腫瘤的異質性。但研究存在一定局限性:首先,納入的乳腺癌病理類型較局限,主要為浸潤性導管癌(104例),未來需要收集其他病理類型乳腺癌納入研究; 其次,本研究為多中心、回顧性研究,樣本量較少,僅納入128例病灶進行研究,且過程中存在一定選擇偏倚,還需要擴大樣本量來驗證模型預測效能; 最后,本研究未分析乳腺癌MRI影像組學特征與其他基因表達的相關性,未來需要進一步探討MRI影像組學預測乳腺癌分子分型的能力。

綜上所述,基于TIRM和DWI序列圖像借助SVM算法構建的影像組學模型可以無創預測乳腺癌HER-2及HR的表達狀態,可避免對癌癥患者進行不必要的活檢。