?

聯合CT影像組學與深度學習特征建立列線圖預測食管鱗癌放療近期療效

2024-03-01 03:07朱正群鞏萍黃櫟有徐蘭章龍珍
放射學實踐 2024年2期
關鍵詞:組學食管癌深度

朱正群,鞏萍,黃櫟有,徐蘭,章龍珍

世界衛生組織報告顯示食管癌的全球發病率排名七位[1],我國食管癌患者中約90%為鱗狀細胞癌[2]。大部分食管癌患者在確診時已處于中晚期,難以接受手術治療。對于不能手術的食管癌患者,放療是主要治療手段之一[3]。有研究表明患者接受放療后的近期療效存在明顯差異[4],而近期療效與食管癌患者預后關系密切[5]。因此,準確預測患者放療近期療效,能夠幫助臨床為患者制定個性化的治療方案,對提高食管癌患者的治療效果,延長生存時間意義重大。

CT作為一種無創性影像學檢查,被臨床廣泛應用于食管癌檢查中,但傳統CT無法對食管癌患者放療近期療效進行準確預測。影像組學通過提取并分析圖像的高通量特征,能夠反映腫瘤整體的異質性,已有研究發現影像組學能夠較好地預測食管鱗癌放療近期療效[6]。深度學習技術通過自主提取特征在多種疾病中表現出了優異的診斷性能[7-8]。本研究通過提取并分析CT影像組學特征和深度學習特征建立聯合預測模型,旨在探討其對食管鱗癌患者放療近期療效的預測價值。

材料與方法

1.病例資料

回顧性分析2018年1月-2021年1月徐州醫科大學附屬醫院137例接受放療的食管鱗癌患者的CT影像和臨床病理資料。病例納入標準:①內鏡活檢病理結果為食管鱗癌;②患者接受根治性放療;③治療前行CT掃描及食管鋇餐檢查。病例排除標準:①合并有遠處轉移和患有其他惡性腫瘤;②缺少臨床和復查影像資料;③CT圖像質量不能滿足影像組學分析。

患者放療結束后3個月行胸部CT和食管鋇餐檢查,與治療前的影像資料進行比較。根據實體瘤療效評價標準(response evaluation criteria in solid tumours,RECIST)1.1版將治療效果分為完全緩解(complete response,CR)、部分緩解(partial response, PR)、病變穩定(stable disease,SD)和病變進展(progressive disease,PD),其中PR與CR患者被定為治療有效組,SD與PD患者被定為治療無效組。

2.檢查方法

CT檢查采用飛利浦BigBore大孔徑CT,掃描參數:管電壓120 kV,管電流120 mA,螺距0.2,掃描層厚5 mm,矩陣512×512,重建層厚5 mm。增強掃描通過高壓注射器注射對比劑碘克沙醇,劑量1.5~2.0 mL/kg,流率3.0 mL/s,注射對比劑25 s后進行掃描,獲得動脈期圖像。

3.圖像分割和特征提取

以DICOM格式下載患者動脈期CT圖像,由1位有5年CT診斷經驗的醫師在勾畫軟件中對食管癌腫瘤區域進行獨立人工感興趣區(region of interest,ROI)勾畫,勾畫時避開食管空腔和其他組織結構(圖1)。通過MRIcroGL圖像處理軟件對CT圖像與ROI進行重采樣,對CT圖像三維方向的像素變化進行校正。重采樣后的CT圖像與ROI層厚設置為1 mm×1 mm×1 mm,保持像素在3維方向的各向同性?;赑yradiomics 1.2.0軟件包利用一階統計量、灰度共生矩陣、灰度游程矩陣、小波變換等方法從每例患者CT圖像中提取影像組學特征395個。

圖1 胸中段食管癌患者,男,75歲。手動勾畫ROI三方向觀,紅色區域為ROI。

通過pytorch1.04框架建立ResNet18深度學習網絡,通過遷移學習技術將由128萬張圖像訓練得到的ImagNet數據集預訓練模型參數遷移到ResNet18深度學習網絡中。在預訓練模型參數基礎上通過訓練集數據對模型參數進行微調并凍結深度學習網絡的參數權重,使模型各層的參數不再進行更新。由于Res-Net18采用的是二維卷積核,只能對二維圖像進行深度特征提取。因此,研究選取每例患者腫瘤直徑最大的層面ROI作為深度特征提取圖像,將圖像調整成224×224×3像素輸入到網絡中對圖像進行多次卷積。輸入圖像經過17層卷積層后得到7×7×512維張量,對提取到的張量進行自適應平均池化處理,最終得到512個深度特征。

為了保證提取特征的一致性,研究隨機選取20例患者,由另一位有7年CT診斷經驗的醫師進行2次獨立勾畫ROI并通過相同方法進行影像組學特征和深度學習特征的提取。采用組內相關系數(intraclass correlation coefficient,ICC)比較2位醫生提取特征的一致性,選取ICC>0.75的特征進行后續分析。

4.模型建立

所有患者依照7:3的比例被隨機劃分為訓練集和驗證集。通過最小絕對收縮和選擇算子(least absolute shrinkage and selection operator,LASSO)方法對訓練集中的影像組學特征和深度學習特征分別進行降維篩選。被篩選出的影像組學特征和深度學習特征依照各自特征回歸系數進行線性加權,最終分別計算得到影像組學得分(Radscore)和深度學習得分(Deepscore)。分別納入臨床指標(年齡、性別、T分期、N分期、TNM分期、放療劑量、是否化療)、影像組學得分和深度學習得分三方面參數,根據納入參數不同分別建立臨床模型(臨床參數)、影像組學模型(臨床參數+影像組學得分)以及聯合模型(臨床參數+影像組學得分+深度學習得分)。通過單因素與多因素分析得到影響食管癌放療近期療效的獨立預測因子?;诙嘁蛩剡壿嫽貧w建立預測模型,應用似然比統計量,利用赤池信息量準則(akaike information criterion,AIC)為停止規則,在AIC最小時停止后向逐步選擇。利用列線圖對邏輯規模模型進行可視化,并通過校準曲線評價模型的校準度。利用Hosmer-Lemeshow檢驗評價預測模型的擬合度。分別繪制3種預測模型的受試者工作特征(receiver operating characteristic curve,ROC)曲線,并計算其曲線下面積(area under curve,AUC)。采用Delong法比較臨床模型、影像組學模型以及聯合預測模型間的AUC差異。在此基礎上,采用決策曲線分析(decision curve analysis,DCA)對模型的臨床凈獲益進行量化,比較3種模型在不同閾值概率下的臨床應用價值。

5.統計學分析

采用R語言(Version3.5.1)進行統計學分析。對連續變量行正態性檢驗,符合正態分布的連續變量以均值±標準差表示,采用獨立樣本t檢驗進行組間比較;不符合正態分布的連續變量以中位數(上、下四分位數)表示,采用Mann-WhitneyU檢驗進行組間比較。分類變量采用皮爾遜χ2檢驗進行組間比較。采用glmnet進行Lasso回歸分析,rms包進行列線圖繪制,pROC包進行ROC曲線繪制,ResourceSelection包進行擬合度檢驗,rmda包進行DCA分析。以P<0.05為差異有統計學意義。

結 果

1.臨床資料分析結果

本研究共納入137患者,其中有效組患者65例,無效組患者72例。統計學分析結果顯示,有效組中T4期患者所占比例明顯低于無效組(P=0.021),接受化療患者所占比例明顯高于無效組(P=0.017,表1)。訓練集與驗證集兩組患者的臨床指標之間差異均無統計學意義(P均>0.05)。

表1 有效組與無效組患者的臨床指標比較 (n,%)

2.特征篩選結果

在特征選擇過程中,共納入306個ICC>0.75的影像組學特征。通過LASSO回歸分析,經過5折交叉驗證后,當λ值為0.1011002時得到6個系數非零最佳影像組學特征(圖2)。對6個特征進行回歸系數加權后得到影像組學得分為Radscore=-0.08396648+original_glcm_ClusterProminence×0.18517479-wavelet_HHH_glcm_Correlation×0.08976676+log_sigma_1mm_3D_glcm_ClusterShade×0.07762019+log_sigma_2mm_3D_glcm_ClusterShade×0.05812535-log_sigma_5mm_3D_glcm_Cluster-Shade×0.07351695-log_sigma_5mm_3D_glcm_InverseVariance×0.01466633。訓練集中有效組的Radscore[0.03(-0.12,0.21)]明顯高于無效組[-0.24(-0.36,-0.06)],差異有統計學意義(Z=-4.572,P<0.001)。驗證集中有效組的Radscore[-0.03(-0.15,0.15)]明顯高于無效組[-0.19(-0.30,-0.08)],差異亦有統計學意義(Z=-3.216,P<0.001)。

圖2 LASSO回歸參數圖。a)5折交叉驗證得到參數λ值,左右兩條虛線分別為LASSO均方誤差最小值對應的λ值和最小誤差1倍標準差對應的λ值;b)影像組學特征的LASSO系數曲線,在均方誤差最小值1倍標準差處繪制虛線得到6個影像組學特征。 圖3 LASSO回歸參數圖。a)5折交叉驗證得到參數λ值,左右兩條虛線分別為LASSO均方誤差最小值對應的λ值和最小誤差1倍標準差對應的λ值;b)深度學習特征的LASSO系數曲線,在均方誤差最小值1倍標準差處繪制虛線得到6個深度學習特征。

深度學習特征依據f1到f512依次命名,納入413個ICC>0.75的深度學習特征。經過LASSO回歸分析,當λ值為0.1371363時得到6個系數非零最佳深度學習特征(圖3)。對6個特征進行回歸系數加權后得到深度學習得分為Deepscore=-0.08449667-0.01013450×f61-0.08460169×f324-0.00107008×f348+0.16836871×f369-0.04141898×f404-0.08245554×f409 。訓練集中有效組的Deepscore[0.08(-0.13,0.24)]顯著高于無效組[-0.25(-0.39,-0.14)],差異有統計學意義(Z=-5.071,P<0.001)。驗證集中有效組的Deepscore[0.02(-0.15,0.16)]顯著高于無效組[-0.22(-0.42,-0.07)],差異亦有統計學意義(Z=-3.041,P=0.003)。

3.預測模型建立

對患者臨床資料、Radscore、Deepscore分別行單因素分析,結果顯示TNM分期(Ⅳ期)、是否化療(是)、Radscore及Deepscore有統計學意義(P<0.05,表2)。

表2 單因素分析結果

基于單因素分析結果,分別對臨床模型、影像組學模型及聯合模型進一步行多因素分析,結果顯示TNM分期(Ⅳ期)、是否化療(是)為臨床模型的獨立預測因子,TNM分期(Ⅳ期)、Radscore是影像組學模型的獨立預測因子,TNM分期(Ⅳ期)、Radscore及Deepscore是聯合模型的獨立預測因子(表3)?;谏鲜霆毩㈩A測因素,利用赤池信息量準則為停止規則,對篩選出的變量進行后向逐步選擇,分別建立 3 種 logistic 回歸模型。

表3 3種模型多因素分析結果

4.模型比較

臨床模型、影像組學模型以及聯合模型在訓練集與驗證集中的診斷效能見表4。聯合模型在訓練集中預測食管鱗癌患者放療近期療效的AUC值為0.904,顯著高于影像組學模型(AUC=0.814,Z=-2.851,P=0.004)以及臨床模型(AUC=0.662,Z=-4.865,P<0.001,圖4a)。聯合模型在驗證集中預測食管鱗癌患者放療近期療效的AUC值為0.938,顯著高于臨床模型(AUC=0.644),差異有統計學意義(Z=-3.36,P<0.001);高于影像組學模型(AUC=0.852),但差異無統計學意義(Z=-1.692,P=0.091,圖4b)。

表4 3種模型在訓練集與驗證集中的診斷效能

圖4 臨床模型、影像組學模型以及聯合模型預測食管鱗癌患者放療近期療效的ROC曲線。a)訓練集;b)驗證集。 圖5 聯合預測模型列線圖。 由TNM、Radscore和Deepscore得分相加為總得分,根據總得分取值可獲得食管癌患者放療近期有效的概率。 圖6 列線圖校準曲線。 圖7 3種模型在驗證集上的決策曲線。All假設所有患者均接受放療,None假設所有患者均不接受放療。

對表現最好的聯合模型繪制列線圖(圖5)。聯合預測列線圖在訓練集和驗證集中的校正曲線見圖6,列線圖在訓練集和驗證集中的預測結果和觀察結果均顯示出良好的一致性。Hosmer-Lemeshow 檢驗結果顯示聯合預測列線圖在訓練集和驗證集中擬合優度檢驗結果差異均無統計學意義(X=8.628、5.836,P=0.375、0.666),表明列線圖預測結果沒有偏離完美擬合。決策曲線分析結果顯示在0.1~0.9和0.97~0.99的閾值范圍內使用聯合預測列線圖獲得的臨床受益要高于臨床模型和影像組學模型(圖7)。

討 論

隨著食管癌患者人數的逐年遞增,臨床迫切需要一種便捷、可靠的診斷方法來預測食管癌放療的近期療效。本研究基于臨床指標、影像組學特征及深度學習特征開發并建立了聯合模型,用于食管鱗癌放療近期療效的預測。聯合模型中包含TNM分期、Radscore和Deepscore等3個指標,結果顯示聯合模型在訓練集與驗證集中的AUC分別達到0.904和0.938,表明聯合模型能夠準確預測食管鱗癌患者放療的近期療效,有助于食管鱗癌患者個體化治療方案的制定。

目前,已有研究通過影像組學對食管癌放化療療效進行預測[9-11]。Luo等[9]從CT圖像中基于7個影像組學特征建立Radscore,并發現TNM分期和Radscore是預測食管癌放化療療效的獨立預測因子。本研究篩選出6個影像組學特征計算得到Radscore,并發現TNM分期(Ⅳ期)和Radscore是影像組學模型的獨立預測因子,結果與既往研究相似。TNM分期是臨床醫生判斷食管癌患者預后的一項重要指標。TNM Ⅳ期表示病變浸潤到外膜以外的組織,有淋巴結轉移,且存在遠處器官轉移,意味著患者已處于食管癌晚期,其治療效果往往較差。相關研究顯示對Radscore有貢獻的6個影像組學特征均屬于灰度共生矩陣,該類特征能夠反映腫瘤整體的異質性[12-13],研究結果提示2組患者在腫瘤異質性上存在差異。造成異質性差異的因素可能與腫瘤內血流灌注情況、血管分布情況、細胞增殖和壞死等因素有關[14-15]。

既往研究大多單純利用影像組學對食管癌患者近期療效進行預測,但影像組學特征均由人為定義,其能夠反映的圖像細節較為有限。這導致影像組學模型的預測準確度難以滿足臨床需要。深度學習通過數據進行自主學習擺脫了人工定義的限制,并在醫學圖像分析領域取得巨大成功[16-17]。已有研究證實深度學習特征能夠提高影像組學模型的精確度[18-19]。目前,尚未有研究利用深度學習特征對食管鱗癌放療近期療效進行預測。因此,本研究通過ResNet18深度學習網絡進行深度特征提取,利用LASSO回歸篩選出6個最佳深度特征計算得到Deepscore。結果顯示訓練集和驗證集中有效組的Deepscore均顯著高于無效組。多因素分析結果顯示Deepscore是食管鱗癌患者放療近期療效的獨立預測因子。上述結果表明深度特征能夠對食管鱗癌放療近期療效進行預測。本研究聯合Deepscore、TNM分期與Radscore建立聯合模型,結果顯示聯合模型在訓練集中預測食管鱗癌患者放療近期療效的AUC為0.904,顯著高于影像組學模型(AUC=0.814)。驗證集中聯合模型的AUC為0.938,高于影像組學模型(0.852),但AUC差異無統計學意義(P>0.05),這可能與驗證集樣本量較小有關。DCA曲線分析結果顯示聯合模型在驗證集中的AUC要大于臨床模型和影像組學模型,在0.1~0.9和0.97~0.99的閾值范圍內聯合模型具有更好的臨床實用性,表明深度學習特征能夠進一步提高預測模型的診斷效能和臨床實用性。

本研究存在以下局限性:①本研究僅納入單中心數據,研究結果需要外部數據驗證;②本研究的數據量較小,擴大數據量能夠進一步提升模型性能;③本研究中ROI為醫生手動勾畫,特征提取的穩定性受人為因素制約。

綜上所述,基于CT影像組學和深度學習特征開發的聯合預測列線圖能夠準確地預測食管癌放療近期療效,可以為臨床提供一種快捷、無創且有效的預測手段。

猜你喜歡
組學食管癌深度
深度理解一元一次方程
口腔代謝組學研究
深度觀察
深度觀察
深度觀察
基于UHPLC-Q-TOF/MS的歸身和歸尾補血機制的代謝組學初步研究
miRNAs在食管癌中的研究進展
MCM7和P53在食管癌組織中的表達及臨床意義
食管癌術后遠期大出血介入治療1例
代謝組學在多囊卵巢綜合征中的應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合