?

預測膠質瘤復發和術后生存期的MRI影像組學初步研究

2024-01-04 12:36翟曉陽任進發程思佳毛珂董亞寧韓東明
磁共振成像 2023年12期
關鍵詞:組學膠質瘤特征

翟曉陽,任進發,程思佳,毛珂,董亞寧,韓東明

作者單位:新鄉醫學院第一附屬醫院核磁共振科,新鄉 453100

0 前言

膠質瘤是最常見的原發性腦部腫瘤,其主要累及成人,惡性率為80%[1-2]。惡性膠質瘤會直接影響患者的生活質量和認知功能障礙,其術后臨床結局往往不佳[3]。目前膠質瘤患者標準的治療方案為最大范圍地進行切除,然后聯合放療和/或同時使用替莫唑胺化療[4]。盡管進行了積極的治療,患者的術后仍然很差,其中位總生存期(overall survival, OS)為29.6 個月,五年生存率為7.2%[5-6]。在常規的MRI 圖像上膠質瘤復發或治療等相關反應表現相似,很難通過常規的圖像將兩者區分開來。雖然隨時間推移的連續成像可以嘗試區分假性進展和真正的腫瘤復發,但這種明確區分通常需要數月的時間,通常會導致患者治療不足或過度治療的風險,因此發現患者術后是否復發對患者的預后治療方案的制訂和生存質量的提高非常重要。

影像組學是醫學影像和計算機領域相結合的新興交叉學科,通過更加全面地描述感興趣區(region of interest, ROI)內的信息,可以捕捉遠超肉眼觀察到的圖像信息,這些特征能夠更好地反映腫瘤的異質性。在最近研究中顯示,使用這些特征,特別是結合機器學習算法后在預測膠質瘤O6-甲基鳥嘌呤-DNA甲基轉移酶(O6-methylguanine-DNA-methyltransferase,MGMT)啟動子甲基化[7]、異檸檬酸脫氫酶(isocitrate dehydrogenase, IDH)突變狀態[8-9]、腫瘤分級[10]的診斷性能和預測患者的預后效果[11]方面顯示出了很有前景的可行性。這些研究聚焦于腫瘤的實體成分[12],而且忽略了周圍環境對疾病本身的影響,同時模型的效能仍有提升空間[13],并且缺乏對術后較長生存期的探討。在這項研究中,我們計劃提取來自瘤周水腫區域(edema region, ED)和術前瘤內增強區域(preoperative enhancement region, POE)的影像組學特征,建立預測膠質瘤術后復發的機器學習模型,并研究其與術后生存期之間的關系。

1 材料與方法

1.1 研究對象

2018年1月至2022年4月,回顧性分析新鄉醫學院第一附屬醫院120例經病理證實的原發性膠質瘤患者病例。此外,所有數據在處理前都進行了脫敏處理,所有患者個人信息都經過去識別化和匿名化處理。本研究遵守《赫爾辛基宣言》,經新鄉醫學院第一附屬醫院倫理委員會批準,免除受試者知情同意,批準文號:EC-023-073。入組標準:(1)術后病理證實為膠質瘤的患者;(2)術前一周內行常規MRI 檢查,包括T2WI、對比增強(contrast-enhanced, CE)T1WI和T2液體衰減反轉恢復(T2 fluid attenuated inversion recovery, T2-FLAIR)序列掃描,掃描參數見表1;(3)術后替莫唑胺和同步放化療。排除標準:(1)術后缺乏規范的治療方案;(2)圖像運動偽影較大或圖像質量差;(3)缺乏術后完整的臨床影像學檢查;(4)無術后影像學隨訪或隨訪丟失。根據這些標準最終120名患者納入原始隊列中,并且收集了這些患者的臨床資料和病理結果。

表1 機器掃描參數Tab.1 The parameters of machine scanning

根據二次手術病理結果或者神經腫瘤反應評價(Response Assessment in Neuro-Oncology, RANO)標準[14],真性進展或者復發定義:(1)至少兩次間隔≥4 周的連續影像學檢查,兩次掃描的結果均顯示病灶直徑乘積之和增加≥25%;(2)隨訪MR 圖像內有新的或增大的強化。

63名患者被定義為復發/進展,57名患者被定義為治療相關反應。所有患者的隨訪主要為復診和電話方式,末次隨訪時間為2023 年5 月13 日。生存時間的起點是患者首次入院MRI確診為膠質瘤的日期,終止日期是死亡時間或末次隨訪時間?;颊叩呐R床資料納入到研究中,包括性別、年齡、WHO分級、IDH狀態、Ki-67 表達水平、1p/19q 和MGMT 甲基化狀態。為了評價Ki-67的表達程度,我們將截斷指數設為20%,<20%表示低表達,≥20%表示高表達,詳見表2。

1.2 處理過程

研究流程包括ROI勾畫、圖像預處理、特征提取、特征選擇和影像組學模型構建。兩名影像科醫師(3 年診斷經驗的住院醫師)獨立勾畫所有的圖像,并在勾畫完成后時隔一個月再次勾畫,同時由第三位有30 年臨床診斷經驗的醫師重新審查圖像,與兩名醫師結果不一致時,三人商議重新確定圖像ROI。為保證ROI 的可重復性,隨機抽取30 例患者,由不同的放射科醫生進行兩次ROI分割,然后計算兩醫師各自提取特征之間的組內相關系數。所有的ROI包含POE和ED,均使用ITK-SNAP 軟件手動勾畫?;颊叩腡2WI和CE-T1WI 圖像納入研究,并轉化為NIFTI 格式。使用剛性和仿射變換將T2WI配準到相應的CE-T1WI,并且通過N4偏置場校驗。接著將體素重采樣為1 mm×1 mm×1 mm,然后用最近鄰插值將灰度數據離散化25 個bin 值寬度。所有特征提取在Python 3.9 版本使用Pyradiomics包上完成。為了獲取高通量特征,本研究采取了非線性強度在圖像體素(平方、平方根、對數和指數)上進行變換;高斯拉普拉斯濾波器sigma值為1、2、3、4、5;對一階統計和紋理特征進行了8種小波變換算法(分別為LLL、LLH、LHL、LHH、HLL、HLH、HHL和HHH)。

1.3 特征選擇和模型構建

在對數據進行標準化處理后,為了減少冗余特征和不相干特征對結果的影響,同時提高模型的精準度,我們對特征進行了篩選。首先通過組內相關系數法分析了特征之間的相關性,閾值設置為0.75,其中大于0.75的特征納入下一步分析。然后使用方差分析檢驗復發組與非復發組之間的差異性,P<0.05 認為差異具有統計學意義,其特征納入后續分析。接著采用Spearman相關分析計算特征之間的相關系數,評價特征間的多重共線性。如果一對特征的系數值≥0.9 或≤-0.9,則只保留診斷性能較好的特征。最后通過最小絕對收縮和選擇算子(least absolute shrinkage and selection operator regression, LASSO)回歸并選擇最小lamda 值剔除回歸系數為零的冗余特征,見圖1、2。

圖1 最小絕對收縮和選擇算子(LASSO)特征選擇圖。圖2 選擇最小lambda作為閾值的特征選擇圖。MSE:均方誤差。Fig.1 The least absolute shrinkage and selection operator (LASSO)feature selection plot.Fig.2 Feature selection plot for selecting the minimum lambda as the threshold.MSE: mean squared error.

影像組學特征分別從POE和ED得到了5264個特征,為了確保特征的可重復性,采用Mann-WhitneyU檢驗選擇了615 個與復發結果顯著相關的特征。然后使用Spearman相關性分析檢測了特征之間的相關性,最終留下了191 個特征。最后通過LASSO 回歸選擇最小lambda 值得到了15 個特征。這些特征類包括firstorder 特 征(n=3, 20.00%)、GLSZM(n=6,40.00%)、GLRLM(n=1, 6.67%)、GLDM(n=1, 6.67%)和GLCM(n=4, 26.67%)組成,見圖3。

圖3 特征的權重。ED:水腫區域;CE-T1WI:T1 對比增強加權圖像;POE:術前瘤內增強區域。Fig.3 Weightings of features.ED: edema region; CE-T1WI: contrast-enhanced T1-weighted image; POE: preoperative enhancement region.

我們使用Python 3.70 中的scikit-learn 包進行了模型構建和評估。根據7∶3 的比例隨機把患者劃分為訓練集和測試集,其中訓練集納入84人、測試集36 人。采用邏輯回歸(logistic regression,LR)模型,最終篩選的特征納入模型當中,采用網格搜索和5折交叉驗證的方法篩選出最優的擬合模型,并在測試集中檢驗模型的效能。建立三種不同的LR模型,包括只含有POE、POE+ED和含有臨床指標加POE、ED的融合模型。為了評估患者的生存情況,我們建立了包含IDH、影像組學評分(Rad-score)和復發狀態的COX比例風險回歸諾模圖。根據Rad-score評分的均值把患者分為低危組(<均值)和高危組(≥均值),根據IDH 狀態分為IDH 野生型組和IDH 突變型組,根據復發情況分為復發組和未復發組,分別在訓練集和測試集中對患者的生存率進行Kaplan-Meier(KM)分析。采用受試者工作特征(receiver operating characteristic, ROC)曲線、校準曲線和決策曲線分析(decision curve analysis, DCA)展示模型的預測能力。計算POE、ED加POE和融合模型的診斷指標,包括曲線下面積(area under the curve, AUC)、95%置信區間(confidence interval,CI)、特異度、敏感度和準確度。Rad-score計算公式如下:

1.4 統計學分析

使用R 軟件(R version 4.3.0)和Python(3.7.12)平臺進行統計學分析。用Kolmogorov-Smirnov檢驗確定連續變量的正態或非正態分布。連續變量用均數±標準差表示,使用Mann-WhitneyU檢驗或Student'st檢驗比較組間差異。使用卡方檢驗或Fisher's精確檢驗來比較分類變量之間差異性。采用Spearman 相關分析計算最終選定特征之間的相關系數,見圖4。利用ROC曲線評估模型的診斷性能,并計算AUC來估計預測模型的判別性能。統計學顯著性水平均為雙尾,P<0.05表示差異具有統計學意義。

圖4 最終選擇特征之間的相關性熱圖。Fig.4 Correlation heatmap in the final selcetion of features.

2 結果

2.1 基線資料分析結果

該研究包括120名患者,其中男57例(47.5%),女63 例(52.5%),平均年齡為53.81 歲,平均生存時間為20.04個月,中位生存時間為15.50個月。根據RANO診斷標準或病理結果,術后復發患者63例(52.5%),未復發患者57例(47.5%)。復發組和未復發組性別和年齡差異無統計學意義。納入的臨床指標中WHO 分級、1p/19q、TP53、ATRX、Ki-67和CD34等差異均無統計學意義,其中IDH狀態在復發組與未復發組之間差異具有統計學意義(P=0.040)。所有患者的臨床資料見表2。

2.2 模型分析結果

把最終得到影像組學特征納入到LR 模型當中后,測試集中三種模型(POE、POE+ED 和融合模型)的AUC 分別為0.859、0.866 和0.897,見圖5。訓練集中三種模型的AUC 分別為0.905、0.925 和0.923,其他指標詳情見表3。通過對三種模型的結果對比發現,融合模型對膠質瘤術后的預測效果最好,在訓練集和測試集中AUC 分別為0.923 和0.897。測試集的校準曲線顯示,所有的模型擬合程度都比較好,見圖6。DCA 表明,當閾值概率超過0.24 時,3 個模型都有利于診斷膠質瘤復發,表明基于影像組學的模型可以用于臨床,并使患者受益,見圖7。

圖5 測試集中不同模型之間的受試者工作特征曲線。AUC:曲線下面積。Fig.5 Receiver operating characteristic curves of different models in test sets.AUC: area under the curve.

圖6 測試集不同模型的校準曲線。Fig.6 Calibration curve of different models in test sets.

圖7 測試集不同模型的臨床決策曲線。Fig.7 Clinical decision curve of different models in test sets.

表3 不同模型之間的效能Tab.3 The performance in different models

2.3 生存資料分析結果

COX回歸分析顯示IDH野生型是影響生存的危險因素[風險比(hazard ratio, HR)=0.79,95%CI:0.50~1.30];高Rad-score 是影響生存的危險因素(HR=1.40,95%CI:0.66~2.80);術后復發是影響生存的危險因素(HR=0.82,95%CI:0.46~1.50),見表4。通過COX 回歸分析諾模圖顯示,在全部膠質瘤患者中,三年生存率為17.5%,五年生存率為2.5%,見圖8。KM 生存曲線分析顯示在測試集中IDH 突變型比IDH 野生型的生存情況較好;復發組的生存情況要低于未復發組;根據Rad-score進行分組顯示高危組的生存情況要差于低危組的生存情況,但3個分組之間生存情況并未顯示出差異,見圖9。

圖8 生存時間諾模圖。IDH:異檸檬酸脫氫酶,1代表突變型,0代表野生型;label:復發狀態,1代表復發,0代表未復發;Rad_score:影像組學評分。Fig.8 Nomogram for predicting survival time.IDH: isocitrate dehydrogenase, 1 for mutant type, 0 for wild type; label: relapse status, 1 for recurrence, 0 for no recurrence; Rad _ score: Radiomics score.

圖9 訓練集和測試集不同分組的Kaplan-Meier分析。Fig.9 Kaplan-Meier analysis of different group in train and test sets.

表4 多因素COX回歸分析Tab.4 Multifactorial COX regression analysis

3 討論

影像組學的概念由Lambin 在2012 年提出[15],通過自動化算法從選定的ROI提取大量圖像信息,進而捕獲腫瘤組織中的有效生物學信息。在這項研究中我們采用了來自于POE 和ED 的多參數影像組學特征對膠質瘤術后復發進行預測,經過特征降維得到了15個影像組學特征,同時結合臨床變量,納入LR模型中的綜合模型取得最佳效能,其測試集AUC為0.897。DCA顯示當閾值大于0.24時,所有的模型均能展示出良好的臨床實用性。本研究使用KM分析對患者生存期進行初了步的探討,在復發與未復發組、IDH 突變與野生型組和Rad-score 高危和低危組之間展示出了一定程度的差異。

先前學者的結果顯示[16],通過捕捉瘤內的特征驗證了影像組學可以作為預測患者無病生存期的重要工具。之前的研究通過對腫瘤內部定量參數的測量,驗證了瘤內特征可以對膠質瘤術后復發狀態進行鑒別[17]。最近有研究使用了ED 作為ROI 對膠質瘤患者的生存情況進行了研究,結果顯示ED 的特征對生存期的預測有較好的性能[18]。在我們的研究中綜合納入POE 和ED 的影像組特征對術后復發進行預測,并且顯示出了較好的診斷效果,其測試集AUC 為0.866。

3.1 瘤內區域分析

先前研究顯示膠質瘤內部呈現不同程度的細胞異質性,其中腫瘤內的小膠質細胞可以促進腫瘤細胞的生長,此外對治療具有高抵抗性的膠質瘤干細胞很難被徹底清除,進而會產生新的腫瘤細胞[19]。同樣的,瘤內異質性還會影響腫瘤的進展和對治療的相關反應[20-21]。在之前的研究中這種腫瘤內的異質性已經初步被定量參數表示,例如擴散峰度成像[17]、酰胺質子轉移成像[22]等,但空間上的豐富信息通常被丟棄。在本研究中通過影像組學的方法捕捉瘤內的生物信息,其中包含了空間信息,并且展現出了較好的效果,在瘤內模型的AUC為0.859。

3.2 ED分析

ED 是膠質瘤常見的影像表現,在圖像上表現為高信號區域。腫瘤細胞表達過多的血管內皮生長因子會促進新生的毛細血管,使血管內皮細胞之間的緊密連接遭到破壞,細胞間隙增大導致血漿、腫瘤細胞等從異常腫瘤毛細血管滲出,因此ED 可能含有浸潤性腫瘤細胞[23-24]。此外,膠質瘤術后ED是術后一個高發的部位,大約90%的復發出現在這里[25]。之前文獻表明ED 中不同細胞間的相互作用會導致組織缺氧、血管生成和腫瘤浸潤,而這些都使得術后患者的生存率低下[26]。另外,當手術切除范圍大于增強范圍時,腫瘤的額外切除均能提高OS[27],這表明ED可能含有對診斷有意義的生物學信息。因此我們將ED納入ROI,并且在結合瘤內區域特征后模型效能得到明顯提升。

3.3 臨床特征和影像組學特征分析

在本研究最終選定的特征中,基于形狀特征統計了ROI 的幾何特征。之前的研究顯示一些基于圖像的典型形狀特征對鑒別膠質瘤復發和放射性壞死有一定的幫助[28-29],這與本研究采取的特征相似,都從圖像上對腫瘤進行描述,表明了紋理特征對于疾病診斷的可行性。本研究臨床資料分析顯示,年齡、性別等臨床指標在復發與相關性反應之間均無顯著差異。而IDH 狀態顯示出與膠質瘤復發有顯著的相關性。之前的研究顯示不同IDH 狀態的腫瘤生物學行為不同,IDH 野生型的彌漫性星形細胞瘤有著更高的向高級別膠質瘤惡性轉化的潛力[30],并且兩者預后及對術后化療的敏感度不同,IDH 突變型彌漫性星形細胞瘤預后更好并對化療藥物替莫唑胺的敏感度更高[31],因此納入IDH 的狀態可以增加對復發的預測能力,在我們的分析中IDH突變型的患者生存時間普遍長于IDH 野生型的患者,這與IDH 突變型對化療敏感的研究結果相一致。

3.4 局限性

本研究仍然存在一些局限性:(1)本研究不同分組之間KM分析的統計學檢驗并沒有顯示出明顯的差異,這可能跟我們的樣本本身存在選擇性差異有關,因此我們仍需要大樣本和多中心的數據去驗證本研究的結果。(2)MGMT 的甲基化狀態沒有顯示出組間差異性,但不同狀態MGMT對放化療的敏感度不同,因此以后需要對此擴大MGMT 患者的樣本量,進一步分析不同的狀態MGMT 是否會影響患者的復發和術后狀態。(3)機器學預測的最終結果仍有提升的空間,因此更改算法,例如采用深度學習技術,和納入更多的臨床變量對模型效能可能會有一定的提升。

4 結論

綜上所述,本文使用來自于ED 和POE 的多參數影像組學特征,結合臨床特征建立的LR 模型展現了術前預測膠質瘤患者術后狀態的可能性,并且使用根據影像組學特征計算的Rad-score 對患者的生存狀態進行了初步評估,基于MRI的影像組學預測膠質瘤患者術后復發有較好的效果,并且可以初步評估術后生存期。

作者利益沖突聲明:全體作者均聲明無利益沖突。

作者貢獻聲明:韓東明設計本研究的方案,對稿件重要內容進行了修改;翟曉陽設計本研究的方案,起草和撰寫稿件,獲取、分析或解釋本研究的數據;任進發設計本研究的方案,獲取、分析或解釋本研究的數據,對稿件重要內容進行了修改;程思佳、毛珂、董亞寧獲取和分析本研究的數據,對稿件重要內容進行了修改;全體作者都同意發表最后的修改稿,同意對本研究的所有方面負責,確保本研究的準確性和誠信。

猜你喜歡
組學膠質瘤特征
如何表達“特征”
不忠誠的四個特征
口腔代謝組學研究
基于UHPLC-Q-TOF/MS的歸身和歸尾補血機制的代謝組學初步研究
抓住特征巧觀察
DCE-MRI在高、低級別腦膠質瘤及腦膜瘤中的鑒別診斷
P21和survivin蛋白在腦膠質瘤組織中的表達及其臨床意義
代謝組學在多囊卵巢綜合征中的應用
Sox2和Oct4在人腦膠質瘤組織中的表達及意義
99mTc-HL91乏氧顯像在惡性腦膠質瘤放療前后的變化觀察
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合