?

基于差異化網絡分析的CT 平掃期影像組學模型可有效預測及解釋腎透明細胞癌WHO/ISUP核分級

2023-06-14 08:36漆安琪張海捷楊麗洋崔維維楊姍姍
分子影像學雜志 2023年3期
關鍵詞:網絡分析特征選擇組學

漆安琪,張海捷,殷 夫,楊麗洋,崔維維,楊姍姍,文 戈

1南方醫科大學南方醫院增城院區醫學影像科,廣東 廣州 511300;2深圳市第二人民醫院PET/CT 中心,廣東深圳 518052;3深圳大學信息工程學院,廣東 深圳 518052;4南方醫科大學南方醫院影像中心,廣東 廣州510515

腎透明細胞癌(ccRCC)是腎細胞癌中最常見的亞型,占比超過70%,惡性程度普遍較高,相比其它亞型預后也較差[1]。ccRCC的核分級與患者的5年生存率存在相關性,通常核分級越高,其生存期會越短[2-3]。目前,ccRCC分級系統采用的是世界衛生組織/國際泌尿病理學會(WHO/ISUP)的最新核分級系統[4-5]。該系統是根據核仁突出的情況,是否存在細胞的多形性以及橫紋肌樣或肉瘤樣形態來劃分的四分類的分級系統。研究表明,ccRCC患者的低級別(1~2級)核分級之間[6-7]和高級別(3~4級)核分級之間[2],他們的生存率并沒有差異,因此WHO/ISUP核分級系統也可被簡化為此二分類標準。在臨床治療方面,低級別ccRCC患者可采取相對保守的治療,如射頻消融、局部切除術或腹腔鏡手術、保留腎單位手術或主動監測;高級別ccRCC患者可能需要接受更多的根治性干預如手術切除和更密切的隨訪[8],因其腫瘤具有更高的侵襲性和死亡率[9]。術前明確患者的WHO/ISUP核分級,對指導其治療和臨床決策至關重要。

目前確定ccRCC的WHO/ISUP核分級的金標準是通過組織病理學檢查。然而,通過細針穿刺活檢確認核分級仍存在一些局限性[10-11]:活檢具有侵入性,可能會導致腫瘤擴散、出血以及感染等多種風險[12-13],并且穿刺活檢經常會低估腫瘤分級[14],對于位置較深或體積較小的腫塊,由于腫瘤獨有的異質性,可能會出現病理結果不太準確的情況[15]。因此,無創并且精準的術前預測ccRCC的病理分級的方法將對患者的治療具有重要的臨床意義。研究發現,影像組學通過其自身的影像組學特征(RFs)可反映腫瘤異質性的特點,可有效用于病理檢測、尋找致癌基因以及評估預后[16-17]。

在影像組學中,特征數量通常大于實驗樣本,故通常需要選擇合適的特征選擇的方法以減少對預測模型的干擾。隨著機器學習的發展,支持向量機、決策樹、隨機森林等機器學習方法,已廣泛用于影像組學的特征篩選,但仍然存在一些局限性。其中,最大的缺陷是忽略了冗余特征的相關信息,這意味著一些同樣重要的RFs會被舍棄。同時,大多數機器學習的特征選擇方法都是基于包裝式的框架,容易出現過擬和。最后,現有的機器學習的方法通常是黑箱操作,選擇特征的可解釋性不強。因此,需要一個更可靠的特征選擇方法以改善上述問題。

近年來,基于差異化網絡分析的特征選擇方法,在大規模數據分析方面表現出了出色的魯棒性,廣泛應用于相關疾病的生物標志物的識別[18]。差異化網絡分析以網絡拓撲結構為中心,通過比較兩個不同群體網絡之間的結構差異來選擇特征,特別在處理小樣本和不平衡樣本問題時表現突出。然而目前少有文獻報道其在影像組學中的相關應用。本研究旨在利用差異化網絡分析選擇特征,并以此構建ccRCC的WHO/ISUP核分級預測模型[19]。除此之外,本文希望探討通過此新的特征選擇的方法所選擇的RFs 與ccRCC 的無進展生存期(PFS)是否存在相關性,使影像組學預測模型及其特征具有更強的可解釋性。

1 資料與方法

1.1 一般資料

本研究為回顧性研究,已獲得南方醫科大學南方醫院倫理委員會審核批準,并免簽患者的知情同意書?;仡櫺苑治隽?015~2021年南方醫科大學南方醫院收治的腎細胞癌患者的臨床、病理、CT、隨訪資料,包括:年齡、性別、腫瘤最大徑、T 分期、生長模式以及WHO/ISUP核分級。納入標準:篩選病理檢查為腎透明細胞癌的患者納入研究;依據2016版WHO/ISUP標準,由2位病理學醫生獨立對組織標本進行重新閱片,并進行核分級(1~2級定義為低級別,3~4級定義為高級別);有完整CT平掃和增強圖像資料。排除標準:由于組織病理資料不全而無法進行重新核分級的腎癌患者;在CT檢查前已做過治療的腎癌患者;單側或雙側腎臟出現2個或2個以上病變的患者;腫瘤的囊性成分特征達到75%以上的腎癌患者;病理組織學中包含混合特征的腎癌患者,如同時含有透明細胞和乳頭狀特征等。最終共有175例患者被納入研究,其中訓練集105例,測試集70例。經統計,診斷為低級別ccRCC(按WHO/ISUP 標準為1~2級)有122例,高級別ccRCC(按WHO/ISUP標準為3~4級)有53例。訓練集和測試集患者所有特征的差異均無統計學意義(P>0.05,表1)。

表1 訓練集與測試集患者的臨床信息Tab.1 Patient's clinical information between the training set and test set

1.2 CT圖像采集

本研究病例采用西門子64 排CT(Siemens Somatom Definition CT)以及飛利浦256 層iCT(Philips Brilliance ICT)進行CT圖像采集。囑患者仰臥位,在屏氣后進行CT平掃及三期增強掃描。掃描范圍從膈頂到雙腎下極,使其包含有完整的腎臟及主要供血血管及鄰近組織。管電壓120 kV;管電流150~320 mA;層厚5 mm;層間距5 mm;視野360 mm;矩陣512×512。首先進行平掃期(NCP)掃描,在常規平掃結束后,根據患者體質量經肘前靜脈注射造影劑(碘海醇或優維顯),劑量為2 ml/kg,以2.5 ml/s的速度注射。在造影劑注射后的30~35 s 掃描皮髓質期(CMP)、60~70 s 掃描實質期(NP)、190~200 s掃描排泄期(EP)。

1.3 圖像分割和RFs提取

由2名具有腹部影像診斷經驗的的放射科醫生(醫生A:10年,醫生B:15年),使用ITK-SNAP軟件對CT圖像進行手動分割獲取感興趣區。在手工勾畫感興趣區時,其輪廓需與腫瘤邊緣保持2 mm的距離,以減少鄰近組織的干擾,如正常腎組織或周圍脂肪[20]。

為了評估分割圖像中提取特征的魯棒性,進行一致性檢驗。醫生A和B分別隨機為30張圖像繪制感興趣區,1周后醫生A再次重新分割同一批圖像,計算兩位放射科醫生提取的RFs的組內和組間相關系數。結果顯示,組內和組間相關系數均大于0.75,表示圖像分割的一致性很好,因此剩余的圖像由醫生A執行分割。所有圖像在提取特征前,均進行了重采樣、歸一化和濾波去噪的預處理。影像組學的特征提取基于PyRadiomics軟件平臺實現。

1.4 特征選擇

本文首次使用了一種基于Glasso的差異化網絡分析方法進行RFs選擇。Glasso是一種經典的最大熵網絡構建模型[21],通過稀疏懲罰極大似然估計的方法預測協方差矩陣的逆。它明確地從一個概率模型出發,利用聯合似然從多個條件中估計協方差矩陣的逆,并以此作為推斷的網絡結構。其一般形式可以寫成:

其中M是估計網絡,C是樣本協方差矩陣,tr表示矩陣的軌跡,det表示矩陣的行列式,λ是正則化參數。矩陣M中的元素描述了在去除間接影響后仍然存在的成對特征的相關性,從而提供了特征之間相互作用的更健壯的描述。

特征選擇的的具體流程如下:首先根據RFs的不同階段(NCP、CMP、NP、EP和ALL-P)構建5個實驗組。其中,NCP、CMP、NP和EP組的樣本僅包含相應期相的RFs,ALL組的樣本包含上述4個期相的所有RFs。在各個實驗組中,根據WHO/ISUP核分級把樣本分為低級別組(1~2 級)和高級別組(3~4 級)。然后,利用Glasso分別構建各實驗組中的高級別和低級別網絡。通過比較高低級別網絡拓撲結構之間的差異,構建各實驗組的WHO/ISUP高低級別的差異化網絡。

一個WHO/ISUP核分級差異化網絡示例圖(圖1)顯示,在高級別和低級別網絡中,特征A和C均存在連接,這意味著在這兩個網絡中,特征A與C的連接關系沒有發生變化,即沒有差異性。最后,根據各實驗組中構建的高低級別差異化網絡結構,通過節點度的直方圖選取各自的RFs,即網絡中排名較高的節點被選擇為重要的RFs(圖中紅色標記)。本實驗中所選特性的數量被設置為不超過15個。

圖1 WHO/ISUP核分級差異化網絡示例Fig.1 A sample of WHO/ISUP grade differential networks.

1.5 模型構建和效能分析

各模型均在訓練集上進行5次分層10折交叉驗證以檢驗其性能,并在測試集上進行獨立測試。每次10折交叉驗證中,訓練集分為內部訓練集和內部驗證集(9:1)。其中交叉驗證的數據劃分中保持相同的類分布。之后將各實驗模型在5次交叉驗證中的平均性能作為其在內部訓練集和內部驗證集上的最終性能,最后在測試集中進行測試。

在本實驗中,首先通過差異化網絡分析特征選擇得到NCP、CMP、NP、EP和ALL期相的RFs,之后通過Logistic回歸方法構建預測模型,最后篩選出其中性能最好的模型。通過ROC 曲線以及曲線下面積(AUC),進一步分別與最小絕對收縮和選擇算子(LASSO)、隨機森林和支持向量機模型等機器學習對照模型以及臨床特征模型行比較,評估所選模型的性能。

1.6 生存分析

進一步通過生存分析,探索WHO/ISUP核分級預測模型中所選RFs是否與PFS相關,以驗證所選特征的可解釋性。首先,進行Kaplan-Meier分析;然后,采用單因素和多因素Cox比例風險回歸模型研究與PFS相關的影像組學特征因素;最后,使用風險評分可視化描述所選擇的RFs。

1.7 統計學分析

采用SPSS22.0軟件進行統計學分析。分類數據以n(%)表示,連續數據以均數±標準差表示。采用非參數Mann-WhitneyU檢驗或獨立樣本t檢驗比較連續數據的組間差異;采用Fisher精確檢驗(樣本量≤5)或者卡方檢驗分析分類數據的組間差異。以P<0.05為差異有統計學意義。在生存分析中,使用surviminer軟件包中的surv-cutpoint函數自適應選擇了連續數據的最佳cut-off值,統計結果以及建模均由R 軟件執行,包括‘rms’,‘ggplot’,‘survival’,‘rmda’以及‘proc’軟件包。

2 結果

2.1 影像組學特征選擇

每個患者從單期CT圖像中提取107個RFs,包括18個一階統計特征、14個形狀的特征、24個灰度共生矩陣特征、14個灰度依賴矩陣(GLDM)特征、16個灰度運行長度矩陣(GLRLM)特征、16個灰度大小區域矩陣特征、5個相鄰灰度差矩(NGTDM)特征。因此從4期CT圖像中共提取428個RFs(4×107)。

通過差異化網絡分析特征選擇,NCP、CMP、NP、EP和ALL-P模型分別選取7、10、9、5和8個RFs。不同期相的差異化網絡(圖2,其中紅色節點表示所選的RFs)。

圖2 不同期相的差異化網絡圖Fig.2 Differential networks of different phases.

2.2 WHO/ISUP核分級預測模型的構建和性能比較

根據差異化網絡分析構建的不同期相模型在訓練集、驗證集和測試集的ROC曲線分析(圖3)。在訓練集中,NCP模型的AUC為0.78,表現最佳,優于其他模型(P<0.05)。在驗證集中,NCP模型(AUC=0.76)仍為最佳,優于其他單期模型(P<0.05)。最后在測試集中,NCP模型(AUC=0.75)依然是最好的兩個模型之一,另一個是ALL-P模型(AUC=0.76),性能均優于其他模型(P<0.05),但二者間的性能差異無統計學意義(P=0.063)。結果表明,NCP 模型具有良好的魯棒性,對WHO/ISUP核分級的預測能力較好,被選為最終模型。模型公式為NCP=-3.7×X1+6×X2+1.97×X3+2.62×X4+1.94×X5+6.73×X6+4.2×X7。NCP模型選擇的RFs的相關信息(表2)。

圖3 不同期相模型在訓練集(A)、驗證集(B)以及測試集(C)上的ROC曲線Fig.3 The ROC curves of different phase models in the training set (A),validation set (B) and test set(C).

表2 采用差異化網絡特征選擇的NCP期相模型的RFsTab.2 The RFs of NCP phase model using the differential network feature selection

NCP模型與其它機器學習模型(LASSO、支持向量機和隨機森林模型)在訓練集、驗證集和測試集中的ROC曲線(圖4)。在訓練集中,NCP模型和隨機森林模型AUC分別為0.78和0.84,優于其它對照組模型,但二者差異無統計學意義(P>0.05)。在驗證集中,所有機器學習模型的性能均發生了急劇下降,而NCP模型波動較小,在所有模型中表現最佳,AUC為0.76,優于其它模型(P<0.05)。最后在測試集中,大部分機器學習模型的性能同樣有大幅度降低,特別是支持向量機和LASSO模型,預測性能下降明顯,但NCP模型依然保持穩定。

圖4 NCP 模型與其他機器學習模型在訓練集(A)、驗證集(B)以及測試集(C)上的ROC曲線Fig.4 The ROC curves of NCP model and other machine learning models in the training set (A),validation set(B)and test set(C).

NCP模型與臨床對照模型(CICFs模型)及兩者聯合模型(CICFs-NCP模型)在訓練集、驗證集和測試集中的ROC曲線(圖5)。在訓練集、驗證集和測試集中,NCP模型均為最佳(AUC分別為0.78、0.76和0.75),優于其他模型(P<0.05)。NCP模型不僅具有良好的魯棒性,同時在聯合了NCP模型后,臨床模型的性能有了提高。

圖5 NCP 模型、臨床對照模型及聯合模型在訓練集(A)、驗證集(B)以及測試集(C)上的ROC曲線Fig.5 The ROC curves of NCP model、clinical control model and combined model in the training set (A),validation set(B)and test set(C).

2.3 K-M生存分析

NCP模型的RFs的Kaplan-Meier生存分析結果顯示,除特征X2(P=0.23)外,其余所有的RFs在高低分組間的差異有統計學意義(P<0.05,圖6)。

圖6 NCP模型RFs的Kaplan-Meier分析Fig.6 Kaplan-Meier analysis of the RFs of the NCP model.

2.4 單因素及多因素Cox回歸分析

單因素分析結果顯示,X1、X3、X4、X5、X6、X7,是PFS的風險因子(P<0.05),將其納入多因素Cox 回歸分析;多因素結果顯示,X3 以及X6 仍具有顯著性(P<0.05),是PFS的獨立風險因子(表3)。

表3 NCP模型中RFs的單變量和多變量Cox回歸分析Tab.3 The univariate and multivariate Cox regression analysis of the RFs of the NCP model

2.5 風險評分可視化分析

NCP模型特征在不同數據集上的ccRCC患者風險評分分析(圖7)。其中a表示每個患者的風險評分分布;b表示ccRCC患者的生存狀態與生存時間的關系(按風險評分排序);c表示RFS的熱圖,從紅色到綠色表示水平從高到低。模型在訓練集(圖7A)、測試集(圖7B)以及所有數據集(圖7C)上的風險評分基本一致,所選特征有較好的魯棒性。其中X3為危險因素,其表達分布與危險評分相似;相反,X6是一個保護因素。

圖7 在訓練集、測試集和全數據集上,ccRCC患者基于NCP模型RFs的風險評分分析Fig.7 Risk score analysis of ccRCC patients in the training set,test set and all data set based on the RFs of the NCP model.

3 討論

ccRCC作為最常見的腎癌病理亞型,具有侵襲性最強、腫瘤相關致死率最高的特點[22],因此,能在術前通過無創的預測方法準確判斷ccRCC患者的病理核分級,對患者的后續針對性治療具有重要的意義。

本研究引入了差異化網絡分析方法選擇高低級別的RFs并構建預測模型。實驗結果表明,基于差異化網絡分析構建的NCP模型具有良好的預測能力和出色的魯棒性,與3種經典的機器學習模型和臨床模型相比具有很強的競爭力。相比于其他特征選擇方法在驗證集和測試集性能較訓練集急劇下降不同,基于差異化網絡分析構建的NCP模型表現穩定,在訓練集、驗證集以及測試集中的AUC分別為0.78、0.76以及0.75。其中一個原因可能是我們的特征選擇方法更關注的是RFs的高低等級網絡的拓撲差異,而不是在訓練集中的預測性能,避免了模型的過擬合。另一方面,我們的方法使用Glasoo構造網絡模型,充分考慮了特征間的高階相關性,能有效處理小樣本問題,因此確保了所選RFs具有更強的魯棒性和良好的泛化性能。

在差異化網絡分析中,不同的網絡構建方法可能導致截然不同的結果。最常見的構建方法是Pearson相關系數網絡模型。然而,Pearson相關性在反映兩個特征的相關性時可能具有誤導性,因為它忽略了其他特征的影響[23]。Glasso 的提出解決了這一問題,它依賴于Boltzmann的熵最大化概念來支持統計推斷,對缺失信息形式的依賴最?。?9]?;诖藰嫿ǖ木W絡模型可以描述在去除間接影響后,特征間仍然存在的相關性,因此能提供更可靠的信息?;谏鲜鲈?,Glasso被用來構建WHO/ISUP的高低級別網絡。

本研究基于Glasso的差異化網絡分析方法構建了一種無創的WHO/ISUP核分級預測模型,可以僅通過NCP掃描,即可有效預測患者的核分級。實驗結果表明,該NCP模型能在術前有效預測腫瘤的核分級,有助于對ccRCC的治療做出更準確的決策。針對影像組學的相關研究,我們的結論與既往研究[20,24]一致,他們也發現NCP期相的相關特征能更好的反映分級。同時,更多數基于傳統的機器學習方法的研究小組則認為,來自增強期或聯合期相的RFs表現更佳。例如,有學者通過LASSO篩選CMP和NP期相特征構建分級預測模型[25];有研究發現通過機器學習的方法構建了基于NCP、CMP和NP期相的混合模型的性能比單一期相模型的預測性能更佳[26]。

本文首次探討了WHO/ISUP 核分級預測模型的RFs與ccRCC的PFS之間的關系,以往大多數研究只是單獨探討預測核分級或生存分析,而不是將二者結合起來研究。例如,有研究只是通過相關機器學習方法構建了分級預測模型[27-28],有研究則只探討了1~3期腎透明細胞癌術后復發的相關生存分析實驗結果[29-30]。本研究在分級預測模型的基礎上,通過生存分析實驗,探討了用于分級的特征與預后的關系,結果表明,核分級模型中選擇的幾乎所有RFs都能有效預測PFS。其中X3是PFS的危險因素,X6是PFS的保護因素。以上結果證明了用于預測分級的RFs與ccRCC的PFS存在關聯,驗證了本文使用的特征選擇方法有較強的可解釋性。

綜上,基于差異化網絡分析特征選擇構建的平掃期模型不僅可以有效預測腎透明細胞癌的WHO/ISUP核分級,同時該模型的特征也能很好的預測無進展生存期,有較強的可解釋性。但本研究仍有值得改進之處:首先,本研究是一項單中心的回顧性研究,僅納入了175例ccRCC患者,研究結果仍存在抽樣誤差。其次,模型的性能還需要與其它的網絡構建方法、基于過濾的特征選擇方法進行比較,來進一步深入驗證差異化網絡分析的有效性。此外,僅使用PFS的保護或危險因素來證明RFs的可解釋性還不夠充分。最后,本研究構建的NCP模型如果應用于實際臨床診斷,仍需其他大規模的外部數據來進一步驗證。

猜你喜歡
網絡分析特征選擇組學
基于ISM模型的EPC項目風險網絡分析
口腔代謝組學研究
鐵路有線調度通信的網絡分析
基于UHPLC-Q-TOF/MS的歸身和歸尾補血機制的代謝組學初步研究
Kmeans 應用與特征選擇
2016年社交網絡分析
聯合互信息水下目標特征選擇算法
代謝組學在多囊卵巢綜合征中的應用
大班幼兒同伴交往的社會網絡分析
基于特征選擇和RRVPMCD的滾動軸承故障診斷方法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合