?

基于臨床-影像組學列線圖模型鑒別局灶性機化性肺炎與肺腺癌

2024-03-18 11:31劉云澤李宬潤郭俊唐
南方醫科大學學報 2024年2期
關鍵詞:機化組學性肺炎

劉云澤,李宬潤,郭俊唐,劉 陽

中國人民解放軍總醫院1研究生院,2第一醫學中心胸外科,北京100853

肺癌是死亡率第1的惡性腫瘤,近年來我國肺癌發病率呈明顯上升趨勢[1,2]。隨著CT檢查的普及,越來越多的肺孤立性小結節被查體發現,性質難以明確。機化性肺炎是一種肺良性病變,往往遷延不愈,難以吸收,病因尚不明確,病理上包括肺泡間隙、支氣管腔中的息肉樣肉芽組織,以及伴有慢性炎癥改變的肺泡間隔增厚[3,4],其中局灶性機化性肺炎(FOP)這一亞型,占比10%~15%[5],在初診時,患者多沒有癥狀,影像學也很難與周圍型肺腺癌(LUAD)鑒別,即使正電子發射計算機斷層顯像CT(PETCT)對于良惡性結節的區分效能也較為有限[6],更何況想要細化區分為良性結節的某一亞種。部分FOP患者會以“疑似肺癌”為初步診斷,進行手術切除,術后病理證實為機化性肺炎[7]。影像組學[8]可以將醫學圖像信息轉化為高通量的數據信息,包括紋理參數、形狀特征等,對病灶進行精準、客觀、定量評價[9],隨著影像組學的發展,很多臨床醫生肉眼不易捕捉的信息,可以被有效的提取到,在臨床初診存疑的情況,可以對診斷起到輔助作用,增加診斷的準確率,避免不必要的手術[10,11]。目前國內外研究較少,且此類研究多為寬泛的良惡性鑒別,并未具體到發病率不低的機化性肺炎;或者單純通過影像組學標簽進行鑒別,并未納入臨床因素的分析。為了提高FOP與LUAD的鑒別率,本研究回顧性分析同期住院的FOP患者和周圍型LUAD患者資料,建立由臨床特征和影像組學標簽組成的風險預測模型,從而獲得兩種疾病的術前判別。

1 資料和方法

1.1 一般資料

初步選取本院2019年1月1日~2022年12月31日經術后病理確診的124 例FOP 和隨機抽取1000 例LUAD患者資料。入組標準:年齡為18~80歲;行肺切除手術后有明確的病理診斷;肺部結節為單發;術前行平掃CT檢查,CT圖像質量可靠,無明顯偽影;初診患者,無其他腫瘤病史,病灶未經穿刺及放化療、免疫治療;所有入組患者肺部無明顯間質纖維化、肺氣腫、肺大皰、彌漫性炎癥等嚴重影響圖像均質性改變疾病。排除標準:CT影像及臨床病歷資料不全;肺部病變為非結節狀;結節最大直徑大于3 cm。本研究病例影像和病理對應圖像(圖1)。

1.2 檢查方法

1.2.1 CT檢查 采用philips brilliance ict 512層螺旋CT機,掃描參數為:管電壓120 kV,0.2 s/圈,80 mm準直,掃描矩陣為512×512,圖像常規層厚5 mm,1.5 mm薄層肺窗及縱隔窗重建,螺距0.75患者體位仰臥位,雙手臂貼耳側,頭側先入,囑患者吸氣、屏氣,吸氣末掃描。

1.2.2 圖像分割 將患者原始Dicom 數據,導入3D slicer 5.2.2 中,在3D slicer 中調整統一灰度參數(W:1400 L:-500)后。對患者術前平掃CT的1.5 mm薄層圖像進行手動分割。應用勾畫工具中的自由勾畫,放大圖像3倍,由以上2名具有閱片資質的臨床醫師或影像醫師分別沿腫塊邊緣逐層勾畫并保存感興趣區(ROI),并融合生成三維的感興趣體積(VOI),兩位醫生收到的病例為隨機順序,平均分成兩份,勾畫兩份病例間隔超過14 d。

1.3 統計學方法

采用python 3.7+SPSS 23.0軟件進行特征提取及統計學分析。正態分布的計量資料采用均數±標準差表示,非正態分布的資料采用M(Q1,Q3)表示,計數資料采用例數或百分比表示,對相關臨床特征及各項檢驗指標采用單因素Logistic回歸,將具有統計學差異的臨床指標以及臨床中可能具有區分價值的指標,進行多因素Logistic回歸,Ρ<0.05為差異具有統計學意義。同時,基于肺部平掃CT進行影像組學特征提取。對2名醫師提取的組學特征利用組內相關系數(ICC)進行一致性檢驗,篩選ICC<0.75 的特征淘汰。將相關特征經Z-score 標準化處理,對于重復性較高特征的經Spearman秩相關檢驗、聚類分析、過濾特征、樣本可視化,構建數據后進行LASSO回歸,進行5次交叉驗證。應用臨床特征及影像組學特征共同建立列線圖模型。按照8∶2比例隨機分成訓練集和測試集,應用受試者操作特征(ROC)曲線評價模型在訓練集和測試集的效能,測得靈敏度、特異度、準確率、陰性預測值、陽性預測值及ROC曲線下面積(AUC)。應用校準曲線評價影像組學評分的校準能力。

2 結果

2.1 一般資料

共收集1124例因肺結節行手術治療的患者,機化性肺炎患者124例,根據納入排除標準篩選出FOP60例,在應用傾向評分匹配1∶2篩選出LUAD120例。兩組基線資料統計數據如表1。

表1 基線資料統計表Tab.3 Baseline data of the patients with FOP and LUAD

2.2 特征提取和影像組學標簽評分

將勾畫好的VOI及原始Dicom文件進行影像組學特征提取,主要分為幾何形狀,強度,紋理特征三方面。利用灰度共生矩陣(GLCM)、灰度區域大小矩陣(GLSZM)、灰度游程矩陣(GLRLM)、鄰域灰度差異矩陣(NGTDM)、灰度相關矩陣(GLDM)來計算,因為提取特征過多,為了防止過擬合,增加模型應用效能,通過多種方式降維,共得出30個系數非0的影像組學標簽,其中系數前8位的是灰度游程矩陣中的灰度非均勻性,表示圖像中灰度級強度的可變性;灰度級大小區域矩陣特征中的尺寸區域非均勻性,表示測量圖像中大小區域體積的可變性,值越低表示大小區域體積越均勻;原始圖像形狀的球形度,表示VOI表面的曲率;一階特征峰度,表示圖像ROI 中值分布的“峰值”的量度;灰度共生矩陣特征中的相關性信息度量;在小波變換中,三個維度均使用高通濾波器,相鄰灰度差矩陣的粗糙度;灰度級大小區域矩陣特征中小尺寸區域分布的量度,數值越大表示區域越小,紋理越精細”灰度級大小區域矩陣特征中的區域熵(圖2、3)。

圖2 用于構建模型的影像組學標簽Fig.2 Radiomics labels used for model construction.

圖3 影像組學標簽對于區分兩種疾病的箱線圖統計表Fig.3 Box chart statistics table of radiomics labels used to distinguish DiseaseA(FOP)and Disease B(LUAD).

2.3 臨床危險因素分析

結果顯示“過敏史”[OR=2.739,95%CI(1.177~6.375)]在兩組數據中,差異具有統計學意義(Ρ=0.016,表2),通過單因素分析篩選可能作為危險因素的指標,與檢驗學指標一同納入多因素Logistic回歸,選入水準α=0.05,剔出水準α=0.1,發現“過敏史”為FOP的危險因素,即“有過敏史”罹患FOP的風險更高(表3)。

表2 臨床資料統計表Tab.3 Clinical data the patients with FOP and LUAD

表3 Logistic回歸分析Tab.3 Multivariate logistic regression analysis

2.4 模型構建與評價

在訓練數據集上建立基于Logistic回歸分析的臨床-影像組學的列線圖模型。在測試集中檢查了列線圖模型的診斷效果。采用受試者工作特征(ROC)曲線和ROC曲線下面積(AUC)評估識別效果。計算校準曲線,比較預測結果與觀測結果的一致性,并采用Hosmer-Lemeshow分析擬合評價。訓練集中預測模型的ROC曲線下面積(AUC)為0.909(95%CI:0.8550~0.9627)、測試集為0.901(95%CI:0.8030~0.9989)。模型在訓練集敏感度、特異性及準確率分別為85.4%、83.5%、84.0%,測試集分別為94.7%、70.6%、83.3%(圖4~6)。

圖5 訓練集和測試集的ROC曲線及DCA曲線Fig.5 ROC and DCAof the training and test datasets.

圖6 基于臨床-影像組學,鑒別局灶性機化性肺炎和肺腺癌的列線圖模型Fig.6 Nomogram model based on clinical-radiomics for differentiating FOP from LUAD.

3 討論

低劑量CT篩查可以明顯降低肺癌死亡率[12],隨著“新冠后時代”的到來,越來越多的人進行肺部低劑量CT檢查,從而也有更多意外的肺部結節被發現[13]。在體檢偶然發現的肺部結節當中,最常見的惡性結節是LUAD?;诂F有的醫學影像特征分析研究,某些多維紋理特征能夠準確反映病變組織的病理學信息[14],已有研究使用影像組學模型區分肺部結節良惡性、治療前后變化、預測疾病預后[15-18],但是精準針對某一種肺部良性結節的診斷模型卻很少。據報道,有些患者新冠感染后,可能會出現繼發的機化性肺炎[19],作為一種病理診斷,其中包含亞型-局灶性機化性肺炎(FOP),很容易與周圍型肺腺癌混淆。根據已經發表的文獻,機化性肺炎的內科療法,尤其是激素沖擊治療,對于相當一部分病例有較好效果[4,20]。對于此類疾病,目前仍然只能依靠明確的病理結果作為診斷金標準,而獲取病理的過程中,可能會造成一定的風險[21],目前研究表明,有一些無創檢查,可以提高診斷此病的概率,比如灌注CT[22]。如果可以在術前確診,可以避免過度醫療所造成的創傷。

本文分別從臨床和影像組學入手,嘗試建立一個有利于區分FOP和LUAD的組合模型。臨床指標方面,本研究發現,在“過敏史”上,兩種疾病有明顯差異。在以往的研究[17,18,23,24]中,本項指標并未被納入統計。而在我們的研究中,罹患機化性肺炎的病人,有著更高的食物藥物過敏或者罹患過敏性疾病的概率。有文獻報道,機化性肺炎有較高的比例,繼發于免疫相關疾病,且應用激素治療,有望治愈[4,20],說明此項指標可能為鑒別兩種疾病的重要依據之一,并且在臨床初診時,此指標容易獲得,不會增加額外的風險或者費用。在Hawkins和Selvam的兩項研究中[17,25],研究者用影像組學標簽進行了肺結節良惡性的鑒別,得到了具有較好的診斷效能的模型,可是因為良性結節包含種類繁多,而建立模型的結節內容未進行設定,造成了一定程度上的不穩定性;本研究因為針對病理明確的單種良性結節進行建模,具有更好的診斷效能和說服力。確定構建列線圖的臨床指標后,再進一步進行影像組學相關研究。在勾畫VOI上,本研究為兩名醫生手動勾畫,相較于目前應用更為廣泛的人工智能勾畫,準確性有大幅度提升。為減小誤差,采用ICC衡量兩位醫生的勾畫組間差異。第二步再從肺部平掃CT原始影像數據及VOI中提取出glrlm、glszm、ngtdm、shape、firstorder、glcm、gldm 這7 組共1835個特征,經過多種方式降維。尤其是LASSO 回歸,為目前常用的特征篩選方法,應用增加約束條件和構建懲罰函數的辦法,壓縮系數,將很多無關緊要的自變量系數壓縮為0,最終得到30個系數非0的特征,在訓練集基于python建立鑒別FOP及LUAD的臨床-影像組學的列線圖模型,應用測試集進行驗證,獲得診斷模型,幫助臨床醫生提供更精準的臨床決策。

最終得出的邏輯回歸線性模型(LR),訓練集ROC曲線下面積0.909,測試集為0.901,且有較高的敏感性與特異性,CT影像組學對于肺結節良惡性的判別一直是一個熱點話題,早期有學者研究基于CT特征辨別FOP[26],但是CT特征的判讀具有一定的主觀性,相較于影像組學,標準性較差,且影像組學特征標簽具有更高的診斷效能。目前也有一些研究基于深度學習對于肺部結節的良惡性進行判斷[27],良好的深度學習模型確實對術前診斷有很大幫助,但是深度學習模型的不足也是顯而易見的,得出的模型不具有可解釋性,需要的樣本量較大,對于臨床數據量不足的疾病,如FOP,深度學習模型往往不能得到令人滿意的結果。本研究中篩選出的影像組學特征,“GraylevelNonUniformity,灰度游程矩陣中的灰度非均勻性?!?、“SizeZoneNonUniformity,灰度級大小區域矩陣特征中的尺寸區域非均勻性?!钡扔糜诮5挠跋窠M學標簽,具有明確可解釋的意義,這也使得得出的結論更具有可靠性和實用性。也可以更好的對臨床決策進行指導。本研究的優點在于通過臨床-影像組學模型鑒別FOP和LUAD,數據量相較于以往研究較多,對于鑒別診斷也更有針對性[28,29];其次,本研究建立的列線圖模型具有較高的診斷效能,為一種無創且易于執行的術前輔助診斷工具,有望在臨床上使得部分疑診患者避免不必要的手術治療和穿刺病理活檢所帶來的風險[30],為部分非癌患者提高隨訪觀察的信心,轉而進行嘗試性藥物治療或者進一步檢查,如灌注CT等[22]。根據2017年Lambin提出的評估體系細則[31],本項研究在影像組學評估體系中,完成的評價標準較多,可以認為具有一定的說服力與驗證效能。

但是本研究也有一些不足:本研究為單中心研究,在未來的研究中考慮納入多中心、更大的樣本量數據,完善外部驗證;作為回顧性研究,可能存在不可避免的選擇偏差,未來需要進行前瞻性研究驗證;本研究只應用了一種成像方式,如果可以對其他方式,如PETCT進行結合,擴展影像數據庫,可能會得到更有價值的模型。

綜上所述,因為臨床上沒有對于局灶性機化性肺炎的明確診斷辦法,在臨床醫生初診存疑的情況下,可以使用本模型,加強診斷效能,使得部分患者獲益。

猜你喜歡
機化組學性肺炎
基于“脾胃內傷”辨治隱源性機化性肺炎
平江農田宜機化改造出實效
重慶市農機總站召開農田宜機化改造技術培訓暨工作推進座談會
老年社區獲得性肺炎發病相關因素
局灶性機化性肺炎與周圍型肺癌MSCT鑒別診斷分析
口腔代謝組學研究
基于UHPLC-Q-TOF/MS的歸身和歸尾補血機制的代謝組學初步研究
老年卒中相關性肺炎應用美羅培南治療的臨床觀察
代謝組學在多囊卵巢綜合征中的應用
人感染H7N9禽流感性肺炎的影像學表現
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合