?

機器學習結合磁共振彌散加權成像識別發病4.5 h 內急性腦卒中患者

2024-01-05 10:27徐燦飛張開治1
吉林大學學報(醫學版) 2023年6期
關鍵詞:灰度機器系數

徐燦飛, 黃 艷, 張開治1,

(1. 吉林大學中日聯誼醫院神經外科,吉林 長春 130033; 2. 浙江大學醫學院附屬邵逸夫醫院病理科,浙江 杭州 310020; 3. 吉林大學中日聯誼醫院醫療保險管理部,吉林 長春 130033)

急性缺血性腦卒中(acute ischemic stroke,AIS)以其高發病率、高致殘率和高死亡率等特點嚴重危害人民健康[1]。在發病4.5 h 內行重組人組織型纖溶酶原激活劑 (recombinant tissue plasminogen activator,rt-PA) 靜脈溶栓為AIS 目前常用的治療方案[1-4]。rt-PA 靜脈溶栓治療有嚴格的時間窗要求,超過時間窗將增加患者顱內出血的風險[5]。約20%的AIS 患者無法明確發病時間,因患者發病時間不明確未能接受rt-PA 靜脈溶栓,導致其預后不佳[6]。因此,有效識別發病4.5 h 內的AIS 患者是當前研究的熱點。機器學習方法采用計算機通過模擬人類的學習方式獲取新的知識,在對獲得的知識結構進行重組后進一步完善自身性能[7]。隨著計算機技術的不斷改進,機器學習方法在醫學影像輔助診斷方面的應用較為廣泛[8-9]。有研究[10-11]報道了結合多模態影像識別發病4.5 h 內AIS 患者的機器學習方法,而依據磁共振彌散加權成像(diffusion weighted imaging,DWI)評估AIS患者發病時間的機器學習方法尚未完全闡明。本研究以發病時間明確的AIS 患者的DWI 為依據,訓練可用于識別發病時間在4.5 h 內AIS 患者的機器學習模型,以期輔助臨床醫師有效評估發病時間不明的AIS 患者對rt-PA 靜脈溶栓治療的適應性。

1 資料與方法

1.1 一般資料選擇2021 年1 月—2021 年7 月于吉林大學中日聯誼醫院神經內科和神經外科收治的DWI 資料完整的AIS 患者227 例。納入標準:①前循環AIS;②有明確的發病時間;③在發病后24 h內接受DWI 檢查;④DWI 成像清晰。排除標準:①顱內出血、腫瘤或創傷;②DWI 有運動偽影圖像無法評估;③DWI 檢查前接受血管再通治療。最終納入227 例患者,其中男性患者165 例,女性患者62例,患者年齡30~93歲,平均年齡64.5 歲。根據發病至DWI 檢查時間,將患者分為發病時間≤4.5 h 組(n=70)和發病時間>4.5 h 組(n=157)。227 例患者采用完全隨機法按照7∶3 的比例劃分為訓練集和測試集。訓練集患者158 例,其中發病時間≤4.5 h 組49 例,發病時間>4.5 h 組109 例;測試集患者69 例,其中發病時間≤4.5 h組21 例,發病時間>4.5 h 組48 例。

1.2 DWI 檢查方法所有患者的DWI 檢查均由西門子3.0T 核磁掃描設備(德國西門子公司)完成。掃描參數:TR 4300 ms,TE 98 ms,矩陣160×160,3 個方向,視野230 mm×230 mm,反轉角90°,層數20,層厚5 mm,b=1 000 s·mm-2。

1.3 圖像采集和標注將AIS 患者的DWI 以DICOM 格式由圖像存儲與傳輸系統中導出,由1 名具有5 年以上頭部核磁影像診斷經驗的神經外科醫師采用ITK-SNAP 軟件(www. itksnap. org)于DWI 上沿病灶邊緣仔細繪制輪廓線,逐層分割感興趣區域(region of interest,ROI),并由2 名具有15 年以上頭部核磁影像診斷經驗的神經外科醫師進行校對。見圖1。

圖1 AIS 患者頭部DWIFig. 1 DWI of head of patients with AIS

1.4 特征提取采用Python 軟件“Pyradioiomics”包由AIS 患者頭部DWI 的ROI 圖像中提取圖像特征[12]。目前可由醫學影像中提取的圖像特征主要包括一階特征、形態特征和紋理特征,可從不同方面解析圖像的隱含特點。一階特征采用ROI 圖像的特征值,以直方圖定量描述圖像內的信號強度及其分布情況;形態特征可以量化ROI 圖像的形狀和大小,如ROI 圖像的周長、球形度、長軸長度和短軸長度等;紋理特征可定量刻畫腦梗死灶內的異質性[13-14]?;叶裙采仃嚕╣ray level co-occurrence matrix,GLCM)定義ROI 圖像的二階聯合概率函數,包括集群顯著性、集群陰影和聯合熵等;灰度相關矩陣(gray level dependence matrix,GLDM)通過統計ROI 圖像中某個像素與周圍像素的差值小于特定閾值的情況描述紋理特征,如灰度方差、依賴方差和依賴熵等;灰度游程矩陣(gray level run length matrix,GLRLM) 以ROI 圖像中一維方向記錄連續多個相同像素值出現的情況描述紋理特征,如運行長度非均勻性、運行長度非均勻歸一化和運行熵等;灰度區域大小矩陣(gray level size zone matrix,GLSZM) 定義了具有相同灰度強度連接體素的數量,如區域熵、低灰度區域強調和高灰度區域強調等;鄰域灰度差矩陣(neighborhood gray tone difference matrix,NGTDM)量化在給定距離內的灰度值與其相鄰距離內的平均灰度值的差值,包括粗糙度、對比度、繁忙度、復雜度和強度。

1.5 特征選擇對提取后的特征進行特征選擇,去除相似和冗余的特征以提高算法的計算效率及防止過擬合的發生。將提取的特征值進行Z-score 正則化處理,Spearman 相關性檢驗評估各特征的相關性,排除一致性過高的特征[15-16]。Spearman 相關系數的正負值反映特征變化方向是否一致,絕對值越大表示特征間相關性越高,當2 個特征的Spearman 相關系數絕對值>0.9 時,可以認為2 個特征存在較高的一致性,可以相互替代,即為冗余特征。使用最小絕對收縮和選擇算子(least absolute shrinkage and selection operator,LASSO)回歸模型對剩余特征進行壓縮,參數λ 反映了LASSO 回歸模型對特征系數的壓縮程度,λ 值增大,特征系數被逐漸壓縮為0[17]。λ 值過大會因系數過度壓縮而導致部分有意義的特征被排除,若λ 值過小會因系數壓縮不足而導致部分冗余的特征被保留。結合10 倍交叉驗證法確定λ 的最佳值,根據不同λ值對應的均方誤差篩選均方誤差最小時的最佳λ 值。獲取發病時間≤4.5 h 組和發病時間>4.5 h 組患者存在顯著差異的特征。

1.6 模型訓練和測試基于篩選后的圖像特征,在訓練集中分別采用支持向量機(support vector machines,SVM)、K 近鄰 (k-nearest neighbor,KNN)、決策樹、極限樹、隨機森林、XGBoost 和LightGBM 共7 種機器學習算法進行模型訓練[18-23]。在測試集中以受試者工作特征曲線(receiver operating characteristic curve,ROC)和曲線下面積(area under curve,AUC)評估模型識別發病4.5 h內AIS 患者的效果并計算95% 置信區間(confidence interval,CI)。對以上模型進行100 次隨機校驗,最終得到每種算法的最優模型并進行比較。

2 結 果

2.1 特征提取和特征選擇于ROI 圖像中共提取107 個特征,包括18 個一階特征、14 個形態特征和75 個紋理特征。采用Spearman 相關分析的方法,共排除79 個冗余特征。見圖2。

圖2 使用Pyradiomics 提取107 個特征的Spearman 相關系數圖Fig. 2 Spearman correlation coefficient diagram of 107 features extracted by Pyradionics

采用LASSO 回歸模型壓縮剩余的28 個特征系數(圖3),橫坐標為λ值,縱坐標為特征系數。最終獲取22 個可用于識別發病4.5 h 內AIS 患者的圖像特征,包括4 個一階特征、6 個形態特征和12 個紋理特征。見圖3~5。

圖3 LASSO 回歸模型壓縮的特征系數收斂圖Fig. 3 Convergence diagram of characteristic coefficients compressed with LASSO regression model

圖4 10 倍交叉驗證結果Fig. 4 10-fold cross validation results

圖5 22 個特征直觀圖Fig. 5 Pictorial diagram of 22 features

2.2 發病4.5 h 內AIS 患者識別情況經過100 次隨機校驗后獲得SVM、 KNN、 Decision Tree、Random Forest、 Extra Trees、 XGBoost 和LightGBM 算法的最優模型。SVM 模型的AUC 為0.735 (95%CI: 0.595~0.874), KNN 模型的AUC 為0.532(95%CI:0.364~0.700),Decision Tree 模型的AUC 為0.624 (95%CI: 0.481~0.768), Random Forest 模型的AUC 為0.761(95%CI: 0.643~0.879), Extra Trees 模型的AUC 為0.670(95%CI:0.508~0.833),XGBoost模型的AUC 為0.817 (95%CI:0.697~0.938),LightGBM 模 型 的 AUC 為 0.775 (95%CI:0.642~0.908)。其中XGBoost 模型識別發病4.5 h內AIS 患者的AUC 最大,模型的準確率、靈敏度和特異度分別為0.739、0.733 和0.814。見圖6和表1。

表1 7 種模型識別發病4.5 h 內AIS 患者的性能Tab. 1 Performances of 7 models in identification of AIS patients with onset time within 4.5 h

圖6 7 種模型識別發病4.5 h 內AIS 患者的ROC 曲線Fig. 6 ROC curves of AIS patients with onset time within 4.5 h identified by 7 models

3 討 論

與AIS 相關的影像學檢查中,DWI 是反映腦組織缺血后發生細胞毒性水腫最敏感的序列,液體衰減反轉恢復(fluid attenuated inversion recovery,FLAIR) 可以較好地顯示發生血管源性水腫的腦梗死病灶[24]。FLAIR 高信號提示血腦屏障的完整性遭到破壞,該影像學現象常出現于AIS 發生后的數小時內[25]。對于發病時間不明的AIS 患者,可通過讀取DWI-FLAIR 不匹配信息判斷患者發病時間是否在4.5 h 內[26-27],常規的人工判讀難以對其進行精準區分,EMERIAU 等[28]發現:通過人工讀取DWI-FLAIR 不匹配信息識別發病4.5 h 內AIS 患者的敏感度和特異度僅為0.55 和0.60。郭靜麗等[29]報道:人工通過DWI-FLAIR 識別發病4.5 h 內AIS 患者的AUC、準確率、靈敏度和特異度分別為0.634、63.8%、0.667 和0.622。評估DWI 存在較強的主觀性,DWI-FLAIR 不匹配信號的人工讀取結果一致性偏低。LEE[11]等發現:由2 名腦卒中疾病的專家對DWI-FLAIR 不匹配信息的視覺評估一致性僅為73.2%。與傳統的人工方法比較,機器學習模型可以更有效地識別發病4.5 h 內的AIS 患者。

隨著計算機技術的不斷改進,機器學習在AIS領域的應用呈現出強勁的增長態勢。使用機器學習方法可進行AIS 患者早期診斷和病灶自動分割、自動化Alberta 卒中項目早期CT 評分(Alberta Stroke Program Early CT Score,ASPECTS)、自動化TOAST 分型、預測AIS 患者最終梗死灶、預測AIS 患者出血轉化概率和預測AIS 患者預后效果等[30-35]。目前,結合DWI 識別發病4.5 h 內AIS 患者的機器學習方法的研究較多,HO 等[10]等以DWI、FLAIR、表觀彌散系數(apparent diffusion coefficient, ADC) 序列和灌注加權成像(perfusion weighted imaging,PWI)四模態核磁影像為基礎訓練的Logistic 回歸模型識別發病4.5 h 內AIS 患者的AUC、靈敏度和特異度分別為0.765、0.788 和0.609。LEE 等[11]依據DWI、ADC 和FLAIR 影像訓練的Random Forest 模型識別AIS 患者的AUC、靈敏度和特異度分別為0.851、0.758和0.826。本研究結果顯示:XGBoost 模型識別發病4.5 h 內AIS 患者具有較大的AUC 和較高的準確度、靈敏度和特異度。本研究可僅使用DWI 訓練模型識別發病4.5 h 內AIS 患者,DWI 較FLAIR 和PWI 在AIS 的診療中使用更加廣泛,且更為廉價和易獲取,在部分經濟欠發達和醫療水平相對落后的地區也可常規獲取,具有較好的通用性。

綜上所述,基于DWI 的XGBoost 模型可有效識別發病4.5 h 內AIS 患者,對于輔助評估AIS 患者發病時間具有一定的臨床意義。

猜你喜歡
灰度機器系數
機器狗
采用改進導重法的拓撲結構灰度單元過濾技術
機器狗
基于灰度拉伸的圖像水位識別方法研究
這些待定系數你能確定嗎?
打雪仗
未來機器城
過年啦
基于最大加權投影求解的彩色圖像灰度化對比度保留算法
基于灰度線性建模的亞像素圖像抖動量計算
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合