鄧成龍,關 貝,劉德豐,劉蘭祥,石清磊,王浩然,王永吉1,
1(中國科學院 軟件研究所 協同創新中心,北京 100190)
2(計算機科學國家重點實驗室(中國科學院 軟件研究所),北京 100190)
3(中國科學院大學,北京 100049)
4(秦皇島市第一醫院 核磁科,河北 秦皇島 066000)
5(山東大學 軟件學院,山東 濟南 250101)
宮頸癌在女性癌癥疾病中發病率較高,且致死率較高[1].引發女性患宮頸癌的主要因素是感染人乳頭瘤病毒(human papilloma virus,簡稱HPV).此外,過早的性生活、免疫抑制以及吸煙都可能引發宮頸癌[2].
宮頸癌多發于陰道和子宮之間的宮頸轉換區,發展一般較為緩慢[3].國際婦產科聯合會FIGO(International Federation of Gynecology and Obstetrics)婦科腫瘤學委員會根據臨床上腫瘤大小、周圍組織結構受累情況、遠處轉移以及影像學和病理結果將宮頸癌病變分為I 期~IV 期.其中:I 期表現為癌灶局限在宮頸(包括累及宮體); II 期表現為癌灶已超出宮頸,但未到達盆壁,癌灶累及陰道,但未及陰道的下1/3;III 期表現為癌灶擴散至盆壁,并且累及陰道下1/3,導致腎盂積水或無功能腎;IV 期表現為癌擴散超出真骨盆或癌浸潤膀胱黏膜或直腸粘膜,甚至遠處轉移[4-6],詳見表1.
Table 1 Criteria of FIGO in staging for cervical cancer and recommended treatment options表1 FIGO 宮頸癌分期標準及推薦療法
不同分期的宮頸癌所對應的治療方案不同.根據美國國家綜合癌癥網站NCCN(National Comprehensive Cancer Network)制定的宮頸癌治療方法,手術治療、放射治療以及化療是宮頸癌治療過程中具有根治效果的方法[7].其中,
? 早期宮頸癌(≤IIA 并且腫瘤到內部宮頸口距離>5mm)主要選擇根治性宮頸切除術治療.該手術局部切除宮頸,可以保證子宮體的完整性,保存患者的生育能力[8];
? 中晚期宮頸癌(IIB~IV 并且腫瘤≥4cm)除腫瘤較大外,還可能出現宮外擴散以及淋巴結受累.因此,進展至這些時期的病變需要進行腔內放療和體外照射治療(早期宮頸癌以腔內放療為主,體外照射為輔;出現宮旁浸潤嚴重的情況以腔內放療為輔,體外照射為主;中晚期宮頸癌需腔內放療、體外照射并重);
? 對于晚期或復發轉移的患者,主要的治療手段為化療(目前多采用以順鉑為主的多藥聯合化療).
對于IIB~IVA 期的宮頸癌患者來說,放化療是主要的治療手段.根據患者接受放化療后3 個月內MR 圖像檢查,依據RECIST[9]標準及腫瘤臨床特征[10]對腫瘤的轉歸情況進行判斷,將放化療結果分為完全緩解(放化療敏感)和不完全緩解(放化療不敏感)兩類,如圖1 所示(紅色區域為腫瘤區域).如果患者接受放化療后,腫瘤出現不完全緩解情況,那么該患者不能繼續接受放化療,而需要探索個性化治療方案,如口服靶向藥治療等.但即使調整治療方案,該部分的患者在放化療后前兩年的無病生存率(disease free survival,簡稱DFS)僅為14.3%,而腫瘤完全緩解的患者為85.7%[10].因此,在放化療療效欠佳的情況下,患者由于喪失了最佳治療時機,同時化療對正常組織產生損傷,導致患者很難再進行及時有效的治療,嚴重影響患者預后[11].因此,在宮頸癌患者治療初期預測該患者對放化療敏感性,進而選擇合適的治療手段,提高患者的生存率具有重要意義.
Fig.1 Complete and incomplete remission of the tumor area after radiotherapy and chemotherapy of SCC圖1 宮頸鱗癌放化療后腫瘤區域完全緩解與不完全緩解
磁共振成像(magnetic resonance imaging,簡稱MRI)不但具有良好的組織分辨率,能夠同時對宮頸及周圍組織,如盆腔內部器官,進行多方位、多序列地掃描[12],而且提供形態學、腫瘤功能及生物學特性方面信息[13],在宮頸癌分期及療效預測方面具有重要作用.T2WI(T2-weighted imaging)結合脂肪抑制技術可較好顯示宮頸管的形態結構與信號,為病變顯示、病變范圍及周圍組織受侵狀況評估提供良好參考[13].因此,本文旨在依據患者放化療前的宮頸MR T2WI 預測患者接受放化療后的治療療效,提出一種基于隨機森林[14]的計算機輔助預測模型.該模型首先利用小波變換及高斯拉普拉斯算子對宮頸癌MR 去噪并增強圖像,排除噪聲影響;其次,利用在小數據集下能準確分割的U-net 模型分割腫瘤區域;在U-net 模型訓練階段,為防止U-net 模型出現梯度下降甚至消失現象,在該模型中加入深度殘差學習;然后,對分割出的腫瘤區域提取多種形狀及紋理特征,并且引入特征篩選機制對提取出的冗余及貢獻較小特征進行淘汰;最后,優化在小樣本下分類優異的隨機森林算法對圖像進行分類,并評估該模型在預測宮頸癌放化療療效中的價值.實驗所用MR 都是放化療前圖像,這些圖像根據患者接受放化療后的遠期治療效果分為完全緩解組與不完全緩解組.
本文首先介紹宮頸癌相關背景.第1 節列出已存關于宮頸癌的相關工作.第2 節列出已存工作不足之處及本文研究重點.第3 節介紹本文提出的預測模型并詳細闡述該模型下各步驟的實現細節.第4 節列出對比實驗結果并分析.第5 節總結全文.
基于MRI 進行宮頸癌放化療療效預測相關研究主要分3 個研究方向.
第一,通過MRI 的定量參數對宮頸癌放化療療效進行預測.如:文獻[15]計算并比較動態增強磁共振功能成像(dynamic contrast enhancement magnetic resonance imaging,簡稱DCE-MRI)的定量參數Ktrans,kep,ve在腫瘤以及正常臀肌的值,論證DCE-MRI 的定量參數可以對早期放化療療效進行評估;文獻[16]測量患者放化療前后DCE-MRI 的定量參數Ktrans,kep,ve的平均值,并與治療后腫瘤縮小率進行Spearman 相關性分析,實現對宮頸癌患者放化療療效預測;
第二,基于MR 圖像提取宮頸癌的形態學及紋理等特征,并利用傳統機器學習算法預測放化療療效.如:文獻[17]首先通過影像醫師手動勾畫宮頸癌病灶區域提取紋理特征,然后利用LASSO-Logistic 回歸分析,建立宮頸癌治療敏感性預測模型;
第三,計算成像方式的參數值,預測宮頸癌放化療療效.如:文獻[18]基于國內外的大數據庫,如MEDLINE,Science Citation Index database 以及中國生物醫學數據庫等已發表的研究,利用STATA 12.0 統計軟件進行分析,發現擴散加權磁共振成像(diffusion-weighted magnetic resonance imaging,簡稱DWI)的表面彌散系數(apparent diffusion coefficient,簡稱ADC)值可以預測宮頸癌放化療療效;文獻[19]除了研究ADC 值在預測宮頸癌患者接受放化療治療反應外,還分析了不同b值對治療反應的評估結果;文獻[20]證明DWI 預測及早期評估宮頸癌患者放化療效果有幫助,但對局部無病生存的判斷能力有限;文獻[21]研究了3.0T MRI 及DWI 在宮頸癌放化療治療過程中的監測作用;文獻[22-25]在臨床上分別獲取宮頸癌患者接受放化療前及放化療后的DWI,計算DWI的ADC 值,驗證ADC 值與宮頸癌放化療后腫瘤反應的關系;文獻[26]利用ADC 值評估放射治療后宮頸癌細胞是否殘存;文獻[27]通過ADC 值預測局部晚期宮頸癌患者放化療后的生存期;文獻[28]通過獲取251 例宮頸癌IB2~ IVA 期宮頸癌患者在同步放化療前和療后6 周的18F-FDG PET/CT,計算該圖像的參數SUVmax 和SUVmean 值,驗證18F-FDG PET/CT 可以預測放化療療效;文獻[29]研究了PET 能預測宮頸癌局部晚期患者接受標準放化療后腫瘤反映和患者存活率,方法是通過獲取療前PET 圖像和每周6 次的順鉑化療和大規模放療后PET 圖像,計算標準攝取值(SUV)和治療前后SUVmax 的比值;文獻[30]在宮頸癌患者MR 圖像的冠狀面、矢狀面及水平面分別分割腫瘤區域,提取其形狀及紋理特征并輸入分類器,得到宮頸癌放化療療效預測結果.
MRI 技術在評估放化療后腫瘤大小方面敏感性較高,但大量文獻通過計算彌散加權MR 圖像(DWI)中腫瘤區域的ADC 來預測宮頸癌放化療療效.此外,還有利用DCE-MRI 的定量參數以及PET 圖像的SUV 值預測療效.這兩種方法除需大量人力,如計算腫瘤面積、腫瘤消退率等,還可能出現計算誤差,如計算ADC 值等.
對于文獻[17]提出利用機器學習方法預測放化療療效,該方法可以有效地減少人力投入.但宮頸癌數據集相對其他數據集是極小的.而該方法只提取腫瘤紋理特征,并用較為傳統的方法進行分析,可能造成預測準確率低下.文獻[30]提取的腫瘤區域特征數量較少,精度不夠,并且提取特征后沒有對特征進行篩選,可能最終影響分類性能.
因此,本文根據上述問題提出基于隨機森林算法預測放化療療效.為得到準確預測結果,本文利用U-net 模型準確分割MR 圖像腫瘤區域,并提取腫瘤區域的形狀、大小及紋理等特征,采用小數據集下分類性能優異的隨機森林算法預測放化療療效.
依據RECIST[9]標準和腫瘤臨床特征[10],宮頸癌患者接受放化療后3 個月內MR 圖像檢查,對腫瘤的轉歸情況進行判斷,將放化療結果分為完全緩解(放化療敏感)和不完全緩解(放化療不敏感)兩類.現有文獻對放化療敏感性預測大多依靠局限性較大的方法或者依靠統計學方法,這些方法不僅耗時而且準確率較低.本文根據MR圖像對腫瘤大小及放化療后腫瘤轉歸情況是最敏感的特性,提出利用宮頸MR 圖像進行療效預測.框架如圖2所示.
Fig.2 Prediction model of radiotherapy and chemotherapy for SCC based on random forests圖2 基于隨機森林的宮頸鱗癌放化療療效預測模型
在宮頸MRI 成像過程中,因成像對象與硬件電路兩方面的原因,導致MR 圖像存在生理學噪聲和熱噪聲[31].此外,由于成像機制的限制,MR 圖像的時間分辨率使得圖像的信噪比和空間分辨率降低[32],導致圖像組織邊界模糊.因此,為消除圖像中噪聲并增強圖像中組織邊緣細節,使得圖像中腫瘤區域的特征更加容易提取,本文利用小波變換(wavelet transform)和高斯拉普拉斯算子(Laplacian of Gaussian,簡稱LOG)對宮頸MR 圖像進行預處理,其流程如圖3 所示(包括多尺度小波變換去噪和LOG 增強).
Fig.3 Process of MR image preprocessing圖3 MR 圖像預處理流程
3.1.1 小波變換
MR 圖像中的噪聲屬于加性噪聲且對比度較高[33],可直接利用多尺度小波變換將MR 圖像分解為高頻部分和低頻部分.其中:噪聲主要對應圖像分解后的高頻部分,該部分小波系數幅值較小、數目眾多;圖像中有效信息主要對應圖像分解后的低頻部分,該部分小波系數幅值較大、數目較少[34].通過對圖像的高頻部分設置合理閾值,就可消除MR 圖像中的噪聲.
本文分別采用7 種不同的小波基函數對MR 圖像進行二維小波變換,分別為Haar 小波、Coiflet 小波、Daubechies 小波、Symlet 小波、Biorthogonal 小波、ReverseBior 小波及Dmeyer 小波.每一種小波基函數都經過兩級小波變換,每次小波變換都產生4 組系數圖像,共產生56 組系數圖像用于特征提取.
3.1.2 高斯拉普拉斯算子
為強化MR 圖像中組織邊界細節,增強MR 圖像的紋理信息,提高腫瘤區域特征提取的準確度,本文利用LOG 算法對MR 圖像進行增強操作.LOG 是高斯濾波和拉普拉斯算子結合生成(其中,高斯濾波對MR 圖像進行平滑處理,拉普拉斯算子提取MR 圖像中邊緣,詳細如文獻[35]所述).根據LOG 公式定義,通過調整取值,可達到對MR 圖像的紋理特征強化目的.
宮頸鱗癌圖像數據相對于自然圖像數據較少,且預測宮頸鱗癌放化療療效需要精確提取MR 圖像中鱗癌區域的紋理及形狀等特征.因此,本文利用在小樣本下能準確分割的U-net[36]模型(如圖4 所示:紅色虛線框內所示跳躍連接操作,綠色虛線框內所示殘差塊結構)來分割MR 圖像中腫瘤區域.同時,為提取腫瘤區域更多特征信息,如空間信息,本文將宮頸鱗癌3D MR 圖像作為網絡輸入.
Fig.4 MR image segmentation network model圖4 MR 圖像分割網絡模型
圖4 所示網絡結構中,卷積層(conv)都包含2 次卷積操作,卷積核大小為(n=1,2,3,4).網絡激活函數為修正線性單元(rectified linear unit,簡稱ReLU).下采樣采用2×2×2 大小,步長為2 的最大池化(max-pooling)操作.在下采樣后,將提取的特征通道數變為原來2 倍.反卷積層中反卷積核大小為2×2×2,且反卷積后將特征通道數減半.跳躍連接操作是將編碼器結構中的卷積操作獲取的特征與解碼器結構相對應的特征進行連接(如圖4 中紅色虛線框所示).
在網絡前向傳播過程中,隨著網絡層的遞增,隱藏層的輸入數據分布逐漸向激活函數取值區間的兩端產生偏移和變動,導致網絡收斂速度下降甚至梯度消失.因此,本文在U-net 中加入殘差學習[37](圖4 中綠色虛線框所示)來避免學習過程中產生此類問題.
殘差學習通過在神經網絡添加恒等映射方式構建殘差塊結構,將網絡映射問題轉換為多個尺度的殘差問題,降低模型學習難度.同時,恒等映射也能在網絡訓練過程中將梯度通過反向傳播向淺層傳遞,提升模型訓練效果.圖4 中的殘差單元首先通過1×1 的卷積操作對輸入數據進行降維處理,在輸出之前,再通過1×1 的卷積進行還原.這樣,在保證精度的前提下有效地降低網絡計算量.
分割得到圖像病灶區域后,本文對病灶區域提取6 種包括形狀及紋理特征,分別為一階統計量(first order features)、形狀(shape)、灰度共生矩陣(gray level co-occurrence matrix,簡稱GLCM)、灰度區域大小矩陣(gray level size zone matrix,簡稱GLSZM)、灰度游程矩陣(gray level run length matrix,簡稱GLRLM)以及局部灰度差分矩陣(neighbouring gray tone difference matrix,簡稱NGTDM),共97 個特征,詳見附錄A.
First Order Features 通過獲取熵、灰度最小值以及灰度值方差等特征統計生成MR 圖像中腫瘤區域像素點的灰度值分布;Shape 描述MR 圖像中腫瘤區域的體積、面積以及最大直徑;GLCM,GLSZM,GLRLM 以及NGTDM 根據圖像灰度在空間上的特性及相互之間的關系,描述MR 圖像中腫瘤區域的紋理特征.
據第3.3 節描述提取的圖像特征中,存在貢獻較小及冗余特征,這些特征會加大模型訓練及特征分析時間,增加模型的學習難度.因此,需對提取的腫瘤區域特征進行篩選,以減少特征個數,降低模型過擬合風險,提高模型的精確度,并減少模型訓練時間.
特征篩選主要包括特征子集的搜索和評價過程.該方法的思想為:先產生一個特征子集,然后對其進行評價,根據評價結果選擇下一個特征子集并評價.重復上述過程,直到無法找到下一個特征子集為止.詳細如下.
(1) 特征子集搜索
特征子集搜索分為前向(forward)搜索、后向(backward)搜索和雙向(bidirectional)搜索.本文采用雙向搜索方法選擇特征子集.該方法分別從完整特征集的開始和結尾處進行遍歷,每一次迭代增加選定的相關特征,同時去掉無關特征,直到第N次迭代增加的特征構成的特征子集評價不如第N-1 次迭代形成的特征子集評價,或者每次迭代去掉一個無關特征形成的特征子集評價明顯下降為止.
(2) 特征子集評價
本文利用信息增益(information gain,簡稱IG)作為評價特征子集的方法.信息增益公式如公式(1)所示:
其中,假設根據特征子集A將特征集D分為V個子集{D1,D2,…,DV},H(·)表示信息熵函數(information entropy),公式如公式(2)所示:
信息增益IG(A)越大,表示該特征子集包含的有用特征越多,訓練隨機森林分類器效果越好.
? 實驗數據集
根據宮頸癌細胞病理類型,可將宮頸癌分為宮頸鱗癌、宮頸腺癌、宮頸鱗腺癌、腺樣囊性癌、小細胞癌和淋巴癌[38].其中,宮頸鱗癌病例數約占宮頸癌病例數的85%[2].根據腫瘤的惡性程度,不同類型的宮頸癌又可以細分為高分化、中分化以及低分化[39].實驗數據由85 位鱗癌IIB~IVA 期患者(其中,高分化3 例,中分化75 例,低分化7 例,共1 785 幅原始MR 圖像及對應標簽數據)的三維T2 權重MR 圖像(詳見表2)組成.
根據患者在臨床上接受放化療治療的遠期效果,將85 例病例分為不完全緩解組和完全緩解組.其中,不完全緩解組40 例(共840 幅圖像,672 幅圖像用于訓練,168 幅圖像用于測試),完全緩解組45 例(共945 幅圖像,756幅圖像用于訓練,189 幅圖像用于測試).本文的所有實驗(包括各對比算法)均在上述實驗數據集中進行.
Table 2 Function of T2-weighted sequences表2 T2 權重圖像各序列作用
所有病例的MR 圖像均為512×512×21,空間分辨率分別為0.50mm,0.50mm 以及5.2mm.MR 圖像中,宮頸鱗癌腫瘤區域由資深影像科醫生通過手動勾畫方式對85 位患者的MR 圖像序列逐一識別并標注(如圖5 所示:第1 行和第2 行分別是兩個患者的部分MR 圖像,紅色區域為醫生手動勾畫的宮頸鱗癌區域,每一行最右側圖像為宮頸癌區域分割后三維重建圖像).
Fig.5 SCC MR images with manual labeling圖5 手動標記宮頸鱗癌MR 圖像示例
? 模型訓練
融合殘差結構的U-Net 網絡訓練時設定初始學習率、衰減率及動量分別為1e-4、1e-4 和0.3,最大迭代次數為1 000.對隨機森林算法的超參數設置,如決策樹數量,是根據隨機森林在訓練集上針對不同超參數進行實驗確定(詳見第4.4 節).
在放化療療效對比實驗中,Inception-ResNet-v2 及Inception-v4[40]網絡設置及訓練策略如下.
(1) 上述兩種網絡的層數及結構等超參數設置均采用TF-slim(https://github.com/tensorflow/models/tree/ master/research/slim)代碼庫默認值;
(2) 由于宮頸鱗癌訓練集數據有限,無法充分訓練上述兩種網絡,本文采用數據擴增(Tensorflow 框架)策略,將完全緩解組與不完全緩解組訓練數據中的每幅圖像分別進行水平方向的翻轉與旋轉(角度為4,8,12,16,20 度);
(3) 上述兩種網絡設定初始學習率1e-4,1 000 輪迭代后學習率設置為1e-5,共訓練2 000 輪;衰減率及動量分別設置為1e-4,0.3.
? 實驗環境
本文實驗環境基于Ubuntu 18.04 操作系統中的Tensorflow 框架,配置NVIDIA 顯卡及深度學習庫,編程IDE為PyCharm,編程語言為Python 3.5;硬件配置:Intel(R) Core(TM) i7-8700K CPU@3.70GHz,NVIDIA GeForce GTX 1080 Ti,32GB 內存.
? 分割算法評估
為定量評估分割算法性能,本文采用3 種常見的評價標準來評估圖像分割算法準確率,分別為Dice 相關系數、PPV(positive predicted value)以及敏感度(sensitivity).PPV 衡量預測的準確率,Sensitivity 衡量預測的召回率,Dice 系數綜合PPV 和Sensitivity 的評價指標.計算公式如公式(3)~公式(5)所示:
其中,P表示預測結果,T表示腫瘤區域標記,|P∩T|表示腫瘤區域預測結果與標記之間重疊部分.
? 療效預測算法評估
本文將放化療療效問題歸結為二分類問題(完全緩解與不完全緩解),而 ROC(receiver operating characteristic)曲線在二分類問題上能有效地反映分類性能.對ROC 曲線下各部分面積求和得到AUC(area under curve),AUC 是判斷模型分類性能重要標準,本文利用AUC 反映不同放化療療效預測算法準確度.
4.2.1 不同損失函數對比
本文基于U-net 分割宮頸MR 圖像中腫瘤區域.在網絡訓練過程,分別使用交叉熵(cross entropy)損失函數、Dice 損失函數以及Softmax 損失函數作實驗對比.表3 和圖6 分別列出基于不同的損失函數訓練得到的U-net模型分割腫瘤區域的精度和結果圖.
Table 3 Segmentation accuracy of U-net on test set with different loss functions表3 基于不同損失函數的U-net 模型在測試集上分割準確率
Fig.6 Segmentation results of U-net on test set based on different loss functions圖6 基于不同損失函數的U-net 模型在測試集上分割結果圖
由表3 及圖6 可知,基于Softmax 損失函數的U-net 網絡分割腫瘤區域準確率高于基于交叉熵和Dice 損失函數的分割模型.基于交叉熵損失函數的分割模型在模型訓練階段對宮頸MR 圖像中所有像素同等考慮,但在三維宮頸MR 圖像中,腫瘤區域只占整幅MR 圖像很小部分,這使得交叉熵損失函數大量計算腫瘤區域以外的像素點,無法對腫瘤區域的特征進行有效地提取,導致分割腫瘤區域準確率較低.Dice 損失函數本質上是衡量兩個樣本的重疊部分,在樣本極度不均勻的情況下效果較好.而本實驗使用的數據都是同一類別,使用Dice 損失函數可能會使得U-net 網絡訓練變得不穩定,造成分割準確率低.
4.2.2 不同分割算法對比
為驗證加入深度殘差學習的U-net 模型能提升分割精度,本文通過與未加入深度殘差學習的U-net 模型、閾值分割、全卷積網絡(FCN)以及DeepMedic+CFR[41]模型進行實驗對比.各模型分割腫瘤區域的平均分割精度見表4,分割結果如圖7 所示.
Table 4 Segmentation accuracy of different algorithms on test set表4 不同分割算法在測試集上分割準確率
Fig.7 Segmentation results obtained by different algorithms on test set圖7 不同算法在測試集上分割結果圖
從表4 可知:深度殘差學習能降低U-net 網絡的擬合難度,使得U-net 模型在Dice 系數、PPV 及Sensitivity標準上比原始U-net 模型分割準確率分別高0.061、0.057 及0.042 個百分點.基于閾值分割模型首先需要確定腫瘤區域的大致位置,然后才能進行分割.但腫瘤的形狀及位置復雜多變,確定某一例宮頸鱗癌腫瘤區域位置不能推廣到其他患者的腫瘤區域,所以分割精度較低.FCN 模型雖然在分割上提升了效率與準確率,但沒有充分考慮像素與像素之間的關系;且在訓練階段沒有進行充分地訓練,導致分割準確率低于本文方法.DeepMedic+CRF模型在分割腦腫瘤上取得了不錯的成績,但在本實驗中分割準確率低于U-Net+Resblock.可能因為宮頸鱗癌數據少,導致網絡模型在訓練階段沒有使參數最優化,使得分割的準確率低.
本文利用U-net 模型分割腫瘤區域后,對腫瘤區域提取6 種97 個特征,包括紋理及形狀等特征.宮頸鱗癌實驗數據集包含1 785 幅圖像,共提取173 145 個特征.但提取的特征存在貢獻較小及冗余特征,因此,本文利用雙向特征搜索及信息增益對特征集進行篩選,篩選結果見表5.
Table 5 Types of tumor area features and number before and after screening表5 腫瘤區域特征種類及篩選前后數量
本文基于隨機森林算法預測放化療不敏感的宮頸鱗癌患者.實驗將療效預測問題歸結為分類問題(完全緩解或不完全緩解兩類).因此,為了驗證本文方法的有效性,加入Inception-ResNet-v2 算法以及Inception-v4[40]算法作為預測療效效果對比模型.通過多種實驗驗證算法的有效性,實驗包括決策樹數量實驗、決策樹剪枝策略實驗以及不同預測算法對比實驗.實驗所用AUC 取值范圍是0.5~1,0.5 對應隨機猜想模型,1 對應理想模型.
4.4.1 決策樹數量實驗
隨機森林通過集成大量決策樹達到較好的泛化性能,但隨機森林中決策樹數量對模型有重要影響.為了使療效預測算法性能達到最優,本實驗在保持最優劃分屬性選擇標準與最大特征數等參數不變的前提下,對包含不同數量決策樹的隨機森林算法在訓練集上預測放化療療效,實驗結果如圖8 所示.
Fig.8 Prediction results on training set based on the number of different decision trees圖8 訓練集上基于不同決策樹數量預測結果
實驗結果表明:隨著決策樹數量的增加,隨機森林的預測性能也在提升.當決策樹數量為55 時,預測性能達到最優.之后,隨著決策樹數量的增加,預測性能出現下降趨勢.可能因為隨著決策樹數量增多,隨機森林模型的復雜度增大,模型的泛化能力下降,出現過擬合現象.因此,本文將隨機森林中決策樹數量設置為55 進行以后的預測實驗.
4.4.2 決策樹剪枝策略實驗
對隨機森林中的決策樹進行剪枝可以最大限度地平衡模型復雜度與模型泛化性能.本實驗在與剪枝參數有關的最大特征數量上對隨機森林預測放化療療效進行實驗.
最大特征數量不但能影響決策樹的復雜度,而且還影響隨機森林模型中不同決策樹之間的關聯程度.假設 共有N個特征用于決策樹的構造,本實驗分別設置N,log2N以及為決策樹生成過程中使用到的最大特征數 量.圖9 展示了在訓練集上基于不同最大特征數下放化療療效預測結果.
Fig.9 Prediction results on training set based on different maximum feature quantity圖9 訓練集上基于不同最大特征數量預測結果
根據圖9 可知:將最大特征數量設置為log2N時,療效預測結果達到最優;而使用全部特征來生成決策樹的預測結果最低.
4.4.3 不同預測算法對比
由于目前宮頸癌療效預測方法較少,因此,為驗證本文提出的放化療療效預測算法優于其他算法,選取目前圖像分類準確率較高的兩種算法(Inception-ResNet-v2 和Inception-v4)、文獻[17]方法與本文算法在訓練數據集及測試數據集上進行實驗對比.圖10、圖11 分別展示了4 種算法在訓練集及測試集上預測放化療療效準確率.
Fig.10 Prediction results obtained by different classification algorithms on training set圖10 不同分類算法在訓練集上預測結果
Fig.11 Prediction results obtained by different classification algorithms on test set圖11 不同分類算法在測試集上預測結果
根據圖11 可知:本文利用隨機森林算法預測宮頸鱗癌放化療療效的AUC 值達到0.921,分別高于其他兩種神經網絡分類算法.Inception-ResNet-v2 和Inception-v4 模型雖然分類性能優越,但在數據量較少的情況下分類效果欠佳.文獻[17]只提取了紋理特征,導致描述腫瘤的特征數量及種類不足,使得LASSO-Logistic 建立的宮頸癌治療敏感性模型預測療效結果的AUC 值僅為0.7867,遠低于本文采用的預測模型.
本文針對部分宮頸鱗癌患者對放化療不敏感的問題,提出了基于隨機森林算法的療效預測模型.在該模型中,為提高MR 圖像腫瘤區域的分割精度,采用了在小樣本下分割性能較好的U-net 模型.同時,為防止U-net 模型訓練階段出現梯度消失情況,在U-net 模型中加入了殘差學習.此外,為訓練泛化能力較強的隨機森林模型,實驗對提取的圖像特征進行篩選,并調整了隨機森林中決策樹的數量以及訓練最大特征數量.實驗結果表明:本文提出的預測模型在分割腫瘤區域敏感性達到0.801,預測放化療療效的準確度達到0.921.
本文未來工作包括:第一,開發基于不同權重類型圖像的預測模型,包括T1W1,DWI 等MR 圖像,綜合運用多種權重類型的圖像可以得到更全面的診斷信息,進一步提高宮頸鱗癌放化療療效預測性能;第二,未來將收集更多病例數,尤其是部分少見病理類型,進一步豐富實驗數據集來訓練預測模型,提升模型預測能力.
致謝在此,我們向對本文工作提供幫助和支持的同行以及對本文提出寶貴意見的各位審稿專家表示衷心的感謝.
附錄A.特征種類及數量
Table A.1 Type and quantity of features表A.1 特征種類和數量
Table A.1 Type and quantity of features (Continued 1)表A.1 特征種類和數量(續1)
Table A.1 Type and quantity of features (Continued 2)表A.1 特征種類和數量(續2)