?

劑量預測引導的鼻咽癌放療計劃質量定量評估方法

2022-10-09 05:51陳彥宇柏朋剛陳榕欽邱小平陳濟鴻戴藝濤全科潤周益民
中國醫學物理學雜志 2022年9期
關鍵詞:預測值限值劑量

陳彥宇,柏朋剛,陳榕欽,邱小平,陳濟鴻,戴藝濤,全科潤,周益民

1.南華大學核科學技術學院,湖南衡陽 421001;2.福建省腫瘤醫院放療科,福建福州 350014

前言

放射治療如今已成為腫瘤治療的主要治療手段之一,尤其對于鼻咽癌,通過放射治療可以取得非常好的治療效果[1-5]。放療療效的好壞與放療計劃的質量息息相關,對放療計劃進行合理的定量評估可以確保放療計劃的質量[6-7]?,F階段放療計劃定量評估方法,通常是參考指南和學術共識提出的劑量限值,根據特定劑量學參考點建立計劃質量測度標準(Plan Quality Metrics, PQM),對放療計劃進行評分[8]。而臨床上由于各個病例病情不同,在計劃評估時會針對病情對參考標準做出調整,因此通過基于劑量限值建立PQM,對放療計劃進行定量評估存在著一定的不合理性。

本研究提供一種計算機輔助方法,根據危及器官(OAR)與靶區的空間關系,利用神經網絡搭建劑量預測模型,并以個性化劑量預測結果為參考標準建立PQM,實現對放療計劃更客觀、更合理的定量評估。

1 資料與方法

1.1 病例資料

本研究選取2018年到2020年福建省腫瘤醫院原發性鼻咽癌患者114 例,所有病例均在Pinnacle39.2(Philips Radiation Oncology Systems)放療計劃系統上進行調強放療(IMRT)計劃設計。計劃靶區包括GTV_T_P(腫瘤原發灶計劃靶區)、CTV1_P(原發灶臨床高危區計劃靶區)、CTV2_P(原發灶臨床中危區計劃靶區)、GTV_NR_P(頸部右側淋巴結轉移灶計劃靶區)、GTV_NL_P(頸部左側淋巴結轉移灶計劃靶區)、CTV_NR_P(頸部右側淋巴結轉移灶臨床計劃靶區)、CTV_NL_P(頸部左側淋巴結轉移灶臨床計劃靶區)。OAR 包括上頜下腺、顳葉、口腔、腦干、脊髓、垂體、左右側腮腺、左右側晶體、左右側眼球、左右側視神經、視交叉等。各個靶區處方劑量分別為:GTV_T_P 為69.96 Gy/33次(2.12 Gy/次);CTV1_P為61.05 Gy/33次(1.85 Gy/次);CTV2_P 為56.1 Gy/33 次(1.7 Gy/次);GTV_NR_P和GTV_NL_P為66 Gy/33次(2.0 Gy/次);CTV_NR_P和CTV_NL_P為52.8 Gy/33次(1.6 Gy/次)。OAR劑量限值標準為:Stem(腦干)D1cc<54 Gy;Cord(脊髓)D1%<45 Gy;PG_L/R(左/右側腮腺)V30Gy<50%或V35Gy<50%;Lens_L/R(左/右側晶體)Dmax<8 Gy;ON_L/R(左/右側視神經)Dmax<54 Gy;Chi(視交叉)Dmax<54 Gy;上頜下腺、顳葉、口腔等其他OAR要求Dmean盡可能低,同時確保劑量熱點不位于OAR上。所有計劃均由主診醫生審核通過。其中81例作為劑量預測模型訓練集用于劑量預測模型訓練,23例作為劑量預測模型測試集用于劑量預測模型準確性驗證,10例作為計劃質量定量評估測試集用于計劃質量評分測試。

1.2 特征提取及網絡模型搭建

OVH(Overlap Volume Histogram)是由Kazhdan等[9]提出,用于反映感興趣區域與靶區空間關系的表征特征,具體表達式如下:

其中,r為靶區各向同性擴縮距離,d(p,T)為點p到靶區邊界有向最小距離(靶區外到靶區邊界方向為正,靶區內到靶區邊界方向為負),|O|表示感興趣區域的體積,|{p∈O} |為靶區擴縮后與感興趣區域的重疊體積。靶區按確定步長內外擴縮特定距離,分別計算擴縮范圍內感興趣區域對應的OVH 值,便可以將三維空間關系降維成二維線性關系。

為了減少降維過程中的信息損失,本研究不僅選取了20 個靶區與OAR 關系的OVH 特征,還添加了5 項靶區擴縮體積特征。通過Pinnacle 腳本提取25 項特征信息,同時提取用于評價計劃質量的劑量體積直方圖(Dose-Volume Histogram, DVH)特征劑量學參數。

在Tensorflow 2.0 框架下搭建人工神經網絡模型,以25 項特征作為輸入,DVH 信息作為輸出,實現DVH 特征劑量學參數的預測。該模型由一個輸入層、一個輸出層和一個隱藏層組成,隱藏層包括10個隱藏層單元。損失函數選擇均方誤差(Mean-Square Error, MSE),網絡優化器選擇Adam,初始學習率為0.01,每隔75 個epoch 進行學習率衰減,學習率衰減率為0.4,學習率衰減方式為倒數衰減,激活函數為tanh,訓練迭代次數為500。

使用劑量預測模型測試集數據驗證模型預測的準確性,將各個OAR 的DVH 感興趣特征劑量學參數的預測值和實際值進行對比,如最大劑量Dmax、絕對(相對)體積-劑量Dcc和相對體積-劑量D%等,并計算△D=預測值-實際值。

1.3 兩種計劃質量評分方法

Nelms 等[8]提出通過建立PQM 來定量評估放療計劃質量。這種放療計劃評估方法通過將各個靶區和OAR 的DVH 特征劑量學參數,如最大劑量Dmax、絕對(相對)體積-劑量Dcc/%等,作為計劃評估的子測度項指標,根據劑量限值標準設計子測度項評分函數,并對子測度項得分加權求和實現計劃質量評分,計劃質量評分滿足以下函數關系式:

其中,sk為計劃質量評分,j為子測度項個數,ε為子測度項權重,P(X)為該子測度項的評分函數。

本研究首先制定一個基于劑量限值的PQM。由于保證靶區劑量達標是計劃制定的首要目標,滿足靶區劑量限值要求則該靶區子測度項評分為100,不滿足則為0;基于劑量限值的PQM 危及器官評分函數見圖1a,以1.1 倍劑量限值作為評分下限,劑量值高于下限則該項評分為0,0.9 倍劑量限值作為評分上限,劑量值低于上限則該項評分為100,劑量限值對應得分為60,上限到劑量限值區間得分與劑量值以線性關系從100到60,劑量限值到下限區間得分與劑量值以線性關系從60 到0。對子測度項得分加權求和后實現整體計劃質量評分。表1 是按照以上方法,根據福建省腫瘤醫院靶區及OAR 劑量限值標準制定的鼻咽癌PQM。

圖1 PQM 子測度項評分函數圖Figure 1 Diagram of PQM submetric scoring functions

表1 基于劑量限值的鼻咽癌PQMTable 1 PQM for nasopharyngeal cancer based on dose limits

在臨床中評估計劃質量時,會根據病例病情對參考劑量限值標準做出調整,而上述方法無法考慮到病人的特異性,因此本研究提出建立一種基于劑量預測值的PQM,用于更準確、更客觀地定量評估計劃質量。首先,利用劑量預測模型對子測度項DVH特征劑量學參數進行預測,再根據預測值制定子測度項評分函數,建立新的PQM。靶區評分函數按靶區優先原則依舊采取原方案;新的OAR 評分函數見圖1b,其中j為具體OAR,Pj為該OAR 劑量預測值,Lj為該OAR 劑量限值,上限為Pj-0.02Lj,低于上限得分為100;下限為Pj+0.08Lj,高于下限得分為0;上下限之間的中間區間得分與劑量值成線性關系,預測值Pj對應得分為80?;趧┝款A測值的鼻咽癌PQM 如表2 所示。分別用基于依據劑量限值建立PQM 和與基于劑量預測值建立PQM 兩種評估方法對10 例計劃進行評分,對比評分結果,并結合實際情況討論兩種方法對計劃質量評估的合理性。

表2 基于劑量預測值的鼻咽癌PQMTable 2 PQM for nasopharyngeal carcinoma based on dose prediction

1.4 統計學方法

采用SPSS 20.0軟件對預測值和實際值數據進行統計分析,采用Shapiro-Wilk 檢驗預測值和實際值數據的正態分布,符合正態分布的計量資料用均數±標準差表示,組內進行配對t檢驗分析;不服從正態分布的計量資料用M(Q1,Q3)表示,組內進行Wilcoxon秩和檢驗。P<0.05為差異有統計學意義。

2 結果

2.1 劑量預測模型準確性驗證

從總體上看,△D 的劑量相關總體平均值為(-0.07±4.55)Gy,△D 的體積相關總體平均值為-1.06%±3.80%;從單個OAR 上看,表3 為23 例劑量預測模型測試集各個OAR 劑量學參數預測值與實際值對比,各個OAR 劑量學參數的預測值與實際值進行統計學分析計算出的P值均大于0.05,說明其預測值和實際值比較差異無統計學意義。圖2 為OAR 劑量預測模型預測值與實際值比較圖,理想情況下,各點應分布于直線y=x上。將各點進行線性擬合,劑量相關擬合線斜率0.952±0.019,截距為1.200±0.609,決定性系數為0.939;體積相關擬合線斜率0.973±0.015,截距為1.108±0.521,決定性系數為0.967。繪制y=0.9x和y=1.1x作為10%誤差線,點位于誤差線之間說明預測結果較為準確。驗證集結果表明大部分點位于兩條誤差線之間,但視神經有大量點位于誤差線外。對于其他預測結果超出10%預測誤差限值的病例中,Chi Dmax有9 例,其中6 例預測值大于實際值;Stem D1cc有4例,其中3例預測值大于實際值;PG V30Gy有5 例,其中3 例預測值大于實際值;PG V35Gy有6例,其中3例預測值大于實際值。

圖2 OAR劑量預測模型預測值與實際值比較圖Figure 2 Comparison of actual values and predictive and actual values from OAR dose prediction model

表3 OAR劑量學參數預測值與實際值對比Table 3 Comparison of predictive and actual values of OAR dosimetric parameters

2.2 兩種計劃質量評分方法結果對比

將10 例已通過臨床審核的病例計劃分別用兩種評分方法進行評分,評分結果見表4,得分A 為基于劑量限值建立PQM 方法的得分,得分B 為基于劑量預測值建立PQM 方法的得分。10例病例總分中7例得分A 高于得分B。將60 分劃為合格線,80 分劃為優秀線,對于病例1、病例2、病例5、病例10 兩種方法都評定為優秀;病例6、病例8 兩種方法都評定為合格。對于病例3、病例7,基于劑量限值建立PQM 方法評定為優秀,基于劑量預測值建立PQM 方法評定為合格;對于病例9,基于劑量限值建立PQM 方法評定為合格,基于劑量預測值建立PQM 方法評定為不合格。對于病例4,基于劑量限值建立PQM 方法評定為不合格,基于劑量預測值建立PQM 方法評定為合格。病例4 的兩種評分方法PQM 子測度項得分見表5,基于劑量限值建立PQM 方法判定該計劃Stem、Chi、PG_L不合格,而基于劑量預測值建立PQM 方法對3個子測度項判定為合格。對于病例4的3個子測度項,Stem D1cc的實際值為59.02 Gy,Chi Dmax的實際值為60.39 Gy,PG_L V30Gy的實際值為為61.9%,將病例4的Stem、Chi、PG_L與靶區進行三維重建,其空間位置關系見圖3。

表4 10例病例計劃兩種評分方法得分對比(分)Table 4 Comparison of the plan scores obtained by the two scoring methods in 10 cases(scores)

表5 病例4兩種評分方法PQM子測度項得分對比(分)Table 5 Comparison of PQM submetric scores obtained by the two scoring methods in case 4(scores)

3 討論

在放射治療過程中,放療計劃質量直接影響放射治療效果,因此對放療計劃質量進行科學合理的定量評估是十分重要的[10-12]。建立基于劑量限值的PQM 可以實現計劃質量的定量評估,但此方法忽略了病例間的差異性,很難客觀地評價個體病例的放療計劃是否達到最優[13]。除此之外,同一病種不同指南共識給出的劑量限值并不相同,這也給定量評分帶來了更多的不確定性[14-18]。

建立基于劑量預測值的PQM可以根據病例的實際情況實現放療計劃質量的個性化定量評估,其核心在于準確地預測劑量學信息?,F階段研究表明,提高模型預測準確性主要通過改進模型算法和優化模型輸入特征的選擇[19-24]。Zhu等[21]用198例高質量前列腺癌計劃建立數據庫,以OAR體積和距離-目標直方圖(Distanceto-Target Histogram,DTH)為幾何解剖學信息特征,先用主成分分析法確定DTH和DVH的主成分特征,再通過支持向量回歸方法(Support Vector Regression,SVR)建立DTH和DVH之間的數學模型,實現預測劑量學信息預測,預測結果準確性約為80%。陳辛元等[23]在鼻咽癌VMAT計劃質量控制方法的研究中,選取了7個幾何特征作為輸入,通過搭建人工神經網絡模型,預測三維劑量分布,對于劑量學指標D2%、D25%、D50%、D75%和平均劑量,預測結果和實際值的差異分別為(-0.27±1.19)、(-0.47±1.29)、(0.93±0.98)、(1.20±1.12)和(0.44±1.02)Gy。Jiao等[22]在預測模型輸入特征的選擇上,以未優化的劑量計算結果為劑量信息,將幾何信息特征DTH和劑量信息特征結合起來作為模型輸入特征,結果發現此方法可以顯著提高模型預測準確性。

本研究搭建了一個人工神經網絡模型,以25 個空間幾何特征作為模型輸入,用來預測PQM 子測度項劑量學信息。結果顯示模型實際劑量-預測劑量擬合線接近于y=x,預測結果整體表現良好,準確性可達90%,高于Zhu 等[21]的SVR 模型,與陳辛元等[23]研究基本結果一致。但模型對視神經的預測效果較差,可能是由于視神經的形狀比較狹長,通過OVH將幾何特征降維時丟失了部分特征信息,Jiao等[22]通過將劑量信息加入模型輸入特征后,對比只以幾何信息作為輸入特征,視神經的預測效果提高46.7%,本課題組下一步打算將劑量信息特征加入模型輸入特征,提高模型預測準確性。對于其他預測結果超出10%誤差限值的病例,其中大部分為預測值大于實際值,表明預測模型低估了這些病例的最優計劃可以到達的程度,這可能是由于本研究選取的病例為臨床治療病例,訓練集中部分計劃在達到臨床要求后并未對計劃質量做進一步優化,仍存在改進空間。在本研究中,分別用基于劑量限值標準建立PQM 和基于劑量預測值建立PQM 兩種方法對10 例測試集病例放療計劃進行定量評估。結果表明,其中有7例病例前者方法的得分高于后者方法的得分,對于以基于劑量預測值建立PQM方法評估得分較低的子測度項,表明預測模型預測放療計劃中該子測度項還存在優化空間。對于判斷計劃是否合格,兩種方法對其中8例的判斷都是一致的,對于病例9,基于劑量限值建立PQM 方法評定為合格,基于劑量預測值建立PQM 方法評定為不合格,說明該計劃雖然整體滿足劑量限值要求,但預測模型認為其還存在優化空間;對于病例4,其腦干、視交叉、腮腺均超過劑量限值,基于劑量限值建立PQM方法評定為不合格,基于劑量預測值建立PQM 方法評定為合格,結合該病例相應OAR與靶區空間關系圖(圖3)可以發現,該病例腦干和視交叉與靶區距離很小,GTV 靶區更是侵犯了左側腮腺。由于本研究進行劑量信息評估的腦干、脊髓、視神經、視交叉皆為進行外擴后的計劃危及器官組織,外擴后的腦干、視交叉與靶區存在交疊,且RTOG 0225 號報告[25]提出鼻咽癌放療最大可接受劑量限值為腦干D1%≤60 Gy,視神經D1%≤60 Gy,單側腮腺V30Gy<50%,考慮到OAR 和靶區的空間關系,該計劃在臨床上也是通過的。以上結果說明,兩種評分方法都可以對大部分計劃做出較為合理的評分,但對于一些特殊病例,基于劑量預測值建立PQM的評分方法能更客觀地反映計劃質量。

圖3 病例4 OAR與靶區空間關系圖Figure 3 Spatial relationships between OAR and target area in case 4

綜上所述,本研究提出一種劑量預測引導的鼻咽癌計劃質量定量評估的方法,該方法既可以反映計劃是否存在可以優化的空間,又克服了基于劑量限值建立PQM進行定量評估過程中忽視了病例特異性的缺陷,能夠更科學、更合理地通過評估得分反映計劃質量。

猜你喜歡
預測值限值劑量
近地層臭氧劑量減半 可使小麥增產兩成
CT設備的掃描電壓對放療計劃劑量計算的影響
兩種64排GE CT冠脈成像信噪比與劑量對比分析研究
AI講座:ML的分類方法
用藥劑量:老年人≠成年人
自體熒光內鏡對消化道腫瘤診斷臨床應用分析
季節模型在某醫院月門診量預測中的研究與應用
2017年北京將實施“世界最嚴”鍋爐排放標準
跨境電商執行新稅制
歐洲議會采納了歐Ⅵ排放標準草案
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合