?

肝細胞癌自動化BCLC分期模型研究

2024-04-15 08:00張冰許慶祎
中國衛生標準管理 2024年5期
關鍵詞:準確率錯誤病例

張冰 許慶祎

肝細胞癌是我國最常見的惡性腫瘤之一,其發病率在所有惡性腫瘤中排第4位,病死率排第3位,嚴重威脅我國人民的生命健康[1]。巴塞羅那分期(Barcelona clinic liver cancer,BCLC)是目前國際廣泛認可的HCC重要分期之一,用于判斷患者腫瘤情況,是制訂臨床診療方案以及評估患者預后的重要根據[2]。BCLC分期自1999年初次提出后[3],至今歷經多次版本更新,故除經系統培訓的肝臟??漆t師外,大部分全科醫師及非肝臟??漆t師對BCLC分期均存在不同程度的認識不足。尤其基層醫院,因知識更新渠道缺乏、對??萍膊≡\療經驗不足等原因,可能在HCC患者的病情判斷、指導分診等方面出現誤差,從而影響患者及時獲得有效治療。而學術研究中,在需對大量既往病例進行即時、準確分期時,也存在耗時較長、人為的主觀錯誤難以避免等問題。目前,大數據時代激發的新技術進步和多學科交叉融合,使實現HCC的自動化BCLC分期成為可能。因此本研究擬依托自主研發建立的HCC大數據平臺,構建自動化BCLC分期模型,以服務于臨床診療及學術研究工作。

1 資料與方法

1.1 一般資料

收集福建醫科大學孟超肝膽醫院2020年1月—2022年12月收治的HCC患者的臨床資料,通過數據倉庫技術(extract-transform-load,ETL)工具[4]構建患者的全維度數據集(每個病例含700個維度)。選取2020年1月—2022年12月收治的1 076例HCC患者,用于構建HCC自動化BCLC分期模型,其中926例作為訓練集,150例作為驗證集。隨機抽取2020年1月—2022年12月收治的HCC患者共191例,進行既往病例測試;選擇2020年1月—2022年12月收治的180例HCC患者,進行新增病例測試。納入標準:(1)入院后完善影像學、乙肝兩對半、甲胎蛋白(alpha-fetoprotein,AFP)等檢查,臨床診斷為HCC。(2)行手術或穿刺活檢者病理確診為HCC。(3)臨床資料準確完整。排除標準:(1)手術或穿刺病理診斷其他類型肝癌或轉移瘤等。(2)臨床資料不完整。 本次試驗經醫院醫學倫理會批準(20190512)。

1.2 方法

采用基于機器學習的自然語言處理和基于Python語言的XGBoost模塊等方法構建自動化BCLC分期模型。

1.2.1 數據采集

通過數據庫自動采集器實時采集電子病歷系統(electronic medical record,EMR)/醫院信息系統(hospital information system,HIS)/影像歸檔和通信系統(picture archiving and communication system,PACS)等系統的信息,將1 076例HCC患者的全維度數據集(每個病例含700個維度)存放在接口庫。

1.2.2 數據清洗

系統設定跟蹤系統,接口庫有內容更新,自動提取患者住院號,收集診斷、檢驗、影像等數據,對數據進行清洗,實現數據的統計口徑一致、剔除無用和冗余數據的工作后,將高維向量集寫入中間庫。

1.2.3 數據整合

將來自于中間庫的數據按照科研所需要的資源按照人口庫、檢驗庫、診斷庫、病史庫等寫入到基礎庫中。

1.2.4 數據存儲

基礎庫存放在數據存儲中,提供相關結果給各個應用調用。

1.2.5 數據分析

以2016年BCLC分期[5]為標準用于建模,從基礎庫中提取診斷、檢驗及影像數據,利用基于醫學語言的自然語言處理,通過基于機器學習的自然語言處理[6]及決策樹等方法對影像報告的描述和診斷結論進行醫學文本的自然語言處理后,從中選取肝性腦病、腹水、總膽紅素、白蛋白、凝血酶原時間、腫瘤個數、腫瘤直徑、門靜脈癌栓情況、肝外轉移情況、患者體力情況等12個相關維度,寫入BCLC分期標準庫,見圖1。

圖1 2016年BCLC分期

1.2.6 建模原理

決策樹是將空間用超平面進行劃分的一種方法。決策樹的boost方法:是一個迭代的過程,每一次新的訓練都是為了改進上一次的結果。XGBOOST算法[7]是一種全新的迭代決策樹算法,可以提供高精度的預測,該算法由多棵決策樹組成,所有樹的結論累加起來做最終結果。XGBOOTS的預測函數如公式1所示:

XGBOOTS的目標函數如公式2所示:

XGBOOTS的目標函數為:泰勒二階展開和巧妙的定義了正則項,用求解到的數值作為樹的預測值,見圖2。

圖2 XGBOOTS目標函數的泰勒展開

1.2.7 模型建立及驗證

導入BCLC分期標準庫,通過含926例HCC患者的訓練集,采用基于機器學習的自然語言處理和基于Python語言的XGBoost模塊等方法,構建HCC自動化BCLC分期模型,使用含150例HCC患者的驗證集對模型進行驗證,記錄模型準確率。

1.3 HCC自動化BCLC分期模型測試

1.3.1 測試分組

模型測試分為既往病例測試和新增病例測試。由2名肝膽外科主治醫師對測試病例根據2016年BCLC分期為標準進行雙盲式人工分期,獲得標準分期用于校正。在大數據平臺里電子病歷庫中檢索測試病例的原始病歷中所記錄的BCLC分期,定義為病例記錄分期。利用自動化BCLC分期模型對測試病例進行分期,獲得模型自動化分期,記錄測試病例開始導入至分期結束的總耗時。

1.3.2 測試方法

本研究定義模型測試中HCC自動化BCLC分期模型準確率與病例記錄分期的準確率誤差不超過5%,即認為建模成功。用標準分期分別校正模型自動化分期及病例記錄分期,記錄二者準確率,找出錯誤案例,并逐份抽取原始病歷分析錯誤原因。

1.4 統計學處理

采用SPSS 23.0統計學軟件進行分析。計量資料以(±s)表示,組間比較采用獨立樣本均數t檢驗;計數資料用n(%)表示,行χ2檢驗。P< 0.05為差異有統計學意義。

2 結果

2.1 建模成功

用含150個病例的驗證集對所構建的HCC自動化BCLC分期模型進行驗證,準確率為93.33%,提示建模成功。

2.2 病例測試結果

既往病例測試結果提示,經標準分期校正,自動化分期準確率為98.43%,錯誤3例,其中0期1例,A期2例,B期0例,C期0例,D期0例,總耗時約19 s。錯誤原因主要是機器對于CT、MRI、腹部彩超報告中腫瘤個數及腫瘤直徑的判斷出現錯誤。記錄分期準確率為96.33%,錯誤7例,其中0期2例,A期5例,B期0例,C期0例,D期0例。錯誤原因包括:(1)電子胃鏡報告可見食管胃底靜脈曲張,提示門靜脈高壓,只關注CT報告,未關注胃鏡報告結果,混淆0期與A期。(2)生化全套提示總膽紅素值異常,僅用于 Child-Pugh評分,未理解對分期影響,混淆0期及A期。(3) Child-Pugh評分為Child B期,只關注腫瘤個數及直徑,混淆0期與A期。

2.3 新增病例測試結果

新增病例測試結果提示,經標準分期校正,自動化分期準確率為95.56%,錯誤8例,其中0期1例,A期1例,B期4例,C期2例,D期0例,總耗時約18 s。錯誤原因包括:(1)主要是機器對于CT、MRI、腹部彩超報告中腫瘤個數及腫瘤直徑的判斷出現錯誤。(2)彩超報告中提示肝外轉移灶待排,CT、MRI報告同一部位無轉移,機器邏輯為報告出現一處轉移記錄就是出現轉移,導致分期錯誤。(3)將巨塊型腫瘤周圍1個子灶一并統計腫瘤個數,歸入B期。記錄分期準確率為96.11%,錯誤7例,其中0期2例,A期1例,B期2例,C期2例,D期0例。錯誤原因包括:(1)CT、MRI報告可見食管胃底靜脈曲張,提示門靜脈高壓,未理解對分期影響,混淆0期與A期。(2)將肝靜脈癌栓及膽管癌栓歸入C期。(4)CT報告提示肝外轉移(腎上腺),未看到。(5)將均<3 cm的3個腫瘤歸入B期。

3 討論

“大數據”時代的來臨已在多個學科領域引發大變革,目前《Nature》《Science》等頂尖學術期刊均推出相應??接懫鋺?,健康醫療大數據更受到全球范圍內的關注、重視。隨著大數據技術的進步、成熟,現已可將臨床記錄、醫學影像、檢驗信息等不同形式的數據迅速而有效地挖掘并有機整合,并進行及時的計算和分析。

BCLC分期是臨床上用于分析HCC的腫瘤情況、制訂診療方案及評估預后的重要依據。自1999年LLOVET等[8]首次提出后,BCLC分期歷經2005、2010、2016年多個版本更新。2005年分期去除了Okuda分期,將單個病灶直徑在2 cm以下定義為0期(極早期),早期治療方案加入射頻消融(radiofrequency ablation,RFA),經導管動脈化療栓塞術(transcatheter arterial chemoembolization,TACE)成為B期首選治療,C期建議參加藥物Ⅱ期研究或隨機對照研究[9]。2016年提出0期患者是潛在肝移植受者概念,明確將直徑2 cm也定義為0期,分期治療方面取消所謂根治性及非根治性療法的說法,進而提出0期、A期、B期、C期均應采取具有生存獲益的有效治療[10]。病例的具體BCLC分期結果常會出現改變,如對既往病例進行人工校正費時費力,且不可避免地會發生主觀性錯誤。另外,非肝臟??漆t生對??浦R的認識不足和相對滯后也可能導致其錯判腫瘤分期。而這些情況都將對HCC的分級診療和臨床研究帶來不利影響。因此,實現HCC的自動化BCLC分期具有積極的臨床實用價值。

本研究利用大數據方法學成功構建了HCC自動化BCLC分期模型,并分別用既往病例和新增病例進行測試,通過富有經驗的??漆t師的雙盲分期來評判測試準確率??倻y試病例共371例,模型自動化分期準確率為97.04%(錯誤11例),而病例記錄分期準確率為96.23%(錯誤14例),兩者大致相當。經逐例分析錯判病例發現,病例記錄分期錯誤主要集中在0期、A期。錯誤發生原因主要包括:(1)部分一線醫生對BCLC分期的認識不充分。(2)既往病例依據舊標準分期并記錄。(3)注意力不夠集中等原因導致主觀錯誤發生。這些都說明人工分期存在著主觀錯誤不可避免、學習成本高等問題。模型自動化分期錯誤則主要是由于腫瘤直徑、腫瘤個數、門靜脈癌栓、肝外轉移灶等相關數據主要從影像學資料提取,而受限于影像科報告醫師的臨床經驗差異、個人習慣不同等因素,該類別存在大量的非結構化數據;雖已經過標準化處理,仍存在部分病例出現維度識別錯誤的問題,最終導致自動化分期錯誤。另外,既往病例測試的自動化分期準確率(98.43%)高于新增病例測試(95.56%),經分析錯誤病例后,考慮由于本團隊過去建設生物信息樣本庫時已對既往病歷資料完成了數據的人工采集歸類,相關維度信息更加詳細、模塊化,故識別提取維度的難度較低、準確度更高。而新增病例是用自動采集器直接從原始病歷、報告等第一手資料中提取維度,難度相對較高而導致個別維度信息提取錯誤。在模型測試過程中所發現的上述缺陷可基于機器學習,進行程序優化以進一步提高準確率[11]。

模型自動化分期的準確率略高于病例記錄分期,且有其獨有優勢:(1)不斷迭代的BCLC分期學習成本高,年輕醫師在大量人工分期時無法避免出現錯誤,而模型分期不存在因主觀導致的錯誤,可輔助臨床醫師做出更精準判斷及減少錯誤,降低學習成本。(2)大數據時代,進行HCC相關學術研究,需要挖掘海量的歷史數據,BCLC分期版本更迭后,需要對海量的既往病例進行重新分期,人工識別工作量大、耗時長,模型分期則可在短時間內完成分期更新,并可根據以后版本進行實時更新,降低時間成本。(3)BCLC分期作為常用HCC分期,在基層醫院因學習渠道窄、接觸相關病例少等問題,普及困難大,容易導致患者治療的延誤,自動化BCLC分期模型建立后可依托互聯網進行推廣,有助于建立醫聯體中更規范的HCC分級診療體制。(4)在機器學習下可逐漸優化模型自身,準確率不斷提高。

在建模過程中,發現諸多不足,模型仍有改進的空間。醫學影像庫的納入僅限于報告的提取,圖像的提取分析功能仍處于研究階段,HCC的診斷強烈依賴于影像,基層醫院經驗不足,導致部分影像學診斷可信度不高,影響了模型的使用推廣,對此可基于醫聯體,建立上下級醫院之間溝通學習的渠道。醫學檢驗庫的納入發現不同時期的檢驗結果因檢驗試劑、方法、設備而出現不一致的問題,檢驗數據的標準化或一致性需要進一步研究。電子病歷庫的納入發現因個人習慣、經驗及大量非結構化部分對數據的提取處理分析提出了挑戰,需根據病例書寫規范進一步進行規范化、模塊化管理。最后是大數據平臺的管理面臨全新的挑戰,包括安全方面、隱私方面、分享交換方面在內,都需要進一步探索[12]。

綜上所述,HCC自動化BCLC分期模型高效、精準,在數據標準化方面尚有改進空間,值得向臨床推廣。

猜你喜歡
準確率錯誤病例
在錯誤中成長
乳腺超聲檢查診斷乳腺腫瘤的特異度及準確率分析
不同序列磁共振成像診斷脊柱損傷的臨床準確率比較探討
2015—2017 年寧夏各天氣預報參考產品質量檢驗分析
“病例”和“病歷”
高速公路車牌識別標識站準確率驗證法
一例犬中毒急診病例的診治
不犯同樣錯誤
妊娠期甲亢合并胎兒甲狀腺腫大一例報告
Meckel憩室并存異位胰腺和胃黏膜并出血一例
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合