?

基于真實世界臨床數據的惡性腫瘤流行病學調查研究

2023-09-17 08:22趙丹丹
上海醫學 2023年7期
關鍵詞:順位白血病直腸

趙丹丹 何 萍 夏 寒 道 理

流行病學調查研究是了解疾病流行病學特征最常用的方法之一,根據不同的研究目的,可采用普查或抽樣調查等方式進行。對于慢性非傳染性疾病的流行病學調查,由于時間跨度、經費、人力資源等客觀因素的存在,常常采用抽樣調查的方式;對于惡性腫瘤的流行病學調查,通常采用醫院登記上報的方式[1]。不論采用哪種方法,都需要投入大量的人力資源,且存在資源消耗大、調查周期長等缺限,難以快速地得到流行病調查結果。

以上海市為例,依托于現有的腫瘤登記報告數據,每隔2年公布1次惡性腫瘤報告。惡性腫瘤報告采用的數據為報告當年之前2年的登記數據,經過人工核查、隨訪等工作,最終形成惡性腫瘤等級報告數據。由于高血壓、糖尿病等慢性病的患者基數大,只能采用抽樣調查的方式估算患者總數,雖投入了大量的人力資源,但結果卻不理想。

上海市自2011年起,建立了上海健康信息網工程,建成了覆蓋上海全市公立醫療衛生機構的數據交換網絡,實現全市衛生信息的數據共享與業務協同。健康信息網平臺以人為主線,按照健康檔案三維模型實現了健康信息的匯聚與整合,包括居民在全市各級醫療機構就診的門急診就診記錄、住院病案、出院小結、檢驗和檢查報告、用藥信息、費用信息等。本研究從真實世界臨床數據的角度出發,利用上海市健康信息網工程成果,通過對臨床電子病歷數據的處理,分析不同類別惡性腫瘤的發病情況,并與傳統報告登記方法進行比較,以期探索一種基于大數據的流行病學統計方法,為流行病學調查研究提供一條新途徑。

1 資料與方法

1.1 病歷資料 選取2014—2018年間上海健康信息網大數據平臺中全部上海市戶籍惡性腫瘤患者就診的病歷資料,所有病例的疾病分類編碼按照WHO《國際疾病分類》(ICD-10)進行編碼。

上海市于2011年4月12日正式啟用上海健康信息網,是實現上海市所有公立醫療衛生機構互聯互通、共享整合的基礎[2]。已基本建立覆蓋全市各級各類公立醫療衛生機構的健康信息網,建成市區兩級數據交換共享平臺,實現了所有區縣的38家三級醫院、近100家二級醫療機構、240家社區衛生服務中心,以及各級、各類公共衛生機構和10 000余個醫生工作站的互聯互通。該網連通的信息系統包括醫療服務相關的醫院管理信息系統、臨床信息系統、實驗室信息管理系統及公共衛生服務相關系統等。目前,上海市市級數據中心已集中匯總了200多億條的診療數據,并以每天1 600多萬條的速度急速增長,是目前最大的單體真實醫療數據庫[3]。

上海市惡性腫瘤發病率資料來源于上海市惡性腫瘤報告,其病例來源于上海市腫瘤登記系統。早在20世紀60年代上海就開始了腫瘤登記工作[4],積累了1973年至今市區惡性腫瘤病例的發病和死亡資料,且在2002年起實現了全市范圍內的腫瘤登記[5]。本研究中所參考的發病率數據由上海市CDC發布[6-7]。

1.2 人口資料 選取2017年末上海市人口各年齡段分布數據。2017年(年末)上海全市戶籍人口約1 452.33萬人。隨著期望壽命的不斷延長,老齡人口比例大幅度增高,65歲及以上人口已占全人群的21.3%,整體人口年齡結構趨向老齡化。2017年末上海市戶籍人口各年齡段分布情況見圖1。

圖1 2017年末上海市戶籍人口各年齡段分布情況

1.3 數據去隱私化 研究過程中,病歷所涉及的患者身份信息全部采用商密3算法(SM3,國家標準《信息安全技術SM3密碼雜湊算法》,GB/T 32905-2016)進行脫敏處理?;颊呱矸莶捎萌ル[私化的通用唯一識別碼(universally unique identifier,UUID)來表示。

1.4 數據預處理 本研究中,腫瘤新發病例的準入標準為每年1月1日前未被確診,且在該統計年度被確診。對多部位原發惡性腫瘤的新發病例統計是按照各部位惡性腫瘤首次診斷日期分別計入當年的該部位發病病例。實際研究工作中,根據“患者標識+確診疾病”對數據進行去重處理。

為方便統計比對,本研究基于規范的診斷編碼(ICD-10編碼)對腫瘤部位進行歸類處理:唇、口腔及咽部(鼻咽部除外)(C00-10、C12-14),鼻咽(C11),食管(C15),胃(C16),結直腸(C18-21),肝臟(C22),膽囊(C23-24),胰腺(C25),喉(C32),氣管、支氣管和肺(C33-34),其他胸腔器官(C37-38),骨(C40-41),皮膚黑色素瘤(C43),乳腺(C50),子宮頸(C53),子宮(C54-55),卵巢(C56),前列腺(C61),睪丸(C62),腎(C64-66、C68),膀胱(C67),腦及中樞神經系統(C70-72),甲狀腺(C73),淋巴瘤(C81-85、C88、C90、C96),白血?。–91-95)。

1.3 屈光異常標準 參考儀器廠家提供的范圍,S表示眼的球徑屈光度(sphere diameter diopter),C表示眼的柱徑屈光度(column diameter diopter)。近視:各年齡組均為S≤-1.0;遠視:2~3歲S≥3.0,4~5歲S≥2.5,5歲以上S≥2.0;散光:各年齡組均為C≤-1.0或≥1.0。

1.5 統計學處理 以上海健康信息網大數據平臺的惡性腫瘤臨床就診病例為數據基礎,按性別分層,分別計算惡性腫瘤發病例數和粗發病率、標化率。采用世界標準人口年齡構成進行世界人口標化率計算[8],分析上海市惡性腫瘤發病特征(發病情況、前10位惡性腫瘤的發病部位情況)和發病年度趨勢。

2 結 果

2.1 上海市惡性腫瘤發病特征

2.1.1 發病情況 2018年度上海市診斷新發惡性腫瘤病例共計83 152例,其中男43 322例(52.1%)、女39 830例(47.9%);惡性腫瘤粗發病率為702.68/10萬(男性為735.47/10萬、女性為672.52/10萬),標化率為329.05/10萬(男性為321.21/10萬、女性為339.28/10萬)。

2.1.2 前10位惡性腫瘤的發病部位情況 2018年度上海市新發惡性腫瘤病例數按發病部位排名第1位為氣管、支氣管和肺(16 234例,粗發病率為139.23/10萬,標化率為61.67/10萬),后依次為結直腸(10 972例,粗發病率為87.19/10萬,標化率為34.75/10萬)、乳腺(6 815例,粗發病率為58.60/10萬,標化率為30.56/10萬)、胃(5 336例,粗發病率為43.75/10萬,標化率為17.27/10萬)、甲狀腺(4 556例,粗發病率為47.55/10萬,標化率為34.77/10萬)、肝臟(3 819例,粗發病率為31.64/10萬,標化率為13.17/10萬)、前列腺(3 547例,粗發病率為27.17/10萬,標化率為9.24/10萬)、白血?。? 132例,粗發病率為18.98/10萬,標化率為13.16/10萬)、膀胱(2 132例,粗發病率為16.66/10萬,標化率為6.22/10萬)、腎臟(2 002例,粗發病率為16.28/10萬,標化率為7.11/10萬)。前10位惡性腫瘤占全部惡性腫瘤發病數量的69.2%(57 545/83 152)。

男性新發惡性腫瘤發病部位排名第1位為氣管、支氣管和肺(8 927例,粗發病率為153.36/10萬,標化率為62.79/10萬),后依次為結直腸(6 560例,粗發病率為107.10/10萬,標化率為42.98/10萬)、前列腺(3 547例,粗發病率為55.03/10萬,標化率為18.52/10萬)、胃(3 402例,粗發病率為57.34/10萬,標化率為22.70/10萬)、肝臟(2 594例,粗發病率為45.05/10萬,標化率為19.27/10萬)、膀胱(1 680例,粗發病率為27.07/10萬,標化率為10.35/10萬)、腎臟(1 370例,粗發病率為23.33/10萬,標化率為10.13/10萬)、白血?。? 232例,粗發病率為22.78/10萬,標化率為16.05/10萬)、甲狀腺(1 147例,粗發病率為25.57/10萬,標化率為19.98/10萬)、胰腺(1 043例,粗發病率為17.17/10萬,標化率為6.61/10萬)。前10位惡性腫瘤占全部男性惡性腫瘤發病數量的72.72%(31 502/43 322)。

女性新發惡性腫瘤發病部位排名第1位為氣管、支氣管和肺(7 307例,粗發病率為125.31/10萬,標化率為60.94/10萬),后依次為乳腺(6 815例,粗發病率為115.89/10萬,標化率為61.19/10萬)、結直腸(4 412例,粗發病率為68.44/10萬,標化率為27.19/10萬)、甲狀腺(3 409例,粗發病率為67.32/10萬,標化率為48.54/10萬)、胃(1 934例,粗發病率為30.93/10萬,標化率為12.34/10萬)、子宮(1 234例,粗發病率為21.22/10萬,標化率為10.90/10萬)、肝臟(1 225例,粗發病率為19.16/10萬,標化率為7.56/10萬)、子宮頸(1 172例,粗發病率為22.17/10萬,標化率為13.08/10萬)、白血?。?00例,粗發病率為15.55/10萬,標化率為10.52/10萬)、卵巢(886例,粗發病率為15.28/10萬,標化率為8.46/10萬)。前10位惡性腫瘤占全部女性惡性腫瘤發病數量的73.55%(29 294/39 830)。

在前10位惡性腫瘤新發病例數中,男性結直腸新發惡性腫瘤標化率是女性的1.58倍,胃新發惡性腫瘤標化率是女性的1.84倍,肝臟新發惡性腫瘤標化率是女性的2.55倍,白血病標化率是女性的1.53倍;女性甲狀腺新發惡性腫瘤標化率是男性的2.48倍。

2.2 發病年度趨勢 上海健康信息網在2016年已基本覆蓋所有的醫療機構、公共衛生中心和社區衛生中心的真實數據,考慮到覆蓋之初數據質量的欠缺,本研究主要統計分析2017年、2018年惡性腫瘤的發病情況。由于本研究過程中暫未公開發布2016年上海市惡性腫瘤發病相關數據,故本研究選用上海市CDC發布的2014年、2015年的數據進行比對分析。

整體惡性腫瘤發病情況:與2014年相比,2018年的前列腺、胰腺、神經系統(腦、中樞神經系統)和甲狀腺的新發惡性腫瘤標化率降低,其中胰腺、神經系統新發惡性腫瘤標化率順位跌出前10;肺(氣管、支氣管和肺)、結直腸、乳腺、胃、肝臟、白血病、腎臟、膀胱的新發惡性腫瘤標化率增高,其中肺、結直腸、乳腺、白血病標化率增高明顯(增高幅度>10%)。見圖2。

圖2 2014—2018年上海市惡性腫瘤標化率變化圖(不含2016年數據)

男性惡性腫瘤發病情況:肺(氣管、支氣管和肺)、結直腸、胃、甲狀腺、肝臟、前列腺的惡性腫瘤高發,尤其是肺、結直腸新發惡性腫瘤的標化率顯著增高。見圖3。

女性惡性腫瘤發病情況:乳腺、肺(氣管、支氣管和肺)、子宮頸的惡性腫瘤高發,且呈增長趨勢;尤其是肺、乳腺新發惡性腫瘤標化率顯著增高。見圖4。

圖4 2014—2018年上海市女性惡性腫瘤標化率變化圖(不含2016年數據)

3 討 論

與2014年的數據相比,2018年上海市氣管、支氣管和肺,以及結直腸、乳腺、胃、肝臟、白血病、腎臟、膀胱部位的新發惡性腫瘤標化率增高,其中氣管、支氣管和肺,以及結直腸、乳腺、白血病等標化率增高明顯(增高幅度>10%)。惡性腫瘤疾病譜的構成發生改變,神經系統和胰腺相關的惡性腫瘤標化率順位退出前10,白血病和腎臟標化率順位分別前移至7、9。在男性中,白血病取代食道惡性腫瘤標化率順位前移至7,且胰腺惡性腫瘤標化率順位退至第10。在女性中,子宮、白血病、卵巢新發惡性腫瘤標化率順位移至前10,神經系統、胰腺和膽囊惡性腫瘤標化率順位退出前10,甲狀腺惡性腫瘤標化率由順位1降至順位3,乳腺與氣管、支氣管和肺癌惡性腫瘤標化率分別為順位1和2。

乳腺惡性腫瘤在女性中高發,女性子宮頸、子宮新發惡性腫瘤標化率呈逐漸增高趨勢。

2017年、2018年上海市惡性腫瘤發病例數順位和標化率、腫瘤譜,以及上海市男、女性新發惡性腫瘤例數順位和標化率、腫瘤譜的差異不大,數據統計分析結果穩定;表明本研究方法可較快地得到相對客觀的、穩定的流行病學統計指標。

本研究方法也存在一些因為數據質量缺陷導致的準確性不足,主要包括兩個方面:①疾病編碼的一致性;②人員填寫疾病編碼的準確性。就上海市醫療信息化而言,雖然醫院信息化系統普遍采用ICD-10作為疾病編碼,但具體系統建設過程中,各醫院的信息化系統所采用的ICD-10字典稍有差別,造成惡性腫瘤診斷編碼取值可能存在不一致的情況;另一方面,由于人工輸入病例數據,可能存在誤編碼、漏編碼的現象,尤其對新發癌癥和轉移癌的界定不十分嚴謹造成數據采集誤差。隨著醫療標準化的進程和數據質量控制措施的不斷完備,因數據質量導致的數據誤差將逐漸減少。此外,隨著各方數據的不斷采集和融合,對新發惡性腫瘤病例的識別也能發揮出大數據的優勢,將逐步減少數據誤差,提高本研究方法的準確性。

本研究方法是基于真實世界臨床數據的統計分析方法,與衛生統計學方法存在一些數據來源、數據處理方式的不同,相關研究對此也有描述[3]。與衛生統計學方法相比,本研究方法有人力成本低、調查進度快的優點。本研究目的并不是取代現有腫瘤登記報告制度,而是為現有腫瘤登記報告制度提供一種便捷的、有效的大數據統計方法。利用本研究方法可減少部分人力、物力成本投入,更加快速及時地獲取惡性腫瘤的數據,作為傳統方法的有益補充。

猜你喜歡
順位白血病直腸
18F-FDG PET/CT在結直腸偶發局灶性18F-FDG攝取增高灶診斷中的價值
抵押前順位作展期是否要后順位同意
一例蛋雞白血病繼發細菌感染的診治
白血病外周血體外診斷技術及產品
音樂和家庭都是第一順位!兩者才是他要的“爵式人生”
海事船舶優先權的受償順位問題分析
彩超引導下經直腸行盆腔占位穿刺活檢1例
閱讀理解Ⅰ
PPH聯合消痔靈注射治療直腸黏膜內脫垂46例
淺析抵押權順位相關問題
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合