周峰,薛淑禎,趙國楨,李博,徐霄龍,劉清泉
(1.首都醫科大學附屬北京中醫醫院,北京 100010;2.北京中醫藥大學,北京 100029;3.首都醫科大學,北京 100069;4.中國中醫科學院中醫臨床基礎醫學研究所,北京 100700)
膿毒癥是一種機體對感染反應失調而引起的生理、病理和生物學異常的危及生命的綜合征[1]。最近一項關于全球膿毒癥的研究[2]表明,2017 年全球有4 890 萬例膿毒癥病例和1 100 萬例的相關死亡病例。膿毒癥高發病率、病死率以及所產生的巨大的經濟負擔,導致其已經成為一個全球性公共衛生問題[3]。然而,對膿毒癥缺乏病理生理學方面的準確認識,導致目前的治療方案仍以抗感染、液體復蘇、臟器支持、機械通氣、血管活性藥物等對癥治療為主[4]。越來越多的證據表明,中醫藥以其多通路、多靶點、多效應作用治療膿毒癥的療效確切[5],尤其是在抗炎、調節免疫、緩解臨床癥狀、改善預后等方面[6]。
但是目前中醫藥臨床研究方法學較為薄弱,特別是結局指標方面的問題尤為突出:規范性差、選擇不合理、異質性大等[7],導致單項研究價值的下降以及中醫藥同類研究很難做到合并和比較分析,導致研究資源的嚴重浪費。核心結局指標集(COS)是同一醫療保健領域的所有臨床試驗都應測量和報告最小的指標集合,研制方法學完善、得到臨床專家共識的COS 是解決上述問題的關鍵[8]。本研究旨在提取、合并及分析近兩年中醫藥干預膿毒癥的隨機對照試驗(RCTs)中結局指標的使用情況,為相關COS 的研究奠定基礎。
1.1 文獻來源 計算機檢索中國知網(CNKI)、萬方數據庫(Wanfang Data)、中文科技期刊數據庫(VIP)、中國生物醫學文獻服務系統(SinoMed)、PubMed、Embase 與Cochrane Library 數據庫。為了保證檢索的全面性,還會對中國臨床試驗注冊中心和ClinicalTrails.gov 中的試驗方案進行檢索。
1.2 檢索策略 中文檢索詞包括“膿毒癥”“血液中毒”“膿毒血癥”“感染性休克”“膿毒性休克”“多器官功能障礙”以及與中醫藥相關的詞匯,如“中醫藥”“中藥”“針灸”“推拿”“艾灸”“氣功”“穴位貼敷”等。英文檢索詞包括:Sepsis、Bloodstream Infection、Pyemia、Pyohemia、Blood Poisonings、Medicine、Chinese Traditional、Zhong Yi Xue、Traditional Tongue Diagnoses等。檢索時間為2021年1月1日到2022年11月1日。
1.3 納入標準 明確診斷為膿毒癥且年齡≥18 歲的患者;干預措施包括所有與中醫藥相關或中醫學理論指導下的治療;文獻類型設定為RCT。對于患者其他信息(性別、病程、種族),對照組干預措施以及納入研究語言種類均不進行限定。
1.4 排除標準 患者診斷為膿毒癥合并并發癥:胃腸功能障礙、凝血功能障礙、心肌損傷、肺功能損傷、肝功能損傷、腎損傷、腦損傷;非中文核心期刊的論文;無法獲取全文的研究;單頁紙的研究;會議論文;學位論文。
1.5 文獻篩選 將題錄信息導入NoteExpress 3.7.0軟件,軟件去重后閱讀題錄信息完成初次篩選。然后對符合條件的文獻全文閱讀,以確定是否最終納入。篩選工作由兩名研究者獨立完成并交叉核對。遇到分歧時,請教第3 名研究者,如果認同前兩名研究者中任何一方的觀點,則以第3 名研究者的判斷為準。如果3 名研究者意見均不一致,則討論決定或咨詢相關領域的專家。
1.6 資料提取 預先設計資料提取表,條目包括作者人口學信息、樣本量、年齡、診斷標準、干預措施、中醫證型、療程、結局指標。
1.7 質量評價 采用Cochrane 偏倚風險評估工具對研究的偏倚風險進行評估,對“隨機序列生成,分配隱藏,受試者和研究人員盲法,結局評價者盲法,結局數據完整性,選擇性報告,其他偏倚”7 個方面作出低、高或未知風險的評估。
1.8 統計分析 首先對篩選過的結局指標進行標準化:1)根據結局指標的相似性進行排序。2)將所有結果的原始定義和名稱統一采用標準化術語。3)去除重復結果,對相同結果進行合并,合并結果將被拆分為兩個單獨的結果。在Excel 中對結果進行描述性分析:納入文獻的基本特征、結局指標特征及分類、高頻結局指標的使用、診斷標準的選擇、指標組合使用情況。
2.1 文獻檢索 計算機檢索7 個中英文數據庫和兩個臨床試驗注冊庫,共獲得文獻14 254 篇,軟件去重后剩余8 868 篇文獻,進一步通過題錄信息篩選后剩余658 篇文獻,閱讀全文后決定最終納入47 篇核心期刊文獻[9-55]和6 篇[56-61]臨床試驗注冊方案。文獻篩選流程圖見圖1。
圖1 文獻篩選流程圖Fig.1 Literature screening process
2.2 基本特征 規范檢索后共納入53 項研究6 320 例患者,其中中文核心期刊47 篇,試驗方案6 篇。樣本量范圍為40~1 520 例。平均年齡范圍為38.7~75.9 歲。其中,共有27 項研究報告了中醫證型[9,13,16,18-25,28-31,37-39,42-45,47,50,52,54,58],包括熱毒熾盛證[9,19,21,24-25,37,42-43,47]、陽氣暴脫證[13,18,22,28-31,45,52,54]、氣營兩燔證[16]、氣陰兩虛證[19,50,58]、熱入營血證[20]、外感發熱證[23]、陽虛水泛證[38]、大腸燥熱證[39]、脾虛濕盛證[44]。中醫干預措施包括中藥湯劑[10-11,20-22,24-26,37-39,42-44,47-48,59-60]、顆粒劑[9,55]、中藥注射液[12-19,24,27,29-35,40,46,49-53,56,58,61],五行音樂療法[10]、刮痧[23]、中藥灌胃[28]、中藥灌腸[41]、艾灸[36]、電針[45,52,57]。納入文獻基本特征見表1。
表1 納入文獻基本特征Tab.1 Basic characteristics of included literature
2.3 偏倚風險評估 對47 篇核心期刊文獻[9-55]進行偏倚風險評估,見表2。隨機序列生成方面,24 項研究[10,13,15,19-25,31,33,36,38-40,42-47,52,54]使用隨機數字表分組被評為低風險,1 項研究[11]使用信封法被評為低風險,1 項研究[18]使用拋硬幣的方法被評為低風險,1 項研究[28]根據入院時間分組被評為高風險,9 項研究[14,27,29,34-35,41,51,53,55]根據治療方法分組被評為高風險,9 項研究[16-17,26,30,32,37,48-50]被評為未知偏倚風險。分配隱藏方面,1 項研究[23]使用不透光信封法被評為低風險,其余研究[9-22,24-55]均未提及,被評為未知偏倚風險。所有研究[9-55]均未對受試者和研究人員設盲,均評為高風險。1 項研究[23]對結局評價者設盲,被評為低風險,其余[9-22,24-55]被評為高風險。所有研究[9-55]數據完整,數據完整性被評為低風險。選擇性報告方面,所有研究[9-55]均被評為未知偏倚風險。37 項研究[10-15,17,21-28,30,32-39,41-49,52-55]由政府資助,其他偏倚被評為低風險,其余[9,16,18-20,29,31,40,50-51]被評為未知偏倚風險。
表2 風險偏倚評估Tab.2 Risk bias assessment
2.4 結局指標
2.4.1 結局指標使用情況 53 項研究共報告了569 個結局指標,161 種結局指標,平均每項研究報告11 個結局指標。對使用次數≥2 次的結局指標進行分類分析,參考《中醫藥臨床試驗核心指標集研制技術規范》[62],依照指標的功能屬性分為7 個部分,見圖2。
圖2 結局指標分類圖Fig.2 Classification of outcome indicators
2.4.2 高頻指標使用情況 使用頻率最高的15 個結局指標為:急性生理與慢性健康(APACHEⅡ)評分、降鈣素原、序貫器官衰竭(SOFA)評分、C 反應蛋白、總有效率、28 d 病死率、白介素-6、平均動脈壓、重癥監護室(ICU)住院時間、乳酸、不良事件、腫瘤壞死因子-α、CD4、CD8 和中醫證候積分,見表3。
2.4.3 診斷標準使用情況 53 項研究采用的膿毒癥診斷標準共計11 種[1,63-72],種類及頻數見表4。
表4 膿毒癥診斷參考標準Tab.4 Diagnostic reference criteria for sepsis
2.4.4 指標組合使用情況 納入的53 項研究中,有10 項研究[12,16,20,25,27,36,39,42,47-48]同時使用APACHEⅡ評分和降鈣素原;有5 項研究[22,29,34,53,55]同時使用APACHEⅡ評分、降鈣素原、SOFA 評分;有5 項研究[14,24,33,35,58]同時使用APACHEⅡ評分、降鈣素原、SOFA 評分、C 反應蛋白;有2 項研究[31,40]同時使用APACHEⅡ評分、降鈣素原、SOFA 評分、C 反應蛋白、總有效率。
3.1 納入研究的合理性 結局指標作為試驗設計和分析的重要部分,納入文獻質量對結局指標質量有重要影響。本研究的文獻篩選方法從兩個方面提升結局指標質量。第一,考慮到只納入高質量文獻會導致結局指標具有局限性,納入全部類型的文獻又會導致工作量繁重,可行性較差。所以本研究僅納入核心期刊發表的RCT,整體質量較高且指標選擇較為全面。第二,本研究開始前初步檢索相關文獻數量較多,參考《中醫藥核心指標集研究中指標池構建相關影響因素分析》[7],本研究限制文獻發表年份為近2 年,基本可以包含新老指標,且可以保證結局指標的時效性和臨床代表性。
3.2 納入研究的局限性
3.2.1 偏倚風險較大 對47 項RCTs 的偏倚風險評估結果顯示,納入研究方法學質量較差,偏倚風險較高。大多數研究都采用了主觀性的結局指標,例如總有效率、APACHEⅡ評分、SOFA 評分等,且所有研究均未對受試者和實驗人員設盲,導致受試者和試驗人員主觀因素對結果的影響較大,增加了信息偏倚。所有研究均未提前注冊,選擇性報告偏倚和發表偏倚較高,可能導致結局指標選擇更加偏向陽性結果,影響臨床試驗的真實性。
3.2.2 診斷標準差異較大 納入研究中,91%的研究報告了膿毒癥的診斷標準,但診斷標準間差異較大。目前國內和國際上膿毒癥診斷標準種類較多,盡管國內和國際學者們對膿毒癥的定義和診斷標準不斷探索和完善,但由于人群體質和地理因素等的差異存在,尚未形成公認的膿毒癥診斷標準。未來可以通過建立中國膿毒癥患者診斷標準的專家共識來實現診斷標準的標準化、一體化,避免同類研究難以合并導致研究資源的浪費。
3.3 結局指標選取的合理性 應用頻次最高的兩項指標分別是APACHEⅡ評分、PCT。APACHEⅡ評分是重癥監護中應用最多的評分系統[73],可準確評估患者的病情,指導進一步治療以及預測膿毒癥患者的病死率。PCT 是一種廣泛應用于膿毒癥的診斷,治療和預后評估炎癥指標。大量研究表明[74-75],PCT 相比于傳統炎癥指標具有明顯的優勢,例如持續時間長,特異性高,數值與疾病嚴重程度呈正相關等。膿毒癥以其高發病率、高病死率、預后較差等已經成為ICU 患者的主要死亡原因,APACHEⅡ評分和PCT 均可以準確、快速評估患者病情,指導進一步治療。
3.4 結局指標選取的局限性
3.4.1 結局指標選取異質性大 單項研究中,結局指標選取數量最少為3 個,最多為38 個,結局指標選取異質性大,指標離散程度高,且納入研究中指標組合使用隨意性較大。上述問題會導致研究結果脫離臨床需求,臨床結果應用價值嚴重受損,同類研究難以進行合并分析結果。這可以通過建立中醫藥治療膿毒癥相關的COS 來解決,規定臨床研究中必須報告的最小指標集合,有助于減少臨床研究中的偏倚,提升研究價值。
3.4.2 忽視中醫特色指標、安全性指標和經濟學指標 納入研究均采用了中醫相關的治療,但僅有11 項研究選擇了中醫證候積分這項指標。指標選擇過分關注理化檢查,缺乏中醫特色。且中醫證候積分作為結局指標主觀性較大,作為療效評價的指標缺乏真實性和代表性,這恰恰是中醫臨床研究質量較低的原因之一。53 項研究中僅有1 項研究[33]選擇了“人均費用”作為結局指標,其余均未報道經濟學指標,中醫相關的特色治療如針灸、推拿等,治療費用和西藥相比普遍較低,所以經濟學指標也應作為臨床研究的結局指標之一。納入本研究中的14 項研究[11-12,14,18,23,26-27,34-35,48-50,54,58]報告了不良事件,2 項研究[41,43]報告了并發癥。據2018 年度統計中藥不良反應占比14.6%[76],因此所有中醫藥臨床研究均應詳細報告不良反應發生情況,無不良反應也需在文中提及。
3.4.3 結局指標報告不規范 第一,結局指標類型隨意轉換,例如對于連續性變量的臨床療效指標,多轉化為等級資料顯效、有效、無效,最終以“總有效率”指標進行統計學分析,且不同研究間療效評價標準也不統一。上述問題導致研究原始數據缺失,嚴重影響數據的二次合并分析。第二,結局指標主次不分。主要結局指標是直接與試驗目的有本質聯系的觀察指標,通常只預設1 個;次要指標是指與試驗目的相關的具有輔助性質的指標,通??深A設多個。指標主次不分、雜亂無序,會嚴重影響研究的質量和可信度。第三,結局指標存在相似交叉條目,例如生活質量評分以8 個維度來進行評估,在中醫證候積分以及其他多項評分量表中均有重復交叉的現象。
3.4.4 測量工具及時點不統一 納入研究在結局指標的測量工具的選擇具有很大的異質性。例如,同一結局指標“總有效率”,測量工具的選擇就包括了4 種[67,69,77-79]。目前中國研究者已經逐步開展COS的研究工作,但對測量工具的選擇卻缺乏關注,所以COS 的研究人員應在完成后,為每一個結局指標確定相應的測量工具并推廣到臨床應用當中。相同指標測量時點差異較大,如遠期預后指標病死率的測量時點就包括7、14、28 d 等。測量時點多且跨度較大,導致指標的差異性增加,嚴重影響指標的臨床有效性和可信度。
3.5 結局指標應用的思考 自古以來,中醫藥的發展源于臨床觀察和經驗的總結,其發展路線遵循實踐到理論到實踐的原則,其中臨床療效是核心所在。臨床試驗證據等級最高的就是系統評價和Meta分析,但臨床研究過程中發現,大量同類研究因為結局指標的選擇、描述、測量等問題難以合并分析,導致研究資源的嚴重浪費。對此,建立中醫藥相關的COS 是解決問題的關鍵。自從2012 年中國研究者注冊了第1 項中醫藥領域的COS 之后,陸續出現了一系列相關的技術規范和專家共識,但是COS 的研制尚未有成熟和公認的方法和體系。中醫藥COS應該以中醫臨床為基點,借鑒西醫研究方法,取其精華去其糟粕,構建具有中醫藥特色,適合中國臨床研究的COS。
本研究通過分析近兩年中醫藥治療膿毒癥RCTs 中結局指標的選擇現狀,提出了目前結局指標應用的優勢和局限性,為后續COS 的研制提供參考。但本研究尚存在一些局限性:納入研究數量較少;僅納入中醫藥干預的研究,未與西醫學干預研究中的結局指標進行對比分析等。未來仍需納入新發表的高質量文獻進行補充以及與膿毒癥的西醫結局指標域進行對比分析,規范指標選擇和報告,推動中醫特色臨床評價體系的進步與發展。