楊金盤 馬秋平 張佳琳 劉裕君 楊春曉
廣西中醫藥大學,南寧市 530200
缺血性腦卒中(ischemic stroke,IS)是我國成年人殘疾、死亡的主要病因,我國IS患者腦卒中后抑郁(post-stroke depression,PSD)的發病率為20%~40%[1]。PSD可繼發于發病后的任何階段,常伴有興趣缺失、睡眠紊亂、自責自罪和易疲勞等癥狀[2]。PSD可影響患者功能康復,延長住院時長,增加治療成本,甚至增加死亡風險[3-4]。加拿大《最佳實踐建議:卒中后抑郁、認知、疲勞》指出,醫務人員應重視PSD的早期識別,但目前仍缺乏PSD的特異性評估工具[5]。PSD風險預測模型是以PSD的多病因為基礎構建的數理統計模型,可量化IS患者發生PSD的概率[6],為醫務人員早期識別PSD高?;颊咛峁┯行У脑u估工具。目前,已有學者開發了IS患者PSD風險預測模型,但文獻質量和結果不一,模型的預測效能和適用性有待評價。本研究對IS患者PSD風險預測模型進行系統性評價,以期為醫務人員選擇合適的PSD高?;颊咦R別模型提供參考。
本研究已在PROSPERO平臺注冊,注冊號為CRD42022360733。
1.1 文獻納入與排除標準
1.1.1 納入標準 (1)研究對象為IS患者,且年齡≥18周歲;(2)研究內容為IS患者PSD風險預測模型,描述了模型構建、驗證和評價全過程;(3)研究類型為橫斷面研究、病例對照研究和隊列研究。
1.1.2 排除標準 (1)使用虛擬數據、未標明數據來源或數據不完整,不能獲取原文;(2)綜述、述評、動物或細胞分子水平研究;(3)學術會議摘要、灰色文獻等非正式發表的文獻;(4)重復發表的文獻;(5)非中英文文獻。
1.2 文獻檢索策略 采用主題詞和自由詞相結合的方式,檢索CINAHL、Embase、Medline、The Cochrane Library、Web of Science、PubMed、中國知網、維普、中國生物醫學文獻數據庫(Chinese Biomedical Literature Database,CBM)和萬方數據庫中有關IS患者PSD風險預測模型的文獻,檢索時限為自建庫至2022年7月13日。中文檢索詞:“卒中/中風/腦血管意外/腦血管障礙/腦梗死”“抑郁/卒中后抑郁”“預測模型/預測因素/風險預測/早期預警/風險因素”;英文檢索詞:“Stroke/Cerebrovascular Accident/Cerebrovascular Apoplexy/Brain Vascular Accident/Acute Cerebrovascular Accident/Cerebrovascular Stroke/Cerebral Infarction” “Depression/Post-stroke Depression/Post Stroke Depression/Poststroke Depression/Depression after Stroke/Depressive Symptoms/Depressive Symptom/Symptom, Depressive/Symptoms,Depressive/Emotional Depression/Depression, Emotional”“Prediction Model/Prognostic Model/Predictive Factors/Risk Prediction/Early-warning/Risk Stratification Model”。
1.3 文獻篩選和數據提取 采用EndNote X9軟件剔除重復文獻。由2名研究者通過閱讀文獻標題、摘要、全文,按照納入和排除標準獨立篩選文獻,意見不一致時,與第3名研究者協商裁決。2名研究者使用預測模型研究系統評價的關鍵評估和數據提取(Critical Appraisal and Data Extraction for Systematic Reviews of Prediction Modelling Studies,CHARMS)清單[7]獨立提取數據并交叉核對。提取數據包括第一作者、發表年份、國家、研究對象、研究類型、研究設計、隨訪時間、預測結局、樣本量、缺失數據、預測因子、模型呈現形式、驗證方法、建模方法和模型性能等。
1.4 納入文獻的偏倚風險和適用性評價 由2名研究者獨立使用預測模型偏倚風險評估工具(Prediction Model Risk of Bias Assessment Tool,PROBAST)[8-9]評價納入文獻的偏倚風險和適用性,并交叉核對結果,意見不一致時,與第3名研究者協商裁決。
1.5 統計學處理 對CHARMS和PROBAST語句中的域和納入文獻結果進行系統評價。
2.1 文獻篩選流程與結果 初檢共獲得相關文獻1 597篇,通過閱讀文獻標題、摘要和全文進行初篩和復篩后,最終納入文獻9篇[10-18],其中中文文獻[10,12-15,17]6篇,英文文獻[11,16,18]3篇。文獻篩選流程與結果見圖1。
圖1 文獻篩選流程與結果
2.2 納入文獻的基本特征與預測結果 共納入橫斷面研究1個,回顧性研究4個,前瞻性研究4個;文獻發表年份為2020年至2022年;納入文獻的結果事件數與協變量個數比(events per independent variable,EPV)均小于10。9篇文獻中,6篇[10-12,14-15,17]未報告缺失數據,2篇[16,18]報告了缺失數據并采取多重插補法進行處理,1篇[13]報告研究過程無數據缺失。納入文獻的基本特征與預測結果見表1。
表1 納入研究的基本特征與預測結果
2.3 模型構建情況 納入文獻中,8篇[10,12-18]采用logistic回歸,1篇[11]采用了LASSO回歸;3篇[10,15,18]未報告校準度,8篇[10-14,16-18]使用受試者工作特征曲線的曲線下面積(Area Under the Curve,AUC)評價模型區分度,AUC均大于0.7,表示預測模型的區分度良好。3項研究[11-12,17]進行了外部驗證并表現出較好的區分度(AUC 0.793~0.885),僅1項研究[13]進行隨機拆分驗證。納入文獻的模型包含3~7個預測因子,其中次數出現最多的是美國國立衛生研究院卒中量表(National Institutes of Health Stroke Scale,NIHSS)評分、Barthel指數(Barthel index,BI)、年齡、高血壓,均為各級醫療機構易獲取、可測量的指標。3篇[13-15]以公式、6篇[10-13,16-17]以列線圖作為呈現模型,僅1篇[18]進一步將模型轉化為量表。納入文獻均對模型的應用進行了評價、討論。以上內容見表2。
表2 模型構建情況
2.4 納入文獻的偏倚風險評價
2.4.1 與研究對象有關的偏倚 在研究對象領域,納入的9項研究偏倚風險均低,見表3。
表3 納入研究的研究對象、預測因子、結果和分析領域評價
2.4.2 與預測因子有關的偏倚 在預測因子領域,4項研究[13,15-16,18]偏倚風險低,5項研究[10-12,14,17]的偏倚風險不清楚。對預測因子評估者的施盲情況和與預測因子有關的偏倚風險的高低相關[8],對評估者施盲的研究的偏倚風險較低[9]。由因及果的前瞻性隊列研究[13,15-16,18]默認對預測因子的評估者施盲,而橫斷面研究[10]和回顧性隊列研究[11-12,14,17]對預測因子評估者的施盲情況不得而知,故偏倚風險不清楚,見表3。
2.4.3 與結果有關的偏倚 在結果領域,納入的9項研究均為低風險偏倚,見表3。
2.4.4 與分析有關的偏倚 在分析領域,9篇文獻均為高風險偏倚,見表3。在開發模型時[19],EPV<10會造成模型過擬合,EPV>20則可提高統計效能以減少混雜因素的干擾,而9篇文獻的EPV均<10,說明其有效樣本不足。將連續型變量轉換為分類變量會丟失部分數據信息,進而影響模型準確性;3篇文獻[12,15-16]將連續型變量轉化為分類變量,導致其偏倚風險增高。數據是否有缺失及其缺失程度直接影響數據質量的高低[20],從而影響模型預測效能。9篇文獻中,6篇[10-12,14-15,17]未報告相關信息,1篇[18]采用多重插補法但未報告缺失數量,1篇[16]報告缺失數據占比為2.78%并采用多重插補法進行填補,僅1篇[13]無數據缺失。變量篩選需以臨床專業知識為最基本的考量,綜合考慮樣本量和自變量大小以確定統計方法、檢驗水準,如脫離臨床則會出現較大偏差[20]。如變量較少可直接全部納入回歸模型進行分析。5項研究[10,12,14-15,17]僅采用單因素分析法篩選變量,未考慮數據的復雜性和臨床特點,因此其偏倚風險較高。在性能評估方面,6項研究[11-14,16-17]同時報告了區分度和校準度。3項研究[11-12,17]進行外部驗證,1項研究[15]未進行驗證,其余均進行內部驗證。納入文獻的偏倚風險見表4。
表4 納入文獻的偏倚風險評價
2.5 適用性評價 在適用性評價方面,9個模型在研究對象、結果領域的適用性均較高,有4個模型[10,12,14,17]在預測因子領域的適用性不清楚;4個模型[10,12,14,17]的總體適用性不清楚。納入文獻的適用性評價結果見表5。
表5 納入文獻的適用性評價
3.1 IS患者PSD風險預測模型仍處于發展階段 本研究最終納入4項模型開發研究、5項模型開發及驗證研究,共計9項研究,共包含9個模型。9個模型的AUC為0.780~0.928,其中6個模型的AUC>0.8,預測性能較好。但9項研究偏倚風險均高,偏倚風險主要集中在分析領域,其原因大致包括:未報告盲法、因變量事件數不足、模型過擬合、未報告或未處理缺失數據和僅依據單因素分析篩選預測因子等。此外,9項研究關于PSD的定義和診斷標準存在異質性,而不同的診斷評估標準會影響模型的外部驗證、臨床實踐轉化和推廣性。建議研究者未來選用目前廣泛使用且《最佳實踐建議》[21]推薦的漢密爾頓抑郁評分量表。
3.2 IS患者PSD預測模型的整體偏倚風險較高 本研究納入的9項研究的總體偏倚風險均較高,5項研究[11,13,15-16,18]的總體適用性較高,其余4項研究[10,12,14,17]的總體適用性均不清楚。未來,需開發偏倚風險低,適用性高的預測模型。對未來護理實踐和臨床研究的啟示如下。(1)NIHSS評分、BI、年齡、高血壓是納入的9個模型中包含的主要預測因子,應注意對上述變量的評估。(2)優化研究設計:建議在評估預測因子、結局事件時對評估人員施盲,診斷性的預測模型適合采用橫斷面的研究設計,預后模型可采用前瞻性隊列的研究設計[20],以減少因研究設計而產生的偏倚。未來可參照PROBAST[8]進行研究設計以減少偏倚。(3)樣本量應充足:依據PROBAST[8],建議模型開發研究應擴大樣本量使EPV>20以獲取足夠的統計學效能甄別混雜因素對結局的影響[20],而模型驗證研究則需使結局事件數>100以降低偏倚風險[22]。(4)科學處理缺失數據:依據缺失原因和數據形式選擇適當的處理方法。6項研究未報告缺失數據相關信息[10-12,14-15,17],可看作研究者忽略了缺失數據的處理,由此產生較大偏倚。常見的處理方法有刪除法、加權法、插補法[23]。(5)切忌只依賴單因素分析篩選預測因子,預測因子的篩選需綜合考慮其臨床重要性、客觀性、適用性、易獲取性和經濟成本[8],而非單純依靠統計方法。(6)選用更優的建模方法。Qiao等[11]采用LASSO回歸建模。LASSO回歸是一種機器學習算法,通過構造一個懲罰函數得到一個較為精煉的模型,可以處理復雜的臨床數據,有效地解決過擬合和多重共線性問題[24]。從預測性能來看,Qiao等[11]LASSO回歸模型在外部驗證集的AUC為0.885,與其他logistic回歸模型[12,17]相比,其外部驗證AUC更高,預測性能更優。這提示,隨著醫療數據的不斷整合與結構化,以及數據挖掘技術的進步,研究者可嘗試使用機器學習算法處理復雜數據并構建模型。(7)模型呈現應以臨床使用便捷為原則。有2項研究[14-15]僅以公式作為呈現形式,未來可借助R語言rms包繪制列線圖,或開發網絡計算器[25]、評分系統,以方便臨床使用。此外,未來研究者應參照個體預后或診斷的多變量預測模型透明報告(Transparent Reporting of a Multivariable Prediction Model for Individual Prognosis or Diagnosis,TRIPOD)[26],以規范其研究報告。
本研究共納入9項研究,包括9個IS患者PSD風險預測模型,偏倚風險均較高。研究結果提示,IS患者PSD風險預測模型的研究仍處于發展階段,未來應參照PROBAST和TRIPOD優化研究設計和研究報告,建議開展多中心、大樣本量研究,結合機器學習等人工智能算法,開發準確性和簡便性兼備的模型,同時對模型進行外部驗證或實證研究以優化模型。