?

證據合成領域下的綜述類型

2024-03-13 05:35王浙吳才志賴鴻皓阮建華羅雅婷尤佳騰胡凱燕丁奉興劉晨易少威楊莉娟李朝霞謝廣妹馬彬
醫學新知 2024年2期
關鍵詞:傘狀綜述證據

王浙,吳才志,賴鴻皓,阮建華,羅雅婷,尤佳騰,胡凱燕,丁奉興,劉晨,易少威,楊莉娟,李朝霞,謝廣妹,馬彬

1.蘭州大學基礎醫學院循證醫學中心(蘭州730000)

2.蘭州大學第一臨床醫學院(蘭州730000)

3.蘭州大學公共衛生學院社會醫學與衛生事業管理研究所(蘭州730000)

4.蘭州大學第二臨床醫學院(蘭州730000)

5.蘭州大學護理學院(蘭州730000)

6.甘肅省第二人民醫院科研與研究生科(蘭州730000)

7.西北民族大學臨床醫學院(蘭州730030)

8.甘肅省婦幼保健院第二生殖醫學中心(蘭州730050)

9.甘肅省中心醫院第二生殖醫學中心(蘭州730050)

原始研究的開展應建立在對現有知識的綜合和評價基礎之上,這是所有學術研究的基石[1]。在原始研究正式開始之前,進行綜述研究應該成為所有學者的優先任務,這也是綜述研究出現時間幾乎與學術起源一樣長遠的原因[1]。然而1990 年以前的綜述文章,通常是不系統的,其定義更多地依賴于不同學科和領域的傳統和習慣,并無統一或官方的標準,甚至缺乏正確的統計方法,導致這類文章往往存在著偏倚或錯誤的結論[2]。為了改變這一現狀,證據合成(evidence synthesis)這一概念在1990 年被首次提出[3]。證據合成作為一種有效的方法,能夠幫助研究者系統地搜集、評估和綜合文獻證據[4]。隨著人們逐漸認識到證據合成這一研究方法的重要性,2001 年首屆循證圖書館和信息實踐會議上,與會專家對曾經概念模糊的綜述進行了重新定義,即“重新審視、評估或分析”(To view, inspect, or examine a second time or again),該定義最大的優勢是概括了目前存在的所有綜述類型,包容范圍較廣,但也正是由于該定義的廣泛性,造成了當前不同類型綜述之間概念和使用方法的混淆,導致研究者難以選擇最合適的方法來回答特定的研究問題[5]。如研究者試圖探究類風濕關節炎患者發生心血管疾病的危險因素方面的證據時,若選擇范圍綜述這一方法,其呈現內容則是對原始文獻的主題、目標、結論等的概括,不涉及對文獻質量的評價或結果的統計分析,這使得研究者難以從文獻的可靠性和量性層面獲得與心血管疾病相關的正確危險因素;再者,當研究者預探究類風濕關節炎患者發生心血管疾病的研究進展時,若選擇系統評價這一方法,其呈現內容則是對有限文獻(限定了PICOS 的原始研究)的綜合分析,然而,這可能會忽略一些與問題無關但與研究主題相關的內容,如概念界定、研究現狀等信息,繼而導致不能全面地展示相關主題的研究現狀和發展趨勢。正如上述兩個例子,綜述類型的非精準使用不僅會導致證據合成的結果不夠準確、全面和可靠,甚至有可能影響決策的質量和效果[6]。因此,國內外學者對各類綜述的應用方法進行了不斷地探索,旨在為選擇與撰寫不同綜述時提供科學參考。其中Grant 等分別對14 種綜述類型的定義、使用方法以及各類綜述的優缺點進行了匯總[3],但該研究為2009 年發布,其后新增許多新的綜述類型如動態系統評價等并未納入其中,且分類較為匱乏;而Sutton 則將綜述分為7 大類,其下共包括48 種綜述類型,綜述分類更加全面[1],但需要強調的是,該研究并未對不同綜述類型的制作方法進行指導。

因此,為幫助研究者更好地了解不同類型綜述研究方法的適用范圍,并指導后續的科學撰寫與規范報告。本文將在前人研究的基礎上,對綜述文獻類型進行更新并重新歸類,系統梳理證據合成領域下的各種綜述類型起源、分類、定義和適用范圍,并詳細列出不同綜述類型的實施步驟以及報告規范,以期為研究者在開展某種具體綜述類型時提供清晰和明確的指導。

1 綜述研究的分類

基于Sutton等的綜述分類方法[1],同時參考健康系統證據(health system evidence)、社會系統證據(social system evidence)等數據庫收錄的最新證據合成研究類型,本文將綜述研究分為9 種不同的類型,即傳統綜述(traditional review)、混合性研究綜述(mixed studies review)、系統評價(systematic review)、快速證據綜合(rapid evidence synthesis)、證據圖譜(evidence map)、 傘狀評價(umbrella review)、范圍綜述(scoping review)、元研究(Meta-research)及動態系統評價(living systematic review)(表1)。其中,就傳統綜述而言,主要包括敘述性綜述、前沿性綜述、批判性綜述以及整合性綜述;就快速證據綜合而言,主要包括快速證據評估與快速現實主義綜述;就系統評價而言,根據研究目的和數據類型又可分為不同的具體類型(圖1)。

表1 各類綜述的定義、適用范圍及優缺點Table 1. Definition, scope of application and advantages and disadvantages of varias types of review

圖1 綜述的分類Figure 1. Classification of review

2 不同綜述類型研究的起源與發展

如圖2 所示,各類綜述的出現經歷了漫長的演變,并隨著時代的需求而不斷產生新的變化與分類,本研究將按照時間順序對不同類型綜述研究的起源與發展進行全面介紹。

圖2 各類綜述研究的起源時間軸Figure 2. Timeline of the origins of various review studies

2.1 傳統綜述

在所有研究正式開始之前,研究者將不可避免地對研究領域現有知識的理論以及進展進行了解,因此,傳統綜述出現時間幾乎與學術起源一樣長遠[1]。此后,隨著傳統綜述的發展,方法學專家為了滿足研究者對不同研究內容與研究目的的需求,逐漸延伸出了各種綜述類型,以彌補傳統綜述的不足。

2.2 混合性研究綜述

混合性研究綜述是另一種分類范式,其納入了定量、定性和(或)混合方法設計的原始研究,以更全面地探索研究問題[7]。1959 年,Webb、Campbell 等發展了三角互證的概念,形成了多元操作主義,這標志著混合方法研究的正式出現[8]。然而,在此基礎上形成和發展的混合性研究綜述直到2014 年才被概念化[7]。此后,這種新興的文獻綜述形式為復雜的公共衛生干預措施和項目提供了豐富而實用的證據。

2.3 系統評價

隨著科學技術的進步,各個領域的研究成果日益增多,信息量呈指數級增長,單靠傳統文獻綜述已經無法滿足對海量信息進行正確的處理和分析[9]。因此,1976 年,Chalmers 等人提出了“系統評價”的概念[10]。但此時合成的文獻主要以定量數據為主,為了在實踐過程中為證據決策者提供更全面和實用性更強的信息,定性的系統評價應運而生。1996 年Dixon 等人應用扎根理論方法制作并發表了第一篇關于患病兒童父母體驗研究的系統評價[11]。

2.4 快速證據綜合與動態系統評價

傳統系統評價雖然是循證醫學的金標準,但其卻具有耗時長、成本高等缺點[12]。為了快速適應當前信息爆炸和證據更新迅速的時代,快速證據綜合與動態系統評價應運而生。1997 年Best 等人首次采用快速證據綜合的方法開展了一項衛生技術評估項目[13]。此后,快速證據綜合逐漸脫離衛生技術評估領域,常被用于各高層決策機構的決策過程中。而動態系統評價的概念則由Elliott在2014 年提出[14],隨后在2015 年,第一篇動態系統評價在JournalofNeurotrauma在線發表,目前已進行了5 次更新,累積納入21 項新研究,促進了歐洲外傷性腦損傷流行病學數據的更新與整合[15]。

2.5 傘狀評價

隨著醫療衛生保健領域對系統評價需求的不斷增加,其發表的文獻數量也呈現出逐年增長的趨勢,但其發表質量卻面臨著良莠不齊的困境,導致了同一研究主題下研究結論不盡相同甚至相反的混亂情境,給臨床醫生的醫療決策帶來了極大困難[16]。因此,2000 年第8 屆Cochrane 年會正式提出了有關傘狀評價的概念,并首先對普通感冒的預防措施、精神分裂癥的藥物治療和與戒煙有關的系統評價進行了再評價[17],為該領域提供了更全面、更高質量、更具臨床實用性的研究證據,極大推動了知識轉化和證據的傳播與應用。

2.6 證據圖譜與范圍綜述

系統評價側重于回答某一具體的科學問題,但當研究人員試圖探索研究領域存在的差距以及更廣泛的主題時,則不能很好的達到目的,由此,2000 年美國耶魯大學預防研究中心發表了一種可靠且可重復的9 步驟審查模型,即證據圖譜[18]。2005 年,Arksey 則首次提出范圍綜述的概念并給出了其基本研究框架[19]。此后,證據圖譜與范圍綜述類文獻發表數量逐漸增多,彌補了系統評價研究范圍過小的不足,促進了不同領域證據缺口的發現以及概念的澄清。

2.7 元研究

元研究的目的是了解和改進不同領域執行、溝通、驗證、評估和獎勵研究的方式[20],因此當研究者開始反思與改善研究過程時,元研究的歷史就開始了。循證研究者亦在綜述領域不斷開展著元研究,如各種類型綜述方法學與報告規范的制定,不同研究領域方法學或報告質量匯總的研究等。但元研究這一概念直至2015 年,才被Ioannidis 在其文獻中首次定義,并在該研究中定義了元研究學科中應包含的內容[21]。

3 不同綜述類型研究的定義、適用范圍及優缺點

表1 總結了9 種不同綜述研究類型的定義、適用范圍以及優缺點。各類綜述的定義都是基于已有文獻的綜合分析方法,但不同綜述的應用范圍和優缺點既有一致又存在一定差異,比如,系統評價與傳統綜述均可以對某一領域或專題的文獻進行綜合分析,但傳統綜述往往受限于專家個人的知識和信念,缺乏客觀的方法,而系統評價則強調全面地收集、篩選、評價和合成相關文獻。有必要根據不同綜述類型的定義、適用范圍及優缺點進行全面的介紹與對比,以幫助研究者根據自身的研究目的選擇恰當的研究類型。

傳統文獻綜述、范圍綜述以及證據圖譜均可以提供當前領域的發展趨勢并為未來研究提供方向,更適合描述范圍宏大的主題,但這幾種研究類型在發展趨勢適用范圍這一層面,仍存在細微的差別[22-24]。傳統文獻綜述不限制發展趨勢的描述時段,而范圍綜述與證據圖譜則更強調現有證據差距,為未來研究提供方向。在優缺點方面,上述研究類型均可以幫助讀者或政策制定者了解一個主題或領域的基本情況,但傳統的文獻綜述則可能因為缺乏系統性和規范性的程序而導致結果存在偏倚或誤差。

系統評價、傘狀評價以及混合性研究綜述,則適用于探究具體的研究問題,提高研究結果的可信度[8,25-26]。系統評價與傘狀評價通過嚴格的方法學流程來提高結果的可靠性,但系統評價綜合的是原始研究的結果,而傘狀評價則更偏向在系統評價研究結果的基礎上,得出更高緯度證據?;旌闲匝芯烤C述則是通過定量與定性結合的方法提高研究結果的可靠性。在優缺點層面,上述研究類型均在不同階段或環節進行了結果的整合,而系統評價和傘狀評價均對納入的研究進行了嚴格的質量評估,混合性研究綜述雖沒有明確的評估流程,但其質性與量性結合的特點,彌補了單一方法的不足,提高了研究的廣度和深度[8,25-26]。但上述研究類型均具有耗時長、技術要求高的缺點,且對于系統評價和傘狀評價來說,其研究質量極大地受限于所納入文獻的質量、可獲取性、一致性和完整性,而混合性研究綜述則更可能存在數據整合的困難[8,25-26]。

對于快速證據綜合以及動態系統評價而言,均可以在證據不足或不確定的領域中,為決策者提供初步的證據支持。但快速證據綜合更適合緊急或突發情況下的應用,因此,可以減去更多系統化流程,而對于動態系統評價則更強調持續更新的證據支持,以提高證據的時效性和可用性[14,27]。因此在優缺點方面,快速證據綜合雖然具有研究周期較短的優勢,但其方法的標準化和透明化亦可能受到影響,而對研究結果產生偏倚。動態系統評價雖然具有減少重復發表、提高證據時效性等優勢,但現有的期刊很少有適合動態系統評價發表的平臺,且這種交予單一團隊更新系統評價的趨勢一旦形成,則會賦予此類團隊或所發表期刊過多的權威性,而限制了更多有關該領域二次研究的討論。

不同于其它綜述類型,元研究的內容包括研究領域的方法、報告、可重復性、評估和獎勵機制五個方面[20]。因此元研究具有提高研究透明度、可重復性和可信度等優勢,但由于其批判性的特征,可能會受到較多的外部干擾,如發表壓力、利益沖突等情況。

4 不同綜述類型研究的制作流程與報告規范

根據研究目的選擇恰當的綜述研究類型后,研究者需根據不同的綜述研究類型進行科學的制作及規范的報告。掌握科學正確的制作和報告方法,對于研究者而言可以幫助其有效地分析、整合和呈現綜述的結果,避免偏倚或誤導,提高綜述的可靠性和透明度。表2 概括性地將不同綜述類型研究的制作流程分為文獻檢索、文獻評價、證據合成和證據分析四大部分,并提供相關的報告規范,以幫助讀者更好地呈現綜述內容。

表2 各類綜述的制作流程及報告規范Table 2. The production process and reporting guidelines of various reviews

4.1 文獻檢索

在檢索層面,除傳統綜述以及混合性研究綜述外,其余綜述類型均需制定系統的檢索策略[8,22]。上述研究類型在檢索最終納入的文獻層面,也存在差異,如傳統綜述不限制最終納入的文獻類型[22],各類系統評價則要求納入的研究為原始研究[28],傘狀評價要求納入的研究類型為系統評價[29],范圍綜述要求同時納入原始研究和二次研究[24],混合性研究綜述和證據圖譜則需要根據研究目的,選擇納入的研究類型[8,23]。

4.2 文獻評價

傳統綜述、范圍綜述和證據圖譜均不強制對納入的文獻進行質量評價[22-24],而各類系統評價、傘狀評價以及混合性研究綜述,則需要根據納入的文獻類型,對文獻的方法質量或偏倚風險進行評估[8,26,28]。

4.3 證據合成

傳統綜述、定性的系統評價以及快速證據綜合多采用敘述的形式進行證據的合成[22,27-28],而定量的系統評價、范圍綜述、證據圖譜、動態系統評價、傘狀評價多采用表格和圖片的方式進行證據的合成,而混合性研究綜述則不限制證據合成的方法。

4.4 證據分析

系統評價、傘狀評價以及動態系統評價,均可從當前已知內容、對當前實踐的建議以及對未來研究的建議層面進行分析,而快速證據綜合由于具有在緊急突發情況中輔助決策的作用,因此僅需分析對當前實踐的建議即可[27]。傳統綜述由于其廣泛的適用范圍,因此在分析時,應根據不同的研究目的進行描述。而證據圖譜與范圍綜述均可從文獻的數量分布以及與其他研究差距層面進行分析[8,23]。

需要強調的是,元研究的文獻檢索、文獻評價、證據合成以及分析過程均需根據具體的研究內容進行。如,同為元研究類型的兩篇文獻,一項研究為手術干預系統評價注冊和報告質量的元研究[30],另一項為SYRCLE 對動物實驗方法質量的影響[31],其文獻檢索納入的研究類型分別為系統評價和原始研究;評估標準依據分別為PRISMA 和SYRCLE;證據合成結果分別為圖表和文字敘述;證據分析則均從當前已知內容、對當前實踐的建議和對未來研究的建議層面陳述。

4.5 報告規范

當前已有一些綜述類型的報告規范發布,如定量、定性的系統評價、范圍綜述、傘狀評價和混合性研究綜述等的報告規范,其中有些報告規范以傳統的PRISMA 報告規范為模板進行了擴展,如范圍綜述的報告規范——PRISMA-ScR[32]、診斷性系統評價的報告規范——PRISMA for DTA[33]等。由于混合性研究的綜述包含了多種研究類型,因此其報告規范可根據納入的研究類型進行選擇,如JARS-Mixed 是專門針對心理學領域混合方法研究的報告規范[34],而ASSESS 是專門針對混合性研究綜述結果呈現而設定的報告規范[35]。但目前仍有一些綜述類型,如快速證據綜合、證據圖譜以及動態系統評價等尚未形成國際公認的報告規范,還有待于進一步開發[36-38]。

5 討論

本研究根據不同綜述類型,共分為9 大類,并對9 種綜述類型的定義、適用范圍以及優缺點進行了介紹,以輔助讀者根據不同研究目的與研究問題選擇合適的綜述類型,詳細介紹了不同綜述類型的制作流程,提供相關的報告指南或有關報告指南的最新信息以供讀者參考。

但需要強調的是:①對于部分研究類型的撰寫流程,不同學者的看法尚未達成一致,如對于傘狀評價,目前主流觀點認為將檢索類型限制在系統評價即可[39],但劉海霞等最新研究認為,即使是傘狀評價,也應檢索最新的單個研究,以避免發表偏倚和其他偏倚[40]。②Meta 流行病學的同義詞為方法學系統評價[41],雖然其按照研究目的的分類屬于系統評價,但其主要研究目的為識別和量化潛在偏倚特征的影響,與傳統系統評價以及傘狀評價的主要研究目的存在差異。③本研究將“各類綜述研究的起源時間軸”繪制日期截止到了2015 年,這是因為在2015 年后尚未出現概念明確、制作流程清晰以及被廣泛傳播使用的新的證據合成類型。④雖然在2015 年后并未出現新的證據合成類型,但循證研究領域下卻出現了一些新的概念,其中具有較大影響力的就是“證據生態系統”,該概念在2017 年的全球循證高峰論壇中被首次提出,其出現推動了證據在原始研究的研究者、證據合成的研究者、證據傳播和證據應用的專業實踐者之間的無縫轉化[42]。

此外,就報告規范的制定而言,由于動態系統評價、證據圖譜、快速證據綜合、傘狀評價的發展時間過短,導致該領域并無相關的報告規范指南,但隨著循證方法學的快速發展,上述綜述類型的報告規范均已有所進展。如針對快速證據綜合的報告規范已經在2015 年啟動,并在EQUATOR 網站發布了計劃書[36];證據圖譜和動態系統評價的報告規范已經分別于2021 年和2022年在PRISMA 平臺進行了注冊[37-38];而對于傘狀系統評價,Gates 團隊于2022 年在BMJ 雜志發布了醫療保健領域干預性傘狀評價的報告規范[43]。同年,為了彌補該報告規范在橫斷面、病例對照和隊列研究層面信息缺失,Marco 團隊發布了流行病學領域傘狀評價報告規范實施方案預印本[44]。

綜上,證據合成下的“綜述”定義具有廣泛性的優勢,但也造成了當前不同類型綜述之間概念和使用方法的混淆。為解決上述問題,本文將綜述分為了9 種類型,并提供了9 種綜述類型的定義、分類、適用范圍、優缺點、制作流程、相關報告指南或有關報告指南的最新信息,以期為未來研究者在選擇綜述類型以及進行綜述撰寫時提供參考。然而當前部分研究類型的撰寫流程尚未達成一致,報告規范亦未制定完成,亟需更多“元研究”發表,為使用者盡快提供更多一致的科學規范。

猜你喜歡
傘狀綜述證據
執傘立在雨中
SEBS改性瀝青綜述
NBA新賽季綜述
新型自行傘狀灌溉器設計理念及設計方法
對于家庭暴力應當如何搜集證據
手上的證據
JOURNAL OF FUNCTIONAL POLYMERS
“大禹治水”有了新證據
風中的韭菜花
手上的證據
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合