?

《確認GRADE證據評級的目標》文獻解讀

2021-03-12 09:27梁小妞羅劍鋒
中國循證兒科雜志 2021年6期
關鍵詞:精確性界值評級

梁小妞 羅劍鋒

1 主要內容介紹

1.1 原則1 證據不確定評級,必須考慮評級目標,所謂的目標,如:根據某一界值劃分的有效、有重要的效應,或者根據區間劃分的小效應、中等效應、大效應等。GRADE證據評級在特定目標的基礎上進行不確定性評級。

1.2 原則2 證據不確定評級目標取決于框架、界值以及點估計。

1.2.1 框架 包括全局性框架、部分性框架以及最小化框架[1]。對于系統綜述和衛生技術評估者來說,主要涉及部分性框架以及最小化框架。

1.2.2 界值 最小化框架下有2種界值:無效界值和小效應界值(圖1)。與此相對應的目標分別為有效和有重要的效應。部分性框架下由小、中、大3個界值劃分的4個區間:微小效應、小效應、中等效應、大效應(圖2)。

界值的劃分基于特定的效應測量指標。常用的有絕對數指標:均數的差異(MD);率差(RD);相對數指標:如相對危險度(RR)、比值比(OR)、風險比(HR)等。如果是無效界值,絕對數指標和相對數指標是等價的,比如RD=0和RR=1。對于其他界值,同樣的相對數,由于參照組的數值不同,對應的絕對數可能相差很大。所以建議同時報告相對數和絕對數。

圖1 最小化框架下的無效界值和小效應界值

圖2 部分框架下的小效應、中效應、大效應界值以及由此劃分的4個區間

1.2.3 點估計 選擇框架,定好界值或者區間后,點估計和界值的相對位置決定證據評級目標(圖3)。比如以最小化框架下的小效應界值為標準,點估計a在界值左側,可以把目標設為是否存在重要效應,最終結果可以判斷為達到重要效應。點估計b在界值右側,也可以把目標設為是否存在重要效應,最終結果可以判斷為未達到重要效應。

圖3 點估計和選定的界值的相對位置決定證據評級目標

當點估計和界值非常接近的時候,除了直接根據點估計相對于界值的位置(稱為方法1)直接判斷之外,指南提供了另一種方法(稱為方法2)。以圖4A為例,在最小化框架下,點估計為-0.99%,選定的界值是小效應界值-1%。如果按照方法1,雖然-0.99%和-1%非常接近,但是仍然低于-1%,判斷未達到重要效應,可能存在小效應。如果按照方法2,考慮小效應界值的兩個相鄰界值,即中等效應界值和無效應界值,則點估計落在小效應和微小效應兩個效應區間內,評級目標可以定為小效應和微小效應。

方法2特別適合于點估計特別接近無效界值的時候。利用無效界值的相鄰界值:小效應有效界值和小效應危害界值,點估計落在以上兩個界值之間,可以認為存在微小的作用或者微小的危害(圖4B)。

圖4 當點估計非常接近選定的界值,可以利用相鄰的兩個界值判斷

1.3 原則3 選擇某種框架,系統綜述或衛生技術評估人員選擇的界值決定證據評級的目標,圖5顯示,以最小框架下小效應界值為例,設定不同的小效應標準,結果顯然不同。如果參照界值1,顯然點估計顯示有重要的作用。如果參照界值2,則未達到重要作用。同理,在部分性框架下,小、中、大效應界值的不同,相應劃分的區間也發生變化,評級目標以及結果也發生變化。

圖5 選擇不同的界值將決定證據評級的目標

1.4 原則4 當95%CI比較寬,跨過多個界值時(圖6),選擇某個界值沒有什么意義,同理,這時的證據評級也沒有什么意義。雖然證據評級的目標主要參考點估計,但是當可信區間非常寬,跨多個界值或者多個區域時,意味著該研究對于真實效應值的估計存在較大的不確定性。因此,這時候需要下調證據評級甚至放棄目標的設定。

2 舉例說明如何利用4個原則進行證據評級

圖7為在圖1 的基礎上增加了可信區間??尚艆^間體現的是證據評級中的精確性。以圖7中證據不確定評級為例。

圖6 可信區間跨多個界值或者區域

圖7 模擬例子:運用4個原則進行證據評價

2.1 如果目標為是否有效 以最小化框架下無效界值為標準,由于點估計在無效界值的左側,在有效范圍內,可以判斷點估計a對應的研究結果為有效。同時可信區間未跨過無效界值,不需要因為精確性下調證據評級。

2.2 如果目標為是否有重要效應 以最小化框架下小效應界值為標準,由于點估計在小效應界值的左側,可以判斷點估計a對應的研究結果為有重要效應。但是可信區間跨過小效應界值,因此精確性下調證據評級。

2.3 如果目標為是否存在小效應 在部分框架下,以中等效應和小效應兩個界值劃定的小效應區間為標準,由于點估計a在小效應區間內,可以判斷點估計對應的研究結果達到小效應,但是由于可信區間跨過小效應界值,仍然有微小效應的可能性,因此精確性下調證據評級。

2.4 如果結論是存在小效應或者微小效應 則可信區間在范圍內,不必因為精確性下調證據評級。

3 解讀

“證據不確定性評價”,或者說“證據質量評價”[1, 2]是GRADE指南制定的核心內容。有一系列的GRADE指南專門討論從不同的維度[3-7]和不同設計類型[8-11]進行證據質量評價。但是在實際應用過程中發現,證據評級目標也是一個影響證據評級非常重要的因素。如果不厘清一些關系,會讓研究者在證據評級過程中產生困惑。

3.1 證據評級目標本身不是證據不確定評級 證據不確定評級針對特定證據評級目標GRADE證據評級一般有5個降級維度[3-6,12]和3個升級維度,并在特定情況下可以進行升降級[7]。GRADE的證據不確定性評級有兩個層次,首先針對證據本身從5個降級維度進行不確定性評級,這一步和系統綜述相同。然后是評估該證據對于指南的推薦等級。在實施中RCT和診斷準確性研究起始是高,然后根據證據本身的不確定性評級,從高開始降級。觀察性研究起始是低,然后根據證據本身的不確定性評級,考慮升降級。以上證據不確定性評級過程本身不等于評級目標,但是針對特定的評級目標。

3.2 評級目標不同 同一個證據,證據不確定性評級結果可能不同。對于某一個特定的證據,點估計、區間估計、研究設計都已經定了。如前面方法部分闡述的,基于不同的框架,把目標定在不同的界值或者區域,點估計和它們的相對位置不一樣,證據評級的結果就可能不一樣。

3.3 目標的選擇由數據驅動(data-driven) 對于框架和界值,讀者可以根據自己的需要選擇。即使系統綜述作者已經選擇了框架和界值,得出了相應的不確定性評級結果。讀者或者其他研究者仍然可以根據證據和自己的需要選擇另外的框架和界值,得出不同的結論??蚣芎徒缰档倪x擇顯得非常自由,所以在GRADE證據評級時,必須事先將評級目標以及框架和界值闡述清楚。

3.4 點估計和區間估計在評級中的作用 本質上GRADE證據評級是希望對真實效應進行評級,但是真實效應實際上無法獲得,每個研究提供的只是觀察到的效應。其中不可避免的有抽樣誤差和系統誤差。在制定目標時,主要根據點估計和界值的關系,這時某種程度上是以點估計代表真實效應。但原則4顯示,當區間很大時,點估計對于真實效應的估計效果比較差,這時制定目標就不是那么可靠了。

從系統評價和醫學指南制作者的角度,這篇文章闡明了在證據不確定性評級時制定評級目標的重要性以及如何根據點估計、框架和界值制定目標。主要以不確定性這一維度為例,闡述了目標和證據不確定性評級。實際上,偏倚風險、不一致性、間接性和發表偏倚等維度也需要在實際工作中同時考慮。某種程度上,其他維度證據等級低,可以在實操角度理解為可信區間變寬,然后就可以按文章中和精確性對評級的影響類似處理了??紤]所有因素后,如果可信區間特別寬,甚至可以放棄目標的制定。

猜你喜歡
精確性界值評級
數字有形狀嗎?數字信息精確性和品牌標識形狀的匹配效應*
初中數學中絕對值性質的應用
分析師最新給予買入評級的公司
陣列式煙氣流量測量裝置在脫硫CEMS中的應用
部分國家和地區司機血液酒精濃度界值及相關處罰規定
測量工程的質量控制分析
蘇州市重點傳染病移動百分位數法預警界值優選分析*
上海市松江區手足口病控制圖法預警界值優選研究
試論法律術語翻譯的精確性
創投概念股評級一覽表
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合