從研究設計和證據質量看循證金字塔

為什麼循證金字塔這麼安排？

循證金字塔從下往上看，排序可看成

研究設計的上限

的考察。針對同一研究問題，一層一層往上，因果關係越來越強。

體外實驗，動物實驗

等間接提示干預措施在人體可能出現的作用。

專家意見

則為這些資訊以及臨床、研究經驗的綜合判斷。

病例報告

則結合專家意見以及具體案例進行分析，更客觀反映干預措施的可能效應。

然而，病例報告中的效應可能只在個體出現，於是便有

病例系列

考察使用該干預措施的群體是否均有該效應。

然而，病例系列中的效應可能不是由干預措施引起的，所以就有

病例對照研究

依據“出現效應的人群”匹配出“無該效應的人群”，考察兩組使用干預措施的比例，判斷干預措施與效應是否存在相關性。

然而，病例對照研究中的效應與干預之間的因果關係沒有時間相關性，於是便有

佇列研究

對干預的暴露組與非暴露組進行隨訪，考察兩組結局的發生比例，判斷效應是否由干預措施引起。

然而，佇列研究對暴露組與非暴露組的匹配可能存在未知的混淆因素影響結局的考察，於是便有

隨機對照研究

，隨機將受試者分組為實驗組與對照組，不管混雜因素如何，這兩組除了干預措施外其他因素都一致，假如兩組結局存在差別自然就是由干預措施所引起的。

然而，大樣本量RCT成本高週期長，

系統評價

Meta

分析

則可以合併各小樣本的RCT得出精確度更高適用性更強的結果。當然，系統評價Meta分析還可以收集其他觀察性研究，質量評價並整合資訊，自然也是開掛般的排在首位。

這些研究從下到上，因果關係更強，利用的資訊更多，所以循證金字塔從研究設計的上限來講，這麼排應該是沒有問題的。

大體上，我總結成下圖：

然而，我此前在被培訓GRADE時，培訓的老師（WHO訪問學者）卻給另外一張圖

http://library.downstate.edu/ebm/2100.htm

（PPT

裡的出處

，不過打不開…

）

GRADE是考察證據質量的，所以我一開始對循證金字塔的思考是從證據質量的角度考慮的。

證據質量反映的是我們對證據結果的信心。

如同上面的分析，截至隨機對照研究，一層一層研究的因果關係逐漸增強，所以循證金字塔的按照證據質量排序也應該是沒有問題的。

那為什麼Meta分析應該貫穿整個循證金字塔呢？

因為Meta分析的質量取決於它所納入的研究。

納入研究的為觀察性研究，那麼該Meta分析只能體現出觀察性研究的質量；納入研究的為RCT，那麼該Meta分析則體現出RCT的質量。所以Meta分析的證據質量應該是貫穿整個循證金字塔的。

我們談論證據質量時，不應該只限定在同一研究問題裡。在同一研究問題裡，系統評價Meta分析可以納入所有符合研究問題的RCT，觀察性研究等等，簡直無解。但是，我們現實裡面對著不同的研究問題，在資源有限的情況下，我們是需要進行選擇的。假如有一篇大樣本量的RCT說明A藥對某疾病有效，另外也有一篇納入多篇佇列研究也大樣本量的Meta說明B藥對該疾病有效，你是臨床醫生或決策者，你會首選A藥還是B藥？往往前面的RCT樣本量即便小於後面的Meta分析十倍甚至百倍，決策者還是會選擇前者。這反映了我們對研究質量的考察，反映了我們對研究結果的信心。

（PS：藥物直接療效研究一般不會出現這種情況，B藥不會有那麼多佇列研究卻還沒正經的RCT。例如降壓藥降壓作用的佇列研究出現之前必然肯定有判斷其降壓效果的RCT存在。但是藥物的遠期療效則有可能會出現這種情況，例如A藥直接做了大型RCT判定他們能降低冠心病患者的心梗發生率；B藥雖然用了很久，但沒做這樣的RCT，知道需要做這個結局後，馬上來兩篇佇列，可以合併出相應樣本量的Meta。我這麼猜啊…不一定合適。這裡只是為了舉例證據質量反映了我們對研究結果的信心）

此外，Meta的證據質量應該是低於它所納入的研究型別的。

Pairwise Meta-Analysis

的前提是相似性原則

，即只有納入的研究滿足一定程度的相似性，Meta分析的結果才是有意義的。

Network Meta-Analysis

則在此基礎上還需要滿足一致性原則

，即直接比較的結果與間接比較的結果必須滿足一定程度的一致。更具體點就是，網路Meta分析的基礎是“合併A vs。 B的研究所得出的A vs。 B的直接比較結果”，和“合併A vs。 C的研究和B vs。 C的研究得出的A vs。 B的間接比較結果”，這兩個結果應該是一致的。

然而，這些假設其實並沒有那麼容易滿足。

Meta分析納入研究主要考察PICOS（Participant， Intervention， Comparison， Outcome， Study），然而我們其實是無法確定Meta中納入的所有研究在這些方面是一模一樣的。需要滿足幾乎一致的內容包括納入的受試者基線（性別，年齡，疾病相關基線），干預措施（劑量，頻率，給藥途徑，給藥週期），對照組（與Intervention相似，另外要注意Background treatment），結局（結局的定義，結局的測量方法，結局的測量時間），研究型別（不同的偏倚風險的RCT也屬於不同的研究型別）。Meta可以接受一定的異質性，因為這樣可以增加研究的適用性（什麼結局什麼人群這個藥都有效，適用性最強了…）。

但是在

PICOS

的各種妥協接受異質性的條件下，是否它的研究質量應該比它所納入的研究低一些許呢?

假如有一篇5000樣本量的RCT說明A藥對某疾病有效，另外也有一篇納入多篇RCT總樣本量為5000的Meta說明B藥對該疾病有效，你是臨床醫生或決策者，你會首選A藥還是B藥？

（PS：Meta分析可計算統計學異質性，但統計學異質性與臨床、方法學異質性是兩回事。看過不少RCT與觀察性研究合併的Meta。他們也是沒有顯著異質性，但這種合併卻讓我對這篇Meta分析結果的信心降低，還不及納入的那篇RCT給我的信心強。）

下面是我對各研究質量排序的總結

當然，循證證據金字塔還可以這麼看：從下往上，研究越來越難做，相應的研究數量也越來越少，也剛好與各型別研究在三角形中所佔面積相匹配。

另外，不同型別的研究之間也是有關聯的。

從臨床中發現問題，提出假設，並透過病例報告，病例系列，病例對照，佇列研究等一步一步更加強化因果地證實原假設。最後透過大型的隨機對照研究對假設定性，甚至對效應量進行定量。儘管我們現在都滿口Meta，RCT，但是這些研究並不憑空而來，都是有一系列次一級的證據，紮根在最底下的證據作支援的。

這也是我心中循證醫學的思想：

透過從最基礎的證據出發，不斷地推論，驗證，強化因果，最終積累出可以定性的證據，為臨床所依據。這個過程並不是統計學的遊戲，而是有理有據，有的放矢，承上啟下的結果。

小蜜蜂問答

小蜜蜂問答

從研究設計和證據質量看循證金字塔

推薦文章

小蜜蜂問答

小蜜蜂問答

從研究設計和證據質量看循證金字塔

相關文章

中文文獻彙報從哪幾個方面？

調查令需要告知對方當事人嗎？

數學中什麼叫做總體？

監控錄影能不能做為定罪直接證據？

推薦文章