荟萃分析综合了来自单独但相似研究的定量结果,并提供了对所关注总体效果的数值估算(Petrie等,2003)。
将不同的权重分配给不同的研究,以计算汇总或合并效应。权重与研究中报告的标准误差的倒数相关(因此与样本量间接相关)。在合并效应量的计算中,具有较小标准误差和较大样本量的研究将获得更大的权重。
感兴趣的效果可以是:
- 连续变量的平均值
- 两个变量之间的相关性
- 比值比,适合分析回顾性研究
- 适用于分析前瞻性研究的相对风险(风险比)或风险差异
- 一定比例
- ROC曲线下的面积
使用不同的异质性量度检查研究之间的同意或不同意见。
固定效应和随机效应模型
在固定效应模型下,假设研究具有共同的真实效应,而汇总效应是对共同效应规模的估计。
在随机效应模型下,假设研究中的真实效应在研究之间有所不同,汇总效应是不同研究中报道的效应的加权平均值(Borenstein等,2009)。
随机效应模型将倾向于给出更保守的估计(即具有更大的置信区间),但是当不存在异质性时,两个模型的结果通常会一致。当存在异质性时(见下文),随机效应模型应为首选模型。
异质性
例:
Cohran的Q
Q 是标准化范围内的加权平方和。据报道,P值较低,表示存在异质性。然而,已知该测试检测异质性的能力较低,建议使用0.10作为有意义的临界值(Higgins等,2003)。相反,如果研究数量很多,则Q作为异质性检验的力量太大。
I 2 统计
I 2 是由于真正的异质性而不是偶然性而在研究中观察到的总变化的百分比。计算公式为 I 2 = 100%x(Q-df)/ Q,其中Q是Cochran的异质性统计量,df是自由度。I 2的负值等于零,以使I 2位于0%到100%之间。值为0%表示未观察到异质性,较大的值表示异质性增加(Higgins等,2003)。
出版偏见
MedCalc的所有荟萃分析报告均包含两项检验,以检测可能的出版偏倚:Egger检验(Egger等,1997)和Begg等级检验(Begg和Mazumdar,1994)。
Egger检验是根据标准化效果估算值(估算值除以其标准误差)相对于精度(估算值的标准误差的倒数)的线性回归得出的Y截距= 0的检验。
Begg的检验评估标准化效果大小的等级与其方差的等级之间是否存在显着相关性。
对于这两个测试,当(双面)P值都很低时,这表明存在发布偏差。
注意,通过少量研究,两种方法检测偏倚的能力将很低。
例:
森林图
在称为“森林图”的图形中说明了具有95%CI的不同研究的结果以及具有95%CI的总体效果(在固定和随机效应模型下),例如:
在此示例中,代表效果大小的标记都具有相同的大小。可选地,标记物的大小可以根据分配给不同研究的权重而变化。另外,可以使用菱形来表示合并的效果。菱形的位置代表估算的效果大小,菱形的宽度反映估算的精度,例如:
漏斗图
漏斗图(Egger等,1997)是用于检测荟萃分析偏差的图形工具。
在漏斗图中,将治疗效果绘制在水平轴上,MedCalc在垂直轴上绘制标准误差(Sterne&Egger,2001)。
垂直线表示使用固定效应荟萃分析得出的估算摘要。
对于垂直轴上的每个标准误差,两条对角线代表汇总效果周围的(伪)95%置信极限(效果±1.96 SE)。这些显示了在没有异质性或选择偏见的情况下研究的预期分布。在没有异质性的情况下,95%的研究应位于这些对角线定义的漏斗内。
对称漏斗图示例 | 不对称漏斗图的示例 |
发布偏差导致漏斗图不对称。如果存在出版偏见,则较小的研究将显示较大的影响。参见Sterne等。(2011)解释漏斗图的不对称性。漏斗图可能并不总是可靠的工具,尤其是当分析中包含的研究数量较少时。