命令: | 统计 生存分析 Kaplan-Meier生存分析 |
描述
进行生存分析并生成Kaplan-Meier生存图。
在临床试验中,研究人员通常会对研究参与者提出特定事件或终点的时间感兴趣。此事件通常是临床结果,例如死亡,肿瘤消失等。
将从特定的起点开始跟踪参与者,并且将记录发生感兴趣事件所需的时间。
通常,在所有参与者都提出该事件之前就已经达到研究的终点,而其余患者的结果是未知的。退出研究的参与者的结果也是未知的。对于所有这些情况,都会记录随访时间(检查数据)。
在MedCalc中,可以通过生命表或Kaplan-Meier曲线来分析这些数据,这是描述生存特征的最常用方法。
如何输入数据
为了能够分析数据,您需要按以下方式在电子表格中输入数据:
- 在一栏中,可以输入代码以将案件分配给特定的组(研究组-对照组)。
- 在第二列中,必须记录生存时间
- 在第三栏中,必须记录案件是否到达终点(通过输入代码1)或时间是否经过审查,即结果未知(通过输入代码0);
这些列的顺序当然并不重要。同样,行也不必以任何方式排序。
第1行的案例属于第1组,在10个时间单位后到达终点。第3行中的案件也属于第1组,被追踪了9个时间单位。这种情况的结果是未知的(从研究或研究结束中撤回)(数据来自Freireich等,Blood 1963; 21:699-716)。
根据这些数据,MedCalc可以轻松计算和构建Kaplan-Meier曲线。
必填项
在此对话框中,需要输入以下数据:
生存时间
变量名称,包含到达感兴趣事件的时间或后续时间。
终点
变量的名称,其中包含已到达端点的案例的代码为1,或尚未到达端点的案例的代码为0,这是因为它们已退出研究或到达研究结束。如果您的数据编码方式不同,则可以使用“定义状态”工具重新编码数据。
因子
对于“因子”,选择一个定性或离散变量(在示例中为分组变量-GROUP)。此定性因素可以是字符代码或数字代码。这些代码用于将数据分解为几个子组。如果要研究连续变量对生存时间的影响,可以使用“创建组”工具将此连续变量转换为离散变量。
MedCalc将允许比较多达6个亚组的生存曲线。
如果未选择任何因子变量,则MedCalc将仅显示一条生存曲线(所有数据均视为一组)。
选择
仅包含图中选定案例子组的过滤器。
选件
因子水平的线性趋势:允许测试因子水平之间的线性趋势(Altman,1991)。如果因子水平具有自然顺序是适当的(例如,因子代码表示应用于不同组的剂量)。Kaplan-Meier假设因子水平是相等间隔的。
受限平均生存时间:该选项可计算受限平均生存时间(RMST),并比较各组之间的RMST。限制平均生存时间是指直到预定时间点的无事件的平均生存时间。从研究开始到那个时间点,它等于Kaplan-Meier曲线下的面积。所选时间点必须位于每个组的第一个事件和最后一个事件之间;否则,软件会将其重置为不同组中最后一个事件的最低时间点。
图表:
-
-
- 生存几率(%):绘制生存几率(%)与时间的关系(下降曲线)
- 100-生存几率(%):绘制100-生存几率(%)随时间变化(上升曲线)
-
在图形中包括95%CI:允许绘制生存曲线的95%置信区间。
在图表中标记检查数据:在图表中用小垂直线标记检查数据。
图表下方的危险人数表:在图表下方显示一张表格,其中包含危险主体的数量。
输入所有数据后,单击确定按钮,程序将打开2个窗口:一个带有生存图,另一个带有统计结果。
图形
生存曲线绘制为阶跃函数,如以下示例所示:
选择“在图形中包含95%CI ”选项后,图形如下所示:
选择选项“图表下方的危险数字”时,结果为:
结果
案例总结
该表显示到达终结点的案例数(事件数),未到达终结点的案例数(受检查的数量)以及案例总数。
平均生存率和中位生存率
报告平均生存时间和中位生存时间及其95%置信区间(CI)。
平均生存时间估计为生存曲线下在0至t max区间内的面积(Klein&Moeschberger,2003年)。
中位生存期是生存几率降至0.5(50%)或更低的最小时间。如果生存曲线未降至0.5或以下,则无法计算中位时间。中位生存时间及其95%CI根据Brookmeyer&Crowley,1982年计算得出。
限制平均生存时间
报告了受限的平均生存时间(RMST),其置信区间为95%。如果定义了组,则会显示一个表,其中包含组之间的RMST差异,差异的95%CI和关联的P值(Royston&Karmar,2013)。
生存表
在每个观察到的时间点,列出所有组的生存率(带有标准误)以及总生存率。
生存曲线比较(对数秩检验)
向下滚动时,您会看到对数秩检验的结果,用于比较两个生存曲线:
在此示例中,第1组中的9例和第2组中的21例呈现了感兴趣的结果。卡方统计量为16.79,关联的P值小于0.0001。因此,得出的结论是,从统计上看,两条生存曲线存在显着差异,或者分组变量对生存时间具有重大影响。
95%置信区间的危险比
指定因子后,MedCalc还将以95%置信区间(CI)计算危险比。危害是衡量关注事件发生的速度的一种度量。危险比将两组中的危险进行比较。
在该示例中,危险比为5.1462,因此,与第1组相比,第2组发生的关注事件的估计相对风险为5.1462。该危险比与值1显着不同(相当于相等危险),因为置信度2.3506到11.2663的间隔不包含值1。
危险比和置信区间是根据Altman等人(2000年)计算的。
请注意,危险比的计算假设该比率随时间变化是一致的,因此,如果生存曲线交叉,则应忽略危险比统计信息。
Logrank趋势检验
如果比较了两个以上的生存曲线,并且各组之间存在自然顺序,则MedCalc也可以执行趋势的对数检验。这测试了各组中生存分数存在趋势的可能性。