MedCalc 摘要统计

命令:
统计
下一步选择摘要统计
描述

允许计算摘要统计信息:平均值,中位数,标准差,百分位数等。

必填项

在“摘要统计信息”对话框中,选择感兴趣的变量。您还可以在“选择”字段中输入过滤器,以仅包括案例的选定子组,如本手册的“简介”部分所述。

摘要统计对话框

您可以单击下拉按钮按钮以获得变量列表。在此列表中,您可以通过单击变量名称来选择变量。

选件

  • 对数转换:如果数据需要对数转换(例如,当数据正偏时),请选择对数转换选项。
  • 测试正态分布:请参阅正态分布测试
  • 单击更多选项按钮以获取其他选项:

    摘要统计的选项

    • 百分位数:允许选择感兴趣的百分位数。
    • 其他平均值
      • 修整后的均值:计算修整后的均值的选项。您选择将被修剪掉的观察百分比。例如,当您选择10%时,将删除最低5%和最高5%的观测值,以计算修整平均值。有关计算详细信息请参见修剪均值,SE和置信区间的计算。
      • 几何平均数。几何平均值由下式给出:
        几何平均数
        选择对数转换时(选择对数转换时,报告的均值已经是几何均值),此选项不可用。
      • 谐波平均值。谐波平均值由下式给出:
        谐波均值
        选择对数转换时,此选项不可用。
    • 子组:(可选)选择分类变量,以将数据分解为几个(最多8个)子组。将提供所有数据和所有子组的摘要统计信息。

结果

统计摘要结果

样本大小:案例数n是满足过滤条件的变量的数字条目数。

最低值最高值的所有观测(范围)。

算术平均值:算术平均值X棒是所有观察值的总和除以观察值的数量n:

算术平均公式

平均值的95%置信区间(CI):这是一个值范围,使用稍后所述的方法计算(请参见 “平均值的标准误”),其中包含具有95%概率的总体平均值。

中位数:当您有n个观察值,并且从小到大进行排序时,中值等于序号为(n + 1)/ 2的值。中值等于50百分。如果数据的分布为正态,则中位数等于算术平均值。中位数对极值或离群值不敏感,因此,它可能比算术平均值更好地衡量集中趋势。

中位数的95%置信区间(CI):这是一个值范围,其中包含具有95%概率的总体中位数(Campbell&Gardner,1988)。仅当样本量不太小时,才可以计算此95%的置信区间。

方差:方差是所有值与算术平均值之差的平方的均值。方差(s 2)使用以下公式计算:

方差公式

标准偏差:标准偏差(s或SD)是方差的平方根,并且是数据分布的度量:

标准偏差公式

当观察值的分布是正常的,则可以假定所有的95%的观察位于间隔均值- 1.96 SD以平均值±SD 1.96(为其它值见表:正态分布的值)。

数据分配

不应将此间隔与平均值的较小95%置信区间相混淆。区间均值-1.96 SD到平均值+ 1.96 SD代表单个观察值的描述性95%置信范围,而平均值的95%CI表示算术平均值的统计不确定性。

相对标准偏差(RSD):这是标准偏差除以平均值。如果合适,可以将该数字乘以100表示​​百分比,以获得变化系数。

平均值的标准误差(SEM):通过将标准偏差除以样本大小的平方根得出。

平均值(SEM)公式的标准误

SEM用于计算平均值的置信区间。当观测值的分布为正态或近似正态时,则有95%的置信度表明总体平均值位于区间X棒 ±  t  SEM中,t取自t分布,其中n-1个自由度和置信度的95%(请参阅表t分布的值)。对于大样本量,t接近1.96。

偏度

偏度系数是变量分布中对称程度的度量。如果相应的P值较低(P <0.05),则变量对称性与正态分布的偏对称性显着不同,正态分布的偏度系数等于0(Sheskin,2011)。

负偏斜分布 正态分布 正偏分布
负偏斜分布
或向左
偏斜<0
正态分布
对称
偏度= 0
正偏分布
或向右
偏斜> 0

 

峰度

峰度系数是变量分布中拖尾程度的度量(Westfall,2014年)。如果相应的P值较低(P <0.05),则可变拖尾度与正态分布的峰度显着不同,正态分布的峰度系数等于0(Sheskin,2011)。

峰度:扁平肺分布 峰度:正态分布 峰度:瘦小体分布
侧柏分布细
尾巴
峰度<0
正态分布中
律分布
峰度= 0
瘦足分布
尾巴
峰度> 0

 

正态分布检验:该检验的结果表示为“接受正态性”或“拒绝正态性”,P值。如果P大于0.05,则可以假定数据具有正态分布,并显示结论“接受正态性”。

如果P值小于0.05,则应该拒绝观察值在样本中的分布为正态的假设,并显示结论“拒绝正态性”。在后一种情况下,无法通过算术平均值和标准偏差准确描述样品,并且不应将这些样品接受任何参数统计检验或程序(例如t检验)。为了测试非正态分布样本之间的可能差异,可以使用Wilcoxon检验,并且可以通过秩相关来估计相关。

当样本量较小时,可能无法执行所选的测试,并且会出现一条适当的消息。在这种情况下,您可以使用直方图或累积频率分布直观地评估分布的对称性和峰值。

百分位数(或“百分位数”):当您有n个观测值,并且它们按从小到大的顺序排序时,第p个百分位数等于具有等级编号的观测值(Lentner,1982; Schoonjans等,2011):

百分等级公式

当等级数R(p)是整数时,则百分位数与样本值一致;如果R(p)是一个分数,则百分位数位于等级与R(p)相邻的值之间,在这种情况下,MedCalc使用插值法计算百分位数。

R(p)的公式仅在以下情况下有效

百分位数所需的样本量

例如,仅当n≥20时才能估计5百分位数和95百分位数,因为

百分位数所需的样本量-示例

因此,它是没有意义的引述5和95百分位数当样本大小小于20。在这种情况下,建议引述10和90百分位数,至少如果样本大小不小于10 。

百分位数可解释如下:观测值的p%位于第p个百分位以下,例如,观测值的10%位于第10百分位以下。

25百分位被称为1个ST四分位数,所述50百分位数是2四分位数(和等于中值),以及75百分位数是3四分位数。

第25百分位数与75个百分位数之间的数值差是四分位数范围。内的2.5和97.5百分位数位于的值的95%,并且该范围被称为95%中心范围。90%的中心范围由第5百分点和95百分点定义,1090百分点由80%中心范围定义。

对数变换

如果选择了对数转换选项,则程序将显示反向转换的结果。逆变换后的均值称为几何均值。均值的方差,标准偏差和标准误差无法进行有意义的逆变换,因此不会报告。

结果介绍

出版物中的数据描述将包括样本量和算术平均值。可以给出标准偏差作为数据变异性的指标:平均值为25.6 mm(SD 3.2 mm)。可以给出平均值的标准误差以显示平均值的精度:平均值为25.6 mm(SE 1.6 mm)。

当您要推断总体均值时,可以给出均值和均值的95%置信区间:均值为25.6(95%CI为22.4至28.8)。

如果变量的分布正偏,则可以应用数据的数学变换以获得正态分布,例如对数或平方根变换。计算后,您可以将结果转换回原始比例。这样就没有必要报告反向转换后的标准偏差或平均值的标准误差。相反,如果应用了对数转换,则可以对置信区间进行对数;如果应用了平方根转换,则可以对置信区间取平方(Altman等,1983)。然后,所得的置信区间将不是对称的,反映了分布的形状。例如,如果在对数转换数据后,平均值为1.408,而95%置信区间为1.334至1.482,的 平均值为25.6毫米(95%CI 21.6 30.3)。

如果即使经过对数转换或其他变换后变量的分布也不正常,则最好报告中位数和百分位数范围,例如四分位间距或中心范围的90%或95%:中位数为25.6 mm( 95%中心范围19.6至33.5毫米)。当您决定使用四分位数范围还是中心范围的90%或95%(请参见百分位数)时,将考虑样本量(Altman,1980)。

报告的统计信息的精度应与原始数据的精度相对应。平均值和95%CI可以比原始数据多一位小数,标准偏差和标准误可以多一位小数(Altman等,1983)。

最后,文本或表格中的摘要统计信息可以用图形来补充(请参阅分布图)。

文学
  • Altman DG(1980)医学研究中的统计与伦理学。VI-结果展示。英国医学杂志281:1542-1544。 考研
  • Altman DG(1991)医学研究的实用统计学。伦敦:查普曼和霍尔。 从亚马逊购买
  • Altman DG,Gore SM,Gardner MJ,Pocock SJ(1983)医学期刊投稿人统计指南。英国医学杂志286:1489-1493。 考研
  • Campbell MJ,Gardner MJ(1988)计算一些非参数分析的置信区间。英国医学杂志296:1454-1456。 考研
  • Lentner C(ed)(1982)Geigy Scientific Tables,8版,第2卷。巴塞尔:Ciba-Geigy Limited。 从亚马逊购买
  • Schoonjans F,De Bacquer D,Schmid P(2011)人口百分位数估计。流行病学22:750-751。 考研
  • Sheskin DJ(2011)参数和非参数统计程序手册。5版。博卡拉顿:Chapman&Hall / CRC。 从亚马逊购买
  • Westfall PH(2014)峰度为峰度,1905-2014年。RIP美国统计学家68:191-195。 考研
Facebook
Twitter