MedCalc 摘要统计

1 2 月, 2021
4:39 下午

命令：

统计

摘要统计

描述

允许计算摘要统计信息：平均值，中位数，标准差，百分位数等。

必填项

在“摘要统计信息”对话框中，选择感兴趣的变量。您还可以在“选择”字段中输入过滤器，以仅包括案例的选定子组，如本手册的“简介”部分所述。

摘要统计对话框

您可以单击下拉按钮按钮以获得变量列表。在此列表中，您可以通过单击变量名称来选择变量。

选件

对数转换：如果数据需要对数转换（例如，当数据正偏时），请选择对数转换选项。
测试正态分布：请参阅正态分布测试。
单击更多选项按钮以获取其他选项：
- 百分位数：允许选择感兴趣的百分位数。
- 其他平均值
  - 修整后的均值：计算修整后的均值的选项。您选择将被修剪掉的观察百分比。例如，当您选择10％时，将删除最低5％和最高5％的观测值，以计算修整平均值。有关计算详细信息，请参见修剪均值，SE和置信区间的计算。
  - 几何平均数。几何平均值由下式给出：
    
    选择对数转换时（选择对数转换时，报告的均值已经是几何均值），此选项不可用。
  - 谐波平均值。谐波平均值由下式给出：
    
    选择对数转换时，此选项不可用。
- 子组：（可选）选择分类变量，以将数据分解为几个（最多8个）子组。将提供所有数据和所有子组的摘要统计信息。

结果

统计摘要结果

样本大小：案例数n是满足过滤条件的变量的数字条目数。

的最低值和最高值的所有观测（范围）。

算术平均值：算术平均值是所有观察值的总和除以观察值的数量n：

算术平均公式

平均值的95％置信区间（CI）：这是一个值范围，使用稍后所述的方法计算（请参见 “平均值的标准误”），其中包含具有95％概率的总体平均值。

中位数：当您有n个观察值，并且从小到大进行排序时，中值等于序号为（n + 1）/ 2的值。中值等于50^个百分。如果数据的分布为正态，则中位数等于算术平均值。中位数对极值或离群值不敏感，因此，它可能比算术平均值更好地衡量集中趋势。

中位数的95％置信区间（CI）：这是一个值范围，其中包含具有95％概率的总体中位数（Campbell＆Gardner，1988）。仅当样本量不太小时，才可以计算此95％的置信区间。

方差：方差是所有值与算术平均值之差的平方的均值。方差（s ²）使用以下公式计算：

方差公式

标准偏差：标准偏差（s或SD）是方差的平方根，并且是数据分布的度量：

标准偏差公式

当观察值的分布是正常的，则可以假定所有的95％的观察位于间隔均值- 1.96 SD以平均值±SD 1.96（为其它值见表：正态分布的值）。

数据分配

不应将此间隔与平均值的较小95％置信区间相混淆。区间均值-1.96 SD到平均值+ 1.96 SD代表单个观察值的描述性95％置信范围，而平均值的95％CI表示算术平均值的统计不确定性。

相对标准偏差（RSD）：这是标准偏差除以平均值。如果合适，可以将该数字乘以100表示百分比，以获得变化系数。

平均值的标准误差（SEM）：通过将标准偏差除以样本大小的平方根得出。

平均值（SEM）公式的标准误

SEM用于计算平均值的置信区间。当观测值的分布为正态或近似正态时，则有95％的置信度表明总体平均值位于区间 ± t SEM中，t取自t分布，其中n-1个自由度和置信度的95％（请参阅表t分布的值）。对于大样本量，t接近1.96。

偏度

偏度系数是变量分布中对称程度的度量。如果相应的P值较低（P <0.05），则变量对称性与正态分布的偏对称性显着不同，正态分布的偏度系数等于0（Sheskin，2011）。


负偏斜分布或向左偏斜<0		正态分布对称偏度= 0		正偏分布或向右偏斜> 0

峰度

峰度系数是变量分布中拖尾程度的度量（Westfall，2014年）。如果相应的P值较低（P <0.05），则可变拖尾度与正态分布的峰度显着不同，正态分布的峰度系数等于0（Sheskin，2011）。


侧柏分布细尾巴峰度<0		正态分布中律分布峰度= 0		瘦足分布尾巴峰度> 0

正态分布检验：该检验的结果表示为“接受正态性”或“拒绝正态性”，P值。如果P大于0.05，则可以假定数据具有正态分布，并显示结论“接受正态性”。

如果P值小于0.05，则应该拒绝观察值在样本中的分布为正态的假设，并显示结论“拒绝正态性”。在后一种情况下，无法通过算术平均值和标准偏差准确描述样品，并且不应将这些样品接受任何参数统计检验或程序（例如t检验）。为了测试非正态分布样本之间的可能差异，可以使用Wilcoxon检验，并且可以通过秩相关来估计相关。

当样本量较小时，可能无法执行所选的测试，并且会出现一条适当的消息。在这种情况下，您可以使用直方图或累积频率分布直观地评估分布的对称性和峰值。

百分位数（或“百分位数”）：当您有n个观测值，并且它们按从小到大的顺序排序时，第p个百分位数等于具有等级编号的观测值（Lentner，1982； Schoonjans等，2011）：

百分等级公式

当等级数R（p）是整数时，则百分位数与样本值一致；如果R（p）是一个分数，则百分位数位于等级与R（p）相邻的值之间，在这种情况下，MedCalc使用插值法计算百分位数。

R（p）的公式仅在以下情况下有效

百分位数所需的样本量

例如，仅当n≥20时才能估计^第5^个百分位数和^第95^个百分位数，因为

百分位数所需的样本量-示例

因此，它是没有意义的引述5^个和95^个百分位数当样本大小小于20。在这种情况下，建议引述10^个和90^个百分位数，至少如果样本大小不小于10 。

百分位数可解释如下：观测值的p％位于第p个百分位以下，例如，观测值的10％位于第10^个百分位以下。

25^个百分位被称为1个^ST四分位数，所述50^个百分位数是2^次四分位数（和等于中值），以及75^个百分位数是3^次四分位数。

第25^个百分位数与^第75个百分位数之间的数值差是四分位数范围。内的2.5^个和97.5^个百分位数位于的值的95％，并且该范围被称为95％中心范围。90％的中心范围由第5^个百分点和^第95^个百分点定义，^第10^个和^第90^个百分点由80％中心范围定义。

对数变换

如果选择了对数转换选项，则程序将显示反向转换的结果。逆变换后的均值称为几何均值。均值的方差，标准偏差和标准误差无法进行有意义的逆变换，因此不会报告。

结果介绍

出版物中的数据描述将包括样本量和算术平均值。可以给出标准偏差作为数据变异性的指标：平均值为25.6 mm（SD 3.2 mm）。可以给出平均值的标准误差以显示平均值的精度：平均值为25.6 mm（SE 1.6 mm）。

当您要推断总体均值时，可以给出均值和均值的95％置信区间：均值为25.6（95％CI为22.4至28.8）。

如果变量的分布正偏，则可以应用数据的数学变换以获得正态分布，例如对数或平方根变换。计算后，您可以将结果转换回原始比例。这样就没有必要报告反向转换后的标准偏差或平均值的标准误差。相反，如果应用了对数转换，则可以对置信区间进行对数；如果应用了平方根转换，则可以对置信区间取平方（Altman等，1983）。然后，所得的置信区间将不是对称的，反映了分布的形状。例如，如果在对数转换数据后，平均值为1.408，而95％置信区间为1.334至1.482，的平均值为25.6毫米（95％CI 21.6 30.3）。

如果即使经过对数转换或其他变换后变量的分布也不正常，则最好报告中位数和百分位数范围，例如四分位间距或中心范围的90％或95％：中位数为25.6 mm（ 95％中心范围19.6至33.5毫米）。当您决定使用四分位数范围还是中心范围的90％或95％（请参见百分位数）时，将考虑样本量（Altman，1980）。

报告的统计信息的精度应与原始数据的精度相对应。平均值和95％CI可以比原始数据多一位小数，标准偏差和标准误可以多一位小数（Altman等，1983）。

最后，文本或表格中的摘要统计信息可以用图形来补充（请参阅分布图）。

文学

Altman DG（1980）医学研究中的统计与伦理学。VI-结果展示。英国医学杂志281：1542-1544。
Altman DG（1991）医学研究的实用统计学。伦敦：查普曼和霍尔。
Altman DG，Gore SM，Gardner MJ，Pocock SJ（1983）医学期刊投稿人统计指南。英国医学杂志286：1489-1493。
Campbell MJ，Gardner MJ（1988）计算一些非参数分析的置信区间。英国医学杂志296：1454-1456。
Lentner C（ed）（1982）Geigy Scientific Tables，^第8版，第2卷。巴塞尔：Ciba-Geigy Limited。
Schoonjans F，De Bacquer D，Schmid P（2011）人口百分位数估计。流行病学22：750-751。
Sheskin DJ（2011）参数和非参数统计程序手册。5^日版。博卡拉顿：Chapman＆Hall / CRC。
Westfall PH（2014）峰度为峰度，1905-2014年。RIP美国统计学家68：191-195。