描述允许计算摘要统计信息:平均值,中位数,标准差,百分位数等。 必填项在“摘要统计信息”对话框中,选择感兴趣的变量。您还可以在“选择”字段中输入过滤器,以仅包括案例的选定子组,如本手册的“简介”部分所述。 您可以单击按钮以获得变量列表。在此列表中,您可以通过单击变量名称来选择变量。 选件
样本大小:案例数n是满足过滤条件的变量的数字条目数。 的最低值和最高值的所有观测(范围)。 算术平均值:算术平均值是所有观察值的总和除以观察值的数量n: 平均值的95%置信区间(CI):这是一个值范围,使用稍后所述的方法计算(请参见 “平均值的标准误”),其中包含具有95%概率的总体平均值。 中位数:当您有n个观察值,并且从小到大进行排序时,中值等于序号为(n + 1)/ 2的值。中值等于50个百分。如果数据的分布为正态,则中位数等于算术平均值。中位数对极值或离群值不敏感,因此,它可能比算术平均值更好地衡量集中趋势。 中位数的95%置信区间(CI):这是一个值范围,其中包含具有95%概率的总体中位数(Campbell&Gardner,1988)。仅当样本量不太小时,才可以计算此95%的置信区间。 方差:方差是所有值与算术平均值之差的平方的均值。方差(s 2)使用以下公式计算: 标准偏差:标准偏差(s或SD)是方差的平方根,并且是数据分布的度量: 当观察值的分布是正常的,则可以假定所有的95%的观察位于间隔均值- 1.96 SD以平均值±SD 1.96(为其它值见表:正态分布的值)。 不应将此间隔与平均值的较小95%置信区间相混淆。区间均值-1.96 SD到平均值+ 1.96 SD代表单个观察值的描述性95%置信范围,而平均值的95%CI表示算术平均值的统计不确定性。 相对标准偏差(RSD):这是标准偏差除以平均值。如果合适,可以将该数字乘以100表示百分比,以获得变化系数。 平均值的标准误差(SEM):通过将标准偏差除以样本大小的平方根得出。 SEM用于计算平均值的置信区间。当观测值的分布为正态或近似正态时,则有95%的置信度表明总体平均值位于区间 ± t SEM中,t取自t分布,其中n-1个自由度和置信度的95%(请参阅表t分布的值)。对于大样本量,t接近1.96。 偏度 偏度系数是变量分布中对称程度的度量。如果相应的P值较低(P <0.05),则变量对称性与正态分布的偏对称性显着不同,正态分布的偏度系数等于0(Sheskin,2011)。
峰度 峰度系数是变量分布中拖尾程度的度量(Westfall,2014年)。如果相应的P值较低(P <0.05),则可变拖尾度与正态分布的峰度显着不同,正态分布的峰度系数等于0(Sheskin,2011)。
正态分布检验:该检验的结果表示为“接受正态性”或“拒绝正态性”,P值。如果P大于0.05,则可以假定数据具有正态分布,并显示结论“接受正态性”。 如果P值小于0.05,则应该拒绝观察值在样本中的分布为正态的假设,并显示结论“拒绝正态性”。在后一种情况下,无法通过算术平均值和标准偏差准确描述样品,并且不应将这些样品接受任何参数统计检验或程序(例如t检验)。为了测试非正态分布样本之间的可能差异,可以使用Wilcoxon检验,并且可以通过秩相关来估计相关。 当样本量较小时,可能无法执行所选的测试,并且会出现一条适当的消息。在这种情况下,您可以使用直方图或累积频率分布直观地评估分布的对称性和峰值。 百分位数(或“百分位数”):当您有n个观测值,并且它们按从小到大的顺序排序时,第p个百分位数等于具有等级编号的观测值(Lentner,1982; Schoonjans等,2011): 当等级数R(p)是整数时,则百分位数与样本值一致;如果R(p)是一个分数,则百分位数位于等级与R(p)相邻的值之间,在这种情况下,MedCalc使用插值法计算百分位数。 R(p)的公式仅在以下情况下有效 例如,仅当n≥20时才能估计第5个百分位数和第95个百分位数,因为 因此,它是没有意义的引述5个和95个百分位数当样本大小小于20。在这种情况下,建议引述10个和90个百分位数,至少如果样本大小不小于10 。 百分位数可解释如下:观测值的p%位于第p个百分位以下,例如,观测值的10%位于第10个百分位以下。 25个百分位被称为1个ST四分位数,所述50个百分位数是2次四分位数(和等于中值),以及75个百分位数是3次四分位数。 第25个百分位数与第75个百分位数之间的数值差是四分位数范围。内的2.5个和97.5个百分位数位于的值的95%,并且该范围被称为95%中心范围。90%的中心范围由第5个百分点和第95个百分点定义,第10个和第90个百分点由80%中心范围定义。 对数变换如果选择了对数转换选项,则程序将显示反向转换的结果。逆变换后的均值称为几何均值。均值的方差,标准偏差和标准误差无法进行有意义的逆变换,因此不会报告。 结果介绍出版物中的数据描述将包括样本量和算术平均值。可以给出标准偏差作为数据变异性的指标:平均值为25.6 mm(SD 3.2 mm)。可以给出平均值的标准误差以显示平均值的精度:平均值为25.6 mm(SE 1.6 mm)。 当您要推断总体均值时,可以给出均值和均值的95%置信区间:均值为25.6(95%CI为22.4至28.8)。 如果变量的分布正偏,则可以应用数据的数学变换以获得正态分布,例如对数或平方根变换。计算后,您可以将结果转换回原始比例。这样就没有必要报告反向转换后的标准偏差或平均值的标准误差。相反,如果应用了对数转换,则可以对置信区间进行对数;如果应用了平方根转换,则可以对置信区间取平方(Altman等,1983)。然后,所得的置信区间将不是对称的,反映了分布的形状。例如,如果在对数转换数据后,平均值为1.408,而95%置信区间为1.334至1.482,的 平均值为25.6毫米(95%CI 21.6 30.3)。 如果即使经过对数转换或其他变换后变量的分布也不正常,则最好报告中位数和百分位数范围,例如四分位间距或中心范围的90%或95%:中位数为25.6 mm( 95%中心范围19.6至33.5毫米)。当您决定使用四分位数范围还是中心范围的90%或95%(请参见百分位数)时,将考虑样本量(Altman,1980)。 报告的统计信息的精度应与原始数据的精度相对应。平均值和95%CI可以比原始数据多一位小数,标准偏差和标准误可以多一位小数(Altman等,1983)。 最后,文本或表格中的摘要统计信息可以用图形来补充(请参阅分布图)。 文学
|
- 0755 - 22222247
- iinfo@mail.apsgo.com
- Mon - Fri: 9:00 - 18:30