MedCalc 卡方检验

命令: 统计
下一步选择交叉表
下一步选择卡方检验
描述

该卡方检验可用于以下情况:

一个变量-单向分类

为了检验以下假设:对于一个分类表(例如性别),所有分类级别具有相同的频率。在对话框中只需标识一个离散变量,并且零假设是所有分类级别的频率相同。如果计算得出的P值较小(<0.05),则否定原假设,并且必须接受不同分类级别的频率之间存在显着差异的替代假设。

两个变量-双向分类

测试两个分类因素(例如性别和职业)之间的关系。在这种情况下,必须在对话框中标识两个离散变量,并且零假设是这两个因素是独立的。如果计算出的P值较小(<0.05),则将拒绝原假设,并且必须接受两个因素之间存在关联的替代假设。

如何输入数据

在下面的示例中,我们有两个类别变量。对于变量OUTCOME,输入1表示肯定结果,输入0表示否定结果。对于变量SMOKING,将代码1用于吸烟的对象,将代码0用于不吸烟的对象。每个案例的数据都输入到电子表格的一行上。

卡方检验的示例数据

必填项

在卡方检验对话框中,必须标识一个或两个带有分类数据的离散变量。分类数据可以是数字值或字母数字(字符串)值。如果需要,可以使用IF函数将连续变量转换为离散变量(请参见其他部分)。

卡方检验对话框

结果

完成对话框后,单击“确定”以获取具有相关统计信息的频率表。

分类表

卡方检验结果

当您选择该选项显示所有的百分比在结果窗口中,所有的百分比显示在表如下:

卡方检验结果表明所有百分比

在此示例中,左上单元格中的数字42(对于代码X和代码Y均等于0)为62个案例的行总数的67.7%;立柱总数的56例中占75%,而立柱总数100例中占42%。

卡方检验

卡方统计量是观察到的频率与预期频率之差的平方之和除以每个单元格的预期频率:

卡方统计

单一分类因子

当您要检验一个单一分类表(例如性别)的假设时,所有分类级别具有相同的频率,然后在对话框表单中仅标识一个离散变量。在这种情况下,零假设是所有分类级别的频率相同。如果计算出的P值较低(P <0.05),则您拒绝原假设,而必须接受不同分类级别的频率之间存在显着差异的替代假设。

在单个分类表中,观察的模式是最常见的观察或类别(频率最高的观察)。单峰分布只有一种模式。双峰分布,两种模式。

两个分类因素

当您要研究两个分类因素(例如性别和职业)之间的关系时,请在对话框形式中标识两个离散变量。在这种情况下,零假设是这两个因素是独立的。如果计算出的P值很低(P <0.05),则原假设被拒绝,您将接受替代假设,即两个因素之间存在关联。

卡方检验趋势

如果表有两列和三行或更多行(或两行和三行或更多列),并且类别可以量化,则MedCalc还将对趋势执行卡方检验。Cochran-Armitage趋势检验(Cochran,1954; Armitage,1955)检验行(或列)数与左列(或顶行)中对象的比例之间是否存在线性趋势。与上面的无序独立性检验相比,Cochran-Armitage趋势检验提供了更强大的检验。

如果行(或列)类别中没有有意义的顺序,则应忽略此计算。

2×2表分析
  • 对于2×2表格,MedCalc使用Campbell(2007)和Richardson(2011)推荐的“ N-1”卡方检验。在“N-1”卡方检验卡方给出上述被系数(乘以Ñ -1)/ Ñ。不再建议使用Yates的连续性校正。
  • 当两个分类因素不是独立的,或者要在相关或成对的观察中测试比例之间的差异时(例如,在以患者作为自己对照的研究中),必须使用McNemar检验
预期频率小

一个普遍的误解是,当存在一个或某些预期频率小于5的单元时,卡方检验不可靠。

在搜索互联网时,您可能会发现很多网站都在声明,但这些都没有引用。

但是根据Pagano&Gauvreau(2000)的说法:
“表中没有任何一个单元格的预期计数应小于1,并且不超过20%的单元格的预期计数应小于5”(参考Cochran,1954年) )。

实际上,根据Cochran(1954):
“ 2×2表。使用费舍尔精确检验(i)如果表的总N <2 0,(ii)如果20 < N <40并且最小期望值小于5 。
应急超过表1个DF如果相对少量的期望是小于5(在1个细胞说出的5个或更多,或2细胞进行的10个或更多),1的最小的期望是在计算允许Χ 2 “。 ;
和“如果Χ 2具有小于30度的自由和最小期望是2以上时,使用普通的χ 2代表通常是足够的。”

由Koehler和Lartnz的研究(1980)(1999年Connover引用,第241页)发现卡方近似是足够的,只要Ñ ≥10,Ç ≥3,Ñ 2 / ç ≥10,和所有È Ĵ ≥0.25(其中c为单元格数量,E j为单元格j中的预期数量)。

Facebook
Twitter