MedCalc 多重回归

命令: 统计
下一步选择回归
下一步选择多元回归
描述

多元回归是一种统计方法,用于检查一个因变量Y与一个或多个自变量i之间的关系。回归方程中的回归参数或系数i

多元回归方程

使用最小二乘法估计。在这种方法中,回归平面和因变量的观测值之间的残差平方和最小。回归方程表示k + 1维空间中的一个(超)平面,其中k是自变量123,… k的数量,加上因变量Y的一维。

必填项

多元回归对话框中需要输入以下内容:

多元回归-对话框

因变量

您要预测其值的变量。

自变量

选择至少一个您希望影响或预测因变量值的变量。也称为预测变量或解释变量。

重物

(可选)选择一个变量,该变量包含应赋予每个观察值的相对权重(用于加权多重最小二乘回归)。为自动加权回归程序选择虚拟变量“ *** AutoWeight 1 / SD ^ 2 ***”,以校正异方差(Neter等,1996)。该虚拟变量在“权重”下拉列表中显示为第一项。

过滤

(可选)输入数据过滤器,以便仅在分析中包括案例的选定子组。

选件
  • 方法:选择将自变量输入模型的方式。
    • 输入:只需一步即可输入模型中的所有变量,而无需检查
    • 转发:依次输入重要变量
    • 向后:首先将所有变量输入模型,然后依次删除不重要的变量
    • 逐步:依次输入重要变量;在模型中输入变量后,检查并可能删除变得不重要的变量。
  • 如果P < 

    如果变量的关联显着性水平小于此P值,则将其输入模型。

  • 如果P>,则删除变量 

    如果变量的关联显着性水平大于此P值,则将其从模型中删除。

  • 报告差异通货膨胀系数(VIF):用于在报告中显示差异通货膨胀系数的选项。高方差通胀因子是自变量的多重共线性的指标。多重共线性是指多重回归模型中两个或多个解释变量高度线性相关的情况。
  • 零阶和简单相关系数:创建表的选项,该表具有分别在因变量和所有自变量之间以及在所有自变量之间的相关系数。
  • 残差:您可以残差的正态分布选择一个可选的检验
结果

单击确定按钮后,结果窗口中将显示以下结果:

多元回归-结果

结果窗口中,显示以下统计信息:

样本量:数据记录数n

确定系数R 2:这是回归模型解释的因变量变化的比例,并且是模型拟合优度的度量。取值范围是0到1,计算方法如下:

确定系数

其中,Y是因变量的观察值,Y栏-观测值的平均值是观察值的平均值,est是因变量的预测值(使用回归方程计算预测值)。

2调整后:这是针对回归模型中的自变量数量调整后的确定系数。与确定系数不同,如果在模型中输入不会显着增加模型拟合的变量,R 2调整后的值可能会减少。

R平方-调整后

要么

R平方-调整后

多重相关系数:该系数用于衡量数据点在回归平面周围的紧密程度,并通过确定系数的平方根计算得出。

在讨论多元回归分析结果时,通常使用多元确定系数而不是多元相关系数。

残差标准差残差的标准差(残差=观测值与预测值之间的差)。计算公式如下:

残留标准偏差

回归方程:具有标准误差bib值,P值,偏和半偏相关系数r和r的不同回归系数i

  • 如果P小于常规的0.05,则可以认为回归系数与0显着不同,并且相应的变量对因变量的预测有显着贡献。
  • 偏相关系数r部分:部分相关是其它变量的线性效应之后的独立变量和因变量之间的相关性已经从自变量和因变量(该变量与因变量的相关性都去除,根据模型中其他变量的影响进行调整)。
  • 半部分相关系数r semipartial(在SPSS中称为部分相关):半部分相关是仅将其他自变量的线性效应从自变量中移除后,自变量与因变量之间的相关性。平方半相关系数是自变量占(唯一)方差相对于因变量Y的总方差的比例。
  • 可选地,该表包括方差通货膨胀系数(VIF)。高方差通胀因子是自变量的多重共线性的指标。多重共线性是指多重回归模型中两个或多个解释变量高度线性相关的情况。

模型中未包含的变量:由于两个可能的原因,变量未包含在模型中:

  • 您选择了逐步模型,并删除了该变量,因为其回归系数的P值高于阈值。
  • 变量的公差非常低(小于0.0001)。公差是方差通货膨胀因子(VIF)的倒数,等于1减去此变量与回归方程中所有其他自变量的平方多重相关性。如果回归方程中变量的容差很小,则无法评估回归方程。

方差分析:方差分析表将因变量的总变化分为两个部分,一个可以归因于回归模型(标记为Regression),另一个不能归因于(标记为Residual)。如果F检验的显着性水平较小(小于0.05),则可以拒绝不存在(线性)关系的假设,并且可以将多重相关系数称为统计显着性。

零阶和简单相关系数:此可选表分别显示了因变量(​​Y)与所有自变量X i之间以及所有自变量之间的相关系数。

残差分析

多元线性回归分析假设残差(观测值与估计值之间的差)服从正态分布。可以通过正式测试或通过图形方法来评估此假设。

当样本量较小时,不同的正态分布正式测试可能没有足够的能力来检测与正态分布的偏差。另一方面,当样本量较大时,由于中心极限定理,正态分布的要求不太严格。

因此,通常优选使用直方图盒须图正态图在视觉上评估残差分布的对称性和峰值。

为此,请在结果窗口中单击“保存残差”超链接。这会将残值保存为电子表格中的新变量。然后,您可以在不同的分布图中使用此新变量。

重复程序

如果要重复多次回归过程(可能要在模型中添加或删除变量),则只需按功能键F7即可。对话框将重新出现,其中包含先前的输入和选择(请参阅“调用对话框”)。

文学
  • Altman DG(1991)医学研究的实用统计学。伦敦:查普曼和霍尔。 从亚马逊购买
  • Armitage P,Berry G,Matthews JNS(2002)医学研究中的统计方法。4编 布莱克韦尔科学。 从亚马逊购买
  • Neter J,Kutner MH,Nachtsheim CJ,Wasserman W(1996)应用线性统计模型。4编 波士顿:麦格劳-希尔。
Facebook
Twitter