1

如您所知,通过选项CORRB,您可以让 SAS 中的逻辑回归或线性回归输出估计矩阵的相关性。有趣的是,我不确定如何阅读这个矩阵。我有两个变量显然是强正相关的。从中PROC CORR,我可以看出这两个变量的皮尔逊相关系数是0.7+。但是逻辑回归和线性回归的估计矩阵都给了我-0.7。相关性的强度大致相似,但符号相反。任何人都可以解释一下吗?非常感谢。

4

1 回答 1

5

您正在正确阅读这些值,它们只是意味着不同的东西。PROC CORR 为您提供变量的相关性,而 CORRB 是模型中这些变量的系数的相关性。

这是一个直观的解释,为什么正相关的预测变量会有负相关的系数。假设y = a + b1*x1 + b2*x2 + eps。如果b1从回归中获得的最佳值稍微增加一点,那么 的预测值y也会增加(对于正值x1)并且会使整体拟合更差。补偿这一点并将预测值更接近观察值的一种方法是减少 b2:由于 的高值x1与 的高值相关联x2,您将回到接近原始拟合的位置。这表明 的不确定性b2与 的不确定性呈负相关b1:增加一个而减少另一个将导致类似的拟合。

看看完美相关的极端情况可能会很有启发性:x2=x1. 那么以下将为您提供完全相同的预测:

y = 1 + 2*x + 3*x
y = 1 + 3*x + 2*x
y = 1 + 9*x + (-4)*x
etc

因此b2 = 5-b1,系数具有完美的负相关。

于 2011-05-31T15:17:37.677 回答