如您所知,通过选项CORRB
,您可以让 SAS 中的逻辑回归或线性回归输出估计矩阵的相关性。有趣的是,我不确定如何阅读这个矩阵。我有两个变量显然是强正相关的。从中PROC CORR
,我可以看出这两个变量的皮尔逊相关系数是0.7+
。但是逻辑回归和线性回归的估计矩阵都给了我-0.7。相关性的强度大致相似,但符号相反。任何人都可以解释一下吗?非常感谢。
问问题
4799 次
1 回答
5
您正在正确阅读这些值,它们只是意味着不同的东西。PROC CORR 为您提供变量的相关性,而 CORRB 是模型中这些变量的系数的相关性。
这是一个直观的解释,为什么正相关的预测变量会有负相关的系数。假设y = a + b1*x1 + b2*x2 + eps
。如果b1
从回归中获得的最佳值稍微增加一点,那么 的预测值y
也会增加(对于正值x1
)并且会使整体拟合更差。补偿这一点并将预测值更接近观察值的一种方法是减少 b2
:由于 的高值x1
与 的高值相关联x2
,您将回到接近原始拟合的位置。这表明 的不确定性b2
与 的不确定性呈负相关b1
:增加一个而减少另一个将导致类似的拟合。
看看完美相关的极端情况可能会很有启发性:x2=x1
. 那么以下将为您提供完全相同的预测:
y = 1 + 2*x + 3*x
y = 1 + 3*x + 2*x
y = 1 + 9*x + (-4)*x
etc
因此b2 = 5-b1
,系数具有完美的负相关。
于 2011-05-31T15:17:37.677 回答