1

我从我的一份 proc 逻辑报告中发现,某个变量与截距高度相关。我该如何解释它?我应该改变什么来修改这种相关性?

编辑:尝试从更理论的角度提出这个问题。在大多数逻辑回归包的估计相关分析输出中,如果您看到截距估计与某个变量高度相关,这意味着什么?你会如何处理这样的情况?希望这是一种更清晰的提问方式。非常感谢大家。

4

1 回答 1

5

截距系数和协变量之间的正相关意味着您的大部分协变量值是负的(反之亦然:正值会出现负相关)。

这不仅限于逻辑回归,使用线性回归可能更容易看到。将您的值的散点图视为 y 轴右侧的一个斑点,并绘制最佳拟合线性回归线。现在稍微增加它的 y 截距和斜率:如果“blob”足够远,这条线将完全错过它。因此,您不能在获得合理拟合线的同时将两个参数移动到同一方向。换句话说,估计是负相关的。

在实践中,这没什么大不了的。确实,截距的估计值会有很大的可变性,但如果您的大部分数据远离 0,这并不奇怪。通常 x=0 没有意义,因此您甚至都不关心截距。如果您无法忍受看到这些大的相关性,只需将您的 x 变量居中即可。y 轴将移动到数据的中间,相关性将神奇地消失。当然,截距的含义也会发生变化,但这通常是可取的。

于 2011-06-09T13:41:50.410 回答