1

我在 R 中运行简单的线性模型(Y~X),其中我的预测变量是分类变量(0-10)。然而,这个变量不是正态分布的,并且没有任何可用的转换技术是有帮助的(例如 log、sq 等),因为数据不是负/正偏斜,而是到处都有。我知道对于 lm ,结果变量(Y)必须是正态分布的,但这也是预测变量所必需的吗?如果是的话,任何关于如何做到这一点的建议都将受到欢迎。

此外,由于我正在查看的数据有两组,患者与对照组(我对组差异感兴趣,正如您所猜到的),我是否必须查看数据是否正常分布在两组内或总体上?两组?
谢谢。

4

1 回答 1

1

请参阅上面的@Roman Luštriks 评论:预测变量的分布方式无关紧要。(除了多重共线性问题。)重要的是残差是正常的(并且具有齐次方差)。

于 2012-07-29T15:45:43.923 回答