0

我正在与 R 合作,lm()在我收集的数据上创建一些线性模型(使用)。现在我不太擅长统计,并且发现很难理解通过 R 生成的线性模型的摘要。

我的意思是残值:Min, 1Q, Median, 3Q,Max

我的问题是:这些值是什么意思,如果我的模型好,我怎么能从这些值中知道?

这是我拥有的一些剩余价值。

Min: -4725611 1Q:-2161468 median:-1352080  3Q:3007561 Max:6035077
4

1 回答 1

3

线性回归的一个基本假设(尤其是相关的假设检验)是残差是正态分布的,期望值为零。稍微违反这个假设是没有问题的,因为统计数据非常可靠。但是,分布至少应该是对称的。

判断是否满足正态性假设的最佳方法是绘制残差图。有许多不同的诊断图可用,例如,您可以执行以下操作:

fit <- lm(y~x)
plot(fit)

这将为您提供残差与拟合值的图和标准化残差的 qq 图。给出的分位数summary(fit)对于快速检查残差是否对称很有用。在那里,最小值和最大值并不那么重要,但中位数应该接近于零,并且第一和第三四分位数应该具有相似的绝对值。当然,只有当您有足够数量的值时,此检查才有意义。

如果残差不是正态分布的,则有几种处理方法,例如,

  • 转变,
  • 广义线性模型,
  • 或者非线性模型可能更合适。

有很多关于线性回归的好书,甚至还有一些很好的网络教程。我建议至少仔细阅读其中之一。

于 2012-08-28T11:35:30.727 回答