我正在与 R 合作,lm()
在我收集的数据上创建一些线性模型(使用)。现在我不太擅长统计,并且发现很难理解通过 R 生成的线性模型的摘要。
我的意思是残值:Min
, 1Q
, Median
, 3Q
,Max
我的问题是:这些值是什么意思,如果我的模型好,我怎么能从这些值中知道?
这是我拥有的一些剩余价值。
Min: -4725611 1Q:-2161468 median:-1352080 3Q:3007561 Max:6035077
我正在与 R 合作,lm()
在我收集的数据上创建一些线性模型(使用)。现在我不太擅长统计,并且发现很难理解通过 R 生成的线性模型的摘要。
我的意思是残值:Min
, 1Q
, Median
, 3Q
,Max
我的问题是:这些值是什么意思,如果我的模型好,我怎么能从这些值中知道?
这是我拥有的一些剩余价值。
Min: -4725611 1Q:-2161468 median:-1352080 3Q:3007561 Max:6035077
线性回归的一个基本假设(尤其是相关的假设检验)是残差是正态分布的,期望值为零。稍微违反这个假设是没有问题的,因为统计数据非常可靠。但是,分布至少应该是对称的。
判断是否满足正态性假设的最佳方法是绘制残差图。有许多不同的诊断图可用,例如,您可以执行以下操作:
fit <- lm(y~x)
plot(fit)
这将为您提供残差与拟合值的图和标准化残差的 qq 图。给出的分位数summary(fit)
对于快速检查残差是否对称很有用。在那里,最小值和最大值并不那么重要,但中位数应该接近于零,并且第一和第三四分位数应该具有相似的绝对值。当然,只有当您有足够数量的值时,此检查才有意义。
如果残差不是正态分布的,则有几种处理方法,例如,
有很多关于线性回归的好书,甚至还有一些很好的网络教程。我建议至少仔细阅读其中之一。