0

在 R 中,我对下面的数据库使用了多项式回归。它表明 R2 良好,系数和模型的显着性水平均小于 0.05。但是当使用shapiro.test测试残差时,p 值为 0.01088,这意味着残差不符合正态分布。所以我想知道多项式回归是否有效。多项式回归的残差是否必须满足正态假设?

下面附上用于回归的代码和数据。

alloy<-data.frame(
  x=c(37.0, 37.5, 38.0, 38.5, 39.0, 39.5, 40.0,
      40.5, 41.0, 41.5, 42.0, 42.5, 43.0),
  y=c(3.40, 3.00, 3.00, 3.27, 2.10, 1.83, 1.53,
      1.70, 1.80, 1.90, 2.35, 2.54, 2.90))

lm.sol=lm(y~x+I(x^2),data=alloy)
summary(lm.sol)

y.res=lm.sol$residuals
shapiro.test(y.res)
4

1 回答 1

0

嗯......这个问题可能属于 stat.exchange 因为它与编程无关。但是,这是我对您的数据的简要介绍。

R2 并shapiro.test解决数据和模型拟合的不同特征,因此您可以认为一个是“好”* 而另一个不是(对于“好”和“非”的足够模糊的定义)。

如果您将数据和拟合绘制在同一张图中,那么您会看到二次回归模型很好地捕捉到了整体趋势。

plot(y ~ x, data=alloy)
lines(alloy$x, predict(lm.sol))

在此处输入图像描述

该模型做得很好。您还可以看到残差的 qq 图表明方差同质性可能存在问题(请参阅最后一个残差)。

qqnorm(resid(lm.sol))

在此处输入图像描述

换句话说,残差可能不一定遵循高斯分布,但可以捕获数据的整体趋势。

那有帮助吗?

于 2017-05-29T18:54:03.053 回答