我学会了如何使用 R 对回归模型的不拟合进行 F 检验,其中 $H_0$:“回归模型中不存在不拟合”。
其中 df_1 是 SSLF 的自由度(失拟平方和),df_2 是 SSPE 的自由度(纯误差的平方和)。
在 R 中,F 检验(例如对于具有 2 个预测变量的模型)可以用
anova(lm(y~x1+x2), lm(y~factor(x1)*factor(x2)))
示例输出:
Model 1: y ~ x1 + x2
Model 2: y ~ factor(x1) * factor(x2)
Res.Df RSS Df Sum of Sq F Pr(>F)
1 19 18.122
2 11 12.456 8 5.6658 0.6254 0.7419
F 统计量:0.6254,p 值为 0.7419。
由于 p 值大于 0.05,我们不拒绝 $H_0$ 不缺乏拟合。因此模型是足够的。
我想知道的是为什么使用 2 个模型以及为什么使用命令factor(x1)*factor(x2)
?显然,来自 的 12.456Model 2
神奇地是Model 1
.
为什么?