我不太明白这个输出中的 p 值是什么意思。我不是指这样的 p 值,而是在这种情况下。
> Model 1: sl ~ le + ky
> Model 2: sl ~ le
Res.Df RSS Df Sum of Sq F Pr(>F)
1 97 0.51113
2 98 0.51211 -1 -0.00097796 0.1856 0.6676
我得到了类似的东西,现在我想知道哪种型号更合适。由于只有一个而不是两个 p 值,我感到困惑。我使用 summary(model1) 或 summary(model2) 得到不同的 pvalue
现在如果
> fm2<-lm(Y~X+T)
(T 是我的指标变量)和
> fm4<-lm(Y~X)
如果我做
> anova(fm2,fm4)
这测试了原假设H0: alpha1==alpha2
(Ha: alpha1!=alpha2)
c(alpha 是我的截距) 所以测试是有一个截距 (=> alpha1==alpha2
) 还是两个截距 ( alpha1!=alpha2
)更好
在这种情况下,我们现在显然会拒绝零假设,因为 p 值为 0.6676。
这意味着我们应该坚持使用 model fm4
,因为它更适合我们的数据。
我得出的结论对吗?我尽了最大努力,但我不确定 p 值是什么意思。因为只有 on,这就是我认为它可能的意思。有人可以澄清一下吗?