0

为什么添加第二个解释变量后拟合会变差?

require("VGAM")
df = data.frame(x = c(1,2,3,4,5,6,7,8,9,10), y = c(1,4,8,15,25,36,48,65,80,105), z =        c(0,0,0,1,100,400,900,1600,1800,200)  )
vgt1 = vgam(y~s(x, df=2), data=df,family=gaussianff, trace=TRUE)
vgt2 = vgam(y~cbind(s(x, df=2),s(z, df=2)), data=df,family=gaussianff, trace=TRUE)

plot(df$x, df$y, col="black")
lines(df$x, vgt1@predictors, col="red")
lines(df$x, vgt2@predictors, col="blue")
4

1 回答 1

1

当您添加一个变量时,您+不使用 cbind。

vgam解析terms.formula用于查找的公式specials = 's',即包含在s表示样条曲线中的术语。

所以

vgt2 = vgam(y~s(x, df=2)+s(z, df=2), data=df,family=gaussianff, trace=TRUE)

会给你你想要的(这比 偏差小vgt1)。

当你适合

vgt2 = vgam(y~cbind(s(x, df=2),s(z, df=2)), data=df,family=gaussianff, trace=TRUE)

terms.formula没有找到任何specials以 开头的s,以及cbind在公式中标识术语的函数。所以

gam(y~cbind(s(x, df=2),s(z, df=2)), data=df,family=gaussianff, trace=TRUE)

相当于

gam(y~cbind(x,y), data=df,family=gaussianff, trace=TRUE)

这相当于

vgam(y~x+z, data=df,family=gaussianff, trace=TRUE)

即没有拟合样条项。

于 2014-02-05T02:22:46.583 回答