1

我将数据集溢出到训练和测试中,如下所示:

splitdata<-split(sb[1:nrow(sb),], sample(rep(1:2, as.integer(nrow(sb)/2))))
test<-splitdata[[1]]
train<-rbind(splitdata[[2]])

sb 是原始数据集的名称,所以是 50/50 train and test。

然后我使用训练集安装了一个 glm。

fitglm<-  glm(num_claims~year+vt+va+public+pri_bil+persist+penalty_pts+num_veh+num_drivers+married+gender+driver_age+credit+col_ded+car_den, family=poisson, train)

现在我想使用这个 glm 进行预测,比如接下来的 10 个观察结果。

我无法在 predict() 中指定新数据,

我试过了:

pred<-predict(fitglm,newdata=data.frame(train),type="response", se.fit=T)

这将给出与训练集中样本数相等的预测数。

最后,如何用置信区间绘制这些预测?

感谢您的帮助

4

1 回答 1

5

如果你问如何构建测试集中接下来 10 个的预测,那么:

pred10<-predict(fitglm,newdata=data.frame(test)[1:10, ], type="response", se.fit=T) 
于 2013-12-02T21:39:20.540 回答