我想应用随机森林方法来预测患者在医院的等待时间。我严格按照https://www.tidymodels.org/start/case-study/上的说明调整我的模型。获得最佳模型后,我last_rf_workflow
按照上面链接中的说明创建对象。
last_rf_workflow <-
Data_rf_wflow %>%
update_model(last_rf_mod)
然后,我使用下面的代码来拟合最终模型:
set.seed(345)
last_rf_fit <-
last_rf_workflow %>%
last_fit(data_split)
如此处所述,该last_fit()
函数在整个训练集上拟合模型并计算测试集的预测值。这些预测可以在 访问View(last_rf_fit[[5]][[1]])
。
但是,当我将模型拟合到整个训练集然后使用该predict()
函数时,我得到的预测略有不同:
set.seed(345)
last_rf_fit_2 <-
last_rf_workflow %>%
fit(training(data_split))
predict(last_rf_fit_2, testing(data_split))
我想知道是否有人可以帮助我理解为什么这两个预测不同。谢谢。