虹膜的一个例子。我们有一些数据,称为 tr。
df = iris
set.seed(1)
sp = sample(nrow(iris), 0.7*nrow(iris))
tr = df[sp,]
newdata = df[-sp,]
我们使用我们拥有的数据在 mlr3 中构建模型:
tsk = TaskClassif$new(id="A", backend=tr, target="Species")
lrn = mlr_learners$get("classif.rpart")
train_set <- sample(tsk$nrow, 0.8*tsk$nrow)
test_set <- setdiff(seq_len(tsk$nrow), train_set)
# train the model
lrn$train(tsk, row_ids = train_set)
# predict data
pred <- lrn$predict(tsk, row_ids = test_set)
现在我想用我建立的模型预测 newdata,但我只找到row_ids作为预测的参数。newdata 数据集在 tsk 中没有 row_ids。我知道我可以将这些数据合并到模型中并重新训练。但我的问题是:有没有办法在不重新训练 tsk 的情况下进行预测?
谢谢!