在一些分类任务中,使用mlr
包,我需要处理一个data.frame
类似于这个的:
set.seed(pi)
# Dummy data frame
df <- data.frame(
# Repeated values ID
ID = sort(sample(c(0:20), 100, replace = TRUE)),
# Some variables
X1 = runif(10, 1, 10),
# Some Label
Label = sample(c(0,1), 100, replace = TRUE)
)
df
我需要交叉验证模型,将值保持在一起ID
,我从教程中知道:
https://mlr-org.github.io/mlr-tutorial/release/html/task/index.html#further-settings
我们可以在任务中包含一个阻塞因素。这将表明某些观察结果“属于一起”,并且在将数据拆分为训练集和测试集以进行重采样时不应分开。
问题是如何将这个阻塞因素包含在makeClassifTask
?
不幸的是,我找不到任何例子。