1

task <- TaskRegr$new("data", data, "y") 是否可以使用过滤器或管道删除任务中的不完整观察mlr3

4

1 回答 1

3

我认为没有用于删除观察的预处理运算符。

我要做的是filter在任务中使用方法。

例子:

t = tsk("pima")
ids = complete.cases(t$data())

# number of incomplete observations
sum(!ids)

t$filter(which(ids))

# number of incomplete observations
# should be zero now
ids = complete.cases(t$data())
sum(!ids)

complete.cases给出一个布尔向量,指示哪些行包含完整的观测值(没有 NA). filter通过参数中提供的行 ID 子集任务的数据。参数中未给出的行 ID 将被原地删除。

如果您想对不完整的观察值进行插补,可以使用一些插补运算符,例如 PipeOpImputeConstant,它们通过常数来插补特征。

于 2020-10-10T04:38:05.237 回答