2

我刚刚从caretto切换到mlr我目前正在处理的特定问题。我想知道这里是否有人熟悉在resample()函数中指定自定义性能度量。

这是一个可重现的代码示例:

library(mlr)
library(mlbench)

data(BostonHousing, package = "mlbench")

task_reg1  <- makeRegrTask(id = "bh", data = BostonHousing, target = "medv")
lrn_reg1   <- makeLearner(cl = "regr.randomForest",
                        predict.type = "response",
                        mtry=3) 
cv_reg1 <- makeResampleDesc("RepCV", folds = 5, reps = 5)

regr_1 <- resample(learner = lrn_reg1,
                     task = task_reg1,
                     resampling = cv_reg1,
                     measures = mlr::rmse)

我不想计算 RMSE,而是想计算平均绝对比例误差MASE。例如,可以在Metrics包中找到用于此目的的函数:Metrics::mase().

我试图measures = Metrics::mase直接在resample()通话中包含,但正如预期的那样,有点乐观,我收到以下错误: Error in checkMeasures(measures, task) : Assertion on 'measures' failed: Must be of type 'list', not 'closure'.

我发现mlr包中有一个用于创建自定义性能指标的函数,称为makeMeasure()( https://rdrr.io/cran/mlr/man/makeMeasure.html )。我试着用它做一些试验,但没有成功。我在修改定制功能方面没有太多经验,所以我希望这里有人可以帮助我,或者为这样的东西提供一些资源。

干杯!

4

1 回答 1

5

您需要构造一个可以在其中应用的函数,makeMeasure()其形式为function(task, model, pred, extra.args)。我们可以只写一个包装器,Metrics::mase()这样你就可以在 中使用这个函数resample(),你可以对你找到的任何其他指标做同样的事情。

mase_fun <- function(task, model, pred, feats, extra.args) {
  Metrics::mase(pred$data$truth, pred$data$response, step_size = extra.args$step_size)
}

mase_measure <- makeMeasure(id = "mase", 
                            minimize = T,
                            properties = c("regr", "req.pred", "req.truth"),
                            fun = mase_fun,
                            extra.args = list(step_size = 1))

resample(learner = lrn_reg1,
         task = task_reg1,
         resampling = cv_reg1,
         measures = mase_measure)
于 2020-04-27T15:53:50.403 回答