random-forest - 使用 MLR 包进行超参数调整

Question

我想使用 MLR 包调整随机森林的超参数。我有几个问题：

1）我如何决定我应该调整哪些参数？我听说过保持 num.trees 在计算上尽可能高并调整 mtry？（虽然我在网上找不到任何支持这一点的东西）

2) 我的调整 mtry 范围应该是多少？这里是参数的 0 到 1/3 之间的一个好的经验法则吗？如果是这样，如果我有不同的数据集（即，我会写什么而不是 lower=0 和 upper =10），我将如何将其集成到下面的代码中？

3）最后，两次创建学习器是否有意义，一次使用 makeLearner 函数，我在 par.vals 中设置参数，然后一次使用 makeTuneWrapper 函数？无论如何它不会覆盖它吗？

learnerRF = makeLearner("regr.ranger", par.vals = list("num.trees" = 5000)) 
parsRF = makeParamSet(
  makeIntegerParam("mtry", lower = 0 , upper = 10), 
)
tuneRF = makeTuneControlGrid() 
inner = makeResampleDesc("CV", iters = 10)
learnerRF = makeTuneWrapper(learnerRF, resampling = inner, par.set = parsRF,control = tuneRF, show.info = FALSE)

score 3 · Accepted Answer

您可以查看这两篇论文，它们试图回答您的问题：

http://jmlr.org/papers/v18/17-269.html

https://arxiv.org/abs/1804.03515

tuneRanger 是一个专门用于在 R 中调整随机森林的软件包。

score 1 · Accepted Answer

1 和 2 的答案是相同的 - 尽可能多地计算，即使参数的数量及其范围尽可能大。通过考虑最大数量的配置选项，这将提供最大可能的收益。

关于 3，您不必在调用之前创建一个单独的学习makeTuneWrapper()器（并且在那里设置您稍后调整的参数没有任何意义）。您可以像这样一步完成这两项工作：

learnerRF = makeTuneWrapper("regr.ranger", resampling = inner, par.set = parsRF, 
                            control = tuneRF, show.info = FALSE)

random-forest - 使用 MLR 包进行超参数调整

2 回答 2

Related

Reference