1

我目前正在尝试使用递归特征消除 (RFE) 为非常高维数据集 (p > 200k) 优化随机森林分类器。caret包有一个很好的实现(rfe() -function)。但是,我也在考虑优化 RAM 和 CPU 使用率。这就是为什么我想知道是否有机会设置不同(更大)数量的树来训练第一个森林(没有特征消除)并利用它的重要性来构建其余的(使用 RFE)使用例如 500 棵树进行 10 倍或 5 倍交叉验证。我知道这个选项在varSelRF中可用。但是caret怎么样?我没有设法在手册中找到任何关于此的内容。

4

1 回答 1

4

你可以这样做。rfFuncs 列表有一个名为 fit 的对象,它定义了模型的拟合方式。此函数的一个参数称为“第一个”,在第一次拟合时为 TRUE(还有一个“最后一个”参数)。您可以基于此设置ntree。

有关更多详细信息,请参阅功能选择插图。

最大限度

于 2012-11-12T03:25:07.690 回答