r - 'randomForest'的'caret'中的递归特征消除：为第一个森林设置不同的ntree参数

Question

我目前正在尝试使用递归特征消除 (RFE) 为非常高维数据集 (p > 200k) 优化随机森林分类器。caret包有一个很好的实现（rfe() -function）。但是，我也在考虑优化 RAM 和 CPU 使用率。这就是为什么我想知道是否有机会设置不同（更大）数量的树来训练第一个森林（没有特征消除）并利用它的重要性来构建其余的（使用 RFE）使用例如 500 棵树进行 10 倍或 5 倍交叉验证。我知道这个选项在varSelRF中可用。但是caret怎么样？我没有设法在手册中找到任何关于此的内容。

score 4 · Accepted Answer

你可以这样做。rfFuncs 列表有一个名为 fit 的对象，它定义了模型的拟合方式。此函数的一个参数称为“第一个”，在第一次拟合时为 TRUE（还有一个“最后一个”参数）。您可以基于此设置ntree。

有关更多详细信息，请参阅功能选择插图。

最大限度

r - 'randomForest'的'caret'中的递归特征消除：为第一个森林设置不同的ntree参数

1 回答 1

Related

Reference