我目前正在尝试使用递归特征消除 (RFE) 为非常高维数据集 (p > 200k) 优化随机森林分类器。caret包有一个很好的实现(rfe() -function)。但是,我也在考虑优化 RAM 和 CPU 使用率。这就是为什么我想知道是否有机会设置不同(更大)数量的树来训练第一个森林(没有特征消除)并利用它的重要性来构建其余的(使用 RFE)使用例如 500 棵树进行 10 倍或 5 倍交叉验证。我知道这个选项在varSelRF中可用。但是caret怎么样?我没有设法在手册中找到任何关于此的内容。
问问题
2464 次