1

我正在使用 randomForest 来找出最重要的变量。我期待一些输出来定义模型的准确性,并根据变量的重要性对变量进行排名。但我现在有点困惑。我尝试了 randomForest,然后运行importance()以提取变量的重要性。但是后来我看到了另一个命令rfcv(用于特征选择的随机森林交叉验证),我想这应该是最适合这个目的的,但我对此的问题是:如何获取最重要变量的列表?运行后如何查看输出?使用哪个命令?

randomForest另一件事:和有什么区别predict.randomForest

我对随机森林和 R 不是很熟悉,因此我们将不胜感激。

先感谢您!

4

1 回答 1

4

randomForest创建模型后,您predict.randomForest可以使用在新数据上创建的模型,例如使用训练数据构建随机森林,然后通过该模型运行验证数据predict.randomForest

至于 rfcv 有一个选项recursive(来自帮助):

在变量减少的每个步骤中是否(重新)评估变量重要性

全部在帮助文件中

于 2012-07-11T15:02:46.140 回答