3

我有两个脚本,它们都在R中生成随机森林,据我所知,它们具有相同的输入,尽管我的问题表明情况并非如此。其中一个返回一个重要性表,其中包含

row.names importance.blue importance.red importance.MeanDecreaseAccuracy importance.MeanDecreaseGini

另一个重要性表只包含

row.names   MeanDecreaseGini

这两个森林之间有什么区别,更重要的是,考虑到我认为相同的输入,是什么导致了差异?

(脚本太大,无法粘贴在这里,但两者都试图根据一堆连续变量来预测一个因素)

4

1 回答 1

6

randomForest 的帮助页面告诉我们,重要性(用于分类时)是一个具有 nclass + 2 列的矩阵。第一个 nclass 列是特定于类的度量,计算为准确度的平均下降。nclass + 1st 列是所有类的平均精度下降。最后一列是基尼指数的平均下降。如果importance=FALSE,最后一个度量仍然作为向量返回。

因此,在我看来,您调用 randomForest 一次,重要性 = TRUE,一次调用重要性 = FALSE。

于 2012-07-30T14:06:12.113 回答