r - randomForest 的重要性只包含 MeanDecreaseGini

Question

我有两个脚本，它们都在R中生成随机森林，据我所知，它们具有相同的输入，尽管我的问题表明情况并非如此。其中一个返回一个重要性表，其中包含

row.names importance.blue importance.red importance.MeanDecreaseAccuracy importance.MeanDecreaseGini

另一个重要性表只包含

row.names   MeanDecreaseGini

这两个森林之间有什么区别，更重要的是，考虑到我认为相同的输入，是什么导致了差异？

（脚本太大，无法粘贴在这里，但两者都试图根据一堆连续变量来预测一个因素）

score 6 · Accepted Answer

randomForest 的帮助页面告诉我们，重要性（用于分类时）是一个具有 nclass + 2 列的矩阵。第一个 nclass 列是特定于类的度量，计算为准确度的平均下降。nclass + 1st 列是所有类的平均精度下降。最后一列是基尼指数的平均下降。如果importance=FALSE，最后一个度量仍然作为向量返回。

因此，在我看来，您调用 randomForest 一次，重要性 = TRUE，一次调用重要性 = FALSE。

r - randomForest 的重要性只包含 MeanDecreaseGini

1 回答 1

Related

Reference