r - R中的randomForest：是否有可能计算案例置信区间？

Question

R 包randomForest报告森林中每棵树的均方误差。但是，我需要对数据中每个案例的置信度进行衡量。由于randomForest通过平均单个树的预测来计算个案预测，我想它也应该可以计算个案标准误差，从而计算置信区间。这可以使用输出的 randomForest 对象来完成（如果是这样：如何？）还是我必须深入研究源代码？

score 7 · Accepted Answer

无需深入研究源代码。您只需要阅读文档。?predict.randomForest声明其论点之一被称为predict.all：

predict.all 是否应该保留所有树的预测？

因此，将其设置为TRUE将为每个案例、每棵树保留一个预测，然后您可以使用它来计算每个案例的标准误差。

我最近了解到 Stefan Wager、Trevor Hastie 和 Brad Efron 的这篇论文，该论文更严格地研究了随机森林（和其他袋装预测器）生成的预测的标准误差的概念。

r - R中的randomForest：是否有可能计算案例置信区间？

1 回答 1

Related

Reference