这是我遇到的问题。我希望有人能解释为什么
我有一个大型数据集,用于预测原始数据中的分类值 L、M、H。它是一个因素。
训练集很大,所以我没有足够的内存来训练它——所以我从我的训练数据集中抽取了一个样本并创建了一个 randomForest。然后我创建了一个不同的随机样本并创建了第二个森林,....它们都有相似的性能,这是一个值得关注的问题
我在 randomForest 中找到了 combine 函数,并决定用它来组合我的模型。
然后我需要使用新模型对训练集进行评分以获得 OOB 估计值,然后对我的验证样本进行相同的估计。
我对测试集的预测有问题。
我基本上收到一条消息说“eval(expr,envirmenclos)中的错误:找不到对象'XXX'”,其中XXX是变量名。但这没有任何意义,因为变量从未更改过名称
我重做了几次,以防我的数据损坏。
知道为什么我会得到这个吗?