我收到“新数据中的预测变量类型与训练数据中的预测变量类型不匹配”的错误消息。
这让我很困惑,因为我能够在 rpart 和 ctree 下获得相同的数据集。这些函数足够方便地报告导致错误的因素,因此很容易调试。现在我不确定我的许多维度中的哪些因素导致了问题。
有没有一种简单的方法可以知道哪些列/变量正在抛出 randomForest?
物有所值:
> write.csv(predict(object=train_comp.rp, newdata = test_w_age, type = c("prob")), file="test_predict_rp_w_age.csv")
> write.csv(predict(object=train_comp.rf, newdata = test_w_age, type = c("prob")), file="test_predict_rf_w_age.csv")
Error in predict.randomForest(object = train_comp.rf, newdata = test_w_age, : Type of predictors in new data do not match that of the training data.