我正在尝试对类变量为二进制(1 或 0)的一些数据进行随机森林。这是我正在运行的代码:
forest.model <- randomForest(x = ticdata2000[,1:85], y = ticdata2000[,86],
ntree=500,
mtry=9,
importance=TRUE,
norm.votes=TRUE,
na.action=na.roughfix,
replace=FALSE,
)
但是当森林走到尽头时,我收到以下错误:
Warning message:
In randomForest.default(x = ticdata2000[, 1:85], y = ticdata2000[, :
The response has five or fewer unique values. Are you sure you want to do regression?
答案当然是不。我不想做回归。我有一个单独的离散变量,它只包含 2 个类。当然,当我使用这个模型进行预测时,我会得到连续的数字,而我想要一个 0 和 1 的列表。有人能告诉我我做错了什么来使用回归而不是分类吗?