我的一位同事表示,randomForest()
在非常大的数据集上表现不佳。现在,我只是想弄清楚是否真的如此,但由于数据集无法共享(敏感信息),我想我不妨尝试提出一个大型数据集。我尝试了以下操作,但无法理解错误消息:
library(randomForest)
data(iris)
dataFile <- iris
newdataFile <- dataFile[sample(dataFile, size= 1:1000000000, replace=T),]
错误信息:
Error in xj[i] : invalid subscript type 'list'
有人可以在这里指导我吗?