我对我的简单但有点大的数据集有聚类需求。它有 3 列和大约 120k 行,而且所有数据都是数字。我尝试使用 rpart 但得到了这个可爱的错误。
Error in rep(1, numclass^2) : invalid 'times' argument
In addition: Warning message:
In matrix(rep(1, numclass^2) - diag(numclass), numclass) :
NAs introduced by coercion
该功能也没有古怪的东西。
fit<-rpart(respVar ~ Var1 + Var2, data=varData, method="class")
我对 1k 行没有问题。它在 10k 行中有点慢,但仍然有效。数据集中没有 NA 值。目前在 Macbook Air 上尝试,但也会在 Mac Mini 上尝试。
我怀疑这是内存问题,但警告信息与我有关。是否有一些解决方法可以使集群工作?