我在 R 中有一个大型数据集(1M+ 行 x 6 列),我想用它来训练随机森林(使用randomForest
包)用于回归目的。不幸的是,我Error in matrix(0, n, n) : too many elements specified
在尝试一次完成整个事情时遇到错误,并且在数据子集上运行时无法分配足够的内存类型的错误 - 低至 10,000 左右的观察。
看到我不可能在我的机器上添加更多 RAM 并且随机森林非常适合我尝试建模的进程类型,我真的很想完成这项工作。
非常感谢任何建议或解决方法的想法。