2

我有一个维度为 2000 万条记录和 50 列的数据集。现在我想将此数据集加载到 R 中。我的机器 RAM 大小为 8 GB,我的数据集大小为 35 GB。我必须在完整数据上运行我的 R 代码。到目前为止,我尝试了 data.table(fread)、bigmemory(read.big.matrix) 包来读取该数据但没有成功。是否可以将 35 GB 数据加载到我的机器(8 GB)中?

如果可能,请指导我如何克服这个问题?

提前致谢。

4

1 回答 1

3

通过购买更多内存。即使您设法加载所有数据(似乎是文本数据),内存中也不会留下任何空间来执行您想要对数据执行的任何操作。

如果您必须一次将所有内容加载到 RAM 中,这实际上可能是唯一正确的答案。您可能不必这样做,但即便如此,购买更多 RAM 可能会更容易。

查看云计算选项,例如AzureAWSGoogle Compute Engine

于 2015-02-20T10:13:34.327 回答