我正在尝试将一个月的数据(200k)行附加到已经有 16m 行的 data.frame 中,并且我的系统达到了 R 内存限制:
d = rbind(d, n)
Error: cannot allocate vector of size 60.8 Mb
In addition: Warning messages:
1: In rbind(deparse.level, ...) :
Reached total allocation of 8072Mb: see help(memory.size)
memory.size
并memory.max
分别报告 2187.88 和 8072,所以我想我正在使用我所有的 8GB 系统内存。使用JD Long 在这个问题中详述的对象内存报告功能,我得到以下报告:
Type Size Rows Columns
d data.table 2,231,877,576 15941535 26
files character 912 13 NA
i numeric 48 1 NA
n data.frame 28,176,000 213116 26
是否有另一种方法可以附加到 data.frame 而不需要似乎正在发生的明显对象重复并占用内存?我热衷于避免附加到 csv 文件,因为我正在使用 .RData 保存的对象以更快地读取数据。