我有以下有点大的数据集:
> dim(dset)
[1] 422105 25
> class(dset)
[1] "data.frame"
>
不做任何事情,R 进程似乎需要大约 1GB 的 RAM。
我正在尝试运行以下代码:
dset <- ddply(dset, .(tic), transform,
date.min <- min(date),
date.max <- max(date),
daterange <- max(date) - min(date),
.parallel = TRUE)
运行该代码,RAM 使用量猛增。它完全饱和了 60GB 的 RAM,在 32 核机器上运行。我究竟做错了什么?