0

我有两个磁盘框架,​​每个都有大约 20GB 的文件。

它太大而无法合并为数据表,因为该过程需要的内存超出了我可用的内存。我尝试使用此代码:output <- rbindlist(list(df1, df2))

皱纹是我也想跑步,unique因为我的数据中可能存在重复。

我可以rbindlist在两个磁盘框架上使用相同的代码吗?

4

1 回答 1

2

是的。你只是做rbindlist.disk.frame(list(df1, df2))

我也需要bind_rows在某个时候实施!

于 2020-09-17T02:30:57.090 回答