我有两个磁盘框架,每个都有大约 20GB 的文件。
它太大而无法合并为数据表,因为该过程需要的内存超出了我可用的内存。我尝试使用此代码:output <- rbindlist(list(df1, df2))
皱纹是我也想跑步,unique
因为我的数据中可能存在重复。
我可以rbindlist
在两个磁盘框架上使用相同的代码吗?
我有两个磁盘框架,每个都有大约 20GB 的文件。
它太大而无法合并为数据表,因为该过程需要的内存超出了我可用的内存。我尝试使用此代码:output <- rbindlist(list(df1, df2))
皱纹是我也想跑步,unique
因为我的数据中可能存在重复。
我可以rbindlist
在两个磁盘框架上使用相同的代码吗?