r - 内存不足文件的汇总统计信息

翻译自：https://stackoverflow.com/questions/65743234 2021-01-15T20:38:29.287

37 次

我有一个 120GB 大小的 csv 文件，它是一组按分类变量分组的数值。

例如。

df<-as.data.frame(x=rbing(rep("BLO",100),rep("LR",100)), y=runif(200))

我想使用 group_by(x) 计算一些汇总统计信息，但我的文件不适合内存。我有哪些选择？我看过 tidyfst 和 {disk.frame} 但我不确定。任何帮助将非常感激。

谢谢你。

0 回答 0