0

我有一个 120GB 大小的 csv 文件,它是一组按分类变量分组的数值。

例如。

df<-as.data.frame(x=rbing(rep("BLO",100),rep("LR",100)), y=runif(200))

我想使用 group_by(x) 计算一些汇总统计信息,但我的文件不适合内存。我有哪些选择?我看过 tidyfst 和 {disk.frame} 但我不确定。任何帮助将非常感激。

谢谢你。

4

0 回答 0