2

我正在尝试在磁盘框架上执行分组,但出现此错误

序列化错误(数据,node$con):写入与磁盘框架的连接时出错

我想知道是否可以通过更改块的大小来解决这个问题。这似乎表明我的块太大而无法处理(我的文件有 16 个块)。我正在考虑用 30 个块重新创建磁盘帧,每个块都小得多,然后再次尝试使用我的聚合。具体来说,聚合正在做n_distinct.

那个听起来是对的吗?

4

1 回答 1

0

您使用的是 data.table 语法吗?只需使用 dplyr 语法。见https://stackoverflow.com/a/63929173/239923

于 2020-09-17T02:42:49.267 回答