我正在尝试在磁盘框架上执行分组,但出现此错误
序列化错误(数据,node$con):写入与磁盘框架的连接时出错
我想知道是否可以通过更改块的大小来解决这个问题。这似乎表明我的块太大而无法处理(我的文件有 16 个块)。我正在考虑用 30 个块重新创建磁盘帧,每个块都小得多,然后再次尝试使用我的聚合。具体来说,聚合正在做n_distinct
.
那个听起来是对的吗?
我正在尝试在磁盘框架上执行分组,但出现此错误
序列化错误(数据,node$con):写入与磁盘框架的连接时出错
我想知道是否可以通过更改块的大小来解决这个问题。这似乎表明我的块太大而无法处理(我的文件有 16 个块)。我正在考虑用 30 个块重新创建磁盘帧,每个块都小得多,然后再次尝试使用我的聚合。具体来说,聚合正在做n_distinct
.
那个听起来是对的吗?
您使用的是 data.table 语法吗?只需使用 dplyr 语法。见https://stackoverflow.com/a/63929173/239923