3

tl; dr
如何从多列上拆分乘法器进行“分区”?

动机:
我不满意使用 32 个内核中的 1 个进行辛勤总结,所以我尝试使用multi-dplyer 我在多个列上运行。

示例:
小插图显示按单列分组,但是当我这样做时,不考虑我的其他分组列。

代码:

library(dplyr)
library(multidplyr)
library(nycflights13)

flights1 <- partition(flights, flight)
flights2 <- summarise(flights1, dep_delay = mean(dep_delay, na.rm = TRUE))
flights3 <- collect(flights2)

那么如何按年、月和日拆分呢?

这对我不起作用:

flights1 <- partition(flights, list(year, month, day))
flights2 <- summarise(flights1, dep_delay = mean(dep_delay, na.rm = TRUE))
flights3 <- collect(flights2)

我似乎无法完成这项工作。你能指出一个适当的或至少有效的方法吗?

4

1 回答 1

1

根据?partition, 的用法partition

partition(.data, ..., cluster = get_default_cluster())

...要分区的变量在哪里。不是传入变量列表,而是分别传入每个变量,即

partition(flights, year, month, day)
于 2017-12-21T23:01:20.940 回答