当您使用group_by
多个变量时,dplyr
有助于找到这些组的交集。
例如,
mtcars %>%
group_by(cyl, am) %>%
summarise(mean(disp))
产量
Source: local data frame [6 x 3]
Groups: cyl [?]
cyl am `mean(disp)`
<dbl> <dbl> <dbl>
1 4 0 135.8667
2 4 1 93.6125
3 6 0 204.5500
4 6 1 155.0000
5 8 0 357.6167
6 8 1 326.0000
我的问题是,有没有办法提供多个变量,但要稍微总结一下?如果您手动执行此操作,我希望输出与您得到的输出一样,逐个变量。
df_1 <-
mtcars %>%
group_by(cyl) %>%
summarise(est = mean(disp)) %>%
transmute(group = paste0("cyl_", cyl), est)
df_2 <-
mtcars %>%
group_by(am) %>%
summarise(est = mean(disp)) %>%
transmute(group = paste0("am_", am), est)
bind_rows(df_1, df_2)
上面的代码产生
# A tibble: 5 × 2
group est
<chr> <dbl>
1 cyl_4 105.1364
2 cyl_6 183.3143
3 cyl_8 353.1000
4 am_0 290.3789
5 am_1 143.5308
理想情况下,语法类似于
mtcars %>%
group_by(cyl, am, intersection = FALSE) %>%
summarise(est = mean(disp))
中是否存在类似的东西tidyverse
?
(ps,我知道上group
表中的变量并不整洁,因为它包含两个变量合二为一,但我保证为了我的目的它是整洁的,好吗?:))