1

如何将group_by+的结果应用/设置summarize为该组所有观察的新变量?

假设我有tibble如下类似:

foo <- tribble(
    ~x, ~y, 
     1, 1, 
     1, 5, 
     1, 2,  
     2, 1, 
     2, 7, 
     2, 3)

x表示组,y变量。
我知道我可以max通过foo %>% group_by(x) %>% summarize(max(y)).

我现在如何将此结果设置为整个组的新列?
即导致

~x, ~y, ~max-y
 1,  1,  5
 1,  5,  5
 1,  2,  5
 2,  1,  7
 2,  7,  7
 2,  3,  7
4

1 回答 1

2

可以简单地在 group by 之后使用 mutate 并指定函数:

foo %>%
  group_by(x) %>%
  mutate(max_y = max(y))
#output:
# A tibble: 6 x 3
# Groups:   x [2]
      x     y max_y
  <dbl> <dbl> <dbl>
1     1     1     5
2     1     5     5
3     1     2     5
4     2     1     7
5     2     7     7
6     2     3     7
于 2017-11-30T08:32:06.023 回答