r - （在R中）如何根据B列排列A列

Question

我有一个这样的数据框：

工厂	面包
一个	一个
一个	一个
乙	C
乙	b
乙	d
C	一个
D	e

我想找到面包数量最多的工厂的名字

我写了两个代码，得到了不同的答案。

1.

df %>%
  group_by(factory, bread)%>%
  summarise(n = n())%>%
  arrange(desc(n))

df %>% 
  group_by(factory) %>% 
  mutate(number = length(unique(bread)))%>% 
  arrange(desc(number))

请问哪一个是正确的代码，为什么？

谢谢！！！！

score 3 · Accepted Answer

我们可以n_distinct从dplyr包中使用：

library(dplyr)
df %>%
    group_by(factory)%>%
    summarise(bread = n_distinct(bread))

输出：

  factory bread
  <chr>   <int>
1 A           2
2 B           1
3 C           1

score 1 · Accepted Answer

一个data.table选项

> setorder(setDT(df)[, .(Bread = uniqueN(Bread)), Factory], -Bread)[]
   Factory Bread
1:       B     3
2:       A     1
3:       C     1
4:       D     1

r - （在R中）如何根据B列排列A列

2 回答 2

Related

Reference