我想通过在其中一个变量中找到的列表的单个元素group_by
来执行一个重要的、分组和汇总数据框。
df <- data.frame(x = 1:5)
df$y <- list("A", c("A", "B"), "C", c("B", "D", "C"), "E")
df
x y
1 1 A
2 2 A, B
3 3 C
4 4 B, D, C
5 5 E
y
现在按(并说计算行数)分组,这是一个保存元素列表的变量,所需的最终结果应该是:
data.frame(group = c("A", "B", "C", "D", "E"), n = c(2,2,2,1,1))
group n
1 A 2
2 B 2
3 C 2
4 D 1
5 E 1
因为“A”出现在 2 行中,“B”出现在 2 行中,等等。
注意:总和n
不一定等于数据框中的行数。