我在 R 中有一个如下所示的数据框:
team id name
1 2335 Victor
1 379 Marc
1 4484 Newton
2 51 AZRIA
2 379 Marc
2 552 Steve
2 1674 Miu
2 1688 Moschi
编辑以更清楚:
- 假设给定团队 1,我如何返回团队 1 的所有 ID?
- 我应该使用 for 循环遍历所有团队吗?
我在 R 中有一个如下所示的数据框:
team id name
1 2335 Victor
1 379 Marc
1 4484 Newton
2 51 AZRIA
2 379 Marc
2 552 Steve
2 1674 Miu
2 1688 Moschi
编辑以更清楚:
这将为您提供每个团队作为列表中的单独数据框:
split(df, df$team)
听起来您的id
和name
变量没有变化(即,id
基本name
相同)。在这种情况下,要找到最常见的id
or name
,只需使用table
(可能是sort
-ed):
sort(table(df$id), decreasing=TRUE)
sort(table(df$name), decreasing=TRUE)
您可能还想要将两者结合起来:
sort(with(df, table(paste(id,name))),decreasing=TRUE)