我正在尝试计算我拥有的数据文件的摘要统计信息。我看过几篇关于类似主题的文章,但它们并没有完全回答我的问题。数据文件包含敏感材料,所以我不想分享它。但我将使用 plyr 中的棒球数据集来演示我正在尝试做的事情。
我正在尝试计算汇总统计数据表,其中一个统计数据需要对因子变量的唯一元素进行计数。因此,例如,如果我们使用棒球包,我将如何查找每个球员曾效力过多少支球队并将其附加到数据集的其余部分(数据集的其余部分是我在每玩家基础)?
ddply(baseball, "id", summarise, total_games=sum(g),
still_active=ifelse(max(year) == 2007,"Yes","No"),
number_teams=as.data.frame(
with(baseball[!duplicated(baseball$team)],table(id))))
上面是一个例子,最后一个参数是我正在努力的那个。我如何找到每个球员参加过的球队数量?我一直在尝试使用 as.data.frame(table())
,但没有成功。