r - 如何在 R 中同时汇总数值和因子水平值

Question

我试图通过在一个列（F1）上分组并获取其他列的平均值来总结数据集，除了其他列在数字和因子级别之间拆分。我可以使用 ddply 来总结 F2 数值，但不知道如何对 F3 中的因子水平做同样的事情。我试图按组捕获最重复的因子水平，但这不起作用。

可重现的例子

library(plyr)
set.seed(37)
df<-data.frame("F1"=rep(LETTERS[1:5],each = 3),
               "F2"= 1:15,
               "F3"= sample(c("Yes","No"), 15, replace=TRUE))
df2 <- ddply(df,~F1,summarise,
                     mF2=mean(F2),
                     mF3=tail(names(sort(table(df$F3))), 1))
> df
   F1 F2  F3
1   A  1  No
2   A  2 Yes
3   A  3  No
4   B  4 Yes
5   B  5  No
6   B  6  No
7   C  7 Yes
8   C  8 Yes
9   C  9 Yes
10  D 10 Yes
11  D 11 Yes
12  D 12  No
13  E 13 Yes
14  E 14 Yes
15  E 15  No
> df2
  F1 mF2 mF3
1  A   2 Yes
2  B   5 Yes
3  C   8 Yes
4  D  11 Yes
5  E  14 Yes

相反，df2 应该如下所示：

> df2
  F1 mF2 mF3
1  A   2 No
2  B   5 No
3  C   8 Yes
4  D  11 Yes
5  E  14 Yes

如果显示如何，我很想尝试使用 dplyr 或其他方法。

score -1 · Accepted Answer

我们可以使用类似的选项dplyr

library(dplyr)
df %>% 
  group_by(F1) %>% 
  summarise(mF2 = mean(F2), mF3 = tail(names(sort(table(F3))),1))

r - 如何在 R 中同时汇总数值和因子水平值

1 回答 1

Related

Reference