定义
df<-read.table(textConnection('egg 1 20 a
egg 2 30 a
jap 3 50 b
jap 1 60 b'))
英石
> df
V1 V2 V3 V4
1 egg 1 20 a
2 egg 2 30 a
3 jap 3 50 b
4 jap 1 60 b
我的数据没有因子,所以我将因子转换为字符:
> df$V1 <- as.character(df$V1)
> df$V4 <- as.character(df$V4)
我想通过 V1 保持“折叠”数据框:
- V2的最大值
- V3 的平均值
- V4 的模式(这个值在 V1 组中实际上并没有改变,所以 first、last 等也可能会改变。)
请注意,这是一个普遍的问题,例如我的数据集要大得多,并且在折叠时我可能想要使用不同的函数(例如,last、first、min、max、variance、st.dev. 等用于不同的变量)。因此,函数参数可能会很长。
在这种情况下,我想要以下形式的输出:
> df.collapse
V1 V2 V3 V4
1 egg 2 25 a
2 jap 3 55 b