我有一个数据框df
,其中的行对于名称列是重复的,但对于值列不重复:
name value etc1 etc2
A 9 1 X
A 10 1 X
A 11 1 X
B 2 1 Y
C 40 1 Y
C 50 1 Y
我需要将重复的名称聚合到一行中,同时计算值列的平均值。预期输出如下:
name value etc1 etc2
A 10 1 X
B 2 1 Y
C 45 1 Y
我曾尝试使用df[duplicated(df$name),]
,但当然这并没有给我提供重复项的平均值。我想使用aggregate()
,但问题是该函数的 FUN 部分也将适用于所有其他列,除其他问题外,它无法计算 char 内容。由于所有其他列在“重复项”上具有相同的内容,因此我需要将它们聚合起来,就像名称列一样。任何提示...?