我有一个数据框,我想创建一个新列,给出按因子分组的数值变量的总和。所以是这样的:
前:
data1 <- data.frame(month = c(1, 1, 2, 2, 3, 3),
sex = c("m", "f", "m", "f", "m", "f"),
value = c(10, 20, 30, 40, 50, 60))
后:
data2 <- data.frame(month = c(1, 1, 2, 2, 3, 3),
sex = c("m", "f", "m", "f", "m", "f"),
value = c(10, 20, 30, 40, 50, 60),
sum = c(30, 30, 70, 70, 110, 110))
在 Stata 中,您可以egen
很容易地使用命令执行此操作。我已经尝试过聚合函数和 ddply 函数,但它们创建了全新的数据框,我只想在现有的数据框中添加一列。