0

我有一个大数据框。我需要找到特定列的所有行的总和,但重复项只计算一次。例如,

考虑以下数据框:

z = data.frame(id = c(16249, 16249, 16250, 16251), value = c(1, 1, 2, 3))

   id     value
1 16249     1
2 16249     1
3 16250     2
4 16251     3

我需要找到列“value”的所有行的总和,但重复的“id”只计算一次。所以,在上面的例子中,答案应该是:1+2+3 = 6(对应id 16249、16250和16251)。

谢谢!

4

1 回答 1

3

?duplicated

sum(with(z, value[!duplicated(id)]))
于 2013-08-13T07:34:01.053 回答