34

我想对一列中具有相同值的行求和:

> df <- data.frame("1"=c("a","b","a","c","c"), "2"=c(1,5,3,6,2), "3"=c(3,3,4,5,2))
> df
  X1 X2 X3
1  a  1  3
2  b  5  3
3  a  3  4
4  c  6  5
5  c  2  2

对于一列 (X2),可以聚合数据以获得具有相同 X1 值的所有行的总和:

> ddply(df, .(X1), summarise, X2=sum(X2))
  X1 X2
1  a  4
2  b  5
3  c  8

如何对 X3 和除 X1 之外的任意数量的其他列执行相同操作?

这是我想要的结果:

  X1 X2 X3
1  a  4  7
2  b  5  3
3  c  8  7
4

4 回答 4

30
ddply(df, "X1", numcolwise(sum))

有关详细信息和示例,请参阅?numcolwise

于 2013-02-24T01:45:48.017 回答
25

aggregate可以通过公式界面轻松做到这一点:

aggregate(. ~ X1, data=df, FUN=sum)
##   X1 X2 X3
## 1  a  4  7
## 2  b  5  3
## 3  c  8  7

等效地:

aggregate(cbind(X2, X3) ~ X1, data=df, FUN=sum)
于 2013-02-24T01:48:38.147 回答
6

aggregate对于这些事情来说是一个很好的功能:

aggregate(df[,-1],df["X1"],sum)

  X1 X2 X3
1  a  4  7
2  b  5  3
3  c  8  7

numcolwise以及来自 plyr的方法的基本 R 版本:

aggregate(df[,sapply(df,is.numeric)],df["X1"],sum)
于 2013-02-24T01:47:35.583 回答
5

data.table内存效率和编码优雅的解决方案

library(data.table)
DT <- data.table(df)


DT[, lapply(.SD, sum), by = X1]

.SD是由 的值定义的每个组的 data.table 的子集X1data.table该软件包有 3 个有用的小插曲。

于 2013-02-24T22:46:37.573 回答