11

Hadley 让我开始使用plyr包,我发现自己一直在使用它来做“分组”之类的事情。但我发现自己必须始终重命名结果列,因为它们默认为 V1、V2 等。

这是一个例子:

mydata<-data.frame(matrix(rnorm(144, mean=2, sd=2),72,2),c(rep("A",24),rep("B",24),rep("C",24)))
colnames(mydata) <- c("x_value", "acres",  "state")
groupAcres <- ddply(mydata, c("state"), function(df)c(sum(df$acres)))
colnames(groupAcres) <- c("state","stateAcres")

有没有办法让 ddply 为我命名结果列,以便我可以省略最后一行?

4

2 回答 2

19

使用总结(或总结):

  groupAcres <- ddply(mydata, "state", summarise, 
     myName = sum(acres))
于 2009-09-08T23:52:29.647 回答
11

这似乎有效:

> groupAcres <- ddply(mydata, c("state"), function(df) c(myName=sum(df$acres)))
> groupAcres
  state   myName
1     A 56.87973
2     B 57.84451
3     C 52.82415
于 2009-09-08T18:36:10.643 回答