2

我有一个有点愚蠢的 R 问题。如果我有一个矩阵(或数据框,以更容易使用的为准),例如:

Year  Match
2008   1808
2008 137088
2008      1
2008  56846
2007   2704
2007 169876
2007  75750
2006   2639
2006 193990
2006      2

而且我想将这些年来的每场比赛计数相加(所以,例如 2008 年的行将是2008 195743,我该怎么做呢?我脑子里有一些解决方案,但它们都是不必要的复杂,而且 R 倾向于在某个地方隐藏一些更简单的解决方案。

您可以使用以下命令生成上面相同的矩阵:

structure(c(2008L, 2008L, 2008L, 2008L, 2007L, 2007L, 2007L, 
2006L, 2006L, 2006L, 1808L, 137088L, 1L, 56846L, 2704L, 169876L, 
75750L, 2639L, 193990L, 2L), .Dim = c(10L, 2L), .Dimnames = list(
NULL, c("Year", "Match")))

谢谢你的尽心帮助。

4

3 回答 3

5

aggregate(x = df$Match, by = list(df$Year), FUN = sum),假设df上面是您的数据框。

于 2012-04-18T03:48:58.547 回答
3

您可能还想使用“plyr”包中的“ddply”功能。

# install plyr package
install.packages('plyr')
library(plyr)
# creating your data.frame
foo <- as.data.frame(structure(c(2008L, 2008L, 2008L, 2008L, 2007L, 2007L, 2007L, 
            2006L, 2006L, 2006L, 1808L, 137088L, 1L, 56846L, 2704L, 169876L, 
            75750L, 2639L, 193990L, 2L), .Dim = c(10L, 2L), .Dimnames = list(
              NULL, c("Year", "Match"))))

# here's what you're looking for
ddply(foo,.(Year),numcolwise(sum))

  Year  Match
1 2006 196631
2 2007 248330
3 2008 195743

顺便说一句,2008 年的总和应该是 195743 (1808+137088+1+56846) 而不是 138897 你忘了加 56846。

于 2012-04-18T21:43:13.033 回答
2

如上所述,您可以使用聚合来执行以下操作。但以更简单的方式

aggregate(. ~ Year, df, sum)
#  Year  Match
#1 2006 196631
#2 2007 248330
#3 2008 195743

您也可以使用 Dplyr 来解决这个问题,如下所示

library(dplyr)
df %>% group_by(Year) %>% summarise(Match = sum(Match))
#  Year  Match
#  (int)  (int)
#1  2008 195743
#2  2007 248330
#3  2006 196631
于 2016-04-21T13:40:39.833 回答