3

我是 R 新手。这是我的具体问题。假设我正在使用以下名为“data”的数据集,用于此示例。我的标题是state,typevalue.

structure(list(state = structure(c(1L, 1L, 1L, 1L, 2L, 2L), .Label = c("AK", 
"AL"), class = "factor"), type = structure(c(2L, 2L, 1L, 1L, 
2L, 1L), .Label = c(" D", " R"), class = "factor"), value = c(100L, 
200L, 100L, 150L, 100L, 150L)), .Names = c("state", "type", "value"
), class = "data.frame", row.names = c(NA, -6L))



  state type value
1    AK    R   100
2    AK    R   200
3    AK    D   100
4    AK    D   150
5    AL    R   100
6    AL    D   150

我想编写一个函数,将每种类型和状态的值相加。例如。对于AK类型R,输出为 300。对于AK类型D,输出为 250。对于AL类型R,输出为 100,对于AL类型D,输出为 150。

4

5 回答 5

7

不是plyr,只是aggregate

> aggregate(value~state+type, data=data,FUN=sum)
  state type value
1    AK    D   250
2    AL    D   150
3    AK    R   300
4    AL    R   100
于 2012-12-30T00:25:23.203 回答
5

你可以使用tapply

data <- read.csv(header=TRUE,text="state, type, value
AK, R, 100
AK, R, 200
AK, D, 100
AK, D, 150
AL, R, 100
AL, D, 150")

tapply(data$value, list(data$state,data$type), sum)
#     D   R
# AK  250 300
# AL  150 100
于 2012-12-30T00:24:23.700 回答
5

尽管@Matthew Lundberg 的回答是最好的,但这里有一些替代方案。

如果你真的想使用 plyr 你可以这样做:

ddply(DF, .(state, type), numcolwise(sum))
  state type value
1    AK    D   250
2    AK    R   300
3    AL    D   150
4    AL    R   100

这是使用 reshape2 包的另一个解决方案

library(reshape2)
dcast( melt(DF), state + type ~ variable, sum)
Using state, type as id variables
  state type value
1    AK    D   250
2    AK    R   300
3    AL    D   150
4    AL    R   100

如果您只想要一个向量,那么这可能很有用:

sapply(with(DF, split(value, list(state, type))), sum)
AK.D  AL.D  AK.R  AL.R 
250   150   300   100 
于 2012-12-30T00:36:19.920 回答
3

一个 plyr 解决方案是:

ddply(data, .(state,type),summarise, total=sum(value, na.rm = TRUE))
#   state type total
# 1    AK    D   250
# 2    AK    R   300
# 3    AL    D   150
# 4    AL    R   100
于 2012-12-30T00:34:16.757 回答
3

为了完整起见,还有“data.table”包,by在基础 R 中。假设您的数据集称为“myd”:

by(myd$value, list(myd$state, myd$type), FUN=sum)
# : AK
# :  D
# [1] 250
# ------------------------------------------------------------------------------ 
# : AL
# :  D
# [1] 150
# ------------------------------------------------------------------------------ 
# : AK
# :  R
# [1] 300
# ------------------------------------------------------------------------------ 
# : AL
# :  R
# [1] 100

library(data.table)
DT <- data.table(myd)
DT[, sum(value), by = "state,type"]
#    state type  V1
# 1:    AK    R 300
# 2:    AK    D 250
# 3:    AL    R 100
# 4:    AL    D 150
于 2012-12-30T10:07:01.220 回答