4

我玩过dplyr一点,真的很喜欢。我错过了一些东西。在plyr中,我能够将函数传递给ddply并重用它。

library('dplyr')
library('plyr')

fn = function(df) {
    summarise(df,
        count = length(id))
}

ddply(DF1,'group', fn)
ddply(DF2,'group', fn)

因此,我可以将一长串录音应用到多个数据集,而无需将所有参数复制到summarise. 但是dplyr,我必须这样做

dplyr::summarise(group_by(DF1,group),
    count = length(id))
dplyr::summarise(group_by(DF2,group),
    count = length(id))

summarise因此,每次都必须重复这些论点。带有list('.data'=DF1,'count'=length(id))and的参数列表do.call也不起作用,因为length(id)在我定义参数列表时会对其进行评估。有什么解决方案吗?

4

2 回答 2

8

我喜欢@RomanLustrik 的回答,所以这是dplyr他回答的 100% 方法。

do(mylist, function(df)
   df %.%
   group_by(b) %.%
   summarise(count = n()))

## [[1]]
## Source: local data frame [2 x 2]

##   b count
## 1 b     5
## 2 a     5

## [[2]]
## Source: local data frame [2 x 2]

##   b count
## 1 b     5
## 2 a     5

在这个答案中,我只是尝试复制 Roman 的方法,但您可以重用您的函数 (fn) :

fn <- function(df) {
    summarise(df,
        count = n())
}

group_by(df1, b) %.% fn()
## Source: local data frame [2 x 2]

##   b count
## 1 b     5
## 2 a     5

group_by(df2, b) %.% fn()
## Source: local data frame [2 x 2]

##   b count
## 1 b     5
## 2 a     5

你甚至可以像这样包裹它

do(list(df1, df2), function(df) group_by(df, b) %.% fn())
于 2014-01-20T06:15:32.753 回答
3

这就是你所追求的吗?

df1 <- df2 <- data.frame(a = runif(10), b = rep(c("a", "b"), each = 5))

library(dplyr)

mylist <- list(df1, df2)
lapply(mylist, FUN = function(x) {
  dplyr::summarise(group_by(x, b),
                   count = length(b))
})
[[1]]
Source: local data frame [2 x 2]

  b count
1 a     5
2 b     5

[[2]]
Source: local data frame [2 x 2]

  b count
1 a     5
2 b     5
于 2014-01-19T14:34:28.777 回答