我正在使用 进行一些编程dplyr
,并且很好奇如何将表达式作为(特别是MoreArgs
)参数传递给mapply
?
考虑一个简单的函数,它根据 some和 a对 aF
进行子集化,然后根据其他一些列输出汇总统计量。data.frame
ids
time_range
x
require(dplyr)
F <- function(ids, time_range, df, date_column, x) {
date_column <- enquo(date_column)
x <- enquo(x)
df %>%
filter(person_id %chin% ids) %>%
filter(time_range[1] <= (!!date_column) & (!!date_column) <= time_range[2]) %>%
summarise(newvar = sum(!!x))
}
我们可以制作一些可以应用我们的函数的示例数据F
。
person_ids <- lapply(1:2, function(i) sample(letters, size = 10))
time_ranges <- lapply(list(c("2014-01-01", "2014-12-31"),
c("2015-01-01", "2015-12-31")), as.Date)
require(data.table)
dt <- CJ(person_id = letters,
date_col = seq.Date(from = as.Date('2014-01-01'), to = as.Date('2015-12-31'), by = '1 day'))
dt[, z := rnorm(nrow(dt))] # The variable we will later sum over, i.e. apply F to.
我们可以成功地将我们的函数应用于我们的每个输入。
F(person_ids[[1]], time_ranges[[1]], dt, date_col, z)
F(person_ids[[2]], time_ranges[[2]], dt, date_col, z)
因此,如果我愿意,我可以编写一个简单的 for 循环来解决我的问题。但是,如果我们尝试应用语法糖并将所有内容包装在 中mapply
,则会出现错误。
mapply(F, ids = person_ids, time_range = time_ranges, MoreArgs = list(df = dt, date_column = date_col, x = z))
# Error in mapply... object 'date_col' not found