3

我正在使用 进行一些编程dplyr,并且很好奇如何将表达式作为(特别是MoreArgs)参数传递给mapply

考虑一个简单的函数,它根据 some和 a对 aF进行子集化,然后根据其他一些列输出汇总统计量。data.frameidstime_rangex

require(dplyr)
F <- function(ids, time_range, df, date_column, x) {
    date_column <- enquo(date_column)
    x <- enquo(x)
    df %>%
        filter(person_id %chin% ids) %>%
        filter(time_range[1] <= (!!date_column) & (!!date_column) <= time_range[2]) %>%
        summarise(newvar = sum(!!x))
}

我们可以制作一些可以应用我们的函数的示例数据F

person_ids <- lapply(1:2, function(i) sample(letters, size = 10))
time_ranges <- lapply(list(c("2014-01-01", "2014-12-31"),
                           c("2015-01-01", "2015-12-31")), as.Date)

require(data.table)
dt <- CJ(person_id = letters,
         date_col  = seq.Date(from = as.Date('2014-01-01'), to = as.Date('2015-12-31'), by = '1 day'))
dt[, z := rnorm(nrow(dt))]  # The variable we will later sum over, i.e. apply F to.

我们可以成功地将我们的函数应用于我们的每个输入。

F(person_ids[[1]], time_ranges[[1]], dt, date_col, z)
F(person_ids[[2]], time_ranges[[2]], dt, date_col, z)

因此,如果我愿意,我可以编写一个简单的 for 循环来解决我的问题。但是,如果我们尝试应用语法糖并将所有内容包装在 中mapply,则会出现错误。

mapply(F, ids = person_ids, time_range = time_ranges, MoreArgs = list(df = dt, date_column = date_col, x = z))

# Error in mapply... object 'date_col' not found
4

1 回答 1

3

In mapply,MoreArgs作为列表提供,但 R 尝试评估列表元素,导致错误。正如@Gregor 所建议的,您可以使用我们不想立即评估的quote那些,防止错误并允许函数继续进行。MoreArgs这可以通过 basequote或来完成dplyr quo

mapply(F, person_ids, time_ranges, MoreArgs = list(dt, quote(date_col), quote(z)))

mapply(F, person_ids, time_ranges, MoreArgs = list(dt, quo(date_col), quo(z)))

另一种选择是map2purrr包中使用,这tidyverse相当于mapply使用两个输入向量。tidyverse函数设置为与非标准评估一起使用,这避免了您在mapply不需要引用参数的情况下遇到的错误:

library(purrr)

map2(person_ids, time_ranges, F, dt, date_col, z)
[[1]]
    newvar
1 40.23419

[[2]]
    newvar
1 71.42327

更一般地,您可以使用pmap,它在任意数量的输入向量上并行迭代:

pmap(list(person_ids, time_ranges), F, dt, date_col, z)
于 2017-10-30T19:45:24.410 回答