我正在阅读dplyr 的小插图,试图弄清楚如何dplyr
在我的函数代码中使用。中途讨论了如何使用enquos
on...
将多个参数传递给 group_by。
一个简短的例子来说明它是如何工作的
grp <- rlang::enquos(...)
df %>%
group_by(!!!grp)
我不知道是否有一种方法可以分配多个表达式值而无需保留...
而无需进行一些有问题的编码。
要了解调用的外观,请使用以下示例:
#reproducable data
df <- datasets::USJudgeRatings
df$name <- rownames(df)
df <- tidyr::gather(df, key = "key", value = "value", -name)
df$dummy <- c("1","2")
test_summarize <- function(df, sum.col, grp = NULL, filter = NULL) {
filter <- rlang::enquo(filter)
sum.col <- rlang::enquo(sum.col)
if(!is.null(rlang::get_expr(filter))){
df <- dplyr::filter(df, !!filter)
}
#how grp is turned into a character vector to be passed to .dots in group_by
grp <- substitute(grp)
if(!is.null(grp)){
grp <- deparse(grp)
grp <- strsplit(gsub(pattern = "list\\(|c\\(|\\)|", replacement = "", x = grp), split =",")[[1]]
grp <- gsub(pattern = "^ | $", replacement = "", x = grp)
df %>%
dplyr::group_by(.dots=grp) %>%
dplyr::summarise(mean = mean(!!sum.col), sum = sum(!!sum.col), n = n())
} else{
df %>%
dplyr::summarise(mean = mean(!!sum.col), sum = sum(!!sum.col), n = n())
}
}
test_summarize(df, sum.col=value, grp = c(name, dummy))
# A tibble: 86 x 5
# Groups: name [?]
name dummy mean sum n
<chr> <fct> <dbl> <dbl> <int>
1 AARONSON,L.H. 1 7.17 43 6
2 AARONSON,L.H. 2 7.42 44.5 6
3 ALEXANDER,J.M. 1 8.35 50.1 6
4 ALEXANDER,J.M. 2 7.95 47.7 6
5 ARMENTANO,A.J. 1 7.53 45.2 6
6 ARMENTANO,A.J. 2 7.7 46.2 6
7 BERDON,R.I. 1 8.67 52 6
8 BERDON,R.I. 2 8.25 49.5 6
9 BRACKEN,J.J. 1 5.65 33.9 6
10 BRACKEN,J.J. 2 5.82 34.9 6
# ... with 76 more rows
这适用于我试图做的事情,但我想知道是否有更好的方法来接受这些论点并处理它们。我所做的每一次尝试都将原始grp
调用变成类似于enquos(...)
失败的东西,所以我做了一个解析并将它们变成一个字符向量,老实说我应该只是期望用户传递字符?
我选择不使用字符向量作为预期输入,因为考虑到函数的 sum.col 和 filter 参数需要 NSE 表达式,我试图保持一致。也许 rlang 包中的某些东西会将原始表达式的每个元素转换为 quosures 列表?
编辑:修复了可重现的示例并提供了预期的输出