在这种情况下,它funs
需要在其标准评估版本 ( funs_
) 中使用。此外,整个公式都在一次调用interp
. 例如:
func <- function(param, data=mtcars) {
data %>%
group_by(cyl) %>%
summarise_each(funs_(lazyeval::interp(~sum(.)/sum(.[var==0]), var = as.name(param))))
}
func("vs")
cyl mpg disp hp drat wt qsec vs am gear carb
1 4 11.28077 9.613466 9.989011 10.108352 11.749065 12.605389 Inf Inf Inf Inf
2 6 2.23987 2.759570 2.167089 2.197898 2.640048 2.569212 Inf Inf Inf Inf
3 8 1.00000 1.000000 1.000000 1.000000 1.000000 1.000000 NaN NA NA NA
或者,更一般的功能:
func <- function(param, param.subset, groupvar, data) {
data %>%
group_by_(groupvar) %>%
summarise_each(funs_(lazyeval::interp(
~if(is.numeric(.)) {
sum(.[var==param.subset])/sum(.)
} else {
length(unique(.[var==param.subset]))
}, var = as.name(param))))
}
func(param="gender", param.subset="Girl", groupvar="grade", data=vcd::JointSports)
grade Freq opinion year gender
1 1st 0.5866477 5 2 1
2 3rd 0.6137566 5 2 1
我仍然觉得我并没有真正“获得” dplyr 的标准评估,并且会对是否有比上面的代码更好的方法感兴趣。