尝试解决以下用例:
我有一个完整的数据集 ( mydf
),我想dplyr::group_by
根据另一组变量组合 ( mysplits
) 的条目使用不同的变量集。问题是,我的mysplits
data.frame 包含变量名称作为字符。
有一个dplyr::group_by_
选项,但我希望使用类似于rlang
功能或类似的工具来实现这一点。
mydf <-
data.frame(
var1 = c('x', 'x', 'y', 'y'),
var2 = c('y', 'z', 'x', 'z'),
var3 = c('a', 'b', 'a', 'b'),
outcome = runif(4),
stringsAsFactors = F
)
mysplits <-
data.frame(
g1 = c('var1', 'var2'),
g2 = c('var2', 'var3'),
stringsAsFactors = F
)
我正在寻找类似的东西:
dlply(
.data = mysplits, .variables = (g1, g2),
function(thissplit){
group_by(mydf, f(thissplit$g1), f(thissplit$g2)) %>% summarise(mean(outcome))
}
)
f()
我的谜题中缺少的部分在哪里。