3

考虑这个简单的例子

library(dplyr)

dataframe <- data_frame(id = c(1,2,3,4),
                        group = c('a','b','c','c'),
                        value = c(200,400,120,300))


> dataframe
# A tibble: 4 x 3
     id group value
  <dbl> <chr> <dbl>
1     1     a   200
2     2     b   400
3     3     c   120
4     4     c   300

这个tidyeval函数用于dplyr根据某些输入列聚合我的数据框。

func_tidy <- function(data, mygroup){
  quo_var <- enquo(mygroup)

  df_agg <- data %>% 
    group_by(!!quo_var) %>% 
    summarize(mean = mean(value, na.rm = TRUE),
              count = n()) %>% 
    ungroup()

  df_agg
}

现在,这有效

> func_tidy(dataframe, group)
# A tibble: 3 x 3
  group  mean count
  <chr> <dbl> <int>
1     a   200     1
2     b   400     1
3     c   210     2

但在循环中做同样的事情失败

for(col in c(group)){
  func_tidy(dataframe, col)
}
 Error in grouped_df_impl(data, unname(vars), drop) : Column `col` is unknown 

这里有什么问题?如何tidyeval在循环中使用我的函数?

谢谢!

4

1 回答 1

6

要遍历列名,您将需要使用字符串。

for(col in "group")

当您将此变量传递给您的函数时,您需要使用 . 将其从字符串转换为符号rlang::sym。您用于取消引用!!,以便评估表达式。

所以你的循环看起来像(我添加一个print来查看输出):

for(col in "group"){
    print( func_tidy(dataframe, !! rlang::sym(col) ) )
}

# A tibble: 3 x 3
  group  mean count
  <chr> <dbl> <int>
1     a   200     1
2     b   400     1
3     c   210     2
于 2017-08-25T17:40:55.917 回答