1

我试图在我自己的函数中使用 R 中 tidyverse 的准引用来解决问题。我在这里读过这个:将参数列表传递给具有准引用的函数以及这里的全部内容:https ://tidyeval.tidyverse.org/

但我仍然没有让它工作。

假设我有以下数据:

dat <- data.frame(time   = runif(20),
                  group1 = rep(1:2, times = 10),
                  group2 = rep(1:2, each = 10),
                  group3 = rep(3:4, each = 10))

我现在要做的是编写一个执行以下操作的函数:

  • 取一个数据集
  • 指定包含时间的变量(注意,在另一个数据集中,这可能称为“小时”或“qtime”或其他)
  • 指定我想对哪些组进行操作/统计

所以我希望用户做的是使用如下功能:

test_function(data = dat, time_var = "time", group_vars = c("group1", "group3"))请注意,我下次可能会选择不同的分组变量或不选择。

假设在我想要的函数中:

  • 计算时间变量的某些统计数据,例如分位数。注意:我想通过我的分组变量来拆分它

这是我最近的尝试之一:

test_function <- function(data, time_var = NULL, group_vars = NULL)
{
# Note I initialize the variables with NULL, since e.g. the user might not specify a grouping 

and I want to check for that in my function at some point)
time_var <- enquo(time_var)
group_vars <- enquos(group_vars)

# Here I try to group by my grouping variables
temp_data <- data %>%
    group_by_at(group_vars) %>%
    mutate(!!sym(time_var) := !!sym(time_var) / 60)

# Here I'm calculating some stats  
time_stats <- temp_data %>%
    summarize_at(vars(!!time_var), list(p0.1_time   = ~quantile(., probs = 0.1, na.rm = T),
                                        p0.2_time   = ~quantile(., probs = 0.2, na.rm = T),
                                        p0.3_time   = ~quantile(., probs = 0.3, na.rm = T),
                                        p0.4_time   = ~quantile(., probs = 0.4, na.rm = T),
                                        p0.5_time   = ~quantile(., probs = 0.5, na.rm = T),
                                        p0.6_time   = ~quantile(., probs = 0.6, na.rm = T),
                                        p0.7_time   = ~quantile(., probs = 0.7, na.rm = T),
                                        p0.8_time   = ~quantile(., probs = 0.8, na.rm = T),
                                        p0.9_time   = ~quantile(., probs = 0.9, na.rm = T),
                                        p0.95_time  = ~quantile(., probs = 0.95, na.rm = T)))

}

我的代码有什么问题?即,我专门与!!,!!!,sym,enquo,enquos 事物作斗争。为什么 group_by_at 东西不需​​要 !! 东西,而我的汇总和变异确实需要它?

4

1 回答 1

7

进行以下更改:

  • 使用symandsyms而不是enquoandenquos
  • 分别使用!!!!!
  • 创建po为列表,然后用于unnest_wider扩展为列
  • quantile已经矢量化了,所以我们不需要map
  • mutate可以直接合并到呼叫quantile中消除它
  • 将管道合并为单个管道
  • 使用TRUE而不是T因为后者可以被该名称的变量所掩盖,而不能调用任何变量TRUE
  • 我们可以使用普通group_by的和summarize
  • 样本数据中没有group3,所以我们group2改用
  • 这没有任何意义,time_var所以删除默认值 NULL

这给出了以下代码

test_function <- function(data, time_var, group_vars = NULL) {
  p <- c(1:9/10, 0.95)
  time_var <- sym(time_var)
  group_vars <- syms(group_vars)
  data %>%
    group_by(!!!group_vars) %>%
    summarize(po = list(quantile(!!time_var / 60, p, na.rm = TRUE))) %>%
    ungroup %>%
    unnest_wider(po)
}

test_function(data = dat, time_var = "time", group_vars = c("group1", "group2")) 

给予:

# A tibble: 4 x 12
  group1 group2   `10%`   `20%`   `30%`   `40%`   `50%`   `60%`   `70%`   `80%`   `90%`   `95%`
   <int>  <int>   <dbl>   <dbl>   <dbl>   <dbl>   <dbl>   <dbl>   <dbl>   <dbl>   <dbl>   <dbl>
1      1      1 0.00237 0.00432 0.00654 0.00903 0.0115  0.0120  0.0124  0.0133  0.0147  0.0154 
2      1      2 0.00244 0.00251 0.00281 0.00335 0.00388 0.00410 0.00432 0.00493 0.00591 0.00640
3      2      1 0.00371 0.00381 0.00468 0.00632 0.00796 0.0101  0.0122  0.0136  0.0143  0.0147 
4      2      2 0.00385 0.00538 0.00630 0.00660 0.00691 0.00725 0.00759 0.00907 0.0117  0.0130 
于 2019-11-13T23:01:06.870 回答