1

我试图弄清楚如何在我的tidyverse工作流程中的 NSE 函数中使用可选参数。这是我希望能够构建的一个小玩具功能。我希望能够对分组数据框进行操作;在此示例中,我想收集 df,不包括 df 分组的任何列(使用 成功获取这些groups(df)列)和任何其他可选列,通过.... quos有一个论点.ignore_empty,但我不确定如何准确地使用它。我可能误解了什么.ignore_empty

我知道我可以通过检查缺少的参数来启动函数,然后设置两组不同的管道操作来确定是否有额外的参数,但我更喜欢将它保存在单个管道流中。

数据和玩具功能:

library(tidyverse)

df <- structure(list(
    town = c("East Haven", "Hamden", "New Haven","West Haven"), 
    region = c("Inner Ring", "Inner Ring", "New Haven", "Inner Ring"),
    Asian = c(1123, 3285, 6042, 2214), 
    Black = c(693,13209, 42970, 10677), 
    Latino = c(3820, 6450, 37231, 10977), 
    Total = c(29015,61476, 130405, 54972), 
    White = c(22898, 37043, 40164, 28864)), 
    class = c("tbl_df","tbl", "data.frame"), row.names = c(NA, -4L))

test_dots <- function(df, ...) {
    grouping_vars <- groups(df)
    gather_vars <- quos(..., .ignore_empty = "all")

    df %>%
        gather(key = variable, value = value, -c(!!!grouping_vars), -c(!!!gather_vars))
}

使用分组的 df 和收到的列名...

df %>%
    group_by(town) %>%
    test_dots(region) %>%
    head()
#> # A tibble: 6 x 4
#> # Groups:   town [4]
#>   town       region     variable value
#>   <chr>      <chr>      <chr>    <dbl>
#> 1 East Haven Inner Ring Asian     1123
#> 2 Hamden     Inner Ring Asian     3285
#> 3 New Haven  New Haven  Asian     6042
#> 4 West Haven Inner Ring Asian     2214
#> 5 East Haven Inner Ring Black      693
#> 6 Hamden     Inner Ring Black    13209

使用分组的 df 但没有任何内容...

df %>%
    select(-region) %>%
    group_by(town) %>%
    test_dots()
#> Error in -x: invalid argument to unary operator

reprex 包(v0.2.0) 于 2018 年 5 月 10 日创建。

提前致谢!

4

1 回答 1

3

我认为问题在于您试图否定一个空向量。如果您确定总会有一个至少一个分组或聚集变量,那么您可以这样做

test_dots <- function(df, ...) {
  grouping_vars <- groups(df)
  gather_vars <- quos(...)
  vars <- quos(c(!!!grouping_vars), c(!!!gather_vars))

  df %>%
    gather(key = variable, value = value, -c(!!!vars))
}

我不认为.ignore_empty与它有任何关系,因为这似乎只是控制如何quos工作,而不是gather().

于 2018-05-10T19:36:21.403 回答