2

“tidyselect”包提供了一个选择帮助函数wherewhere用于选择具有自定义功能的数据框列。它是“tidyselect”的一个内部函数。这意味着where不会加载到您的命名空间,您只能通过tidyselect:::where.

但是,我从dplyr 小插图中看到了以下示例: columnwise operations 。

starwars %>% 
  summarise(across(where(is.character), ~ length(unique(.x))))
#> # A tibble: 1 x 8
#>    name hair_color skin_color eye_color   sex gender homeworld species
#>   <int>      <int>      <int>     <int> <int>  <int>     <int>   <int>
#> 1    87         13         31        15     5      3        49      38

在这个例子中,where没有前缀“tidyselect:::”,但很明显,代码中没有错误,它产生了有意义的结果。这对我来说似乎很奇怪。我想知道为什么代码正常运行。

我想这是由于“代码引用”,这是 tidyeval 方法的一部分。粗略地说,代码引用将代码作为表达式挂起,然后在“内部环境”中评估表达式。这只是一个直观的猜测,我不知道如何测试它。

我希望有人可以帮助我解决“哪里”问题,或者为我留下一些关于代码如何运行的参考。

4

1 回答 1

4

您没有说明示例中附加了哪些包,但我们假设唯一附加的包是dplyr.

library(dplyr)

首先,我们注意到该函数where未附加,即当前 R 会话不知道该函数。我们可以通过在控制台中输入它的名字(不带括号)来检查。如果附加了该函数,我们现在将看到它的源代码。相反,我们得到一个错误,即where找不到对象。

但是,我们注意到dplyr附加了来自 的其他功能tidyselectstarts_with作为示例。如果我们重复在控制台中输入名称的实验,我们现在可以看到源代码,并且函数源自tidyselect命名空间:

> starts_with
function (match, ignore.case = TRUE, vars = NULL) 
{
    check_match(match)
    vars <- vars %||% peek_vars(fn = "starts_with")
    if (ignore.case) {
        vars <- tolower(vars)
        match <- tolower(match)
    }
    flat_map_int(match, starts_with_impl, vars)
}
<bytecode: 0x0000027338e5f8e8>
<environment: namespace:tidyselect>

在这种情况下,函数starts_with是由 dplyr 使用该NAMESPACE文件附加的,您可以在该文件中列出应该与您的包一起附加的其他包中的函数。您可以查看dplyr 源代码

但是where正如我们已经看到的那样,它并没有以这种方式提供。在这种情况下,该函数确实被引用并且仅在 tidyselect 包中进行评估。如果查看 cross 的源代码,您会注意到在第 82 行,列规范被传递给across_setup在同一文件中定义的函数。在此函数中,列规范被引用(第 174、175 行),然后发送到tidyselect函数tidyselect::eval_select(第 177 行)。这个函数是 tidyselect 包的一部分,可以访问where.

于 2020-11-13T07:09:00.887 回答