1

我有一个tibble,我想使用字符向量向它添加列。向量的名称是新列的名称,新列应填充向量的值(每行重复)。使用 for 循环很容易做到这一点,但我试图了解它是如何across工作的,但我遇到了两个问题。

cv <- c("a"="x", "b"="y", "c"="z")  
tib <- tibble(c1=1:5)
myf <- function(x) { cv[x]}
tib %>% mutate(across(all_of(names(cv))), myf)  ## first problem
#   Error: Problem with `mutate()` input `..1`.
#   x Can't subset columns that don't exist.
#   x Columns `a`, `b`, and `c` don't exist.
tib %>% mutate_at(all_of(names(cv)), myf)
# ℹ Input `..1` is `across(all_of(names(cv)))`.

for (x in names(cv)) { ## do it with a for loop
  tib[[x]] <- myf(x)
}
tib %>% mutate(across(all_of(names(cv)), myf)) ## second problem

产生:

# A tibble: 5 x 4
     c1 a     b     c    
  <int> <chr> <chr> <chr>
1     1 NA    NA    NA   
2     2 NA    NA    NA   
3     3 NA    NA    NA   
4     4 NA    NA    NA   
5     5 NA    NA    NA   

将最后一行替换为tib %>% mutate_at(all_of(names(cv)), myf)会产生相同的错误行为。

第一个问题是,mutate across由于某种我无法理解的原因,它似乎不喜欢制作新专栏。第二个问题是across不知道该怎么办myf。它似乎想要某种我不知道如何创建的闭包。(与 . 相同mutate_at。)我已经简要地查看了rlang但无法确定如何将常规函数转换为适当类型的对象。

4

1 回答 1

1

across可以在数据集中存在列时使用,并且如果我们想要更新这些列或通过指定 更改列名从该列创建新列.names。在这里,一种方法是使用 遍历名称map,使用创建列transmute并将其与原始数据绑定

library(purrr)
library(dplyr)
map_dfc(names(cv), ~ tib %>%
                     transmute(!! .x := myf(.x))) %>%
       bind_cols(tib, .)

-输出

# A tibble: 5 x 4
#     c1 a     b     c    
#  <int> <chr> <chr> <chr>
#1     1 x     y     z    
#2     2 x     y     z    
#3     3 x     y     z    
#4     4 x     y     z    
#5     5 x     y     z    
于 2021-04-08T16:08:28.833 回答