这在某种程度上与这个问题有关:原则上,我试图了解跨多个列rowwise
的操作如何应用超过 1 个函数,如 ( ,等。) 工作。mutate
mean()
sum()
min()
我了解到,across
做这项工作,而不是c_across
。我了解到该函数与不适用于数据帧的函数mean()
不同,我们需要将其更改为可以使用 unlist 或 as.matrix 完成的向量 -> 从 Ronak Shah在这里了解 rowwise()和 c_across()min()
mean()
现在以我的实际情况为例:我能够完成这项任务,但我失去了一个专栏d
。d
在此设置中如何避免列松动。
我的df:
df <- structure(list(a = 1:5, b = 6:10, c = 11:15, d = c("a", "b",
"c", "d", "e"), e = 1:5), row.names = c(NA, -5L), class = c("tbl_df",
"tbl", "data.frame"))
不工作:
df %>%
rowwise() %>%
mutate(across(a:e),
avg = mean(unlist(cur_data()), na.rm = TRUE),
min = min(unlist(cur_data()), na.rm = TRUE),
max = max(unlist(cur_data()), na.rm = TRUE)
)
# Output:
a b c d e avg min max
<int> <int> <int> <chr> <int> <dbl> <chr> <chr>
1 1 6 11 a 1 NA 1 a
2 2 7 12 b 2 NA 12 b
3 3 8 13 c 3 NA 13 c
4 4 9 14 d 4 NA 14 d
5 5 10 15 e 5 NA 10 e
工作,但我松散列d
:
df %>%
select(-d) %>%
rowwise() %>%
mutate(across(a:e),
avg = mean(unlist(cur_data()), na.rm = TRUE),
min = min(unlist(cur_data()), na.rm = TRUE),
max = max(unlist(cur_data()), na.rm = TRUE)
)
a b c e avg min max
<int> <int> <int> <int> <dbl> <dbl> <dbl>
1 1 6 11 1 4.75 1 11
2 2 7 12 2 5.75 2 12
3 3 8 13 3 6.75 3 13
4 4 9 14 4 7.75 4 14
5 5 10 15 5 8.75 5 15