我正在尝试设置具有多个输入和多个返回值的自定义函数,并purrr::map
在数据框上使用此函数。
我的样本数据是:
test_data <-
tibble(x1 = 1:10,
x2 = 2:11,
x3 = 3:12,
x4 = x1 + x2 + x3)
这test_data
看起来像这样:
# A tibble: 10 x 4
x1 x2 x3 x4
<int> <int> <int> <int>
1 1 2 3 6
2 2 3 4 9
3 3 4 5 12
4 4 5 6 15
5 5 6 7 18
6 6 7 8 21
7 7 8 9 24
8 8 9 10 27
9 9 10 11 30
10 10 11 12 33
首先,如果我的函数只有一个返回值(output_3
在这种情况下):
my_function_1 <-
function(var1, var2, var3, var4){
output_1 <- var1 + var2
output_2 <- var2 + var3
output_3 <- var1 + var2 + var3
output_4 <- var1 + var2 + var4
return(output_3)
}
我pmap
使用这个功能
my_results <-
dplyr::as.tbl(test_data) %>%
dplyr::mutate(output = purrr::pmap(list(var1 = x1, var2 = x2, var3 = x3, var4 = x4),
my_function_1)) %>%
tidyr::unnest()
结果如下所示:
my_results
# A tibble: 10 x 5
x1 x2 x3 x4 output
<int> <int> <int> <int> <int>
1 1 2 3 6 6
2 2 3 4 9 9
3 3 4 5 12 12
4 4 5 6 15 15
5 5 6 7 18 18
6 6 7 8 21 21
7 7 8 9 24 24
8 8 9 10 27 27
9 9 10 11 30 30
10 10 11 12 33 33
现在如果我的函数有多个返回值,比如
my_function_2 <-
function(var1, var2, var3, var4){
output_1 <- var1 + var2
output_2 <- var2 + var3
output_3 <- var1 + var2 + var3
output_4 <- var1 + var2 + var4
return(list(output_1, output_2, output_3, output_4))
}
我应该如何映射它my_function_2
并将purrr::map
返回列添加到test_data
,就像上一步使用一个返回值一样?
我还想先输出结果(使用以下代码),然后再join/bind
输出test_data
:
pmap(list(test_data$x1,
test_data$x2,
test_data$x3,
test_data$x4),
my_function_2) %>%
flatten()
但结果不是想要的格式,如下所示:
[[1]]
[1] 3
[[2]]
[1] 5
[[3]]
[1] 6
[[4]]
[1] 9
[[5]]
[1] 5
... ...
有人可以提醒我一些潜在的解决方案来格式化输出并加入原始文件test_data
吗?