14

我在现实世界的问题中有一个返回列表的函数。有没有办法将它与 dplyr mutate() 一起使用?这个玩具示例不起作用-:

it = data.table(c("a","a","b","b","c"),c(1,2,3,4,5), c(2,3,4,2,2))

myfun = function(arg1,arg2) {

temp1 = arg1 + arg2
temp2 = arg1 - arg2
list(temp1,temp2)

}

myfun(1,2)

it%.%mutate(new = myfun(V2,V3))

我看到它在变量的第一个“列”中循环遍历函数的输出,但不明白为什么。

谢谢!

4

3 回答 3

10

执行此操作的惯用方法data.table是使用:=(assignment by reference) 运算符。这是一个插图:

it[, c(paste0("V", 4:5)) := myfun(V2, V3)]

如果你真的想要一个列表,为什么不:

as.list(it[, myfun(V2, V3)])

或者,也许这就是你想要的,但你为什么不直接使用这个data.table功能:

it[, c(.SD, myfun(V2, V3))]
#    V1 V2 V3 V4 V5
# 1:  a  1  2  3 -1
# 2:  a  2  3  5 -1
# 3:  b  3  4  7 -1
# 4:  b  4  2  6  2
# 5:  c  5  2  7  3    

请注意,如果myfun要为其输出命名,则名称将显示在最终结果列中:

#    V1 V2 V3 new.1 new.2
# 1:  a  1  2     3    -1
# 2:  a  2  3     5    -1
# 3:  b  3  4     7    -1
# 4:  b  4  2     6     2
# 5:  c  5  2     7     3    
于 2014-02-07T15:00:38.747 回答
0

鉴于这个问题的标题,我想我会发布一个tidyverse使用dplyr::mutate. 注意myfun需要输出adata.frame才能工作。


library(tidyverse)

it = data.frame(
  v1 = c("a","a","b","b","c"),
  v2 = c(1,2,3,4,5), 
  v3 = c(2,3,4,2,2))

myfun = function(arg1,arg2) {

  temp1 = arg1 + arg2
  temp2 = arg1 - arg2
  data.frame(temp1, temp2)

}

it %>% 
  nest(data = c(v2, v3)) %>% 
  mutate(out = map(data, ~myfun(.$v2, .$v3))) %>% 
  unnest(cols = c(data, out))
#> # A tibble: 5 x 5
#>   v1       v2    v3 temp1 temp2
#>   <fct> <dbl> <dbl> <dbl> <dbl>
#> 1 a         1     2     3    -1
#> 2 a         2     3     5    -1
#> 3 b         3     4     7    -1
#> 4 b         4     2     6     2
#> 5 c         5     2     7     3

reprex 包(v0.3.0)于 2020-02-04 创建

于 2019-04-24T04:33:28.927 回答
-1

mutate() 函数旨在向现有数据框添加新列。数据框是相同长度的向量列表。因此,您不能将列表添加为新列,因为列表不是向量。

您可以将函数重写为两个函数,每个函数都返回一个向量。然后使用 mutate() 分别应用它们中的每一个,它应该可以工作。

于 2014-02-07T14:43:05.653 回答