4

我想通过 data.table 上的字符名称调用函数。每个函数还有一个参数向量(因此有一长串函数可应用于 data.table)。参数是 data.table 列。我的第一个想法是 do.call 将是该任务的好方法。这是一个简单的示例,其中运行一个函数名称,它是要传递的列向量:

# set up dummy data 
set.seed(1)
DT <- data.table(x = rep(c("a","b"),each=5), y = sample(10), z = sample(10))
# columns to use as function arguments
mycols <- c('y','z')
# function name 
func <- 'sum'
# my current solution:
DT[, do.call(func, list(get('y'), get('z'))), by = x]
#    x V1
# 1: a 47
# 2: b 63  

我对此并不满意,因为它需要专门命名每一列。我想只传递一个字符向量mycols

在这种情况下,我需要的其他解决方案是:

DT[, do.call(func, .SD), .SDcols = mycols, by = x]

但是自定义函数有一个小问题,唯一适合我的解决方案是第一个:

#own dummy function    
myfunc <- function(arg1, arg2){
  arg1+arg2
}
func <- 'myfunc'
DT[, do.call(func, list(get('y'), get('z'))), by = x] 
#   x V1
#  1: a  6
#  2: a  6
#  3: a 11
#  4: a 17
#  5: a  7
#  6: b 15
#  7: b 17
#  8: b 10
#  9: b 11
# 10: b 10
# second solution does not work 
DT[, do.call(func, .SD), .SDcols = mycols, by = x]
# Error in myfunc(y = c(3L, 4L, 5L, 7L, 2L), z = c(3L, 2L, 6L, 10L, 5L)) : 
#  unused arguments (y = c(3, 4, 5, 7, 2), z = c(3, 2, 6, 10, 5))

据我了解,它假定 myfunc 具有y, z不正确的参数。应该有y,z应该传递给 arguments 的变量arg1, arg2

我也尝试了 mget 功能,但也没有成功:

DT[, do.call(func, mget(mycols)), by = x] 
# Error: value for ‘y’ not found

我可能会遗漏一些相当明显的东西,在此先感谢您的任何指导。

4

3 回答 3

2

这可能取决于您要使用的函数类型,但您似乎Reduce可能会感兴趣。

这是您的两个示例:

mycols <- c('y','z')
func <- 'sum'

DT[, Reduce(func, mget(mycols)), by = x]
#    x V1
# 1: a 47
# 2: b 63

myfunc <- function(arg1, arg2){
  arg1+arg2
}
func <- 'myfunc'

DT[, Reduce(func, mget(mycols)), by = x]
#     x V1
#  1: a  6
#  2: a  6
#  3: a 11
#  4: a 17
#  5: a  7
#  6: b 15
#  7: b 17
#  8: b 10
#  9: b 11
# 10: b 10
于 2015-11-25T11:31:47.713 回答
1

是的,您遗漏了一些东西(嗯,这并不是很明显,但是仔细调试错误可以确定问题)。您的函数需要命名参数arg1arg2. 您正在传递参数y = ...z = ...via do.call(您已经注意到了)。解决方案是传递不带名称的列表:

> DT[, do.call(func, unname(.SD[, mycols, with = F])), by = x]
    x V1
 1: a  6
 2: a  6
 3: a 11
 4: a 17
 5: a  7
 6: b 15
 7: b 17
 8: b 10
 9: b 11
10: b 10
于 2017-10-16T06:10:03.737 回答
0

这是一个帮助我实现我想要的解决方案。

func <- 'sum'
mycols <- c('y','z')
DT[, do.call(func, lapply(mycols, function(x) get(x))), by = x]
#    x V1
# 1: a 47
# 2: b 63

可以将base函数或自定义函数传递给它(不像Reduce解决方案那样具体)。

于 2015-11-26T09:55:18.930 回答