我想通过 data.table 上的字符名称调用函数。每个函数还有一个参数向量(因此有一长串函数可应用于 data.table)。参数是 data.table 列。我的第一个想法是 do.call 将是该任务的好方法。这是一个简单的示例,其中运行一个函数名称,它是要传递的列向量:
# set up dummy data
set.seed(1)
DT <- data.table(x = rep(c("a","b"),each=5), y = sample(10), z = sample(10))
# columns to use as function arguments
mycols <- c('y','z')
# function name
func <- 'sum'
# my current solution:
DT[, do.call(func, list(get('y'), get('z'))), by = x]
# x V1
# 1: a 47
# 2: b 63
我对此并不满意,因为它需要专门命名每一列。我想只传递一个字符向量mycols
。
在这种情况下,我需要的其他解决方案是:
DT[, do.call(func, .SD), .SDcols = mycols, by = x]
但是自定义函数有一个小问题,唯一适合我的解决方案是第一个:
#own dummy function
myfunc <- function(arg1, arg2){
arg1+arg2
}
func <- 'myfunc'
DT[, do.call(func, list(get('y'), get('z'))), by = x]
# x V1
# 1: a 6
# 2: a 6
# 3: a 11
# 4: a 17
# 5: a 7
# 6: b 15
# 7: b 17
# 8: b 10
# 9: b 11
# 10: b 10
# second solution does not work
DT[, do.call(func, .SD), .SDcols = mycols, by = x]
# Error in myfunc(y = c(3L, 4L, 5L, 7L, 2L), z = c(3L, 2L, 6L, 10L, 5L)) :
# unused arguments (y = c(3, 4, 5, 7, 2), z = c(3, 2, 6, 10, 5))
据我了解,它假定 myfunc 具有y, z
不正确的参数。应该有y,z
应该传递给 arguments 的变量arg1, arg2
。
我也尝试了 mget 功能,但也没有成功:
DT[, do.call(func, mget(mycols)), by = x]
# Error: value for ‘y’ not found
我可能会遗漏一些相当明显的东西,在此先感谢您的任何指导。