32

我有以下data.table

x = structure(list(f1 = 1:3, f2 = 3:5), .Names = c("f1", "f2"), row.names = c(NA, -3L), class = c("data.table", "data.frame"))

我想对data.table. 该函数func.test使用 argsf1f2对其进行处理并返回一个计算值。假设(例如)

func.text <- function(arg1,arg2){ return(arg1 + exp(arg2))}

但我真正的函数更复杂,并且执行循环和所有操作,但返回一个计算值。实现这一目标的最佳方法是什么?

4

3 回答 3

52

最好的方法是编写一个矢量化函数,但如果你不能,那么也许可以这样做:

x[, func.text(f1, f2), by = seq_len(nrow(x))]
于 2014-08-21T17:03:00.597 回答
29

我发现的最优雅的方式是mapply

x[, value := mapply(func.text, f1, f2)]
x
#    f1 f2    value
# 1:  1  3 21.08554
# 2:  2  4 56.59815
# 3:  3  5 151.4132

或使用purrr包装:

x[, value := purrr::pmap_dbl(.(f1, f2), func.text)]
于 2017-04-13T17:59:06.887 回答
9

我们可以用.I函数定义行。

dt_iris <- data.table(iris)
dt_iris[, ..I := .I]

## Let's define some function
some_fun <- function(dtX) {
    print('hello')
    return(dtX[, Sepal.Length / Sepal.Width])
}

## by row
dt_iris[, some_fun(.SD), by = ..I] # or simply: dt_iris[, some_fun(.SD), by = .I]

## vectorized calculation
some_fun(dt_iris) 
于 2015-09-24T11:33:42.317 回答