11

我有一个函数列表

funs <- list(fn1 = function(x) x^2,
             fn2 = function(x) x^3,               
             fn3 = function(x) sin(x),
             fn4 = function(x) x+1)
#in reality these are all f = splinefun()

我有一个数据框:

mydata <- data.frame(x1 = c(1, 2, 3, 2),
                     x2 = c(3, 2, 1, 0),
                     x3 = c(1, 2, 2, 3),
                     x4 = c(1, 2, 1, 2))
#actually a 500x15 dataframe of 500 samples from 15 parameters

对于i行中的每一行,我想在j列的每一列上评估函数j并对结果求和:

unlist(funs)
attach(mydata)
a <- rep(NA,4)
for (i in 1:4) {
     a[i] <- sum(fn1(x1[i]), fn2(x2[i]), fn3(x3[i]), fn4(x4[i]))
}

我怎样才能有效地做到这一点?这是实现plyr功能的合适时机吗?如果是这样,怎么做?

奖金问题:为什么a[4] NA

现在是使用函数的合适时间plyr吗?如果是,我该怎么做?

4

3 回答 3

9

忽略您的代码片段并坚持您想要在列号j上应用函数j然后“对结果求和”的初始规范......您可以这样做:

mapply( do.call, funs, lapply( mydata, list))
#      [,1] [,2]      [,3] [,4]
# [1,]    1   27 0.8414710    2
# [2,]    4    8 0.9092974    3
# [3,]    9    1 0.9092974    3

我不确定您现在要以哪种方式添加结果(即按行或按列),因此您可以在此矩阵上执行rowSums或执行。colSums例如:

colSums( mapply( do.call, funs,  lapply( mydata, list)) )
# [1] 14.000000 36.000000  2.660066  8.000000
于 2011-01-22T00:42:01.853 回答
4

为什么不只为所有 4 个函数编写一个函数并将其应用于数据帧?您的所有函数都是矢量化的, 也是如此splinefun,这将起作用:

fun <-  function(df)
    cbind(df[, 1]^2, df[, 2]^3, sin(df[, 3]), df[, 4] + 1)

rowSums(fun(mydata))

这比在行上“foring”或“applying”要有效得多。

于 2011-01-22T14:13:00.930 回答
0

我尝试使用plyr::each

library(plyr)
sapply(mydata, each(min, max))
    x1 x2 x3 x4
min  1  0  1  1
max  3  3  3  2

它工作正常,但是当我传递自定义函数时,我得到:

sapply(mydata, each(fn1, fn2))
Error in proto[[i]] <- fs[[i]](x, ...) :
  more elements supplied than there are to replace

each有非常简短的文档,我不太明白问题出在哪里。

于 2011-01-22T19:07:28.943 回答