7

我正在使用 R,我有两个 data.framesAB. 它们都有 6 行,但A有 25000 列(基因),并且B有 30 列。我想应用一个带有两个参数的函数,其中f(x,y)x每一列是. 到目前为止,它看起来像这样:AyB

i = 1
for (x in A){
    j = 1
    for (y in B){
        out[i,j] <- f(x,y)
        j = j + 1
    }
    i = i + 1
}

我对此有两个问题:从我的 Python 编程中,我认为跟踪这样的计数器很麻烦,从我的 R 编程中,我对 for 循环感到紧张。但是,我不太明白如何应用apply(或者即使我应该应用apply)这个问题,并希望有人能启发我。我现在需要将f()其视为原子(实际上是cor.test())。

4

3 回答 3

7

由于您使用的是数据帧,因此使用 lapply 或 sapply 执行此操作可能会更快(特别是考虑到数据帧的范围)。例如,

x <- data.frame(col1=c(1,2,3,4), col2=c(5,6,7,8), col3=c(9,10,11,12))
y <- data.frame(col1=c(1,2,3,4), col2=c(5,6,7,8))
bl <- lapply(x, function(u){
   lapply(y, function(v){
       f(u,v) # Function with column from x and column from y as inputs
   })
})
out = matrix(unlist(bl), ncol=ncol(y), byrow=T)
于 2010-08-24T15:29:12.890 回答
3

一些数据

nrows <- 6
A <- data.frame(a = runif(nrows), b = runif(nrows), c = runif(nrows))
B <- data.frame(z = rnorm(nrows), y = rnorm(nrows))

诀窍:记住列expand.grid

counter <- expand.grid(seq_along(A), seq_along(B))
f <- function(x) 
{
  cor.test(A[, x["Var1"]], B[, x["Var2"]])$estimate
}

现在我们只需要 1 次调用apply.

stats <- apply(counter, 1, f)
names(stats) <- paste(names(A)[counter$Var1], names(B)[counter$Var2], sep = ",")
stats
于 2010-08-24T15:20:25.877 回答
1

不过,嵌套 apply 有效,但不是最简单的语法。

x<-data.frame(col1=c(1,2,3,4), col2=c(5,6,7,8), col3=c(9,10,11,12))
y<-data.frame(col1=c(1,2,3,4), col2=c(5,6,7,8))

z<-apply(x,2,function(col,df2)
             {
               apply(df2,2,function(col2,col1)
                           {
                              col2+col1
                           },col)
             },y)

z
 col1 col2 col3
[1,]    2    6   10
[2,]    4    8   12
[3,]    6   10   14
[4,]    8   12   16
[5,]    6   10   14
[6,]    8   12   16
[7,]   10   14   18
[8,]   12   16   20
于 2010-08-24T15:02:32.533 回答