我编写了自己的名为 batcheffect 的函数来重新计算数据框中的所有值。该函数只需要数据框作为导入。首先,在函数中计算平均值,然后对数据框中的每个点进行计算并创建一个新的数据框。
batcheffect <- function (experiment){
corr<-list()
matrixexp<-as.matrix(experiment)
expmean <-mean(matrixexp)
for (i in 1:length(matrixexp)){
correction <- (matrixexp[i]-overallmean - expmean)+overallmean
corr[[i]]<- matrix(correction)
}
return(unlist(corr))
}
对于大型数据帧,函数内的循环很慢。所以我想使用 sapply 或 lapply 函数来加速这个过程。有人建议吗?
谢谢
更新:例如我有一个像这样的数据框 df<- data.frame(A=1:10,B=10:1,C=11:20,C1=21:30,B1=31:40,A2=41 :50)
计算数据框中所有值的平均值。数据帧被转换为矩阵 df1<-as.matrix(df)overallmean<-mean(df1)
数据的第一个目标是按列名制作子集。您生成三个组,A 组,B 组和 C 组。子集由以下代码定义:
"selectexperiments" <- function (partialname, data)
{
result <- data[,grep(partialname, colnames(data))]
return(result)
}
A<-selectexperiments('A', df)
B<-selectexperiments('B', df)
C<-selectexperiments('C', df)
创建了三个组。对于 eggroup 中的每个值,AI 想要计算以下总和:(值 - 总体均值 - 组均值)+ 总体均值。因此我创建了这个批处理效果函数。
"batcheffect" <- function (group)
{
corr<-list()
matrixexp<-as.matrix(group)
expmean <-mean(matrixexp) #mean of the group
for (i in 1:length(matrixexp)){
correction <- (matrixexp[i]-overallmean - expmean)+overallmean
corr[[i]]<- matrix(correction)
}
return(unlist(corr))
}
Abatch<-batcheffect(A)
结果现在可以了,但是我会将结果作为数据框返回。对于我自己的数据,这个功能真的很慢,所以我认为可能有一种加速方法,比如 sapply 的东西。