请让我首先提供显示问题的合成数据集:
Do <- rep(c(0,2,4,6,8,10,15,20,30,40,45,50,55,60,65,70,80,85,90,92,94,96,98,100), each=16,times=16)
Cl <- rep(c("K", "Y","M","C"), each= 384, times=4)
In <- rep(c("A", "S"), each=3072)
Sa <- rep(c(1,2), each=1536)
Data <- rnorm(6144)
DataFrame <- cbind.data.frame(Do,Cl,In,Sa,Data); head(DataFrame)
rm(Do,Cl,In,Sa,Data)
attach(DataFrame)
接下来,我将“DataFrame”对象拆分为多个列表,以避免不可预知的回收。基本上,我将每个数据子集放在一个单独的列表中,这样循环是可预测的,并且在我的模拟器中产生了正确的输出。
DFSplit <- split(DataFrame[ , "Data"], list(Do, Cl, In, Sa))
'DFSplit' 对象有 384 个列表
length(names(DFSplit))
然后我创建了函数“ids”来识别列表名称
ids <- function(Do, Cl, In, Sa){
grep( paste( "^" , Do, "\\.",
Cl, "\\.",
In,
"\\.", Sa,sep=""),
names(DFSplit), value = TRUE)}
mapply(ids, Do, Cl, In, Sa, SIMPLIFY = FALSE)
我知道每个“ids”参数的长度都是 6144。mapply 产生 384 个列表,每个列表重复 16 次。如何更改 ids 函数,以便 mapply 不会重复相同的名称 16 次。作为一个丑陋且成本高昂的解决方案,我使用了独特的;我需要一个更好的根本解决方案。
unique(mapply(ids, Do, Cl, In, Sa, SIMPLIFY = FALSE))
我还创建了一个对“DFSplit”列表进行操作的函数。它与以前的功能具有相同的问题。问题是,它接受前一个函数作为输入。
dG <- function(Do,Cl, In, Sa){
dg <- 100*
(1-10^-( DFSplit[[ids(Do, Cl, In, Sa)]] - DFSplit[[ids(0, Cl, In, Sa)]])) /
(1-10^-( DFSplit[[ids(100, Cl, In, Sa)]] - DFSplit[[ids(0, Cl, In, Sa)]])) - Do
dg}
mapply(dG, Do, Cl, In, Sa, SIMPLIFY = FALSE)
如果我可以说,我正在尝试做的是在 384 个列表中的每个列表中应用 dG 函数,但没有成功。我承认 dG 功能也需要修改,我不知道如何。我希望 dG 函数的输入是 384 个列表的名称,每个列表包含 16 个数字。我希望输出是应用了 dG 的 384 列表。
请随时提出不同的解决方案。重要的是我需要将“dG”函数应用于数据集。