r - R循环：如果不存在，则将列添加到表中

Question

我正在尝试使用 R 中的 for 循环编译来自多个文件的数据。我想将所有数据放入一个表中。下面的计算只是一个例子。

library(reshape)

dat1 <- data.frame("Specimen" = paste("sp", 1:10, sep=""), "Density_1" = rnorm(10,4,2), "Density_2" = rnorm(10,4,2), "Density_3" = rnorm(10,4,2))
dat2 <- data.frame("Specimen" = paste("fg", 1:10, sep=""), "Density_1" = rnorm(10,4,2), "Density_2" = rnorm(10,4,2))

dat <- c("dat1", "dat2")
for(i in 1:length(dat)){
data <- get(dat[i])
melt.data <- melt(data, id = 1)
assign(paste(dat[i], "tbl", sep=""), cast(melt.data, ~ variable, mean))
}

rbind(dat1tbl, dat2tbl)

将额外的列添加到 dat2 中的最流畅的方法是什么？我想获得相同的列名（在这种情况下为“Density_3”）并用零填充它，如果它不存在的话。假设我有大约 100 个表，列数（Density_1、2、3 等）在 5 到 6 之间变化。

我尝试了以下操作，但没有成功：

if(names(data) %in% "Density_3" == FALSE){
dat.all$Density_3 <- 0
} else {
dat.all$Density_3 <- dat.all$Density3}

另一个：有没有一种平滑的方法来 rbind() 表？似乎 rbind(get(dat)) 不起作用。

score 3 · Accepted Answer

盯着这个问题看了一会儿后，我认为它的意图可能被不必要的get和assign操纵所掩盖。我认为答案是pylr::rbind.fill

我会构造“dat”，而不是作为字符向量，而是作为两个数据帧的列表，使用aggregate( ..., FUN=mean)（因为我没有上 reshape2/plyr 总线，除了melt和rbind.fill那是）然后do.call(rbind.fill, ...)在结果列表上。无论如何，这就是我认为你想要的。我认为为真正缺失的值添加零不是一个好主意。

> rbind.fill(dat1tbl, dat2tbl)
  value Density_1 Density_2 Density_3
1 (all)  5.006709  4.088988  2.958971
2 (all)  4.178586  3.812362        NA

r - R循环：如果不存在，则将列添加到表中

1 回答 1

Related

Reference