7

在尝试早先回答一个问题时,我遇到了一个看起来应该很简单的问题,但我无法弄清楚。

如果我有数据框列表:

df1 <- data.frame(a=1:3, x=rnorm(3))
df2 <- data.frame(a=1:3, x=rnorm(3))
df3 <- data.frame(a=1:3, x=rnorm(3))

df.list <- list(df1, df2, df3)

我想rbind在一起,我可以做到以下几点:

df.all <- ldply(df.list, rbind)

但是,我想要另一列来标识data.frame每一行的来源。我希望能够使用该deparse(substitute(x))方法(此处和其他地方)来获取相关名称data.frame并添加一列。这就是我的处理方式:

fun <- function(x) {
  name <- deparse(substitute(x))
  x$id <- name
  return(x)
}
df.all <- ldply(df.list, fun)

哪个返回

  a          x      id
1 1  1.1138062 X[[1L]]
2 2 -0.5742069 X[[1L]]
3 3  0.7546323 X[[1L]]
4 1  1.8358605 X[[2L]]
5 2  0.9107199 X[[2L]]
6 3  0.8313439 X[[2L]]
7 1  0.5827148 X[[3L]]
8 2 -0.9896495 X[[3L]]
9 3 -0.9451503 X[[3L]]

所以显然列表中的每个元素都不包含我认为的名称。谁能建议一种方法来获得我的期望(如下所示)?

  a          x  id
1 1  1.1138062 df1
2 2 -0.5742069 df1
3 3  0.7546323 df1
4 1  1.8358605 df2
5 2  0.9107199 df2
6 3  0.8313439 df2
7 1  0.5827148 df3
8 2 -0.9896495 df3
9 3 -0.9451503 df3
4

4 回答 4

10

用名字定义你的列表,它应该给你一个名字的.iddata.frame

df.list <- list(df1=df1, df2=df2, df3=df3)
df.all <- ldply(df.list, rbind)

输出:

  .id a           x
1 df1 1  1.84658809
2 df1 2 -0.01177462
3 df1 3  0.58579469
4 df2 1 -0.64748756
5 df2 2  0.24384614
6 df2 3  0.59012676
7 df3 1 -0.63037679
8 df3 2 -1.17416295
9 df3 3  1.09349618

data.frame然后你可以从列中知道名称df.all$.id

编辑: 根据@Gary Weissman 的评论,如果您想自动生成名称,您可以这样做

names(df.list) <- paste0('df',seq_along(df.list)
于 2013-03-05T02:12:13.367 回答
3

仅使用 base,可以尝试以下操作:

dd <- lapply(seq_along(df.list), function(x) cbind(df_name = paste0('df',x),df.list[[x]]))

do.call(rbind,dd)
于 2013-03-05T02:04:25.907 回答
2

但是,在您的定义中,df.list没有名称,即使那样,deparse 替代成语似乎也无法轻松工作(作为lapply调用.Internal(lapply(X, FUN))-您必须查看源代码以查看对象名称是否可用以及如何获取它

就像是

names(df.list) <- paste('df', 1:3, sep = '')

foo <- function(n, .list){
         .list[[n]]$id <- n
         .list[[n]]
       } 

     a          x id
1 1  0.8204213  a
2 2 -0.8881671  a
3 3  1.2880816  a
4 1 -2.2766111  b
5 2  0.3912521  b
6 3 -1.3963381  b
7 1 -1.8057246  c
8 2  0.5862760  c
9 3  0.5605867  c
于 2013-03-05T02:06:13.417 回答
2

如果你想使用你的function, 而不是deparse(substitute(x))use match.call(),并且你想要第二个参数,请确保将其转换为character

 name <- as.character(match.call()[[2]])
于 2013-03-05T02:38:34.657 回答