9

我有三个独立data.frames的。这三个data.frames具有相同的列数和相同的行数。此外,它们具有相同的列名。我正在尝试根据列名合并三个 data.frames。我正在使用以下代码来合并两个 data.frames 并返回匹配的数量。

Merged_DF = sapply(names(DF1),function(n) nrow(merge(DF1, DF2, by=n)))

问题是,虽然在这个例子中有两个 data.frames,但在我的例子中,我有 3 个 data.frames。如何修改代码以合并三个 data.frame 而不是两个?我试图以这种方式修改字符串,只需添加第三个 data.frame 但它不起作用:

  Merged_DF = sapply(names(DF1),function(n) nrow(merge(DF1, DF2, DF3,  by=n)))

它返回以下错误:

 Error in fix.by(by.x, x) :  'by' must specify column(s) as numbers, names or logical

前任:

DF1

 G1  G2  G3
  a   b   f
  b   c   a
  c   d   b

DF2

 G1  G2  G3
  A   b   f
  b   c   a
  h   M   b

DF3

 G1  G2  G3
  a   b   f
  b   l   a
  j   M   v

data.frames 有大约 250 行和 50 列。

4

3 回答 3

11

您可以使用该Reduce功能合并多个数据框:

df_list <- list(DF1, DF2, DF3)
Reduce(function(x, y) merge(x, y, all=TRUE), df_list, accumulate=FALSE)

merge_recursereshape包装中:

library(reshape)
data <- merge_recurse(df_list)

另请参阅 R Wiki:合并数据帧

于 2013-03-08T10:32:21.767 回答
3

在今天研究了同样的问题几个小时之后,我想出了这个简单而优雅的解决方案,它结合了“dplyr”管道和基本的 R“merge()”函数。

MergedDF <- merge(DF1, DF2) %>%
              merge(DF3)

正如您在帖子中提到的那样,这假设列名相同,并且您要合并的每个数据框中的行数相同。这也将自动消除在合并过程中使用的任何重复列(即标识符)。

于 2019-07-07T00:55:04.923 回答
0

以防万一有人想合并具有相同列名但行号不相等的多个数据框,这篇文章很有帮助:https ://medium.com/coinmonks/merging-multiple-dataframes-in-r-72629c4632a3

基本上,您使用 do.call 和 rbind 函数:

Merged <- do.call("rbind", list(df1, df2, df3, df4))
于 2021-01-18T08:34:42.710 回答