3

我有四个 data.frames,它们都具有相同的列,第一个对所有人都相同。在变量列中有一些 NA。

首先,我想用 data.frame 的名称替换每个 data.frame 中的任何值(不是 NA)。其次,我想合并data.frames。在这种情况下,对于每个 NA,都会有一些其他的 data.frame 有一个值,所以我会以每个单元格填充值(或 data.frames 的名称)结束。

这是一个包含两个 data.frame 的示例:

 >A
 name Q  W  E  R  T
 g1   NA NA 4  NA 0
 g2   3  2  NA 4  5
 g3   NA 1  NA 0  0
 g4   0  NA NA 1  9

 >B
 name Q  W  E  R  T
 g1   2  4  NA 1  NA
 g2   NA NA 5  NA NA
 g3   5  NA 0  NA NA
 g4   NA 6  4  NA NA

 >result
 name Q  W  E  R  T
 g1   B  B  A  B  A
 g2   A  A  B  A  A
 g3   B  A  B  A  A
 g4   A  B  B  A  A

我尝试了一些不同的 merge() 和 union() 选项。此外,我试图调整类似问题的答案,但我似乎无法解决这个问题。

创建一个函数以将一个 data.frame 中的 NA 替换为另一个 data.frame 中的值

在 R 中合并具有缺失值的数据帧

先感谢您!

4

2 回答 2

4

我已经为此编写了一个包,因为我反复从数据库文盲的人那里收到部分重叠的 excel 文件。

我将它上传到 CRAN,它应该很快就会可用。那该怎么办是这样的

> install.packages("datamerge")
> library(datamerge)
> version.merge(A, B, add.values=TRUE)
Rows:  4 from `A` #1
       0 from `B` #2

Columns:
Q  Origin: `A` #1
   Imputed 2 values from `B` #2
W  Origin: `A` #1
   Imputed 2 values from `B` #2
E  Origin: `A` #1
   Imputed 3 values from `B` #2
R  Origin: `A` #1
   Imputed 1 values from `B` #2
T  Origin: `A` #1
   Q W E R T
g1 2 4 4 1 0
g2 3 2 5 4 5
g3 5 1 0 0 0
g4 0 6 4 1 9

如果您想在 CRAN 上线之前尝试一下,您可以从http://www.anst.uu.se/chrba104/datamerge_1.0-1.tar.gz获取

于 2012-07-23T07:47:17.820 回答
4

这可能不适用于您,但对于提供的数据......

A <- data.frame(Q=c(NA, 3, NA, 0),
                W=c(NA, 2, 1, NA),
                E=c(4, NA, NA, NA),
                R=c(NA, 4, 0, 1),
                T=c(0,5,0,9), row.names=paste0('g', 1:4), stringsAsFactors=FALSE)

B <- data.frame(Q=c(2, NA, 5, NA),
                W=c(4, NA, NA, 6),
                E=c(NA, 5, 0, 4),
                R=c(1, NA, NA, NA),
                T=c(NA, NA, NA, NA), row.names=paste0('g', 1:4), stringsAsFactors=FALSE)

结果将是 "A" 任何A不是的地方NA。不在的地方B就是“B”NA

result <- A
result[!is.na(A)] <- "A" 
result[!is.na(B)] <- "B"

#   Q W E R T
#g1 B B A B A
#g2 A A B A A
#g3 B A B A A
#g4 A B B A A
于 2012-07-23T00:47:13.980 回答