2

我有以下代码:

set.seed(47)
df <- data.frame(V1 = sample(letters[1:5], size = 10, replace = TRUE),
                 V2 = 101:110)

partial_key <- data.frame(V1 = letters[1:3], V2 = 1:3)

> df
   V1  V2
1   e 101
2   b 102
3   d 103
4   e 104
5   c 105
6   d 106
7   b 107
8   c 108
9   c 109
10  e 110


> partial_key
  V1 V2
1  a  1
2  b  2
3  c  3

我想用列中匹配的相应值替换V2in的值。非匹配项应保持原样。dfpartial_keyV1

使用完整的密钥,我会使用match,它替换正确的值,但将不匹配的值替换为NA

df[, "V2"] <- partial_key[match(df$V1, partial_key$V1), "V2"]
## Replaces too much

我可以用 破解一个解决方案%in%,但是有更好的方法吗?更直观、更少打字的东西?

df[df$V1 %in% partial_key$V1, "V2"] <-
partial_key[match(df$V1[df$V1 %in% partial_key$V1], partial_key$V1), "V2"]
## Works, but is there a better way?
> df
   V1  V2
1   e 101
2   b   2
3   d 103
4   e 104
5   c   3
6   d 106
7   b   2
8   c   3
9   c   3
10  e 110
4

3 回答 3

4

使用%in%是不必要的,因为输出match已经包含该信息。所以你可以做这样的事情:

replacement <- partial_key$V2[match(df$V1, partial_key$V1)]
df$V2 <- ifelse(is.na(replacement), df$V2, replacement)

有时我希望 R 有一个if.na类似于 Excel 的基本功能IFERROR。我在我的 Rprofile 中有它:

if.na <- function(value, value.if.na) ifelse(is.na(value), value.if.na, value)
df$V2 <- if.na(replacement, df$V2)
于 2012-11-09T18:53:26.583 回答
1

另一种解决方案:

comb <- rbind(df, partial_key)
df$V2 <- head(ave(comb$V2, comb$V1,
                  FUN = function(x) tail(x, 1)), -nrow(partial_key))
于 2012-11-09T19:37:52.563 回答
1

您可以合并,然后进行所需的重新排列

> mdf <- merge(df, partial_key, by="V1", all.x=TRUE)
> mdf$V2.x[!is.na(mdf$V2.y)] <- mdf$V2.y[!is.na(mdf$V2.y)]
> mdf
   V1 V2.x V2.y
1   b    2    2
2   b    2    2
3   c    3    3
4   c    3    3
5   c    3    3
6   d  106   NA
7   d  103   NA
8   e  101   NA
9   e  104   NA
10  e  110   NA
> mdf[-3]
   V1 V2.x
1   b    2
2   b    2
3   c    3
4   c    3
5   c    3
6   d  106
7   d  103
8   e  101
9   e  104
10  e  110
于 2012-11-09T18:43:04.137 回答