0

我有一个这样的数据框

ID      VAR
a       3
b       2
c       6
b       8
z       1
c       5
b       7

另一个计算一个ID出现的次数

numb    nrec

a       1
b       3
c       2
z       1

我想做的是更改只有一条记录的所有ID的ID名称,pe

ID      VAR
-1      3
b       2
c       6
b       8
-1      1
c       5
b       7
4

1 回答 1

1

这是一个丑陋的解决方案

> ind <- as.character(df2$numb[df2$nrec==1])
> df1$ID <- as.character(df1$ID)
> df1$ID[as.character(df1$ID) %in% ind] <- "-1"
> df1
  ID VAR
1 -1   3
2  b   2
3  c   6
4  b   8
5 -1   1
6  c   5
7  b   7

如果你想ID再次成为因素,那么df1$ID <- as.factor(df1$ID)

更好的方法是使用revalueplyr 包:

library(plyr)
df1$ID <- with(df1, revalue(ID, c("a"="-1", "z"=-1)))

编辑:使用基本函数的更简洁的方法

ind <- as.character(df2$numb[df2$nrec==1])
levels(df1$ID)[levels(df1$ID)==ind] <- "-1"

你甚至可以直接使用df1,不需要使用df2。使用table和一些索引...

levels(df1$ID)[levels(df1$ID)==with(df1, levels(ID)[table(ID)==1])] <- "-1"
于 2013-10-18T11:00:02.803 回答