我有一个相当基本的问题。我在一列中有几个值,我想用一个值替换它们,例如:
a<-data.frame(T=LETTERS[5:20],V=rnorm(16,10,1))
我想将 T 中的所有“E”、“S”、“T”更改为“AB”,所以我尝试了
a[a$T==c("E","S","T")]<-"AB"
它给了我几个警告,最后全部替换为“AB”
我认为这与级别和级别的标签有关,但我无法仅替换其中的一些值,我必须重新标记每个值。很抱歉给您带来麻烦,感谢您的帮助!
您可以使用recode()
库中的函数car
来更改因子的值。
library(car)
a$T<-recode(a$T,"c('E','S','T')='AB'")
如果您需要用不同的其他值替换不同的值,则可以在一个函数调用中编写所有语句。
recode(a$T,"c('E','S','T')='AB';c('F','G','H')='CD'")
这将维护您的数据结构(您猜到的一个因素):
x <- levels(a$T)
levels(a$T) <- ifelse(x %in% c("E","S","T"), "AB", x)
或者
levels(a$T)[levels(a$T) %in% c("E","S","T")] <- "AB"
编辑:如果你有很多这样的替换,它有点复杂但并非不可能:
from <- list(c("E","S","T"), c("J", "K", "L"))
to <- c("AB", "YZ")
find.in.list <- function(x, y) match(TRUE, sapply(y, `%in%`, x = x))
idx.in.list <- sapply(levels(a$T), find.in.list, from)
levels(a$T) <- ifelse(is.na(idx.in.list), levels(a$T), to[idx.in.list])
a$T
# [1] AB F G H I YZ YZ YZ M N O P Q R AB AB
# Levels: AB F G H I YZ M N O P Q R
你真的想要那里的因素吗???如果没有(我认为你没有)这样做options(stringsAsFactors=FALSE)
所以它比那简单得多...... =>a[a$T %in% c("E","S","T"),"T"]<-"AB"