4

我有一个数据框,其中包含(除其他外)一个带有浓度的数字列和一个带有状态标志的因子列。此状态标志包含 NA。

这是一个例子

df<-structure(list(conc = c(101.769, 1.734, 62.944, 92.697, 25.091, 27.377, 24.343, 55.084, 0.335, 23.280), status = structure(c(NA, NA, NA, NA, NA, NA, 2L, NA, 1L, NA), .Label = c("<LLOQ", "NR"), class = "factor")), .Names = c("conc", "status"), row.names = c(NA, -10L), class = "data.frame")

我想将浓度列替换为标志列的某些值的字符串,或者将浓度值格式化为一定数量的有效数字。

当我尝试这个

ifelse(df$status=="NR","NR",df$conc)

状态标志中的 NA 不会触发真或假条件(并返回 NA) - 正如文档所暗示的那样。我可以遍历行并在每一行上使用 IF 然后 else 但这似乎效率低下。

我错过了什么吗?我也尝试过 as.character(df$status) ,但它不起作用。我的魔力一定越来越低了......

4

3 回答 3

5

使用%in%代替==

ifelse(df$status %in% "NR","NR", df$conc)

两种方法的并排比较:

data.frame(df, ph = ifelse(df$status=="NR","NR",df$conc), mp = ifelse(df$status %in% "NR","NR",df$conc))

查看?match更多信息 - 我不确定我能否很好地解释它。

于 2010-03-31T15:53:45.370 回答
3

您必须明确测试,NA以便您可以使用:

ifelse(df$status=="NR" | is.na(df$status),"NR",df$conc) # gives you NR for NA

或者

ifelse(df$status=="NR" & !is.na(df$status),"NR",df$conc) # gives you df$conc for NA
于 2010-03-31T13:47:41.057 回答
2

如何测试缺失:

ifelse(is.na(df$status), df$conc, as.character(df$status))
于 2010-03-31T13:19:20.790 回答