有很多关于替换 NA 值的帖子。我知道可以将下表/框架中的 NA 替换为以下内容:
x[is.na(x)]<-0
但是,如果我想将其限制为仅某些列怎么办?让我给你看一个例子。
首先,让我们从数据集开始。
set.seed(1234)
x <- data.frame(a=sample(c(1,2,NA), 10, replace=T),
b=sample(c(1,2,NA), 10, replace=T),
c=sample(c(1:5,NA), 10, replace=T))
这使:
a b c
1 1 NA 2
2 2 2 2
3 2 1 1
4 2 NA 1
5 NA 1 2
6 2 NA 5
7 1 1 4
8 1 1 NA
9 2 1 5
10 2 1 1
好的,所以我只想将替换限制为“a”和“b”列。我的尝试是:
x[is.na(x), 1:2]<-0
和:
x[is.na(x[1:2])]<-0
哪个不起作用。
我的 data.table 尝试, wherey<-data.table(x)
显然永远不会工作:
y[is.na(y[,list(a,b)]), ]
我想在 is.na 参数中传递列,但这显然行不通。
我想在 data.frame 和 data.table 中执行此操作。我的最终目标是将“a”和“b”中的 1:2 重新编码为 0:1,同时保持“c”的原样,因为它不是逻辑变量。我有一堆专栏,所以我不想一个一个地做。而且,我只想知道如何做到这一点。
你有什么建议吗?