r - 按 NA 水平对因子进行子集

Question

我在 R 中有一个因素，具有 NA 级别。

set.seed(1)
x <- sample(c(1, 2, NA), 25, replace=TRUE)
x <- factor(x, exclude = NULL)
> x
 [1] 1    2    2    <NA> 1    <NA> <NA> 2    2    1    1   
[12] 1    <NA> 2    <NA> 2    <NA> <NA> 2    <NA> <NA> 1   
[23] 2    1    1   
Levels: 1 2 <NA>

如何按<NA>级别子集该因素？我试过的两种方法都不起作用。

> x[is.na(x)]
factor(0)
Levels: 1 2 <NA>
> x[x=='<NA>']
factor(0)
Levels: 1 2 <NA>

score 9 · Accepted Answer

令我惊讶的是，您尝试这样做没有奏效，但这似乎是：

x[is.na(levels(x)[x])]

我通过查看str(x)并看到它是级别而NA不是底层代码到达那里：

str(x)
 Factor w/ 3 levels "1","2",NA: 1 2 2 3 1 3 3 2 2 1 ...

score 3 · Accepted Answer

作为 Ben 的后续行动：

str(x)向您展示问题。因子在内部以整数形式存储，并具有某种“查找”功能。所以：

> all(is.na(x))
[1] FALSE

但

> any(is.na(levels(x)))
[1] TRUE

如本所示，打印向量的实际值：

> levels(x)[x]
 [1] "1" "2" "2" NA  "1" NA  NA  "2" "2" "1" "1" "1" NA  "2" NA  "2" NA  NA  "2" NA  NA       "1" "2" "1" "1"

相对

> x
 [1] 1    2    2    <NA> 1    <NA> <NA> 2    2    1    1    1    <NA> 2    <NA> 2    <NA> <NA> 2    <NA> <NA> 1    2    1    1
Levels: 1 2 <NA>

r - 按 NA 水平对因子进行子集

2 回答 2

Related

Reference