9

我在 R 中有一个因素,具有 NA 级别。

set.seed(1)
x <- sample(c(1, 2, NA), 25, replace=TRUE)
x <- factor(x, exclude = NULL)
> x
 [1] 1    2    2    <NA> 1    <NA> <NA> 2    2    1    1   
[12] 1    <NA> 2    <NA> 2    <NA> <NA> 2    <NA> <NA> 1   
[23] 2    1    1   
Levels: 1 2 <NA>

如何按<NA>级别子集该因素?我试过的两种方法都不起作用。

> x[is.na(x)]
factor(0)
Levels: 1 2 <NA>
> x[x=='<NA>']
factor(0)
Levels: 1 2 <NA>
4

2 回答 2

9

令我惊讶的是,您尝试这样做没有奏效,但这似乎是:

x[is.na(levels(x)[x])]

我通过查看str(x)并看到它是级别NA不是底层代码到达那里:

str(x)
 Factor w/ 3 levels "1","2",NA: 1 2 2 3 1 3 3 2 2 1 ...
于 2012-01-26T16:33:06.893 回答
3

作为 Ben 的后续行动:

str(x)向您展示问题。因子在内部以整数形式存储,并具有某种“查找”功能。所以:

> all(is.na(x))
[1] FALSE

> any(is.na(levels(x)))
[1] TRUE

如本所示,打印向量的实际值:

> levels(x)[x]
 [1] "1" "2" "2" NA  "1" NA  NA  "2" "2" "1" "1" "1" NA  "2" NA  "2" NA  NA  "2" NA  NA       "1" "2" "1" "1"

相对

> x
 [1] 1    2    2    <NA> 1    <NA> <NA> 2    2    1    1    1    <NA> 2    <NA> 2    <NA> <NA> 2    <NA> <NA> 1    2    1    1
Levels: 1 2 <NA>
于 2012-01-26T16:38:22.970 回答