我有一个包含空白缺失值和 NA 的大型数据框。执行 summary(factor(df$col)) 给了我类似的东西
A
123
B
50000
90000
C
26000
NA's
12476
(注意 . 之后的空白50000
。)
并且sum(is.na(df$col))
是 12476,与 s 的数量相同NA
,但我希望它是空白和NA
s 的总和。
我试图通过做
levels(df$col) <- c("A", "B", "Blank", "C")
然后尝试为空白创建一个级别df$col <- factor(df$col, exclude="Blank")
,它说NA
生成了's但我的输出是相同的。有谁知道如何根据因子水平创建 NA 或有更好的解决方案来替换缺失值?我认为问题可能是空格不止一个空格字符,所以它们没有变成NA
's 但我不知道如何确认。