r - 当分组因子有缺失值时，基本 R 中的箱线图可以显示“NA”吗？

Question

我要这个：

以 NA 作为类别名称的箱线图

而且我认为传递na.action=na.pass给 boxplot 会让 NA 出现在分组名称中。这是一些示例代码：

#Build a fake dataset
set.seed(212012)
nn = 100
sample_data <- data.frame( score = c( rpois(nn, 1), rpois(nn, 2),
                                      rpois(nn, 1.5), rpois(nn, 3)),
                          category = c( rep(0, nn), rep(1, nn), 
                                        rep(2, nn), rep(NA, nn) ))   

boxplot( score ~ category, data=sample_data, na.action=na.pass )

但这会产生：

在此处输入图像描述

获得我想要的东西的“简单”方法是以下代码，但它不适合探索性数据分析：

sample_data$category2 <- sample_data$category
sample_data$category2[ is.na(sample_data$category) ] <- 'NA'
boxplot( score ~ category2, data=sample_data )

R大师那里有任何提示吗？我能够从这个更一般的讨论中找到关于 na.pass 的信息，以及来自 Ripley 教授的 na.pass 的起源。但是，出现在将被因子拆分的数据中的缺失数据 (NA) 与因子本身中的缺失数据之间似乎没有区别。我错过了一些简单的东西，还是这更像是一个功能要求？

score 7 · Accepted Answer

boxplot( score ~ factor(category,exclude=NULL), data=sample_data)

默认因子行为是exclude=NA. 我假设呼叫的内部boxplot是一个factor呼叫，如果它还不是一个因素。这只是强制分解包含您的 NA 值。

r - 当分组因子有缺失值时，基本 R 中的箱线图可以显示“NA”吗？

1 回答 1

Related

Reference