我要这个:
而且我认为传递na.action=na.pass
给 boxplot 会让 NA 出现在分组名称中。这是一些示例代码:
#Build a fake dataset
set.seed(212012)
nn = 100
sample_data <- data.frame( score = c( rpois(nn, 1), rpois(nn, 2),
rpois(nn, 1.5), rpois(nn, 3)),
category = c( rep(0, nn), rep(1, nn),
rep(2, nn), rep(NA, nn) ))
boxplot( score ~ category, data=sample_data, na.action=na.pass )
但这会产生:
获得我想要的东西的“简单”方法是以下代码,但它不适合探索性数据分析:
sample_data$category2 <- sample_data$category
sample_data$category2[ is.na(sample_data$category) ] <- 'NA'
boxplot( score ~ category2, data=sample_data )
R大师那里有任何提示吗?我能够从这个更一般的讨论中找到关于 na.pass 的信息,以及来自Ripley 教授的 na.pass 的起源。但是,出现在将被因子拆分的数据中的缺失数据 (NA) 与因子本身中的缺失数据之间似乎没有区别。我错过了一些简单的东西,还是这更像是一个功能要求?