5

我正在尝试在 geom_box 图上添加极值(异常值或非异常值)的标签。我发现了这个问题,这几乎与我的 [ geom_boxplot 中的极值标签 ggplot2 ] 几乎完全相同 yonicd 提供的答案几乎对我有用:

df=rbind(data.frame(id=rep("1",100),var=paste0("V",seq(1,100)),
         val=rnorm(100,0,5)),
         data.frame(id=rep("2",100),var=paste0("V",seq(1,100)),
         val=rnorm(100,0,3)))


df_bound=df%.%group_by(id)%>%do(.,data.frame(val=boxplot.stats(.$val)$out))
df_bound=left_join(df_bound, df, by=c("id","val"))

ggplot(df,aes(x=id, y=val, fill=id, label=var)) + geom_boxplot() +
geom_point(aes(group=id), data=df_bound)+
geom_text(aes(group=id), data=df_bound, hjust=-1, size=4)

很明显,我只需要替换 [ $out] in

 df_bound=df%.%group_by(id)%>%do(.,data.frame(val=boxplot.stats(.$val)$out))

有极值而不是异常值。如果我使用

df_bound=df%.%group_by(id)%>%do(.,data.frame(val=boxplot.stats(.$val)$stats))

异常值的标签不会出现。如果解决这个问题怎么办?

4

1 回答 1

0

因此代码适用于最新版本的 dplyr:将%.%操作符更改为 magrittr pipe %>%。添加了 [c(1,5)],它对 boxplot.stats$stats 中胡须的“下”和“上”极端进行了子集化。

df_bound <- df%>%group_by(id)%>%do(.,data.frame(val=boxplot.stats(.$val)$stats[c(1,5)]))

于 2017-05-15T12:49:41.183 回答