3

我有一个长度为 15,000 的数据集,实际值从 0 到 100。我的数据集严重向左倾斜。我正在尝试完成以下垃圾箱:0、1、2、3、4、5、6、7、8、9、10、>10。到目前为止我所做的是创建以下内容:

  breakvector = c(0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 100) 

并运行:

  hist(datavector, breaks=breakvector, xlim=(0, 13))

但是,这似乎会导致直方图不包含大于 13 的数据。有没有人知道如何让 R 将最后一个 bin 中的所有其余数据分箱。提前致谢。

4

1 回答 1

4

这个怎么样

datavector<-c(sample(1:9, 40, replace=T), sample(10:100, 20, replace=T))
breakvector <- c(0:11)
hist(ifelse(datavector>10,11,datavector), breaks=breakvector, xlim=c(0, 13), xaxt="n")
axis(1, at=1:11-.5, labels=c(1:10, ">10"))

我没有调整休息时间,而是将所有值>10放入 11 的 bin 中。然后我相应地更新轴。

在此处输入图像描述

于 2014-05-29T23:13:48.497 回答