2

我有一个大型数据集,讨论板上的线程寿命。我想要一个显示寿命分布的直方图,所以我这样做了:

dall <- read.csv("lifespan.csv")
colnames(dall) <- c("thread.id", "seconds.alive", "start.time")
hist(dall$seconds.alive)

这产生了这个难以阅读的图像: http://dl.dropbox.com/u/285483/tmp/screenshot297.png

我的问题是 a) 将 y 轴更改为对数刻度是使其更具可读性的好方法吗?显然有些人认为将 y 轴更改为对数是一个坏主意。

b)我该怎么做?

4

1 回答 1

4

我会尝试hist(log10(dall$seconds.alive))改用。

还尝试指定breaks=100或更小/更大的数字:

hist(log10(dall$seconds.alive), breaks=100)
于 2010-11-10T21:42:27.073 回答