我有一个以天为单位的年龄列表,我希望在密度图上以年为单位显示它们。
我做了这两种方法 - 将 x 轴上的标签更改为年,并将数据除以 365。这些方法给了我不同的密度估计:
df <- data.frame(id = 1:80000, age = rnorm(80000, 46, 5) * 365)
第一个图是使用以下方法生成的:
breaks <- seq(from = min(df$age), to = max(df$age), by = 10*365)
ggplot(data = df, aes(x = age)) +
geom_density(aes(y = ..density..)) +
scale_x_continuous(breaks= breaks, labels = floor(breaks/365))
y 轴上显示的密度范围为 0 到 0.0002
但是,当我这样做时(将年龄除以 365 得到年份 - 而不仅仅是像上面那样更改 x 标签):
ggplot(data = df, aes(x = age/365)) +
geom_density(aes(y = ..density..))
该图看起来相同,但密度范围从 0 到 0.08 我很难理解发生了什么 - 为什么两个图之间的密度不同?