假设我有以下数据集:
set.seed(seed=10)
n <- 10000
s.data <- data.frame(score = rnorm(n,500,100),
gender = sample(c("Male","Female"),size=n,replace=T,prob=c(.4,.6)),
major = sample(c("A","B","C","D"),size=n,replace=T,prob=c(.02,.25,.05,.68)))
我创建以下直方图:
require(ggplot2)
ggplot(s.data, aes(x=score)) + facet_wrap(~ major) +
geom_histogram(binwidth=50,colour="black", fill="white")
因为我想要更多关于主要 A 和 C 的详细信息,所以我绘制了一个密度直方图:
ggplot(s.data, aes(x=score)) + facet_wrap(~ major) +
geom_histogram(binwidth=50,aes(y = ..density..),colour="black", fill="white")
完美到此为止。
当我尝试用分类变量(而不是连续变量)做同样的事情时,我可以做频率但不能绘制密度:
ggplot(s.data, aes(gender)) +
geom_histogram(colour="black", fill="white") +
facet_wrap(~ major)
如我所愿。
但我对这张图不及格:
ggplot(s.data, aes(gender)) +
geom_histogram(aes(y = ..density..),colour="black", fill="white") +
facet_wrap(~ major)
有任何想法吗?提前致谢。