5

假设我有以下数据集:

set.seed(seed=10)
n <- 10000
s.data <- data.frame(score = rnorm(n,500,100),
                     gender = sample(c("Male","Female"),size=n,replace=T,prob=c(.4,.6)),
                     major = sample(c("A","B","C","D"),size=n,replace=T,prob=c(.02,.25,.05,.68)))

我创建以下直方图:

require(ggplot2)
ggplot(s.data, aes(x=score)) + facet_wrap(~ major) +
  geom_histogram(binwidth=50,colour="black", fill="white") 

直方图 1

因为我想要更多关于主要 A 和 C 的详细信息,所以我绘制了一个密度直方图:

ggplot(s.data, aes(x=score)) + facet_wrap(~ major) +
  geom_histogram(binwidth=50,aes(y = ..density..),colour="black", fill="white") 

直方图 2 完美到此为止。

当我尝试用分类变量(而不是连续变量)做同样的事情时,我可以做频率但不能绘制密度:

ggplot(s.data, aes(gender)) + 
   geom_histogram(colour="black", fill="white") + 
   facet_wrap(~ major)

在此处输入图像描述

如我所愿。

但我对这张图不及格:

ggplot(s.data, aes(gender)) + 
       geom_histogram(aes(y = ..density..),colour="black", fill="white") + 
       facet_wrap(~ major)

在此处输入图像描述

有任何想法吗?提前致谢。

4

0 回答 0