我使用以下方法绘制一些分布:
geom_density(aes(my.variable,
color=my.factor,
group=my.replicates,
y=..count..))
考虑到我在 my.factor 的每个级别内没有相同数量的复制 -> 我不能只删除'group' 参数,因为 ..count.. 取决于复制的数量。因此,我想要类似 ..count../number of replicates 之类的东西
这是上下文和可重现的示例
我在 2 个栖息地(a 和 b)进行了采样:鱼的数量和每个个体的体型。我在栖息地之间进行了不同的采样工作。(ra 和 rb 分别是在栖息地 a 和 b 内采样的重复数量)我对栖息地之间在鱼类丰度和体型方面的平均差异感兴趣。但是,我不知道如何处理我没有相同数量的副本这一事实。
数据
#number of replicat
ra=4;rb=6
#number of individuals (lambda of poisson distribution)
na=30;nb=60
#size of individuals (lambda of poisson distribution)
sa=90;sb=80
#data for habitat a
dfa=data.frame()
for (ri in 1:ra){
habitat="a"
nb_rep=ra
replicat=paste("r",ri,sep="")
size=rpois(rpois(1,na),sa)
dfa=rbind.data.frame(dfa,data.frame(habitat,nb_rep,replicat,size))
}
#data for habitat b
dfb=data.frame()
for (ri in 1:rb){
habitat="b"
nb_rep=rb
replicat=paste("r",ri,sep="")
size=rpois(rpois(1,nb),sb)
dfb=rbind.data.frame(dfb,data.frame(habitat,nb_rep,replicat,size))
}
#whole data set
df=rbind(dfa,dfb)
地块
require(ggplot2)
summary(df)
密度
ggplot(df,aes(size,color=habitat))+
geom_density(aes(y=..density..))
数数
ggplot(df,aes(size,color=habitat))+
geom_density(aes(y=..count..))
但是,如果没有以相同的努力对栖息地进行采样,即不同数量的重复,这是有偏见的
计数,考虑不同的重复
ggplot(df,aes(size,color=habitat,group=paste(habitat,replicat)))+
geom_density(aes(y=..count..))
从最后一个图中,如何获得重复的平均线?谢谢