我正在尝试使用山脊图来可视化一些数据,但我想知道是否有一种方法可以对山脊的密度进行加权。
基本上我有以下几点:
set.seed(1)
example <- data.frame(matrix(nrow=100,ncol=3))
colnames(example) <- c("year","position","weight")
example$year <- as.character(rep(c(1,2,3,4,5),each=20) )
example$position <- runif(100,1,10)
example$weight <- sample(1:3,100,replace = T)
5 个不同年份的职位样本。我想用脊图绘制分布随时间的变化,但在数据集中,还有一个“权重”列,这意味着一些样本比其他样本计数更多。有没有办法将其合并到我的山脊分布图中?还有一种方法可以使样本*重的行比样本少的行高吗?所以不将每年的身高标准化为一个?
ggplot(example,aes(x=position,y=year))+
ggridges::geom_density_ridges()+
theme_classic()
我在想我可以尝试通过管道传输数据集以重复行以获取它们拥有的权重值的数量,因此它们的计数次数将超过 x 次(或“权重”次数)并更改密度。不能完全弄清楚如何做到这一点。另外,在我的数据集中,权重不是整数,所以我希望有更好的解决方案。
或者,是否有另一种可能实现这一目标的包/技术?