几年来,我收到了一个很好的数据集(红色),用于检查许多树木的橡子形态和寄生虫(象鼻虫)。然而,每棵树的样本量变化很大(5 - 75 颗橡子/树)。我将为一棵树/年组合设置至少 20 个橡子,以输入将要分析的数据集。
如何根据该组的(tree.id)计数选择任何一年(年)的组?
很高兴与 dplyr 一起工作,但我不确定如何使用 dplyr 使用该过滤器创建数据集
到目前为止我所拥有的
group_by(tree.id) %>%
filter(n() >=20)
谢谢,
杰夫
2012L, 2012L, 2012L, 2012L, 2012L, 2012L, 2012L, 2012L, 2012L,
2012L, 2012L, 2012L, 2012L, 2012L), tree.id = c(45L, 87L, 87L,
87L, 87L, 87L, 87L, 87L, 87L, 87L, 87L, 87L, 87L, 87L, 87L, 87L,
87L, 87L, 205L, 87L), species = c("RO", "RO", "RO", "RO", "RO",
"RO", "RO", "RO", "RO", "RO", "RO", "RO", "RO", "RO", "RO", "RO",
"RO", "RO", "RO", "RO"), germination = c(0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L),
seed.mass = c(5.305, 5.152, 5.225, 7.684, 6.902, 7.809, 8.48,
3.606, 6.541, 8.531, 8.233, 6.284, 6.855, 3.33, 7.628, 7.778,
5.955, 5.332, 2.358, 7.617)), row.names = c(NA, 20L), class = "data.frame")