我在 R 中有一个如下所示的数据框:
bin Family Genus
1 blue flower
1 green moss
1 blue tree
2 red bird
2 red lizard
可以多次拥有同一个 bin,并且相关的科/属可能不是一个 bin 所独有的。我正在寻找与每个垃圾箱相关联的所有家庭,以及每个家庭与每个垃圾箱相关联的次数。我将重复测试属。
我最终会尝试确定与每个 bin 关联的名称是否存在差异,这样我就可以为每个 bin 选择最常用的名称,并为该 bin 分配一个名称。我的数据框很大,有数千个垃圾箱。