我有一个由 100 多列组成的数据集,所有列都是类型因子。前任:
animal fruit vehicle color
cat orange car blue
dog apple bus green
dog apple car green
dog orange bus green
在我的数据集中,我需要删除所有具有每个级别少于 5 个观察值的因子的列。在此示例中,如果我想删除每个级别的观察量小于或等于1
、blue
或的所有列cat
,则该算法将删除列animal
和color
。最优雅的方法是什么?