我想将计数小于 n 的所有因素组合成一个名为“Else”的因素
例如,如果 n = 3,那么在下面的 df 中,我想将“c”、“d”和“e”组合为“Else”:
df = data.frame(x=c(1:10), y=c("a","a","a","b","b","b","c","d","d","e"))
我首先得到一个包含所有低计数值的 df:
library(plyr)
lowcounts = ddply(df, "y", function(z){if(nrow(z)<3) nrow(z) else NULL})
我知道我可以手动更改这些,但实际上我有几十个级别,所以我需要自动化。
我只想选择并重命名级别(df)中的级别 %in% lowcount,其余部分保持不变,但不知道如何继续。