我有一个数据库,其中包含分类变量并且具有大量类别。
在这种情况下,我希望将其重新分类为更少的类别 2,并根据它们在另一个变量上的平均值来决定将类别放入其中一个新类别中。
当我的类别数量很少(在本例中为 10 个)时,我使用此脚本
data$V152=as.numeric(data$V152)
data$V152=as.numeric(revalue(as.character(data$V152),
c("2"="0","3"="1", "4"="0","5"="1","6"="1","7"="0", "8"="0","9"="0","10"="0")))
但是我如何使用具有大量类别的分类来做到这一点?
查看图片,我希望将具有上述平均值的类别重新分类为 1,将其他类别重新分类为 2。