我有一个要求,我需要根据它们与我的连续变量的关联将我的分类变量(具有超过 5 个类别值)分成 5 个组。为此,我将rpart与“ annova ”方法一起使用。
因此,例如,我的分类变量是具有代码1、2、3、4、5、6、7、8、9、10、11、12、13、14、15的类型,所以我想要 5 组这个变量。运行树后,为了只有 5 个组,我需要修剪树。我尝试的一种方法是使用cptable中的nsplit,但是 5 的 nsplit 可能会给我 7-8 片叶子,类似地4 的nsplit可能会给我 5-6 片叶子。
我一直在寻找一个选项,当我修剪时,我只得到 5 片叶子,作为我的 5 组。
有人可以建议我如何通过使用 rpart 来实现这一点。
谢谢 !!