0

我想根据几个变量制作分类树来预测 1 种鸟类的存在/不存在。我知道 rpart 处理单变量分区,而 mvpart 处理多变量分区,但我想将 mvpart 用于我的单变量树,因为它的输出更灵活。有谁知道我不应该这样做的原因?rpart 和 mvpart 中的分割是否会不同,输入相同?

4

1 回答 1

2

不能保证拆分是相同的;mvpart()最小化组内平方和,而rpart分类树将最小化基尼系数(默认情况下为 IIRC)。

您可能最终得到相同的模型/拆分,但由于这两个函数使用两种不同的节点杂质度量,这可能只是侥幸。

仅供参考,mvpart正在拟合回归模型,但您需要分类模型。

最后,考虑使用party包及其功能ctree;它的输出比默认情况下要好得多rpart,但在模型拟合方面又做了些许不同的事情。

顺便说一句,还可以查看plotmo包,其中包括许多树状模型的增强图,包括 IIRC 模型rpart

于 2013-05-07T15:21:46.170 回答