2

我正在尝试使用 rpart 对具有 16 个变量和 420 个观察值的数据集进行分类(该数据集是http://archive.ics.uci.edu/ml/datasets/Arrhythmia数据集的子集;我只选择了某些变量并排除了缺少观察)。

我正在运行的代码如下,问题是它似乎陷入了无限循环:

library(rpart)
newdata_frame <- data.frame(newdata)
tree <- rpart(class~ ., data=newdata_frame, method="class")

我对 rpart 很陌生,因此我对如何尝试解决这个问题没有太多想法。我尝试在同一个数据集上运行“树”,它运行良好。

关于为什么 rpart 会陷入无限循环的任何想法?谢谢您的帮助!赞赏!L.

4

1 回答 1

0

问题可能与某些类的观察值很少(有些为 0,但这些被忽略)有关。既然你说树工作正常,我假设缓慢是在 rpart 算法的修剪阶段的某个地方。这是已经构建树的阶段,但 rpart 算法决定通过删除一些分区(分支)来减少过度拟合。

快速解决方法可能是预测受试者是否患有任何形式的心律失常(即,1 级与其他类型的心律失常)。

于 2013-10-08T17:05:36.620 回答