3

rpart 和党的专家有几个问题。

1)我试图了解rpart和party中控制参数“minbucket”的区别。rpart 中的 minbucket 未加权是否正确(即使提供了适合树的权重)?

2) 谁能简要描述一下 rpart 算法中如何使用权重?我试图下载并查看源代码,但我无法理解它是一个新手。rpart 调用了一个 C 函数(C_rpart),这似乎是 rpart 的主要部分,但我找不到更多关于它的信息。

提前非常感谢。

4

1 回答 1

0

rpart(以及大多数其他机器学习算法)中的权重参数可以被认为完全等同于多次复制这些训练项目。权重为 5 与该行重复 5 次相同。如果您的数据集足够小,您可以使用一些简单的代码显式创建它:

data[rep(1:nrow(data),times=data$weights),] 
于 2015-07-31T15:38:41.633 回答