Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
rpart 和党的专家有几个问题。
1)我试图了解rpart和party中控制参数“minbucket”的区别。rpart 中的 minbucket 未加权是否正确(即使提供了适合树的权重)?
2) 谁能简要描述一下 rpart 算法中如何使用权重?我试图下载并查看源代码,但我无法理解它是一个新手。rpart 调用了一个 C 函数(C_rpart),这似乎是 rpart 的主要部分,但我找不到更多关于它的信息。
提前非常感谢。
rpart(以及大多数其他机器学习算法)中的权重参数可以被认为完全等同于多次复制这些训练项目。权重为 5 与该行重复 5 次相同。如果您的数据集足够小,您可以使用一些简单的代码显式创建它:
data[rep(1:nrow(data),times=data$weights),]