tree - Weka J48 实现不同的缺失值处理

翻译自：https://stackoverflow.com/questions/24406255 2014-06-25T10:31:18.590

835 次

在一些使用缺失值数据的任务中，我必须使用 J48 树归纳算法。现在我将做一些经验研究，比较 J48 树归纳上下文中的不同缺失值方法，不同的 UCI 训练数据集和不同的人工这些数据集的截肢率（标准，+10%，+40% 截肢）。

我的主要问题是，我如何在 J48 源代码中实现以下方法，或者在我自己的代码中使用 Weka J48 类更好地实现。我可以将这种方法作为元分类器或其他方式处理吗？我想测试的方法与 J48 标准处理和随机森林相对应：

我必须停用集成的 J48(C4.5) 缺失值处理吗？我怎样才能停用这个？我认为 J48(C4.5) 将使用特殊值方法来查找测试、概率分布和在训练数据分区期间将对象拆分为部分，而在分类期间则使用其他方法。

现在其他所有人都可以轻松扩展J48的其他缺失值方法吗？

非常感谢！

0 回答 0