0

在一些使用缺失值数据的任务中,我必须使用 J48 树归纳算法。现在我将做一些经验研究,比较 J48 树归纳上下文中的不同缺失值方法,不同的 UCI 训练数据集和不同的人工这些数据集的截肢率(标准,+10%,+40% 截肢)。

我的主要问题是,我如何在 J48 源代码中实现以下方法,或者在我自己的代码中使用 Weka J48 类更好地实现。我可以将这种方法作为元分类器或其他方式处理吗?我想测试的方法与 J48 标准处理和随机森林相对应:

  • 删除缺少属性的对象(完整案例)
  • Hot-Deck-Methods(寻找内部捐赠者的概念)
  • 代理拆分(使用其他属性进行拆分,例如 CART 处理缺失值)
  • 使用其他决策树(概念->缺失属性值)进行插补以找到缺失的属性值

我必须停用集成的 J48(C4.5) 缺失值处理吗?我怎样才能停用这个?我认为 J48(C4.5) 将使用特殊值方法来查找测试、概率分布和在训练数据分区期间将对象拆分为部分,而在分类期间则使用其他方法。

现在其他所有人都可以轻松扩展J48的其他缺失值方法吗?

非常感谢!

4

0 回答 0