任何人都可以帮助我使用 Java 中的 Weka API 在 J48 算法中实现替代缺失值处理。
我确信在训练 J48 之前使用预插补方法很容易。
但是,在划分训练日期的情况下使用代理拆分属性(如 Breiman 在 CART 中所做的那样)而不是 J48 标准方法(C4.5 中的 Quinlan)将案例从具有已知值的观察案例中拆分为概率分布。
任何人都可以给我一些信息、提示、帮助,在 Weka API 和源代码中必须修改以用代理拆分替换标准吗?
任何人都可以帮助我使用 Java 中的 Weka API 在 J48 算法中实现替代缺失值处理。
我确信在训练 J48 之前使用预插补方法很容易。
但是,在划分训练日期的情况下使用代理拆分属性(如 Breiman 在 CART 中所做的那样)而不是 J48 标准方法(C4.5 中的 Quinlan)将案例从具有已知值的观察案例中拆分为概率分布。
任何人都可以给我一些信息、提示、帮助,在 Weka API 和源代码中必须修改以用代理拆分替换标准吗?
Look at weka source code weka.classifiers.trees.j48.C45ModelSelection from line 152 (Find "best" attribute to split on). It uses info gain ratio as splitting criteria.