0

我正在尝试可视化决策树如何应用于测试集,并且我正在使用 Weka 的 J48 决策树。Weka 通过评估决策树并到达叶子来将每个样本识别为一个类别。当然,多个叶子被标记为同一个类。有谁知道如何让 Weka 为每个样本说出它用来标记该样本的叶子?

X < 47
|  Y > 10  : Class1 (...)
|  Y <= 10 : Class2 (...)
X >= 47
|  Y > 15  : Class1 (...)
|  Y <= 15
|  |  Z > 10  : Class2 (...)
|  |  Z <= 10 : Class1 (...)

我想要这样的话“样本 15 被归类为 Class1,因为 (X>=47, Y<=15, Z<=10)”或类似的东西。

或者,我想要“27 个样本被归类为 Class1,因为 (X>=47, Y<=15, Z<=10)”的内容。

或者,是否有人知道有人将这些信息可视化的实例,或者其他软件会吐出这些信息?谢谢。

4

1 回答 1

0

如果有人知道,我仍然想要一个真正的答案,但我的答案是 Weka 不包含这种能力。我的解决方案是做一个我需要的东西。它在这里可用:

GitHub:决策树DNA

我还没有完成它。它会用数字构建一个很酷的图表,但它已经吐出了我想要的那些数字。哦 - 它吐出的数字是“27 个样本被归类为 Class1,因为 (X>=47, Y<=15, Z<=10)”品种,但很容易修改为吐出“样本 15 被分类作为 Class1 因为 (X>=47, Y<=15, Z<=10)”。

于 2012-12-14T23:43:15.170 回答