“j48”的相关标签问题_Stack Overflow中文网

0 投票

2 回答

3155 浏览

machine-learning - weka J48 功能选择

我正在使用 Weka 并应用 J48 来构建我的分类器。我有 40 个功能和 2000 个实例（700 个 a 类和 1300 个 b 类）。

J48 决策树只使用了 40 个特征中的 2 个！无论如何，是否允许 J48 使用所有功能，或者是否有任何其他算法允许使用所有功能？

提前致谢。

2013-01-31T01:31:01.963

0 投票

2 回答

2941 浏览

machine-learning - Weka 如何使用 J48 计算 Precision？

我是数据挖掘和 Weka 的新手。我使用 GUI 在 Weka 中使用J48构建了一个分类器。当 Weka 完成运行时，它会说：

从我自己的代码（使用 IKVM.NET 的 C#）运行时，我使用相同的未标记数据集重新评估我的模型，将预测类的结果保存到 ARFF 文件中，并计算从 1500 条记录中获得的结果。

大约 1300 条记录被正确分类，200 条没有，这给出了（我认为）86% 的精度测量。

这个对吗？那为什么结果会不一样呢？

machine-learning classification weka precision j48

2015-04-13T12:13:16.050

0 投票

0 回答

538 浏览

java - 从每个映射器打印一个混淆矩阵而不是多个矩阵

我正在尝试打印 weka j48 算法的混淆矩阵，并且我得到了多个矩阵作为输出。

这是运行整个程序的类。它负责从用户那里获取输入，设置映射器和归约器，组织 weka 输入等。

映射器类

这个类是 weka 分类器的映射器，它被赋予了一大块数据，并设置了一个分类器以在该数据上运行。该方法中还发生了许多其他处理。

减速机类

这个类是 weka 分类器输出的化简器，它从映射器中得到一堆交叉验证的数据块，它的工作是将数据聚合到一个解决方案中。

最后是 InputFormatClass

接受 JobContext 并返回拆分成片段的数据列表基本上这是处理大型数据集的一种方式。这种方法允许我们将一个大数据集拆分成更小的块以跨工作节点传递（或者在我们的例子中，只是为了让生活更轻松一点，并将这些块传递给单个节点，这样它就不会被一个大数据集淹没)

java hadoop mapreduce weka j48

2015-04-21T09:26:30.883

0 投票

1 回答

147 浏览

machine-learning - 结果 weka j48 分类实例不正确

我已经建立了一棵树来对实例进行分类。在我的树中，有 14 个属性。每个属性由监督离散离散。当我创建一个新实例时，我将值放在这个实例中并在我的树中分类，我发现结果是错误的。于是我调试了我的程序，发现实例的值没有正确划分区间。例如：
实例的值：0.26879699248120303 被划分为'(-inf-0]'。

为什么？

machine-learning weka j48

2015-04-24T03:35:31.603

0 投票

1 回答

478 浏览

weka - 相同的决策树，不同的结果

我在做一个机器学习应用，使用 Weka 进行测试，比较分类算法等。在 Weka 上进行测试操作后，我决定使用 J48 决策树。我解析了 Weka 生成的修剪树并将其实现为 C 中的 if-then 格式。但是，如果我测试了在我的程序中用作 Weka 输入的数据，结果与 Weka 的混淆矩阵不同。在 Weka 的测试选项中，我选择了“使用训练集”并使用了该决策树。这是混淆矩阵和我的结果：

=== 混淆矩阵 ===

我的程序结果：

尽管一切都相同（决策树、数据、特征值、函数等），但为什么我会得到这些不同的结果？Weka 是否有可能产生/显示错误的决策树？

weka decision-tree j48

2015-04-30T07:42:58.357

0 投票

1 回答

297 浏览