问题标签 [j48]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
machine-learning - weka J48 功能选择
我正在使用 Weka 并应用 J48 来构建我的分类器。我有 40 个功能和 2000 个实例(700 个 a 类和 1300 个 b 类)。
J48 决策树只使用了 40 个特征中的 2 个!无论如何,是否允许 J48 使用所有功能,或者是否有任何其他算法允许使用所有功能?
提前致谢。
machine-learning - Weka 如何使用 J48 计算 Precision?
我是数据挖掘和 Weka 的新手。我使用 GUI 在 Weka 中使用J48构建了一个分类器。当 Weka 完成运行时,它会说:
从我自己的代码(使用 IKVM.NET 的 C#)运行时,我使用相同的未标记数据集重新评估我的模型,将预测类的结果保存到 ARFF 文件中,并计算从 1500 条记录中获得的结果。
大约 1300 条记录被正确分类,200 条没有,这给出了(我认为)86% 的精度测量。
这个对吗?那为什么结果会不一样呢?
java - 从每个映射器打印一个混淆矩阵而不是多个矩阵
我正在尝试打印 weka j48 算法的混淆矩阵,并且我得到了多个矩阵作为输出。
这是运行整个程序的类。它负责从用户那里获取输入,设置映射器和归约器,组织 weka 输入等。
映射器类
这个类是 weka 分类器的映射器,它被赋予了一大块数据,并设置了一个分类器以在该数据上运行。该方法中还发生了许多其他处理。
减速机类
这个类是 weka 分类器输出的化简器,它从映射器中得到一堆交叉验证的数据块,它的工作是将数据聚合到一个解决方案中。
最后是 InputFormatClass
接受 JobContext 并返回拆分成片段的数据列表 基本上这是处理大型数据集的一种方式。这种方法允许我们将一个大数据集拆分成更小的块以跨工作节点传递(或者在我们的例子中,只是为了让生活更轻松一点,并将这些块传递给单个节点,这样它就不会被一个大数据集淹没)
machine-learning - 结果 weka j48 分类实例不正确
我已经建立了一棵树来对实例进行分类。在我的树中,有 14 个属性。每个属性由监督离散离散。当我创建一个新实例时,我将值放在这个实例中并在我的树中分类,我发现结果是错误的。于是我调试了我的程序,发现实例的值没有正确划分区间。例如:
实例的值:0.26879699248120303 被划分为'(-inf-0]'。
为什么?
weka - 相同的决策树,不同的结果
我在做一个机器学习应用,使用 Weka 进行测试,比较分类算法等。在 Weka 上进行测试操作后,我决定使用 J48 决策树。我解析了 Weka 生成的修剪树并将其实现为 C 中的 if-then 格式。但是,如果我测试了在我的程序中用作 Weka 输入的数据,结果与 Weka 的混淆矩阵不同。在 Weka 的测试选项中,我选择了“使用训练集”并使用了该决策树。这是混淆矩阵和我的结果:
=== 混淆矩阵 ===
我的程序结果:
尽管一切都相同(决策树、数据、特征值、函数等),但为什么我会得到这些不同的结果?Weka 是否有可能产生/显示错误的决策树?
weka - 具有非线性可分数据的 WEKA J48 决策树
Weka J48 决策树分类器是否支持对本质上非线性可分数据的问题进行分类?简而言之,J48 是线性分类器还是非线性分类器?
tree - 仅使用显着属性,还是在检查信息增益后使用全套属性构建 J48 模型?
Weka 的 J48 允许检查一组完整属性的信息增益,我应该使用这些重要属性来构建我的模型吗?或者我应该使用全套属性吗?
visualization - 可视化 j48 树 weka
我想以更好的布局可视化我的树GraphViz
,但由于某种原因,它根本不显示树,即使它确实显示在默认布局中。
r - 从决策树 J48 中提取内容
我有以下决策树(由 JWEKA 包创建 - 通过命令J48(NSP~., data=training)
):
我想以 2 种格式提取节点的值:一种格式只有属性的名称,例如:MSTV、MLTV、DP ......等等,所以树的每一级都将跟随他的父级,在在上述情况下,我想将'('作为每个级别之间的分隔符,例如:
在第二种格式中,我想获取具有它们的值的节点,例如:
如何提取相关信息。我认为要分隔节点值,我们应该使用分隔字符gsub("[A-Z]:", "", string)
但是我们需要忽略最后几行。非常感谢你的帮助。
r - J48 树 (RWeka) 中的属性及其值
如果您运行以下命令:
res
将是J48
继承自的类列表Weka_tree
。如果你打印它
我想按从右到左的顺序获取属性及其值。所以对于这种情况:
我尝试将 res 输入到一个因子并运行命令:
没有成功。只是要记住,我们应该忽略左边的字符。