问题标签 [j48]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
3066 浏览

python - 从一个决策树(J48)分类转换为python中的集成

我想根据论文实现算法的分类。我有一个J48(C4.5)决策树(下面提到的代码)。我想I_max在数据集上运行它几次 ( ) 并计算所有集成的 C* = 类成员概率。如本文所述和第 8 页所述。在此处输入图像描述

0 投票
0 回答
144 浏览

weka - 在 J48 树 WEKA 中显示熵值

我对 Weka 很陌生,但我想做的是打印 J48 树中每个拆分的熵值。我用来训练树的命令行是:

但我有一条错误消息:

你知道如何获得熵值吗?

谢谢

0 投票
2 回答
391 浏览

r - 使用 J48 算法绘制基于字符串的决策树进行预测

我正在尝试根据字符串值属性绘制 J48 决策树并预测目标变量(分类),我已经看到很多基于数值绘制决策树的示例,但我没有遇到过基于字符串的情况。

这是样本数据集,J48 决策树工作正常。

如果我将标题 sepal_length、sepal_width 和 sepal_color 重命名,并将值作为“白色”、“黑色”以及不同颜色组合到 setosa、versicolor 和 virginca,我如何绘制决策树并预测目标物种值。

假设我有如下数据集,

0 投票
1 回答
109 浏览

weka - 使用 J48 解释 x 级别中感兴趣的划分属性的结果 (WEKA)

我是数据挖掘和 Weka 的新手。我使用 GUI 在 Weka 中使用 J48 构建了一个分类器,其中 J48(训练集)用于五个级别的感兴趣属性。我必须评估模型的精度,但我不知道该怎么做!一些信息可能很有趣:

首先,我想知道“?”的含义。在精度栏中。在两个级别中使用感兴趣的属性进行探测时,我没有得到“?”。这棵树现在比分成两层时更大。我质疑这是否意味着在五个级别中获取感兴趣的属性会在分类和计算时间方面生成效率较低的树。这似乎很明显,因为当属性具有 2 个级别时,正确分类的实例的数量高达 72%。

提前感谢您,所有有趣的答案都将得到奖励!

0 投票
0 回答
718 浏览

r - J48中置信因子的含义

我尝试在 R(C4.5 算法)中使用 RWeka 库中的 J48 分类器。我可以使用 C 参数对这个分类器进行参数化,这意味着“置信因子”。这个值到底是什么意思?我知道更大的价值意味着我相信我的学习集更能很好地代表整个人口,并且算法不太可能被修剪。但它究竟意味着什么?有什么公式可以解释这个值吗?

0 投票
1 回答
264 浏览

machine-learning - J48树分类器的叶子节点是什么意思

示例图片 我无法理解决策树的叶节点属性的含义。

我是一个新的机器学习者,在使用 J48 算法对数据集进行分类之后。我得到了一棵树,现在我无法理解哪个属性的值与树的叶节点相关。我只是通过使用来自 Kaggle 的数据集来执行预测。

0 投票
1 回答
91 浏览

r - 如何在 RWeka 中获取分类值?

谁能解释我如何从 RWeka 包中获得 J48 制作的决策树中每次休假的结果?

因此,例如,我们在 R 中有这个 iris 数据集:

在预测中,我想使用休假中的比例。我试着用这个包Partykit,但它看起来仍然很复杂,只是为了得到每个假期的比例。

至少我得到了列表中的叶子数,但找不到概率。

因此,作为预测,我想要例如 Petal.Width > 0.6 的新数据点的结果;花瓣宽度 <= 1.7; Petal.Length <= 4.9 结果杂色 97,9%。和 2,1% 其他。我怎样才能得到这些预测?

0 投票
1 回答
162 浏览

performance - Weka - 我怎样才能提高 J48 的性能?

当我需要能够预测 Kickstarter 项目资金的成功机会时,我正在从事数据挖掘项目。

我使用了在 Kaggle 上找到的 kickstarter 数据集,我已经清理了所有嘈杂的数据,删除了不相关的属性并添加了另一个有用的属性。

现在我有大约 320K 实例和 6 个属性。

运行 J48 算法后,我得到了 65.07% 的正确分类实例和 68.7% 的平均 roc 区域。我必须提高这种性能,但我不知道如何。

这是一个大学项目,所以我有特定的规则:我只能更改算法的 Confidence Factor 和 NumMinObj。我花了很多时间尝试每种组合。

我还能做什么?也许我的数据集中的某些东西有问题?在此处输入图像描述

0 投票
1 回答
534 浏览

weka - Weka 中树叶的数量和树的大小是什么意思?

有人能用简单的英语解释一下 Weka 中树叶的数量和树的大小是什么意思吗?我已经制作了我的决策树,这就是我在下面得到的,但我只需要解释这些值的含义。谢谢你。

叶数:49;树的大小:87。

0 投票
1 回答
52 浏览

algorithm - weka算法或流程图步骤中的J48算法

我是机器学习领域的新手。拜托,我想知道您是否可以为我提供 J48 的算法或流程图步骤。注意:我在 weka 中使用默认设置。感谢您的帮助。