问题标签 [j48]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
117 浏览

weka - 在 Weka 中使用决策树的学生表现

我是使用 weka 的新手。我想将 j48 用于我的学生表现项目。我不知道如何编辑规则。例如,我有 8 个科目,如果总成绩 < 60,则需要在获得平均分后获得平均分:需要改进。我怎么做?抱歉,这一切都让我很困惑。

0 投票
1 回答
322 浏览

weka - Weka 中数据汇总错误与树可视化之间的不平衡

我尝试使用 J48 算法在 Weka 中的iris.arff数据集上运行一个简单的分类。我使用了 10 折的交叉验证,并且 - 如果我没记错的话 - J4​​8 的所有默认设置。结果是 96% 的准确率与 6 个错误分类的实例。

这是我的问题:据此,可视化中的第二个数字是每个叶子中错误分类的实例的数量,但是为什么它们的总和不是 6 而是 3?


数据汇总


我的决策树

编辑:使用不同的测试选项运行算法我在准确性(以及因此错误的数量)方面获得了不同的结果,但是当我可视化树时,我总是得到具有相同 3 个错误的同一棵树。我仍然无法解释为什么。

0 投票
0 回答
103 浏览

java - 有没有办法从文本文件中读取 J48 修剪树?

给定一个包含以下内容的文本文件(比如 weather.txt):

Java 中有没有办法将此文本作为 J48 对象读取。

目前我有一个数据文件“data.txt”(arff格式):

我当前的代码是(如下)打印上面的树:

我的目标是将这些树保存在文本文件中。并把它们读回来。如何在java中阅读它们?

0 投票
1 回答
517 浏览

java - Weka J48 分类不跟随树

我原来的树要大得多,但由于我被这个问题困扰了很长时间,我决定尝试简化我的树。我结束了这样的事情:

吃货

如您所见,我只有一个名为“LarguraBandaRede”的属性,其中包含 3 个可能的标称值“Congestionado”、“Livre”和“Merda”。

之后,我从 weka 导出了 j48.model 以用于我的 java 代码。

使用这段代码,我导入模型以用作分类器:

之后我开始创建我的属性和实例文件的数组列表

其中 populateAttributes 给出了每个属性的可能值,在本例中为“Livre, Merda, Congestionado;” 对于 LarguraBandaRede 和对于 Resultado 的“Sim,Nao”,我的类属性。

创建我的实例之后是时候创建我的实例文件,即我要分类的实例

然后我用“LarguraBandaRede”的 3 个可能值设置每个实例。'instanceLivre' 与“Livre”,“instanceMediano”与“Merda”以及“instanceCongestionado”与“Congestionado”。

之后我只使用classifyInstance方法对这3个实例进行分类

这是我的结果:

结果

如您所见,Merda 为“LarguraBandaRede”的实例被归类为与 Congestionado 相同的类,即“Nao”类。但这没有任何意义,因为上面的树清楚地表明,当“LarguraBandaRede”是“Merda”或“Livre”时,类应该是相同的。

所以这就是我的问题。这是如何发生的以及如何解决它?

提前致谢。

编辑

我不知道这个:

weka的指数

对模型的工作方式产生了任何影响。但是在为名义属性提供可能的值时,我们必须遵循这个顺序。

0 投票
0 回答
137 浏览

java - Test instances always classified in to the the same class

I have written a java program that build a J48 classifier using training set. Then I pass a test instance to the classifier to predict the unknown class. But each and every test instance classified in to first element of the class attribute.

example : - if I declare element of class attributes,

In this order, each instance classified in to first class element which is positive.

If I declare class element in this order,

each instance classified in to first class element which is negative.

My training set shows more than 90% accuracy in weka explore.

my training set look like

0 投票
2 回答
1104 浏览

machine-learning - 我可以防止 J48 分类器在同一字段上拆分 x 次以上吗?

使用数据集、Weka 和 J48 分类器,我得到以下树:J48树

它在右侧的“NumTweets”上分裂了很多。我可以防止 J48 在一个字段上进行超过指定数量的拆分吗?因为这显然过度拟合了我在特定领域的数据。理想情况下,我希望它只在分支中重复使用相同的字段 3-4 次。有什么办法可以做到这一点吗?

提前致谢!

0 投票
1 回答
1267 浏览

weka - 如何使用具有信息增益和随机属性选择的 j48 weka 进行分类?

我知道 j48 决策树用于gain ratio选择属性来制作树。但我想使用information gainandrandom selection而不是增益比。在select attribute tabWeka Explorer 中,我选择InfoGainAttributeEval并放置了开始按钮。之后,我看到了带有信息增益方法的属性排序列表。但我不知道如何使用这个列表在 Weka 中运行 j48。此外,我不知道如何在 j48 中随机选择属性。如果可以,请你帮助我。

0 投票
0 回答
414 浏览

machine-learning - Weka 决策树变得太大(内存不足)

对于分类,我使用 Weka 的 J48 决策树在几个标称属性上构建模型。现在有更多用于分类的数据(5 个非小属性),但每个属性都有 3000 个不同的值。我使用带有修剪功能的 J48,但它的内存不足(相关的 4GB)。使用较小的数据集,我在输出中看到,J48 保留所有叶子,没有与之关联的实例。为什么将它们保留在模型中?我应该切换到另一种分类算法吗?

0 投票
1 回答
864 浏览

csv - Weka J48 卡在基于训练数据的构建模型上

我正在尝试使用 Weka 查看我的数据集。当我加载我的数据集,我要分类,我选择J48并点击开始它会正常,我在右下角的鸟会来回走动,旁边会有斧头1。状态将更新为“在火车数据上构建模型”,但一两秒后,鸟会停下来坐下来,它会变为 x 0。之后没有进一步的进展。

我正在查看的文件是一个包含 5 列的 csv 文件。第一行,是一行标签,总行数为 1971 行(显然在每一列中)。

我对此进行了一些研究,但没有找到解决方案。可能我找错地方了?对此问题的任何指导或解决方案将不胜感激!

停止时的屏幕图像

0 投票
0 回答
65 浏览

java - java中使用weka的实例分类中的ArrayIndexOutOfBoundsException

我正在编写一个程序来将给定的测试实例分类为“正面”或“负面”;使用 j48 算法。我使用 Weka 工具创建了模型,并在我的 java 程序中使用它。

我的 Java 程序

我的训练数据文件

我从 ArrayIndexOutOfBoundsExceptionresult = cls_co.classifyInstance(data.firstInstance());

我尝试了很多在互联网上找到的例子。但我仍然遇到同样的错误。

提前致谢。