问题标签 [j48]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
weka - 在 Weka 中使用决策树的学生表现
我是使用 weka 的新手。我想将 j48 用于我的学生表现项目。我不知道如何编辑规则。例如,我有 8 个科目,如果总成绩 < 60,则需要在获得平均分后获得平均分:需要改进。我怎么做?抱歉,这一切都让我很困惑。
weka - Weka 中数据汇总错误与树可视化之间的不平衡
我尝试使用 J48 算法在 Weka 中的iris.arff数据集上运行一个简单的分类。我使用了 10 折的交叉验证,并且 - 如果我没记错的话 - J48 的所有默认设置。结果是 96% 的准确率与 6 个错误分类的实例。
这是我的问题:据此,树可视化中的第二个数字是每个叶子中错误分类的实例的数量,但是为什么它们的总和不是 6 而是 3?
编辑:使用不同的测试选项运行算法我在准确性(以及因此错误的数量)方面获得了不同的结果,但是当我可视化树时,我总是得到具有相同 3 个错误的同一棵树。我仍然无法解释为什么。
java - 有没有办法从文本文件中读取 J48 修剪树?
给定一个包含以下内容的文本文件(比如 weather.txt):
Java 中有没有办法将此文本作为 J48 对象读取。
目前我有一个数据文件“data.txt”(arff格式):
我当前的代码是(如下)打印上面的树:
我的目标是将这些树保存在文本文件中。并把它们读回来。如何在java中阅读它们?
java - Weka J48 分类不跟随树
我原来的树要大得多,但由于我被这个问题困扰了很长时间,我决定尝试简化我的树。我结束了这样的事情:
如您所见,我只有一个名为“LarguraBandaRede”的属性,其中包含 3 个可能的标称值“Congestionado”、“Livre”和“Merda”。
之后,我从 weka 导出了 j48.model 以用于我的 java 代码。
使用这段代码,我导入模型以用作分类器:
之后我开始创建我的属性和实例文件的数组列表
其中 populateAttributes 给出了每个属性的可能值,在本例中为“Livre, Merda, Congestionado;” 对于 LarguraBandaRede 和对于 Resultado 的“Sim,Nao”,我的类属性。
创建我的实例之后是时候创建我的实例文件,即我要分类的实例
然后我用“LarguraBandaRede”的 3 个可能值设置每个实例。'instanceLivre' 与“Livre”,“instanceMediano”与“Merda”以及“instanceCongestionado”与“Congestionado”。
之后我只使用classifyInstance方法对这3个实例进行分类
这是我的结果:
如您所见,Merda 为“LarguraBandaRede”的实例被归类为与 Congestionado 相同的类,即“Nao”类。但这没有任何意义,因为上面的树清楚地表明,当“LarguraBandaRede”是“Merda”或“Livre”时,类应该是相同的。
所以这就是我的问题。这是如何发生的以及如何解决它?
提前致谢。
编辑
我不知道这个:
对模型的工作方式产生了任何影响。但是在为名义属性提供可能的值时,我们必须遵循这个顺序。
java - Test instances always classified in to the the same class
I have written a java program that build a J48 classifier using training set. Then I pass a test instance to the classifier to predict the unknown class. But each and every test instance classified in to first element of the class attribute.
example : - if I declare element of class attributes,
In this order, each instance classified in to first class element which is positive.
If I declare class element in this order,
each instance classified in to first class element which is negative.
My training set shows more than 90% accuracy in weka explore.
my training set look like
weka - 如何使用具有信息增益和随机属性选择的 j48 weka 进行分类?
我知道 j48 决策树用于gain ratio
选择属性来制作树。但我想使用information gain
andrandom selection
而不是增益比。在select attribute tab
Weka Explorer 中,我选择InfoGainAttributeEval
并放置了开始按钮。之后,我看到了带有信息增益方法的属性排序列表。但我不知道如何使用这个列表在 Weka 中运行 j48。此外,我不知道如何在 j48 中随机选择属性。如果可以,请你帮助我。
machine-learning - Weka 决策树变得太大(内存不足)
对于分类,我使用 Weka 的 J48 决策树在几个标称属性上构建模型。现在有更多用于分类的数据(5 个非小属性),但每个属性都有 3000 个不同的值。我使用带有修剪功能的 J48,但它的内存不足(相关的 4GB)。使用较小的数据集,我在输出中看到,J48 保留所有叶子,没有与之关联的实例。为什么将它们保留在模型中?我应该切换到另一种分类算法吗?
csv - Weka J48 卡在基于训练数据的构建模型上
我正在尝试使用 Weka 查看我的数据集。当我加载我的数据集,我要分类,我选择J48并点击开始它会正常,我在右下角的鸟会来回走动,旁边会有斧头1。状态将更新为“在火车数据上构建模型”,但一两秒后,鸟会停下来坐下来,它会变为 x 0。之后没有进一步的进展。
我正在查看的文件是一个包含 5 列的 csv 文件。第一行,是一行标签,总行数为 1971 行(显然在每一列中)。
我对此进行了一些研究,但没有找到解决方案。可能我找错地方了?对此问题的任何指导或解决方案将不胜感激!
java - java中使用weka的实例分类中的ArrayIndexOutOfBoundsException
我正在编写一个程序来将给定的测试实例分类为“正面”或“负面”;使用 j48 算法。我使用 Weka 工具创建了模型,并在我的 java 程序中使用它。
我的 Java 程序
我的训练数据文件
我从 ArrayIndexOutOfBoundsExceptionresult = cls_co.classifyInstance(data.firstInstance());
我尝试了很多在互联网上找到的例子。但我仍然遇到同样的错误。
提前致谢。