问题标签 [j48]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
machine-learning - 如何为机器学习和预测建立良好的训练数据集?
我有一个学校项目来制作一个程序,该程序使用 Weka 工具对足球(足球)比赛进行预测。
由于算法已经存在(J48 算法),我只需要数据。我找到了一个免费提供足球比赛数据的网站,并在 Weka 中进行了尝试,但预测结果非常糟糕,所以我认为我的数据结构不正确。
我需要从我的源中提取数据并以另一种方式对其进行格式化,以便为我的模型创建新的属性和类。有谁知道如何为机器学习预测正确创建属性和类的课程/教程/指南?是否有一个标准来描述选择数据集属性以训练机器学习算法的最佳方式?对此有什么方法?
这是我目前拥有的数据示例:http ://www.football-data.co.uk/mmz4281/1516/E0.csv
machine-learning - 生成完美建模训练集的决策树?
我的数据集是我的规则,我想生成一个决策树,在分类我的规则时至少有 100% 的准确率,但我永远无法达到 100%。我将 minNumObjs 设置为 1 并使其未修剪,但我只得到了 84% 正确分类的实例。
我的属性是:
前数据:
有人可以帮助我理解为什么我永远无法将 100% 的实例分类,以及如何将它们 100% 分类(同时仍然允许我的属性是数字的)
谢谢
r - J48并联运行
我收到以下错误:
我想创建并行模型(J48)。这样将为每个子数据集建立一个模型。例如,对于iris_dataset[[1]]
J48 将是j48_c.models[[1]]
... 而对于iris_dataset[[18]]
J48 将是j48_c.models[[18]]
.
您可以通过以下方式单独运行模型:
r - R中的J48树 - 训练和测试分类
我想在 R 上的 J48 决策树中使用训练和测试。这是我的代码:
但我想将我的数据分成 70% 的训练和 30% 的测试,我该如何使用 J48 算法来做到这一点?
非常感谢!
r - weka.core.UnsupportedAttributeTypeException:weka.classifiers.trees.j48.C45PruneableClassifierTree:无法处理字符串属性
我有以下代码:
这应该为我绘制来自 J48 算法的贝叶斯网络图。我怎么会收到以下错误:
请协助解决问题。当我从 CSV 读取数据时,它运行良好,但从 json 中我得到一个字符串属性错误。
weka - 树中分类错误的实例与混淆矩阵不匹配
所有规则中错误分类(见树)的总和为 2097(来自 895+700+428+74)。但是混淆矩阵是 2121(来自 1999+122)。有人可以解释这种差异吗?数字怎么不一样?
machine-learning - WEKA 使用类值来解决决策树?
我是 WEKA 和 ML 的新手,所以请原谅我对以下内容的无知。我浪费了几个小时试图弄清楚,所以希望有人能指出我正确的方向:
我正在尝试对 USDJPY 的数据运行 J48 决策树。数据是通过 .csv 文件加载的,并且类值是名义类型,更具体地说,如果 USDJPY 在 20 个交易日后交易价格上涨超过 1%,则值为 TRUE 或 FALSE。问题是,当我运行算法时,决策树只是简单地使用类值来解决问题,这是没有用的。除了我希望从中预测类属性的类属性之外,还有 *22 个属性。
将我的数据集与示例“玻璃”数据集进行比较时,我找不到可以解释我的问题的两者之间的任何区别。当我运行 J48(具有相同设置)时,“glass.arff”按预期工作,尝试通过其他属性预测类值(玻璃类型)(即,它得到了一些错误的猜测)。
我在这里想念什么?这是属性列表:
matrix - 如何计算混淆矩阵?
这是我能够生成的 WEKA 输出。不幸的是,我不知道如何计算混淆矩阵。有人可以帮我计算一下吗?
一个。使用 WEKA 输出构建混淆矩阵。(提示:查看每个叶子节点以确定有多少实例落入四个象限中的每一个;并汇总所有叶子节点的结果以获得最终计数)
TP=?
FP=?
FN=?
TN=?
湾。在医学诊断中,常用的三个指标是:敏感性、特异性和诊断准确性。灵敏度定义为 TP/(TP+FN) ;特异性定义为 TN/(FP+TN);诊断准确度定义为敏感性和特异性的平均值。根据上面的混淆矩阵计算诊断准确率。
如果有人可以帮助我,我将不胜感激。谢谢!
r - 决策树分析问题
我目前正在处理 R 的问题。我想在数据集上应用分类树,但结果似乎是错误的,因为我已经使用 Weka 解决了相同的问题,并且得到了不同的结果。
我得到了一个包含在 csv 文件中的数据集,如下所示:
这是脚本: