问题标签 [weka]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
command-line - 从命令行运行 weka - 找不到类 NaiveBayes
我正在尝试从命令行运行 Weka 分类,但我的代码:
出现错误消息:
“找不到主类:weka.classifiers.bayes.NaiveBayes。程序将退出。”
我在包含 weka.jar 的目录中运行命令。怎么找不到分类器?
java - 如何在 Java 应用程序中使用序列化分类器对新实例进行分类
我想使用序列化分类器对新实例进行分类。我找到了这门课,但我不明白。
arg[2]
= 类属性名称和arg[3]
= 从原始数据集预测的实例的基于 1 的索引
这是这个类的代码:
提前致谢。
data-mining - 您如何在 Weka 中执行引导和删除异常值?
我刚刚开始使用 Weka API 和几个示例数据集,但只是想了解一些零碎的东西。有谁知道如何在 Weka 中执行 0.632 自举?
另外,我将如何检测异常值(我知道有很多不同的方法可以做到这一点......)?
另外,一旦确定了异常值,我将如何删除 10% 的异常值?
任何帮助将不胜感激!
干杯,
尼尔
java - 简单的 K-Means 不处理 iris.arff
我在下面有这个课程,我考虑了 wiki 和论文中给出的示例来构建它,为什么 SympleKMeans 不能处理数据?该类可以打印数据源dados,因此处理文件没有问题,错误在于构建。
错误:
java - 导出 Weka 模型以用于 C 或 C++
使用 Weka 进行数据探索并确定哪种分类算法最适合我的问题,我取得了巨大的成功。现在我有一个训练有素的模型,我想将它集成到我的 C++ 程序的其余部分中。不幸的是,这似乎是一项艰巨的任务:只有 Weka 原生支持将分类器导出为 Java 对象文件。有没有人找到一种方法以有用的格式导出 Weka 训练的模型参数?
如果有一个从 J48 决策树生成 C/C++ 代码的实用程序,我会特别感兴趣。
java - 将 CURE 聚类算法添加到 WEKA
我编写了一个 java 程序来执行 CURE 集群。我希望将此程序作为聚类算法添加到 weka 并可视化聚类。有没有人已经在 weka 上实现了它?任何指向它的链接都会非常有帮助。我该如何进行?
file-format - 稀疏 ARFF 文件的 Weka 字符串属性
我正在尝试使用 Weka 进行文本分类。为此,使用稀疏 ARFF 数据文件格式是有意义的。使用 Weka 3.7.2,我尝试了:
- 使用TextDirectoryLoader将文本目录转换为 Instances 对象 。
- 使用StringToWordVector将前一阶段产生的字符串转换为数字。
第一阶段工作得很好。第二阶段导致了一个问题,在 Weka 的 ARFF 文件格式规范中是这样描述的:
警告:从具有字符串属性的数据集中保存 SparseInstance 对象存在一个已知问题。在 Weka 中,字符串和标称数据值存储为数字;这些数字充当可能属性值数组的索引(这非常有效)。但是,第一个字符串值被分配索引 0:这意味着,在内部,这个值被存储为 0。当写入 SparseInstance 时,内部值为 0 的字符串实例不会输出,因此它们的字符串值会丢失(并且当再次读取arff文件,默认值0是不同字符串值的索引,所以属性值出现变化)。
ARFF 格式建议使用此解决方案:
要解决此问题,请在索引 0 处添加一个虚拟字符串值,只要您声明可能在 SparseInstance 对象中使用并保存为 Sparse ARFF 文件的字符串属性,就不会使用该虚拟字符串值。
我正在尝试这样做 - 添加一个虚拟字符串。我未能手动执行此操作(通过编辑 ARFF 文件)。任何做过这个的人都可以发布一个例子——一个程序段,一个正确修改的 ARFF 文件,或者其他方式来做到这一点?
谢谢。
weka - ARFF (Weka) 中的缺失值
Weka 中的分类器(例如决策树)将如何解释“?” (代表 ARFF 文件中的缺失值)在学习阶段?Weka 会用一些预定义的值(例如“0”或“假”)替换它,还是会以某种方式影响训练过程?
machine-learning - WEKA:如何过滤多个属性范围?
这是我通常在weka中选择属性范围的方法
现在,我还需要删除属性字段 4,如何在 options[1] 中指定它?
谢谢
java - WEKA 使用 SimpleDateFormat 解析我的日期......除非它涉及 2 点钟
我有一个大的 ARFF 文件,其中的数据看起来像这样:
为了帮助解析它,我声明了第二个属性,如下所示:
使用 Java 的 SimpleDateFormat 的解析器在第一行(以及与其非常相似的几百万行)上运行良好,但在几行上就卡住了,就像第二行一样。我注意到它只会阻塞小时为“02”的一行 - 事实上,如果我将第二行更改为540,"2011-03-13 01:10:19.000",0
. 为了增加谜团,02
无论如何,一些带有 a 的行都可以很好地解析。像:1,"2006-12-16 02:58:51.000",111
那么有人知道发生了什么吗?有什么建议吗?提前致谢。