问题标签 [weka]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
5491 浏览

command-line - 从命令行运行 weka - 找不到类 NaiveBayes

我正在尝试从命令行运行 Weka 分类,但我的代码:

出现错误消息:

“找不到主类:weka.classifiers.bayes.NaiveBayes。程序将退出。”

我在包含 weka.jar 的目录中运行命令。怎么找不到分类器?

0 投票
2 回答
3549 浏览

java - 如何在 Java 应用程序中使用序列化分类器对新实例进行分类

我想使用序列化分类器对新实例进行分类。我找到了这门课,但我不明白。

arg[2]= 类属性名称和arg[3]= 从原始数据集预测的实例的基于 1 的索引

这是这个类的代码:

提前致谢。

0 投票
1 回答
3121 浏览

data-mining - 您如何在 Weka 中执行引导和删除异常值?

我刚刚开始使用 Weka API 和几个示例数据集,但只是想了解一些零碎的东西。有谁知道如何在 Weka 中执行 0.632 自举?

另外,我将如何检测异常值(我知道有很多不同的方法可以做到这一点......)?

另外,一旦确定了异常值,我将如何删除 10% 的异常值?

任何帮助将不胜感激!

干杯,

尼尔

0 投票
3 回答
4041 浏览

java - 简单的 K-Means 不处理 iris.arff

我在下面有这个课程,我考虑了 wiki 和论文中给出的示例来构建它,为什么 SympleKMeans 不能处理数据?该类可以打印数据源dados,因此处理文件没有问题,错误在于构建。

错误:

0 投票
2 回答
3606 浏览

java - 导出 Weka 模型以用于 C 或 C++

使用 Weka 进行数据探索并确定哪种分类算法最适合我的问题,我取得了巨大的成功。现在我有一个训练有素的模型,我想将它集成到我的 C++ 程序的其余部分中。不幸的是,这似乎是一项艰巨的任务:只有 Weka 原生支持将分类器导出为 Java 对象文件。有没有人找到一种方法以有用的格式导出 Weka 训练的模型参数?

如果有一个从 J48 决策树生成 C/C++ 代码的实用程序,我会特别感兴趣。

0 投票
2 回答
2092 浏览

java - 将 CURE 聚类算法添加到 WEKA

我编写了一个 java 程序来执行 CURE 集群。我希望将此程序作为聚类算法添加到 weka 并可视化聚类。有没有人已经在 weka 上实现了它?任何指向它的链接都会非常有帮助。我该如何进行?

0 投票
1 回答
4241 浏览

file-format - 稀疏 ARFF 文件的 Weka 字符串属性

我正在尝试使用 Weka 进行文本分类。为此,使用稀疏 ARFF 数据文件格式是有意义的。使用 Weka 3.7.2,我尝试了:

  1. 使用TextDirectoryLoader将文本目录转换为 Instances 对象 。
  2. 使用StringToWordVector将前一阶段产生的字符串转换为数字。

第一阶段工作得很好。第二阶段导致了一个问题,在 Weka 的 ARFF 文件格式规范中是这样描述的:

警告:从具有字符串属性的数据集中保存 SparseInstance 对象存在一个已知问题。在 Weka 中,字符串和标称数据值存储为数字;这些数字充当可能属性值数组的索引(这非常有效)。但是,第一个字符串值被分配索引 0:这意味着,在内部,这个值被存储为 0。当写入 SparseInstance 时,内部值为 0 的字符串实例不会输出,因此它们的字符串值会丢失(并且当再次读取arff文件,默认值0是不同字符串值的索引,所以属性值出现变化)。

ARFF 格式建议使用此解决方案:

要解决此问题,请在索引 0 处添加一个虚拟字符串值,只要您声明可能在 SparseInstance 对象中使用并保存为 Sparse ARFF 文件的字符串属性,就不会使用该虚拟字符串值。

我正在尝试这样做 - 添加一个虚拟字符串。我未能手动执行此操作(通过编辑 ARFF 文件)。任何做过这个的人都可以发布一个例子——一个程序段,一个正确修改的 ARFF 文件,或者其他方式来做到这一点?

谢谢。

0 投票
1 回答
3788 浏览

weka - ARFF (Weka) 中的缺失值

Weka 中的分类器(例如决策树)将如何解释“?” (代表 ARFF 文件中的缺失值)在学习阶段?Weka 会用一些预定义的值(例如“0”或“假”)替换它,还是会以某种方式影响训练过程?

0 投票
1 回答
3307 浏览

machine-learning - WEKA:如何过滤多个属性范围?

这是我通常在weka中选择属性范围的方法

现在,我还需要删除属性字段 4,如何在 options[1] 中指定它?

谢谢

0 投票
2 回答
855 浏览

java - WEKA 使用 SimpleDateFormat 解析我的日期......除非它涉及 2 点钟

我有一个大的 ARFF 文件,其中的数据看起来像这样:

为了帮助解析它,我声明了第二个属性,如下所示:

使用 Java 的 SimpleDateFormat 的解析器在第一行(以及与其非常相似的几百万行)上运行良好,但在几行上就卡住了,就像第二行一样。我注意到它只会阻塞小时为“02”的一行 - 事实上,如果我将第二行更改为540,"2011-03-13 01:10:19.000",0. 为了增加谜团,02无论如何,一些带有 a 的行都可以很好地解析。像:1,"2006-12-16 02:58:51.000",111

那么有人知道发生了什么吗?有什么建议吗?提前致谢。