问题标签 [weka]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

2948 问题

0 投票

2 回答

5491 浏览

command-line - 从命令行运行 weka - 找不到类 NaiveBayes

我正在尝试从命令行运行 Weka 分类，但我的代码：

出现错误消息：

“找不到主类：weka.classifiers.bayes.NaiveBayes。程序将退出。”

我在包含 weka.jar 的目录中运行命令。怎么找不到分类器？

2011-05-09T16:48:43.277

0 投票

2 回答

3549 浏览

java - 如何在 Java 应用程序中使用序列化分类器对新实例进行分类

我想使用序列化分类器对新实例进行分类。我找到了这门课，但我不明白。

arg[2]= 类属性名称和arg[3]= 从原始数据集预测的实例的基于 1 的索引

这是这个类的代码：

提前致谢。

java weka

2011-05-09T22:01:00.193

0 投票

1 回答

3121 浏览

data-mining - 您如何在 Weka 中执行引导和删除异常值？

我刚刚开始使用 Weka API 和几个示例数据集，但只是想了解一些零碎的东西。有谁知道如何在 Weka 中执行 0.632 自举？

另外，我将如何检测异常值（我知道有很多不同的方法可以做到这一点......）？

另外，一旦确定了异常值，我将如何删除 10% 的异常值？

任何帮助将不胜感激！

干杯，

尼尔

data-mining weka

2011-05-10T18:04:41.833

0 投票

3 回答

4041 浏览

java - 简单的 K-Means 不处理 iris.arff

我在下面有这个课程，我考虑了 wiki 和论文中给出的示例来构建它，为什么 SympleKMeans 不能处理数据？该类可以打印数据源dados，因此处理文件没有问题，错误在于构建。

错误：

java weka

2011-05-13T10:01:06.660

0 投票

2 回答

3606 浏览

java - 导出 Weka 模型以用于 C 或 C++

使用 Weka 进行数据探索并确定哪种分类算法最适合我的问题，我取得了巨大的成功。现在我有一个训练有素的模型，我想将它集成到我的 C++ 程序的其余部分中。不幸的是，这似乎是一项艰巨的任务：只有 Weka 原生支持将分类器导出为 Java 对象文件。有没有人找到一种方法以有用的格式导出 Weka 训练的模型参数？

如果有一个从 J48 决策树生成 C/C++ 代码的实用程序，我会特别感兴趣。

java c++machine-learning weka classification

2011-05-14T22:22:21.173

0 投票

2 回答

2092 浏览

java - 将 CURE 聚类算法添加到 WEKA

我编写了一个 java 程序来执行 CURE 集群。我希望将此程序作为聚类算法添加到 weka 并可视化聚类。有没有人已经在 weka 上实现了它？任何指向它的链接都会非常有帮助。我该如何进行？

java cluster-analysis weka data-mining

2011-05-15T18:09:03.013

0 投票

1 回答

4241 浏览

file-format - 稀疏 ARFF 文件的 Weka 字符串属性

我正在尝试使用 Weka 进行文本分类。为此，使用稀疏 ARFF 数据文件格式是有意义的。使用 Weka 3.7.2，我尝试了：

使用TextDirectoryLoader将文本目录转换为 Instances 对象。
使用StringToWordVector将前一阶段产生的字符串转换为数字。

第一阶段工作得很好。第二阶段导致了一个问题，在 Weka 的 ARFF 文件格式规范中是这样描述的：

警告：从具有字符串属性的数据集中保存 SparseInstance 对象存在一个已知问题。在 Weka 中，字符串和标称数据值存储为数字；这些数字充当可能属性值数组的索引（这非常有效）。但是，第一个字符串值被分配索引 0：这意味着，在内部，这个值被存储为 0。当写入 SparseInstance 时，内部值为 0 的字符串实例不会输出，因此它们的字符串值会丢失（并且当再次读取arff文件，默认值0是不同字符串值的索引，所以属性值出现变化）。

ARFF 格式建议使用此解决方案：

要解决此问题，请在索引 0 处添加一个虚拟字符串值，只要您声明可能在 SparseInstance 对象中使用并保存为 Sparse ARFF 文件的字符串属性，就不会使用该虚拟字符串值。

我正在尝试这样做 - 添加一个虚拟字符串。我未能手动执行此操作（通过编辑 ARFF 文件）。任何做过这个的人都可以发布一个例子——一个程序段，一个正确修改的 ARFF 文件，或者其他方式来做到这一点？

谢谢。

file-format weka sparse-matrix arff

2011-05-16T10:44:46.647

0 投票

1 回答

3788 浏览

weka - ARFF (Weka) 中的缺失值

Weka 中的分类器（例如决策树）将如何解释“？” （代表 ARFF 文件中的缺失值）在学习阶段？Weka 会用一些预定义的值（例如“0”或“假”）替换它，还是会以某种方式影响训练过程？

weka decision-tree arff

2011-05-16T12:31:01.203

0 投票

1 回答

3307 浏览

machine-learning - WEKA：如何过滤多个属性范围？

这是我通常在weka中选择属性范围的方法

现在，我还需要删除属性字段 4，如何在 options[1] 中指定它？

谢谢

machine-learning weka classification

2011-05-18T08:38:32.227

0 投票

2 回答

855 浏览

java - WEKA 使用 SimpleDateFormat 解析我的日期......除非它涉及 2 点钟

我有一个大的 ARFF 文件，其中的数据看起来像这样：

为了帮助解析它，我声明了第二个属性，如下所示：

使用 Java 的 SimpleDateFormat 的解析器在第一行（以及与其非常相似的几百万行）上运行良好，但在几行上就卡住了，就像第二行一样。我注意到它只会阻塞小时为“02”的一行 - 事实上，如果我将第二行更改为540,"2011-03-13 01:10:19.000",0. 为了增加谜团，02无论如何，一些带有 a 的行都可以很好地解析。像：1,"2006-12-16 02:58:51.000",111

那么有人知道发生了什么吗？有什么建议吗？提前致谢。

java weka simpledateformat arff

2011-05-20T19:14:22.600

1 2 3 4 5 6 7 8 9 10

问题标签 [weka]

Reference