“weka”的相关标签问题_Stack Overflow中文网

0 投票

3 回答

10730 浏览

java - weka可视化选项卡中的jitter是什么意思

在weka我加载了一个 arff 文件。我可以使用可视化选项卡查看属性之间的关系。

但是我无法理解抖动滑块的含义。它的目的是什么？

2009-08-09T16:52:36.890

0 投票

3 回答

1827 浏览

machine-learning - 关于使用机器学习工具 Weka 的问题

我正在使用 Weka 的资源管理器功能进行分类。

所以我有我的 .arff 文件，具有 NUMERIC 值的 2 个特征，我的类是二进制 0 或 1（例如 {0,1}）。

样本：

我加载这个 .arff 文件，使用 10 倍交叉验证（无测试文件），然后选择 NaiveBayes，然后我对数据进行分类，它给了我：5 个错误标记，100 个正确标记。到现在为止还挺好。

现在，我显着更改了我的 .arff 文件（为我的特征属性提供完全随机的值）。重复上述操作，我在分类时得到完全相同的统计数据。

我尝试对我的 .arff 文件进行更多更改，使用不同的分类算法。尽管如此，无论我给我的 .arff 文件赋予什么值，完全相同的统计数据（在相同的算法中）。

我在这里做错了吗？

machine-learning data-mining classification weka

2009-11-27T04:58:47.040

0 投票

3 回答

9328 浏览

filter - WEKA 的重采样过滤器 - 如何解释结果

我目前正在努力解决机器学习问题，而我必须处理大量不平衡的数据集。也就是说，有六个类（'1'，'2'...'6'）。不幸的是，例如“1”类有 150 个示例/实例，“2”类有 90 个实例，“3”类只有 20 个。所有其他类都不能“训练”，因为这些类没有可用的实例。

到目前为止，我发现 WEKA（我正在使用的机器学习工具包）提供了这种有监督的“重采样”过滤器。当我使用 'noReplacement'=false 和 'bialToUniformClass'=1.0 应用此过滤器时，这会产生一个数据集，其中实例的数量很好并且几乎相等（对于类 '1'..'3' 和其他留空）。

我现在的问题是：WEKA 和这个过滤器如何为不同的类生成“新”/附加实例。

非常感谢您提前提供任何提示或建议。

干杯朱利安

filter machine-learning weka

2009-12-09T15:27:12.377

0 投票

1 回答

472 浏览

java - 如何使用 java 编程删除微阵列数据中的冗余元组？

在用于 MICROARRAY DATA 的数据挖掘软件 WEKA 中，如何从现有数据集中删除冗余元组？删除冗余的代码应该在 JAVA 中。

即，数据集包含诸如

这里的元组 1,4,5 是多余的。

代码应返回以下 REDUNDANCY REMOVED 数据集...

java weka redundancy

2010-01-12T04:39:03.037

0 投票

4 回答

13954 浏览

normalization - Weka 规范化列

我有一个包含 14 个数字列的 ARFF 文件。我想分别对每一列执行标准化，即将每一列的值修改为（actual_value - min(this_column)) / (max(this_column) - min(this_column)）。因此，列中的所有值都将在范围内[0, 1]。一列的最小值和最大值可能与另一列的不同。

如何使用 Weka 过滤器做到这一点？

谢谢

normalization weka

2010-02-16T07:21:17.957

0 投票

3 回答

19771 浏览