问题标签 [weka]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
6 回答
4372 浏览

java - 重用 Weka 代码解析 ARFF 文件

有人做过吗?有没有关于如何使用这个解析器模块的文档?我已经查看了代码,但我不清楚如何在数据被解析后实际使用它。

文件src\main\java\weka\core\converters\ArffLoader.java(我认为这是 Arff 解析发生的地方)具有以下说明:

  • 批量使用的典型代码:
  • BufferedReader reader = new BufferedReader(new FileReader("/some/where/file.arff"));
  • ArffReader arff = new ArffReader(reader);
  • 实例数据 = arff.getData();
  • data.setClassIndex(data.numAttributes() - 1);

但是我还能用“数据”做什么?如何访问每一行以及每一行中的值?

(顺便说一句,我是 Java 新手。如果我运行这段代码,是否可以对数据进行某种内省以查看它提供了什么?这就是我在 Python 中会做的事情。)

(如果存在的话,我也愿意在我的项目中使用更简单的开源 Arff 解析器的建议。)

0 投票
1 回答
642 浏览

java - 奇怪的 weka 实例结果

使用 J48 树时出现奇怪的结果。我需要对一个包含 48 个特征的向量进行分类,效果很好,但是当我尝试“优化”时,我遇到了奇怪的结果。

我有一个方法分类:

它工作得很好,我希望我做对了。但我想删除在每个方法调用时完成的实例创建,所以我将 Instance 移至 BeClassified = new Instance(48); 进入类主体 - 所以它只创建一次。这也很有效,尽管我得到的结果与其他结果略有不同。可以说,从 400 个分类中,有一个是不同的(不是说,不正确)。但是我看不出这是什么原因……我希望这里有一些人在使用 weka,以便我了解发生了什么/错误。(是的,2+featureVec.length 是 48)。

谢谢并恭祝安康。

0 投票
2 回答
16512 浏览

java - NetBeans - 如何从外部库导入类

我在 Netbeans 中有一个 Java 项目,我想在我的项目中使用Weka的一些类。

我按照此处的说明(项目、属性、库..)将文件 C:\Program Files\Weka-3-7\weka-src.jar 添加到我的库中

那么我现在如何导入我想要的类呢?

我尝试像这样导入:

为了踢球,我也尝试了这个,但也没有用:

NetBeans 对两者都说“包不存在”。

我是否错误地链接了库?我需要以不同的方式对导入进行表述吗?

非常感谢您对此提供的任何见解。

更新:

在我的项目选项卡的库文件夹中,我看到:

weka-src.jar 并在其下我看到:、META-INF、lib、src.main.java.weka.associations 以及来自 weka 的许多其他内容。

0 投票
1 回答
2630 浏览

java - 波特 Stemmer 和 Weka

我将 Weka 与 SnowBall 包中提供的搬运工 Stemmer 一起使用。如果我在 Eclipse 中运行我的应用程序,一切正常,但是一旦我将它导出为可运行的 jar(包括所有库),weka 说:

我怎么能解决这个问题?

0 投票
1 回答
881 浏览

java - Weka KernelEstimator 类中的带宽是如何计算的?

我正在使用 Weka 来计算给定数据集的概率。更具体地说,我正在使用KernelEstimator类。

为了获得良好的密度估计结果,带宽参数的选择至关重要,但我无法找出带宽参数是如何计算的。使用的核函数是一个简单的高斯核。有谁知道带宽参数是如何计算的?

0 投票
3 回答
13161 浏览

java - 使用 Weka Java 代码 - 如何将 CSV(无标题行)转换为 ARFF 格式?

我正在使用 Weka Java 库读取 CSV 文件并将其转换为 ARFF 文件

问题是CSV 文件没有标题行,只有数据。导入 CSV 文件后如何分配属性名称?(所有列都是字符串数据类型)

这是我到目前为止的代码:

我试图通过 Weka 源代码来解决这个问题,但我无法确定它的正面或反面:-(

0 投票
1 回答
1068 浏览

classification - 在 MOA 中使用我的 weka 分类器

我在 weka 中创建了自己的分类器,它与 weka gui 配合得很好。我试图通过选择 weka 分类器然后我的分类器在MOA中使用它。我的分类器出现在 weka 分类器下的 MOA gui 中,但如果我选择它,我会收到“选项问题:baseLearner”错误。是否不能在 MOA 中使用我的新 weka 分类器,是否有任何路径或对我的分类器的引用,我应该在 MOA 中添加?

提前致谢

0 投票
1 回答
8434 浏览

machine-learning - 解释朴素贝叶斯结果

我开始使用NaiveBayes/Simple分类器进行分类(Weka),但是在训练数据时我有一些问题需要理解。我使用的数据集是weather.nominal.arff。

替代文字

当我使用选项中的使用训练测试时,分类器结果是:

我的第一个问题应该从不正确的分类实例中理解什么?为什么会出现这样的问题?哪个属性集合分类不正确?有没有办法理解这一点?

其次,当我尝试 10 折交叉验证时,为什么我得到不同(更少)正确分类的实例?

结果是:

0 投票
2 回答
856 浏览

machine-learning - 数据子集的分类器性能

我正在使用 Weka 对一组标记的网页执行分类,并使用 AUC 测量分类器性能。我有一个单独的六级因子,在分类中没有使用,我想知道分类器在因子的每个级别上的表现如何。

我应该使用哪些技术或措施来测试数据子集上的分类器性能?

0 投票
1 回答
1748 浏览

data-mining - 在 Weka 中调查样本的初学者问题

我刚刚使用 Weka 在“分类”标签下训练我的 SVM 分类器。现在我想进一步调查哪些数据样本被错误分类,我需要研究它们的模式,但我不知道从 Weka 哪里看这个。谁能给我一些帮助?提前致谢。