7

我是一个绝对的初学者。从未使用 Java 在 weka 中制作分类器或任何东西我以前使用过该接口。基本上我有点迷茫,我查看了 weka 的过滤器类并玩了一下。我的文档是文本文档,我需要将它们分成 2 类。

我不确定如何定义类别或如何将文档加载到 IDE 中进行分类

:-(

任何帮助/教程或指针将不胜感激。

4

2 回答 2

2

第一次使用 weka 很痛苦,但你需要经历它。

另外,我尝试了 weka,但由于 JVM 内存不足异常,我不得不转储它。我使用 Ruby 编写了自己的小型集群算法,它的性能要好得多。

无论如何,这里是如何在 WEKA 中使用 SVM:

  1. 您可以按照本教程了解如何在 weka 中使用 SVM:www.stat.nctu.edu.tw/~misg/WekaInC.ppt

  2. 现在,您将需要 ARFF 格式的数据(根据我的经验,我建议您使用它,它会有所帮助,从 WEKA 的角度来看,数据看起来更加结构化)。因此,您可以使用我为自己编写的XML2ARFF-Converter来做到这一点。您可以修改它以读取文本文件并将您的文本文件转换为 ARFF。

于 2011-02-22T21:42:41.590 回答
2

我发现这个 java 教程很有帮助,虽然网上可用的资源很少(我发现)

http://www.cs.waikato.ac.nz/ml/weka/index_documentation.html

希望这可以帮助

于 2011-04-28T10:19:18.537 回答