我是一个绝对的初学者。从未使用 Java 在 weka 中制作分类器或任何东西我以前使用过该接口。基本上我有点迷茫,我查看了 weka 的过滤器类并玩了一下。我的文档是文本文档,我需要将它们分成 2 类。
我不确定如何定义类别或如何将文档加载到 IDE 中进行分类
:-(
任何帮助/教程或指针将不胜感激。
我是一个绝对的初学者。从未使用 Java 在 weka 中制作分类器或任何东西我以前使用过该接口。基本上我有点迷茫,我查看了 weka 的过滤器类并玩了一下。我的文档是文本文档,我需要将它们分成 2 类。
我不确定如何定义类别或如何将文档加载到 IDE 中进行分类
:-(
任何帮助/教程或指针将不胜感激。
第一次使用 weka 很痛苦,但你需要经历它。
另外,我尝试了 weka,但由于 JVM 内存不足异常,我不得不转储它。我使用 Ruby 编写了自己的小型集群算法,它的性能要好得多。
无论如何,这里是如何在 WEKA 中使用 SVM:
您可以按照本教程了解如何在 weka 中使用 SVM:www.stat.nctu.edu.tw/~misg/WekaInC.ppt
现在,您将需要 ARFF 格式的数据(根据我的经验,我建议您使用它,它会有所帮助,从 WEKA 的角度来看,数据看起来更加结构化)。因此,您可以使用我为自己编写的XML2ARFF-Converter来做到这一点。您可以修改它以读取文本文件并将您的文本文件转换为 ARFF。
我发现这个 java 教程很有帮助,虽然网上可用的资源很少(我发现)
http://www.cs.waikato.ac.nz/ml/weka/index_documentation.html
希望这可以帮助