嗨,我是机器学习的新手,因此正在寻找文本分类解决方案。有人可以向我推荐一个用 java 编写的不错的框架吗?我考虑过使用 WEKA,但也听说过 MALLET。更好的是,主要区别在哪里?
我的目标是对未标记的文本进行分类。因此,我准备了大约 18 个主题和每个主题 100 篇文字进行学习。
你会建议做什么?也希望有一个很好的小例子或提示如何继续。
嗨,我是机器学习的新手,因此正在寻找文本分类解决方案。有人可以向我推荐一个用 java 编写的不错的框架吗?我考虑过使用 WEKA,但也听说过 MALLET。更好的是,主要区别在哪里?
我的目标是对未标记的文本进行分类。因此,我准备了大约 18 个主题和每个主题 100 篇文字进行学习。
你会建议做什么?也希望有一个很好的小例子或提示如何继续。
由于您的任务相当简单,并且正如您提到的您是 ML 的新手,我建议您使用 weka,因为它易于使用并且拥有庞大的用户社区。
否则,您可以查看一些 Java 中的通用机器学习框架:
资料来源:真棒机器学习