-2

我需要构建一个分类器,它将任何推文字符串分类为特定类别。我有大约 15 个左右的类别。我有训练数据集。任何想法我应该如何继续这个?为此使用 Python 或 Java。

我一直在研究 Textblob 和斯坦福 NLP 分类器。我只是不确定选择哪一个以获得更好的结果。

4

1 回答 1

1

我喜欢在 Python 中使用 scikit-learn 进行监督机器学习。http://scikit-learn.org/stable/

对于 Java,您可以查看 DKPro https://dkpro.github.io/,因为他们利用现有的工具包来完成各种 NLP 任务。

最后,无论您使用什么工具包,您都可以查看是否可以将 TweetNLP http://www.ark.cs.cmu.edu/TweetNLP/用于 POS 标记组件。

祝你好运!

于 2015-10-05T16:42:59.993 回答