可能重复:
Java:有没有好的自然语言处理库
谁能告诉我有关 Java 中的 NLP 库的信息?如果也有适当的记录,那就太好了。我曾尝试使用 lingpipe,但我无法完全理解它。
可能重复:
Java:有没有好的自然语言处理库
谁能告诉我有关 Java 中的 NLP 库的信息?如果也有适当的记录,那就太好了。我曾尝试使用 lingpipe,但我无法完全理解它。
你应该试试Stanford-NLP。它有许多用于 NLP 的实用程序和库,例如词性标注器,所有这些都非常好用且易于理解。
现在可能有点晚了,我想你一定已经继续你的项目了。但是你无论如何都可以查看这个博客。它有一系列关于 nlp with java 的帖子。正如其他人所建议的, Stanford-NLP是一个很好的库。
大多数库将在词法分析阶段(句子分割、标记化、POS 标记、解析等)为您提供帮助,这样您就不必从头开始编写代码。祝一切顺利 !
我已经用 jRuby对Apache OpenNLP进行了一些试验。它非常好和可靠,但当时我写这个记录很差。如果您尝试 OpenNLP,我建议您阅读以下文章:
OpenNLP 的文档可以在这里找到。
这是我使用 OpenNLP进行命名实体识别的项目中的代码。它是用 jRuby 编写的。OpenNLP 模型存储在数据库中,因为代码在 Heroku 上运行,您无法在其中的文件系统上编写代码。
实际上有一个安静的好NLP 工具列表。它是德语的,但应该与谷歌翻译一起使用。但我还是列出了一些:
如果您想要最好的英语,请选择斯坦福,但它的 GPL v2。对于不那么流行的语言,Treetagger 更好(它只需要一个较小的训练语料库就可以工作)。例如,您使用 TreeTagger 在德语文本上获得更好的结果,不再了解该调查,但如果您需要,我可以搜索它。OpenNLP 不如其他工具好,但它在 Apache License v2 下,您也应该考虑这一点。