3

我发现 Python 中的 NLKT 是通过 *raw_parse* 函数完成的,但我需要使用 Java。我发现 cleartk 有一个 MaltParser 包装器,但没有关于它的文档。我正在寻找一个函数或项目,它首先将原始英文文本转换为 MaltParser 可以使用的 conll 文件并使用 MaltParser 解析它。任何帮助表示赞赏。

4

1 回答 1

0

在文件夹examples/apiexamples/srcex中有一些随 MaltParser 1.7.2 发行版提供的示例。

但是,这些示例仅显示了在已经执行标记化和后标记之后(并且在这些步骤的输出已转换为类似 CONLL 的格式之后)如何以编程方式运行 MaltParser。

由于我目前无法提供更好(更简单/更短)的替代方案,至少我可以与您分享一个Groovy 脚本的链接,该脚本执行标记化、词性标记(使用 OpenNLP)和依赖项解析(使用 MaltParser)。这些工具使用 UIMA 可互操作。如果熟悉 Maven,则应该非常直接地派生出该脚本的 Java 版本。

请注意,这不是最好的答案,但在这一点上可能总比没有好。

注意:我是 Apache UIMA 和 DKPro Core(链接指向的项目)的开发人员。

于 2013-07-24T19:08:39.670 回答