1

我在许多网站上阅读,他们说 Gate 支持西班牙语,但我没有找到如何使用 Gate 分析西班牙语文本。我尝试使用 treetagger,但出现错误:TreeTagger\tree-tagger-spanish-gate": CreateProcess error=193, %1 no es una aplicación Win32 válida

我也尝试过使用 OpenNLP,但我没有找到西班牙语的模型(标记器、块等),我只找到了荷兰语、德语和英语。

我还需要识别句子的主语和谓语。如果我错了,请纠正我,但我认为我可以使用 OpenNLP 来做到这一点,因为可以使用树库解析器或 MuNPEx 插件来识别 NP(名词短语)和 VP(动词短语)。

Summering,有什么方法可以将 Gate 语言设置为西班牙语?

谢谢。

4

1 回答 1

3

您需要 Cygwin 才能在 Windows 上运行 treetagger 脚本。错误信息

CreateProcess 错误=193,%1 没有应用程序 Win32 有效

向我建议您没有将shell.path系统属性设置为指向您的 Cygwin sh.exe,如用户指南的 TaggerFramework 部分中所述

对于 OpenNLP, http ://opennlp.sourceforge.net/models-1.5/ 提供了一些名称查找器模型,https://github.com/utcompling/OpenNLP-Models/tree/master/models/es提供了 POS 标记器模型但我在任何地方都看不到分词器或分块器模型。对于标记化和句子分割,我怀疑默认的 GATE Unicode 标记器(不是“ANNIE 英语标记器”)和任何一个默认的句子分割器都会做一个合理的工作。

订阅门用户邮件列表并在那里询问是否有其他人愿意分享任何西班牙资源可能是值得的。

于 2013-08-09T11:54:07.790 回答