1

我在 Linux 下将 GATE 用于阿拉伯语,使用 Stanford Tagger 时没有任何 POS 标签。所有参数均未更改(默认情况下)我该怎么做才能执行该任务?这个问题是否取决于参数?tagger的安装目录必须在taggerBinary参数中设置?

4

1 回答 1

1

首先,您必须在 GATE 中创建一个新的 StanfordPOSTaggerPR 并使用arabic.taggerStanfordTagger 提供的模型初始化 Tagger。

GATE 的最后一个版本是 8.0,它使用的是 StanfordTagger 3.4。所以你必须下载这个版本提供的模型。

在此处输入图像描述

接下来,您必须使用 SentenceSplitter 和 Tokeniser 创建一个语料库管道(我已尝试使用UnicodeTokeniserRegExp SentenceSplitter):

在此处输入图像描述

最后,使用示例文件尝试管道:

在此处输入图像描述

于 2014-11-27T16:46:33.903 回答