0

我正在使用GATE * SDK * 并希望修改默认的 ANNIE Gazetteer以包含基于我创建的新列表定义的简单注释。

  • 我已将列表定义添加到GATE-HOME\plugins\ANNIE\resources\gazetteer
  • 我在 lists.def 文件中添加了一个条目以指向我的新列表文件。例如 *open_source_software:opensouce*
  • 我创建了一个注释模式并添加到 GATE-HOME\plugins\ANNIE\resources\schema
  • 当我加载 ANNIE 并运行应用程序时,它不会自动识别注释,但是当我将鼠标悬停在新列表定义中存在的单词上时,ANNIE 会突出显示该单词并建议正确的注释

有没有可能让他自动,这样我就不用训练安妮了?所以我可以按程序来做吗?

4

1 回答 1

2

默认情况下,地名词典会创建Lookup具有majorTypeminorType特征的类型注释,例如.def文件中的条目

oss.lst:software:open_source

将为列表中的条目创建带有majorType“软件”和“open_source”的查找。minorType然后通常的方法是编写处理Lookup注释并创建最终注释的 JAPE 规则。

通过向该.def行添加更多字段,可以直接从地名词典创建其他注释类型:

oss.lst:software:open_source::Software

将创建类型的注释Software而不是Lookup(字段是列表文件名、主要类型、次要类型、语言和注释类型)。但通常我建议坚持使用LookupJAPE 然后创建最终注释,因此您可以根据需要添加其他规则(地名词典盲目地注释列表中任何提及的任何内容,您通常需要启发式方法来过滤掉它,例如“ Apache”在大多数情况下可能被认为是软件,但不是在后面跟着“许可证”这个词的时候)。

最后,如果您想添加自己的地名词典和/或 JAPE 规则,那么我们建议您不要plugins/ANNIE直接编辑下面的文件。而是在其他地方创建自己的,并将其加载到地名词典 PR 的单独实例中,插入管道中的适当位置。 lists.def

于 2014-02-11T23:12:53.037 回答