5

我可以在我的 java 程序中使用 GATE http://gate.ac.uk/来提取命名实体吗?如果是,您能否举出任何例子或指导我找到一些来源。谢谢

4

2 回答 2

5

您的问题实际上是两个问题:如何使用 GATE 查找命名实体以及如何将 GATE 嵌入到您的应用程序中。

命名实体识别或分类是一个庞大的研究领域,根据您要查找的命名实体,不同的方法可能最有效。GATE 提供了一个非常基本的地名词典列表和基于规则的方法,用于在英文文本中查找命名实体的某些类别:ANNIE。如果 ANNIE 找到的类别对您来说很有趣,那么开始的一种方法可能是了解和改进 ANNIE 已经提供的内容。ANNIE 管道将为您的文档中的人员、组织等创建注释,您只需要使用或编写访问这些注释的 PR,并对这些注释的功能或文本执行您需要的任何操作。查看 GATE 手册http://gate.ac.uk/sale/tao/split.html它解释了 ANNIE 并且还有一些关于如何嵌入 GATE 的文档(如何在不运行 GUI 的情况下直接从 Java 程序中使用 GATE)。

于 2011-05-17T13:33:40.237 回答
-2

以下是一些可用于命名实体识别 NER 的 CREOLE 插件列表:

  • 标记器_测量
  • Tagger_Number

如果您对医学 NER 感兴趣,您可以使用:

  • Tagger_MetaMap:查找医学实体,例如疾病、综合征、程序等等

还有这些外部插件:

于 2018-06-08T10:35:02.697 回答