3

我是自然语言处理和 GATE 的新手。目前我正在学习使用 GATE / ANNIE 。ANNIE 的默认地名词典列表很棒,但显然它们并没有为所有内容提供列表。我需要在故事书中创建一个角色列表。
从 GATE 地名词典编辑器(如 Gate 手册 13.2.2 中提到的)或使用文本编辑器创建列表并向每个列表添加条目似乎不切实际。所以任何人都知道创建我们自己的地名词典列表的方法,除了,直接通过 GATE 或使用文本编辑器创建/编辑?

4

2 回答 2

2

正如GATE 手册中所说,您可以在文本编辑器中编辑任何现有列表。可能最直接的方法是以编程方式创建这些列表。即,如果您将它们放在数据库中,则以地名词典格式转储记录(基本上每行一个单词)。如果您将它们保存在 csv 或网页中,请将它们导出为正确的格式。

另一种选择是使用更高级的地名词典,它使用本体或语义存储库。有关不同的地名词典以及如何使用它们,请参阅上面的手动链接。

于 2014-03-26T09:16:53.917 回答
2

如上所述,我使用数据库表中的列的内容创建了一个列表。只需使用 Notepad++ 将其作为 .lst 文件保存在与所有其他 .lst 文件相同的目录中(我使用的是 ANNIE 地名词典),然后使用地名词典编辑器添加它。我遇到的一个问题是没有以正确的编码 (UTF-8) 保存它。GATE 不喜欢它,它在加载时显示在消息中。一旦我弄清楚并纠正了它,它就可以正常工作。

如果您需要从文本创建实体列表,也许您可​​以查看地名词典列表收集器 - http://gate.ac.uk/sale/tao/splitch13.html - 13.7

于 2014-08-07T10:46:12.290 回答