4

我正在尝试阿尔巴尼亚语的 OpenNLP。为此,我正在使用 OPenNLP 并尝试为阿尔巴尼亚语的人员、位置和组织实体识别构建模型。我正在构建我自己的语料库,但我需要一位 Open NLP 专家来确认我以下疑问: 1- 我是否应该为每个模型构建一个单独的语料库,例如为 ner-person 构建一个只有标签存在的语料库?2-是否可以在同一语料库中标记人员、位置和组织,并使用它来训练能够提取所有三种实体类型的单个模型?3-是否有资源可以让我找到更多关于 OpenNLP 名称查找器模块中使用的算法的信息?

感谢您的回复,我真的需要您对我的论文的支持

4

1 回答 1

-1

1-我应该为每个模型建立一个单独的语料库,例如为ner-person建立一个只存在标签的语料库吗?IMO 是的......但是可以让模型包含多种名称类型。如果将它们分开,您可以更轻松地更新和迭代改进给定名称的模型,特别是如果它们是大型模型。

2-是否可以在同一语料库中标记人员、位置和组织,并使用它来训练能够提取所有三种实体类型的单个模型?是的,这是可能的,但是如果您计划在每种名称类型上构建并优化模型,那么将它们分开对我来说更容易。

3-是否有资源可以让我找到更多关于 OpenNLP 名称查找器模块中使用的算法的信息?最好的做法是下拉源代码并使用一些真实数据逐步执行代码......它基于最大熵。

于 2013-12-08T17:07:14.913 回答