3

我需要做一些NER。我找到了可以做到这一点的DeepPavlov库。

这是来自docs的示例:

from deeppavlov import configs, build_model

ner_model = build_model(configs.ner.ner_ontonotes, download=True)
ner_model(['Bob Ross lived in Florida'])
>>> [[['Bob', 'Ross', 'lived', 'in', 'Florida']], [['B-PERSON', 'I-PERSON', 'O', 'O', 'B-GPE']]]

我不明白所有这些标签的含义。正如我从文档中了解到的,它们采用 CoNLL 2003 NER 任务格式。

有人可以指出带有 CoNLL 2003 NER 任务描述的可能标签列表吗?

4

1 回答 1

5

对于 NER 任务,有一些常见的实体类型用作标签:

  • 人 (PER)
  • 组织 (ORG)
  • 货币价值(MONEY)
  • 地缘政治实体,即国家、城市、州 (GPE)

和许多其他人

此外,为了区分具有相同标签的相邻实体,许多应用程序使用 BIO 标记方案。这里B表示实体的开始,I代表“内部”,用于表示除第一个之外的所有组成实体的词,O表示没有实体。

所以在上面的例子中,B-PERSON表示人名以标记Bob开头,下一个标签I-PERSON表示Ross与前一个标签相关的实体。然后是O这意味着live不属于任何实体,in也是如此,而FloridaGeopolitical entity (GPE)的乞讨。

请让我知道这是否足够有帮助。

于 2019-01-08T03:26:29.100 回答