0

我在这里的要求是给定一个句子(序列),我想只提取序列中存在的实体,而不将它们分类到 NER 任务中的类型。我看到 NER 的 BertForTokenClassification 进行了分类。这可以仅适用于提取吗?

BERT 可以仅用于进行实体提取/识别吗?

4

1 回答 1

0

不管 BERT,NER 标记通常是通过使用 IOB 格式(内部、外部、开头)或类似的标记(通常结尾也被显式标记)来完成的。inside和begging标签包含实体类型。像这样的东西:

Alex B-PER
is O
going O
to O
Los B-LOC
Angeles I-LOC

如果您修改训练数据,使得只有一种实体类型,模型将只学习检测实体而不知道实体是什么类型。

Alex B
is O
going O
to O
Los B
Angeles I
于 2019-10-25T10:12:20.287 回答