2

我正在使用 spacy-transformers 和 roBERTa 开发自定义 NER 模型。我真的只为此使用 CLI,并试图更改我的 Spacy config.cfg 文件以说明管道中的自定义实体标签。

我是 Spacy 的新手,但我收集到人们通常使用 ner.add_label 来完成此操作。我想知道我是否可以更改配置的 [initialize.components.ner.labels] 中的某些内容,但还没有找到这样做的好方法。

我似乎找不到任何以类似方式更改配置文件的选项 - 有谁知道这是否可能,或者实现这些自定义标签的最简洁方法是什么?

为清楚起见进行了编辑:我的问题可能与我的配置理论不同。现在我得到一个输出,但它们不是文本标签,而是数字标签,例如:

('Oct',383) ('2019',383) ('February',383)

预先感谢您的帮助!

4

1 回答 1

1

如果您正在使用基于配置的训练,通常您不必在任何地方指定标签 - spaCy 将查看训练数据并从那里获取标签列表。

在少数情况下,这不起作用。

您有训练数据中没有的标签。这些是无法学习的,所以我只会认为这是一个错误,但有时您必须使用已提供的数据。

你的训练数据非常大。在这种情况下,阅读所有训练数据以获得完整的标签列表可能是一个问题。您可以使用init labels命令生成数据,这样就不必在每次开始训练时都扫描输入数据。

于 2021-07-23T07:20:42.367 回答