我正在尝试en_core_web_trf
使用一些额外的日期格式更新 DATE 实体的现有 spacy 模型。
如 spacy 的文档中所述,数据已正确格式化并转换为.spacy
文件
config.cfg 文件根据链接
[components.ner]
source = "en_core_web_trf"
训练后的模型会导致灾难性的遗忘问题:
- 以前检测到某些格式被错误分类
- 更新后的 en_core_web_trf 模型无法确定任何其他现有实体,如 PERSON、ORDINAL、LOC 等。(即使
nlp.components[5][1].labels
显示所有现有实体列表)
如何在不影响默认准确性的情况下处理此问题?