我正在尝试在 spacy v3 中准备一个自定义 ner 模型。从训练的角度来看,v3 与 v2 相比发生了显着变化。
我正在使用 en_web_lg 的默认配置。我已经使用 convert 命令准备了训练数据(training.spacy)。但是,训练命令需要一个 dev.spacy 文件。
不确定 dev.spacy 中需要哪些数据。这是在询问 training.spacy 文件的纯文本语料库吗?但是有没有办法将纯文本文件转换为 spacy 格式..
来自 spacy 站点的命令 - python -m spacy train config.cfg --output ./output --paths.train ./train.spacy --paths.dev ./dev.spacy
有人可以帮助解释如何准备 dev.spacy。