我正在尝试使用 SpaCy v3 训练自定义文本分类器。然而,textcat 模型似乎并没有通过迭代进行更新。事实上损失是完全一样的。这是我的代码的培训部分:
nlp = spacy.load('en_core_web_trf')
config = {
"threshold": 0.5,
}
textcat = nlp.add_pipe("textcat", config=config, last=True)
for label in binarizer.classes_:
textcat.add_label(str(label))
optimizer = nlp.initialize()
for i in range(50):
random.shuffle(TRAIN_DATA)
losses = {}
for batch in minibatch(TRAIN_DATA, size=16):
textcat.update(batch, sgd=optimizer, losses=losses)
print(i, losses)
TRAIN_DATA 是示例列表。
谢谢