stanford-nlp - 在训练新的 stanford-pos 模型时重用参数

Question

使用以下方法训练新模型时：

java -mx1g edu.stanford.nlp.tagger.maxent.MaxentTagger -props myPropertiesFile.prop

假设中指定的模型myPropertiesFile.prop已经存在。新模型是从头开始训练的，还是从现有参数开始训练的？我可以控制在这种情况下所做的事情吗？

一些上下文：

我想首先在一个非常大的不那么准确标记数据的语料库上训练标注器，然后继续在一个更小的准确数据语料库上训练（所谓的warm start）

score 1 · Accepted Answer

它将从头开始构建一个新模型。据我所知，没有在一个数据集上训练模型，然后在另一个数据集上继续训练的功能。您可以修改代码以获取初始特征和权重，然后从那里开始训练，但它的设置并不容易做到这一点。

1 回答 1