使用以下方法训练新模型时:
java -mx1g edu.stanford.nlp.tagger.maxent.MaxentTagger -props myPropertiesFile.prop
假设 中指定的模型myPropertiesFile.prop
已经存在。新模型是从头开始训练的,还是从现有参数开始训练的?我可以控制在这种情况下所做的事情吗?
一些上下文:
我想首先在一个非常大的不那么准确标记数据的语料库上训练标注器,然后继续在一个更小的准确数据语料库上训练(所谓的warm start
)