2

Word2vec一个很棒的工具是deeplearning4j。我设法按照本教程为语料库创建了一个向量。

现在的问题是如何用新句子更新模型,而不必从头开始重新构建它。

关于这个的一些想法,这种方法有帮助吗?

public void trainSentence(List<VocabWord> sentence){}

那会更新模型吗?如果是,如何准备要发送到此方法的句子?

4

1 回答 1

2

是和不是。在这里的文档中,它提到:

添加模型序列化/反序列化后权重更新。也就是说,您可以使用 200GB 的新文本来更新模型状态,方法是调用loadFullModel、添加TokenizerFactorySentenceIterator,然后调用fit()恢复的模型。

这意味着可以使用新的语料库重新训练和更新模型权重。但是不会在词汇表中添加新词。

在此处检查代码和 Javadoc 。

于 2016-05-03T18:29:18.820 回答