0

我已经用 Python 训练了几百万Word2VecGensim单词。我想用新数据更新这个训练有素的模型。但是从您以前的帖子和网络上的其他资源中,我知道这是不可能的。所以我正在尝试创建多个模型并转储它们。现在我想合并我正在倾销的模型。我想使用这些转储的结果。我之前有一篇文章Merging pretrained models in Word2Vec? 但我不知道该怎么做。我开始知道有一个名为 deepdist 的库,我正在尝试查看一些实验:

model = word2vec.Word2Vec.load_word2vec_format('/tmp/vectors.bin', binary=True)
  1. 有没有可能的解决方案?
  2. 如果有的话,有人可以建议怎么做?

我在 Windows 7 Professional 上使用 Python2.7。

4

1 回答 1

1

您指出的答案并不建议将模型合并为解决方案。实际上,他们建议您使用单独拥有的不同模型。对每个模型进行预测,然后组合答案。有几种方法可以组合输出。在您的情况下,您提到您有多个模型,因此您可以忽略答案中他们建议将您的训练数据分成 2 的部分,以便实际有 3 个模型进行预测。只要您有 2 个以上的预测,您就可以使用多数投票策略。

于 2015-06-03T19:36:20.750 回答