2

我确实使用 Doc2Vec 在我的语料库上记录了相似性,但它输出的相似性并不好。我想知道是否可以根据 Doc2Vec 提供的主题模型来提高模型的准确性以获得更好的相似性?

4

1 回答 1

2

您应该从原始语料库中训练一个新模型(如 LDA)。

如果 Doc2Vec 流程提供的本机相似性不是很好,也许您可​​以通过调整流程来改进它们。

但如果这不起作用,那么 Doc2Vec 就没有从您的数据中提取有用的信息——基于这些(坏)原始数字的下游计算不可能神奇地变得更好。

于 2017-07-21T23:46:52.767 回答