Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我确实使用 Doc2Vec 在我的语料库上记录了相似性,但它输出的相似性并不好。我想知道是否可以根据 Doc2Vec 提供的主题模型来提高模型的准确性以获得更好的相似性?
您应该从原始语料库中训练一个新模型(如 LDA)。
如果 Doc2Vec 流程提供的本机相似性不是很好,也许您可以通过调整流程来改进它们。
但如果这不起作用,那么 Doc2Vec 就没有从您的数据中提取有用的信息——基于这些(坏)原始数字的下游计算不可能神奇地变得更好。