data-visualization - 在 2D 中可视化 Gensim 的短语向量

Question

我正在使用 Phrases 类并希望在 2D 空间中可视化向量。为了用 Word2Vec 做到这一点，我使用了 T-SNE，它运行良好。当我尝试对短语做同样的事情时，它没有任何意义（单词出现在不相关的单词旁边）。

关于如何可视化短语输出的任何建议？

score 0 · Accepted Answer

正如gensim 邮件列表中建议/报告的那样，关键问题是仅仅将语料库包装Phrases在一个迭代器中，该迭代器只提供一次数据传递。该Word2Vec模型需要一个语料库，它可以在该语料库上进行多次通过来进行词汇发现，然后进行多次训练。（如果密切关注 INFO 级别的日志记录，应该有迹象表明“训练”在这种情况下几乎立即结束。）

data-visualization - 在 2D 中可视化 Gensim 的短语向量

1 回答 1

Related

Reference