0

我正在使用 Phrases 类并希望在 2D 空间中可视化向量。为了用 Word2Vec 做到这一点,我使用了 T-SNE,它运行良好。当我尝试对短语做同样的事情时,它没有任何意义(单词出现在不相关的单词旁边)。

关于如何可视化短语输出的任何建议?

4

1 回答 1

0

正如gensim 邮件列表中建议/报告的那样,关键问题是仅仅将语料库包装Phrases在一个迭代器中,该迭代器只提供一次数据传递。该Word2Vec模型需要一个语料库,它可以在该语料库上进行多次通过来进行词汇发现,然后进行多次训练。(如果密切关注 INFO 级别的日志记录,应该有迹象表明“训练”在这种情况下几乎立即结束。)

于 2017-04-12T18:20:55.077 回答