0

我将不同的文本聚集成 15 个集群。

文本格式如下:

"Oreo Biscuit is good"
"Healthy Breakfast
"Cars are fast"
....

我将文本转换为 100 维的 Word2Vec。现在我有 15 个集群,我想绘制它们。

我不想绘制所有点,而是想为每个集群绘制 1 个点,这样图中就有 15 个点。我怎么做?

想法:

1) Use the cluster centre to plot each cluster.

Is there any other way  (Converting all the Word2vecs in a cluster into 
Doc2vec) or 

Can Mds (Multi Dimensional Scaling) be used to plot the . 
clusters?

谢谢

4

1 回答 1

1

您已经拥有每个文本的矢量表示。你也有这些文本的集群。您有以下非常简单的选项:

  1. 您只需使用一些降维机制绘制集群中心点。(优点:简单,缺点:没有关于每个单独集群的优点的信息)
  2. 您仍然可以绘制集群质心,但可以使用一些气泡图将这些时间方差添加为第三维,如此处所示。(优点包括均值和方差,缺点: K-mean 太简单了)
  3. 我们可以应用一些谱聚类方法,然后在此基础上应用上述方法。
于 2018-06-11T06:08:41.607 回答