我正在使用 doc2vec 将我的追随者的前 100 条推文转换为矢量表示(比如 v1.....v100)。之后,我使用向量表示来进行 K-Means 聚类。
model = Doc2Vec(documents=t, size=100, alpha=.035, window=10, workers=4, min_count=2)
我可以看到集群 0 由一些值(比如 v10、v12、v23 ......)支配。我的问题是这些 v10、v12 ... 等代表什么。我可以推断出这些特定列聚集了文档的特定关键字吗?