我已经Word2vec
在“棕色语料库”上训练了一个模型。
我想将向量化的单词应用于一个新的文本文档,然后我想通过 way 对其句子进行聚类Affinity Propagation
。
import gensim
import nltk
from nltk.corpus import brown
sentences = brown.sents()
model = gensim.models.Word2Vec(sentences, min_count=1)
model.save('brown_model')
model = gensim.models.Word2Vec.load('brown_model')
我的文本文档包含一个请求列表,例如:
"I want to go to the store"
"I want the president to help me"
"Clean up my house"
我的问题是:
如何将矢量化Brown corpus
应用于我自己的文本数据以进行后续聚类?