我正在准备一个我已经训练过的 word2vec 模型。我已将其序列化为 CSV 文件:
word, v0, v1, ..., vN
house, 0.1234, 0.4567, ..., 0.3461
car, 0.456, 0.677, ..., 0.3461
我想知道的是如何加载该词向量模型gensim
并使用它来训练段落或 doc2vec 模型。
这个Doc2Vec 教程说我可以以“”的形式加载模型,# C text format
但我不知道这实际上意味着什么。首先是什么是“C 文本格式”,但更重要的是:
- 如何加载我的 word2vec 模型并将其用于 doc2vec 培训?
如何从我的 word2vec 模型构建词汇表?