4

我想使用 doc2vec 表示和 scikit-learn 模型对文本文档进行分类。

我的问题是我迷失了如何开始。有人可以解释将 doc2vec 与 scikit-learn 一起使用通常采取的一般步骤吗?

4

1 回答 1

9

这里有一个很棒的教程,用于使用 scikit-learn + doc2vec 进行二进制分类。简而言之:

  • gensim用于训练/加载您的 doc2vec 模型。
  • 输入文本将被转换为浮点数的固定维度向量(与嵌入相同的维度)。这些是实际的输入特征。
  • 现在可以随意使用scikit-learn.
于 2016-11-28T10:31:36.950 回答