0

我想使用 fastText Sentence Vector 作为输入特征。

vector = model.get_sentence_vector('Original Sentence')

我正在尝试使用 MLP 执行句子的二进制分类,并将使用上述代码生成的固定大小的特征来训练算法。这是一个合理的做法吗?

4

1 回答 1

1

您可以取词嵌入的平均值,即对句子进行标记,查找所有词的嵌入,计算平均值。这样,您将获得一个 NumPy 数组,您可以将其用作您想要的任何分类器的输入。根据分类任务,首先删除功能词可能很有用。

Gensim拥有比 FastText 本身更丰富的 Python API。如果你只是想快速训练一个分类器,最好的选择是使用FastText的命令行界面。

于 2020-05-13T07:56:36.657 回答