0

我有一个数据集。该数据集仅包含单词。我必须对这些词进行矢量化。我搜索了词向量算法。Bag of words, word2wec, tf-idf Bag of words, word2wec, tf-idf 正在做向量化句子中的单词的过程。但我没有句子。我只有一句话。那么如何进行向量化单词的过程呢?

4

1 回答 1

0

Spacy有一个库来获取300维的词向量。您需要加载一个矢量包,如代码所示。token.vector 将为您提供一个单词的向量

import spacy
nlp = spacy.load('en_core_web_md')
token = nlp('Basketball')
print(token.vector)
于 2019-03-31T18:33:35.887 回答