1

有谁知道 facebook 开源的词向量(特别是这里的https://fasttext.cc/docs/en/pretrained-vectors.html)是否包含子词向量,或者它们是否只包含生成的完整词向量。我希望它们包含子词,但我很难找到它们,而且似乎无法在任何地方找到这个问题的明确答案。

4

1 回答 1

2

fastText为您提供两种可能的解决方案:

  1. 使用仅包含词嵌入向量的 .vec 文件
  2. 使用包含子词向量和模型参数的 .bin 文件。

实际上使用 .bin 文件,您可以获得所需的每个单词的嵌入,而使用 .vec 文件,您有固定数量的可用向量(仍然很大)。

于 2018-10-21T15:59:10.047 回答