目前,Fasttext 通过取句子中单词的归一化词向量的平均值来生成句子向量。这是提出句子向量的最佳方法吗?
或者是否使用单词的 tfidf 权重,然后从中减去第一个 PCA 组件,如本文所述:https ://openreview.net/pdf?id=SyK00v5xx 会更好。在 fasttext 中是否已经有任何这样的实现。如果是这样,在哪里以及如何通过 python 使用它。
另外,当我计算它的 fasttext 向量时,我是否需要从句子中删除停用词?
同样在fasttext的python绑定中如何计算句子向量。似乎没有语法。任何意见。