1

我正在尝试计算两个二元组之间的语义相似度,我需要使用 fasttext 的预训练词向量来完成这项任务。

例如:

b-gram 是两个元素的 python 列表: [his, name][I, am]

它们是两个元组,我需要通过任何必要的方式计算这两个元组之间的相似性。

我希望有一个分数可以给我一个很好的相似度近似值。例如,如果有方法可以告诉我这与than[His, name]更相似。[I, am][An, apple]

现在我只使用了包含任何语义相似性的余弦相似度。

4

1 回答 1

1

如果您首先在二元组中平均两个词向量,则余弦相似度可能会很有用。因此,您想将“his”和“name”的向量平均为一个向量。然后取“I”和“am”的向量并将它们平均为一个向量。最后,计算两个结果向量的余弦相似度,它应该会给你一个粗略的语义相似度。

于 2017-12-03T14:38:33.117 回答