我想计算句子含义相似度。我正在使用余弦相似度,但这种方法不能满足我的需求。
例如,如果我有这两个句子。
- 他和他的父亲非常亲近。
- 他与父亲有着奇妙的联系。
我需要的是根据含义相似度计算这些句子之间的相似度,而不仅仅是匹配相似的单词
有没有办法做到这一点?
我想计算句子含义相似度。我正在使用余弦相似度,但这种方法不能满足我的需求。
例如,如果我有这两个句子。
我需要的是根据含义相似度计算这些句子之间的相似度,而不仅仅是匹配相似的单词
有没有办法做到这一点?
一种方法是使用预训练的词向量(“嵌入”)来表示每个词。这些是具有数百维的向量,其中具有相似含义的单词(例如,“close”、“bond”)应该具有相似的向量。关键思想是词嵌入可以表示两个句子即使使用不同的词也具有相似的含义。
这是一个简单的方法:通过句子中预训练的嵌入和平均单词来表示每个单词。现在使用任何合理的距离度量(余弦是标准的)比较向量。