当计算单词之间的相似度时,我已经了解 LSA 是如何工作的。我正在使用网站 lsa.colorado.edu 中的 LSA,但我找不到如何计算句子或多个单词之间相似度的来源。它只是通过对所有成对相似性进行平均来完成的吗?
问问题
1205 次
2 回答
1
您可以简单地将词向量组合在一起,然后将最终总和作为句子向量返回。由于这些表示与单词表示具有相同的类型,因此您可以轻松地使用现有方法来计算语义相似度。
然后要计算语义相似度,您可以使用这些向量之间的余弦值。
我目前正在使用S-Space库,它有一个执行此任务的DocumentVectorBuilder类。
于 2013-07-22T02:23:16.030 回答
0
您使用所谓的点积来计算两个向量之间的余弦相似度。因此,一旦从术语文档频率矩阵中获得 SVD 矩阵,您就可以在两个向量之间应用点积公式。
于 2015-07-11T04:23:58.937 回答