我有两组短消息,我想计算这两组之间的相似度,并根据它们的语义相似度来确定它们是否在谈论同一个子主题。我知道如何使用成对相似度,我的问题是我想计算两组中所有句子的整体相似度,而不是 2 个句子。有没有办法使用具有余弦相似度的 tf-idf 或 word2vec/doc2vec 来计算总分?
问问题
218 次
我有两组短消息,我想计算这两组之间的相似度,并根据它们的语义相似度来确定它们是否在谈论同一个子主题。我知道如何使用成对相似度,我的问题是我想计算两组中所有句子的整体相似度,而不是 2 个句子。有没有办法使用具有余弦相似度的 tf-idf 或 word2vec/doc2vec 来计算总分?