我正在尝试计算大量动态文本文档之间的相似性。对于静态集,余弦相似度 + tf-idf 之类的东西会很好用。但是,我正在寻找一种方案,该方案允许我添加新文档而无需重新计算整个相似性集。有没有这样的算法存在?
问问题
693 次
我正在尝试计算大量动态文本文档之间的相似性。对于静态集,余弦相似度 + tf-idf 之类的东西会很好用。但是,我正在寻找一种方案,该方案允许我添加新文档而无需重新计算整个相似性集。有没有这样的算法存在?