0

我已经阅读了很多教程并尝试了一些 minhash LSH,但它无法生成相似度矩阵,而是只返回超过阈值的相似数据。我怎样才能生成它?我的意图是使用 LSH 结果进行聚类。

4

1 回答 1

0

LSH 的重点是避免成对距离,因为这不会缩放。

如果然后将数据放入距离矩阵,则会再次遇到所有可伸缩性问题!

而是考虑像 DBSCAN 聚类这样的算法。它不需要距离矩阵,只需要距离 epsilon 的邻居。

于 2018-01-05T09:38:04.533 回答