Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我已经阅读了很多教程并尝试了一些 minhash LSH,但它无法生成相似度矩阵,而是只返回超过阈值的相似数据。我怎样才能生成它?我的意图是使用 LSH 结果进行聚类。
LSH 的重点是避免成对距离,因为这不会缩放。
如果然后将数据放入距离矩阵,则会再次遇到所有可伸缩性问题!
而是考虑像 DBSCAN 聚类这样的算法。它不需要距离矩阵,只需要距离 epsilon 的邻居。