1

我正在寻找使用欧几里得距离的python 3中LSH的有效实现。

有“in-python”LSHForest实现,但它使用余弦距离。

此外,即使使用此实现,我也没有找到查看每个篮子内容的方法,例如,如果使用 LSH 进行聚类 - 它只返回一定半径内的一定数量的近似邻居。但是如果我想查看所有邻居,我看不到它是如何完成的(我不想使用任意的搜索半径,我真的不确定使用这个非常大或无限的半径是什么意思执行)。

将欣赏任何见解。非常感谢。

4

1 回答 1

1

对于软件推荐,请在此处询问:软件推荐


对于它是如何工作的,首先阅读我的答案,然后假设您从包中询问(我没有使用它)一个很大的 k (k应该是软件返回的邻居数),在一个很大的半径内r。这应该返回许多邻居 set k = N,其中N是数据集中点的数量,您将获得所有邻居。

如果您想查看某个桶内的所有邻居,那么您必须调查一个桶可以包含多少个点并将其设置k为该数字。

于 2016-06-14T13:46:39.643 回答