我有一个非常具体的问题。我从事一个项目,是否需要找到最近的邻居(k 和附近)。由于我不需要 excat 并且希望能够扩展到高维度,因此我专注于 LSH。
我的数据的距离是一个度量,但不是欧几里得。我发现了许多使用欧几里得度量(例如 p 稳定分布)、二进制编码(通过投影)或基于字符串的向量空间的方法。
我正在搜索的是为任意度量提供 LSH 模板的论文。有人对论文有一些参考吗?
提前感谢丹
我有一个非常具体的问题。我从事一个项目,是否需要找到最近的邻居(k 和附近)。由于我不需要 excat 并且希望能够扩展到高维度,因此我专注于 LSH。
我的数据的距离是一个度量,但不是欧几里得。我发现了许多使用欧几里得度量(例如 p 稳定分布)、二进制编码(通过投影)或基于字符串的向量空间的方法。
我正在搜索的是为任意度量提供 LSH 模板的论文。有人对论文有一些参考吗?
提前感谢丹
您正在寻找的是相当新的:我认为这篇论文可能会有所帮助 http://www.aaai.org/ocs/index.php/aaai/aaai10/paper/download/1839/2032
它为非度量数据提出了策略,这比非欧几里得情况更糟糕。