问题标签 [nearest-neighbor]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
5640 浏览

computational-geometry - 它如何将图像与 kd-trees 和最近邻搜索进行比较/匹配?

我一直在向谷歌查询有关 kd-trees 和图像比较的一些材料,但我无法在使用 kd-trees 进行图像比较的技术之间建立“链接”。首先,我找到了一些关于使用随机 kd-trees 提高速度的文章,然后我被介绍给了 SIFT。在基本了解了 SIFT 的工作原理后,我阅读了有关最近邻搜索的内容。

我真正的问题是:如果我有来自 SIFT 的点网格,那么我为每个图像创建 kd-tree。最近邻搜索如何帮助我比较图像?起初,我认为将图像与树进行比较可以使用某种算法检查树结构以及每个点与图像 A 与图像 B 中同一节点中的点的距离。

如果问题太愚蠢,请提出材料或一些搜索主题。

谢谢!

0 投票
15 回答
72997 浏览

algorithm - 高维数据中的最近邻?

几天前我问了一个关于如何找到给定向量的最近邻居的问题。我的向量现在是 21 维,在我继续之前,因为我不是来自机器学习或数学领域,我开始问自己一些基本问题:

  • 欧几里得距离是首先找到最近邻居的好指标吗?如果没有,我有什么选择?
  • 此外,如何确定确定 k 邻居的正确阈值?是否可以进行一些分析来计算出这个值?
  • 以前,有人建议我使用 kd-Trees,但 Wikipedia 页面明确表示,对于高维,kd-Tree 几乎等同于蛮力搜索。在那种情况下,在百万点数据集中有效地找到最近邻的最佳方法是什么?

有人可以澄清上述部分(或全部)问题吗?

0 投票
1 回答
574 浏览

algorithm - Levenstein-distance-like metric 中的最近邻搜索

我有一组单词(“字典”),我必须从字典中找到最接近的单词,给定一个新单词。(我使用“单词”作为关键字,因为它实际上是一个可变长度的抽象“字母”序列)。

我正在使用 Levenstein 距离的概括作为度量——我需要概括的原因是我需要交换两个给定字母的特定“成本”——例如,我需要将“a”与“b”交换成本'a' 与 'c' 的交换更少。我想我仍然必须说服自己,我的概括仍然是一个指标。

目前我正在使用简单的线性搜索,即遍历字典中的所有单词并跟踪最小距离,我正在寻找一种更有效的方法。

我开始阅读有关最近邻搜索的方法,但对我来说主要的概念困难是我的“点”(单词)没有嵌入我可以可视化的空间中,它们不是具有维度等的向量。

考虑到这一点,我想听听一些关于寻找哪些算法的建议。

0 投票
2 回答
2144 浏览

r - knn 密度估计 R

是否有任何函数/包可以在 R 中执行基于 k 近邻的密度估计?

0 投票
2 回答
560 浏览

algorithm - Dijkstra 算法最短路径

我正在尝试构建一个最短路径程序,但我对图表有疑问。你应该先画图???否则我将如何定义哪些节点是邻居???

0 投票
1 回答
876 浏览

java - 基于关键字的最近邻算法或库

我想找到一个库或算法(所以我自己编写代码)来识别网页的最近 k 个邻居,其中网页被定义为一组关键字。我已经完成了提取关键字的部分。

它不必非常好,只要足够好。

任何人都可以提出解决方案,或者从哪里开始。我过去看过 Yury Lifshits 的讲座,但如果可能的话,我希望能得到一些现成的东西。

首选 Java 库。

0 投票
2 回答
1919 浏览

c++ - 从矩阵中查找距离 k 内的元素

给定一个*n 矩阵和一个值 k,我们如何找到每个元素的所有邻居?例如:在一个4*4矩阵中,k=2 说矩阵是:

其中这些值是位置的索引,是 的邻居1 are 1,2,3,5,6,9。这些值3,6 and 9只是因为 k = 2 而如果 k = 1 则不会存在。

同样 6 的邻居将是1 2 3 5 6 7 8 9 10 11 and 14

你能帮我写ac代码来用c++实现这个吗。

这是冯诺依曼邻域的问题,请有人用c ++实现它。谢谢

0 投票
5 回答
2842 浏览

ruby - 我需要什么数据来实现 k 最近邻?

我目前有一个 reddit 克隆类型的网站。我正在尝试根据我的用户以前喜欢的帖子推荐帖子。

似乎 K 最近邻或 k 均值是最好的方法。

我似乎无法理解如何实际实现这一点。我看过一些数学公式(例如 k 表示维基百科页面上的那个),但它们对我来说真的没有意义。

有人可以推荐一些伪代码,或者可以看的地方,这样我就可以更好地了解如何做到这一点?

0 投票
4 回答
6366 浏览

api - Does anyone know of a free Neighborhood Database?

Working on a SaaS application in PHP/Zend and want to provide users with the ability to search by neighborhood as well radius from zip code. We've been trying to find a decent Neighborhood DB of the US, but so far have only found very expensive sources.

Has anyone found/built a neighborhood db either by zip code or by lat/long?

0 投票
1 回答
1982 浏览

matlab - 如何存储局部敏感哈希?

我已经有了生成局部敏感散列的算法,但是我应该如何将它们存储起来以利用它们的特性(即相似的元素具有接近散列(具有汉明距离))?

在 matlab 代码中,我发现他们只是在要搜索的点的散列和数据库中点的散列之间创建一个距离矩阵,以简化代码,同时引用所谓的 Charikar 方法来实现搜索的实际良好方法。

我试图搜索它,但我不确定如何将我找到的任何方法应用于我的案例(如多探针方法)。如果您已经拥有哈希值,那么这些技术似乎都不是很容易插入的。是否有任何简单的示例代码?或者有什么建议?

这是我正在谈论的带有 matlab 代码的页面的链接: http ://www.eecs.berkeley.edu/~kulis/klsh/klsh.htm