问题标签 [knn]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1577 浏览

node.js - 数据集 Node.js 中的最近邻

我有一个将数据保存到 MongoDB 的 Node.js 应用程序。给定一个文档,我想在数据库中找到最相似的文档。

我的想法是实现某种最近邻算法,将所有记录作为训练序列并返回最相似的文档(包括关于这两个文档相似程度的某种百分比。)

例如,在我的数据库中有这些记录...

...我想找到最接近这个的文件

是否有任何节点模块/实现采用任何类型的对象/参数并返回其最近的邻居?

0 投票
0 回答
551 浏览

c++ - opencv flann 索引赋值运算符

我想cv::flann::Index用作类成员,从而在必要时为其赋值。

但是,如果重新分配,我会在执行期间销毁时Index得到“未分配指针被释放” 。Index它的复制控制有问题还是我误解了smth?

这有效:

这不起作用

甚至这不起作用:

它是opencv 2.4.2

0 投票
3 回答
1498 浏览

machine-learning - KD树搜索KNN什么时候不起作用?

我一直在探索和学习 KNN 的 KD 树(K 最近邻问题),什么时候搜索不起作用?或者是否值得或不改进天真的搜索。这种方法有什么缺点吗?

0 投票
1 回答
1890 浏览

matlab - 数据集的 KNN 分类。

我有一个包含 178 个属性的数据集,其中包含 13 个属性。我将它们分成 2 组(100 和 78)进行训练和测试。

我想确定每个标记样本的 k 个最近邻居。如果样本的标签比 k 个最近邻的任何其他标签更常见,则将分类视为正确,否则,将分类视为错误。

这是我完全迷失的部分。

0 投票
1 回答
156 浏览

algorithm - 在大集合中找到最近的邻居

我在多维空间中有大量点。而且我想为任何给定点找到几个邻居(在附近)(要求是避免扫描所有点)。

我想知道我的解决方案是否合适:

预处理:

  1. 定义一组正交轴
  2. 对每个轴上的每个点进行投影
  3. 每个投影都与其到轴起点的距离(键)和点的标识符(值)相关联。索引投影- 将它们全部放入排序集(例如树集)

要查找任何给定点的邻居:

  1. 找到它在每个轴上的投影
  2. 使用 idex - 在每个 exis 上找到最近的投影
  3. 寻找实际的邻居——所有结果的交集

这是一个简单的例子:

在此处输入图像描述

相交[2, 4, 1][4, 5]产生答案[4]

请指出我,如果我在算法中犯了任何错误

谢谢

0 投票
1 回答
2520 浏览

matlab - 在 Matlab 中为 KNN 选择 k

我目前正在使用 Matlab 的 k 最近邻分类器(knnclassify)来训练和测试二进制属性。如果没有提供 k,则 k 的默认值参数是 1,并且可以选择其他 k 值。我已经在网上和 stackoverflow 上进行了研究,但没有任何相关内容可以解决我的问题,即 k 的最佳用途。是否有一个内置函数可以告诉我,对于我的特定数据,还是只是猜测并等待查看导出的准确性?任何帮助将不胜感激。

这是 matlab 的 knnclassify 文档的链接:knnclassify

0 投票
1 回答
1447 浏览

weka - Weka如何从KNN(IBk)中绘制ROC曲线?

在发布之前,我已经阅读了很多关于 ROC 曲线的内容。

所以,我不明白 Weka 是如何绘制 ROC 曲线的。我找不到要改变以生成曲线中的点的阈值。谢谢,

0 投票
1 回答
2241 浏览

algorithm - 为什么 KNN 比决策树快得多?

有一次在面试中,遇到了雇主的一个问题。他问我为什么 KNN 分类器比决策树快得多,例如在字母识别或人脸识别中?

当时我完全不知道。所以我想知道我应该在哪些方面比较两种分类方法的速度性能?谢谢。

0 投票
2 回答
780 浏览

r - 如何在 R 中对基因组数据执行 dist 和 kNN?

我有缺失值的基因组数据,我想通过使用可用值来计算每对基因的表达水平之间的距离。然后我想发现 K 个最近的邻居来填补空白?我怎么能在 R 中做到这一点?

...我如何计算欧几里德距离?我当时只需要使用一排吗?

抱歉,我是基因组数据的新手,我无法在任何地方找到此信息。

谢谢。

0 投票
2 回答
1385 浏览

machine-learning - k-最近邻算法

我正在我的智能设备上实施 k-最近邻算法,以便从识别数据中识别人类活动。我将解释我将如何实现它。你们能否建议我对我正在采取的步骤进行任何改进,并回答我在途中可能会问的任何问题?

这些是步骤:

  1. 我下载了一个带标签的数据集,其中包括来自加速度计的三轴加速度以及描述活动的标签。我将在这个数据集中选择一些我希望识别的活动(在我的例子中是步行、坐着、站立)的数据。
  2. 然后,我将从数据集中的加速度计数据的每个窗口(即从包含加速度计数据的 128 个读数的数据集中的每条记录)中提取特征(在我的情况下,从幅度加速度的平均值、最小值、最大值、标准偏差)和我将以 JSON 格式将这些特征与窗口标签(作为一条记录)一起存储在设备上的文本文件中。因此,训练数据集中的一个记录/样本将包括:平均值、最小值、最大值、标准差和一个标签
  3. 在分类步骤中,从收集的数据中,我还将有一个加速度计数据窗口,从中提取上述 4 个特征。因此,我需要将收集到的数据的 4 个特征与训练数据中的每个样本进行比较。我应该如何找到它们之间的相似性,因为一条记录将包含 4 个特征?

作为第 (3) 点问题的解决方案,我正在考虑通过计算每个特征之间的差异来获取每个特征的 k 最近邻,然后从每个特征中挑选出大多数。请问你怎么看?你能提出任何优化吗?谢谢 :)