问题标签 [knn]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 在 scikit-learn 中为 KNN 使用除 p-norm 之外的其他成对距离度量
对于scikit-learn 的 KNN 包,可以指定sklearn.metrics.pairwise
不是 p 范数或 Minkowski 距离的成对距离度量(来自包)吗?例如,我可以使用RBF 内核吗?甚至是余弦距离?
c++ - 基于汉明距离的快速 NN 相似性搜索的 LSH?
我正在研究对多维向量的快速 NN 搜索。(就像在提取和计算了特征向量之后搜索相似的图像)
我目前正在使用ORB,它用一些字符串来描述它的关键点。
要比较 2 个描述符 ORB 需要汉明距离。
我已经阅读过 LSH 根据欧几里德距离 (L2) 或 Manathann 距离 (L1) 计算其哈希表。这是否意味着 LSHisn't
是需要汉明距离的向量比较的选项?
编辑
LSH 可以处理汉明距离,因为它根据初始位字符串上的子字符串制作哈希表,这就是它起作用的原因
classification - k最近邻算法中k的值
我有 7 个需要分类的类,我有 10 个特征。在这种情况下,我是否需要使用 k 的最佳值,或者我是否必须针对 1 到 10(大约 10)之间的 k 值运行 KNN 并在算法本身的帮助下确定最佳值?
r - 已安装软件包,但出现无法找到功能的错误 R
可能重复:
错误:在 R 中找不到函数...
我正在尝试在 R 中使用 knn 函数,并且已经安装了几个包来这样做(例如 KNN、KNNgarden、iped)。
使用 R-Studio,它遇到了成功安装包(包 'kknn' 成功解包并检查了 MD5 总和),但是当我尝试使用 kknn (kknn(train, test, cl, k = 1, l = 0, prob = TRUE, use.all = TRUE)) 我收到以下错误:错误:找不到函数“kknn”
我假设这与我的工作目录有关。我检查并将我的 WD 重置为 R 中包含软件包的文件夹,但要知道是否有用。我究竟做错了什么?
error-handling - Stata中如何有效使用knn
我有两个关于在 Stata 中执行 discrim knn 的问题。
1)您如何正确编码命令?我尝试了各种版本,但似乎总是得到一个错误,即指定的变量太多。
- 结果正确的向量是buy。
- 我在尝试:
discrim knn buy, group(train test) k(1)
2)我对 KNN 的理解是因子变量(二进制)对于使用 KNN 来说是很好的,甚至受到鼓励。但是,我收到不允许使用因子变量和时间序列运算符的错误消息。
最后,虽然我知道这不是这个问题的最佳空间,但每个向量是否应该针对 knn 进行归一化?我听到了相互矛盾的回应。
r - 如何为 knn 模型绘制 ROC 曲线
我正在使用 ROCR 包,我想知道如何在 R 中为 knn 模型绘制 ROC 曲线?有没有办法用这个包把它全部绘制出来?
我不知道如何使用ROCR的预测功能进行knn。这是我的示例,我正在使用来自 UCI 存储库的 isolet 数据集,其中我将类属性重命名为 y:
现在我的问题是,传递给 ROC 预测函数的参数是什么。我尝试了以下两种不起作用的替代方法:
r - 提取knn回归模型
我为 R 找到了关于“k Nearest Neighbor Regression”的包。我尝试了这个例子(见下文),但我想做的是保存创建的回归模型(pac.knn)。如何保存或提取模型并将其应用到 R 之外?
python - 每个数据点的 k 最近邻脚本
我有很多功能,如下所示:
我正在尝试计算每个特征的 k 最近邻,对于k=5
. 我正在使用 numpy 和 scipy 包,但是,由于数据集很大(1000 x 1000),它的计算似乎很复杂。有没有更简单的方法来使用 python 计算 kNN?
opencv - 获取opencv中knn中所有样本的距离
据我所知,knn 找到所有样本的最小距离。这意味着它是最近的样本。但是如果我想要我的新数据与所有样本的距离怎么办?例如,如何获得与我的新数据最近的 3 或 4 个样本?谢谢