我正在尝试为 K 最近邻算法找到 K 的最佳值。我一直在 Matlab 上针对不同数量的类成员运行这种分类方法,但是当我们使用不同的 K 值时,我需要计算错误率。我试图以这个想法为例:
我有以下数据集:
1 3 1
2 3 2
2 1 2
3 3 2
3 4 1
3 3 2
2 2 2
第一列是 x 轴,第二列是 y 轴,第三列是类的标签,我需要使用 K-NN 算法对点 (x,y) 进行分类。我正在使用不同的 K 值。我的问题是我是否知道该点 (4,1) 不包含在源数据集中,但我知道它来自类标签 1。如何计算基于Leave-one-out-cross-validation方法的某个K值。
非常感谢你提前
问候
里纳迪