它是关于非参数密度估计。
因此,我们有 2 个不同的数据 220 个“好数据”值和 30 个“坏数据”值,我们应该使用 k-最近邻密度估计来估计 p(x |c="good data")
在 k=5 的情况下,我们有 p(x |c=good) =(5/220)*(1/V)。
如果我理解正确,通过k-最近邻我们应该确定V然后得到p(x | c =好)如果我们必须找出5个点的V,那么我们可以解决p(x | c =好)
我有一个问题,如何绘制和计算这个概率。书中有图片 http://content.foto.mail.ru/mail/zurix/_mypagephoto/h-67.jpg K最近邻密度估计图形上的蓝色曲线是什么意思(你可以看到附件)?这条曲线可以显示不同 V 的边界吗?如果是,那么类之间的确切边界在哪里,每个类由 5 个点组成???
先感谢您!!