我正在为一些 2D 数据构建分类器。
我有一些我知道类的训练数据,并将它们绘制在图表上以查看聚类。
对观察者来说,有明显的、独立的集群,但不幸的是,它们分布在线条上而不是紧密的集群中。一个线扩展以大约 80 度角上升,另一个以 45 度角上升,另一个与水平线呈约 10 度角,但所有三个似乎都指向原点。
我想对一些测试数据执行最近邻分类,从外观上看,如果测试数据与训练数据非常相似,则 3-最近邻分类器可以正常工作,除非数据接近图的原点,在这种情况下,三个集群非常接近,可能会有一些错误。
我应该为我的集群提出一些估计的高斯分布吗?如果是这样,我不确定如何将它与最近邻分类器结合起来?
感谢任何输入。
干杯