我有一个需要在 MATLAB 中解决的二进制分类问题。有两个类,训练数据和测试数据问题来自两个类,它们是从高斯分布绘制的二维坐标。
样本是 2D 点,它们是这样的(A 类有 1000 个样本,B 类有 1000 个样本):我只是在这里发布其中的一些:
5.867766 3.843014 5.019520 2.874257 1.787476 4.483156 4.494783 3.551501 1.212243 5.949315 2.216728 4.126151 2.864502 3.139245 1.532942 6.669650 6.569531 5.032038 2.552391 5.753817 2.610070 4.251235 1.943493 4.326230 1.617939 4.948345
如果有新的测试数据进来,我应该如何对测试样本进行分类?
P(Class/TestPoint) 与 P(TestPoint/Class) * (ProbabilityOfClass) 成正比。
我不确定我们如何计算给定二维坐标的 P(Sample/Class) 变量。现在,我正在使用公式
P(坐标/类)=(坐标-该类的平均值)/该类中点的标准差)。
但是,我没有得到很好的测试结果。我做错什么了吗?