我正在尝试使用libsvm对数据进行分类,如下图所示:
您可以“通过肉眼”看到蓝色和红色之间存在柔和的分离,但整个区域都存在一些蓝色样本,我会说“应该标记为红色”。
我无法让 libsvm 返回一个有意义的分类,并继续获得标记为蓝色的琐碎的单点。这发生在各种内核和参数值上。我认为使用成本变量并不能解决这个问题,因为蓝色样本比红色样本多 10 倍。
我错过了什么吗?是否有一些处理这种情况的 libsvm 参数?
或者 SVM 可能不适合该任务,您可以提出一些建议吗?
我正在尝试使用libsvm对数据进行分类,如下图所示:
您可以“通过肉眼”看到蓝色和红色之间存在柔和的分离,但整个区域都存在一些蓝色样本,我会说“应该标记为红色”。
我无法让 libsvm 返回一个有意义的分类,并继续获得标记为蓝色的琐碎的单点。这发生在各种内核和参数值上。我认为使用成本变量并不能解决这个问题,因为蓝色样本比红色样本多 10 倍。
我错过了什么吗?是否有一些处理这种情况的 libsvm 参数?
或者 SVM 可能不适合该任务,您可以提出一些建议吗?