2

我正在尝试使用libsvm对数据进行分类,如下图所示: SVM 的散点图

您可以“通过肉眼”看到蓝色和红色之间存在柔和的分离,但整个区域都存在一些蓝色样本,我会说“应该标记为红色”。

我无法让 libsvm 返回一个有意义的分类,并继续获得标记为蓝色的琐碎的单点。这发生在各种内核和参数值上。我认为使用成本变量并不能解决这个问题,因为蓝色样本比红色样本多 10 倍。

我错过了什么吗?是否有一些处理这种情况的 libsvm 参数?
或者 SVM 可能不适合该任务,您可以提出一些建议吗?

4

2 回答 2

0

应该可以使用线性 SVM 获得非平凡的解决方案。您应该尝试不同的 C 值,并且由于您的数据不平衡,请使用 wi 参数来固定每个类的权重。

于 2012-06-20T14:45:33.723 回答
0

尝试做一些主成分分析或一些独立成分分析作为预处理。这应该可以帮助你。鸢尾花数据库有很多例子。

于 2012-08-31T01:15:26.203 回答