3

我正在使用 LibSVM 在高度不平衡的数据集上训练 SVM。输出的 10% 为真,而 90% 为假。我读到了重量参数:

  -wi weight: set the parameter C of class i to weight*C, for C-SVC (default 1)

每个类的参数集应该是什么?这个权重参数在直观上是什么意思,我们应该如何使用呢?

4

1 回答 1

4

权重参数控制 SVM 优化的偏度。也就是说,权重较高的类将计数更多。如果一个类的权重是另一个类的 3 倍,则权重较低的类的实例距离 libsvm 确定为另一个类的实例的类之间的边界距离可以是 3 倍以获得相同的优化值。

你如何使用它完全取决于你——你可以设置它,使两个类的权重相等(即权重为 9),但如果你得到的结果实际上改进了使用相同的权重是不同的事情。

我建议你玩不同的重量,看看会发生什么。

于 2012-08-01T18:25:22.170 回答