-c选项是设置超参数值。由于您的数据不平衡,因此与示例数量较少的类相比,它会尽量减少具有大量示例的类的错误。
现在,一种方法是以某种方式向算法建议,与其他类相比,具有较少示例的类的错误应该给予更大的权重。您可以使用-w选项来执行此操作。
说:你有两个职业 +1 和 -1。与 -1 类相比,+1 示例的数量较少。因此,您希望对 +1 类给予更多的权重。现在,您可以将参数设置为,
-w+1 10 -c C
表示正类的错误应该比二元分类中的负类赋予大约 10 倍的权重。
与-c一起使用的值和-w是使用交叉验证技术选择的。