我需要有关 libSVM 的权重选项的帮助。我在某些时候感到困惑;我们是否也应该在进行交叉验证时使用 -wi 选项?如果是这样,我们应该使用整个数据的计算权重还是根据 v-1 子集计算的权重(用于 v-fold 交叉验证)?我的第二个问题是我们应该在预测期间使用 -wi 选项吗?如果是这样,我们应该在训练期间使用计算的权重还是应该根据测试数据中负实例和正实例的分布来计算权重?
例如; 我们有 50 + 数据和 200 - 数据。因此,在计算出最佳 c 和 gamma 参数值之后,我们将在训练时使用 -w1 4 -w-1 1 选项。但是网格搜索和交叉验证期间的训练呢?假设我们正在执行 5 折交叉验证。在对剩余的 4 个子集进行训练时,负实例和正实例的分布可能会发生变化。那么我们应该在这个 5 折交叉验证期间重新计算权重吗?
除了我们应该在测试时使用 -w1 4 -w-1 1 选项吗?
谢谢