我试图找到一个线性分类器,在数据非线性可分的情况下最小化训练误差(0/1 损失)。具体来说,我正在寻找一种确定权重的方法:
sign(weights' * features) = label
对于features
\in {0, 1}^d, label
\in {-1, 1} 和实值权重。我有 N 个训练实例,我希望上述等式适用于最大可能的实例数。我知道如果问题总是可分离的,那么像硬边距 SVM 这样的东西会起作用,但如果不是,我也需要找到解决方案。
(这个任务可能听起来有点深奥,但是请不要告诉我该怎么做而不是寻找一个最小训练误差的线性分类器——我所描述的绝对是我想要解决的问题!)