0

我想解决以下优化问题 -

成本函数: 1/2 ||W||^2

服从: Y_i(w.X_i - b) >= 1

其中X是 700x3 矩阵,Y是存储这些实例的类标签(值为 1/-1)的向量,是 和的w.X_i点积。wX_i

我正在使用 CVX -

cvx_begin
    variable W(3);
    variable B;
    minimize (0.5*W'*W)
    subject to 
        Y'*(X*W - B) >= 1;
cvx_end

然后,我正在密谋,w1.x1 + w2.x2 - b 这似乎没有分离超平面?

我在做什么错?

4

1 回答 1

0

简而言之: 当你这样做时,w1.x1 + w2.x2 - b你试图在特定位置指定一个超平面,这也与在向量上指定一个特定点相同。要在 3D 空间中执行任一操作,您需要使用所有三个维度,因此:w1.x1 + w2.x2 +w3.x3 - b

更长的时间: 当执行这样的线性分类时,可以通过两种方式查看任务:

  1. 找到一个分离超平面,使得一个类的所有样本都在一侧,而另一类的所有样本都在另一侧。

  2. 找到样本所在的多维空间到一维线的投影,使得线上有一个点可以清楚地将它们分开。

这些是相同的任务,因为 2 中的单一维度本质上是每个样本与分离超平面的距离(以及所述样本在哪一侧)。我发现牢记这两种观点是有帮助的,特别是因为分离超平面是与一维向量正交的平面。

因此,在您正在处理的情况下,w模型提供的权重向量用于将矩阵中的样本X投影到一维线上,并且偏移量b指示沿着该向量的哪个点出现分离超平面。通过从投影值中减去b它们,它们被移动,使得该超平面是与点 0 处的线正交的超平面,这使得进行简单的阈值化。

于 2015-02-01T14:09:33.253 回答