3

我之前要求解释线性可分数据。仍在阅读 Mitchell 的机器学习书,我很难理解为什么感知器规则仅适用于线性可分数据?

Mitchell 定义感知器如下: 感知器

也就是说,如果加权输入的总和超过某个阈值,则 y 为 1 或 -1。

现在,问题是确定一个权重向量,使感知器为每个给定的训练示例产生正确的输出(1 或 -1)。实现这一点的一种方法是通过感知器规则:

学习一个可接受的权重向量的一种方法是从随机权重开始,然后迭代地将感知器应用于每个训练示例,并在它对示例进行错误分类时修改感知器权重。重复此过程,根据需要多次迭代训练示例,直到感知器正确分类所有训练示例。根据感知器训练规则在每一步修改权重,它根据规则修改与输入 xi 关联的权重 wi: 感知器规则

所以,我的问题是:为什么这只适用于线性可分数据?谢谢。

4

1 回答 1

6

w因为和的点积x是 s 的线性组合x,而实际上,您使用超平面将数据分成 2 个类a_1 x_1 + … + a_n x_n > 0

考虑一个 2D 示例:X = (x, y)然后. 如果它的参数大于 0,则返回 1,也就是说,对于类 #1 你有,这相当于(假设 b != 0)。这个方程是线性的,将一个二维平面分成两部分。W = (a, b)X * W = a*x + b*ysgna*x + b*y > 0y > -a/b x

于 2012-12-21T10:56:08.520 回答