我之前要求解释线性可分数据。仍在阅读 Mitchell 的机器学习书,我很难理解为什么感知器规则仅适用于线性可分数据?
Mitchell 定义感知器如下:
也就是说,如果加权输入的总和超过某个阈值,则 y 为 1 或 -1。
现在,问题是确定一个权重向量,使感知器为每个给定的训练示例产生正确的输出(1 或 -1)。实现这一点的一种方法是通过感知器规则:
学习一个可接受的权重向量的一种方法是从随机权重开始,然后迭代地将感知器应用于每个训练示例,并在它对示例进行错误分类时修改感知器权重。重复此过程,根据需要多次迭代训练示例,直到感知器正确分类所有训练示例。根据感知器训练规则在每一步修改权重,它根据规则修改与输入 xi 关联的权重 wi:
所以,我的问题是:为什么这只适用于线性可分数据?谢谢。