我从math.stackexchange.com交叉发布了这个,因为我没有得到任何反馈,而且这对我来说是一个时间敏感的问题。
我的问题与支持向量机中超平面的线性可分性有关。
根据维基百科:
...形式上,支持向量机在高维或无限维空间中构造一个超平面或一组超平面,可用于分类、回归或其他任务。直观地说,与任何类的最近训练数据点的距离最大的超平面(所谓的功能边距)实现了良好的分离,因为一般来说,边距越大,分类器的泛化误差越低。
超平面对类的线性分离直观地对我来说是有意义的。我想我理解二维几何的线性可分性。但是,我正在使用流行的 SVM 库 (libSVM) 实现 SVM,并且在处理数字时,我无法理解 SVM 如何在类之间创建曲线,或者将类别 1 中的中心点包含在圆形曲线中如果 n 维空间 V 中的超平面是维度 n - 1 的“平面”子集,则被类别 2 中的点包围,或者对于二维空间 - 一维线。
这就是我的意思:
那不是超平面。那是圆形的。这是如何运作的?或者 SVM 内部的维度是否比二维 2D 输入特征多?
此示例应用程序可在此处下载。
编辑:
感谢您的全面回答。所以 SVM 可以通过使用核函数很好地分离奇怪的数据。在将数据发送到 SVM 之前对数据进行线性化是否有帮助?例如,我的一个输入特征(一个数值)有一个转折点(例如 0),它恰好适合类别 1,但高于和低于零则适合类别 2。现在,因为我知道这一点,它会帮助分类发送SVM这个特征的绝对值?