我有一些关于 SVM 的基本概念查询——如果有人能指导我,那就太好了。我一直在学习书籍和讲座,但无法正确获得这些查询的答案
假设我有 m 个特征数据点 - m > 2。我怎么知道数据点是否线性可分?如果我理解正确,线性可分数据点 - 不需要任何特殊内核来找到超平面,因为不需要增加维度。
说,我不确定数据是否线性可分。我试图得到一个具有线性内核的超平面,一次有松弛,一次没有松弛,拉格朗日乘数。我会看到这两个超平面的训练和测试数据的错误率有什么不同。如果我理解正确,如果数据不是线性可分的,并且如果我没有使用松弛度,那么就不可能有任何最佳平面。如果是这样的话,支持向量机算法是否应该在不同的运行中给我不同的超平面。现在当我引入松弛时——我是否应该总是得到相同的超平面,每次运行?以及如何从超平面的拉格朗日乘数中找出数据是否线性可分。
现在从 2 说,我以某种方式知道数据在 m 维上不是线性可分的。所以我会尝试增加维度,看看它是否可以在更高的维度上分离。我怎么知道我需要走多高?我知道计算不会进入那个空间——但是有什么方法可以从 2 中找出 3 的最佳内核(即我想找到一个线性分离的超平面)。
什么是在 Matlab 中可视化超平面和数据点的最佳方法,其中特征维度可以高达 60 - 并且超平面的维度 > 100(即数百个数据点并使用高斯内核,特征向量会发生变化到 > 100 个维度)。
如果有人能解决这些疑虑,我将不胜感激