我目前正在使用 matlab 中的 libsvm 对两个标签进行分类。我已经提取了这些特征,其中大约有 69 个。我只是想知道是否可以使用线性内核进行具有大约 69 个特征的两类分类。
谢谢
马库斯
我目前正在使用 matlab 中的 libsvm 对两个标签进行分类。我已经提取了这些特征,其中大约有 69 个。我只是想知道是否可以使用线性内核进行具有大约 69 个特征的两类分类。
谢谢
马库斯
它始终取决于数据的性质。如果它是线性可分的,那么线性核就足够了。
如果数据是非线性的并且是局部封装的(换句话说,如果存在一个包含所有数据的超球体——包括新点),那么 RBF 内核听起来像是适合这项工作的内核。
如果数据是非线性的但它没有被封装(所以它可能总是远离你的训练集数据的一个新点)那么你可能想尝试使用一个连续的内核,比如多项式内核)
在高维空间中很难推断出数据的性质,因此大多数时候实际的解决方案是尝试不同的场景并使用交叉验证来选择合适的内核和参数。
然而,有时绘制不同的特征对有助于我了解我的数据性质,但这只是一个非常粗略的指标。
是的,完全没问题。我对具有大约 5000 个特征的数据使用了线性内核。(并不是说这是最好的方法,但有可能。)
更好的是,为什么不试试 RBF 内核并比较结果呢?
这真的取决于情况。在不同的场景下,不同内核的结果会有所不同。你需要尝试。
试试RBF核,多项式核。不同的内核给出不同的结果。你得试试。