我有这种与内核 svm 相关的困惑。我读到使用内核 svm 保留的支持向量的数量很大。这就是为什么训练困难且耗时的原因。我没有得到这部分为什么难以优化。好的,我可以说嘈杂的数据需要大量的支持向量。但这与训练时间有什么关系。
另外我正在阅读另一篇文章,他们试图将非线性 SVM 内核转换为线性 SVM 内核。在线性核的情况下,它只是原始特征本身的点积。但在非线性的情况下,它是 RBF 和其他。我没有理解他们所说的“操纵核矩阵会带来重大的计算瓶颈”的意思。据我所知,内核矩阵是静态的,不是吗。对于线性内核,它只是原始特征的点积。在 RBF 的情况下,它使用高斯核。所以我只需要计算一次,然后我就完成了不是吗。那么操纵和瓶颈思考的意义何在?
支持向量机 (SVM) (Cortes and Vapnik, 1995) 作为最先进的分类算法已广泛应用于各个科学领域。内核的使用允许将输入样本映射到再现内核希尔伯特空间(RKHS),这对于解决线性不可分问题至关重要。虽然核 SVM 提供了最先进的结果,但操作核矩阵的需要带来了严重的计算瓶颈,使得难以在大数据上进行扩展。