Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我正在尝试实现 SVM 算法,但我很难理解如何实际处理 d 维数据集。在我的特殊情况下,每个“点”都有近 400 个识别特征。
在二维空间中,它基本上试图在两组之间找到一条线,使两边任意点的边距最大化。我可以想象这样的“线”在 d 维空间中会是什么样子,但我完全不知道分类实际上是如何工作的。
这里有一个类似的问题,但我不明白。我有点明白在你拥有分类器后分离会如何发生,但我不知道如何实际获得分类器。
如果你能想象二维情况的线如何成为更高维度的 d 维超平面,那么你就完成了。实际分类发生在您在超平面上测试一个点时,如果该点属于第 1 类,则会给您一个正数,如果它属于第 2 类,则会给您一个负数。
请注意,公式中对每个点的尺寸没有限制:
[图片由维基百科提供]
如果您对使用内核技巧时非线性情况会发生什么感到好奇,我想与您分享一个视频,该视频很好地说明了这个想法。
http://www.youtube.com/watch?v=3liCbRZPrZA