3

所以我想确保我有这个权利。首先,我是一名计算机工程专业的本科生,拥有比软件更多的硬件/EE 经验。今年夏天,我发现自己使用了一种使用一类 SVM 的聚类算法。SVM 只是用于分类/分离输入数据的数学模型吗?SVM 是否适用于具有一个属性/变量的数据集?我猜后者不会,可能是因为具有单个属性的分类实际上是刻板印象。我的猜测是 SVM 在具有多个属性/变量以有助于分类的数据集上表现更好。提前致谢!

4

1 回答 1

4

SVM 尝试构建分离 2 个类的超平面(AFAIK,在一类 SVM 中,一类用于“正常”实例,一类用于“异常”实例)。只有一个属性,您就有一维空间,即line。因此,这里的超平面是线上的一个点。如果 2 个类的实例(这条线上的点)可以被这个超平面点分开(即它们是线性可分的),那么是的,可以使用 SVM。否则不行。

请注意,即使具有多个属性,SVM 仍可用于对线性不可分的实例进行分类。在下一张图像中,二维空间中有 2 个类(2 个属性 - X 和 Y),一个用蓝点标记,另一个用绿色点标记。

在此处输入图像描述

您无法绘制可以将它们分开的线。不过,所谓的内核技巧可用于通过组合现有的属性来产生更多的属性。使用更多属性,您可以获得更高维度的空间,所有实例都可以在其中分离(视频)。不幸的是,一个属性不能与自身组合,因此对于一维空间内核技巧不适用。

因此,您的问题的答案是:当且仅当 2 个类的实例本身可线性分离时,SVM 可以用于只有一个属性的集合

于 2011-07-28T23:07:35.227 回答