根据有关 One-Class SVM 的大多数文档,该算法基本上试图拟合数据周围的超球面 (SVDD)。然而,sci kit learn 方法使用超平面来分离数据。这或多或少类似于标准 SVM 的工作方式。这是我的问题?
1.)在超平面世界中,分数(model.score_samples)是什么意思?(在 SVDD/超球世界中,分数是与原点的距离)
<w,x> + b > 0 其中 w 和 b 是我们试图优化的参数,b 是我们在不失一般性的情况下添加的偏差。
因此,上述数量的SIGN会告诉我班级吗?
2.) 一旦w被优化,我们就得到了最好的决策边界。那么从这个意义上说,边际(从支持向量到决策边界的距离)是阈值吗?
3.)我的主要目标是使用分数来解释正在发生的事情并使用阈值来确定什么是异常值(我不想使用 model.predict)
4.)根据此链接,sci kit learn 正在尝试拟合 n-dim sphere :/ One Class SVM with a RBF Kernel