2

我正在尝试使用 Microsoft ML 包构建一类 SVM 模型以进行新奇检测,并设法获得了一些结果。使用测试数据预测的结果包含“Score”列,我不太清楚这里的含义。当我在网上搜索时,对此没有很好的解释。

作为机器学习的初学者,我猜这个分数代表了数据点是真正异常的概率,因为分数越高,数据输入越有可能是异常。如果我错了,请纠正我,我也想知道确定阈值的算法。我知道一些,例如 GA,但对于如何选择合适的使用感到非常困惑。

谢谢!

4

1 回答 1

1

关于“分数越高 - 越有可能是异常”,您是对的。为了找到一个阈值,我使用 rxLinePlot 来绘制这样的图表:plotting scores in oneclasssvm

从上图中可以清楚地看出,阈值是任何大于 0.1 的值。此类图将有助于根据您的用例确定阈值。如果你想在你的机器上生成这个图,这里是完整的 R 代码:https ://gist.github.com/ramnov/b08224b06c75d613688f0c8d61511d9b

于 2017-05-23T05:47:24.480 回答