r - Microsoft rxOneClassSVM 的预测分数是什么意思？

Question

我正在尝试使用 Microsoft ML 包构建一类 SVM 模型以进行新奇检测，并设法获得了一些结果。使用测试数据预测的结果包含“Score”列，我不太清楚这里的含义。当我在网上搜索时，对此没有很好的解释。

作为机器学习的初学者，我猜这个分数代表了数据点是真正异常的概率，因为分数越高，数据输入越有可能是异常。如果我错了，请纠正我，我也想知道确定阈值的算法。我知道一些，例如 GA，但对于如何选择合适的使用感到非常困惑。

谢谢！

score 1 · Accepted Answer

关于“分数越高 - 越有可能是异常”，您是对的。为了找到一个阈值，我使用 rxLinePlot 来绘制这样的图表：plotting scores in oneclasssvm

从上图中可以清楚地看出，阈值是任何大于 0.1 的值。此类图将有助于根据您的用例确定阈值。如果你想在你的机器上生成这个图，这里是完整的 R 代码：https ://gist.github.com/ramnov/b08224b06c75d613688f0c8d61511d9b

1 回答 1