我正在使用 Amazon Web Service 机器学习服务进行试点,但我有一些疑问。
我使用了二元分类器模型,在我看来,所得结果的直方图与数值结果不匹配。根据直方图,假阳性的分布高于真阴性的分布,但数值结果并未呈现这种行为。
- 778 个真阳性
- 15,178 个真阴性
- 6,663 个误报
- 173个假阴性
任何人都可以对此事提出一些见解吗?
谢谢,
我正在使用 Amazon Web Service 机器学习服务进行试点,但我有一些疑问。
我使用了二元分类器模型,在我看来,所得结果的直方图与数值结果不匹配。根据直方图,假阳性的分布高于真阴性的分布,但数值结果并未呈现这种行为。
任何人都可以对此事提出一些见解吗?
谢谢,
您可以控制截止分数(垂直线),并且可以将其从右向左移动,反之亦然。在您的图表中,您将截止分数向左移动,这意味着您将在大多数情况下预测是,因此,您将有更多的误报(错误地预测为正(=是),而不是误报.
这是亚马逊网络服务支持团队通过他们的论坛对我的问题的回答:
经过一番挖掘,我发现直方图的 Y 轴比例是对数的,这就解释了为什么真阴性和假阳性的直接 1:1 面积比较与数值结果不一致。如果我们不显示对数刻度,我的猜测是您的大部分 Y 轴将由真阴性和真阳性结果主导,而假阳性和假阴性可能太小而无法明显看到。
参考:https ://forums.aws.amazon.com/message.jspa?messageID=733706
如果 Y 轴是对数的,则结果与提供的直方图匹配。