0

我正在使用 Weka 使用已知二元结果的训练数据执行逻辑回归。它的表现相当不错,可以正确分类大约 80% 的实例。我还有一个使用当前数据的数据集,其中结果未知。当我使用当前数据和输出预测运行模型时,它会将每个实例分类为是或否,并提供错误和概率分布项(其中错误 + 概率分布 = 1)。我无法理解这些结果。有人可以帮我解释我应该如何解释它们吗?我注意到该模型仅在概率分布低于 0.5 时才猜测是。这是否意味着我应该将其解读为结果是肯定的 1 概率分布?

4

1 回答 1

1

类别概率总和必须为 1。如果您有 P(Yes)=40% 和 P(No)=20% 并且只有YesNo是唯一的类别,那么缺少的 40% 会是什么?

此外,如果结果显示 P(Yes)=60% 和 P(No)=40% 并且您要给出预测而不是概率,那么显然理性的选择将是Yes,因为它具有所有选项的最高概率. 这就是贝叶斯最优决策规则。(感谢拉尔斯曼

在二元分类问题中,这与选择 P>50% 的答案相同。

在不知道你得到的实际输出是什么样子的情况下,看起来你得到的概率确实是 P(No)

于 2013-05-08T10:16:26.290 回答