neural-network - Rapidminer - 神经网络算子 - 输出置信度

Question

我有六个输入、一个隐藏层和两个输出节点（1；0）的前馈神经网络。该 NN 通过 0;1 值学习。应用模型时，创建了变量confidence(0)和confidence(1)，其中每行这两个数字的总和为1。我的问题是：这两个数字(confidence(0)和confidence(1))是什么究竟是什么意思？这两个数字是概率吗？

感谢您的回答

score 3 · Accepted Answer

一般来说

置信度值（或分数，因为它们在其他程序中被称为）表示衡量模型如何确信所呈现的示例属于某个类别。它们高度依赖于一般策略和算法的属性。

例子

最容易说明的例子是多数分类器，它只是根据原始测试集中的比例为所有观察分配相同的分数。

另一个例子是k-nearest-neighbor-classifier，其中类 i 的分数是通过对那些都属于 k-最近邻且具有类 i 的示例的距离进行平均来计算的。然后在所有类别中对分数进行归一化。

在NN的具体例子中，不检查代码我不知道它们是如何计算的。我猜这只是输出节点的值，在两个类之间进行了归一化。

置信度是否代表概率？

一般来说没有。为了说明这种情况下的概率是什么意思：如果一个示例对于“1”类的概率为 0.3，那么具有相似特征/变量值的所有示例中有 30%应该属于“1”类，而 70% 不应该属于。

据我所知，他的任务叫做“校准”。为此目的，存在一些通用方法（例如，对分数进行分箱并将它们映射到相应箱的类别分数）和一些依赖于分类器的方法（例如，为 SVM 发明的Platt Scaling）。一个好的开始是：

Bianca Zadrozny、Charles Elkan：将分类器分数转化为准确的多类概率估计

score 0 · Accepted Answer

置信度度量对应于在初始训练数据集中激活的输出 0 和 1 的比例。

例如，如果 30% 的训练集有输出 (1;0)，其余 70% 有输出 (0; 1)，那么置信度 (0) = 30%，置信度 (1) = 70%

neural-network - Rapidminer - 神经网络算子 - 输出置信度

2 回答 2

Related

Reference