我有六个输入、一个隐藏层和两个输出节点(1;0)的前馈神经网络。该 NN 通过 0;1 值学习。应用模型时,创建了变量confidence(0)和confidence(1),其中每行这两个数字的总和为1。我的问题是:这两个数字(confidence(0)和confidence(1))是什么究竟是什么意思?这两个数字是概率吗?
感谢您的回答
我有六个输入、一个隐藏层和两个输出节点(1;0)的前馈神经网络。该 NN 通过 0;1 值学习。应用模型时,创建了变量confidence(0)和confidence(1),其中每行这两个数字的总和为1。我的问题是:这两个数字(confidence(0)和confidence(1))是什么究竟是什么意思?这两个数字是概率吗?
感谢您的回答
一般来说
置信度值(或分数,因为它们在其他程序中被称为)表示衡量模型如何确信所呈现的示例属于某个类别。它们高度依赖于一般策略和算法的属性。
例子
最容易说明的例子是多数分类器,它只是根据原始测试集中的比例为所有观察分配相同的分数。
另一个例子是k-nearest-neighbor-classifier,其中类 i 的分数是通过对那些都属于 k-最近邻且具有类 i 的示例的距离进行平均来计算的。然后在所有类别中对分数进行归一化。
在NN的具体例子中,不检查代码我不知道它们是如何计算的。我猜这只是输出节点的值,在两个类之间进行了归一化。
置信度是否代表概率?
一般来说没有。为了说明这种情况下的概率是什么意思:如果一个示例对于“1”类的概率为 0.3,那么具有相似特征/变量值的所有示例中有 30%应该属于“1”类,而 70% 不应该属于。
据我所知,他的任务叫做“校准”。为此目的,存在一些通用方法(例如,对分数进行分箱并将它们映射到相应箱的类别分数)和一些依赖于分类器的方法(例如,为 SVM 发明的Platt Scaling)。一个好的开始是:
置信度度量对应于在初始训练数据集中激活的输出 0 和 1 的比例。
例如,如果 30% 的训练集有输出 (1;0),其余 70% 有输出 (0; 1),那么置信度 (0) = 30%,置信度 (1) = 70%