0

对于一个分类问题,网络的输出通常是如何确定的?

假设有三个可能的类,每个类都有一个数字标识符,一个合理的解决方案是将输出相加并将该总和作为网络的整体输出吗?或者你会取网络输出的平均值吗?

关于 ANN 理论的信息很多,但关于应用的信息不多,但如果这是一个愚蠢的问题,我表示歉意。

4

2 回答 2

5

对于具有 3 个类别的多层感知器分类器,通常构建具有 3 个输出的网络并训练网络,使 (1,0,0) 是第一类的目标输出,(0,1,0) 是第二类,第三类为 (0,0,1)。为了对新观察进行分类,您通常选择具有最大值的输出(例如,(0.12、0.56、0.87)将被分类为第 3 类)。

于 2013-02-15T18:47:47.623 回答
0

我主要同意 bogatron 的观点,此外,您会在这里找到许多关于这种使用神经网络的“多类分类”的帖子。

关于您的标题,我想补充一点,您可以将该输出解释为概率,因为我努力为此寻找理论基础。接下来,我将讨论一个在输出层有 3 个神经元的神经网络,表示相应类为 1。由于所有三个输出的总和在训练中始终为 1,因此神经网络也将给出总和为 1 的前馈输出(所以而不是(0.12 0.36 0.52)而不是 bogatrons 示例))然后您可以将这些数字解释为相应输入属于第 1/2/3 类的概率(属于第 3 类的概率为 0.52)。

当使用逻辑函数或 tanh 作为激活函数时,这是正确的。

更多信息:通过神经网络的后验概率:http ://www-vis.lbl.gov/~romano/mlgroup/papers/neural-networks-survey.pdf
如何将人工神经网络的输出转换为概率?

于 2013-02-15T21:51:22.963 回答