我正在使用神经网络进行多类分类。假设我有 10 个目标类和一个 null(非上述目标)。最好为每个目标分别训练一个神经网络,每个网络(目标,非目标)有两个输出神经元,以便在上述情况下我需要 10 个单独的神经网络,或者一个具有 11 个输出的神经网络(10 个目标, 1 个其他)?我见过人们在不同的论文中使用这两种方法中的任何一种,但没有解释,但是为每个目标类使用单独的网络是否有理论上的优势?相对于替代方法,计算开销成本是否值得获得和收益?
提前致谢!
PS (1) 当然,在任何一种方法中,训练样本的分布都严重偏向非目标(“其他”)类,并且 (2) 假设 NN 的输出层具有 softmax 激活。