我是深度学习的新手,并试图理解隐藏层背后的概念,但我不清楚以下几点:
如果有 3 个隐藏层。当我们将第二层所有节点的输出作为第三层所有节点的输入时,第三层节点的输出有什么不同,因为它们获得相同的输入+相同的参数初始化(根据我读到的内容,我假设一层的所有节点都获得相同的随机参数权重)。
如果我想错了方向,请纠正我。
我是深度学习的新手,并试图理解隐藏层背后的概念,但我不清楚以下几点:
如果有 3 个隐藏层。当我们将第二层所有节点的输出作为第三层所有节点的输入时,第三层节点的输出有什么不同,因为它们获得相同的输入+相同的参数初始化(根据我读到的内容,我假设一层的所有节点都获得相同的随机参数权重)。
如果我想错了方向,请纠正我。