1

在 CS231N 课程中,它说我们希望以零为中心的数据来防止局部梯度总是与上游梯度下降的符号相同,从而导致梯度更新效率低下。但是在每一层使用relu都会输出所有正数,如何解决梯度更新效率低的问题?

4

0 回答 0