在一本关于神经网络和深度学习的在线教科书中,作者从最小化二次成本函数的角度说明了神经网络的基础知识,他说二次成本函数是均方误差的同义词。不过,有两件事让我对他的功能感到困惑(下面的伪代码)。
MSE≡(1/2n)*∑‖y_true-y_pred‖^2
- 不是将平方误差的总和除以训练示例的数量n为什么而是除以2n?这是什么意思?
- 为什么使用双杠符号而不是括号?这让我想到还有一些其他的计算正在进行,例如 L2 范数,但没有明确显示。我怀疑情况并非如此,该术语旨在表达简单的旧平方误差之和。不过超级混乱。
非常感谢您提供的任何见解!