我刚刚在 Coursera 上看过 Andrew Ng 的一些在线公开课程讲座。在关于神经网络的讲座结束时,他解释了正则化,但我担心我错过了一些东西。通过正则化,成本函数的值计算如下:
J(theta) = -1/m * jValMain + lambda/(2*m)*JValReg
jValMain
是一组总和y
,以及 NN 的输出。第二个组件jValReg
是应用正则化,看起来像这样:
jValReg = lambda/(2*m)*sum( sum( sum( Theta(j)(i)(k)^2 ) ) )
Theta
是一组权重,m
是数据库中所有元素/案例的数量,然后是lambda
. 什么是拉姆达?它是标量还是向量或矩阵?我们如何通过 lambda 应用正则化?是 lambda 从第 l 层调节特定的第 j 和第 i 个权重,还是通过一个数字调节所有权重。它以某种方式让我感到困惑。如果有人熟悉这个概念,我将不胜感激。干杯!