0

我刚刚开始研究神经网络,我设法弄清楚如何推导出反向传播所需的方程。我花了将近 3 天的时间询问了我所有的教授,并在谷歌上搜索了我能找到的所有内容。我的数学技能确实很差,但我真的很想了解这个特殊的公式在数学上是如何有意义的。该公式用于在找到梯度后更新权重。

W1 = W0 - L * (dC/dw)

在哪里:

W1 = 新重量

W0 = 旧重量

L = 学习率

dC/dw = 误差函数的偏导数和代价函数的梯度向量的一个成员

到目前为止我所知道的:

  1. 梯度是它的偏导数的向量,最大增长率由梯度本身给出。每个偏导数给出了导数相对于方向的最大变化率。
  2. dC/dW 是这些偏导数之一。
  3. dC/dW 评估为变化率。它的标志可以告诉我们变化的方向。该值本身是成本变化与特定重量下重量变化之间的比例。
  4. 不知何故,将 dC/dW 乘以学习率只是将该速率的一小部分作为权重的变化。

我无法调和的:

  1. 学习率只是一个没有单位的标量。怎么可能只用一个标量乘以一个速率并最终得到一个可测量的重量变化?我在这里不明白什么?
4

1 回答 1

0

人工神经网络(ANN)是基于人类神经系统的概念。人类神经系统的基本单位是神经元。为了感知刺激,这些神经元存在于整个身体中,每个神经元都与另一个神经元相连,以便将信息从身体的那一部分传递到大脑。神经元的信号传递受某些化学物质的浓度控制存在于神经元中。那里化学物质的浓度通常保持在平衡状态,直到感觉到刺激才会受到干扰。因此,除非有刺激,否则不会将信号传递给其他神经元。然而,当感知到刺激时(例如,一个人从其尖端切割了他的身材,那里的神经元会在身材尖端感知到刺激),一个神经元表面的化学物质浓度增加,信号传递到另一个神经元。内部编码的信号和信息的性质取决于化学物质变化的浓度。

在 ANN 中,神经元是数学函数或公式,神经元的权重类似于人类神经元中的化学浓度水平。应该调整权重,以便固定公式可以编码所有信息以执行所有所需的预测,如通过化学浓度在人类神经元中编码的那样。为了找出正确的权重,人工神经网络通过大量数据来训练人工神经网络正在被训练的问题。

学习率是一个标量,通常在 0 和 1 之间变化,包括 0 和 1。简单的学习率定义了更新权重的速度。导数是两个值之间的变化率。这里,在这种情况下,两个点是预测值和实际值。因为,(dC/dw) 你也可以简单地使用成本函数,它也被称为整个网络中错误的那个神经元的责任。公式可能会因层而异,也可能因文本而异。这是一个链接,它很好地详细解释了前馈神经网络结构。希望您能理解。如果您仍然感到困惑,您可以进一步询问。

于 2020-02-26T05:26:05.670 回答