我试图通过 Torch 教程来理解监督学习。
http://code.madbits.com/wiki/doku.php?id=tutorial_supervised
和反向传播:
http://home.agh.edu.pl/~vlsi/AI/backp_t_en/backprop.html
据我所知,本火炬教程中的参数更新在第 4 步训练程序中,
output = model:forward(inputs[i])
df_do = criterion:backward(output, targets[i])
model:backward(inputs[i], df_do)
例如,我得到了这个
output = -2.2799
-2.3638
-2.3183
-2.1955
-2.3377
-2.3434
-2.3740
-2.2641
-2.3449
-2.2214
[torch.DoubleTensor of size 10]
targets[i] = 9
df_do 是这个吗?
0
0
0
0
0
0
0
0
-1
0
[torch.DoubleTensor of size 10]
我知道在这个例子中目标是 9,输出是 4,所以结果是错误的,并给出 df_do 的第 9 个元素“-1”。
但为什么 ?
根据http://home.agh.edu.pl/~vlsi/AI/backp_t_en/backprop.html,
df_do 是 [目标(期望的输出) - 输出]。