3个问题:
chainer 中的 grad_outputs 是什么?
chainer 的函数 F.transpose 中的一个例子,如何解释这个后向代码?
def向后(自我,输入,grad_outputs):gy = grad_outputs [0] inv_axes = self.axes if self.axes:轴=元组(ax % len(self.axes)for ax in self.axes)inv_axes = tuple(numpy .argsort(axes)) gx = gy.transpose(inv_axes) 返回 gx,
假设我想实现自定义函数,但是我的输入[0] 和输入[1] 具有不同的形状,为了使用差分链式规则进行反向传播,我必须在中编写以下代码
backward
:a, b = inputs gy = grad_outputs[0] return a * gy, b * gy 但是,a和b的形状不一样,
a * gy
而且b * gy
可能报错?形状不匹配乘?