我正在阅读有关 AlphaGo Zero 的网络结构的信息,并遇到了这个备忘单:
我很难理解跳跃连接是如何在维度上工作的。
具体来说,似乎每个残差层都以它接收到的输入的 2 个堆叠副本结束。这不会导致输入大小随着网络的深度呈指数增长吗?
是否可以通过更改 conv2d 滤波器的输出通道大小来避免这种情况?我看到 in_C 和 out_C 在 pytorch 中不必相同,但我知道的不够多,无法理解这些值不同的含义。
我正在阅读有关 AlphaGo Zero 的网络结构的信息,并遇到了这个备忘单:
我很难理解跳跃连接是如何在维度上工作的。
具体来说,似乎每个残差层都以它接收到的输入的 2 个堆叠副本结束。这不会导致输入大小随着网络的深度呈指数增长吗?
是否可以通过更改 conv2d 滤波器的输出通道大小来避免这种情况?我看到 in_C 和 out_C 在 pytorch 中不必相同,但我知道的不够多,无法理解这些值不同的含义。